Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാവുന്ന കമാൻഡ് ചെക്ക്ബോട്ട് ആണിത്.
പട്ടിക:
NAME
ചെക്ക്ബോട്ട് - WWW ലിങ്ക് വെരിഫയർ
സിനോപ്സിസ്
ചെക്ക്ബോട്ട് [--കുക്കികൾ] [--ഡീബഗ്] [--ഫയൽ ഫയലിന്റെ പേര്] [--സഹായിക്കൂ]
[--mailto ഇമെയിൽ വിലാസങ്ങൾ] [--നോപ്രോക്സി ഡൊമെയ്നുകളുടെ പട്ടിക]
[--വാക്കുകൾ]
[--url URL ആരംഭിക്കുക]
[--പൊരുത്തം മാച്ച് സ്ട്രിംഗ്] [--പെടുത്തിയിട്ടില്ല സ്ട്രിംഗ് ഒഴിവാക്കുക]
[--പ്രോക്സി പ്രോക്സി URL] [--ആന്തരികം-മാത്രം]
[--അവഗണിക്കുക സ്ട്രിംഗ് അവഗണിക്കുക]
[--ഫിൽട്ടർ സബ്സ്റ്റിറ്റ്യൂഷൻ റെഗുലർ എക്സ്പ്രഷൻ]
[--ശൈലി സ്റ്റൈൽ ഫയൽ URL]
[--കുറിപ്പ് കുറിപ്പ്] [--ഉറക്കം സെക്കന്റുകൾ] [--ടൈം ഔട്ട് ടൈം ഔട്ട്]
[--ഇടവേള സെക്കന്റുകൾ] [--മുന്നറിയിപ്പ് നൽകരുത് HTTP പ്രതികരണ കോഡുകൾ]
[--പ്രാപ്തമാക്കുക-വെർച്വൽ]
[--ഭാഷ ഭാഷാ കോഡ്]
[--അടക്കുക അടിച്ചമർത്തൽ ഫയൽ]
[URL-കൾ ആരംഭിക്കുക]
വിവരണം
വേൾഡ് വൈഡ് വെബിന്റെ ഒരു പ്രത്യേക ഭാഗത്തുള്ള ലിങ്കുകൾ ചെക്ക്ബോട്ട് പരിശോധിക്കുന്നു. ഇത് HTML സൃഷ്ടിക്കുന്നു
ഡയഗ്നോസ്റ്റിക്സ് ഉള്ള പേജുകൾ.
പേജുകളിലെ URL-കൾ കണ്ടെത്താനും അവ പരിശോധിക്കാനും ചെക്ക്ബോട്ട് LWP ഉപയോഗിക്കുന്നു. ഇത് അതേ സ്കീമുകളെ പിന്തുണയ്ക്കുന്നു
HTML::LinkExtor കണ്ടെത്തുന്ന അതേ ലിങ്കുകൾ LWP ചെയ്യുന്നു, കണ്ടെത്തുന്നു.
ചെക്ക്ബോട്ട് ലിങ്കുകളെ 'ആന്തരികം' അല്ലെങ്കിൽ 'പുറം' ആയി കണക്കാക്കുന്നു. ആന്തരിക ലിങ്കുകൾ ലിങ്കുകളാണ്
പരിശോധിക്കേണ്ട വെബ് സ്പേസിനുള്ളിൽ. ഒരു ആന്തരിക ലിങ്ക് ഒരു വെബിലേക്ക് പോയിന്റുചെയ്യുകയാണെങ്കിൽ
ഈ പ്രമാണം വീണ്ടെടുക്കുകയും അതിന്റെ ലിങ്കുകൾ എക്സ്ട്രാക്റ്റ് ചെയ്യുകയും പ്രോസസ്സ് ചെയ്യുകയും ചെയ്യുന്നു. ബാഹ്യ
ലിങ്കുകൾ പ്രവർത്തിക്കുന്നുണ്ടോയെന്ന് മാത്രം പരിശോധിച്ചു. ചെക്ക്ബോട്ട് ലിങ്കുകൾ കണ്ടെത്തുന്നതിനനുസരിച്ച് പരിശോധിക്കുന്നു, അതിനാൽ ആന്തരികവും
കൂടാതെ ബാഹ്യ ലിങ്കുകൾ വ്യത്യസ്തമായി പരിഗണിക്കുന്നുണ്ടെങ്കിലും ഒരേ സമയം പരിശോധിക്കുന്നു.
ചെക്ക്ബോട്ടിനുള്ള ഓപ്ഷനുകൾ ഇവയാണ്:
--കുക്കികൾ
സെർവറിൽ നിന്ന് കുക്കികൾ സ്വീകരിച്ച് പിന്നീടുള്ള അഭ്യർത്ഥനകളിൽ അവ വീണ്ടും വാഗ്ദാനം ചെയ്യുക. ഇതായിരിക്കാം
സെഷനുകൾ കൈകാര്യം ചെയ്യാൻ കുക്കികൾ ഉപയോഗിക്കുന്ന സെർവറുകൾക്ക് ഉപയോഗപ്രദമാണ്. സ്ഥിരസ്ഥിതിയായി ചെക്ക്ബോട്ട് ഇല്ല
ഏതെങ്കിലും കുക്കികൾ സ്വീകരിക്കുക.
--ഡീബഗ്
ഡീബഗ്ഗിംഗ് മോഡ് പ്രവർത്തനക്ഷമമാക്കുക. ശരിക്കും പിന്തുണയ്ക്കില്ല, പക്ഷേ ഇത് ചില ഫയലുകൾ സൂക്ഷിക്കും
അല്ലാത്തപക്ഷം ഇല്ലാതാക്കപ്പെടും.
--ഫയൽ
ഫയൽ ഉപയോഗിക്കുക ഫയല് പേര് സംഗ്രഹ ഫയൽ പേരുകളുടെ അടിസ്ഥാനം. സംഗ്രഹ പേജ് ചെയ്യും
നേടുക ഫയല് പേര് നൽകിയിരിക്കുന്നു, സെർവർ പേജുകൾ അടിസ്ഥാനമാക്കിയുള്ളതാണ് ഫയല് പേര് ഇല്ലാതെ
.html വിപുലീകരണം. ഉദാഹരണത്തിന്, ഈ ഓപ്ഷൻ "index.html" ആയി സജ്ജീകരിക്കുന്നത് ഒരു സൃഷ്ടിക്കും
index.html എന്ന സംഗ്രഹ പേജും index-server1.html എന്ന സെർവർ പേജും ഒപ്പം
സൂചിക-server2.html.
ഈ ഓപ്ഷന്റെ ഡിഫോൾട്ട് മൂല്യം "checkbot.html" ആണ്.
--സഹായിക്കൂ
സ്റ്റാൻഡേർഡ് ഔട്ട്പുട്ടിൽ ഹ്രസ്വ സഹായ സന്ദേശം കാണിക്കുന്നു.
--mailto [, ]
എന്നതിലേക്ക് മെയിൽ അയക്കുക ഇമെയിൽ വിലാസം ചെക്ക്ബോട്ട് പരിശോധിക്കുമ്പോൾ. നിങ്ങൾക്ക് കൂടുതൽ നൽകാം
ഒരു വിലാസം കോമകളാൽ വേർതിരിച്ചിരിക്കുന്നു. അറിയിപ്പ് ഇമെയിലിൽ ഒരു ചെറിയ സംഗ്രഹം ഉൾപ്പെടുന്നു
ഫലങ്ങൾ. ചെക്ക്ബോട്ട് 1.76-ൽ പ്രശ്നങ്ങൾ കണ്ടെത്തിയാൽ മാത്രമേ ഇമെയിൽ അയയ്ക്കൂ
ചെക്ക്ബോട്ട് റൺ.
--നോപ്രോക്സി
നൽകിയിരിക്കുന്ന ഡൊമെയ്നുകളിലേക്ക് അഭ്യർത്ഥനകൾ പ്രോക്സി ചെയ്യരുത്. ഡൊമെയ്നുകളുടെ ലിസ്റ്റ് ഒരു കോമ ആയിരിക്കണം-
വേർതിരിച്ച പട്ടിക. ഉദാഹരണത്തിന്, അതിനാൽ ലോക്കൽഹോസ്റ്റിനായി പ്രോക്സി ഉപയോഗിക്കുന്നത് ഒഴിവാക്കുക
someserver.xyz, നിങ്ങൾക്ക് "--noproxy localhost,someserver.xyz" ഉപയോഗിക്കാം.
--വാക്കുകൾ
റൺ ചെയ്യുമ്പോൾ വെർബോസ് ഔട്ട്പുട്ട് കാണിക്കുക. പരിശോധിച്ച എല്ലാ ലിങ്കുകളും ഉൾപ്പെടുന്നു, ഇതിൽ നിന്നുള്ള ഫലങ്ങൾ
പരിശോധനകൾ മുതലായവ.
--url
ആരംഭ URL സജ്ജമാക്കുക. ചെക്ക്ബോട്ട് ഈ URL-ൽ പരിശോധിക്കാൻ തുടങ്ങുന്നു, തുടർന്ന് ആവർത്തിച്ച് പരിശോധിക്കുന്നു
ഈ പേജിൽ എല്ലാ ലിങ്കുകളും കണ്ടെത്തി. അധിക URL-കളേക്കാൾ ആരംഭ URL മുൻഗണന നൽകുന്നു
കമാൻഡ് ലൈനിൽ വ്യക്തമാക്കിയിരിക്കുന്നു.
URL-നായി സ്കീമൊന്നും വ്യക്തമാക്കിയിട്ടില്ലെങ്കിൽ, ഫയൽ പ്രോട്ടോക്കോൾ അനുമാനിക്കപ്പെടുന്നു.
--പൊരുത്തം
ചെക്ക്ബോട്ട് ലോക്കൽ ആയി പരിഗണിക്കുന്ന പേജുകൾ ഈ ഓപ്ഷൻ തിരഞ്ഞെടുക്കുന്നു. എങ്കിൽ മത്സരം സ്ട്രിംഗ് is
URL-ൽ അടങ്ങിയിരിക്കുന്നു, തുടർന്ന് ചെക്ക്ബോട്ട് പേജ് ലോക്കൽ ആയി കണക്കാക്കുകയും അത് വീണ്ടെടുക്കുകയും ചെയ്യുന്നു
അതിൽ അടങ്ങിയിരിക്കുന്ന എല്ലാ ലിങ്കുകളും പരിശോധിക്കും. അല്ലെങ്കിൽ പേജ് ബാഹ്യമായി കണക്കാക്കും
ഒരു HEAD അഭ്യർത്ഥനയോടെ മാത്രമേ ഇത് പരിശോധിക്കൂ.
വ്യക്തമായില്ലെങ്കിൽ മത്സരം സ്ട്രിംഗ് നൽകിയിരിക്കുന്നു, ആരംഭ URL-കൾ (ഓപ്ഷൻ "--url" കാണുക) ഉപയോഗിക്കും
പകരം ഒരു മാച്ച് സ്ട്രിംഗ് ആയി. ഈ സാഹചര്യത്തിൽ, അവസാന പേജിന്റെ പേര്, എന്തെങ്കിലും ഉണ്ടെങ്കിൽ, അത് ട്രിം ചെയ്യപ്പെടും.
ഉദാഹരണത്തിന്, ഒരു ആരംഭ URL പോലെയുള്ള "http://some.site/index.html" ഒരു സ്ഥിരസ്ഥിതിയിൽ കലാശിക്കും
മത്സരം സ്ട്രിംഗ് "http://some.site/".
ദി മത്സരം സ്ട്രിംഗ് ഒരു perl റെഗുലർ എക്സ്പ്രഷൻ ആകാം. ഉദാഹരണത്തിന്, പ്രധാനം പരിശോധിക്കാൻ
സെർവർ പേജും അതിന് താഴെയുള്ള എല്ലാ HTML പേജുകളും, എന്നാൽ ഇതിലെ HTML പേജുകളല്ല
സെർവറിന്റെ ഉപഡയറക്ടറികൾ, the മത്സരം സ്ട്രിംഗ് ഉണ്ടാകും
"www.someserver.xyz/($|[^/]+.html)".
--പെടുത്തിയിട്ടില്ല
URL-കൾ പൊരുത്തപ്പെടുന്നു പെടുത്തിയിട്ടില്ല സ്ട്രിംഗ് അവ സംഭവിച്ചാലും ബാഹ്യമായി കണക്കാക്കപ്പെടുന്നു
പൊരുത്തപ്പെടുത്തുക മത്സരം സ്ട്രിംഗ് (ഓപ്ഷൻ "--മാച്ച്" കാണുക). --ഒഴിവാക്കൽ സ്ട്രിംഗുമായി പൊരുത്തപ്പെടുന്ന URL-കൾ
ഇപ്പോഴും പരിശോധിച്ചുകൊണ്ടിരിക്കുകയാണ്, പ്രശ്നങ്ങൾ കണ്ടെത്തിയാൽ അറിയിക്കും, പക്ഷേ അവ ഉണ്ടാകില്ല
സൈറ്റിലേക്കുള്ള കൂടുതൽ ലിങ്കുകൾക്കായി പരിശോധിച്ചു.
ദി പെടുത്തിയിട്ടില്ല സ്ട്രിംഗ് ഒരു perl റെഗുലർ എക്സ്പ്രഷൻ ആകാം. ഉദാഹരണത്തിന്, എല്ലാ URL-കളും പരിഗണിക്കാൻ
ബാഹ്യമായ ഒരു അന്വേഷണ സ്ട്രിംഗ് ഉപയോഗിച്ച്, "[=\?]" ഉപയോഗിക്കുക. ഒരു അന്വേഷണമുള്ള URL ആയിരിക്കുമ്പോൾ ഇത് ഉപയോഗപ്രദമാകും
സ്ട്രിംഗ് ഒരു വലിയ ഡാറ്റാബേസിലേക്കുള്ള പാത അൺലോക്ക് ചെയ്യുന്നു, അത് പരിശോധിക്കപ്പെടും.
--ഫിൽട്ടർ
ഈ ഓപ്ഷൻ നിർവ്വചിക്കുന്നു a ഫിൽറ്റർ ചെയ്യുക സ്ട്രിംഗ്, ഇത് ഒരു perl റെഗുലർ എക്സ്പ്രഷൻ ആണ്. ഈ ഫിൽട്ടർ
കണ്ടെത്തിയ ഓരോ URL-ലും പ്രവർത്തിക്കുന്നു, അങ്ങനെ ക്യൂവിൽ പ്രവേശിക്കുന്നതിന് മുമ്പ് URL വീണ്ടും എഴുതുന്നു
പരിശോധിച്ചു. ഒരു URL-ൽ നിന്ന് ഘടകങ്ങൾ നീക്കം ചെയ്യാൻ ഇത് ഉപയോഗിക്കാം. എപ്പോൾ ഈ ഓപ്ഷൻ ഉപയോഗപ്രദമാകും
പ്രതീകാത്മക ലിങ്കുകൾ ഒരേ ഡയറക്ടറിയിലേക്ക് പോയിന്റ് ചെയ്യുന്നു, അല്ലെങ്കിൽ ഒരു ഉള്ളടക്ക മാനേജ്മെന്റ് സിസ്റ്റം ചേർക്കുമ്പോൾ
URL-കളിലേക്കുള്ള സെഷൻ ഐഡികൾ.
ഉദാഹരണത്തിന്, "/old/new/" എന്നത് ഓരോ URL-ലും 'പഴയ' സംഭവങ്ങളെ 'പുതിയത്' ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കും.
--അവഗണിക്കുക
URL-കൾ പൊരുത്തപ്പെടുന്നു അവഗണിക്കുക സ്ട്രിംഗ് ഒന്നും പരിശോധിച്ചിട്ടില്ല, അവ പൂർണ്ണമായും അവഗണിക്കപ്പെടുന്നു
ചെക്ക്ബോട്ട്. അറിയപ്പെടുന്ന പ്രശ്ന ലിങ്കുകൾ അവഗണിക്കുന്നതിനോ നയിക്കുന്ന ലിങ്കുകളെ അവഗണിക്കുന്നതിനോ ഇത് ഉപയോഗപ്രദമാകും
ഡാറ്റാബേസുകളിലേക്ക്. ദി അവഗണിക്കുക സ്ട്രിംഗ് ശേഷം പൊരുത്തപ്പെടുന്നു ഫിൽറ്റർ ചെയ്യുക സ്ട്രിംഗ് പ്രയോഗിച്ചിട്ടുണ്ട്.
ദി അവഗണിക്കുക സ്ട്രിംഗ് ഒരു perl റെഗുലർ എക്സ്പ്രഷൻ ആകാം.
ഉദാഹരണത്തിന് "www.server.com\/(one|two)" ഒന്നിൽ ആരംഭിക്കുന്ന എല്ലാ URL-കളുമായും പൊരുത്തപ്പെടും
www.server.com/one അല്ലെങ്കിൽ www.server.com/two.
--പ്രോക്സി
ഈ ആട്രിബ്യൂട്ട് ഒരു പ്രോക്സി സെർവറിന്റെ URL വ്യക്തമാക്കുന്നു. HTTP, FTP അഭ്യർത്ഥനകൾ മാത്രം
ആ പ്രോക്സി സെർവറിലേക്ക് അയയ്ക്കും.
--ആന്തരികം-മാത്രം
ചെക്ക്ബോട്ട് റണ്ണിന്റെ അവസാനം ബാഹ്യ ലിങ്കുകളുടെ പരിശോധന ഒഴിവാക്കുക. പൊരുത്തപ്പെടൽ മാത്രം
ലിങ്കുകൾ പരിശോധിച്ചു. ചില റീഡയറക്ടുകൾ ഇപ്പോഴും ബാഹ്യ ലിങ്കുകൾക്ക് കാരണമായേക്കാം എന്നത് ശ്രദ്ധിക്കുക
പരിശോധിച്ചു.
--കുറിപ്പ്
ദി കുറിപ്പ് മെയിൽ സന്ദേശത്തിൽ അക്ഷരാർത്ഥത്തിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട് ("--mailto" ഓപ്ഷൻ കാണുക). ഇത് ആകാം
ലളിതമായ റഫറൻസിനായി സംഗ്രഹ HTML പേജിന്റെ URL ഉൾപ്പെടുത്തുന്നത് ഉപയോഗപ്രദമാണ്, ഉദാഹരണത്തിന്.
"--mailto" ഓപ്ഷനുമായി സംയോജിപ്പിച്ചാൽ മാത്രം അർത്ഥപൂർണ്ണമാണ്.
--ഉറക്കം
എണ്ണം നിമിഷങ്ങൾ അഭ്യർത്ഥനകൾക്കിടയിൽ ഉറങ്ങാൻ. ഡിഫോൾട്ട് 0 സെക്കൻഡ് ആണ്, അതായത് ചെയ്യരുത്
അഭ്യർത്ഥനകൾക്കിടയിൽ ഉറങ്ങുക. ലോഡ് നിലനിർത്താൻ ഈ ഓപ്ഷൻ സജ്ജീകരിക്കുന്നത് ഉപയോഗപ്രദമാകും
ചെക്ക്ബോട്ട് പ്രവർത്തിപ്പിക്കുമ്പോൾ വെബ് സെർവർ പ്രവർത്തനരഹിതമാണ്. ഈ ഓപ്ഷൻ a ആയി സജ്ജമാക്കാനും കഴിയും
ഫ്രാക്ഷണൽ നമ്പർ, അതായത് 0.1 ന്റെ മൂല്യം സെക്കൻഡിന്റെ പത്തിലൊന്ന് ഇടയ്ക്ക് ഉറങ്ങും
അഭ്യർത്ഥനകൾ.
--ടൈം ഔട്ട്
അഭ്യർത്ഥനകൾക്കുള്ള ഡിഫോൾട്ട് ടൈംഔട്ട്, സെക്കന്റുകൾക്കുള്ളിൽ വ്യക്തമാക്കിയിരിക്കുന്നു. സ്ഥിരസ്ഥിതി 2 മിനിറ്റാണ്.
--ഇടവേള
ഫലങ്ങൾ വെബ് പേജുകളുടെ അപ്ഡേറ്റുകൾക്കിടയിലുള്ള പരമാവധി ഇടവേള നിമിഷങ്ങൾക്കുള്ളിൽ. സ്ഥിരസ്ഥിതി 3 ആണ്
മണിക്കൂർ (10800 സെക്കൻഡ്). ചെക്ക്ബോട്ട് ഒരു മിനിറ്റിലും ക്രമേണയും ഇടവേള ആരംഭിക്കും
അത് പരമാവധി ഇടവേളയിലേക്ക് നീട്ടുക.
--ശൈലി
ഈ ഓപ്ഷൻ ഉപയോഗിക്കുമ്പോൾ, ഓരോന്നിലും ഒരു സ്റ്റൈൽ ഫയലിലേക്കുള്ള ലിങ്കായി ചെക്ക്ബോട്ട് ഈ URL ഉൾച്ചേർക്കുന്നു
അത് എഴുതുന്ന പേജ്. ഇത് സൃഷ്ടിച്ച പേജുകളുടെ ലേഔട്ട് ഇഷ്ടാനുസൃതമാക്കുന്നത് എളുപ്പമാക്കുന്നു
ചെക്ക്ബോട്ട്.
--മുന്നറിയിപ്പ് നൽകരുത്
പൊരുത്തപ്പെടുന്ന HTTP പ്രതികരണ കോഡുകൾക്കുള്ള മുന്നറിയിപ്പുകൾ ഫല പേജുകളിൽ ഉൾപ്പെടുത്തരുത്
പതിവ് പദപ്രയോഗം. ഉദാഹരണത്തിന്, --dontwarn "(301|404)" ൽ 301 ഉൾപ്പെടുന്നില്ല
404 പ്രതികരണ കോഡുകൾ.
ഈ പ്രതികരണ കോഡ് ആണെങ്കിലും, സെർവർ സൃഷ്ടിച്ച പ്രതികരണ കോഡുകൾ ചെക്ക്ബോട്ട് ഉപയോഗിക്കുന്നു
RFC 2616 (HTTP/1.1) ൽ നിർവചിച്ചിട്ടില്ല. സാധാരണ HTTP പ്രതികരണ കോഡിന് പുറമേ,
സാങ്കേതികമായി എ അല്ലാത്ത സാഹചര്യങ്ങൾക്കായി ചെക്ക്ബോട്ട് കുറച്ച് പ്രതികരണ കോഡുകൾ നിർവചിക്കുന്നു
പ്രശ്നം, പക്ഷേ അത് എന്തായാലും പല കേസുകളിലും പ്രശ്നങ്ങൾ ഉണ്ടാക്കുന്നു. ഈ കോഡുകൾ ഇവയാണ്:
901 ഹോസ്റ്റിന്റെ പേര് പ്രതീക്ഷിച്ചെങ്കിലും കണ്ടെത്തിയില്ല
ഈ സാഹചര്യത്തിൽ, URL ഒരു ഹോസ്റ്റ് നാമത്തെ പിന്തുണയ്ക്കുന്നു, പക്ഷേ കണ്ടെത്താനായില്ല
URL-ൽ. ഇത് സാധാരണയായി URL-ലെ ഒരു തെറ്റിനെ സൂചിപ്പിക്കുന്നു. എ
ഈ പരിശോധന വാർത്തകൾക്ക് ബാധകമല്ല എന്നതാണ് അപവാദം: URL-കൾ.
902 യോഗ്യതയില്ലാത്ത ഹോസ്റ്റ് പേര് കണ്ടെത്തി
ഈ സാഹചര്യത്തിൽ ഹോസ്റ്റ് നാമത്തിൽ ഡൊമെയ്ൻ ഭാഗം അടങ്ങിയിട്ടില്ല.
ഇത് സാധാരണയായി അർത്ഥമാക്കുന്നത് പേജുകൾ ഉള്ളിൽ കാണുമ്പോൾ നന്നായി പ്രവർത്തിക്കുന്നു എന്നാണ്
യഥാർത്ഥ ഡൊമെയ്ൻ, പക്ഷേ അതിന് പുറത്ത് നിന്ന് നോക്കുമ്പോൾ അല്ല.
903 URL പാതയിൽ ഇരട്ട സ്ലാഷ്
URL-ൽ ഇരട്ട സ്ലാഷ് ഉണ്ട്. ഇത് നിയമപരമാണ്, എന്നാൽ ചില വെബ്
സെർവറുകൾക്ക് ഇത് നന്നായി കൈകാര്യം ചെയ്യാൻ കഴിയില്ല, ഇത് ചെക്ക്ബോട്ടിന് കാരണമായേക്കാം
ഓടിപ്പോകുക. താഴെയുള്ള കമന്റുകളും കാണുക.
904 URL-ൽ അജ്ഞാതമായ സ്കീം
ചെക്ക്ബോട്ടിന് അറിയാത്ത ഒരു സ്കീമിലാണ് URL ആരംഭിക്കുന്നത്
കുറിച്ച്. URL-ന്റെ സ്കീം തെറ്റായി ടൈപ്പ് ചെയ്യുന്നതാണ് പലപ്പോഴും ഇത് സംഭവിക്കുന്നത്,
എന്നാൽ ഈ സ്കീം നിയമപരവും ആകാം. അങ്ങനെയെങ്കിൽ ദയവായി അനുവദിക്കുക
ചെക്ക്ബോട്ടിൽ ചേർക്കാൻ കഴിയുമെന്ന് എനിക്കറിയാം.
--പ്രാപ്തമാക്കുക-വെർച്വൽ
ഈ ഓപ്ഷൻ വെർച്വൽ സെർവറുകൾ കൈകാര്യം ചെയ്യുന്നത് സാധ്യമാക്കുന്നു. അപ്പോൾ ചെക്ക്ബോട്ട് എല്ലാം അനുമാനിക്കുന്നു
ഇന്റേണൽ സെർവറുകൾക്കുള്ള ഹോസ്റ്റ്നാമങ്ങൾ അദ്വിതീയമാണ്, അവയുടെ ഐപി വിലാസങ്ങൾ ഇങ്ങനെയായിരിക്കാം
അതേ. സെർവറുകൾ വേർതിരിച്ചറിയാൻ സാധാരണയായി ചെക്ക്ബോട്ട് ഐപി വിലാസം ഉപയോഗിക്കുന്നു. ഇതിന് ഉണ്ട്
ഒരു സെർവറിന് രണ്ട് പേരുകൾ ഉണ്ടെങ്കിൽ (ഉദാ: www, bamboozle) അതിന്റെ പേജുകൾക്ക് മാത്രമേ ലഭിക്കൂ
ഒരിക്കൽ പരിശോധിച്ചു. നിങ്ങൾക്ക് ഒന്നിലധികം വെർച്വൽ സെർവറുകൾ പരിശോധിക്കണമെങ്കിൽ ഇത് പ്രശ്നങ്ങൾ ഉണ്ടാക്കുന്നു,
സെർവറിനെ വേർതിരിച്ചറിയാൻ ഹോസ്റ്റ്നാമം ഉപയോഗിച്ച് ഈ സവിശേഷത പ്രവർത്തിക്കുന്നു.
--ഭാഷ
ഈ ഓപ്ഷന്റെ ആർഗ്യുമെന്റ് ഒരു രണ്ടക്ഷര ഭാഷാ കോഡാണ്. ചെക്ക്ബോട്ട് ഭാഷ ഉപയോഗിക്കും
ആ ഭാഷയിലുള്ള ഫയലുകൾ അഭ്യർത്ഥിക്കാനുള്ള ചർച്ച. ഇംഗ്ലീഷ് അഭ്യർത്ഥിക്കുക എന്നതാണ് സ്ഥിരസ്ഥിതി
ഭാഷ (ഭാഷാ കോഡ് 'en').
--അടക്കുക
ഈ ഓപ്ഷന്റെ ആർഗ്യുമെന്റ് പിശക് കോഡുകളുടെയും കോമ്പിനേഷനുകളുടെയും സംയോജനം ഉൾക്കൊള്ളുന്ന ഒരു ഫയലാണ്
മുന്നറിയിപ്പുകൾ അടിച്ചമർത്താനുള്ള URL-കൾ. അറിയപ്പെടുന്നവയുടെ റിപ്പോർട്ടിംഗ് ഒഴിവാക്കാൻ ഇത് ഉപയോഗിക്കാം
പരിഹരിക്കാനാകാത്ത URL പിശകുകൾ അല്ലെങ്കിൽ മുന്നറിയിപ്പുകൾ.
സപ്രഷൻ ഫയലിന്റെ ഫോർമാറ്റ് ഒരു ലളിതമായ വൈറ്റ്സ്പേസ് ഡിലിമിറ്റഡ് ഫോർമാറ്റാണ്, ആദ്യം
URL-ന് ശേഷം പിശക് കോഡ് ലിസ്റ്റുചെയ്യുന്നു. ഓരോ പിശക് കോഡും URL കോമ്പിനേഷനും ആണ്
ഒരു പുതിയ ലൈനിൽ ലിസ്റ്റ് ചെയ്തിരിക്കുന്നു. a ഉപയോഗിച്ച് വരി ആരംഭിച്ച് ഫയലിലേക്ക് അഭിപ്രായങ്ങൾ ചേർക്കാം
"#" പ്രതീകം.
# 301 ശാശ്വതമായി നീക്കി
301 http://www.w3.org/P3P
# 403 നിരോധിച്ചിരിക്കുന്നു
403 http://www.herring.com/
കൂടുതൽ ഫ്ലെക്സിബിലിറ്റിക്ക് ഒരു സാധാരണ URL-ന് പകരം ഒരു സാധാരണ പദപ്രയോഗം ഉപയോഗിക്കാം. ദി
റെഗുലർ എക്സ്പ്രഷൻ ഫോർവേഡ് സ്ലാഷുകൾ കൊണ്ട് ഘടിപ്പിച്ചിരിക്കണം. ഉദാഹരണത്തിന്, എല്ലാം അടിച്ചമർത്താൻ
വിക്കിപീഡിയയിൽ 403 പിശകുകൾ:
403 /http:\/\/wikipedia.org\/.*/
ഭാവിയിലെ റിലീസിൽ അപ്രത്യക്ഷമാകുന്ന ഒഴിവാക്കിയ ഓപ്ഷനുകൾ:
--അനുവദിക്കുക-ലളിതമായ-ഹോസ്റ്റുകൾ (ഒഴിവാക്കി)
യോഗ്യതയില്ലാത്ത ഹോസ്റ്റ് നാമങ്ങൾ അടങ്ങിയ URL-കളെക്കുറിച്ചുള്ള മുന്നറിയിപ്പുകൾ ഈ ഓപ്ഷൻ ഓഫാക്കുന്നു. ഈ
ഒരു ലളിതമായ ഹോസ്റ്റ് നാമം അല്ലെങ്കിൽ പലപ്പോഴും ഉപയോഗിക്കുന്ന ഇൻട്രാനെറ്റ് സൈറ്റുകൾക്ക് ഇത് ഉപയോഗപ്രദമാണ്
അവരുടെ ലിങ്കുകളിൽ "localhost".
ഈ ഓപ്ഷന്റെ ഉപയോഗം ഒഴിവാക്കിയിരിക്കുന്നു. പിശക് 902-ന് ദയവായി --dontwarn മെക്കാനിസം ഉപയോഗിക്കുക
പകരം.
സൂചനകൾ ഒപ്പം നുറുങ്ങുകൾ
FTP ലിങ്കുകൾ പരിശോധിക്കുന്നതിൽ പ്രശ്നങ്ങൾ
ചില ഉപയോക്താക്കൾക്ക് FTP ലിങ്കുകൾ പരിശോധിക്കുന്നതിൽ സ്ഥിരമായ പ്രശ്നങ്ങൾ അനുഭവപ്പെടാം. ഈ സന്ദർഭങ്ങളിൽ
ഫയലുകൾ പരിശോധിക്കാൻ നിഷ്ക്രിയ FTP മോഡ് ഉപയോഗിക്കുന്നതിന് Net::FTP നിർദ്ദേശം നൽകുന്നത് ഉപയോഗപ്രദമായിരിക്കും. ഇതിന് കഴിയും
എൻവയോൺമെന്റ് വേരിയബിൾ FTP_PASSIVE 1 ആയി സജ്ജീകരിക്കുക. ഉദാഹരണത്തിന്, ഉപയോഗിക്കുന്നത്
ബാഷ് ഷെൽ: "FTP_PASSIVE=1 ചെക്ക്ബോട്ട് ...". കൂടുതൽ വിവരങ്ങൾക്ക് Net::FTP ഡോക്യുമെന്റേഷൻ കാണുക
വിശദാംശങ്ങൾ.
ഓടിപ്പോകുന്ന ചെക്ക്ബോട്ട്
ചില സന്ദർഭങ്ങളിൽ ചെക്ക്ബോട്ട് അക്ഷരാർത്ഥത്തിൽ പൂർത്തിയാക്കാൻ എന്നേക്കും എടുക്കും. രണ്ട് പൊതു കാരണങ്ങളുണ്ട്
ഈ പ്രശ്നത്തിന്.
ആദ്യം, വെബ്സൈറ്റിന്റെ ഭാഗമായി ഒരു ഡാറ്റാബേസ് ആപ്ലിക്കേഷൻ ഉണ്ടാകാം, അത് എ
മറ്റൊരു പേജിലെ ലിങ്കുകളെ അടിസ്ഥാനമാക്കിയുള്ള പുതിയ പേജ്. ചെക്ക്ബോട്ട് എല്ലായിടത്തും സഞ്ചരിക്കാൻ ശ്രമിക്കുന്നതിനാൽ
ലിങ്കുകൾ ഇത് അനന്തമായ പേജുകൾ സൃഷ്ടിക്കും. ഇത്തരത്തിലുള്ള റൺ-എവേ പ്രഭാവം ആണ്
സാധാരണയായി പ്രവചിക്കാവുന്നതാണ്. --exclude ഓപ്ഷൻ ഉപയോഗിച്ച് ഇത് ഒഴിവാക്കാം.
രണ്ടാമതായി, ഒരു സെർവർ കോൺഫിഗറേഷൻ പ്രശ്നം പേജുകൾക്കായി URL-കൾ സൃഷ്ടിക്കുന്നതിൽ ഒരു ലൂപ്പിന് കാരണമാകും
അത് യഥാർത്ഥത്തിൽ നിലവിലില്ല. ഇത് ഫോമിന്റെ URL-കൾക്ക് കാരണമാകും
http://some.server/images/images/images/logo.png, കൂടുതൽ 'ചിത്രങ്ങൾ' ഉൾപ്പെടുത്തി.
ചെക്ക്ബോട്ടിന് ഇത് പരിശോധിക്കാൻ കഴിയില്ല, കാരണം സെർവർ അത് സൂചിപ്പിച്ചിരിക്കണം
ആവശ്യപ്പെട്ട പേജുകൾ നിലവിലില്ല. പരിഹരിക്കുകയല്ലാതെ ഇത് പരിഹരിക്കാൻ എളുപ്പവഴിയില്ല
കുറ്റകരമായ വെബ് സെർവർ അല്ലെങ്കിൽ തകർന്ന ലിങ്കുകൾ.
https:// ലിങ്കുകളിലെ പ്രശ്നങ്ങൾ
പിശക് സന്ദേശം
"LWP::Protocol::https::Socket" പാക്കേജ് വഴി "പുതിയ" ഒബ്ജക്റ്റ് രീതി കണ്ടെത്താനായില്ല
സാധാരണയായി എൽഡബ്ല്യുപിയുടെ നിലവിലെ ഇൻസ്റ്റലേഷൻ SSL പരിശോധിക്കുന്നതിനെ പിന്തുണയ്ക്കുന്നില്ല എന്നാണ് അർത്ഥമാക്കുന്നത്
ലിങ്കുകൾ (അതായത് https:// ൽ ആരംഭിക്കുന്ന ലിങ്കുകൾ). ഇൻസ്റ്റാൾ ചെയ്യുന്നതിലൂടെ ഈ പ്രശ്നം പരിഹരിക്കാൻ കഴിയും
ക്രിപ്റ്റ്::എസ്എസ്ലേ മൊഡ്യൂൾ.
ഉദാഹരണങ്ങൾ
ചെക്ക്ബോട്ടിന്റെ ഏറ്റവും ലളിതമായ ഉപയോഗം ഒരു സെർവറിലെ ഒരു കൂട്ടം പേജുകൾ പരിശോധിക്കുക എന്നതാണ്. എന്റെ പരിശോധിക്കാൻ
ഞാൻ ഉപയോഗിക്കുന്ന ചെക്ക്ബോട്ട് പേജുകൾ:
ചെക്ക്ബോട്ട് http://degraaff.org/checkbot/
ചെക്ക്ബോട്ട് റൺ ചെയ്യാൻ കുറച്ച് സമയമെടുക്കും, അതിനാൽ റൺ ആകുമ്പോൾ ചെക്ക്ബോട്ടിന് ഒരു അറിയിപ്പ് മെയിൽ അയയ്ക്കാനാകും
ചെയ്തു:
ചെക്ക്ബോട്ട് --mailto [ഇമെയിൽ പരിരക്ഷിച്ചിരിക്കുന്നു] http://degraaff.org/checkbot/
ഒരു വെബ് സെർവർ ഉപയോഗിക്കാതെ തന്നെ ഒരു കൂട്ടം ലോക്കൽ ഫയലുകൾ പരിശോധിക്കാൻ സാധിക്കും. ഇത് മാത്രമേ പ്രവർത്തിക്കൂ
സ്റ്റാറ്റിക് ഫയലുകൾക്കായി, എന്നാൽ ചില സന്ദർഭങ്ങളിൽ ഉപയോഗപ്രദമാകും.
ചെക്ക്ബോട്ട് ഫയൽ:///var/www/documents/
മുൻവ്യവസ്ഥകൾ
ഈ സ്ക്രിപ്റ്റ് "LWP" മൊഡ്യൂളുകൾ ഉപയോഗിക്കുന്നു.
കോർക്വിസൈറ്റുകൾ
"Mail::Send" ഉള്ളപ്പോൾ ഈ സ്ക്രിപ്റ്റിന് മെയിൽ അയക്കാൻ കഴിയും.
onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് ഓൺലൈനായി checkbotp ഉപയോഗിക്കുക