ນີ້ແມ່ນຄໍາສັ່ງ checkbotp ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
Checkbot - WWW Link Verifier
ສະຫຼຸບສັງລວມ
checkbot [--ຄຸກກີ້] [--debug] [--file ຊື່ເອກະສານ] [- ຊ່ວຍ]
[--mailto ທີ່ຢູ່ອີເມວ] [--noproxy ບັນຊີລາຍຊື່ຂອງໂດເມນ]
[-- verbose]
[--url URL ເລີ່ມຕົ້ນ]
[--ການແຂ່ງຂັນ match string] [--ຍົກເວັ້ນ ບໍ່ລວມສາຍພັນ]
[-- ຕົວແທນ URL ຕົວແທນ] [-- ພາຍໃນເທົ່ານັ້ນ]
[--ບໍ່ສົນໃຈ ບໍ່ສົນໃຈ string]
[--ການກັ່ນຕອງ ການທົດແທນການສະແດງອອກປົກກະຕິ]
[--ແບບ URL ໄຟລ໌ຮູບແບບ]
[--ຫມາຍເຫດ ຫມາຍເຫດ] [-- ນອນ ວິນາທີ] [--ຫມົດເວລາ ຫມົດເວລາ]
[-- ໄລຍະຫ່າງ ວິນາທີ] [-- ຢ່າເຕືອນ ລະຫັດຕອບຮັບ HTTP]
[--enable-virtual]
[-- ພາສາ ລະຫັດພາສາ]
[-- ສະກັດກັ້ນ ໄຟລ໌ສະກັດກັ້ນ]
[ເລີ່ມ URLs]
ລາຍລະອຽດ
Checkbot ກວດສອບການເຊື່ອມຕໍ່ໃນສ່ວນສະເພາະຂອງ World Wide Web. ມັນສ້າງ HTML
ຫນ້າທີ່ມີການວິນິດໄສ.
Checkbot ໃຊ້ LWP ເພື່ອຊອກຫາ URL ໃນຫນ້າຕ່າງໆແລະກວດເບິ່ງພວກມັນ. ມັນສະຫນັບສະຫນູນໂຄງການດຽວກັນກັບ
LWP ເຮັດ, ແລະຊອກຫາການເຊື່ອມຕໍ່ດຽວກັນທີ່ HTML::LinkExtor ຈະຊອກຫາ.
Checkbot ພິຈາລະນາການເຊື່ອມຕໍ່ເປັນ 'ພາຍໃນ' ຫຼື 'ພາຍນອກ'. ການເຊື່ອມຕໍ່ພາຍໃນແມ່ນການເຊື່ອມຕໍ່
ພາຍໃນພື້ນທີ່ເວັບໄຊຕ໌ທີ່ຕ້ອງໄດ້ຮັບການກວດສອບ. ຖ້າການເຊື່ອມຕໍ່ພາຍໃນຊີ້ໄປຫາເວັບ
ເອກະສານນີ້ຖືກດຶງມາ, ແລະການເຊື່ອມຕໍ່ຂອງມັນໄດ້ຖືກສະກັດແລະປຸງແຕ່ງ. ພາຍນອກ
ການເຊື່ອມຕໍ່ພຽງແຕ່ຖືກກວດສອບເພື່ອເຮັດວຽກ. Checkbot ກວດສອບການເຊື່ອມຕໍ່ຍ້ອນວ່າມັນຊອກຫາພວກມັນ, ດັ່ງນັ້ນພາຍໃນ
ແລະການເຊື່ອມຕໍ່ພາຍນອກຖືກກວດສອບໃນເວລາດຽວກັນ, ເຖິງແມ່ນວ່າພວກເຂົາຖືກປະຕິບັດແຕກຕ່າງກັນ.
ທາງເລືອກສໍາລັບ Checkbot ແມ່ນ:
--ຄຸກກີ້
ຍອມຮັບ cookies ຈາກເຄື່ອງແມ່ຂ່າຍແລະສະເຫນີໃຫ້ເຂົາເຈົ້າອີກເທື່ອຫນຶ່ງຕາມຄໍາຮ້ອງຂໍຕໍ່ມາ. ນີ້ອາດຈະເປັນ
ເປັນປະໂຫຍດສໍາລັບເຄື່ອງແມ່ຂ່າຍທີ່ໃຊ້ cookies ເພື່ອຈັດການເຊດຊັນ. ໂດຍຄ່າເລີ່ມຕົ້ນ Checkbot ບໍ່ໄດ້
ຍອມຮັບ cookies ໃດ.
--debug
ເປີດໃຊ້ໂໝດດີບັກ. ບໍ່ຮອງຮັບແທ້ໆ, ແຕ່ມັນຈະຮັກສາບາງໄຟລ໌ໄວ້
ຖ້າບໍ່ດັ່ງນັ້ນຈະຖືກລຶບຖິ້ມ.
--file
ໃຊ້ໄຟລ໌ ເອກະສານ ຊື່ ເປັນພື້ນຖານສໍາລັບຊື່ໄຟລ໌ສະຫຼຸບ. ຫນ້າສະຫຼຸບຈະ
ໄດ້ຮັບ ເອກະສານ ຊື່ ໃຫ້, ແລະຫນ້າເຊີຟເວີແມ່ນອີງໃສ່ ເອກະສານ ຊື່ ໂດຍບໍ່ມີການ
.html ສ່ວນຂະຫຍາຍ. ຕົວຢ່າງ, ການຕັ້ງຄ່າຕົວເລືອກນີ້ເປັນ "index.html" ຈະສ້າງ a
ຫນ້າສະຫຼຸບທີ່ເອີ້ນວ່າ index.html ແລະຫນ້າເຊີຟເວີທີ່ເອີ້ນວ່າ index-server1.html ແລະ
index-server2.html.
ຄ່າເລີ່ມຕົ້ນສໍາລັບຕົວເລືອກນີ້ແມ່ນ "checkbot.html".
- ຊ່ວຍ
ສະແດງຂໍ້ຄວາມຊ່ວຍເຫຼືອສັ້ນໆກ່ຽວກັບຜົນຜະລິດມາດຕະຖານ.
--mailto [, ]
ສົ່ງອີເມວໄປຫາ ອີເມວ ທີ່ຢູ່ ເມື່ອ Checkbot ເຮັດການກວດສອບ. ທ່ານສາມາດໃຫ້ຫຼາຍກ່ວາ
ທີ່ຢູ່ໜຶ່ງທີ່ແຍກດ້ວຍເຄື່ອງໝາຍຈຸດ. ອີເມວແຈ້ງເຕືອນປະກອບມີບົດສະຫຼຸບເລັກນ້ອຍຂອງ
ຜົນໄດ້ຮັບ. ໃນຖານະເປັນຂອງ Checkbot 1.76 ອີເມວຖືກສົ່ງພຽງແຕ່ຖ້າບັນຫາໄດ້ຖືກພົບເຫັນໃນລະຫວ່າງ
ແລ່ນ Checkbot.
--noproxy
ຫ້າມການຮ້ອງຂໍຕົວແທນໃຫ້ກັບໂດເມນທີ່ໃຫ້. ລາຍຊື່ໂດເມນຕ້ອງເປັນເຄື່ອງໝາຍຈຸດ.
ລາຍຊື່ແຍກອອກ. ຕົວຢ່າງ, ດັ່ງນັ້ນຫຼີກເວັ້ນການໃຊ້ proxy ສໍາລັບ localhost ແລະ
someserver.xyz, ທ່ານສາມາດນໍາໃຊ້ "--noproxy localhost, someserver.xyz".
-- verbose
ສະແດງຜົນຜະລິດ verbose ໃນຂະນະທີ່ແລ່ນ. ລວມມີການເຊື່ອມຕໍ່ທັງໝົດທີ່ກວດສອບ, ຜົນໄດ້ຮັບຈາກ
ກວດກາ, ແລະອື່ນໆ.
--url
ຕັ້ງ URL ເລີ່ມຕົ້ນ. Checkbot ເລີ່ມການກວດສອບຢູ່ URL ນີ້, ແລະຫຼັງຈາກນັ້ນກວດເບິ່ງຄືນໃຫມ່
ການເຊື່ອມຕໍ່ທັງຫມົດທີ່ພົບເຫັນຢູ່ໃນຫນ້ານີ້. URL ເລີ່ມຕົ້ນແມ່ນມີຄວາມສຳຄັນກວ່າ URL ເພີ່ມເຕີມ
ລະບຸໄວ້ໃນເສັ້ນຄໍາສັ່ງ.
ຖ້າບໍ່ມີໂຄງການໃດຖືກລະບຸໄວ້ສໍາລັບ URL, ອະນຸສັນຍາໄຟລ໌ແມ່ນສົມມຸດ.
--ການແຂ່ງຂັນ
ຕົວເລືອກນີ້ເລືອກວ່າຫນ້າໃດທີ່ Checkbot ພິຈາລະນາທ້ອງຖິ່ນ. ຖ້າ ການແຂ່ງຂັນ string is
ບັນຈຸຢູ່ໃນ URL, ຫຼັງຈາກນັ້ນ Checkbot ພິຈາລະນາຫນ້າທ້ອງຖິ່ນ, ດຶງມັນ, ແລະ
ຈະກວດສອບການເຊື່ອມຕໍ່ທັງຫມົດທີ່ມີຢູ່ໃນມັນ. ຖ້າບໍ່ດັ່ງນັ້ນຫນ້າຈະຖືກພິຈາລະນາພາຍນອກ
ແລະມັນຖືກກວດສອບດ້ວຍການຮ້ອງຂໍ HEAD ເທົ່ານັ້ນ.
ຖ້າບໍ່ຊັດເຈນ ການແຂ່ງຂັນ string ແມ່ນໃຫ້, URL ເລີ່ມຕົ້ນ (ເບິ່ງຕົວເລືອກ "--url") ຈະຖືກໃຊ້
ເປັນສະຕຣິງຈັບຄູ່ແທນ. ໃນກໍລະນີນີ້, ຊື່ຫນ້າສຸດທ້າຍ, ຖ້າມີ, ຈະຖືກຕັດອອກ.
ຕົວຢ່າງ, URL ເລີ່ມຕົ້ນເຊັ່ນ "http://some.site/index.html" ຈະສົ່ງຜົນໃຫ້ມີຄ່າເລີ່ມຕົ້ນ
ການແຂ່ງຂັນ string ຂອງ "http://some.site/".
ໄດ້ ການແຂ່ງຂັນ string ສາມາດເປັນການສະແດງອອກປົກກະຕິ perl. ສໍາລັບຕົວຢ່າງ, ການກວດສອບຕົ້ນຕໍ
ຫນ້າເຊີບເວີແລະຫນ້າ HTML ທັງຫມົດໂດຍກົງພາຍໃຕ້ມັນ, ແຕ່ບໍ່ແມ່ນຫນ້າ HTML ໃນ
ໄດເລກະທໍລີຍ່ອຍຂອງເຄື່ອງແມ່ຂ່າຍ, the ການແຂ່ງຂັນ string ຈະ
"www.someserver.xyz/($|[^/]+.html)".
--ຍົກເວັ້ນ
URL ທີ່ກົງກັບ ຍົກເວັ້ນ string ຖືກຖືວ່າເປັນພາຍນອກ, ເຖິງແມ່ນວ່າພວກເຂົາເກີດຂຶ້ນກັບ
ກົງກັບ ການແຂ່ງຂັນ string (ເບິ່ງຕົວເລືອກ "--match"). URL ທີ່ກົງກັບ --exclude string ແມ່ນ
ຍັງຄົງຖືກກວດສອບແລະຈະຖືກລາຍງານຖ້າພົບບັນຫາ, ແຕ່ພວກມັນຈະບໍ່ເປັນ
ກວດເບິ່ງການເຊື່ອມຕໍ່ເພີ່ມເຕີມເຂົ້າໄປໃນເວັບໄຊທ໌.
ໄດ້ ຍົກເວັ້ນ string ສາມາດເປັນການສະແດງອອກປົກກະຕິ perl. ຕົວຢ່າງ, ເພື່ອພິຈາລະນາທຸກ URL
ດ້ວຍສາຍຄຳຊອກຫາພາຍນອກ, ໃຫ້ໃຊ້ "[=\?]". ນີ້ສາມາດເປັນປະໂຫຍດເມື່ອ URL ທີ່ມີການສອບຖາມ
string unlocks ເສັ້ນທາງໄປສູ່ຖານຂໍ້ມູນອັນໃຫຍ່ຫຼວງເຊິ່ງຈະຖືກກວດສອບ.
--ການກັ່ນຕອງ
ຕົວເລືອກນີ້ກໍານົດ a ການກັ່ນຕອງ string, ຊຶ່ງເປັນການສະແດງອອກປົກກະຕິ perl. ການກັ່ນຕອງນີ້
ຖືກດໍາເນີນການໃນແຕ່ລະ URL ທີ່ພົບເຫັນ, ດັ່ງນັ້ນຈຶ່ງຂຽນ URL ອີກເທື່ອຫນຶ່ງກ່ອນທີ່ມັນຈະເຂົ້າໄປໃນແຖວທີ່ຈະເປັນ
ກວດແລ້ວ. ມັນສາມາດຖືກນໍາໃຊ້ເພື່ອເອົາອົງປະກອບອອກຈາກ URL. ທາງເລືອກນີ້ສາມາດເປັນປະໂຫຍດໃນເວລາທີ່
ການເຊື່ອມຕໍ່ສັນຍາລັກຊີ້ໃຫ້ເຫັນເຖິງໄດເລກະທໍລີດຽວກັນ, ຫຼືເມື່ອລະບົບການຄຸ້ມຄອງເນື້ອຫາເພີ່ມ
ເຊດຊັນ IDs ກັບ URLs.
ຕົວຢ່າງ "/old/new/" ຈະທົດແທນການປະກົດຕົວຂອງ 'ເກົ່າ' ດ້ວຍ 'ໃໝ່' ໃນແຕ່ລະ URL.
--ບໍ່ສົນໃຈ
URL ທີ່ກົງກັບ ບໍ່ສົນໃຈ string ບໍ່ໄດ້ກວດກາທັງຫມົດ, ພວກເຂົາເຈົ້າໄດ້ຖືກລະເລີຍໂດຍ
Checkbot. ນີ້ສາມາດເປັນປະໂຫຍດທີ່ຈະບໍ່ສົນໃຈການເຊື່ອມຕໍ່ບັນຫາທີ່ຮູ້ຈັກ, ຫຼືບໍ່ສົນໃຈການເຊື່ອມຕໍ່ນໍາ
ເຂົ້າໄປໃນຖານຂໍ້ມູນ. ໄດ້ ບໍ່ສົນໃຈ string ຖືກຈັບຄູ່ຫຼັງຈາກ ການກັ່ນຕອງ string ໄດ້ຖືກນຳໃຊ້ແລ້ວ.
ໄດ້ ບໍ່ສົນໃຈ string ສາມາດເປັນການສະແດງອອກປົກກະຕິ perl.
ຕົວຢ່າງ "www.server.com\/(one|two)" ຈະກົງກັບທຸກ URL ທີ່ເລີ່ມຕົ້ນດ້ວຍອັນໃດນຶ່ງ
www.server.com/one ຫຼື www.server.com/two.
-- ຕົວແທນ
ຄຸນລັກສະນະນີ້ລະບຸ URL ຂອງເຊີບເວີພຣັອກຊີ. ພຽງແຕ່ການຮ້ອງຂໍ HTTP ແລະ FTP
ຈະຖືກສົ່ງໄປຫາເຊີບເວີພຣັອກຊີນັ້ນ.
-- ພາຍໃນເທົ່ານັ້ນ
ຂ້າມການກວດສອບການເຊື່ອມຕໍ່ພາຍນອກໃນຕອນທ້າຍຂອງການດໍາເນີນການ Checkbot. ກົງກັນເທົ່ານັ້ນ
ການເຊື່ອມຕໍ່ຖືກກວດສອບ. ໃຫ້ສັງເກດວ່າບາງການປ່ຽນເສັ້ນທາງອາດຈະຍັງເຮັດໃຫ້ການເຊື່ອມຕໍ່ພາຍນອກເປັນ
ກວດກາ.
--ຫມາຍເຫດ
ໄດ້ ຫມາຍເຫດ ໄດ້ຖືກລວມເຂົ້າໃນຂໍ້ຄວາມທາງໄປສະນີ (ເບິ່ງຕົວເລືອກ "--mailto"). ນີ້ສາມາດເປັນ
ເປັນປະໂຫຍດທີ່ຈະລວມເອົາ URL ຂອງຫນ້າ HTML ສະຫຼຸບສໍາລັບການອ້າງອີງງ່າຍ, ສໍາລັບການຍົກຕົວຢ່າງ.
ພຽງແຕ່ມີຄວາມຫມາຍໃນການປະສົມປະສານກັບທາງເລືອກ "--mailto".
-- ນອນ
ຈໍານວນ ວິນາທີ ນອນຢູ່ໃນລະຫວ່າງການຮ້ອງຂໍ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 0 ວິນາທີ, ie ບໍ່
ນອນຢູ່ໃນທຸກລະຫວ່າງການຮ້ອງຂໍ. ການຕັ້ງຄ່າຕົວເລືອກນີ້ສາມາດເປັນປະໂຫຍດເພື່ອຮັກສາການໂຫຼດໄດ້
ເຊີບເວີເວັບລົງໃນຂະນະທີ່ແລ່ນ Checkbot. ຕົວເລືອກນີ້ຍັງສາມາດຖືກຕັ້ງເປັນ a
ຕົວເລກເສດເຫຼືອ, ie ຄ່າຂອງ 0.1 ຈະນອນຫນຶ່ງສ່ວນສິບຂອງວິນາທີລະຫວ່າງ
ການຮ້ອງຂໍ.
--ຫມົດເວລາ
ໝົດເວລາເລີ່ມຕົ້ນສຳລັບການຮ້ອງຂໍ, ລະບຸເປັນວິນາທີ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 2 ນາທີ.
-- ໄລຍະຫ່າງ
ໄລຍະຫ່າງສູງສຸດລະຫວ່າງການປັບປຸງຂອງຫນ້າເວັບຜົນໄດ້ຮັບໃນວິນາທີ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 3
ຊົ່ວໂມງ (10800 ວິນາທີ). Checkbot ຈະເລີ່ມໄລຍະຫ່າງໃນເວລາຫນຶ່ງນາທີ, ແລະຄ່ອຍໆ
ຂະຫຍາຍມັນໄປສູ່ໄລຍະສູງສຸດ.
--ແບບ
ເມື່ອຕົວເລືອກນີ້ຖືກນໍາໃຊ້, Checkbot ຈະຝັງ URL ນີ້ເປັນການເຊື່ອມຕໍ່ກັບໄຟລ໌ຮູບແບບໃນແຕ່ລະ
ຫນ້າທີ່ມັນຂຽນ. ນີ້ເຮັດໃຫ້ມັນງ່າຍທີ່ຈະປັບແຕ່ງຮູບແບບຂອງຫນ້າທີ່ສ້າງໂດຍ
Checkbot.
-- ຢ່າເຕືອນ
ຢ່າລວມເອົາຄໍາເຕືອນຢູ່ໃນຫນ້າຜົນໄດ້ຮັບສໍາລັບລະຫັດຕອບ HTTP ເຫຼົ່ານັ້ນທີ່ກົງກັນ
ການສະແດງອອກປົກກະຕິ. ຕົວຢ່າງ, --dontwarn "(301|404)" ຈະບໍ່ລວມເອົາ 301 ແລະ.
404 ລະຫັດຕອບສະຫນອງ.
Checkbot ໃຊ້ລະຫັດຕອບສະຫນອງທີ່ສ້າງຂຶ້ນໂດຍເຄື່ອງແມ່ຂ່າຍ, ເຖິງແມ່ນວ່າລະຫັດຕອບສະຫນອງນີ້
ບໍ່ໄດ້ຖືກກໍານົດໄວ້ໃນ RFC 2616 (HTTP/1.1). ນອກເຫນືອໄປຈາກລະຫັດຕອບສະຫນອງ HTTP ປົກກະຕິ,
Checkbot ກໍານົດລະຫັດຕອບສະຫນອງຈໍານວນຫນ້ອຍສໍາລັບສະຖານະການທີ່ບໍ່ແມ່ນທາງວິຊາການ
ບັນຫາ, ແຕ່ວ່າເຮັດໃຫ້ເກີດບັນຫາໃນຫຼາຍໆກໍລະນີ. ລະຫັດເຫຼົ່ານີ້ແມ່ນ:
ຄາດວ່າຊື່ເຈົ້າພາບ 901 ແຕ່ບໍ່ພົບ
ໃນກໍລະນີນີ້ URL ສະຫນັບສະຫນູນຊື່ເຈົ້າພາບ, ແຕ່ບໍ່ພົບ
ໃນ URL. ນີ້ປົກກະຕິແລ້ວຊີ້ໃຫ້ເຫັນຄວາມຜິດພາດໃນ URL. ອັນ
ຂໍ້ຍົກເວັ້ນແມ່ນວ່າການກວດສອບນີ້ບໍ່ໄດ້ນໍາໃຊ້ກັບຂ່າວ: URLs.
902 ພົບເຫັນຊື່ເຈົ້າພາບທີ່ບໍ່ມີເງື່ອນໄຂ
ໃນກໍລະນີນີ້ຊື່ໂຮດບໍ່ມີສ່ວນໂດເມນ.
ນີ້ມັກຈະຫມາຍຄວາມວ່າຫນ້າເຮັດວຽກໄດ້ດີເມື່ອເບິ່ງພາຍໃນ
ໂດເມນຕົ້ນສະບັບ, ແຕ່ບໍ່ແມ່ນເມື່ອເບິ່ງຈາກພາຍນອກມັນ.
903 Double slash ໃນເສັ້ນທາງ URL
URL ມີ slash ສອງເທົ່າຢູ່ໃນມັນ. ນີ້ແມ່ນກົດຫມາຍ, ແຕ່ບາງເວັບ
ເຊີບເວີບໍ່ສາມາດຈັດການກັບມັນໄດ້ດີຫຼາຍແລະອາດຈະເຮັດໃຫ້ Checkbot
ແລ່ນຫນີ. ເບິ່ງຄໍາເຫັນຂ້າງລຸ່ມນີ້.
904 ໂຄງການທີ່ບໍ່ຮູ້ຈັກໃນ URL
URL ເລີ່ມຕົ້ນດ້ວຍໂຄງການທີ່ Checkbot ບໍ່ຮູ້
ກ່ຽວກັບ. ນີ້ມັກຈະເກີດມາຈາກການພິມຜິດໂຄງການຂອງ URL,
ແຕ່ໂຄງການດັ່ງກ່າວຍັງສາມາດເປັນທາງກົດໝາຍໄດ້. ໃນກໍລະນີດັ່ງກ່າວນີ້, ກະລຸນາໃຫ້
ຂ້ອຍຮູ້ເພື່ອໃຫ້ມັນສາມາດຖືກເພີ່ມໃສ່ Checkbot.
--enable-virtual
ທາງເລືອກນີ້ເຮັດໃຫ້ສາມາດຈັດການກັບເຄື່ອງແມ່ຂ່າຍ virtual. Checkbot ຫຼັງຈາກນັ້ນສົມມຸດວ່າທັງຫມົດ
ຊື່ໂຮດສໍາລັບເຄື່ອງແມ່ຂ່າຍພາຍໃນແມ່ນເປັນເອກະລັກ, ເຖິງແມ່ນວ່າທີ່ຢູ່ IP ຂອງພວກເຂົາອາດຈະເປັນ
ດຽວກັນ. ໂດຍປົກກະຕິ Checkbot ໃຊ້ທີ່ຢູ່ IP ເພື່ອຈໍາແນກເຄື່ອງແມ່ຂ່າຍ. ນີ້ມີ
ປະໂຫຍດທີ່ຖ້າເຄື່ອງແມ່ຂ່າຍມີສອງຊື່ (ເຊັ່ນ: www ແລະ bamboozle) ຫນ້າຂອງມັນພຽງແຕ່ໄດ້ຮັບ
ກວດສອບຄັ້ງດຽວ. ເມື່ອທ່ານຕ້ອງການກວດເບິ່ງເຄື່ອງແມ່ຂ່າຍ virtual ຫຼາຍອັນນີ້ເຮັດໃຫ້ເກີດບັນຫາ,
ເຊິ່ງຄຸນສົມບັດນີ້ໃຊ້ໄດ້ໂດຍການໃຊ້ຊື່ໂຮດເພື່ອຈຳແນກເຊີບເວີ.
-- ພາສາ
ການໂຕ້ຖຽງສໍາລັບທາງເລືອກນີ້ແມ່ນລະຫັດພາສາສອງຕົວອັກສອນ. Checkbot ຈະໃຊ້ພາສາ
ການເຈລະຈາເພື່ອຮ້ອງຂໍໄຟລ໌ໃນພາສານັ້ນ. ຄ່າເລີ່ມຕົ້ນແມ່ນການຮ້ອງຂໍພາສາອັງກິດ
ພາສາ (ລະຫັດພາສາ 'en').
-- ສະກັດກັ້ນ
ການໂຕ້ຖຽງສໍາລັບທາງເລືອກນີ້ແມ່ນໄຟລ໌ທີ່ມີການປະສົມປະສານຂອງລະຫັດຂໍ້ຜິດພາດແລະ
URL ທີ່ຈະສະກັດກັ້ນການເຕືອນ. ນີ້ສາມາດຖືກນໍາໃຊ້ເພື່ອຫຼີກເວັ້ນການລາຍງານທີ່ຮູ້ຈັກແລະ
ຂໍ້ຜິດພາດຫຼືການເຕືອນ URL ທີ່ບໍ່ສາມາດແກ້ໄຂໄດ້.
ຮູບແບບຂອງໄຟລ໌ສະກັດກັ້ນແມ່ນຮູບແບບຈໍາກັດຊ່ອງຫວ່າງທີ່ງ່າຍດາຍ, ທໍາອິດ
ລາຍຊື່ລະຫັດຂໍ້ຜິດພາດຕາມດ້ວຍ URL. ແຕ່ລະລະຫັດຂໍ້ຜິດພາດແລະການປະສົມປະສານ URL ແມ່ນ
ຢູ່ໃນແຖວໃຫມ່. ຄໍາເຫັນສາມາດຖືກເພີ່ມໃສ່ໄຟລ໌ໂດຍການເລີ່ມຕົ້ນເສັ້ນດ້ວຍ a
"#" ຕົວອັກສອນ.
# 301 ຍ້າຍອອກຖາວອນ
301 http://www.w3.org/P3P
#403 ຫ້າມ
403 http://www.herring.com/
ສໍາລັບຄວາມຍືດຫຍຸ່ນຕື່ມອີກ, ການສະແດງອອກປົກກະຕິສາມາດຖືກນໍາໃຊ້ແທນທີ່ຈະເປັນ URL ປົກກະຕິ. ໄດ້
ການສະແດງຜົນປົກກະຕິຈະຕ້ອງຖືກປິດດ້ວຍເຄື່ອງໝາຍຂ້າງໜ້າ. ຕົວຢ່າງ, ເພື່ອສະກັດກັ້ນທັງຫມົດ
403 ຂໍ້ຜິດພາດໃນ wikipedia:
403 /http:\/\/wikipedia.org\/.*/
ທາງເລືອກທີ່ຖືກຄັດເລືອກທີ່ຈະຫາຍໄປໃນການປ່ອຍໃນອະນາຄົດ:
--allow-simple-hosts (ເຊົາໃຊ້ແລ້ວ)
ຕົວເລືອກນີ້ຈະປິດການເຕືອນກ່ຽວກັບ URL ທີ່ມີຊື່ໂຮດທີ່ບໍ່ມີເງື່ອນໄຂ. ນີ້
ເປັນປະໂຫຍດສໍາລັບສະຖານທີ່ intranet ທີ່ມັກຈະໃຊ້ພຽງແຕ່ຊື່ໂຮດງ່າຍດາຍຫຼືແມ້ກະທັ້ງ
"localhost" ໃນການເຊື່ອມຕໍ່ຂອງພວກເຂົາ.
ການໃຊ້ຕົວເລືອກນີ້ຖືກປະຕິເສດ. ກະລຸນາໃຊ້ກົນໄກ --dontwarn ສໍາລັບຄວາມຜິດພາດ 902
ແທນທີ່ຈະເປັນ.
ຄໍາແນະນໍາ ແລະ ເຄັດລັບການ
ມີບັນຫາກັບການກວດສອບການເຊື່ອມຕໍ່ FTP
ຜູ້ໃຊ້ບາງຄົນອາດຈະປະສົບບັນຫາທີ່ສອດຄ່ອງໃນການກວດສອບການເຊື່ອມຕໍ່ FTP. ໃນກໍລະນີເຫຼົ່ານີ້
ມັນອາດຈະເປັນປະໂຫຍດທີ່ຈະສັ່ງໃຫ້ Net::FTP ໃຊ້ໂຫມດ FTP passive ເພື່ອກວດເບິ່ງໄຟລ໌. ນີ້ສາມາດ
ເຮັດໄດ້ໂດຍການຕັ້ງຕົວແປສະພາບແວດລ້ອມ FTP_PASSIVE ເປັນ 1. ຕົວຢ່າງ, ການນໍາໃຊ້
bash shell: "FTP_PASSIVE=1 checkbot ...". ເບິ່ງ Net::ເອກະສານ FTP ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ
ລາຍລະອຽດ.
Run-away Checkbot
ໃນບາງກໍລະນີ Checkbot ໃຊ້ເວລາຕະຫຼອດໄປເພື່ອໃຫ້ສໍາເລັດ. ມີສອງສາເຫດທົ່ວໄປ
ສໍາລັບບັນຫານີ້.
ຫນ້າທໍາອິດ, ອາດຈະມີຄໍາຮ້ອງສະຫມັກຖານຂໍ້ມູນເປັນສ່ວນຫນຶ່ງຂອງເວັບໄຊທ໌ທີ່ສ້າງ a
ຫນ້າໃຫມ່ໂດຍອີງໃສ່ການເຊື່ອມຕໍ່ໃນຫນ້າອື່ນ. ນັບຕັ້ງແຕ່ Checkbot ພະຍາຍາມເດີນທາງຜ່ານທັງຫມົດ
ການເຊື່ອມຕໍ່ນີ້ຈະສ້າງຈໍານວນຫນ້າທີ່ບໍ່ມີຂອບເຂດ. ປະເພດຂອງຜົນກະທົບແລ່ນຫນີນີ້ແມ່ນ
ປົກກະຕິແລ້ວຄາດຄະເນ. ມັນສາມາດຫຼີກເວັ້ນໄດ້ໂດຍການໃຊ້ທາງເລືອກ --exclude.
ອັນທີສອງ, ບັນຫາການຕັ້ງຄ່າເຊີບເວີສາມາດເຮັດໃຫ້ເກີດການຫມຸນວຽນໃນການສ້າງ URL ສໍາລັບຫນ້າຕ່າງໆ
ທີ່ແທ້ບໍ່ມີ. ນີ້ຈະສົ່ງຜົນໃຫ້ URL ຂອງແບບຟອມ
http://some.server/images/images/images/logo.png, ພ້ອມກັບ 'ຮູບພາບ' ຫຼາຍກວ່ານັ້ນລວມຢູ່.
Checkbot ບໍ່ສາມາດກວດສອບສິ່ງນີ້ໄດ້ເພາະວ່າເຄື່ອງແມ່ຂ່າຍຄວນຈະຊີ້ໃຫ້ເຫັນວ່າ
ໜ້າທີ່ຮ້ອງຂໍບໍ່ມີຢູ່. ບໍ່ມີວິທີງ່າຍໆທີ່ຈະແກ້ໄຂບັນຫານີ້ນອກເຫນືອຈາກການແກ້ໄຂ
ເຊີບເວີເວັບທີ່ລະເມີດ ຫຼືການເຊື່ອມຕໍ່ທີ່ແຕກຫັກ.
ບັນຫາກັບ https:// links
ຂໍ້ຄວາມຜິດພາດ
ບໍ່ສາມາດຊອກຫາວິທີການວັດຖຸ "ໃໝ່" ຜ່ານແພັກເກດ "LWP::Protocol::https::Socket"
ປົກກະຕິແລ້ວຫມາຍຄວາມວ່າການຕິດຕັ້ງ LWP ໃນປັດຈຸບັນບໍ່ສະຫນັບສະຫນູນການກວດສອບ SSL
ການເຊື່ອມຕໍ່ (ເຊັ່ນ: ການເຊື່ອມຕໍ່ເລີ່ມຕົ້ນດ້ວຍ https://). ບັນຫານີ້ສາມາດແກ້ໄຂໄດ້ໂດຍການຕິດຕັ້ງ
ໂມດູນ Crypt::SSLeay.
ຕົວຢ່າງ
ການນໍາໃຊ້ທີ່ງ່າຍດາຍທີ່ສຸດຂອງ Checkbot ແມ່ນການກວດສອບຊຸດຂອງຫນ້າໃນເຄື່ອງແມ່ຂ່າຍ. ເພື່ອກວດເບິ່ງຂອງຂ້ອຍ
ຫນ້າ checkbot ຂ້ອຍຈະໃຊ້:
checkbot http://degraaff.org/checkbot/
ການແລ່ນ Checkbot ສາມາດໃຊ້ເວລາບາງເວລາເພື່ອໃຫ້ Checkbot ສາມາດສົ່ງອີເມວແຈ້ງເຕືອນເມື່ອການແລ່ນແມ່ນ
ເຮັດແລ້ວ:
checkbot --mailto [email protected] http://degraaff.org/checkbot/
ມັນເປັນໄປໄດ້ທີ່ຈະກວດເບິ່ງຊຸດຂອງໄຟລ໌ທ້ອງຖິ່ນໂດຍບໍ່ຕ້ອງໃຊ້ເຄື່ອງແມ່ຂ່າຍເວັບໄຊຕ໌. ນີ້ພຽງແຕ່ເຮັດວຽກ
ສໍາລັບໄຟລ໌ຄົງທີ່ແຕ່ອາດຈະເປັນປະໂຫຍດໃນບາງກໍລະນີ.
ໄຟລ໌ checkbot:///var/www/documents/
ເງື່ອນໄຂເບື້ອງຕົ້ນ
ສະຄຣິບນີ້ໃຊ້ໂມດູນ "LWP".
ສິ່ງຫຼັກໆ
ສະຄຣິບນີ້ສາມາດສົ່ງຈົດໝາຍໄດ້ເມື່ອມີ "Mail::Send" ຢູ່.
ໃຊ້ checkbotp ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net