ນີ້ແມ່ນ bogofilter ຄໍາສັ່ງທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
bogofilter - ການກັ່ນຕອງຂີ້ເຫຍື້ອ Bayesian ໄວ
ສະຫຼຸບສັງລວມ
bogofilter [ທາງເລືອກການຊ່ວຍເຫຼືອ | ທາງເລືອກການຈັດປະເພດ | ທາງເລືອກການລົງທະບຽນ |
ຕົວເລືອກພາລາມິເຕີ | ຂໍ້ມູນທາງເລືອກ] [ຕົວເລືອກທົ່ວໄປ] [ຕົວເລືອກໄຟລ໌ການຕັ້ງຄ່າ]
ບ່ອນທີ່
ຊ່ວຍເຫຼືອ ທາງເລືອກໃນການ ແມ່ນ:
[-h] [--help] [-V] [-Q]
ການຈັດປະເພດ ທາງເລືອກໃນການ ແມ່ນ:
[-p] [-e] [-t] [-T] [-u] [-H] [-M] [-b] [-B ຈຸດປະສົງ ...] [-R] [ທາງເລືອກທົ່ວໄປ]
[ຕົວເລືອກພາລາມິເຕີ] [ຕົວເລືອກໄຟລ໌ການຕັ້ງຄ່າ]
ການລົງທະບຽນ ທາງເລືອກໃນການ ແມ່ນ:
[-s | -n] [-S | -N] [ທາງເລືອກທົ່ວໄປ]
ໂດຍທົ່ວໄປ ທາງເລືອກໃນການ ແມ່ນ:
[-ຄ ຊື່ເອກະສານ] [-C] [-ງ dir] [-ກ cacheize] [-l] [-ລ ໂຄດຄໍາສັ່ງ] [-I ຊື່ເອກະສານ] [-ອ ຊື່ເອກະສານ]
ພາລາມິເຕີ ທາງເລືອກໃນການ ແມ່ນ:
[-ອ value[,value]] [-ມ value[,value][,value]] [-ອ value[,value]]
ຂໍ້ມູນ ທາງເລືອກໃນການ ແມ່ນ:
[-v] [-y ວັນ] [-D] [-x ທົງ]
config ເອກະສານ ທາງເລືອກໃນການ ແມ່ນ:
[--option=value]
ຫມາຍເຫດ: ໃຊ້ bogofilter - ຊ່ວຍ ເພື່ອສະແດງບັນຊີລາຍຊື່ເຕັມຂອງທາງເລືອກ.
ລາຍລະອຽດ
Bogofilter ແມ່ນການກັ່ນຕອງຂີ້ເຫຍື້ອ Bayesian. ໃນຮູບແບບປົກກະຕິຂອງມັນ, ມັນໃຊ້ເວລາອີເມລ໌
ຂໍ້ຄວາມຫຼືຂໍ້ຄວາມອື່ນໆກ່ຽວກັບການປ້ອນຂໍ້ມູນມາດຕະຖານ, ບໍ່ມີການກວດສອບສະຖິຕິກັບບັນຊີລາຍການ "ດີ"
ແລະຄໍາສັບ "ບໍ່ດີ", ແລະສົ່ງຄືນລະຫັດສະຖານະທີ່ຊີ້ບອກວ່າຂໍ້ຄວາມເປັນ spam ຫຼືບໍ່.
Bogofilter ຖືກອອກແບບດ້ວຍລະບົບສູດການຄິດໄລ່ໄວ, ໃຊ້ Berkeley DB ສໍາລັບການເລີ່ມຕົ້ນໄວ ແລະ
lookups, coded ໂດຍກົງໃນ C, ແລະ tuned ສໍາລັບຄວາມໄວ, ສະນັ້ນມັນສາມາດຖືກນໍາໃຊ້ສໍາລັບການຜະລິດໂດຍ
ເວັບໄຊທ໌ທີ່ດໍາເນີນການຫຼາຍ mail.
ນິທານ OF OPERATION
Bogofilter ປະຕິບັດການປ້ອນຂໍ້ມູນຂອງຕົນເປັນຖົງຂອງ tokens. ແຕ່ລະ token ຖືກກວດສອບກັບບັນຊີລາຍການຄໍາ,
ເຊິ່ງຮັກສາການນັບຈໍານວນເວລາທີ່ມັນເກີດຂຶ້ນໃນອີເມວທີ່ບໍ່ແມ່ນ spam ແລະ spam.
ຕົວເລກເຫຼົ່ານີ້ຖືກໃຊ້ເພື່ອຄິດໄລ່ການຄາດຄະເນຄວາມເປັນໄປໄດ້ຂອງຂໍ້ຄວາມທີ່
token ເກີດຂຶ້ນແມ່ນ spam. ສິ່ງເຫຼົ່ານັ້ນຖືກລວມເຂົ້າກັນເພື່ອຊີ້ບອກວ່າຂໍ້ຄວາມເປັນ spam ຫຼື
ຮືມ.
ໃນຂະນະທີ່ວິທີການນີ້ສຽງບໍ່ສົມບູນເມື່ອທຽບໃສ່ກັບວິທີການຈັບຄູ່ຮູບແບບປົກກະຕິຫຼາຍກວ່າ, ມັນ
ກາຍເປັນປະສິດທິພາບທີ່ສຸດ. ເຈ້ຍຂອງ Paul Graham A ແຜນການ ສໍາລັບການ Spam[1] ແມ່ນແນະນໍາໃຫ້
ການອ່ານ.
ໂຄງການນີ້ປັບປຸງຢ່າງຫຼວງຫຼາຍກ່ຽວກັບການສະເຫນີຂອງ Paul ໂດຍການເຮັດວິເຄາະ lexical smarter.
Bogofilter ເຮັດການຖອດລະຫັດ MIME ທີ່ຖືກຕ້ອງ ແລະການວິເຄາະ HTML ທີ່ສົມເຫດສົມຜົນ. ປະເພດພິເສດ
tokens ເຊັ່ນ hostnames ແລະ IP addresses ແມ່ນເກັບຮັກສາໄວ້ເປັນລັກສະນະການຮັບຮູ້ແທນທີ່ຈະກ່ວາ
ແຕກຂຶ້ນ. ປະເພດຕ່າງໆຂອງ MTA cruft ເຊັ່ນ: ວັນທີ ແລະຂໍ້ຄວາມ ID ແມ່ນຖືກລະເລີຍເພື່ອບໍ່ໃຫ້
ເພື່ອ bloat ບັນຊີລາຍຊື່ຄໍາ. ໂທເຄັນທີ່ພົບເຫັນຢູ່ໃນຊ່ອງຫົວຕ່າງໆແມ່ນຖືກໝາຍໄວ້ຢ່າງເໝາະສົມ.
ການປັບປຸງອີກອັນຫນຶ່ງແມ່ນວ່າໂຄງການນີ້ສະຫນອງການດັດແກ້ທີ່ແນະນໍາຂອງ Gary Robinson
ການຄິດໄລ່ (ເບິ່ງຕົວກໍານົດການ robx ແລະ robs ຂ້າງລຸ່ມນີ້). ການປ່ຽນແປງເຫຼົ່ານີ້ແມ່ນ
ອະທິບາຍໄວ້ໃນເອກະສານຂອງ Robinson Spam ການຄົ້ນພົບ[2]
ຕັ້ງແຕ່ນັ້ນມາ, Robinson (ເບິ່ງບົດຄວາມ Linux Journal ຂອງລາວ A ສະຖິຕິ ວິທີການ to ໄດ້ Spam
ບັນຫາ[3]) ແລະອື່ນໆໄດ້ຮັບຮູ້ວ່າການຄິດໄລ່ສາມາດໄດ້ຮັບການປັບປຸງເພີ່ມເຕີມໂດຍນໍາໃຊ້
ວິທີການຂອງ Fisher. ອີກປະການຫນຶ່ງ ການປັບປຸງ[4] ຊົດເຊີຍການຊໍ້າຊ້ອນຂອງ token ໂດຍການສະຫມັກ
ປັດໄຈຂະຫນາດທີ່ມີປະສິດທິພາບແຍກຕ່າງຫາກ (ESF) ກັບການຄິດໄລ່ຄວາມເປັນໄປໄດ້ spam ແລະ nonspam.
ໃນສັ້ນ, ນີ້ແມ່ນວິທີການເຮັດວຽກ: ການຄາດຄະເນສໍາລັບຄວາມເປັນໄປໄດ້ spam ຂອງບຸກຄົນ
tokens ແມ່ນລວມກັນໂດຍໃຊ້ "ຟັງຊັນ chi-square inverse". ມູນຄ່າຂອງມັນຊີ້ໃຫ້ເຫັນເຖິງວິທີການທີ່ບໍ່ດີ
ການສົມມຸດຕິຖານ null ວ່າຂໍ້ຄວາມແມ່ນພຽງແຕ່ການລວບລວມຂອງຄໍາທີ່ເປັນເອກະລາດແບບສຸ່ມ
ຄວາມເປັນໄປໄດ້ທີ່ໃຫ້ໂດຍການຄາດຄະເນທີ່ຜ່ານມາຂອງພວກເຮົາລົ້ມເຫລວ. ຟັງຊັນນີ້ມີຄວາມອ່ອນໄຫວຫຼາຍ
ຄວາມເປັນໄປໄດ້ເລັກນ້ອຍ (ຄໍາສັບ hammish), ແຕ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້ສູງ (ຄໍາ spammish); ດັ່ງນັ້ນ
ມູນຄ່າພຽງແຕ່ຊີ້ໃຫ້ເຫັນສັນຍານ hammish ທີ່ເຂັ້ມແຂງໃນຂໍ້ຄວາມ. ໃນປັດຈຸບັນການນໍາໃຊ້ inverse
ຄວາມເປັນໄປໄດ້ສໍາລັບ tokens, ການຄິດໄລ່ດຽວກັນແມ່ນເຮັດອີກເທື່ອຫນຶ່ງ, ໃຫ້ຕົວຊີ້ວັດທີ່
ຂໍ້ຄວາມເບິ່ງຄືວ່າ spammish ຢ່າງຫຼວງຫຼາຍ. ສຸດທ້າຍ, ສອງຕົວຊີ້ວັດເຫຼົ່ານັ້ນຖືກຫັກອອກ (ແລະ
ຂະຫຍາຍເປັນ 0-1-ໄລຍະຫ່າງ). ຕົວຊີ້ວັດລວມນີ້ (bogosity) ແມ່ນຢູ່ໃກ້ກັບ 0 ຖ້າຫາກວ່າອາການ
ສໍາລັບຂໍ້ຄວາມ hammish ແມ່ນເຂັ້ມແຂງກວ່າສໍາລັບຂໍ້ຄວາມ spammish ແລະຢູ່ໃກ້ກັບ 1 ຖ້າຫາກວ່າ
ສະຖານະການແມ່ນທາງອື່ນ. ຖ້າສັນຍານສໍາລັບທັງສອງມີຄວາມເຂັ້ມແຂງເທົ່າທຽມກັນ, ມູນຄ່າຈະເປັນ
ໃກ້ກັບ 0.5. ເນື່ອງຈາກຂໍ້ຄວາມເຫຼົ່ານັ້ນບໍ່ໄດ້ໃຫ້ສັນຍານທີ່ຊັດເຈນວ່າມີຮູບແບບ tristate ໃນ
bogofilter ເພື່ອໝາຍຂໍ້ຄວາມເຫຼົ່ານັ້ນວ່າບໍ່ແນ່ໃຈ, ໃນຂະນະທີ່ຂໍ້ຄວາມທີ່ຈະແຈ້ງຈະຖືກໝາຍວ່າເປັນສະແປມ
ຫຼື ham, ຕາມລໍາດັບ. ໃນໂໝດສອງລັດ, ທຸກໆຂໍ້ຄວາມຈະຖືກໝາຍວ່າເປັນ spam ຫຼື ham.
ຕົວກໍານົດການຕ່າງໆມີອິດທິພົນຕໍ່ການຄິດໄລ່ເຫຼົ່ານີ້, ທີ່ສໍາຄັນທີ່ສຸດແມ່ນ:
robx: ຄະແນນທີ່ມອບໃຫ້ກັບ token ທີ່ບໍ່ເຄີຍເຫັນມາກ່ອນ. robx ແມ່ນຄວາມເປັນໄປໄດ້ທີ່
token ແມ່ນ spammish.
robs: ນ້ໍາຫນັກຂອງ robx ເຊິ່ງຍ້າຍຄວາມເປັນໄປໄດ້ຂອງ token ທີ່ເຫັນເລັກນ້ອຍໄປສູ່ robx.
min-dev: ໄລຍະຫ່າງຕໍ່າສຸດຈາກ .5 ສໍາລັບ tokens ທີ່ຈະໃຊ້ໃນການຄໍານວນ. ໂທເຄັນເທົ່ານັ້ນ
ໄກຈາກ 0.5 ຫຼາຍກວ່າຄ່ານີ້ຖືກນໍາໃຊ້.
spam-cutoff: ຂໍ້ຄວາມທີ່ມີຄະແນນຫຼາຍກວ່າຫຼືເທົ່າກັບຈະຖືກຫມາຍວ່າເປັນ spam.
ham-cutoff: ຖ້າສູນຫຼື spam-cutoff, ຂໍ້ຄວາມທັງຫມົດທີ່ມີມູນຄ່າຕ່ໍາກວ່າ spam-cutoff ຢ່າງເຂັ້ມງວດ.
ຖືກຫມາຍເປັນ ham, ອື່ນໆທັງຫມົດເປັນ spam (ສອງລັດ). ຄ່າອື່ນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບ
ham-cutoff ແມ່ນຫມາຍເປັນ ham, ຂໍ້ຄວາມທີ່ມີຄ່າຢ່າງເຂັ້ມງວດລະຫວ່າງ ham-cutoff ແລະ
spam-cutoff ຖືກໝາຍວ່າບໍ່ແນ່ໃຈ; ສ່ວນທີ່ເຫຼືອເປັນ spam (tristate)
sp-esf: ປັດໄຈຂະຫນາດທີ່ມີປະສິດທິພາບ (ESF) ສໍາລັບ spam.
ns-esf: ESF ສໍາລັບ nonspam. ເຫຼົ່ານີ້ຄ່າ ESF ເລີ່ມຕົ້ນເປັນ 1.0, ເຊິ່ງຄືກັນກັບບໍ່ແມ່ນ
ການນໍາໃຊ້ ESF ໃນການຄິດໄລ່. ຄ່າທີ່ເຫມາະສົມກັບປະຊາກອນອີເມວຂອງຜູ້ໃຊ້ສາມາດເປັນ
ກໍານົດໂດຍການຊ່ວຍເຫຼືອຂອງໂຄງການ bogotune ໄດ້.
OPTIONS
ທາງເລືອກຊ່ວຍເຫຼືອ
ໄດ້ -h ທາງເລືອກພິມຂໍ້ຄວາມຊ່ວຍເຫຼືອແລະອອກ.
ໄດ້ -V ທາງເລືອກພິມຈໍານວນສະບັບແລະອອກ.
ໄດ້ -Q (ສອບຖາມ) ທາງເລືອກພິມການຕັ້ງຄ່າຂອງ bogofilter, ເຊັ່ນ: ຕົວກໍານົດການລົງທະບຽນ,
ຕົວເລືອກການວິເຄາະ, ບັນຊີລາຍການ bogofilter, ແລະອື່ນໆ.
ຕົວເລືອກການຈັດປະເພດ
ໄດ້ -p (passthrough) ທາງເລືອກອອກຂໍ້ຄວາມທີ່ມີເສັ້ນ X-Bogosity ໃນຕອນທ້າຍຂອງ
ຫົວຂໍ້ຂໍ້ຄວາມ. ອັນນີ້ຮຽກຮ້ອງໃຫ້ເກັບຂໍ້ຄວາມທັງໝົດໄວ້ໃນຄວາມຊົງຈຳເມື່ອມັນຖືກອ່ານຈາກ
stdin (ຫຼືຈາກທໍ່ຫຼືເຕົ້າສຽບ). ຖ້າຂໍ້ຄວາມຖືກອ່ານຈາກໄຟລ໌ທີ່ສາມາດ rewound ໄດ້,
bogofilter ຈະອ່ານມັນເທື່ອທີສອງ.
ໄດ້ -e (ຝັງ) ທາງເລືອກບອກ bogofilter ອອກດ້ວຍລະຫັດ 0 ຖ້າຂໍ້ຄວາມສາມາດເປັນ
ຈັດປະເພດ, ie ຖ້າບໍ່ມີຂໍ້ຜິດພາດ. ປົກກະຕິ bogofilter ໃຊ້ລະຫັດທີ່ແຕກຕ່າງກັນສໍາລັບ
ຂີ້ເຫຍື້ອ, ham, ແລະການຈັດປະເພດທີ່ບໍ່ແນ່ນອນ, ແຕ່ນີ້ເຮັດໃຫ້ການນໍາໃຊ້ bogofilter ກັບ procmail ງ່າຍຂຶ້ນ.
ຫຼື maildrop.
ໄດ້ -t (terse) ທາງເລືອກບອກ bogofilter ພິມຂໍ້ຄວາມ spamicity ຫຍໍ້
ມີ 1 ຕົວອັກສອນແລະຄະແນນ. Spam ແມ່ນລະບຸດ້ວຍ "Y", ham ໂດຍ "N", ແລະບໍ່ແນ່ໃຈວ່າໂດຍ
"U". ໝາຍເຫດ: ການຈັດຮູບແບບສາມາດປັບແຕ່ງໄດ້ໂດຍໃຊ້ໄຟລ໌ config.
ໄດ້ -T ສະຫນອງຮູບແບບ terse invariant ສໍາລັບສະຄິບທີ່ຈະໃຊ້. bogofilter ຈະພິມ an
ຫຍໍ້ຂໍ້ຄວາມຂີ້ເຫຍື້ອທີ່ມີ 1 ຕົວອັກສອນແລະຄະແນນ. Spam ແມ່ນຊີ້ໃຫ້ເຫັນດ້ວຍ
"S", ham ໂດຍ "H", ແລະບໍ່ແນ່ນອນໂດຍ "U".
ໄດ້ -TT ສະຫນອງຮູບແບບ terse invariant ສໍາລັບສະຄິບທີ່ຈະໃຊ້. Bogofilter ພິມພຽງແຕ່ໄດ້
ຄະແນນແລະສະແດງມັນເປັນ 16 ຕົວເລກທີ່ສໍາຄັນ.
ໄດ້ -u ທາງເລືອກບອກ bogofilter ລົງທະບຽນຂໍ້ຄວາມຂອງຂໍ້ຄວາມຫຼັງຈາກຈັດປະເພດມັນເປັນ spam
ຫຼືບໍ່ແມ່ນ spam. ຂໍ້ຄວາມຂີ້ເຫຍື້ອຈະຖືກລົງທະບຽນຢູ່ໃນລາຍຊື່ spam ແລະຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ spam ຢູ່ໃນ
ບັນຊີລາຍຊື່ທີ່ດີ. ຖ້າການຈັດປະເພດແມ່ນ "ບໍ່ແນ່ໃຈ", ຂໍ້ຄວາມຈະບໍ່ຖືກລົງທະບຽນ.
ປະສິດທິຜົນທາງເລືອກນີ້ດໍາເນີນການ bogofilter ກັບ -s or -n ທຸງ, ຕາມຄວາມເຫມາະສົມ. ຂໍ້ຄວນລະວັງແມ່ນ
ຮຽກຮ້ອງໃນການນໍາໃຊ້ຄວາມສາມາດນີ້, ຍ້ອນວ່າຄວາມຜິດພາດການຈັດປະເພດໃດໆ bogofilter ອາດຈະເຮັດໄດ້
ໄດ້ຮັບການຮັກສາໄວ້ແລະຈະສະສົມຈົນກ່ວາການແກ້ໄຂຄູ່ມືກັບການ -ນ ແລະ - ນ ທາງເລືອກ
ການປະສົມປະສານ. ໃຫ້ສັງເກດວ່າທາງເລືອກນີ້ເຮັດໃຫ້ຖານຂໍ້ມູນເປີດສໍາລັບການເຂົ້າເຖິງການຂຽນ, ເຊິ່ງ
ສາມາດເຮັດໃຫ້ເກີດການຊ້າລົງຢ່າງຫຼວງຫຼາຍໂດຍຜ່ານການໂຕ້ແຍ້ງຂອງລັອກແລະການດໍາເນີນງານ I/O synchronous.
ໄດ້ -H ທາງເລືອກບອກ bogofilter ບໍ່ໃຫ້ tag tokens ຈາກ header. ທາງເລືອກນີ້ແມ່ນສໍາລັບ
ການທົດສອບ, ທ່ານບໍ່ຄວນໃຊ້ມັນໃນການດໍາເນີນງານປົກກະຕິ.
ໄດ້ -M ທາງເລືອກບອກ bogofilter ໃຫ້ປະມວນຜົນການປ້ອນຂໍ້ມູນຂອງມັນເປັນໄຟລ໌ຮູບແບບ mbox. ຖ້າ -v or
-t ທາງເລືອກຍັງໄດ້ຮັບການໃຫ້, ເສັ້ນ spamicity ຈະຖືກພິມອອກສໍາລັບແຕ່ລະຂໍ້ຄວາມ.
ໄດ້ -b ທາງເລືອກ (streaming bulk mode) ບອກ bogofilter ເພື່ອຈັດປະເພດວັດຖຸຫຼາຍອັນທີ່ມີ
ຊື່ແມ່ນອ່ານຈາກ stdin. ຖ້າ -v or -t ທາງເລືອກແມ່ນໃຫ້, bogofilter ຈະພິມ a
ແຖວໃຫ້ຊື່ໄຟລ໌ແລະຂໍ້ມູນການຈັດປະເພດສໍາລັບແຕ່ລະໄຟລ໌. ນີ້ແມ່ນທາງເລືອກ
to -B ເຊິ່ງລາຍຊື່ວັດຖຸຢູ່ໃນເສັ້ນຄໍາສັ່ງ.
ວັດຖຸໃນສະພາບການນີ້ຈະເປັນ maildir (ກວດພົບອັດຕະໂນມັດ), ຫຼືຖ້າມັນບໍ່ແມ່ນ maildir, a
mail ດຽວເວັ້ນເສຍແຕ່ -M ແມ່ນໃຫ້ - ໃນກໍລະນີນັ້ນມັນຖືກປຸງແຕ່ງເປັນ mbox. (ຄວາມຍາວເນື້ອໃນ:
ສ່ວນຫົວບໍ່ໄດ້ຖືກພິຈາລະນາໃນປັດຈຸບັນ.)
ເມື່ອອ່ານຮູບແບບ mbox, bogofilter ອີງໃສ່ເສັ້ນເປົ່າຫຼັງຈາກ mail. ຖ້າຕ້ອງການ,
ຈົດໝາຍ -ແມ່ນ ຈະຮັບປະກັນວ່ານີ້ແມ່ນກໍລະນີ.
ໄດ້ -B ຈຸດປະສົງ ... (ຮູບແບບຫຼາຍ) ທາງເລືອກບອກ bogofilter ເພື່ອຈັດປະເພດວັດຖຸຫຼາຍອັນທີ່ມີຊື່
ຢູ່ໃນເສັ້ນຄໍາສັ່ງ. ວັດຖຸອາດຈະເປັນຊື່ໄຟລ໌ (ສໍາລັບຂໍ້ຄວາມດຽວ), ກ່ອງຈົດຫມາຍ (ໄຟລ໌
ມີຫຼາຍຂໍ້ຄວາມ), ຫຼືໄດເລກະທໍລີ (ຂອງຮູບແບບ maildir ແລະ MH). ຖ້າ -v or -t ທາງເລືອກ
ຍັງໄດ້ມອບໃຫ້, bogofilter ຈະພິມຊື່ໄຟລ໌ແລະການຈັດປະເພດ
ຂໍ້ມູນສໍາລັບແຕ່ລະໄຟລ໌. ນີ້ແມ່ນທາງເລືອກທີ່ຈະ -b ເຊິ່ງລາຍຊື່ວັດຖຸຢູ່ໃນ stdin.
ໄດ້ -R ທາງເລືອກບອກ bogofilter ໃຫ້ຜົນຜະລິດກອບຂໍ້ມູນ R ໃນຮູບແບບຂໍ້ຄວາມຕາມມາດຕະຖານ
ຜົນຜະລິດ. ເບິ່ງພາກສ່ວນກ່ຽວກັບການເຊື່ອມໂຍງກັບ R, ຂ້າງລຸ່ມນີ້, ສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ.
ຕົວເລືອກການລົງທະບຽນ
ໄດ້ -s ທາງເລືອກບອກ bogofilter ລົງທະບຽນຂໍ້ຄວາມທີ່ນໍາສະເຫນີເປັນ spam. ຖານຂໍ້ມູນແມ່ນ
ສ້າງຂຶ້ນຖ້າບໍ່ມີ.
ໄດ້ -n ທາງເລືອກບອກ bogofilter ລົງທະບຽນຂໍ້ຄວາມທີ່ນໍາສະເຫນີບໍ່ແມ່ນ spam.
Bogofilter ບໍ່ກວດພົບວ່າຂໍ້ຄວາມທີ່ລົງທະບຽນສອງຄັ້ງ. ຖ້າຫາກວ່າທ່ານເຮັດແນວນີ້ໂດຍບັງເອີນ, ໄດ້
ການນັບ token ຈະປິດລົງ 1 ຈາກສິ່ງທີ່ທ່ານຕ້ອງການ ແລະຄະແນນ spam ທີ່ສອດຄ້ອງກັນ
ຈະຫຼຸດລົງເລັກນ້ອຍ. ເນື່ອງຈາກຈໍານວນຂະຫນາດໃຫຍ່ຂອງ tokens ແລະຂໍ້ຄວາມໃນ wordlist, ນີ້
ບໍ່ສໍາຄັນ. ປັນຫາ ສາມາດເຮັດໄດ້ ໄດ້ຮັບການແກ້ໄຂໂດຍການນໍາໃຊ້ -S ທາງເລືອກຫຼື -N ທາງເລືອກ.
ໄດ້ -S ທາງເລືອກບອກ bogofilter ຍົກເລີກການລົງທະບຽນກ່ອນຫນ້າຂອງຂໍ້ຄວາມດຽວກັນກັບ spam.
ຖ້າຂໍ້ຄວາມຖືກໃສ່ບໍ່ຖືກຕ້ອງເປັນ spam ໂດຍ -s or -u ແລະທ່ານຕ້ອງການທີ່ຈະເອົາມັນແລະ
ໃສ່ມັນເປັນທີ່ບໍ່ແມ່ນ spam, ໃຊ້ -ນທີ່ຢູ່ ຖ້າຫາກວ່າ -S ຖືກນໍາໃຊ້ສໍາລັບຂໍ້ຄວາມທີ່ບໍ່ໄດ້ລົງທະບຽນເປັນ spam,
ການນັບຈະຍັງຄົງຖືກຫຼຸດລົງ.
ໄດ້ -N ທາງເລືອກບອກ bogofilter ຍົກເລີກການລົງທະບຽນກ່ອນຫນ້າຂອງຂໍ້ຄວາມດຽວກັນກັບ
ທີ່ບໍ່ແມ່ນ spam. ຖ້າຂໍ້ຄວາມຖືກໃສ່ບໍ່ຖືກຕ້ອງເປັນບໍ່ແມ່ນ spam ໂດຍ -n or -u ແລະທ່ານຕ້ອງການ
ເອົາມັນອອກແລະໃສ່ມັນເປັນ spam, ຈາກນັ້ນໃຊ້ - ນທີ່ຢູ່ ຖ້າຫາກວ່າ -N ຖືກນໍາໃຊ້ສໍາລັບຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ
ລົງທະບຽນເປັນທີ່ບໍ່ແມ່ນ spam, ການນັບຈະຍັງຄົງຖືກຫຼຸດລົງ.
ທາງເລືອກທົ່ວໄປ
ໄດ້ -c ຊື່ເອກະສານ ທາງເລືອກບອກ bogofilter ອ່ານໄຟລ໌ config ທີ່ມີຊື່.
ໄດ້ -C ທາງເລືອກປ້ອງກັນບໍ່ໃຫ້ bogofilter ຈາກການອ່ານໄຟລ໌ການຕັ້ງຄ່າ.
ໄດ້ -d dir ທາງເລືອກຊ່ວຍໃຫ້ທ່ານສາມາດຕັ້ງໄດເລກະທໍລີສໍາລັບຖານຂໍ້ມູນ. ເບິ່ງສະພາບແວດລ້ອມ
ພາກສ່ວນສໍາລັບຕົວເລືອກການຕັ້ງຄ່າໄດເລກະທໍລີອື່ນໆ.
ໄດ້ -k cacheize ທາງເລືອກກໍານົດຂະຫນາດ cache ສໍາລັບລະບົບຍ່ອຍ BerkeleyDB, ໃນຫນ່ວຍຂອງ 1
MiB (1,048,576 bytes). ຂະຫນາດ cache ຢ່າງຖືກຕ້ອງປັບປຸງການປະຕິບັດຂອງ bogofilter. ໄດ້
ຂະຫນາດທີ່ແນະນໍາແມ່ນຫນຶ່ງສ່ວນສາມຂອງຂະຫນາດຂອງໄຟລ໌ຖານຂໍ້ມູນ. ທ່ານສາມາດແລ່ນ bogotune ໄດ້
script (ໃນໄດເລກະທໍລີ tuning) ເພື່ອກໍານົດຂະຫນາດທີ່ແນະນໍາ.
ໄດ້ -l ທາງເລືອກຂຽນເສັ້ນຂໍ້ມູນໃສ່ບັນທຶກຂອງລະບົບໃນແຕ່ລະເວລາທີ່ bogofilter ຖືກແລ່ນ.
ຂໍ້ມູນທີ່ບັນທຶກໄວ້ແມ່ນຂຶ້ນກັບວິທີການ bogofilter ຖືກດໍາເນີນການ.
ໄດ້ -L ໂຄດຄໍາສັ່ງ ທາງເລືອກຕັ້ງຄ່າໂຄດຄໍາສັ່ງທີ່ສາມາດໄດ້ຮັບການລວມເຂົ້າໃນຂໍ້ມູນທີ່ຖືກບັນທຶກ
ໂດຍ -l ທາງເລືອກ, ແຕ່ວ່າມັນຮຽກຮ້ອງໃຫ້ມີຮູບແບບກໍານົດເອງທີ່ປະກອບມີ %l ສະຕຣິງສໍາລັບປັດຈຸບັນ.
ທາງເລືອກນີ້ຫມາຍເຖິງ -l.
ໄດ້ -I ຊື່ເອກະສານ ທາງເລືອກບອກ bogofilter ອ່ານວັດສະດຸປ້ອນຂອງມັນຈາກໄຟລ໌ທີ່ລະບຸ, ແທນທີ່ຈະ
ກ່ວາຈາກ stdin.
ໄດ້ -O ຊື່ເອກະສານ ທາງເລືອກບອກ bogofilter ບ່ອນທີ່ຈະຂຽນຜົນຜະລິດຂອງມັນໃນຮູບແບບ passthrough.
ໃຫ້ສັງເກດວ່ານີ້ເຮັດວຽກພຽງແຕ່ເມື່ອ -p ຖືກມອບໃຫ້ຢ່າງຊັດເຈນ.
ຕົວເລືອກພາຣາມິເຕີ
ໄດ້ -E value[,value] ທາງເລືອກອະນຸຍາດໃຫ້ກໍານົດຄ່າ sp-esf ແລະຄ່າ ns-esf. ກັບສອງ
ຄ່າ, ທັງ sp-esf ແລະ ns-esf ຖືກຕັ້ງ. ຖ້າມີຄ່າດຽວເທົ່ານັ້ນ, ພາລາມິເຕີຈະຖືກຕັ້ງເປັນ
ອະທິບາຍໄວ້ໃນບັນທຶກຂ້າງລຸ່ມນີ້.
ໄດ້ -m value[,value][,value] ທາງເລືອກອະນຸຍາດໃຫ້ກໍານົດຄ່າ min-dev ແລະ, ທາງເລືອກ, the
ຄ່າ robs ແລະ robx. ດ້ວຍສາມຄ່າ, min-dev, robs, ແລະ robx ຖືກຕັ້ງຄ່າທັງໝົດ. ຖ້າໜ້ອຍລົງ
ຄ່າແມ່ນໄດ້ຖືກມອບໃຫ້, ພາລາມິເຕີຖືກກໍານົດຕາມທີ່ອະທິບາຍໄວ້ໃນບັນທຶກຂ້າງລຸ່ມນີ້.
ໄດ້ -o value[,value] ທາງເລືອກອະນຸຍາດໃຫ້ກໍານົດຄ່າ spam-cutoff ham-cutoff. ກັບສອງ
ຄ່າ, ທັງ spam-cutoff ແລະ ham-cutoff ແມ່ນຖືກກໍານົດ. ຖ້າພຽງແຕ່ຫນຶ່ງຄ່າແມ່ນໃຫ້, ຕົວກໍານົດການ
ຖືກກໍານົດໄວ້ຕາມທີ່ອະທິບາຍໄວ້ໃນບັນທຶກຂ້າງລຸ່ມນີ້.
ໝາຍເຫດ: ຕົວເລືອກທັງໝົດເຫຼົ່ານີ້ອະນຸຍາດໃຫ້ມີຄ່າໜ້ອຍລົງ. ຄ່າສາມາດຂ້າມໄດ້
ໂດຍໃຊ້ພຽງແຕ່ຕົວຂັ້ນເຄື່ອງໝາຍຈຸດ, ໃນກໍລະນີນີ້ ຕົວກໍານົດການທີ່ສອດຄ້ອງກັນຈະບໍ່ເປັນ.
ປ່ຽນແປງ. ຖ້າພຽງແຕ່ໃຫ້ຄ່າທໍາອິດ, ຫຼັງຈາກນັ້ນພຽງແຕ່ກໍານົດຕົວກໍານົດການທໍາອິດ.
ຄ່າຕໍ່ທ້າຍສາມາດຂ້າມໄດ້, ໃນກໍລະນີດັ່ງກ່າວນີ້, ຕົວກໍານົດການທີ່ກ່ຽວຂ້ອງຈະບໍ່ເປັນ
ປ່ຽນແປງ. ພາຍໃນລາຍການພາລາມິເຕີ, ບໍ່ອະນຸຍາດໃຫ້ມີຍະຫວ່າງຫຼັງຈາກເຄື່ອງໝາຍຈຸດ.
ຂໍ້ມູນທາງເລືອກ
ໄດ້ -v ທາງເລືອກຜະລິດບົດລາຍງານຜົນຜະລິດມາດຕະຖານກ່ຽວກັບການວິເຄາະຂອງ bogofilter ຂອງວັດສະດຸປ້ອນ.
ແຕ່ລະເພີ່ມເຕີມ v ຈະເພີ່ມ verbosity ຂອງຜົນຜະລິດໄດ້, ສູງສຸດຂອງ 4. ກັບ
-vv, ບົດລາຍງານສະແດງລາຍການ tokens ທີ່ມີ deviation ສູງສຸດຈາກສະເລ່ຍຂອງ 0.5 ສະມາຄົມ
ກັບ spam.
ທາງເລືອກ -y ວັນ ສາມາດໃຊ້ເພື່ອແທນທີ່ວັນທີປັດຈຸບັນໃນເວລາທີ່ການປະທັບຕາເວລາ. ຄ່າ
ຂອງສູນ (0) ປິດການປະທັບຕາເວລາ.
ໄດ້ -D ທາງເລືອກ redirects debug output ກັບ stdout.
ໄດ້ -x ທົງ ທາງເລືອກອະນຸຍາດໃຫ້ຕັ້ງຂອງທຸງ debug ສໍາລັບການພິມຂໍ້ມູນດີບັກ. ເບິ່ງ
header file debug.h ສຳລັບລາຍຊື່ທຸງທີ່ສາມາດໃຊ້ໄດ້.
ຕັ້ງຄ່າຕົວເລືອກໄຟລ໌
ໃຊ້ GNU longopt -- syntax, config ໄຟລ໌ name=value ຖະແຫຼງການກາຍເປັນເສັ້ນຄໍາສັ່ງ
--option=value. ໃຊ້ຄໍາສັ່ງ bogofilter - ຊ່ວຍ ສໍາລັບບັນຊີລາຍຊື່ຂອງທາງເລືອກແລະເບິ່ງ
bogofilter.cf. ຕົວຢ່າງສໍາລັບຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບພວກມັນ. ຕົວຢ່າງເພື່ອປ່ຽນສ່ວນຫົວ X-Bogosity
ເພື່ອ "X-Spam-Header", ໃຊ້:
--spam-header-name=X-Spam-header
ENVIRONMENT
Bogofilter ໃຊ້ໄດເລກະທໍລີຖານຂໍ້ມູນ, ເຊິ່ງສາມາດຖືກກໍານົດໄວ້ໃນໄຟລ໌ config. ຖ້າບໍ່ໄດ້ຕັ້ງ
ຢູ່ທີ່ນັ້ນ, bogofilter ຈະໃຊ້ມູນຄ່າຂອງ BOGOFILTER_DIR. ທັງສອງສາມາດໄດ້ຮັບການ overridden ໂດຍ -d
dir ທາງເລືອກ. ຖ້າບໍ່ມີອັນນັ້ນ, bogofilter ຈະໃຊ້ໄດເລກະທໍລີ $HOME/.bogofilter.
CONFIGURATION
ເສັ້ນຄໍາສັ່ງ bogofilter ອະນຸຍາດໃຫ້ກໍານົດທາງເລືອກຫຼາຍທີ່ກໍານົດວິທີການ bogofilter
ດໍາເນີນການ. ໄຟລ໌ /etc/bogofilter.cf ສາມາດຖືກນໍາໃຊ້ເພື່ອກໍານົດພາລາມິເຕີເພີ່ມເຕີມທີ່ມີຜົນກະທົບຂອງມັນ
ການດໍາເນີນງານ. ໄຟລ໌ /etc/bogofilter.cf.example ມີຕົວຢ່າງຂອງພາລາມິເຕີທັງໝົດ. ສະຖານະ
ແລະບັນທຶກຂໍ້ຄວາມສາມາດຖືກປັບແຕ່ງສໍາລັບແຕ່ລະເວັບໄຊທ໌.
ກັບຄືນ VALUES
0 ສໍາລັບ spam; 1 ສໍາລັບການທີ່ບໍ່ແມ່ນ spam; 2 ສໍາລັບການບໍ່ແນ່ໃຈວ່າ; 3 ສໍາລັບ I/O ຫຼືຄວາມຜິດພາດອື່ນໆ.
ຖ້າທັງສອງ -p ແລະ -e ຖືກນໍາໃຊ້, ມູນຄ່າກັບຄືນແມ່ນ: 0 ສໍາລັບ spam ຫຼືບໍ່ແມ່ນ spam; 3 ສໍາລັບ I/O ຫຼື
ຄວາມຜິດພາດອື່ນໆ.
ຄວາມຜິດພາດ 3 ປົກກະຕິແລ້ວຫມາຍຄວາມວ່າໄຟລ໌ລາຍການຄໍາທີ່ bogofilter ຕ້ອງການອ່ານໃນຕອນເລີ່ມຕົ້ນແມ່ນ
ຂາດຫາຍໄປຫຼືຮາດດິດໄດ້ຕື່ມຂໍ້ມູນໃສ່ -p mode
ການຮ່ວມມື ກັບ ອື່ນໆ ເຄື່ອງມື
ໃຊ້ກັບ procmail
ສູດຕໍ່ໄປນີ້ (a) spam-bins ສິ່ງໃດແດ່ທີ່ bogofilter ອັດຕາເປັນ spam, (b) ລົງທະບຽນ
ຄໍາສັບຕ່າງໆໃນຂໍ້ຄວາມທີ່ຖືກຈັດອັນດັບເປັນ spam ດັ່ງກ່າວ, ແລະ (c) ລົງທະບຽນຄໍາທີ່ຢູ່ໃນຂໍ້ຄວາມທີ່ຖືກຈັດອັນດັບ
ທີ່ບໍ່ແມ່ນ spam ເຊັ່ນນັ້ນ. ດ້ວຍຈຸດນີ້, ມັນເປັນປົກກະຕິພຽງແຕ່ມີຄວາມຈໍາເປັນສໍາລັບຜູ້ໃຊ້
ແຊກແຊງ (ກັບ - ນ or -ນ) ເມື່ອ bogofilter ການຈັດປະເພດບາງຢ່າງຜິດພາດ.
# ການກັ່ນຕອງເມລຜ່ານ bogofilter, ແທັກມັນເປັນ Ham, Spam, ຫຼືບໍ່ແນ່ນອນ,
# ແລະການປັບປຸງບັນຊີລາຍການຄໍາ
:0fw
| bogofilter -u -e -p
# ຖ້າ bogofilter ລົ້ມເຫລວ, ສົ່ງຄືນເມລໄປຫາແຖວ;
# MTA ຈະລອງໃໝ່ໃນພາຍຫຼັງ
# 75 ແມ່ນຄ່າຂອງ EX_TEMPFAIL ໃນ /usr/include/sysexits.h
:0e
{ EXITCODE=75 ເຈົ້າພາບ }
# ຍື່ນຈົດໝາຍໄປທີ່ spam-bogofilter ຖ້າມັນເປັນ spam.
: 0:
* ^X-Bogosity: Spam, tests=bogofilter
spam-bogofilter
# ຍື່ນຈົດໝາຍໄປຫາ bogofilter ທີ່ບໍ່ແນ່ໃຈ
# ຖ້າມັນບໍ່ແມ່ນທັງ ham ຫຼື spam.
: 0:
* ^X-Bogosity: ບໍ່ແນ່ໃຈ, tests=bogofilter
unsure-bogofilter
# ດ້ວຍສູດນີ້, ທ່ານສາມາດຝຶກອົບຮົມ bogofilter ເລີ່ມຕົ້ນດ້ວຍການຫວ່າງເປົ່າ
# ລາຍການຄຳສັບ. ໃຫ້ແນ່ໃຈວ່າກວດເບິ່ງໂຟນເດີທີ່ບໍ່ແນ່ນອນຂອງເຈົ້າເປັນປົກກະຕິ, ເອົາ
# ຂໍ້ຄວາມອອກຈາກມັນ, ຈັດປະເພດພວກມັນເປັນ ham (ຫຼື spam), ແລະໃຊ້ພວກມັນ
# bogofilter ລົດໄຟ.
ກົດລະບຽບ procmail ຕໍ່ໄປນີ້ຈະເອົາເມລໃນ stdin ແລະບັນທຶກມັນເພື່ອສົ່ງ spam ຖ້າ bogofilter
ຄິດວ່າມັນເປັນ spam:
:0HB:
* ? bogofilter
ຂີ້ເຫຍື້ອ
ແລະກົດລະບຽບທີ່ຄ້າຍຄືກັນນີ້ຍັງຈະລົງທະບຽນ tokens ໃນ mail ອີງຕາມການ
ການຈັດປະເພດ bogofilter:
:0HB:
* ? bogofilter -u
ຂີ້ເຫຍື້ອ
ຖ້າ bogofilter ລົ້ມເຫລວ (ກັບຄືນ 3) ຂໍ້ຄວາມຈະຖືກປະຕິບັດວ່າບໍ່ແມ່ນ spam.
ອັນນີ້ແມ່ນສໍາລັບ maildrop, ມັນອັດຕະໂນມັດ defers mail ແລະ retries ຕໍ່ມາໃນເວລາທີ່
ຄໍາສັ່ງ xfilter ລົ້ມເຫລວ, ໃຊ້ນີ້ຢູ່ໃນຂອງທ່ານ ~/.mailfilter:
xfilter "bogofilter -u -e -p"
ຖ້າ (/^X-Bogosity: Spam, tests=bogofilter/)
{
ກັບ "spam-bogofilter"
}
ແຖວ .muttrc ຕໍ່ໄປນີ້ຈະສ້າງ mutt macro ສຳລັບການສົ່ງຈົດໝາຍໄປຍັງ bogofilter.
ດັດຊະນີມະຫາພາກ d " ບໍ່ໄດ້ຕັ້ງ wait_key\n\
bogofilter -n\n\
ຕັ້ງ wait_key\n\
" "ລຶບຂໍ້ຄວາມທີ່ເປັນບໍ່ແມ່ນ spam"
ດັດຊະນີມະຫາພາກ \ed " ບໍ່ໄດ້ຕັ້ງ wait_key\n\
bogofilter -s\n\
ຕັ້ງ wait_key\n\
" "ລຶບຂໍ້ຄວາມເປັນ spam"
ການປະສົມປະສານກັບຕົວແທນການຂົນສົ່ງທາງໄປສະນີ (MTA)
1. bogofilter ຍັງສາມາດໄດ້ຮັບການປະສົມປະສານເຂົ້າໄປໃນ MTA ເພື່ອກັ່ນຕອງຈົດຫມາຍຂາເຂົ້າທັງຫມົດ. ໃນຂະນະທີ່
ການປະຕິບັດສະເພາະແມ່ນຂຶ້ນກັບ MTA, ຂັ້ນຕອນທົ່ວໄປມີດັ່ງນີ້:
2. ຕິດຕັ້ງ bogofilter ໃນເຄື່ອງແມ່ຂ່າຍເມລ
3. Prime the bogofilter databases with a spam and non-spam corpus. ນັບຕັ້ງແຕ່ bogofilter ຈະ
ຮັບໃຊ້ຊຸມຊົນຂະຫນາດໃຫຍ່, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະຊີ້ນໍາມັນກັບຊຸດຕົວແທນ
ຂອງຂໍ້ຄວາມ.
4. ຕັ້ງຄ່າ MTA ເພື່ອເອີ້ນ bogofilter ໃນແຕ່ລະຂໍ້ຄວາມ. ໃນຂະນະທີ່ນີ້ແມ່ນ MTA ສະເພາະ
ຂັ້ນຕອນ, ທ່ານອາດຈະຈໍາເປັນຕ້ອງໄດ້ນໍາໃຊ້ -p, -u, ແລະ -e ຕົວເລືອກ
5. ກໍານົດກົນໄກສໍາລັບຜູ້ໃຊ້ລົງທະບຽນ spam / ຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ spam, ເຊັ່ນດຽວກັນກັບການແກ້ໄຂ
ການຈັດປະເພດທີ່ຜິດພາດ. ການແກ້ໄຂທົ່ວໄປທີ່ສຸດແມ່ນການຕັ້ງຄ່າທີ່ຢູ່ອີເມວ alias ກັບ
ທີ່ຜູ້ໃຊ້ bounce ຂໍ້ຄວາມ.
6. ເບິ່ງເອກະສານ ແລະລາຍຊື່ການປະກອບສ່ວນສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.
ການນໍາໃຊ້ R ເພື່ອກວດສອບການຄິດໄລ່ຂອງ bogofilter
ທາງເລືອກ -R ບອກ bogofilter ເພື່ອສ້າງກອບຂໍ້ມູນ R. ກອບຂໍ້ມູນປະກອບມີຫນຶ່ງ
row ຕໍ່ token ວິເຄາະ. ແຕ່ລະແຖວດັ່ງກ່າວມີ token, ຜົນລວມຂອງຖານຂໍ້ມູນຂອງມັນ "ດີ"
ແລະການນັບ "spam", ການນັບ "ດີ" ແບ່ງອອກດ້ວຍຈໍານວນຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ spam ທີ່ໃຊ້ເພື່ອ
ສ້າງຖານຂໍ້ມູນການຝຶກອົບຮົມ, ການນັບ "spam" ແບ່ງອອກດ້ວຍຈໍານວນຂໍ້ຄວາມ spam,
f(w) ຂອງ Robinson ສໍາລັບ token, ບັນທຶກທໍາມະຊາດຂອງ (1 - f(w)) ແລະ f(w), ແລະຕົວຊີ້ວັດ.
ຕົວອັກສອນ (+ ຖ້າຄ່າ f(w) ຂອງ token ເກີນຄ່າ deviation ຕໍ່າສຸດຈາກ 0.5, - ຖ້າມັນ
ບໍ່). ມີແຖວໜຶ່ງເພີ່ມເຕີມຢູ່ທ້າຍຕາຕະລາງທີ່ມີປ້າຍກຳກັບຢູ່ໃນ
token ພາກສະຫນາມ, ປະຕິບັດຕາມດ້ວຍຈໍານວນຂອງຄໍາສັບຕ່າງໆທີ່ນໍາໃຊ້ຈິງ (ຄໍາທີ່ມີ + ຕົວຊີ້ວັດ),
ຄ່າ P, Q, S, s ແລະ x ຂອງ Robinson ແລະຄ່າ deviation ຕໍ່າສຸດ.
ກອບຂໍ້ມູນ R ສາມາດຖືກບັນທຶກໄວ້ໃນໄຟລ໌ແລະຕໍ່ມາອ່ານເຂົ້າໄປໃນກອງປະຊຸມ R (ເບິ່ງ ໄດ້ R
ໂຄງການ ເວັບໄຊທ໌[5] ສໍາລັບຂໍ້ມູນກ່ຽວກັບຊຸດຄະນິດສາດ R). ສະຫນອງໃຫ້ກັບ
ການແຈກຢາຍ bogofilter ແມ່ນສະຄິບ R ແບບງ່າຍດາຍ (ໄຟລ໌ bogo.R) ທີ່ສາມາດຖືກນໍາໃຊ້ເພື່ອກວດສອບ
ການຄິດໄລ່ຂອງ bogofilter. ຄໍາແນະນໍາສໍາລັບການນໍາໃຊ້ຂອງມັນຖືກລວມຢູ່ໃນສະຄິບໃນຮູບແບບ
ຂອງຄໍາເຫັນ.
LOG MESSAGES
Bogofilter ຂຽນຂໍ້ຄວາມໃສ່ບັນທຶກຂອງລະບົບໃນເວລາທີ່ -l ທາງເລືອກແມ່ນຖືກນໍາໃຊ້. ສິ່ງທີ່ຂຽນ
ຂຶ້ນກັບວ່າທຸງອື່ນໃດຖືກໃຊ້.
ການແລ່ນການຈັດປະເພດຈະສ້າງ (ພວກເຮົາບໍ່ໄດ້ສະແດງວັນທີ ແລະພາກສ່ວນເຈົ້າພາບຢູ່ນີ້):
bogofilter[1412]: X-Bogosity: Ham, spamicity=0.000227
bogofilter[1415]: X-Bogosity: Spam, spamicity=0.998918
ການນໍາໃຊ້ -u ເພື່ອຈັດປະເພດຂໍ້ຄວາມແລະປັບປຸງບັນຊີລາຍການຄໍາຈະຜະລິດ (ຫນຶ່ງແຖວດຽວ):
bogofilter[1426]: X-Bogosity: Spam, spamicity=0.998918,
ລົງທະບຽນ -s, 329 ຄໍາ, 1 ຂໍ້ຄວາມ
ການຈົດທະບຽນຄໍາສັບຕ່າງໆ (-l ແລະ -s, -n, -S, ຫຼື -N) ຈະຜະລິດ:
bogofilter[1440]: register-n, 255 ຄໍາ, 1 ຂໍ້ຄວາມ
ແລ່ນລົງທະບຽນ (ໃຊ້ -s, -n, -N, ຫຼື -S) ຈະສ້າງຂໍ້ຄວາມເຊັ່ນ:
bogofilter[17330]: register-n, 574 ຄໍາ, 3 ຂໍ້ຄວາມ
bogofilter[6244]: register-s, 1273 ຄໍາ, 4 ຂໍ້ຄວາມ
ໃຊ້ bogofilter ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net