ພາສາອັງກິດພາສາຝຣັ່ງແອສປາໂຍນ

OnWorks favicon

bogofilter - ອອນລາຍໃນຄລາວ

ເປີດໃຊ້ bogofilter ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນ bogofilter ຄໍາສັ່ງທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


bogofilter - ການກັ່ນຕອງຂີ້ເຫຍື້ອ Bayesian ໄວ

ສະຫຼຸບສັງລວມ


bogofilter [ທາງເລືອກການຊ່ວຍເຫຼືອ | ທາງເລືອກການຈັດປະເພດ | ທາງ​ເລືອກ​ການ​ລົງ​ທະ​ບຽນ |
ຕົວເລືອກພາລາມິເຕີ | ຂໍ້ມູນທາງເລືອກ] [ຕົວເລືອກທົ່ວໄປ] [ຕົວເລືອກໄຟລ໌ການຕັ້ງຄ່າ]

ບ່ອນທີ່

ຊ່ວຍເຫຼືອ ທາງເລືອກໃນການ ແມ່ນ:

[-h] [--help] [-V] [-Q]

ການຈັດປະເພດ ທາງເລືອກໃນການ ແມ່ນ:

[-p] [-e] [-t] [-T] [-u] [-H] [-M] [-b] [-B ຈຸດ​ປະ​ສົງ ...] [-R​] [ທາງ​ເລືອກ​ທົ່ວ​ໄປ​]
[ຕົວເລືອກພາລາມິເຕີ] [ຕົວເລືອກໄຟລ໌ການຕັ້ງຄ່າ]

ການລົງທະບຽນ ທາງເລືອກໃນການ ແມ່ນ:

[-s | -n] [-S | -N​] [ທາງ​ເລືອກ​ທົ່ວ​ໄປ​]

ໂດຍທົ່ວໄປ ທາງເລືອກໃນການ ແມ່ນ:

[-ຄ ຊື່​ເອ​ກະ​ສານ] [-C] [-ງ dir] [-ກ cacheize] [-l] [-ລ ໂຄດ​ຄໍາ​ສັ່ງ] [-I ຊື່​ເອ​ກະ​ສານ] [-ອ ຊື່​ເອ​ກະ​ສານ]

ພາລາມິເຕີ ທາງເລືອກໃນການ ແມ່ນ:

[-ອ value[,value]] [-ມ value[,value][,value]] [-ອ value[,value]]

ຂໍ້ມູນ ທາງເລືອກໃນການ ແມ່ນ:

[-v] [-y ວັນ] [-D] [-x ທົງ]

config ເອກະສານ ທາງເລືອກໃນການ ແມ່ນ:

[--option=value]

ຫມາຍເຫດ: ໃຊ້ bogofilter - ຊ່ວຍ ເພື່ອສະແດງບັນຊີລາຍຊື່ເຕັມຂອງທາງເລືອກ.

ລາຍລະອຽດ


Bogofilter ແມ່ນການກັ່ນຕອງຂີ້ເຫຍື້ອ Bayesian. ໃນຮູບແບບປົກກະຕິຂອງມັນ, ມັນໃຊ້ເວລາອີເມລ໌
ຂໍ້​ຄວາມ​ຫຼື​ຂໍ້​ຄວາມ​ອື່ນໆ​ກ່ຽວ​ກັບ​ການ​ປ້ອນ​ຂໍ້​ມູນ​ມາດ​ຕະ​ຖານ​, ບໍ່​ມີ​ການ​ກວດ​ສອບ​ສະ​ຖິ​ຕິ​ກັບ​ບັນ​ຊີ​ລາຍ​ການ "ດີ​"
ແລະຄໍາສັບ "ບໍ່ດີ", ແລະສົ່ງຄືນລະຫັດສະຖານະທີ່ຊີ້ບອກວ່າຂໍ້ຄວາມເປັນ spam ຫຼືບໍ່.
Bogofilter ຖືກອອກແບບດ້ວຍລະບົບສູດການຄິດໄລ່ໄວ, ໃຊ້ Berkeley DB ສໍາລັບການເລີ່ມຕົ້ນໄວ ແລະ
lookups, coded ໂດຍກົງໃນ C, ແລະ tuned ສໍາລັບຄວາມໄວ, ສະນັ້ນມັນສາມາດຖືກນໍາໃຊ້ສໍາລັບການຜະລິດໂດຍ
ເວັບໄຊທ໌ທີ່ດໍາເນີນການຫຼາຍ mail.

ນິທານ OF OPERATION


Bogofilter ປະຕິບັດການປ້ອນຂໍ້ມູນຂອງຕົນເປັນຖົງຂອງ tokens. ແຕ່ລະ token ຖືກກວດສອບກັບບັນຊີລາຍການຄໍາ,
ເຊິ່ງຮັກສາການນັບຈໍານວນເວລາທີ່ມັນເກີດຂຶ້ນໃນອີເມວທີ່ບໍ່ແມ່ນ spam ແລະ spam.
ຕົວເລກເຫຼົ່ານີ້ຖືກໃຊ້ເພື່ອຄິດໄລ່ການຄາດຄະເນຄວາມເປັນໄປໄດ້ຂອງຂໍ້ຄວາມທີ່
token ເກີດຂຶ້ນແມ່ນ spam. ສິ່ງເຫຼົ່ານັ້ນຖືກລວມເຂົ້າກັນເພື່ອຊີ້ບອກວ່າຂໍ້ຄວາມເປັນ spam ຫຼື
ຮືມ.

ໃນ​ຂະ​ນະ​ທີ່​ວິ​ທີ​ການ​ນີ້​ສຽງ​ບໍ່​ສົມ​ບູນ​ເມື່ອ​ທຽບ​ໃສ່​ກັບ​ວິ​ທີ​ການ​ຈັບ​ຄູ່​ຮູບ​ແບບ​ປົກ​ກະ​ຕິ​ຫຼາຍ​ກວ່າ​, ມັນ​
ກາຍເປັນປະສິດທິພາບທີ່ສຸດ. ເຈ້ຍຂອງ Paul Graham A ແຜນການ ສໍາລັບການ Spam[1​] ແມ່ນ​ແນະ​ນໍາ​ໃຫ້​
ການອ່ານ.

ໂຄງ​ການ​ນີ້​ປັບ​ປຸງ​ຢ່າງ​ຫຼວງ​ຫຼາຍ​ກ່ຽວ​ກັບ​ການ​ສະ​ເຫນີ​ຂອງ Paul ໂດຍ​ການ​ເຮັດ​ວິ​ເຄາະ lexical smarter​.
Bogofilter ເຮັດການຖອດລະຫັດ MIME ທີ່ຖືກຕ້ອງ ແລະການວິເຄາະ HTML ທີ່ສົມເຫດສົມຜົນ. ປະເພດພິເສດ
tokens ເຊັ່ນ hostnames ແລະ IP addresses ແມ່ນເກັບຮັກສາໄວ້ເປັນລັກສະນະການຮັບຮູ້ແທນທີ່ຈະກ່ວາ
ແຕກ​ຂຶ້ນ. ປະເພດຕ່າງໆຂອງ MTA cruft ເຊັ່ນ: ວັນທີ ແລະຂໍ້ຄວາມ ID ແມ່ນຖືກລະເລີຍເພື່ອບໍ່ໃຫ້
ເພື່ອ bloat ບັນຊີລາຍຊື່ຄໍາ. ໂທເຄັນທີ່ພົບເຫັນຢູ່ໃນຊ່ອງຫົວຕ່າງໆແມ່ນຖືກໝາຍໄວ້ຢ່າງເໝາະສົມ.

ການປັບປຸງອີກອັນຫນຶ່ງແມ່ນວ່າໂຄງການນີ້ສະຫນອງການດັດແກ້ທີ່ແນະນໍາຂອງ Gary Robinson
ການຄິດໄລ່ (ເບິ່ງຕົວກໍານົດການ robx ແລະ robs ຂ້າງລຸ່ມນີ້). ການປ່ຽນແປງເຫຼົ່ານີ້ແມ່ນ
ອະທິບາຍໄວ້ໃນເອກະສານຂອງ Robinson Spam ການຄົ້ນພົບ[2]

ຕັ້ງແຕ່ນັ້ນມາ, Robinson (ເບິ່ງບົດຄວາມ Linux Journal ຂອງລາວ A ສະຖິຕິ ວິທີການ to ໄດ້ Spam
ບັນຫາ[3​]​) ແລະ​ອື່ນໆ​ໄດ້​ຮັບ​ຮູ້​ວ່າ​ການ​ຄິດ​ໄລ່​ສາ​ມາດ​ໄດ້​ຮັບ​ການ​ປັບ​ປຸງ​ເພີ່ມ​ເຕີມ​ໂດຍ​ນໍາ​ໃຊ້​
ວິທີການຂອງ Fisher. ອີກປະການຫນຶ່ງ ການປັບປຸງ[4] ຊົດເຊີຍການຊໍ້າຊ້ອນຂອງ token ໂດຍການສະຫມັກ
ປັດໄຈຂະຫນາດທີ່ມີປະສິດທິພາບແຍກຕ່າງຫາກ (ESF) ກັບການຄິດໄລ່ຄວາມເປັນໄປໄດ້ spam ແລະ nonspam.

ໃນສັ້ນ, ນີ້ແມ່ນວິທີການເຮັດວຽກ: ການຄາດຄະເນສໍາລັບຄວາມເປັນໄປໄດ້ spam ຂອງບຸກຄົນ
tokens ແມ່ນລວມກັນໂດຍໃຊ້ "ຟັງຊັນ chi-square inverse". ມູນຄ່າຂອງມັນຊີ້ໃຫ້ເຫັນເຖິງວິທີການທີ່ບໍ່ດີ
ການສົມມຸດຕິຖານ null ວ່າຂໍ້ຄວາມແມ່ນພຽງແຕ່ການລວບລວມຂອງຄໍາທີ່ເປັນເອກະລາດແບບສຸ່ມ
ຄວາມເປັນໄປໄດ້ທີ່ໃຫ້ໂດຍການຄາດຄະເນທີ່ຜ່ານມາຂອງພວກເຮົາລົ້ມເຫລວ. ຟັງຊັນນີ້ມີຄວາມອ່ອນໄຫວຫຼາຍ
ຄວາມເປັນໄປໄດ້ເລັກນ້ອຍ (ຄໍາສັບ hammish), ແຕ່ບໍ່ແມ່ນຄວາມເປັນໄປໄດ້ສູງ (ຄໍາ spammish); ດັ່ງນັ້ນ
ມູນຄ່າພຽງແຕ່ຊີ້ໃຫ້ເຫັນສັນຍານ hammish ທີ່ເຂັ້ມແຂງໃນຂໍ້ຄວາມ. ໃນປັດຈຸບັນການນໍາໃຊ້ inverse
ຄວາມເປັນໄປໄດ້ສໍາລັບ tokens, ການຄິດໄລ່ດຽວກັນແມ່ນເຮັດອີກເທື່ອຫນຶ່ງ, ໃຫ້ຕົວຊີ້ວັດທີ່
ຂໍ້ຄວາມເບິ່ງຄືວ່າ spammish ຢ່າງຫຼວງຫຼາຍ. ສຸດທ້າຍ, ສອງຕົວຊີ້ວັດເຫຼົ່ານັ້ນຖືກຫັກອອກ (ແລະ
ຂະຫຍາຍເປັນ 0-1-ໄລຍະຫ່າງ). ຕົວ​ຊີ້​ວັດ​ລວມ​ນີ້ (bogosity​) ແມ່ນ​ຢູ່​ໃກ້​ກັບ 0 ຖ້າ​ຫາກ​ວ່າ​ອາ​ການ​
ສໍາລັບຂໍ້ຄວາມ hammish ແມ່ນເຂັ້ມແຂງກວ່າສໍາລັບຂໍ້ຄວາມ spammish ແລະຢູ່ໃກ້ກັບ 1 ຖ້າຫາກວ່າ
ສະຖານະການແມ່ນທາງອື່ນ. ຖ້າສັນຍານສໍາລັບທັງສອງມີຄວາມເຂັ້ມແຂງເທົ່າທຽມກັນ, ມູນຄ່າຈະເປັນ
ໃກ້ກັບ 0.5. ເນື່ອງຈາກຂໍ້ຄວາມເຫຼົ່ານັ້ນບໍ່ໄດ້ໃຫ້ສັນຍານທີ່ຊັດເຈນວ່າມີຮູບແບບ tristate ໃນ
bogofilter ເພື່ອໝາຍຂໍ້ຄວາມເຫຼົ່ານັ້ນວ່າບໍ່ແນ່ໃຈ, ໃນຂະນະທີ່ຂໍ້ຄວາມທີ່ຈະແຈ້ງຈະຖືກໝາຍວ່າເປັນສະແປມ
ຫຼື ham, ຕາມລໍາດັບ. ໃນໂໝດສອງລັດ, ທຸກໆຂໍ້ຄວາມຈະຖືກໝາຍວ່າເປັນ spam ຫຼື ham.

ຕົວກໍານົດການຕ່າງໆມີອິດທິພົນຕໍ່ການຄິດໄລ່ເຫຼົ່ານີ້, ທີ່ສໍາຄັນທີ່ສຸດແມ່ນ:

robx: ຄະແນນທີ່ມອບໃຫ້ກັບ token ທີ່ບໍ່ເຄີຍເຫັນມາກ່ອນ. robx ແມ່ນຄວາມເປັນໄປໄດ້ທີ່
token ແມ່ນ spammish.

robs: ນ້ໍາຫນັກຂອງ robx ເຊິ່ງຍ້າຍຄວາມເປັນໄປໄດ້ຂອງ token ທີ່ເຫັນເລັກນ້ອຍໄປສູ່ robx.

min-dev: ໄລຍະຫ່າງຕໍ່າສຸດຈາກ .5 ສໍາລັບ tokens ທີ່ຈະໃຊ້ໃນການຄໍານວນ. ໂທເຄັນເທົ່ານັ້ນ
ໄກຈາກ 0.5 ຫຼາຍກວ່າຄ່ານີ້ຖືກນໍາໃຊ້.

spam-cutoff: ຂໍ້ຄວາມທີ່ມີຄະແນນຫຼາຍກວ່າຫຼືເທົ່າກັບຈະຖືກຫມາຍວ່າເປັນ spam.

ham-cutoff: ຖ້າສູນຫຼື spam-cutoff, ຂໍ້ຄວາມທັງຫມົດທີ່ມີມູນຄ່າຕ່ໍາກວ່າ spam-cutoff ຢ່າງເຂັ້ມງວດ.
ຖືກຫມາຍເປັນ ham, ອື່ນໆທັງຫມົດເປັນ spam (ສອງລັດ). ຄ່າອື່ນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບ
ham-cutoff ແມ່ນຫມາຍເປັນ ham, ຂໍ້ຄວາມທີ່ມີຄ່າຢ່າງເຂັ້ມງວດລະຫວ່າງ ham-cutoff ແລະ
spam-cutoff ຖືກໝາຍວ່າບໍ່ແນ່ໃຈ; ສ່ວນທີ່ເຫຼືອເປັນ spam (tristate)

sp-esf: ປັດໄຈຂະຫນາດທີ່ມີປະສິດທິພາບ (ESF) ສໍາລັບ spam.

ns-esf: ESF ສໍາລັບ nonspam. ເຫຼົ່ານີ້ຄ່າ ESF ເລີ່ມຕົ້ນເປັນ 1.0, ເຊິ່ງຄືກັນກັບບໍ່ແມ່ນ
ການນໍາໃຊ້ ESF ໃນການຄິດໄລ່. ຄ່າທີ່ເຫມາະສົມກັບປະຊາກອນອີເມວຂອງຜູ້ໃຊ້ສາມາດເປັນ
ກໍານົດໂດຍການຊ່ວຍເຫຼືອຂອງໂຄງການ bogotune ໄດ້.

OPTIONS


ທາງເລືອກຊ່ວຍເຫຼືອ

ໄດ້ -h ທາງເລືອກພິມຂໍ້ຄວາມຊ່ວຍເຫຼືອແລະອອກ.

ໄດ້ -V ທາງ​ເລືອກ​ພິມ​ຈໍາ​ນວນ​ສະ​ບັບ​ແລະ​ອອກ​.

ໄດ້ -Q (ສອບຖາມ) ທາງເລືອກພິມການຕັ້ງຄ່າຂອງ bogofilter, ເຊັ່ນ: ຕົວກໍານົດການລົງທະບຽນ,
ຕົວເລືອກການວິເຄາະ, ບັນຊີລາຍການ bogofilter, ແລະອື່ນໆ.

ຕົວເລືອກການຈັດປະເພດ

ໄດ້ -p (passthrough) ທາງເລືອກອອກຂໍ້ຄວາມທີ່ມີເສັ້ນ X-Bogosity ໃນຕອນທ້າຍຂອງ
ຫົວຂໍ້ຂໍ້ຄວາມ. ອັນນີ້ຮຽກຮ້ອງໃຫ້ເກັບຂໍ້ຄວາມທັງໝົດໄວ້ໃນຄວາມຊົງຈຳເມື່ອມັນຖືກອ່ານຈາກ
stdin (ຫຼືຈາກທໍ່ຫຼືເຕົ້າສຽບ). ຖ້າຂໍ້ຄວາມຖືກອ່ານຈາກໄຟລ໌ທີ່ສາມາດ rewound ໄດ້,
bogofilter ຈະອ່ານມັນເທື່ອທີສອງ.

ໄດ້ -e (ຝັງ) ທາງເລືອກບອກ bogofilter ອອກດ້ວຍລະຫັດ 0 ຖ້າຂໍ້ຄວາມສາມາດເປັນ
ຈັດປະເພດ, ie ຖ້າບໍ່ມີຂໍ້ຜິດພາດ. ປົກກະຕິ bogofilter ໃຊ້ລະຫັດທີ່ແຕກຕ່າງກັນສໍາລັບ
ຂີ້ເຫຍື້ອ, ham, ແລະການຈັດປະເພດທີ່ບໍ່ແນ່ນອນ, ແຕ່ນີ້ເຮັດໃຫ້ການນໍາໃຊ້ bogofilter ກັບ procmail ງ່າຍຂຶ້ນ.
ຫຼື maildrop.

ໄດ້ -t (terse) ທາງເລືອກບອກ bogofilter ພິມຂໍ້ຄວາມ spamicity ຫຍໍ້
ມີ 1 ຕົວອັກສອນແລະຄະແນນ. Spam ແມ່ນລະບຸດ້ວຍ "Y", ham ໂດຍ "N", ແລະບໍ່ແນ່ໃຈວ່າໂດຍ
"U". ໝາຍເຫດ: ການຈັດຮູບແບບສາມາດປັບແຕ່ງໄດ້ໂດຍໃຊ້ໄຟລ໌ config.

ໄດ້ -T ສະຫນອງຮູບແບບ terse invariant ສໍາລັບສະຄິບທີ່ຈະໃຊ້. bogofilter ຈະພິມ an
ຫຍໍ້ຂໍ້ຄວາມຂີ້ເຫຍື້ອທີ່ມີ 1 ຕົວອັກສອນແລະຄະແນນ. Spam ແມ່ນຊີ້ໃຫ້ເຫັນດ້ວຍ
"S", ham ໂດຍ "H", ແລະບໍ່ແນ່ນອນໂດຍ "U".

ໄດ້ -TT ສະຫນອງຮູບແບບ terse invariant ສໍາລັບສະຄິບທີ່ຈະໃຊ້. Bogofilter ພິມພຽງແຕ່ໄດ້
ຄະແນນແລະສະແດງມັນເປັນ 16 ຕົວເລກທີ່ສໍາຄັນ.

ໄດ້ -u ທາງເລືອກບອກ bogofilter ລົງທະບຽນຂໍ້ຄວາມຂອງຂໍ້ຄວາມຫຼັງຈາກຈັດປະເພດມັນເປັນ spam
ຫຼືບໍ່ແມ່ນ spam. ຂໍ້ຄວາມຂີ້ເຫຍື້ອຈະຖືກລົງທະບຽນຢູ່ໃນລາຍຊື່ spam ແລະຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ spam ຢູ່ໃນ
ບັນຊີລາຍຊື່ທີ່ດີ. ຖ້າການຈັດປະເພດແມ່ນ "ບໍ່ແນ່ໃຈ", ຂໍ້ຄວາມຈະບໍ່ຖືກລົງທະບຽນ.
ປະສິດທິຜົນທາງເລືອກນີ້ດໍາເນີນການ bogofilter ກັບ -s or -n ທຸງ, ຕາມຄວາມເຫມາະສົມ. ຂໍ້ຄວນລະວັງແມ່ນ
ຮຽກຮ້ອງໃນການນໍາໃຊ້ຄວາມສາມາດນີ້, ຍ້ອນວ່າຄວາມຜິດພາດການຈັດປະເພດໃດໆ bogofilter ອາດຈະເຮັດໄດ້
ໄດ້​ຮັບ​ການ​ຮັກ​ສາ​ໄວ້​ແລະ​ຈະ​ສະ​ສົມ​ຈົນ​ກ​່​ວາ​ການ​ແກ້​ໄຂ​ຄູ່​ມື​ກັບ​ການ​ -ນ ແລະ - ນ ທາງເລືອກ
ການປະສົມປະສານ. ໃຫ້ສັງເກດວ່າທາງເລືອກນີ້ເຮັດໃຫ້ຖານຂໍ້ມູນເປີດສໍາລັບການເຂົ້າເຖິງການຂຽນ, ເຊິ່ງ
ສາມາດເຮັດໃຫ້ເກີດການຊ້າລົງຢ່າງຫຼວງຫຼາຍໂດຍຜ່ານການໂຕ້ແຍ້ງຂອງລັອກແລະການດໍາເນີນງານ I/O synchronous.

ໄດ້ -H ທາງເລືອກບອກ bogofilter ບໍ່ໃຫ້ tag tokens ຈາກ header. ທາງເລືອກນີ້ແມ່ນສໍາລັບ
ການທົດສອບ, ທ່ານບໍ່ຄວນໃຊ້ມັນໃນການດໍາເນີນງານປົກກະຕິ.

ໄດ້ -M ທາງເລືອກບອກ bogofilter ໃຫ້ປະມວນຜົນການປ້ອນຂໍ້ມູນຂອງມັນເປັນໄຟລ໌ຮູບແບບ mbox. ຖ້າ -v or
-t ທາງ​ເລືອກ​ຍັງ​ໄດ້​ຮັບ​ການ​ໃຫ້​, ເສັ້ນ spamicity ຈະ​ຖືກ​ພິມ​ອອກ​ສໍາ​ລັບ​ແຕ່​ລະ​ຂໍ້​ຄວາມ​.

ໄດ້ -b ທາງເລືອກ (streaming bulk mode) ບອກ bogofilter ເພື່ອຈັດປະເພດວັດຖຸຫຼາຍອັນທີ່ມີ
ຊື່ແມ່ນອ່ານຈາກ stdin. ຖ້າ -v or -t ທາງເລືອກແມ່ນໃຫ້, bogofilter ຈະພິມ a
ແຖວໃຫ້ຊື່ໄຟລ໌ແລະຂໍ້ມູນການຈັດປະເພດສໍາລັບແຕ່ລະໄຟລ໌. ນີ້ແມ່ນທາງເລືອກ
to -B ເຊິ່ງລາຍຊື່ວັດຖຸຢູ່ໃນເສັ້ນຄໍາສັ່ງ.

ວັດຖຸໃນສະພາບການນີ້ຈະເປັນ maildir (ກວດພົບອັດຕະໂນມັດ), ຫຼືຖ້າມັນບໍ່ແມ່ນ maildir, a
mail ດຽວເວັ້ນເສຍແຕ່ -M ແມ່ນໃຫ້ - ໃນກໍລະນີນັ້ນມັນຖືກປຸງແຕ່ງເປັນ mbox. (ຄວາມຍາວເນື້ອໃນ:
ສ່ວນຫົວບໍ່ໄດ້ຖືກພິຈາລະນາໃນປັດຈຸບັນ.)

ເມື່ອອ່ານຮູບແບບ mbox, bogofilter ອີງໃສ່ເສັ້ນເປົ່າຫຼັງຈາກ mail. ຖ້າຕ້ອງການ,
ຈົດໝາຍ -ແມ່ນ ຈະຮັບປະກັນວ່ານີ້ແມ່ນກໍລະນີ.

ໄດ້ -B ຈຸດ​ປະ​ສົງ ... (ຮູບແບບຫຼາຍ) ທາງເລືອກບອກ bogofilter ເພື່ອຈັດປະເພດວັດຖຸຫຼາຍອັນທີ່ມີຊື່
ຢູ່ໃນເສັ້ນຄໍາສັ່ງ. ວັດຖຸອາດຈະເປັນຊື່ໄຟລ໌ (ສໍາລັບຂໍ້ຄວາມດຽວ), ກ່ອງຈົດຫມາຍ (ໄຟລ໌
ມີຫຼາຍຂໍ້ຄວາມ), ຫຼືໄດເລກະທໍລີ (ຂອງຮູບແບບ maildir ແລະ MH). ຖ້າ -v or -t ທາງເລືອກ
ຍັງໄດ້ມອບໃຫ້, bogofilter ຈະພິມຊື່ໄຟລ໌ແລະການຈັດປະເພດ
ຂໍ້​ມູນ​ສໍາ​ລັບ​ແຕ່​ລະ​ໄຟລ​໌​. ນີ້ແມ່ນທາງເລືອກທີ່ຈະ -b ເຊິ່ງລາຍຊື່ວັດຖຸຢູ່ໃນ stdin.

ໄດ້ -R ທາງເລືອກບອກ bogofilter ໃຫ້ຜົນຜະລິດກອບຂໍ້ມູນ R ໃນຮູບແບບຂໍ້ຄວາມຕາມມາດຕະຖານ
ຜົນຜະລິດ. ເບິ່ງພາກສ່ວນກ່ຽວກັບການເຊື່ອມໂຍງກັບ R, ຂ້າງລຸ່ມນີ້, ສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ.

ຕົວເລືອກການລົງທະບຽນ

ໄດ້ -s ທາງເລືອກບອກ bogofilter ລົງທະບຽນຂໍ້ຄວາມທີ່ນໍາສະເຫນີເປັນ spam. ຖານຂໍ້ມູນແມ່ນ
ສ້າງຂຶ້ນຖ້າບໍ່ມີ.

ໄດ້ -n ທາງເລືອກບອກ bogofilter ລົງທະບຽນຂໍ້ຄວາມທີ່ນໍາສະເຫນີບໍ່ແມ່ນ spam.

Bogofilter ບໍ່ກວດພົບວ່າຂໍ້ຄວາມທີ່ລົງທະບຽນສອງຄັ້ງ. ຖ້າ​ຫາກ​ວ່າ​ທ່ານ​ເຮັດ​ແນວ​ນີ້​ໂດຍ​ບັງ​ເອີນ​, ໄດ້​
ການນັບ token ຈະປິດລົງ 1 ຈາກສິ່ງທີ່ທ່ານຕ້ອງການ ແລະຄະແນນ spam ທີ່ສອດຄ້ອງກັນ
ຈະ​ຫຼຸດ​ລົງ​ເລັກ​ນ້ອຍ​. ເນື່ອງຈາກຈໍານວນຂະຫນາດໃຫຍ່ຂອງ tokens ແລະຂໍ້ຄວາມໃນ wordlist, ນີ້
ບໍ່ສໍາຄັນ. ປັນ​ຫາ ສາມາດເຮັດໄດ້ ໄດ້​ຮັບ​ການ​ແກ້​ໄຂ​ໂດຍ​ການ​ນໍາ​ໃຊ້​ -S ທາງເລືອກຫຼື -N ທາງເລືອກ.

ໄດ້ -S ທາງເລືອກບອກ bogofilter ຍົກເລີກການລົງທະບຽນກ່ອນຫນ້າຂອງຂໍ້ຄວາມດຽວກັນກັບ spam.
ຖ້າຂໍ້ຄວາມຖືກໃສ່ບໍ່ຖືກຕ້ອງເປັນ spam ໂດຍ -s or -u ແລະ​ທ່ານ​ຕ້ອງ​ການ​ທີ່​ຈະ​ເອົາ​ມັນ​ແລະ​
ໃສ່ມັນເປັນທີ່ບໍ່ແມ່ນ spam, ໃຊ້ -ນທີ່ຢູ່ ຖ້າຫາກວ່າ -S ຖືກນໍາໃຊ້ສໍາລັບຂໍ້ຄວາມທີ່ບໍ່ໄດ້ລົງທະບຽນເປັນ spam,
ການນັບຈະຍັງຄົງຖືກຫຼຸດລົງ.

ໄດ້ -N ທາງເລືອກບອກ bogofilter ຍົກເລີກການລົງທະບຽນກ່ອນຫນ້າຂອງຂໍ້ຄວາມດຽວກັນກັບ
ທີ່ບໍ່ແມ່ນ spam. ຖ້າຂໍ້ຄວາມຖືກໃສ່ບໍ່ຖືກຕ້ອງເປັນບໍ່ແມ່ນ spam ໂດຍ -n or -u ແລະທ່ານຕ້ອງການ
ເອົາມັນອອກແລະໃສ່ມັນເປັນ spam, ຈາກນັ້ນໃຊ້ - ນທີ່ຢູ່ ຖ້າຫາກວ່າ -N ຖືກນໍາໃຊ້ສໍາລັບຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ
ລົງທະບຽນເປັນທີ່ບໍ່ແມ່ນ spam, ການນັບຈະຍັງຄົງຖືກຫຼຸດລົງ.

ທາງເລືອກທົ່ວໄປ

ໄດ້ -c ຊື່​ເອ​ກະ​ສານ ທາງເລືອກບອກ bogofilter ອ່ານໄຟລ໌ config ທີ່ມີຊື່.

ໄດ້ -C ທາງເລືອກປ້ອງກັນບໍ່ໃຫ້ bogofilter ຈາກການອ່ານໄຟລ໌ການຕັ້ງຄ່າ.

ໄດ້ -d dir ທາງເລືອກຊ່ວຍໃຫ້ທ່ານສາມາດຕັ້ງໄດເລກະທໍລີສໍາລັບຖານຂໍ້ມູນ. ເບິ່ງສະພາບແວດລ້ອມ
ພາກສ່ວນສໍາລັບຕົວເລືອກການຕັ້ງຄ່າໄດເລກະທໍລີອື່ນໆ.

ໄດ້ -k cacheize ທາງເລືອກກໍານົດຂະຫນາດ cache ສໍາລັບລະບົບຍ່ອຍ BerkeleyDB, ໃນຫນ່ວຍຂອງ 1
MiB (1,048,576 bytes). ຂະຫນາດ cache ຢ່າງຖືກຕ້ອງປັບປຸງການປະຕິບັດຂອງ bogofilter. ໄດ້
ຂະຫນາດທີ່ແນະນໍາແມ່ນຫນຶ່ງສ່ວນສາມຂອງຂະຫນາດຂອງໄຟລ໌ຖານຂໍ້ມູນ. ທ່ານສາມາດແລ່ນ bogotune ໄດ້
script (ໃນໄດເລກະທໍລີ tuning) ເພື່ອກໍານົດຂະຫນາດທີ່ແນະນໍາ.

ໄດ້ -l ທາງເລືອກຂຽນເສັ້ນຂໍ້ມູນໃສ່ບັນທຶກຂອງລະບົບໃນແຕ່ລະເວລາທີ່ bogofilter ຖືກແລ່ນ.
ຂໍ້ມູນທີ່ບັນທຶກໄວ້ແມ່ນຂຶ້ນກັບວິທີການ bogofilter ຖືກດໍາເນີນການ.

ໄດ້ -L ໂຄດ​ຄໍາ​ສັ່ງ ທາງ​ເລືອກ​ຕັ້ງ​ຄ່າ​ໂຄດ​ຄໍາ​ສັ່ງ​ທີ່​ສາ​ມາດ​ໄດ້​ຮັບ​ການ​ລວມ​ເຂົ້າ​ໃນ​ຂໍ້​ມູນ​ທີ່​ຖືກ​ບັນ​ທຶກ​
ໂດຍ -l ທາງ​ເລືອກ, ແຕ່​ວ່າ​ມັນ​ຮຽກ​ຮ້ອງ​ໃຫ້​ມີ​ຮູບ​ແບບ​ກໍາ​ນົດ​ເອງ​ທີ່​ປະ​ກອບ​ມີ %l ສະ​ຕ​ຣິງ​ສໍາ​ລັບ​ປັດ​ຈຸ​ບັນ​.
ທາງເລືອກນີ້ຫມາຍເຖິງ -l.

ໄດ້ -I ຊື່​ເອ​ກະ​ສານ ທາງເລືອກບອກ bogofilter ອ່ານວັດສະດຸປ້ອນຂອງມັນຈາກໄຟລ໌ທີ່ລະບຸ, ແທນທີ່ຈະ
ກ່ວາຈາກ stdin.

ໄດ້ -O ຊື່​ເອ​ກະ​ສານ ທາງເລືອກບອກ bogofilter ບ່ອນທີ່ຈະຂຽນຜົນຜະລິດຂອງມັນໃນຮູບແບບ passthrough.
ໃຫ້ສັງເກດວ່ານີ້ເຮັດວຽກພຽງແຕ່ເມື່ອ -p ຖືກມອບໃຫ້ຢ່າງຊັດເຈນ.

ຕົວເລືອກພາຣາມິເຕີ

ໄດ້ -E value[,value] ທາງເລືອກອະນຸຍາດໃຫ້ກໍານົດຄ່າ sp-esf ແລະຄ່າ ns-esf. ກັບສອງ
ຄ່າ, ທັງ sp-esf ແລະ ns-esf ຖືກຕັ້ງ. ຖ້າມີຄ່າດຽວເທົ່ານັ້ນ, ພາລາມິເຕີຈະຖືກຕັ້ງເປັນ
ອະທິບາຍໄວ້ໃນບັນທຶກຂ້າງລຸ່ມນີ້.

ໄດ້ -m value[,value][,value] ທາງເລືອກອະນຸຍາດໃຫ້ກໍານົດຄ່າ min-dev ແລະ, ທາງເລືອກ, the
ຄ່າ robs ແລະ robx. ດ້ວຍສາມຄ່າ, min-dev, robs, ແລະ robx ຖືກຕັ້ງຄ່າທັງໝົດ. ຖ້າໜ້ອຍລົງ
ຄ່າແມ່ນໄດ້ຖືກມອບໃຫ້, ພາລາມິເຕີຖືກກໍານົດຕາມທີ່ອະທິບາຍໄວ້ໃນບັນທຶກຂ້າງລຸ່ມນີ້.

ໄດ້ -o value[,value] ທາງເລືອກອະນຸຍາດໃຫ້ກໍານົດຄ່າ spam-cutoff ham-cutoff. ກັບສອງ
ຄ່າ, ທັງ spam-cutoff ແລະ ham-cutoff ແມ່ນຖືກກໍານົດ. ຖ້າພຽງແຕ່ຫນຶ່ງຄ່າແມ່ນໃຫ້, ຕົວກໍານົດການ
ຖືກກໍານົດໄວ້ຕາມທີ່ອະທິບາຍໄວ້ໃນບັນທຶກຂ້າງລຸ່ມນີ້.

ໝາຍເຫດ: ຕົວເລືອກທັງໝົດເຫຼົ່ານີ້ອະນຸຍາດໃຫ້ມີຄ່າໜ້ອຍລົງ. ຄ່າສາມາດຂ້າມໄດ້
ໂດຍໃຊ້ພຽງແຕ່ຕົວຂັ້ນເຄື່ອງໝາຍຈຸດ, ໃນກໍລະນີນີ້ ຕົວກໍານົດການທີ່ສອດຄ້ອງກັນຈະບໍ່ເປັນ.
ປ່ຽນແປງ. ຖ້າພຽງແຕ່ໃຫ້ຄ່າທໍາອິດ, ຫຼັງຈາກນັ້ນພຽງແຕ່ກໍານົດຕົວກໍານົດການທໍາອິດ.
ຄ່າຕໍ່ທ້າຍສາມາດຂ້າມໄດ້, ໃນກໍລະນີດັ່ງກ່າວນີ້, ຕົວກໍານົດການທີ່ກ່ຽວຂ້ອງຈະບໍ່ເປັນ
ປ່ຽນແປງ. ພາຍໃນລາຍການພາລາມິເຕີ, ບໍ່ອະນຸຍາດໃຫ້ມີຍະຫວ່າງຫຼັງຈາກເຄື່ອງໝາຍຈຸດ.

ຂໍ້ມູນທາງເລືອກ

ໄດ້ -v ທາງເລືອກຜະລິດບົດລາຍງານຜົນຜະລິດມາດຕະຖານກ່ຽວກັບການວິເຄາະຂອງ bogofilter ຂອງວັດສະດຸປ້ອນ.
ແຕ່ລະເພີ່ມເຕີມ v ຈະເພີ່ມ verbosity ຂອງຜົນຜະລິດໄດ້, ສູງສຸດຂອງ 4. ກັບ
-vv, ບົດລາຍງານສະແດງລາຍການ tokens ທີ່ມີ deviation ສູງສຸດຈາກສະເລ່ຍຂອງ 0.5 ສະມາຄົມ
ກັບ spam.

ທາງເລືອກ -y ວັນ ສາມາດໃຊ້ເພື່ອແທນທີ່ວັນທີປັດຈຸບັນໃນເວລາທີ່ການປະທັບຕາເວລາ. ຄ່າ
ຂອງສູນ (0) ປິດການປະທັບຕາເວລາ.

ໄດ້ -D ທາງ​ເລືອກ redirects debug output ກັບ stdout.

ໄດ້ -x ທົງ ທາງ​ເລືອກ​ອະ​ນຸ​ຍາດ​ໃຫ້​ຕັ້ງ​ຂອງ​ທຸງ debug ສໍາ​ລັບ​ການ​ພິມ​ຂໍ້​ມູນ​ດີ​ບັກ​. ເບິ່ງ
header file debug.h ສຳລັບລາຍຊື່ທຸງທີ່ສາມາດໃຊ້ໄດ້.

ຕັ້ງຄ່າຕົວເລືອກໄຟລ໌

ໃຊ້ GNU longopt -- syntax, config ໄຟລ໌ name=value ຖະແຫຼງການກາຍເປັນເສັ້ນຄໍາສັ່ງ
--option=value. ໃຊ້ຄໍາສັ່ງ bogofilter - ຊ່ວຍ ສໍາລັບບັນຊີລາຍຊື່ຂອງທາງເລືອກແລະເບິ່ງ
bogofilter.cf. ຕົວຢ່າງສໍາລັບຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບພວກມັນ. ຕົວຢ່າງເພື່ອປ່ຽນສ່ວນຫົວ X-Bogosity
ເພື່ອ "X-Spam-Header", ໃຊ້:

--spam-header-name=X-Spam-header

ENVIRONMENT


Bogofilter ໃຊ້ໄດເລກະທໍລີຖານຂໍ້ມູນ, ເຊິ່ງສາມາດຖືກກໍານົດໄວ້ໃນໄຟລ໌ config. ຖ້າບໍ່ໄດ້ຕັ້ງ
ຢູ່ທີ່ນັ້ນ, bogofilter ຈະໃຊ້ມູນຄ່າຂອງ BOGOFILTER_DIR. ທັງສອງສາມາດໄດ້ຮັບການ overridden ໂດຍ -d
dir ທາງເລືອກ. ຖ້າບໍ່ມີອັນນັ້ນ, bogofilter ຈະໃຊ້ໄດເລກະທໍລີ $HOME/.bogofilter.

CONFIGURATION


ເສັ້ນຄໍາສັ່ງ bogofilter ອະນຸຍາດໃຫ້ກໍານົດທາງເລືອກຫຼາຍທີ່ກໍານົດວິທີການ bogofilter
ດໍາເນີນການ. ໄຟລ໌ /etc/bogofilter.cf ສາມາດຖືກນໍາໃຊ້ເພື່ອກໍານົດພາລາມິເຕີເພີ່ມເຕີມທີ່ມີຜົນກະທົບຂອງມັນ
ການດໍາເນີນງານ. ໄຟລ໌ /etc/bogofilter.cf.example ມີຕົວຢ່າງຂອງພາລາມິເຕີທັງໝົດ. ສະຖານະ
ແລະບັນທຶກຂໍ້ຄວາມສາມາດຖືກປັບແຕ່ງສໍາລັບແຕ່ລະເວັບໄຊທ໌.

ກັບຄືນ VALUES


0 ສໍາລັບ spam; 1 ສໍາລັບການທີ່ບໍ່ແມ່ນ spam; 2 ສໍາ​ລັບ​ການ​ບໍ່​ແນ່​ໃຈວ່​າ​; 3 ສໍາລັບ I/O ຫຼືຄວາມຜິດພາດອື່ນໆ.

ຖ້າທັງສອງ -p ແລະ -e ຖືກນໍາໃຊ້, ມູນຄ່າກັບຄືນແມ່ນ: 0 ສໍາລັບ spam ຫຼືບໍ່ແມ່ນ spam; 3 ສໍາລັບ I/O ຫຼື
ຄວາມ​ຜິດ​ພາດ​ອື່ນໆ​.

ຄວາມຜິດພາດ 3 ປົກກະຕິແລ້ວຫມາຍຄວາມວ່າໄຟລ໌ລາຍການຄໍາທີ່ bogofilter ຕ້ອງການອ່ານໃນຕອນເລີ່ມຕົ້ນແມ່ນ
ຂາດຫາຍໄປຫຼືຮາດດິດໄດ້ຕື່ມຂໍ້ມູນໃສ່ -p mode

ການຮ່ວມມື ກັບ ອື່ນໆ ເຄື່ອງມື


ໃຊ້ກັບ procmail

ສູດຕໍ່ໄປນີ້ (a) spam-bins ສິ່ງໃດແດ່ທີ່ bogofilter ອັດຕາເປັນ spam, (b) ລົງທະບຽນ
ຄໍາສັບຕ່າງໆໃນຂໍ້ຄວາມທີ່ຖືກຈັດອັນດັບເປັນ spam ດັ່ງກ່າວ, ແລະ (c) ລົງທະບຽນຄໍາທີ່ຢູ່ໃນຂໍ້ຄວາມທີ່ຖືກຈັດອັນດັບ
ທີ່ບໍ່ແມ່ນ spam ເຊັ່ນນັ້ນ. ດ້ວຍຈຸດນີ້, ມັນເປັນປົກກະຕິພຽງແຕ່ມີຄວາມຈໍາເປັນສໍາລັບຜູ້ໃຊ້
ແຊກແຊງ (ກັບ - ນ or -ນ) ເມື່ອ bogofilter ການຈັດປະເພດບາງຢ່າງຜິດພາດ.

# ການກັ່ນຕອງເມລຜ່ານ bogofilter, ແທັກມັນເປັນ Ham, Spam, ຫຼືບໍ່ແນ່ນອນ,
# ແລະການປັບປຸງບັນຊີລາຍການຄໍາ

:0fw
| bogofilter -u -e -p

# ຖ້າ bogofilter ລົ້ມເຫລວ, ສົ່ງຄືນເມລໄປຫາແຖວ;
# MTA ຈະລອງໃໝ່ໃນພາຍຫຼັງ
# 75 ແມ່ນຄ່າຂອງ EX_TEMPFAIL ໃນ /usr/include/sysexits.h

:0e
{ EXITCODE=75 ເຈົ້າພາບ }

# ຍື່ນຈົດໝາຍໄປທີ່ spam-bogofilter ຖ້າມັນເປັນ spam.

: 0:
* ^X-Bogosity: Spam, tests=bogofilter
spam-bogofilter

# ຍື່ນຈົດໝາຍໄປຫາ bogofilter ທີ່ບໍ່ແນ່ໃຈ
# ຖ້າມັນບໍ່ແມ່ນທັງ ham ຫຼື spam.

: 0:
* ^X-Bogosity: ບໍ່ແນ່ໃຈ, tests=bogofilter
unsure-bogofilter

# ດ້ວຍສູດນີ້, ທ່ານສາມາດຝຶກອົບຮົມ bogofilter ເລີ່ມຕົ້ນດ້ວຍການຫວ່າງເປົ່າ
# ລາຍການຄຳສັບ. ໃຫ້ແນ່ໃຈວ່າກວດເບິ່ງໂຟນເດີທີ່ບໍ່ແນ່ນອນຂອງເຈົ້າເປັນປົກກະຕິ, ເອົາ
# ຂໍ້ຄວາມອອກຈາກມັນ, ຈັດປະເພດພວກມັນເປັນ ham (ຫຼື spam), ແລະໃຊ້ພວກມັນ
# bogofilter ລົດໄຟ.

ກົດລະບຽບ procmail ຕໍ່ໄປນີ້ຈະເອົາເມລໃນ stdin ແລະບັນທຶກມັນເພື່ອສົ່ງ spam ຖ້າ bogofilter
ຄິດວ່າມັນເປັນ spam:

:0HB:
* ? bogofilter
ຂີ້ເຫຍື້ອ

ແລະກົດລະບຽບທີ່ຄ້າຍຄືກັນນີ້ຍັງຈະລົງທະບຽນ tokens ໃນ mail ອີງຕາມການ
ການ​ຈັດ​ປະ​ເພດ bogofilter​:

:0HB:
* ? bogofilter -u
ຂີ້ເຫຍື້ອ

ຖ້າ bogofilter ລົ້ມເຫລວ (ກັບຄືນ 3) ຂໍ້ຄວາມຈະຖືກປະຕິບັດວ່າບໍ່ແມ່ນ spam.

ອັນນີ້ແມ່ນສໍາລັບ maildrop, ມັນອັດຕະໂນມັດ defers mail ແລະ retries ຕໍ່ມາໃນເວລາທີ່
ຄໍາສັ່ງ xfilter ລົ້ມເຫລວ, ໃຊ້ນີ້ຢູ່ໃນຂອງທ່ານ ~/.mailfilter:

xfilter "bogofilter -u -e -p"
ຖ້າ (/^X-Bogosity: Spam, tests=bogofilter/)
{
ກັບ "spam-bogofilter"
}

ແຖວ .muttrc ຕໍ່ໄປນີ້ຈະສ້າງ mutt macro ສຳລັບການສົ່ງຈົດໝາຍໄປຍັງ bogofilter.

ດັດຊະນີມະຫາພາກ d " ບໍ່ໄດ້ຕັ້ງ wait_key\n\
bogofilter -n\n\
ຕັ້ງ wait_key\n\
" "ລຶບຂໍ້ຄວາມທີ່ເປັນບໍ່ແມ່ນ spam"
ດັດຊະນີມະຫາພາກ \ed " ບໍ່ໄດ້ຕັ້ງ wait_key\n\
bogofilter -s\n\
ຕັ້ງ wait_key\n\
" "ລຶບຂໍ້ຄວາມເປັນ spam"

ການປະສົມປະສານກັບຕົວແທນການຂົນສົ່ງທາງໄປສະນີ (MTA)

1. bogofilter ຍັງສາມາດໄດ້ຮັບການປະສົມປະສານເຂົ້າໄປໃນ MTA ເພື່ອກັ່ນຕອງຈົດຫມາຍຂາເຂົ້າທັງຫມົດ. ໃນຂະນະທີ່
ການປະຕິບັດສະເພາະແມ່ນຂຶ້ນກັບ MTA, ຂັ້ນຕອນທົ່ວໄປມີດັ່ງນີ້:

2. ຕິດຕັ້ງ bogofilter ໃນເຄື່ອງແມ່ຂ່າຍເມລ

3. Prime the bogofilter databases with a spam and non-spam corpus. ນັບຕັ້ງແຕ່ bogofilter ຈະ
ຮັບ​ໃຊ້​ຊຸມ​ຊົນ​ຂະ​ຫນາດ​ໃຫຍ່​, ມັນ​ເປັນ​ສິ່ງ​ສໍາ​ຄັນ​ທີ່​ຈະ​ຊີ້​ນໍາ​ມັນ​ກັບ​ຊຸດ​ຕົວ​ແທນ​
ຂອງ​ຂໍ້​ຄວາມ​.

4. ຕັ້ງຄ່າ MTA ເພື່ອເອີ້ນ bogofilter ໃນແຕ່ລະຂໍ້ຄວາມ. ໃນຂະນະທີ່ນີ້ແມ່ນ MTA ສະເພາະ
ຂັ້ນຕອນ, ທ່ານອາດຈະຈໍາເປັນຕ້ອງໄດ້ນໍາໃຊ້ -p, -u, ແລະ -e ຕົວເລືອກ

5. ກໍານົດກົນໄກສໍາລັບຜູ້ໃຊ້ລົງທະບຽນ spam / ຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ spam, ເຊັ່ນດຽວກັນກັບການແກ້ໄຂ
ການ​ຈັດ​ປະ​ເພດ​ທີ່​ຜິດ​ພາດ​. ການແກ້ໄຂທົ່ວໄປທີ່ສຸດແມ່ນການຕັ້ງຄ່າທີ່ຢູ່ອີເມວ alias ກັບ
ທີ່ຜູ້ໃຊ້ bounce ຂໍ້ຄວາມ.

6. ເບິ່ງເອກະສານ ແລະລາຍຊື່ການປະກອບສ່ວນສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.

ການນໍາໃຊ້ R ເພື່ອກວດສອບການຄິດໄລ່ຂອງ bogofilter

ທາງເລືອກ -R ບອກ bogofilter ເພື່ອສ້າງກອບຂໍ້ມູນ R. ກອບຂໍ້ມູນປະກອບມີຫນຶ່ງ
row ຕໍ່ token ວິເຄາະ. ແຕ່ລະແຖວດັ່ງກ່າວມີ token, ຜົນລວມຂອງຖານຂໍ້ມູນຂອງມັນ "ດີ"
ແລະການນັບ "spam", ການນັບ "ດີ" ແບ່ງອອກດ້ວຍຈໍານວນຂໍ້ຄວາມທີ່ບໍ່ແມ່ນ spam ທີ່ໃຊ້ເພື່ອ
ສ້າງຖານຂໍ້ມູນການຝຶກອົບຮົມ, ການນັບ "spam" ແບ່ງອອກດ້ວຍຈໍານວນຂໍ້ຄວາມ spam,
f(w) ຂອງ Robinson ສໍາລັບ token, ບັນທຶກທໍາມະຊາດຂອງ (1 - f(w)) ແລະ f(w), ແລະຕົວຊີ້ວັດ.
ຕົວອັກສອນ (+ ຖ້າຄ່າ f(w) ຂອງ token ເກີນຄ່າ deviation ຕໍ່າສຸດຈາກ 0.5, - ຖ້າມັນ
ບໍ່). ມີແຖວໜຶ່ງເພີ່ມເຕີມຢູ່ທ້າຍຕາຕະລາງທີ່ມີປ້າຍກຳກັບຢູ່ໃນ
token ພາກ​ສະ​ຫນາມ​, ປະ​ຕິ​ບັດ​ຕາມ​ດ້ວຍ​ຈໍາ​ນວນ​ຂອງ​ຄໍາ​ສັບ​ຕ່າງໆ​ທີ່​ນໍາ​ໃຊ້​ຈິງ (ຄໍາ​ທີ່​ມີ + ຕົວ​ຊີ້​ວັດ​)​,
ຄ່າ P, Q, S, s ແລະ x ຂອງ Robinson ແລະຄ່າ deviation ຕໍ່າສຸດ.

ກອບຂໍ້ມູນ R ສາມາດຖືກບັນທຶກໄວ້ໃນໄຟລ໌ແລະຕໍ່ມາອ່ານເຂົ້າໄປໃນກອງປະຊຸມ R (ເບິ່ງ ໄດ້ R
ໂຄງການ ເວັບໄຊທ໌[5] ສໍາລັບຂໍ້ມູນກ່ຽວກັບຊຸດຄະນິດສາດ R). ສະຫນອງໃຫ້ກັບ
ການແຈກຢາຍ bogofilter ແມ່ນສະຄິບ R ແບບງ່າຍດາຍ (ໄຟລ໌ bogo.R) ທີ່ສາມາດຖືກນໍາໃຊ້ເພື່ອກວດສອບ
ການຄິດໄລ່ຂອງ bogofilter. ຄໍາແນະນໍາສໍາລັບການນໍາໃຊ້ຂອງມັນຖືກລວມຢູ່ໃນສະຄິບໃນຮູບແບບ
ຂອງ​ຄໍາ​ເຫັນ​.

LOG MESSAGES


Bogofilter ຂຽນຂໍ້ຄວາມໃສ່ບັນທຶກຂອງລະບົບໃນເວລາທີ່ -l ທາງເລືອກແມ່ນຖືກນໍາໃຊ້. ສິ່ງທີ່ຂຽນ
ຂຶ້ນກັບວ່າທຸງອື່ນໃດຖືກໃຊ້.

ການແລ່ນການຈັດປະເພດຈະສ້າງ (ພວກເຮົາບໍ່ໄດ້ສະແດງວັນທີ ແລະພາກສ່ວນເຈົ້າພາບຢູ່ນີ້):

bogofilter[1412]: X-Bogosity: Ham, spamicity=0.000227
bogofilter[1415]: X-Bogosity: Spam, spamicity=0.998918

ການນໍາໃຊ້ -u ເພື່ອຈັດປະເພດຂໍ້ຄວາມແລະປັບປຸງບັນຊີລາຍການຄໍາຈະຜະລິດ (ຫນຶ່ງແຖວດຽວ):

bogofilter[1426]: X-Bogosity: Spam, spamicity=0.998918,
ລົງທະບຽນ -s, 329 ຄໍາ, 1 ຂໍ້ຄວາມ

ການ​ຈົດ​ທະ​ບຽນ​ຄໍາ​ສັບ​ຕ່າງໆ (-l ແລະ -s, -n, -S, ຫຼື -N) ຈະ​ຜະ​ລິດ​:

bogofilter[1440]: register-n, 255 ຄໍາ, 1 ຂໍ້ຄວາມ

ແລ່ນລົງທະບຽນ (ໃຊ້ -s, -n, -N, ຫຼື -S) ຈະ​ສ້າງ​ຂໍ້​ຄວາມ​ເຊັ່ນ​:

bogofilter[17330]: register-n, 574 ຄໍາ, 3 ຂໍ້ຄວາມ
bogofilter[6244]: register-s, 1273 ຄໍາ, 4 ຂໍ້ຄວາມ

ໃຊ້ bogofilter ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net


ເຊີບເວີ ແລະສະຖານີເຮັດວຽກຟຣີ

ດາວໂຫຼດແອັບ Windows ແລະ Linux

  • 1
    AstrOrzPlayer
    AstrOrzPlayer
    AstrOrz Player ເປັນຜູ້ນສື່ມວນຊົນຟຣີ
    ຊອບ​ແວ​, ສ່ວນ​ຫນຶ່ງ​ອີງ​ໃສ່ WMP ແລະ VLC​. ໄດ້
    ຜູ້ນແມ່ນຢູ່ໃນຮູບແບບ minimalist, ມີ
    ຫຼາຍ​ກ​່​ວາ​ສິບ​ສີ​ຫົວ​ຂໍ້​, ແລະ​ຍັງ​ສາ​ມາດ​
    b
    ດາວໂຫລດ AstrOrzPlayer
  • 2
    movistartv
    movistartv
    Kodi Movistar+ TV es un ADDON para XBMC/
    Kodi que permite disponer de un
    decodificador de los servicios IPTV de
    Movistar integrado en uno de los
    ສູນ​ກາງ​ສື່​ມວນ​ຊົນ​ມາ ...
    ດາວໂຫລດ movistartv
  • 3
    ລະຫັດ :: ທ່ອນໄມ້
    ລະຫັດ :: ທ່ອນໄມ້
    ລະຫັດ::Blocks ເປັນແຫຼ່ງເປີດຟຣີ,
    ຂ້າມເວທີ C, C++ ແລະ Fortran IDE
    ສ້າງຂຶ້ນເພື່ອຕອບສະຫນອງຄວາມຕ້ອງການທີ່ຕ້ອງການຫຼາຍທີ່ສຸດ
    ຂອງ​ຜູ້​ຊົມ​ໃຊ້​ຂອງ​ຕົນ​. ມັນໄດ້ຖືກອອກແບບໃຫ້ຫຼາຍ
    ຂະຫຍາຍ...
    ດາວໂຫລດລະຫັດ::Blocks
  • 4
    ທ່າມກາງ
    ທ່າມກາງ
    ທ່າມກາງ ຫຼື Advanced Minecraft Interface
    ແລະ​ຂໍ້​ມູນ / ການ​ຕິດ​ຕາມ​ໂຄງ​ສ້າງ​ເປັນ​ເຄື່ອງ​ມື​ເພື່ອ​
    ສະແດງພາບລວມຂອງ Minecraft
    ໂລກ, ໂດຍບໍ່ມີການສ້າງມັນຢ່າງແທ້ຈິງ. ມັນ
    ສາ​ມາດ ...
    ດາວ​ນ​໌​ໂຫລດ​ໃນ​ທ່າມ​ກາງ​
  • 5
    MSYS2
    MSYS2
    MSYS2 ເປັນ​ການ​ເກັບ​ກໍາ​ຂອງ​ເຄື່ອງ​ມື​ແລະ​
    ຫ້ອງສະຫມຸດສະຫນອງທ່ານດ້ວຍ
    ສະ​ພາບ​ແວດ​ລ້ອມ​ທີ່​ງ່າຍ​ທີ່​ຈະ​ນໍາ​ໃຊ້​ສໍາ​ລັບ​ການ​ກໍ່​ສ້າງ​,
    ການຕິດຕັ້ງແລະແລ່ນ Windows ພື້ນເມືອງ
    ຊອບ​ແວ​. ມັນ con...
    ດາວໂຫລດ MSYS2
  • 6
    libjpeg-turbo
    libjpeg-turbo
    libjpeg-turbo ເປັນຕົວແປງສັນຍານຮູບພາບ JPEG
    ທີ່ໃຊ້ຄໍາແນະນໍາ SIMD (MMX, SSE2,
    NEON, AltiVec) ເພື່ອເລັ່ງພື້ນຖານ
    ເປີດການບີບອັດ JPEG ແລະ decompression
    x86,x8...
    ດາວໂຫລດ libjpeg-turbo
  • ເພີ່ມເຕີມ »

Linux ຄຳ ສັ່ງ

Ad