Ito ang command qsf na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
qsf - mabilis na filter ng spam
SINOPSIS
Pagsala: qsf [-snrAtav] [-d DB] [-g DB]
[-L LVL] [-S SUBJ] [-H MARKA] [-Q NUM]
[-X NUM]
Pagsasanay: qsf -T SPAM NONSPAM [MAXROUNDS] [-d DB]
Muling pagsasanay: qsf -[m|M] [-d DB] [-w Timbang] [-ayN]
Database: qsf -[p|D|R|O] [-d DB]
Pagsasama ng database: qsf -E OTHERDB [-d DB]
Allowlist query: qsf -e EMAIL [-m|-M|-t] [-d DB] [-g DB]
Tanong sa denylist: qsf -y -e EMAIL [-m -m|-M -M|-t] [-d DB] [-g DB]
Tulong sa: qsf -[h|V]
DESCRIPTION
qsf nagbabasa ng isang email sa karaniwang input, at bilang default ay naglalabas nito sa karaniwang output.
Kung natukoy na spam ang email, magdaragdag ng karagdagang header ("X-Spam: YES"),
at opsyonal na ang linya ng paksa ay maaaring may "[SPAM]" na naka-prepend dito.
qsf ay nilayon na gamitin sa a procmail(1) recipe, sa isang ruleset tulad nito:
:0 wf
| qsf -ra
:0 H:
* X-Spam: OO
$HOME/mail/spam
Para sa higit pang mga halimbawa, kabilang ang sample procmail(1) mga recipe, tingnan ang HALIMBAWA seksyon sa ibaba.
PAGSASANAY
Bago qsf magagamit ng maayos, kailangan sanayin. Isang magandang paraan para sanayin qsf ay upang
mangolekta ng kopya ng lahat ng iyong email sa dalawang folder - isa para sa spam, at isa para sa hindi spam.
Kapag nagawa mo na ito, maaari mong gamitin ang function ng pagsasanay, tulad nito:
qsf -aT spam-folder na hindi spam-folder
Ito ay bubuo ng isang database na maaaring gamitin ng qsf upang hulaan kung natanggap ang email
ang hinaharap ay spam o hindi. Tandaan na ang paunang pagsasanay na ito ay maaaring tumagal ng mahabang panahon, ngunit
isang beses mo lang dapat gawin.
Upang markahan ang a solong mensahe as spam, pipe ito sa qsf sa --mark-spam or -m ("markahan bilang
spam") na opsyon. Ia-update nito ang database nang naaayon at itatapon ang email.
Upang markahan ang a solong mensahe as hindi spam, pipe ito sa qsf sa --mark-nonspam or -M ("marka
bilang non-spam") na opsyon. Muli, itatapon nito ang email.
Kung ang isang mensahe ay na-mis-tag, ipadala lang ito sa qsf bilang kabaligtaran na uri, ibig sabihin, kung ito
ay nagkamali na na-tag bilang spam, ipapasok ito qsf --mark-nonspam --timbang=2 upang idagdag ito
sa hindi-spam na bahagi ng database na may doble sa karaniwang pagtimbang.
Opsyon
Ang qsf ang mga opsyon ay nakalista sa ibaba.
-d, --database [TYPE:]FILE
paggamit FILE bilang database ng spam/non-spam. Ang default ay ang gamitin /var/lib/qsfdb at,
kung hindi iyon available o read-only, $HOME/.qsfdb. Ang pagpipiliang ito ay maaari ding
kapaki-pakinabang kung mayroong isang database ng buong system ngunit ayaw mong gamitin ito -
ang pagtukoy sa sarili mo dito ay magpapawalang-bisa sa default.
Kung nilagyan mo ng prefix ang filename ng a TYPE, ng anyo btree:$HOME/.qsfdb, pagkatapos ito
ay tukuyin kung anong uri ng database FILE ay, tulad ng listahan, btree, gdbm, sqlite at
iba pa. Suriin ang output ng qsf -V para makita kung aling mga database backend ang available.
Ang default ay ang auto-detect ang uri, o, kung wala pa ang file, gamitin
listahan. Tandaan na TYPE ay hindi case-sensitive.
-g, --pandaigdigan [TYPE:]FILE
paggamit FILE bilang default na global database, sa halip na /var/lib/qsfdb. Kung ikaw din
tukuyin ang isang database na may -d, pagkatapos itong "global" na database ay gagamitin sa read-only
mode kasabay ng read-write database na tinukoy sa -d. ang -g opsyon
maaaring magamit sa pangalawang pagkakataon upang tukuyin ang pangatlong database, na gagamitin din sa
read-only na mode. Muli, ang filename ay maaaring opsyonal na lagyan ng prefix ng a TYPE alin
tumutukoy sa uri ng database.
-P, --plain-map FILE
Panatilihin ang pagmamapa ng lahat ng mga token ng database sa kanilang hindi na-hash na mga katapat sa FILE,
isang token bawat linya. Maaari itong maging kapaki-pakinabang kung gusto mong mailista ang mga nilalaman
ng iyong database sa ibang araw, halimbawa para makakuha ng listahan ng mga email address
iyong allow-list. Tandaan na ang paggamit sa opsyong ito ay maaaring mabagal qsf pababa, at mga entry lamang
na nakasulat sa database habang ang opsyon na ito ay aktibo ay maiimbak sa FILE.
-oo, --paksa
Isulat muli ang linya ng Paksa ng anumang email na lumalabas na spam, idinaragdag ang "[SPAM]" sa
ang simula ng linya.
-S, --subject-marker SUBJECT
Sa halip na idagdag ang "[SPAM]," idagdag SUBJECT sa linya ng Paksa ng anumang email na lumiliko
para maging spam. Nagpapahiwatig -s.
-H, --header-marker MARKA
Sa halip na itakda ang X-Spam header sa "OO", itakda ito sa MARKA kung ang email ay lumabas sa
maging spam. Maaari itong maging kapaki-pakinabang kung ang iyong email client ay makakapaghanap lamang sa lahat ng mga header para sa a
string, sa halip na isang partikular na header (kaya maaaring mas tumugma ang paghahanap para sa "OO".
kaysa sa output lang ng qsf).
-n, --walang-header
Huwag magdagdag ng X-Spam header sa mga mensahe.
-r, --add-rating
Maglagay ng karagdagang header na X-Spam-Rating na isang rating ng "spamminess" ng
isang mensahe mula 0 hanggang 100; Ang 90 pataas ay binibilang bilang spam, anuman ang mas mababa sa 90 ay hindi
itinuturing na spam. Kung isasama sa -t, pagkatapos ay ang rating (0-100) ay magiging output, sa
sarili nitong, sa karaniwang output.
-A, --asterisk
Maglagay ng karagdagang header na X-Spam-Level na maglalaman sa pagitan ng 0 at 20
asterisk (*), depende sa spam rating.
-t, --pagsusulit
Sa halip na ipasa ang mensahe sa karaniwang output, wala nang output, at lumabas sa 0
kung ang mensahe ay hindi spam, o lumabas sa 1 kung ang mensahe ay spam. Kung isasama sa -r,
pagkatapos ay ang spam rating ay magiging output sa karaniwang output.
-a, --allowlist
Paganahin ang allow-list. Nagdudulot ito ng mga email address na ibinigay sa mensahe
"Mula kay:" at "Return-Path:" na mga header na susuriin laban sa isang listahan; kung alinman sa isa
tumutugma, kung gayon ang mensahe ay palaging itinuturing na hindi spam, anuman ang
sabi ng token database. Kapag tinukoy na may watawat sa muling pagsasanay, -a -m (markahan bilang spam)
aalisin ang address na iyon mula sa allow-list pati na rin ang pagmamarka sa mensahe bilang
spam, at -a -M (markahan bilang non-spam) ay idaragdag din ang address na iyon sa allow-list
bilang pagmamarka sa mensahe bilang hindi spam. Ang ideya ay idagdag mo ang lahat ng iyong mga kaibigan
sa allow-list, at pagkatapos ay wala sa kanilang mga mensahe ang namarkahan bilang spam.
-y, --denylist
Paganahin ang deny-list. Nagdudulot ito ng mga email address na ibinigay sa mensahe
"Mula kay:" at "Return-Path:" na mga header na susuriin laban sa pangalawang listahan; kung alinman
ang isa ay tumutugma, pagkatapos ang kanilang mensahe ay palaging itinuturing bilang spam. Ang pagsasanay ay gumagana sa
parehong paraan tulad ng sa -a, maliban na dapat mong tukuyin -m or -M dalawang beses upang baguhin ang
deny-list sa halip na allow-list, at may reverse syntax: -y -m -m (markahan bilang
spam) ay idaragdag ang address na iyon sa deny-list, samantalang -y -M -M (markahan bilang hindi spam)
aalisin ang address na iyon mula sa deny-list. Ang dobleng pagtutukoy na ito ay ganoon
ang karaniwang proseso ng muling pagsasanay ay hindi kailanman umabot sa listahan ng pagtanggi; ang deny-list dapat
maingat na pinananatili sa halip na awtomatikong nabuo.
Karaniwang hindi mo kailangang gamitin ang deny-list.
-L, --level, --threshold ANTAS
Baguhin ang antas ng threshold ng pagmamarka ng spam na dapat maabot bago ang isang email
inuri bilang spam. Ang default ay 90.
-Q, --min-token NUM
Magbigay lamang ng marka kung higit sa NUM ang mga token ay matatagpuan sa mensahe - kung hindi man ang
ang mensahe ay ipinapalagay na hindi spam, at hindi ito binabago sa anumang paraan. Ang default
ay 0. Maaaring maging kapaki-pakinabang ang opsyong ito kung nalaman mong napakaikli ng mga mensahe
madalas mali ang pagkakategorya.
-e, --email, --email-lamang EMAIL
Itanong o i-update ang entry ng allow-list para sa email address EMAIL. na walang iba
mga pagpipilian, ito ay maglalabas lamang ng "OO" kung EMAIL ay nasa allow-list, o "NO" kung ito
ay hindi. Sa -t, hindi ito maglalabas ng anuman, ngunit lalabas sa 0 (tagumpay) kung EMAIL is
sa allow-list, o 1 (failure) kung hindi. Kasama ang -m (mark-spam) na opsyon, anuman
nakaraang entry ng allow-list para sa EMAIL ay aalisin. Sa wakas, kasama ang -M (marka-
nonspam) na opsyon, EMAIL ay idaragdag sa allow-list kung wala pa ito.
If EMAIL ay salita lamang MSG sa sarili nitong, pagkatapos ay babasahin ang isang email mula sa pamantayan
input, at ang mga email address na ibinigay sa mga header na "Mula kay:" at "Return-Path:."
magamit.
paggamit -e awtomatikong bubukas -a.
Kung tinukoy mo rin -y, pagkatapos ay mapapatakbo ang deny-list. Tandaan mo yan -m
at -M ay binaligtad kasama ang deny-list.
Kung tumukoy ka ng email address ng form @domain (wala bago ang @), pagkatapos
ang buong domain ay papayagan o tanggihan na nakalista.
-sa, --verbose
Magdagdag ng dagdag X-QSF-Impormasyon mga header sa anumang na-filter na email, na naglalaman ng mga mensahe ng error at
iba pa kung naaangkop. Tukuyin -v higit sa isang beses upang madagdagan ang verbosity.
-T, --tren SPAM NONSPAM [MAXROUNDS]
Sanayin ang database gamit ang dalawang mbox folder SPAM at NONSPAM, sa pamamagitan ng pagsubok sa bawat isa
mensahe sa bawat folder at ina-update ang database sa tuwing may mensahe
mali ang pagkakategorya. Ginagawa ito ng ilang beses, at maaaring magtagal bago tumakbo. Tukuyin
ang -a (allow-list) flag upang idagdag ang bawat nagpadala sa NONSPAM folder sa iyong allow-
listahan bilang side-effect ng proseso ng pagsasanay. Kung MAXROUNDS ay tinukoy, pagsasanay
magtatapos pagkatapos ng bilang ng mga round na ito kung hindi pa rin sapat ang mga resulta. Ang
Ang default ay maximum na 200 round.
-m, --mark-spam
Sa halip na ipasa ang mensahe sa karaniwang output, markahan ang mga nilalaman nito bilang spam
at i-update ang database nang naaayon. Kung ang allow-list (-a) ay pinagana, ang
ang mga address na "Mula kay:" at "Return-Path:" ay tinanggal mula sa listahan ng pinahihintulutan. Kung
ang deny-list (-y) ay pinagana at tinukoy mo -m dalawang beses, ang mga address ng mensahe ay
sa halip ay idinagdag sa deny-list.
-M, --mark-nonspam
Sa halip na ipasa ang mensahe sa karaniwang output, markahan ang mga nilalaman nito bilang hindi-
spam at i-update ang database nang naaayon. Kung ang allow-list (-a) ay pinagana, ang
ang mga address na "Mula kay:" at "Return-Path:" ay idinagdag sa listahan ng pinahihintulutan (tingnan ang
-a opsyon sa itaas). Kung ang deny-list (-y) ay pinagana at tinukoy mo -M dalawang beses, ang
sa halip, ang mga address ng mensahe ay tinanggal mula sa listahan ng pagtanggi.
-w, --timbang Timbang
Kapag nagmamarka bilang spam o hindi spam, i-update ang database na may timbang na Timbang
bawat token sa halip na ang default na 1. Kapaki-pakinabang kapag nagwawasto ng mga pagkakamali, hal a
ang mensaheng maling natukoy bilang spam ay dapat mamarkahan bilang hindi spam
gamit ang weighting na 2, ibig sabihin, doblehin ang karaniwang weighting, upang kontrahin ang error.
-D, --tambakan [FILE]
Itapon ang mga nilalaman ng database bilang isang platform-independent na text file, na angkop para sa
archival, paglipat sa ibang makina, at iba pa. Ang data ay output sa stdout o
sa ibinigay FILE.
-R, --ibalik [FILE]
Muling itayo ang database mula sa simula mula sa text file sa stdin. Kung ang FILE ay ibinigay,
Ang data ay binabasa mula doon sa halip na mula sa stdin.
-O, --mga token
Sa halip na mag-filter, maglabas ng listahan ng mga token na makikita sa mensaheng binasa
karaniwang input, kasama ang bilang ng beses na matagpuan ang bawat token. Ito ay lamang
kapaki-pakinabang kung nais mong gamitin qsf bilang isang pangkalahatang tokenizer para magamit sa isa pang pag-filter
Pakete.
- Eh, --pagsamahin OTHERDB
Pagsamahin ang OTHERDB database sa kasalukuyang database. Ito ay maaaring maging kapaki-pakinabang kung ikaw
gusto mong kunin ang mailbox ng isang user at pagsamahin ito sa buong system, halimbawa
(ito ay gagawin ng, bilang ugat, paggawa qsf -d /var/lib/qsfdb -E /home/user/.qsfdb
at pagkatapos ay tanggalin /home/user/.qsfdb).
-B, --benchmark SPAM NONSPAM [MAXROUNDS]
I-benchmark ang proseso ng pagsasanay gamit ang dalawang mbox folder SPAM at NONSPAM. Ang
Ang pansamantalang database ay ginawa at sinanay gamit ang unang 75% ng mga mensahe sa
bawat folder, at pagkatapos ay susuriin ang buong nilalaman ng bawat folder upang makita kung ilan
nangyayari ang mga maling positibo at maling negatibo. Ang ilang impormasyon sa tiyempo ay din
ipinakita
Magagamit ito upang magpasya kung aling backend ang pinakamahusay sa iyong system. Gamitin -d upang piliin
isang backend, hal qsf -B spam nonspam -d GBM - lilikha ito ng pansamantalang database
na inalis pagkatapos.
Ang pagbubukod dito ay ang MySQL backend, kung saan isang buong detalye ng database
dapat ibigay (-d MySQL:database=db;host=localhost;...) at ang talahanayan ng database
ang ibinigay ay hindi pupunasan muna o ibababa pagkatapos.
Tulad ng -T, Kung MAXROUNDS ay tinukoy, ang pagsasanay ay hindi kailanman gagawin nang higit sa
ang bilang ng mga round na ito; ang default ay 200.
-h, - Tumulong
Mag-print ng mensahe ng paggamit sa karaniwang output at matagumpay na lumabas.
-V, --bersyon
I-print ang impormasyon ng bersyon, kabilang ang isang listahan ng mga available na backend ng database, sa
karaniwang output at matagumpay na lumabas.
DEPRECATE NA Opsyon
Ang mga sumusunod na opsyon ay para lamang gamitin sa lumang binary tree database backend o luma
mga database na hindi pa na-upgrade sa bagong format na kasama ng bersyon 1.1.0.
-N, --walang-autoprune
Kapag nagmamarka bilang spam o nonspam, hindi kailanman awtomatikong putulin ang database. Karaniwan
ang database ay pinuputol pagkatapos ng bawat 500 marka; kung gugustuhin mo --pugutan mano-mano,
gamitin -N upang hindi paganahin ang awtomatikong pruning.
-p, --pugutan
Alisin ang mga kalabisan na entry mula sa database at linisin ito ng kaunti. Ito ay
awtomatikong ginagawa pagkatapos ng ilang mga tawag sa --mark-spam or --mark-nonspam, at sa panahon
pagsasanay sa --tren kung ang pagsasanay ay tumatagal ng isang malaking bilang ng mga round, kaya dapat
bihirang kailangang gamitin --pugutan mano-mano maliban kung ginagamit mo -N /
--walang-autoprune.
-X, --prune-max NUM
Kapag ang database ay pinuputol, hindi hihigit sa NUM isasaalang-alang ang mga entry para sa
pagtanggal. Ito ay upang maiwasan ang pagkuha ng CPU at memory resources. Ang
Ang default ay 100,000 ngunit sa ilang mga pagkakataon (kung nalaman mong kailangan din ang pruning
mahaba) ang opsyong ito ay maaaring gamitin upang bawasan ito sa isang mas mapapamahalaang numero.
Gumamit ng qsf online gamit ang mga serbisyo ng onworks.net