Ini adalah perintah qsf yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
qsf - filter spam cepat
RINGKASAN
Penyaringan: qsf [-snrAtav] [-d DB] [-g DB]
[-L LVL] [-S SUBJ] [-H MENANDAI] [-Q NUM]
[-X NUM]
Latihan: qsf -T SPAM NONSPAM [MAXROUND] [-d DB]
Pelatihan ulang: qsf -[m|M] [-d DB] [-w BERAT] [-ayN]
Database: qsf -[p|D|R|O] [-d DB]
Penggabungan basis data: qsf -E DB LAINNYA [-d DB]
Kueri daftar yang diizinkan: qsf -e EMAIL [-m|-M|-t] [-d DB] [-g DB]
Kueri daftar penolakan: qsf -y -e EMAIL [-m -m|-M -M|-t] [-d DB] [-g DB]
Bantuan: qsf -[h|V]
DESKRIPSI
qsf membaca satu email pada input standar, dan secara default mengeluarkannya pada output standar.
Jika email ditentukan sebagai spam, header tambahan ("X-Spam: YES") akan ditambahkan,
dan opsional baris subjek dapat memiliki "[SPAM]" di depannya.
qsf dimaksudkan untuk digunakan dalam procmail(1) resep, dalam aturan seperti ini:
:0 wkt
| qsf -ra
:0 jam:
* X-Spam: YA
$HOME/email/spam
Untuk lebih banyak contoh, termasuk sampel procmail(1) resep, lihat CONTOH bagian di bawah ini.
PELATIHAN
Sebelum qsf dapat digunakan dengan baik, perlu dilatih. Cara yang baik untuk melatih qsf adalah untuk
kumpulkan salinan semua email Anda ke dalam dua folder - satu untuk spam, dan satu lagi untuk non-spam.
Setelah Anda melakukan ini, Anda dapat menggunakan fungsi pelatihan, seperti ini:
qsf -aT folder spam non-folder spam
Ini akan menghasilkan database yang dapat digunakan oleh qsf untuk menebak apakah email diterima di
masa depan adalah spam atau tidak. Perhatikan bahwa latihan awal ini mungkin memakan waktu lama, tapi
Anda hanya perlu melakukannya sekali.
Untuk menandai tunggal pesan as Spam, pipa ke qsf pada pengatur terkenal. Pengatur ini menawarkan bantuan hukum kepada traderapabila trader berselisih dengan broker yang terdaftar dengan mereka. --tandai-spam or -m ("ditandai sebagai
spam"). Ini akan memperbarui database yang sesuai dan membuang email.
Untuk menandai tunggal pesan as bukan spam, pipa ke qsf pada pengatur terkenal. Pengatur ini menawarkan bantuan hukum kepada traderapabila trader berselisih dengan broker yang terdaftar dengan mereka. --tandai-nonspam or -M ("tanda
sebagai non-spam"). Sekali lagi, ini akan membuang email.
Jika ada pesan yang salah ditandai, cukup kirimkan ke qsf sebagai tipe kebalikannya, yaitu jika
telah keliru ditandai sebagai spam, kirimkan ke qsf --tandai-nonspam --berat = 2 untuk menambahkannya
ke sisi database non-spam dengan pembobotan dua kali lipat dari biasanya.
PILIHAN
qsf pilihan tercantum di bawah ini.
-D, --basis data [JENIS:] FILE
penggunaan FILE sebagai basis data spam/non-spam. Standarnya adalah menggunakan /var/lib/qsfdb dan,
jika itu tidak tersedia atau hanya-baca, $HOME/.qsfdb. Pilihan ini juga bisa
berguna jika ada database seluruh sistem tetapi Anda tidak ingin menggunakannya -
menentukan milik Anda sendiri di sini akan menimpa default.
Jika Anda mengawali nama file dengan a JENIS, berbentuk btree:$HOME/.qsfdb, lalu ini
akan menentukan jenis database FILE adalah, seperti daftar, pohon, gdbm, sqlite dan
segera. Periksa keluaran dari qsf -V untuk melihat backend database mana yang tersedia.
Standarnya adalah mendeteksi tipe secara otomatis, atau, jika file belum ada, gunakan
daftar. Catat itu JENIS tidak peka huruf besar/kecil.
-G, --global [JENIS:] FILE
penggunaan FILE sebagai database global default, bukan /var/lib/qsfdb. Jika Anda juga
tentukan database dengan -d, maka database "global" ini akan digunakan dalam read-only
mode bersama dengan database baca-tulis yang ditentukan dengan -d. itu -g Option
dapat digunakan untuk kedua kalinya untuk menentukan database ketiga, yang juga akan digunakan dalam
mode hanya baca. Sekali lagi, nama file secara opsional dapat diawali dengan a JENIS yang
menentukan tipe database.
-P, --plain-peta FILE
Pertahankan pemetaan semua token basis data ke rekanan non-hash mereka di FILE,
satu token per baris. Ini bisa berguna jika Anda ingin dapat membuat daftar isinya
database Anda di kemudian hari, misalnya untuk mendapatkan daftar alamat email di
daftar izin Anda. Perhatikan bahwa menggunakan opsi ini dapat memperlambat qsf turun, dan hanya entri
ditulis ke database saat opsi ini aktif akan disimpan di FILE.
-S, --subjek
Tulis ulang baris Subjek email apa pun yang ternyata spam, tambahkan "[SPAM]" ke
awal baris.
-S, --subjek-penanda SUBJECT
Alih-alih menambahkan "[SPAM]", tambahkan SUBJECT ke baris Subjek email apa pun yang berubah
keluar untuk menjadi spam. menyiratkan -s.
-H, --penanda-header MENANDAI
Alih-alih mengatur header X-Spam ke "YA", setel ke MENANDAI jika email ternyata
menjadi spam. Ini dapat berguna jika klien email Anda hanya dapat mencari semua tajuk untuk a
string, daripada satu header tertentu (jadi mencari "YA" mungkin lebih cocok
dari sekedar output dari qsf).
-N, --tanpa header
Jangan menambahkan header X-Spam ke pesan.
-R, --tambah-peringkat
Masukkan header tambahan X-Spam-Rating yang merupakan peringkat "spam" dari
pesan dari 0 hingga 100; 90 ke atas dihitung sebagai spam, apa pun di bawah 90 tidak
dianggap spam. Jika digabungkan dengan -t, maka rating (0-100) akan keluar, pada
sendiri, pada output standar.
-SEBUAH, --asterisk
Masukkan header tambahan X-Spam-Level yang akan berisi antara 0 dan 20
tanda bintang (*), tergantung pada peringkat spam.
-T, --tes
Alih-alih meneruskan pesan pada output standar, tidak menghasilkan apa-apa, dan keluar dari 0
jika pesan tersebut bukan spam, atau keluar 1 jika pesan tersebut adalah spam. Jika digabungkan dengan -r,
maka peringkat spam akan ditampilkan pada output standar.
-Sebuah, --daftar yang diizinkan
Aktifkan daftar yang diizinkan. Hal ini menyebabkan alamat email yang diberikan dalam pesan
Header "From:" dan "Return-Path:" untuk diperiksa terhadap daftar; jika salah satunya
cocok, maka pesan selalu diperlakukan sebagai non-spam, terlepas dari apa
basis data token mengatakan. Ketika ditentukan dengan bendera pelatihan ulang, -a -m (tandai sebagai spam)
akan menghapus alamat itu dari daftar yang diizinkan serta menandai pesan sebagai
spam, dan -a -M (tandai sebagai non-spam) akan menambahkan alamat itu ke daftar yang diizinkan juga
sebagai menandai pesan sebagai non-spam. Idenya adalah Anda menambahkan semua teman Anda
ke daftar yang diizinkan, dan kemudian tidak ada pesan mereka yang ditandai sebagai spam.
-y, --penyangkal
Aktifkan daftar tolak. Hal ini menyebabkan alamat email yang diberikan dalam pesan
Header "From:" dan "Return-Path:" untuk diperiksa dengan daftar kedua; jika baik
satu cocok, maka pesan tersebut selalu diperlakukan sebagai spam. Pelatihan bekerja di
cara yang sama seperti dengan -a, kecuali bahwa Anda harus menentukan -m or -M dua kali untuk memodifikasi
daftar tolak alih-alih daftar yang diizinkan, dan dengan sintaks terbalik: -y -m -m (ditandai sebagai
spam) akan menambahkan alamat itu ke daftar penolakan, sedangkan -y -M -M (tandai sebagai bukan spam)
akan menghapus alamat itu dari daftar penolakan. Spesifikasi ganda ini adalah agar
proses pelatihan ulang yang biasa tidak pernah menyentuh daftar penolakan; daftar penolakan seharusnya
dipelihara dengan hati-hati daripada dihasilkan secara otomatis.
Biasanya Anda tidak perlu menggunakan daftar tolak.
-L, --tingkat, --ambang TINGKAT
Ubah tingkat ambang batas skor spam yang harus dicapai sebelum email dikirim
diklasifikasikan sebagai spam. Standarnya adalah 90.
-Q, --min-token NUM
Berikan skor hanya jika lebih dari NUM token ditemukan dalam pesan - jika tidak,
pesan dianggap bukan spam, dan tidak dimodifikasi dengan cara apa pun. Standarnya
adalah 0. Opsi ini mungkin berguna jika Anda menemukan bahwa pesan yang sangat pendek sedang
sering salah kategori.
-e, --surel, --hanya email EMAIL
Kueri atau perbarui entri daftar yang diizinkan untuk alamat email EMAIL. Tanpa yang lain
opsi, ini hanya akan menampilkan "YA" jika EMAIL ada dalam daftar yang diizinkan, atau "TIDAK" jika
tidak. Dengan -t, itu tidak akan menampilkan apa pun, tetapi akan keluar dari 0 (berhasil) jika EMAIL is
dalam daftar yang diizinkan, atau 1 (gagal) jika tidak. Dengan -m (tandai-spam), apa saja
entri daftar yang diizinkan sebelumnya untuk EMAIL akan dihapus. Akhirnya, dengan -M (tanda-
opsi nonspam), EMAIL akan ditambahkan ke daftar yang diizinkan jika belum ada di daftar tersebut.
If EMAIL hanya kata MSG dengan sendirinya, maka email akan dibaca dari standar
masukan, dan alamat email yang diberikan di header "Dari:" dan "Jalur Kembali:" akan
digunakan.
Menggunakan -e otomatis aktif -a.
Jika Anda juga menentukan -y, maka daftar tolak akan dioperasikan. Ingat bahwa -m
dan -M dibalik dengan daftar tolak.
Jika Anda menentukan alamat email formulir @domain (tidak ada sebelum @), lalu
keseluruhan domain akan diizinkan atau ditolak terdaftar.
-di, --bertele-tele
Tambahkan ekstra X-QSF-Info tajuk ke email apa pun yang difilter, berisi pesan kesalahan dan
sebagainya jika berlaku. Menentukan -v lebih dari sekali untuk meningkatkan verbositas.
-T, --kereta SPAM NONSPAM [MAXROUND]
Latih database menggunakan dua folder mbox SPAM dan NONSPAM, dengan menguji masing-masing
pesan di setiap folder dan memperbarui database setiap kali ada pesan
salah kategori. Ini dilakukan beberapa kali, dan mungkin perlu beberapa saat untuk dijalankan. Menentukan
itu -a (daftar yang diizinkan) bendera untuk menambahkan setiap pengirim di NONSPAM folder ke izin Anda-
daftar sebagai efek samping dari proses pelatihan. Jika MAXROUND ditentukan, pelatihan
akan berakhir setelah jumlah putaran ini jika hasilnya masih belum cukup baik. NS
default adalah maksimum 200 putaran.
-M, --tandai-spam
Alih-alih menyampaikan pesan pada keluaran standar, tandai isinya sebagai spam
dan memperbarui database yang sesuai. Jika daftar yang diizinkan (-a) diaktifkan,
alamat "Dari:" dan "Jalur Kembali:" pesan dihapus dari daftar yang diizinkan. Jika
daftar penolakan (-y) diaktifkan dan Anda tentukan -m dua kali, alamat pesannya adalah
ditambahkan ke daftar tolak sebagai gantinya.
-M, --tandai-nonspam
Alih-alih meneruskan pesan pada keluaran standar, tandai isinya sebagai non-
spam dan perbarui database yang sesuai. Jika daftar yang diizinkan (-a) diaktifkan,
alamat "Dari:" dan "Jalur Kembali:" pesan ditambahkan ke daftar yang diizinkan (lihat
-a pilihan di atas). Jika daftar penolakan (-y) diaktifkan dan Anda tentukan -M dua kali,
alamat pesan dihapus dari daftar tolak sebagai gantinya.
-w, --berat BERAT
Saat menandai sebagai spam atau non-spam, perbarui database dengan bobot BERAT
per token, bukan default 1. Berguna saat mengoreksi kesalahan, misalnya a
pesan yang salah terdeteksi sebagai spam harus ditandai sebagai bukan spam
menggunakan pembobotan 2, yaitu menggandakan pembobotan biasa, untuk mengatasi kesalahan.
-D, --membuang [MENGAJUKAN]
Buang konten database sebagai file teks platform-independen, cocok untuk
pengarsipan, transfer ke komputer lain, dan sebagainya. Data dikeluarkan pada stdout atau
ke dalam yang diberikan FILE.
-R, --memulihkan [MENGAJUKAN]
Bangun kembali basis data dari awal dari file teks di stdin. Jika sebuah FILE diberikan,
data dibaca dari sana alih-alih dari stdin.
-HAI, --token
Alih-alih memfilter, keluarkan daftar token yang ditemukan dalam pesan yang dibaca dari
masukan standar, bersama dengan berapa kali setiap token ditemukan. Hanya ini
berguna jika Anda ingin menggunakan qsf sebagai tokeniser umum untuk digunakan dengan pemfilteran lain
paket.
-E, --menggabungkan DB LAINNYA
Gabungkan DB LAINNYA database ke dalam database saat ini. Ini bisa berguna jika Anda
ingin mengambil satu kotak surat pengguna dan menggabungkannya ke seluruh sistem, misalnya
(ini akan dilakukan oleh, sebagai root, melakukan qsf -d /var/lib/qsfdb -E /home/pengguna/.qsfdb
dan kemudian menghapus /home/pengguna/.qsfdb).
-B, --tolok ukur SPAM NONSPAM [MAXROUND]
Tolok ukur proses pelatihan menggunakan dua folder mbox SPAM dan NONSPAM. Sebuah
database sementara dibuat dan dilatih menggunakan 75% pesan pertama di
setiap folder, dan kemudian seluruh isi setiap folder diuji untuk melihat berapa banyak
positif palsu dan negatif palsu terjadi. Beberapa informasi waktu juga
ditampilkan.
Ini dapat digunakan untuk memutuskan backend mana yang terbaik di sistem Anda. Menggunakan -d untuk memilih
backend, misalnya qsf -B Spam bukan spam -d PDBM - ini akan membuat database sementara
yang dikeluarkan setelahnya.
Pengecualian untuk ini adalah backend MySQL, di mana spesifikasi database lengkap
harus diberikan (-d MySQL:database=db;host=localhost;...) dan tabel database
diberikan tidak akan dihapus sebelumnya atau dijatuhkan setelahnya.
Seperti -T, Jika MAXROUND ditentukan, pelatihan tidak akan pernah dilakukan lebih dari
jumlah putaran ini; defaultnya adalah 200.
-H, --membantu
Cetak pesan penggunaan pada output standar dan keluar dengan sukses.
-V, --Versi: kapan
Informasi versi cetak, termasuk daftar backend database yang tersedia, di
keluaran standar dan keluar dengan sukses.
TIDAK DIGUNAKAN LAGI PILIHAN
Opsi berikut hanya untuk digunakan dengan backend database pohon biner lama atau lama
database yang belum ditingkatkan ke format baru yang disertakan dengan versi 1.1.0.
-N, --tidak ada pemangkasan otomatis
Saat menandai sebagai spam atau nonspam, jangan pernah memangkas database secara otomatis. Biasanya
database dipangkas setelah setiap 500 tanda; jika Anda lebih suka --memangkas secara manual,
menggunakan -N untuk menonaktifkan pemangkasan otomatis.
-P, --memangkas
Hapus entri yang berlebihan dari database dan bersihkan sedikit. Ini adalah
dilakukan secara otomatis setelah beberapa panggilan ke --tandai-spam or --tandai-nonspam, dan selama
berlatih dengan --kereta jika pelatihan membutuhkan banyak putaran, jadi seharusnya
jarang diperlukan untuk digunakan --memangkas secara manual kecuali Anda menggunakan -N /
--tidak ada pemangkasan otomatis.
-X, --prune-maks NUM
Saat database sedang dipangkas, tidak lebih dari NUM entri akan dipertimbangkan untuk
pemindahan. Ini untuk mencegah CPU dan sumber daya memori diambil alih. NS
default adalah 100,000 tetapi dalam beberapa keadaan (jika Anda menemukan bahwa pemangkasan juga diperlukan
long) opsi ini dapat digunakan untuk menguranginya ke jumlah yang lebih mudah dikelola.
Gunakan qsf online menggunakan layanan onworks.net