EnglischFranzösischSpanisch

OnWorks-Favicon

sa-learnp – Online in der Cloud

Führen Sie sa-learnp im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl sa-learnp, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


sa-learn – Trainieren Sie den Bayes'schen Klassifikator von SpamAssassin

ZUSAMMENFASSUNG


sa-lernen [Optionen] [Datei]...

sa-lernen [Optionen] --dump [ alle | Daten | Magie ]

Option:

--ham Nachrichten als Ham (kein Spam) lernen
--spam Erkennt Nachrichten als Spam
--forget Eine Nachricht vergessen
--use-ignores Verwenden Sie bayes_ignore_from und bayes_ignore_to
--sync Synchronisiert bei Bedarf die Datenbank und das Journal
--force-expire Erzwingt eine Datenbanksynchronisierung und einen Ablauflauf
--dbpath Ermöglicht das Überschreiben der Befehlszeile (im bayes_path-Format)
woher man die Bayes-Datenbank lesen kann
--dump [all|data|magic] Zeigt den Inhalt der Bayes-Datenbank an
Akzeptiert ein optionales Argument für das, was angezeigt werden soll
--regexp Gibt nur für Dump an, welche Token gesendet werden sollen
Dump basierend auf einem regulären Ausdruck.
-f Datei, --folders=Datei Liest die Liste der Dateien/Verzeichnisse aus der Datei
--dir ignoriert; historische Kompatibilität
--file ignoriert; historische Kompatibilität
--mbox Eingabequellen liegen im Mbox-Format vor
--mbx Eingabequellen liegen im MBX-Format vor
--max-size Nachrichten überspringen, die größer als b Bytes sind;
Der Standardwert ist 256 KB, 0 bedeutet keine Begrenzung
--showdots Zeigt den Fortschritt mithilfe von Punkten an
--progress Zeigt den Fortschritt mithilfe des Fortschrittsbalkens an
--no-sync Überspringt die Synchronisierung der Datenbank und des Journals
nachdem lernen
-L, --local Lokal arbeiten, keine Netzwerkzugriffe
--import Daten von einer älteren Version/nicht DB_File migrieren
basierte Datenbanken
--clear Löscht die vorhandene Datenbank
--backup Sicherung der vorhandenen Datenbank auf STDOUT
--wiederherstellen Stellen Sie eine Datenbank aus Dateiname wieder her
-u Benutzername, --username=Benutzername
Überschreiben Sie den aus der Laufzeit übernommenen Benutzernamen
Umgebung, verwendet mit SQL
-C Pfad, --configpath=Pfad, --config-file=Pfad
Pfad zum Standardkonfigurationsverzeichnis
-p prefs, --prefspath=Datei, --prefs-file=Datei
Legen Sie die Benutzereinstellungsdatei fest
--siteconfigpath=path Pfad für Site-Konfigurationen
(Standard: /etc/spamassassin)
--cf='config line' Zusätzliche Konfigurationszeile
-D, --debug [area=n,...] Gibt Debugging-Meldungen aus
-V, --version Druckversion
-h, --help Nutzungsmeldung drucken

BESCHREIBUNG


Angesichts einer typischen Auswahl Ihrer eingehenden E-Mails, die als Spam oder Ham (Nicht-Spam) klassifiziert sind, ist dies der Fall
Das Tool leitet jede E-Mail an SpamAssassin weiter und ermöglicht so das „Lernen“, welche Zeichen wahrscheinlich sind
bedeuten Spam, und die wahrscheinlich Schinken bedeuten.

Führen Sie diesen Befehl einfach einmal für jeden Ihrer E-Mail-Ordner aus, und er lernt daraus
Mail darin.

Beachten Sie den csh-Stil Globbing in den Mail-Ordnernamen wird unterstützt; mit anderen Worten,
Wenn Sie einen Ordnernamen als „*“ angeben, wird jeder übereinstimmende Ordner gescannt. Sehen
Weitere Informationen finden Sie unter „Mail::SpamAssassin::ArchiveIterator“.

SpamAssassin merkt sich, welche E-Mail-Nachrichten es bereits gelernt hat, und lernt nicht erneut
diese Nachrichten erneut, es sei denn, Sie verwenden die --vergessen Möglichkeit. Als Spam erkannte Nachrichten werden erkannt
Entfernen Sie das SpamAssassin-Markup im Handumdrehen.

Wenn Sie einen Fehler machen und eine E-Mail als Ham scannen, obwohl sie Spam ist, oder umgekehrt, führen Sie den Vorgang einfach noch einmal durch
Geben Sie diesen Befehl mit der richtigen Klassifizierung ein und der Fehler wird korrigiert.
SpamAssassin „vergisst“ automatisch die vorherigen Angaben.

Benutzer von „Spamd“, die Schulungen aus der Ferne über ein Netzwerk durchführen möchten, sollten dies überprüfen
den Schalter „spamc -L“.

OPTIONAL


--Schinken
Lernen Sie die Eingabenachricht(en) als Ham. Wenn Sie zuvor eine der Nachrichten erfahren haben
SpamAssassin vergisst sie zunächst als Spam und erkennt sie dann erneut als Ham.
Alternativ, wenn Sie sie zuvor als Schinken gelernt haben, werden sie dieses Mal übersprungen
um. Wenn die Nachrichten bereits durch SpamAssassin gefiltert wurden, wird der Lernende
ignoriert alle Änderungen, die SpamAssassin möglicherweise vorgenommen hat.

--Spam
Erkennen Sie die Eingabenachricht(en) als Spam. Wenn Sie bereits etwas davon gelernt haben
Wenn Sie Nachrichten als Ham speichern, vergisst SpamAssassin sie zunächst und erkennt sie dann erneut als Spam.
Wenn Sie sie zuvor als Spam erkannt haben, werden sie dieses Mal übersprungen
um. Wenn die Nachrichten bereits durch SpamAssassin gefiltert wurden, wird der Lernende
ignoriert alle Änderungen, die SpamAssassin möglicherweise vorgenommen hat.

--Ordner=Dateinamen, -f Dateinamen
sa-learn liest die Liste der Ordner aus der angegebenen Datei ein, einen Ordner pro Zeile
in der Datei. Wenn dem Ordner das Präfix „ham:type:“ oder „spam:type:“ vorangestellt ist, wird sa-learn
erkennt diesen Ordner entsprechend, andernfalls wird davon ausgegangen, dass es sich bei den Ordnern um Ordner handelt
der von angegebene Typ --Schinken or --Spam.

„Typ“ oben ist optional, entspricht aber dem Standard für ArchiveIterator: mbox,
mbx, dir, file oder discover (die Standardeinstellung, falls nicht angegeben).

--mbox
sa-learn liest die Datei(en) ein, die die zu lernenden E-Mails enthalten, und wird dies tun
Verarbeiten Sie sie im Mbox-Format (eine oder mehrere E-Mails pro Datei).

--mbx
sa-learn liest die Datei(en) ein, die die zu lernenden E-Mails enthalten, und wird dies tun
Verarbeiten Sie sie im MBX-Format (eine oder mehrere E-Mails pro Datei).

--use-ignores
Die Meldung wird nicht gelesen, wenn eine Absenderadresse mit einem Konfigurationsdateielement übereinstimmt
„bayes_ignore_from“ oder eine to-Adresse entspricht „bayes_ignore_to“. Die Option könnte sein
Wird verwendet, wenn aus einer großen Datei von Nachrichten gelernt wird, aus denen die Hammy-Spam-Nachrichten stammen oder
Spam-Ham-Nachrichten wurden nicht entfernt.

--sync
Synchronisieren Sie das Journal und die Datenbanken. Nach erfolgreicher Synchronisierung der Datenbank mit
Wenn die Einträge im Journal gelöscht werden, wird die Journaldatei entfernt.

--force-expire
Erzwingt einen Ablaufversuch, unabhängig davon, ob dieser notwendig ist oder nicht. Notiz:
Dies bedeutet nicht, dass Token tatsächlich ablaufen. Bitte beachten Sie den Abschnitt „LAUFZEIT“.
unten mit.

Hinweis: „--force-expire“ bewirkt auch, dass die Journaldaten in die Bayes synchronisiert werden
Datenbanken.

--vergessen
Vergessen Sie eine zuvor gelernte Botschaft.

--dbpath
Ermöglicht eine Befehlszeilenüberschreibung von bayes_path Konfigurationsoption.

--entsorgen zu erhalten
Zeigen Sie den Inhalt der Bayes-Datenbank an. Ohne Option oder mit der alle Option,
Alle magischen Token und Datentoken werden angezeigt. Magie wird nur Magie zeigen
Token und die Datenerfassung zeigt nur die Datentokens an.

Kann auch verwendet werden --regexp RE Option zum Angeben, welche Token basierend auf a angezeigt werden sollen
regulären Ausdruck.

--klar
Löschen Sie eine vorhandene Bayes-Datenbank, indem Sie alle Spuren der Datenbank entfernen.

WARNUNG: Dies ist zerstörerisch und sollte mit Vorsicht verwendet werden.

--Sicherung
Führt einen Dump der Bayes-Datenbank in einem maschinen-/menschlich lesbaren Format durch.

Der Dump enthält Token und gesehene Daten. Es eignet sich zur Rückeingabe in die
--restore-Befehl.

--wiederherstellen=Dateinamen
Führt eine Wiederherstellung der von definierten Bayes-Datenbank durch Dateinamen.

WARNUNG: Dies ist ein destruktiver Vorgang. Frühere Bayes-Daten werden gelöscht.

-h, --help
Hilfenachricht drucken und beenden.

-u Benutzername, --Nutzername=Benutzername
Wenn dieser Benutzername angegeben wird, überschreibt er den aus der Laufzeit übernommenen Benutzernamen
Umfeld. Mit dieser Option können Sie Benutzer in einer virtuellen Benutzerkonfiguration angeben
bei Verwendung von SQL als Bayes-Backend.

HINWEIS: Diese Option ändert sich nicht Benutzername, wird es nur versuchen zu handeln
im Namen dieses Benutzers. Aus diesem Grund benötigen Sie die entsprechenden Berechtigungen
in der Lage sein, Dateien zu ändern, die Eigentum von sind Benutzername. Im Fall von SQL ist dies im Allgemeinen nicht der Fall
Problem.

-C Weg, --configpath=Weg, --Konfigurationsdatei=Weg
Verwenden Sie den angegebenen Pfad zum Auffinden der verteilten Konfigurationsdateien. Ignoriere das
Standardverzeichnisse (normalerweise „/usr/share/spamassassin“ oder ähnlich).

--siteconfigpath=Weg
Verwenden Sie den angegebenen Pfad zum Auffinden standortspezifischer Konfigurationsdateien. Ignoriere das
Standardverzeichnisse (normalerweise „/etc/spamassassin“ oder ähnliches).

--cf='config Linie'
Fügen Sie zusätzliche Konfigurationszeilen direkt über die Befehlszeile hinzu, analysiert nach dem
Konfigurationsdateien werden gelesen. Mehrere --vgl Argumente können verwendet werden, und jedes wird es sein
wird als separate Konfigurationslinie betrachtet.

-p Vorlieben, --prefspath=Vorlieben, --prefs-Datei=Vorlieben
Lesen Sie die Benutzerbewertungspräferenzen aus Vorlieben (normalerweise „$HOME/.spamassassin/user_prefs“).

--Fortschritt
Druckt einen Fortschrittsbalken (auf STDERR), der den aktuellen Fortschritt anzeigt. Für den Fall, dass nein
Wenn ein gültiges Terminal gefunden wird, verhält sich diese Option ähnlich wie die Option --showdots.

-D [Bereich,...], --debuggen [Bereich,...]
Erzeugen Sie eine Debugging-Ausgabe. Wenn keine Bereiche aufgeführt sind, sind alle Debugging-Informationen aufgeführt
gedruckt. Die Diagnoseausgabe kann auch für jeden Bereich einzeln aktiviert werden; Gesamtfläche unserer Sitzes lernen muss die
Bereich des Codes zum Instrument. Um beispielsweise Diagnoseausgaben für Bayes zu erstellen,
lernen und DNS verwenden:

spamassassin -D bayes,learn,dns

Weitere Informationen darüber, welche Bereiche (auch Kanäle genannt) verfügbar sind, finden Sie hier
siehe Dokumentation unter:

C<http://wiki.apache.org/spamassassin/DebugChannels>

Informationsnachrichten mit höherer Priorität, die für die normale Anmeldung geeignet sind
Umstände sind mit einem Bereich „Info“ verfügbar.

--no-sync
Überspringen Sie den langsamen Synchronisierungsschritt, der normalerweise nach einem Datenbankwechsel stattfindet
Einträge. Wenn Sie planen, aus vielen Ordnern in einem Stapel zu lernen, oder aus vielen
Um einzelne Nachrichten einzeln nacheinander anzuzeigen, ist es schneller, diesen Schalter zu verwenden und „sa-learn“ auszuführen
--sync“, sobald alle Ordner gescannt wurden.

Klarstellung: Der Zustand von --no-sync überschreibt die bayes_learn_to_journal
Konfigurationsoption. Wenn nichts angegeben wird, lernt sa-learn direkt in der Datenbank.
Wenn angegeben, lernt sa-learn die Journaldatei.

Hinweis: --sync und --no-sync kann in derselben Befehlszeile angegeben werden, was geringfügig ist
verwirrend. In diesem Fall ist die --no-sync Die Option wird ignoriert, da kein Lernen erfolgt
Erfassung sind.

-L, --lokal
Führen Sie keine Netzwerkzugriffe durch, während Sie Details zu den E-Mail-Nachrichten erfahren.
Dies beschleunigt den Lernprozess, kann jedoch zu einer etwas geringeren Genauigkeit führen.

Beachten Sie, dass dies derzeit ignoriert wird, da aktuelle Versionen von SpamAssassin dies nicht tun
Während des Lernens Netzwerkzugriff durchführen; Aber zukünftige Versionen können es sein.

--importieren
Wenn Sie zuvor den Bayesian-Learner von SpamAssassin ohne das Modul „DB_File“ verwendet haben
installiert, werden Dateien in anderen Formaten erstellt, z. B. „GDBM_File“,
„NDBM_File“ oder „SDBM_File“. Mit diesem Schalter können Sie die alten Daten in die migrieren
Format „DB_File“. Es werden alle derzeit in der „DB_File“ enthaltenen Daten überschrieben.

Kann auch mit dem verwendet werden --dbpath Weg Option zur Angabe des Standorts der Bayes
zu verwendende Dateien.

MIGRATION


Es stehen jetzt mehrere Backend-Speichermodule zum Speichern der Bayes'schen Daten des Benutzers zur Verfügung.
Daher möchten Sie möglicherweise von einem Backend zu einem anderen migrieren. Hier ist ein einfaches Verfahren
für die Migration von einem Backend zum anderen.

Beachten Sie, dass Sie bei einzelnen Benutzerdatenbanken einen ähnlichen Vorgang durchführen müssen
Verfahren für jeden von ihnen.

sa-learn --sync
Dadurch werden alle ausstehenden Journaleinträge synchronisiert

sa-learn --backup > backup.txt
Dadurch werden alle Ihre Bayes-Daten in einer Nur-Text-Datei gespeichert.

sa-lernen --klar
Dies ist optional, aber sinnvoll, um die alte Datenbank zu löschen.

Wiederholen!
Wenn Sie über mehrere Datenbanken verfügen, sollten Sie an dieser Stelle das oben beschriebene Verfahren durchführen
für jeden von ihnen. (Das heißt, die Datenbank jedes Benutzers muss vor dem Fortfahren gesichert werden.)

Backends wechseln
Sobald Sie alle Datenbanken gesichert haben, können Sie Ihre Konfiguration für die neue aktualisieren
Datenbank-Backend. Dies erfordert mindestens die Konfigurationsoption bayes_store_module und
Abhängig von den Anforderungen kann es einige zusätzliche Konfigurationsoptionen geben
Modul. (Möglicherweise müssen Sie beispielsweise eine SQL-Datenbank konfigurieren.)

sa-learn --restore backup.txt
Auch dies müssen Sie für jede Datenbank tun.

Wenn Sie auf SQL migrieren, können Sie -u verwenden Option in sa-lernen
Füllen Sie die Datenbank jedes Benutzers auf. Andernfalls müssen Sie sa-learn als Benutzer ausführen, der die Datenbank verwendet
Du stellst wieder her.

EINFÜHRUNG TO BAYESIAN FILTERUNG


(Danke an Michael Bell für diesen Abschnitt!)

Eine ausführlichere Beschreibung, wie das funktioniert, finden Sie unter http://www.paulgraham.com/ und sehen,
„Ein Plan gegen Spam“. Es ist einigermaßen lesbar, auch wenn mich die Statistik zum Staunen bringt
Bienenstöcke.

Die kurze, halb ungenaue Version: Bei gegebener Schulung kann eine Spam-Heuristik-Engine das bewältigen
die meisten „Spam“- und „Hammy“-Wörter und wenden eine probabilistische Analyse an. Darüber hinaus einmal gegeben
Als Grundlage für die Analyse kann die Engine iterativ weiterlernen, indem sie beides anwendet
die nicht-Bayes'schen und Bayes'schen Regelsätze zusammen, um eine sich entwickelnde "Intelligenz" zu schaffen.

SpamAssassin 2.50 und höher unterstützt die Bayes'sche Spam-Analyse in Form von BAYES
Regeln. Dies ist eine neue Funktion, sehr leistungsstark und wird deaktiviert, bis genügend Nachrichten vorliegen
gelernt worden.

Die Vorteile der Bayes'schen Spam-Analyse:

Kann falsch-positive und falsch-negative Ergebnisse erheblich reduzieren.
Es lernt aus Ihren E-Mails und ist daher auf Ihren individuellen E-Mail-Fluss zugeschnitten.

Sobald es mit dem Lernen beginnt, kann es weiterhin von SpamAssassin lernen und sich im Laufe der Zeit verbessern.

Und die Nachteile:

Es ist eine angemessene Anzahl an Nachrichten erforderlich, bevor die Ergebnisse für Ham/Spam nützlich sind
Entschlossenheit.
Es ist schwer zu erklären, warum eine Nachricht als Spam markiert wird oder nicht.
Das heißt: Eine einfache Regel, die beispielsweise mit „VIAGRA“ übereinstimmt, ist leicht zu verstehen. Wenn es
ein falsch positives oder falsch negatives Ergebnis erzeugt, ist es ziemlich leicht zu verstehen, warum.

Bei der Bayes'schen Analyse handelt es sich nur um Wahrscheinlichkeiten – „weil die Vergangenheit sagt, dass es wahrscheinlich ist.“
da dies in eine Wahrscheinlichkeitsverteilung fällt, die für frühere Spam-Mails in Ihren Systemen üblich ist.
Sagen Sie das Ihren Benutzern! Sagen Sie das dem Kunden, wenn er fragt: „Was kann ich tun?“
ändern Sie dies.“ (Übrigens lautet die Antwort in diesem Fall „Whitelisting verwenden“.)

Es wird Speicherplatz und Arbeitsspeicher beanspruchen.
Die von ihm verwalteten Datenbanken erfordern eine Menge Ressourcen zum Speichern und Verwenden.

BEKOMMEN GESTARTET


Noch interessiert? Ok, hier sind die Richtlinien, damit das funktioniert.

Zunächst ein allgemeiner Überblick:

Erstellen Sie eine signifikante Stichprobe von Ham- und Spam-Mails.
Ich empfehle jeweils mehrere Tausend, die in SPAM- und HAM-Verzeichnissen oder Postfächern abgelegt werden.
Ja, Sie MÜSSEN dies von Hand sortieren, sonst werden die Ergebnisse nicht viel besser sein
SpamAssassin allein. Überprüfen Sie den Spam-Charakter JEDER Nachricht. Du bist
Es wird dringend empfohlen, die Verwendung eines öffentlich zugänglichen Korpus (Beispiel) zu vermeiden – diesem muss entnommen werden
IHR Mailserver, wenn er statistisch nützlich sein soll. Andernfalls können die Ergebnisse abweichen
ziemlich schief.

Verwenden Sie dieses Tool, um SpamAssassin diese Beispiele näherzubringen, etwa so:
sa-learn --spam /path/to/spam/folder
sa-learn --ham /path/to/ham/folder
...

Lassen Sie SpamAssassin fortfahren und Dinge lernen. Wenn Ham und Spam gefunden werden, werden diese hinzugefügt
„interessante Token“ in die Datenbank aufnehmen.

Wenn Sie möchten, dass SpamAssassin bestimmte Nachrichten vergisst, verwenden Sie die --vergessen .
Dies kann entweder auf Ham- oder Spam-Mails angewendet werden, die durch das gelaufen sind sa-lernen Prozesse.
Es ist wirklich ein Hammer, die Gewichtung der spezifischen Token darin zu verringern
Nachricht (nur wenn diese Nachricht zuvor verarbeitet wurde).

Das Lernen aus einzelnen Nachrichten verwendet einen Befehl wie diesen:
sa-learn --ham --no-sync mailmessage

Dies ist praktisch für die Bindung an einen Schlüssel in Ihrem Mail-Benutzeragenten. Es ist wie alles sehr schnell
Der zeitaufwändige Vorgang wird verschoben, bis Sie ihn mit der Option „--sync“ ausführen.

Autolearning ist standardmäßig aktiviert
Wenn Sie keinen E-Mail-Korpus zum Lernen gespeichert haben, können Sie SpamAssassin verwenden
Erlernen Sie automatisch die E-Mails, die Sie erhalten. Wenn Sie von Grund auf automatisch lernen,
Die Menge an E-Mails, die Sie erhalten, bestimmt, wie lange es dauert, bis die BAYES_*-Regeln gelten
aktiviert.

EFFEKTIVER FORTBILDUNGEN


Lernfilter erfordern Training, um effektiv zu sein. Wenn man sie nicht trainiert, werden sie es nicht tun
arbeiten. Darüber hinaus müssen Sie sie regelmäßig mit neuen Nachrichten schulen, um sie auf dem Laufenden zu halten.
Andernfalls veralten die Daten und beeinträchtigen die Genauigkeit.

Sie müssen mit beiden Spam-Mails trainieren und Schinken-Mails. Eine Art von E-Mail allein reicht nicht aus
Wirkung.

Beachten Sie, dass, wenn Ihre E-Mail-Ordner Dinge wie weitergeleiteten Spam enthalten, Diskussionen über Spam-
B. Fangregeln usw., wird dies zu Problemen führen. Sie sollten es vermeiden, diese Nachrichten zu scannen
wenn möglich. (Eine einfache Möglichkeit, dies zu tun, besteht darin, sie zur Seite zu verschieben, in einen Ordner, in dem es sich nicht befindet.)
gescannt.)

Wenn die Nachrichten, aus denen Sie lernen, bereits durch SpamAssassin gefiltert wurden, wird der
Der Lernende wird dies kompensieren. Tatsächlich lernt es, wie jede Nachricht aussehen würde
wenn Sie vorher „spamassassin -d“ darüber ausgeführt hätten.

Beachten Sie außerdem, dass Sie normalerweise versuchen sollten, mit mindestens 1000 zu trainieren
Spam-Nachrichten und 1000 Ham-Nachrichten, wenn möglich. Mehr ist besser, aber alles ist vorbei
Etwa 5000 Nachrichten verbessern die Genauigkeit in unseren Tests nicht wesentlich.

Achten Sie darauf, dass Sie aus derselben Quelle trainieren – wenn Sie beispielsweise auf altem Spam trainieren,
aber neue Schinkenpost, dann wird der Klassifikator denken, dass es sich um eine Post mit einem alten Datumsstempel handelt
wahrscheinlich Spam.

Es ist auch erwähnenswert, dass das Training mit einer sehr kleinen Menge Schinken zu Ergebnissen führt
schreckliche Ergebnisse. Sie sollten versuchen, mit mindestens der gleichen Menge zu trainieren (oder mehr, wenn
möglich!) von Ham-Daten als von Spam.

Es ist am besten, den Filter kontinuierlich zu trainieren, um sicherzustellen, dass er frisch ist
Daten, mit denen gearbeitet werden kann. Hierzu gibt es verschiedene Möglichkeiten:

1. Überwachtes Lernen
Das bedeutet, dass Sie eine Kopie aller oder eines Großteils Ihrer E-Mails aufbewahren, getrennt nach Spam und Ham
Stapeln und regelmäßiges Nachtraining mit diesen. Es liefert die besten Ergebnisse, aber
erfordert mehr Arbeit von Ihnen als Benutzer.

(Eine einfache Möglichkeit, dies zu tun, besteht übrigens darin, einen neuen Ordner für „gelöschte“ Nachrichten zu erstellen.
und anstatt sie aus anderen Ordnern zu löschen, verschieben Sie sie stattdessen einfach dorthin.
Bewahren Sie dann sämtlichen Spam in einem separaten Ordner auf und löschen Sie ihn niemals. Solange du dich erinnerst
Um falsch klassifizierte E-Mails in den richtigen Ordnersatz zu verschieben, ist es einfach genug, Schritt zu halten
miteinander ausgehen.)

2. Unüberwachtes Lernen aus der Bayes'schen Klassifikation
Eine andere Möglichkeit zum Trainieren besteht darin, die Ergebnisse des Bayes'schen Klassifikators wieder in den zu verketten
Training, so dass es seine eigenen Entscheidungen stärkt. Dies ist nur sicher, wenn Sie anschließend umschulen
Es basiert auf etwaigen Fehlern, die Sie entdecken.

SpamAssassin unterstützt diese Methode aufgrund experimenteller Ergebnisse nicht
deuten darauf hin, dass es nicht gut funktioniert, und da Bayes nur ein Teil des Ergebnisses ist
Ergebnis, das dem Benutzer präsentiert wird (während Bayes möglicherweise die falsche Entscheidung über a getroffen hat
E-Mail, möglicherweise wurde es von einem anderen System überschrieben).

3. Unüberwachtes Lernen aus den SpamAssassin-Regeln
Wird in SpamAssassin auch als „automatisches Lernen“ bezeichnet. Basierend auf statistischer Analyse der
Mit der SpamAssassin-Erfolgsrate können wir die Bayes'sche Datenbank automatisch trainieren
ein gewisses Maß an Vertrauen, dass unsere Trainingsdaten korrekt sind.

Wenn möglich, sollte es zusätzlich durch eine beaufsichtigte Schulung ergänzt werden.

Dies ist die Standardeinstellung, kann jedoch durch Festlegen der SpamAssassin-Konfiguration deaktiviert werden
Parameter „bayes_auto_learn“ auf 0.

4. Fehlerbasiertes Training
Das bedeutet, dass Sie auf einer kleinen Anzahl von E-Mails trainieren und dann nur auf Nachrichten, die Sie erhalten
SpamAssassin klassifiziert falsch. Das funktioniert, aber es dauert länger, es richtig hinzubekommen
als eine komplette Trainingseinheit.

Nutzen Sie sa-learnp online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad