Dies ist der Befehl ra-index, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
ra-index – Indexdateien zur Verwendung mit Remembrance-Agent-Software
ZUSAMMENFASSUNG
Ra-Index [--version] [-v] [-d] [-s] [ ] [...] [-e
[ ] [...]]
BESCHREIBUNG
Ra-Index und ra-abrufen bilden die Savant-Suchmaschine, eine Informationssuchmaschine
als Back-End für den Remembrance Agent (RA) konzipiert. Gegeben eine Sammlung der des Benutzers
angesammelte E-Mails, Usenet-Nachrichtenartikel, Papiere, gespeicherte HTML-Dateien und andere Textnotizen,
die RA versucht, die Dokumente zu finden, die für die aktuelle des Benutzers am relevantesten sind
Kontext. Das heißt, es durchsucht diese Textsammlung nach den Dokumenten, die die
höchste Wort-für-Wort-Ähnlichkeit mit dem Text, den der Benutzer gerade bearbeitet, in der Hoffnung
dass sie auch eine hohe konzeptionelle Ähnlichkeit aufweisen und somit für den Benutzer nützlich sind
derzeitige Arbeit. Mit dem Emacs-Frontend werden diese Vorschläge kontinuierlich in a
kleiner Puffer am unteren Rand des Benutzerfensters. Wenn ein Vorschlag nützlich erscheint, ist der vollständige
Text kann mit einem einzigen Befehl abgerufen werden.
Der Remembrance Agent arbeitet in zwei Phasen. Zuerst die Sammlung von Textdokumenten des Benutzers
wird in eine im Vektorformat gespeicherte Datenbank indiziert. Nachdem die Datenbank erstellt wurde,
Die andere Phase des Erinnerungsagenten wird von emacs ausgeführt, wo es regelmäßig dauert
Textprobe aus dem Arbeitspuffer und findet die Dokumente aus der Sammlung, die
sind am ähnlichsten. Es fasst die wichtigsten Dokumente in einem kleinen Emacs-Fenster zusammen und ermöglicht Ihnen
um den gesamten Text eines beliebigen mit einem Tastendruck abzurufen. Siehe die README-Datei für
Informationen zur Verwendung des Emacs-Frontends.
Im Kern ist Savant eine Textsuchmaschine, die ein Standard-TF/iDF verwendet
Es verwendet jedoch auch ein Vorlagensystem, um verschiedene Arten von Dokumenten zu erkennen
und extrahieren Sie verschiedene Feldinformationen. Zum Beispiel, Ra-Index kann Betreffzeilen erkennen
und Adressinformationen aus E-Mail-Dateien und archivieren Sie diese Informationen separat. Es kann
Zerlegen Sie auch Dateiarchive in separate Dokumente, z. B. werden RMAIL-Dateien als indiziert
separate E-Mail-Dokumente. Schließlich sind für viele Dokumenttypen Filter definiert
Entfernen Sie überflüssige Informationen wie HTML-Tags, die andernfalls zu Problemen führen könnten
Abruf. Diese sind alle in einer Vorlagenstruktur vorkompiliert. Derzeit ist es nicht gut
dokumentiert, aber falls jemand damit spielen möchte, ist alles in der Quelldatei definiert
templates/conftemplates.c.
Die RA ist in erster Linie als proaktiver Informationsanbieter konzipiert, der kontinuierlich gibt
Sie erhalten Informationen, die für Ihre aktuelle Umgebung relevant sein könnten, aber Savant kann es auch sein
Wird als Standard-Text- und Informationssuchmaschine verwendet.
ANWENDUNG
Zum Indizieren benötigen Sie eine Reihe von Quelltextdateien und ein Verzeichnis, das Savant ablegen kann
Datenbankdateien in. Der Argumente können Dateien oder Verzeichnisse sein. Wenn ein Verzeichnis
befindet sich in der Liste, verwendet Savant seinen gesamten Inhalt und führt eine Rekursion in alle Unterverzeichnisse durch. Nicht-
Textdateien und Sicherungsdateien (die mit ~ angehängt oder mit # vorangestellt sind) werden ignoriert. Es
ignoriert auch Punktdateien (die mit . beginnen) und symbolische Links. Beliebige Dateien bzw
Verzeichnisse, die nach dem optionalen Flag -e angegeben werden, werden ausgeschlossen. Savant wird jedes verwenden
Dateien, die es findet, um eine Datenbank im angegebenen Basisverzeichnis zu erstellen, was bereits geschehen muss
existieren. Das optionale Argument -v (ausführlich) weist Savant an, Sie darüber auf dem Laufenden zu halten
Fortschritt. Also zum Beispiel,
ra-index -v ~/RA-indexes/mail ~/RMAIL ~/Rmail-Dateien -e ~/Rmail-Dateien/Alte-Dateien
wird eine Datenbank in der erstellen ~/RA-indexes/mail Verzeichnis, bestehend aus E-Mails von meinem RMAIL
Datei plus alle Dateien und Unterverzeichnisse von ~/Rmail-Dateien, ausgenommen Dateien und Verzeichnisse
in ~/Rmail-Dateien/Alte-Dateien.
Ra-Index kann Datenbanken in jedem beliebigen Verzeichnis erstellen, aber die Emacs-Schnittstelle für
Remembrance Agent erwartet eine bestimmte Struktur. Für jede Datenbank, die Sie erstellen möchten, Sie
sollte ein Verzeichnis erstellen, und alle diese Verzeichnisse sollten sich im selben übergeordneten Verzeichnis befinden
Verzeichnis. Für den eigenen Gebrauch habe ich zum Beispiel ein Verzeichnis ~/RA-indizes/, und innerhalb dessen
sind die Verzeichnisse ~/RA-indexes/mail/, ~/RA-indices/papers/usw., die tatsächlich enthalten
die Datenbankdateien.
OPTIONAL
-v Ausführlicher Modus. Drucken Sie nützliche Informationen aus.
-d Debug-Modus. Drucken Sie nicht so nützliche Informationen.
-e Schließen Sie alle folgenden Dateinamen und Verzeichnisse aus
-s Folgen Sie bei der Indizierung symbolischen Links
--Version
Versionsinformationen drucken.
Nutzen Sie ra-index online über die Dienste von onworks.net