EnglischFranzösischSpanisch

OnWorks-Favicon

indexer – Online in der Cloud

Führen Sie den Indexer im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehlsindexer, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


indexer – Sphinxsearch-Volltextindexgenerator

ZUSAMMENFASSUNG


Indexer [--config KONFIGURATIONSDATEI] [--rotate] [--noprogress | --quiet] [--all | INDEX | ...]

Indexer --buildstops AUSGABEDATEI ANZAHL [--config KONFIGURATIONSDATEI] [--noprogress | --ruhig]
[--all | INDEX | ...]

Indexer --verschmelzen MAIN_INDEX DELTA_INDEX [--config KONFIGURATIONSDATEI] [--rotate] [--noprogress |
--ruhig]

BESCHREIBUNG


Sphinx ist eine Sammlung von Programmen, die eine qualitativ hochwertige Volltextsuche ermöglichen sollen.

Indexer ist das erste der beiden Hauptwerkzeuge von Sphinx. Wird entweder von der aufgerufen
Befehlszeile direkt oder als Teil eines größeren Skripts, Indexer ist allein verantwortlich für
Sammeln der durchsuchbaren Daten.

Die Aufrufsyntax für den Indexer lautet wie folgt:

$ indexer [OPTIONEN] [indexname1 [indexname2 [...]]]

Im Wesentlichen würden Sie die verschiedenen möglichen Indizes auflisten (die Sie später erstellen würden).
für die Suche verfügbar) in sphinx.conf, also beim Aufruf Indexer, das müssen Sie zumindest sein
Sagen Sie ihm, welchen Index (oder welche Indizes) Sie indizieren möchten.

Wenn sphinx.conf Details zu zwei Indizes enthielt, mybigindex und mysmallindex, du könntest es tun
die folgende:

$ indexer mybigindex
$ indexer mysmallindex mybigindex

Als Teil der Konfigurationsdatei sphinx.conf geben Sie einen oder mehrere Indizes für Ihre an
Daten. Du könntest anrufen Indexer um einen von ihnen ad hoc neu zu indizieren, oder Sie können ihn anweisen, ihn zu verarbeiten
alle Indizes – Sie sind nicht darauf beschränkt, nur einen oder alle auf einmal aufzurufen, Sie können jederzeit auswählen
eine Kombination der verfügbaren Indizes.

OPTIONAL


Die meisten Optionen für Indexer sind jedoch in der Konfigurationsdatei angegeben
sind einige Optionen, die Sie möglicherweise auch in der Befehlszeile angeben müssen, da sie Auswirkungen haben können
wie der Indizierungsvorgang durchgeführt wird. Diese Optionen sind:

--alle
Tells Indexer um jeden in sphinx.conf aufgeführten Index zu aktualisieren, anstatt ihn aufzulisten
einzelne Indizes. Dies wäre in kleinen Konfigurationen oder vom Cron-Typ oder nützlich
Wartungsjobs, bei denen der gesamte Indexsatz jeden Tag, jede Woche oder neu erstellt wird
welcher Zeitraum am besten ist.

Beispielverwendung:

$ indexer --config /home/myuser/sphinx.conf --all

--buildstops outfile.txt NUM
Überprüft die Indexquelle, als ob sie die Daten indizieren würde, und erstellt eine Liste der
Begriffe, die indiziert werden. Mit anderen Worten: Es wird eine Liste aller durchsuchbaren Elemente erstellt
Begriffe, die in den Index aufgenommen werden. Notiz; Der Index wird nicht aktualisiert
Frage, es verarbeitet die Daten einfach „so, als ob“ sie indiziert würden, einschließlich der Ausführung
Abfragen definiert mit sql_query_pre or sql_query_post. Die Datei „outputfile.txt“ enthält die Datei
Liste von Wörtern, eines pro Zeile, sortiert nach Häufigkeit, wobei die häufigsten zuerst stehen, und NUM
gibt die maximale Anzahl der Wörter an, die aufgelistet werden; wenn ausreichend groß, um
Jedes Wort im Index umfassen, es werden nur so viele Wörter zurückgegeben. So ein
Die Wörterbuchliste könnte für Clientanwendungsfunktionen rund um „Meinten Sie…“ verwendet werden.
Funktionalität, normalerweise in Verbindung mit --buildfreqs, Unten.

Ejemplo:

$ indexer myindex --buildstops word_freq.txt 1000

Dies würde ein Dokument im aktuellen Verzeichnis, word_freq.txt, mit der Zahl 1,000 erzeugen
Die häufigsten Wörter in „myindex“, sortiert nach den häufigsten Wörtern zuerst. Beachten Sie, dass die Datei
beziehen sich auf den zuletzt indizierten Index, wenn sie mit mehreren Indizes angegeben werden oder --alle (dh
der letzte in der Konfigurationsdatei aufgeführte)

--buildfreqs
Verwendet in Paar mit --buildstops (und wird ignoriert, wenn --buildstops ist nicht angegeben). Als
--buildstops stellt die Liste der im Index verwendeten Wörter bereit, --buildfreqs fügt die hinzu
Menge im Index vorhanden ist, was hilfreich wäre, um festzustellen, ob sicher
Wörter sollten als Stoppwörter betrachtet werden, wenn sie zu häufig vorkommen. Es wird auch dabei helfen
Entwicklung von „Meinten Sie...“-Funktionen, mit denen Sie feststellen können, wie viel häufiger ein bestimmtes Wort vorkommt
im Vergleich zu einem anderen, ähnlichen.

Ejemplo:

$ indexer myindex --buildstops word_freq.txt 1000 --buildfreqs

Dies würde die Datei „word_freq.txt“ wie oben erzeugen, jedoch nach jedem Wort die Datei „
wie oft es im betreffenden Index vorkam.

--config KONFIGRIEREN, -c KONFIGURATIONSDATEI
Verwenden Sie die angegebene Datei als Konfiguration. Normalerweise wird in der Datei nach sphinx.conf gesucht
Installationsverzeichnis (z. B./usr/local/sphinx/etc/sphinx.conf, falls in installiert).
/usr/local/sphinx), gefolgt vom aktuellen Verzeichnis, in dem Sie sich beim Aufruf des Indexers befinden
aus der Schale. Dies wird am häufigsten in gemeinsam genutzten Umgebungen verwendet, in denen sich die Binärdateien befinden
irgendwo wie /usr/local/sphinx/ installiert, aber Sie möchten Benutzern Folgendes zur Verfügung stellen
Möglichkeit, ihre eigenen benutzerdefinierten Sphinx-Setups zu erstellen oder mehrere davon auszuführen
Instanzen auf einem einzelnen Server. In solchen Fällen könnten Sie ihnen erlauben, ihre eigenen zu erstellen
eigene sphinx.conf-Dateien und übergebe sie an Indexer mit dieser Option.

Beispielsweise:

$ indexer --config /home/myuser/sphinx.conf meinindex

--dump-rows FILE
Speichert von SQL-Quellen abgerufene Zeilen in einer MySQL-kompatiblen Datei in der angegebenen Datei
Syntax. Die resultierenden Dumps stellen die exakte Darstellung der Daten dar, wie sie vom Indexer empfangen wurden
und helfen, sich wiederholende Probleme mit der Indizierungszeit zu vermeiden.

--verschmelzen DST-INDEX SRC-INDEX
Führen Sie zwei Indizes physisch zusammen. Wenn Sie beispielsweise ein Haupt-Delta-Schema haben,
wobei sich der Hauptindex selten ändert, der Deltaindex jedoch häufig neu erstellt wird, und
--verschmelzen würde verwendet werden, um beides zu kombinieren. Die Bedienung bewegt sich von rechts nach links – die
Inhalt von SRC-INDEX Lassen Sie sich untersuchen und körperlich mit dem Inhalt kombinieren
DST-INDEX und das Ergebnis bleibt drin DST-INDEX. In Pseudocode könnte es ausgedrückt werden
als: DST-INDEX += SRC-INDEX

Ein Beispiel:

$ indexer --merge main delta --rotate

Im obigen Beispiel ist der Hauptindex der Master, der selten geänderte Index und Delta
ist die seltener geänderte Variante, Sie können die obige Bezeichnung verwenden, um sie aufzurufen Indexer zu
Kombinieren Sie den Inhalt des Deltas im Hauptindex und rotieren Sie die Indizes.

--merge-dst-range ATTR MIN MAX
Führen Sie den beim Zusammenführen angegebenen Filterbereich aus. Insbesondere, wenn die Zusammenführung auf die angewendet wird
Zielindex (als Teil von --verschmelzen, und wird ignoriert, wenn --verschmelzen ist nicht angegeben),
Indexer filtert auch nur die Dokumente, die im Zielindex landen
Dokumente durchlaufen den angegebenen Filter und landen im endgültigen Index. Das
könnte beispielsweise in einem Index verwendet werden, in dem es ein „gelöschtes“ Attribut gibt, wobei 0 ist
bedeutet „nicht gelöscht“. Ein solcher Index könnte zusammengeführt werden mit:

$ indexer --merge main delta --merge-dst-range gelöscht 0 0

Alle als gelöscht markierten Dokumente (Wert 1) werden aus der neu zusammengeführten Datei entfernt
Zielindex. Es kann mehrmals zur Befehlszeile hinzugefügt werden, um es hinzuzufügen
Aufeinanderfolgende Filter für die Zusammenführung, die alle erfüllt sein müssen, damit ein Dokument erstellt werden kann
werden Teil des endgültigen Index.

--merge-killlists, --merge-klists
Verwendet in Paar mit --verschmelzen. Normalerweise beim Zusammenführen Indexer Verwendet die Kill-Liste des Quellindex
(d. h. dasjenige, mit dem zusammengeführt wird) als Filter zum Löschen der übereinstimmenden Dokumente
der Zielindex. Gleichzeitig ist die Kill-Liste des Ziels selbst nicht vorhanden
überhaupt berührt. Beim Benutzen --merge-killlists, (oder es kürzere Form --merge-klists) das
Indexer filtert die dst-index-Dokumente nicht mit src-index killlist, führt sie jedoch zusammen
ihre Kill-Listen zusammen, so dass der endgültige Ergebnisindex die Kill-Liste enthält
enthält die Kill-Listen der zusammengeführten Quellen.

--keine Fortschritte
Zeigen Sie keine Fortschrittsdetails an, sobald sie auftreten. Stattdessen werden die endgültigen Statusdetails (wie z
Wie Dokumente indexiert werden, wie schnell die Indexierung ist usw. werden erst nach Abschluss gemeldet
Indizierung. In Fällen, in denen das Skript nicht auf einer Konsole (oder „tty“) ausgeführt wird, ist dies der Fall
wird standardmäßig aktiviert sein.

Beispielverwendung:

$ indexer --rotate --all --noprogress

--print-queries
Druckt SQL-Abfragen aus, die der Indexer zusammen mit der SQL-Verbindung an die Datenbank sendet
und Trennungsereignisse. Dies ist nützlich, um Probleme mit SQL zu diagnostizieren und zu beheben
Quellen.

--ruhig
Tells Indexer nichts auszugeben, es sei denn, es liegt ein Fehler vor. Auch hier wird es am häufigsten verwendet
Cron-Typ oder andere Skriptjobs, bei denen die Ausgabe irrelevant oder unnötig ist, außer
im Falle eines Fehlers.

Beispielverwendung:

$ indexer --rotate --all --quiet

--drehen
Wird für rotierende Indizes verwendet. Es sei denn, Sie haben die Situation, dass Sie die Suche durchführen können
Offline funktionieren, ohne die Benutzer zu stören, müssen Sie mit ziemlicher Sicherheit beibehalten
Die Suche wird ausgeführt, während neue Dokumente indiziert werden. --drehen erstellt einen zweiten Index,
parallel zum ersten (an der gleichen Stelle, einfach .new in die Dateinamen einfügen).
Einmal abgeschlossen, Indexer benachrichtigt gesucht durch Versenden der SEUFZEND Signal und gesucht
wird versuchen, die Indizes umzubenennen (die vorhandenen so umzubenennen, dass sie .old und enthalten).
Umbenennen der .new-Datei, um sie zu ersetzen) und dann mit der Bereitstellung aus den neueren Dateien beginnen.
Abhängig von der Einstellung von Seamless_rotate, kann es zu einer leichten Verzögerung kommen
um die neueren Indizes zu durchsuchen.

Beispielverwendung:

$ indexer --rotate --all

--sighup-each
ist nützlich, wenn Sie viele große Indizes neu erstellen und in jeden einzelnen rotieren möchten
gesucht so schnell wie möglich. Mit --sighup-each, Indexer werde eine senden SEUFZEND signalisieren
gesucht nach erfolgreichem Abschluss der Arbeit an jedem Index. (Das Standardverhalten ist
eine Single verschicken SEUFZEND nachdem alle Indizes erstellt wurden.)

- ausführlich
Garantiert, dass jede Zeile, die Probleme bei der Indizierung verursacht hat (doppelt, null oder fehlt).
Dokument Identifikation; oder Dateifeld-E/A-Probleme; usw.) werden gemeldet. Standardmäßig ist diese Option
ist deaktiviert und stattdessen können Problemzusammenfassungen gemeldet werden.

Verwenden Sie den Indexer online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad