Dies ist der Befehl estwaver, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
estwaver – Befehlszeilenschnittstelle des Webcrawlers
ZUSAMMENFASSUNG
estwaver init [-apn|-acc] [-xs|-xl|-xh] [-sv|-si|-sa] Rootdir
estwaver kriechen [-restart|-revisit|-revcont] Rootdir
estwaver Gerätetest Rootdir
estwaver holen [-proxy Hostr Hafen] [-Schlepper Anzahl] [-il lang] URL
BESCHREIBUNG
estwaver ist eine Ansammlung von Unterbefehlen. Der Name eines Unterbefehls wird durch angegeben
erstes Argument. Andere Argumente werden entsprechend jedem Unterbefehl analysiert. Das Argument
Rootdir Gibt das Crawler-Stammverzeichnis an, das die Konfigurationsdatei usw. enthält.
estwaver init [-apn|-acc] [-xs|-xl|-xh] [-sv|-si|-sa] Rootdir
Erstellen Sie das Crawler-Stammverzeichnis.
If -apn angegeben ist, wird die N-Gramm-Analyse auch für europäischen Text durchgeführt.
If - gem angegeben ist, wird anstelle der N-Gramm-Analyse eine Zeichenkategorieanalyse durchgeführt
Analyse.
If -xs angegeben ist, wird der Index so optimiert, dass weniger als 50000 Dokumente registriert werden.
If -xl angegeben ist, ist der Index auf die Registrierung von mehr als 300000 Dokumenten abgestimmt.
If -xh angegeben ist, ist der Index auf die Registrierung von mehr als 1000000 Dokumenten abgestimmt.
If -sv angegeben ist, werden die Ergebnisse als ungültig gespeichert.
If -Ja angegeben ist, werden die Ergebnisse als 32-Bit-Ganzzahl gespeichert.
If -Sa angegeben ist, werden die Partituren unverändert gespeichert und markiert, damit sie nicht angepasst werden können
Suche.
estwaver kriechen [-restart|-revisit|-revcont] Rootdir
Fangen Sie an zu kriechen.
If -neu starten angegeben ist, wird das Crawlen ab den Seed-Dokumenten neu gestartet.
If - erneut besuchen angegeben wird, werden gesammelte Dokumente erneut gesichtet.
If -revcont angegeben wird, werden die gesammelten Dokumente erneut durchsucht und anschließend gecrawlt
Fortsetzung.
estwaver Gerätetest Rootdir
Führen Sie Unit-Tests durch.
estwaver holen [-proxy Hostr Hafen] [-Schlepper Anzahl] [-il lang] URL
Holen Sie sich ein Dokument.
URL Gibt die URL eines Dokuments an.
-Proxy Gibt den Hostnamen und die Portnummer des Proxyservers an.
-Schlepper Gibt den Timeout in Sekunden an.
es Gibt die bevorzugte Sprache an. Standardmäßig ist es Englisch.
Alle Unterbefehle geben 0 zurück, wenn der Vorgang erfolgreich ist, andernfalls 1. Ein laufender Crawler
schließt das Schließen der Datenbank ab, wenn das Signal 1 (SIGHUP), 2 (SIGINT), 3 empfangen wird
(SIGQUIT) oder 15 (SIGTERM).
Wenn das Crawlen abgeschlossen ist, gibt es ein Verzeichnis _Index im Root-Verzeichnis des Crawlers. Es ist
ein Index verfügbar von estcmd und so weiter.
Nutzen Sie estwaver online über die Dienste von onworks.net