Dies ist der Befehl httpindex, der beim kostenlosen Hosting-Anbieter OnWorks über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
httpindex – HTTP-Frontend für den SWISH++-Indexer
ZUSAMMENFASSUNG
wget [ Optionen ] URL ... 2> & 1 | httpindex [ Optionen ]
BESCHREIBUNG
httpindex ist ein Frontend für index++(1) um Dateien zu indizieren, die von Remote-Servern kopiert wurden
wget(1). Die Dateien (in einer Kopie der Remote-Verzeichnisstruktur) können behalten, gelöscht oder werden
nach der Indizierung durch ihre Beschreibungen ersetzt.
OPTIONAL
wget Optionen
Die wget(1) Optionen, die es gibt falls angefordert sind: -A, -nv, -r und -x; diejenigen, die es sind hoch
empfohlen sind: -l, -nh, -t und -w. (Siehe das BEISPIEL.)
httpindex Optionen
httpindex akzeptiert die gleichen kurzen Optionen wie index++(1) außer -H, -I, -l, -r, -S und
-V.
Die folgenden Optionen gelten nur für httpindex:
-d Ersetzen Sie anschließend den Text lokaler Kopien der abgerufenen Dateien durch deren Beschreibungen
sie wurden indiziert. Dies ist nützlich, um Dateibeschreibungen in der Suche anzuzeigen
Ergebnisse, ohne dass vollständige Kopien der Remote-Dateien vorhanden sein müssen und somit gespeichert werden
Speicherplatz im Dateisystem. (Siehe die Funktion extract_description() in WWW(3) für Details
darüber, wie Beschreibungen extrahiert werden.)
-D Löschen Sie die lokalen Kopien der abgerufenen Dateien, nachdem sie indiziert wurden. Das
verhindert, dass sich Ihr lokales Dateisystem mit Kopien entfernter Dateien füllt.
BEISPIEL
So indizieren Sie alle HTML- und Textdateien auf einem Remote-Webserver und behalten die Beschreibungen lokal bei:
wget -A html,txt -linf -t2 -rxnv -nh -w2 http://www.foo.com 2>&1 |
httpindex -d -e'html:*.html,text:*.txt'
Beachten Sie, dass Sie umleiten müssen wget(1)'s Ausgabe vom Standardfehler zur Standardausgabe in
um es weiterzuleiten httpindex.
EXIT STATUS
Wird nur dann mit dem Wert Null beendet, wenn die Indizierung erfolgreich abgeschlossen wurde. andernfalls ungleich Null.
VORSICHTEN
Zusätzlich zu denen für index++(1) httpindex geht mit der Verwendung von nicht richtig um
mehrere -e, -E, -m, oder auch -M Optionen (da das Perl-Skript den Standard GetOpt::Std verwendet
Paket zur Verarbeitung von Befehlszeilenoptionen, das dies nicht tut). Das letzte davon
Optionen „gewinnt.“
Die Problemumgehung besteht darin, für diese Optionen mehrere Werte zu verwenden, die durch Kommas getrennt sind
einzelne dieser Optionen. Wenn Sie zum Beispiel Folgendes tun möchten:
httpindex -e'html:*.html' -e'text:*.txt'
mach das stattdessen:
httpindex -e'html:*.html,text:*.txt'
Verwenden Sie httpindex online über die Dienste von onworks.net