Aceasta este comanda htdump care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
htdump - scrieți o versiune ASCII-text a bazei de date de documente
REZUMAT
htdump [Opțiuni]
DESCRIERE
Htdump scrie o versiune ASCII-text a bazei de date de documente în aceeași formă ca și
-t opțiunea htdig.
OPŢIUNI
-a Utilizați fișiere de lucru alternative. Spune htdump să adauge .muncă la fișierele bazei de date, permițând
acesta să opereze pe un al doilea set de baze de date.
-c configfile
Utilizați cea specificată configfile în loc de implicit.
-v Modul verbos. Acest lucru nu are prea mult efect.
Fișier Formate
Document Baza de date
Fiecare linie din fișier începe cu ID-ul documentului urmat de o listă de numele domeniului :
valoare separate prin file. Câmpurile apar întotdeauna în ordinea de mai jos:
u URL-ul
t Titlu
a Stare (0 = normal, 1 = negăsit, 2 = neindexat, 3 = învechit)
m Ora ultimei modificări, așa cum este raportată de server
s Dimensiunea în octeți
H Extras
h Descrierea Meta
l Ora ultimei recuperări
L Numărul de link-uri din document (link-uri de ieșire)
b Numărul de link-uri către document (link-uri primite sau backlink-uri)
c HopCount din acest document
g Semnătura documentului utilizat pentru detectarea duplicatelor
e Adresă de e-mail de utilizat pentru un mesaj de notificare de la htnotify
n Data pentru trimiterea unui mesaj e-mail de notificare
S Subiect pentru un mesaj de e-mail de notificare
d Textul link-urilor care indică acest document. (de ex. <a
href="/docURL">descriere )
A Ancore în document (de ex
Cuvânt Baza de date
În timp ce htdump și htload nu se ocupă direct de baza de date de cuvinte, merită
menționându-l aici pentru că trebuie să te ocupi de el când copiați ASCII
baze de date de la un sistem la altul. Baza de date inițială de cuvinte produsă de htdig
este deja în format ASCII și o versiune binară a acesteia este produsă de htmerge, pentru
folosit de htsearch. Deci, atunci când copiați versiunea ASCII a bazei de date de documente
produs de htdump, trebuie să copiați și lista de cuvinte, apoi să rulați htload la
creați baza de date binară a documentelor pe sistemul țintă, urmată de rularea htmerge
pentru a face indexul cuvântului.
Fiecare linie din fișierul listei de cuvinte începe cu cuvântul
urmată de o listă de numele domeniului : valoare separate prin file. Câmpurile apar întotdeauna
în ordinea de mai jos, ultimele două fiind opționale:
i ID document
l Locația cuvântului în document (de la 1 la 1000)
w Greutatea cuvântului pe baza factorilor de notare
c Numărul de apariții ale cuvântului în document, dacă este mai mare de 1
a Număr ancoră dacă cuvântul a apărut după o ancoră numită
Utilizați htdump online folosind serviciile onworks.net