Jest to polecenie hxpipe, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
hxpipe - konwertuje plik XML do formatu łatwiejszego do analizy w Perlu lub AWK
STRESZCZENIE
hxpipe [ -l ] [ -- ] [ plik-lub-URL ]
OPIS
hxpipe analizuje plik HTML lub XML i generuje jego liniową reprezentację
dobrze nadaje się do dalszej obróbki narzędziami AWK lub podobnymi. Format jest podobny do
ESIS (zestaw informacji o strukturze elementu), który jest wyprowadzany przez nsgmls/onsgmls.
Operację odwrotną, czyli konwersję z powrotem na marżę, wykonuje funkcja hxunpipe program.
Format wyjściowy jest następujący:
Komentarze są wyświetlane jako
*komentarz
Oznacza to, że jest to pojedyncza linia zaczynająca się od „*”, po której następuje tekst komentarza. Linia
kanały, znaki powrotu karetki i tabulatory w tekście są zapisywane jako „\n”, „\r” i „\t”,
odpowiednio. Zapisany jest tekst wyglądający jak znak numeryczny
znak „&” zastąpiony przez „\”. Linia kończy się przesunięciem linii.
Należy pamiętać, że onsgmls wyświetla komentarze zaczynające się od „_” zamiast „*” i
nie zastępuje „&” znaków numerycznych przez „\” (i domyślnie
całkowicie pomija komentarze).
Instrukcje przetwarzania są wyprowadzane jako
?Instrukcja przetwarzania
Oznacza to, że pojedyncza linia zaczyna się od „?” po którym następuje tekst przetwarzania
instrukcja. Tekst jest zmieniony jak w komentarzach (patrz wyżej).
<!DOCTYPE root PUBLIC "-//foo//DTD bar//EN" "http://example.org/dtd">
DOCTYPE są wyprowadzane jako jeden z następujących:
!root "-//foo//DTD bar//EN" http://example.org/dtd
!root "-//foo//DTD bar//EN"
!źródło "" http://example.org/dtd
!źródło ""
odpowiednio dla: DOCTYPE z (1) identyfikatorem publicznym i systemowym, (2)
tylko identyfikator publiczny, (3) tylko identyfikator systemowy lub (4) żadne z nich
dwa. Oznacza to, że pojedyncza linia zaczyna się od „!”, po której następuje spacja i ewentualnie
pusty ciąg znaków w cudzysłowie, po którym opcjonalnie następuje spacja i dowolny tekst. Zanotuj
cudzysłowy dla identyfikatora publicznego i brak cudzysłowów dla systemu
identyfikator.
Znacznik początkowy jest wyprowadzany jako
Wartość CDATA Aatt1 1
Wartość CDATA Aatt2 2
(ewent
Tj. zero lub więcej linii dla atrybutów i jedna linia dla elementu
typ. Każdy wiersz atrybutu zaczyna się od litery „A”, po której następuje nazwa atrybutu
atrybut, spację, ciąg literału „CDATA”, kolejną spację i atrybut
wartość. Tekst wartości atrybutu jest znakowany zmianą, jak w komentarzach (patrz wyżej).
Linia określająca typ elementu zaczyna się od „(”, po którym następuje typ elementu.
hxpipe nie czyta DTD i zakłada, że atrybuty są zawsze CDATA. Nigdy
generuje inne typy (IMPLIED, TOKEN, ID itp.), w przeciwieństwie do onsgmls.
Znaczniki końcowe są wyprowadzane jako
) el
Tj. jako linia rozpoczynająca się od „)”, po którym następuje typ elementu.
Puste elementy (w formacie XML) są wyprowadzane jako
Aatt1 Wartość CDATA 1
Aatt2 Wartość CDATA 2
|pusty
Tj. jako zero lub więcej linii dla atrybutów i jedna linia rozpoczynająca się od „|”
po którym następuje typ elementu.
Należy pamiętać, że onsgmls nigdy nie wyświetla „|”. (Jednak opcjonalnie może wyprowadzić linię
składający się z pojedynczego „e” tuż przed linią „(”, aby wskazać, że
element jest pusty.)
tekst Tekst jest wyprowadzany jako
-tekst
Tj. jako pojedyncza linia rozpoczynająca się od „-”. Tekst jest pomijany, jak w przypadku komentarzy
(patrz wyżej).
Numery linii
Podczas -l opcja jest aktywna, hxpipe przeplata dane wyjściowe liniami
formy
L12
gdzie „12” zastępuje się numerem wiersza w źródle, w którym następuje następne wyjście
pochodzi z.
hxpipe nie normalizuje danych wejściowych i nie dodaje brakujących znaczników. Możliwe jest zatem, że
liczba linii „(” i „)” jest nierówna. Jeśli ważne jest, aby każdy tag początkowy był
dopasowane przez znacznik końcowy, potokuj dane wejściowe hxnormalizuj -x pierwszy.
OPCJE
Obsługiwane są następujące opcje:
-l Dodaj linie „L” do wyniku, aby wskazać numery linii w źródle.
OPERANDY
Obsługiwany jest następujący operand:
plik-lub-URL
Nazwa lub adres URL pliku HTML. Jeśli nie ma, zamiast tego czytane jest standardowe wejście.
EXIT STATUS
Zwracane są następujące wartości wyjściowe:
0 Pomyślne.
> 0 Wystąpił błąd podczas analizowania pliku HTML. hxpipe spróbuje poprawić
błąd i mimo to wygeneruj dane wyjściowe.
ŚRODOWISKO
Aby użyć proxy do pobierania zdalnych plików, ustaw zmienne środowiskowe http Proxy i
ftp_proxy. Np, http_proxy="http://localhost:8080/"
Użyj hxpipe online, korzystając z usług onworks.net