To jest polecenie html2text, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS
PROGRAM:
IMIĘ
html2text - zaawansowany konwerter HTML na tekst
STRESZCZENIE
tekst html2 -Pomoc
tekst html2 -wersja
tekst html2 [ -przeanalizuj | -czek ] [ -debug-skaner ] [ -debug-parser ] [ -plik rc ścieżka ] [
-Style ( kompaktowy | bardzo ) ] [ -szerokość szerokość ] [ -o plik wyjściowy ] [ -Nobs ] [ -asci |
-utf8 ] [ -nometa ] [ plik-wejściowy ...]
OPIS
tekst html2 odczytuje dokumenty HTML z plik-wejściowys, formatuje każdy z nich w strumień
znaki tekstowe i wypisuje wynik na standardowe wyjście (lub na plik wyjściowyJeśli
dotychczasowy -o używana jest opcja wiersza poleceń).
Jeśli nie plik-wejściowys są podane w wierszu poleceń, tekst html2 odczytuje ze standardowego wejścia.
Myślnik jako plik-wejściowy to alternatywny sposób określania standardowego wejścia.
tekst html2 rozumie wszystkie konstrukcje HTML 3.2, ale może renderować tylko ich część ze względu na
ograniczenia formatu wyjściowego tekstu. Jednak program stara się zapewnić dobre
substytuty elementów, których nie może renderować. tekst html2 analizuje również dane wejściowe HTML 4, ale
nie zawsze tak skuteczne, jak inne procesory HTML. Akceptuje również niepoprawną składnię
danych wejściowych i próbuje je zinterpretować „rozsądnie”.
Droga tekst html2 formaty dokumenty HTML są kontrolowane przez właściwości formatowania read
z pliku RC. tekst html2 próbuje czytać $HOME/.html2textrc (lub plik określony przez
dotychczasowy -plik rc opcja wiersza poleceń); jeśli tego pliku nie można odczytać, tekst html2 próbuje czytać
/etc/html2textrc. Jeśli nie można odczytać żadnego pliku RC (lub jeśli plik RC nie zastępuje wszystkich)
formatowania), to zakładane są „rozsądne” wartości domyślne. Format pliku RC to
opisane w html2textrc(5) strona podręcznika.
Wersja Debiana tekst html2 może również wykonać przekodowanie wejścia i wyjścia (patrz
/usr/share/doc/html2text/README.Debian, aby uzyskać więcej informacji). tekst html2 próbuje pobrać kodowanie
z dokumentu HTML. Jeśli kodowanie nie jest określone, możesz użyć -asci i -utf8 opcje.
Dane wyjściowe są konwertowane na zestaw znaków regionalnych użytkownika (LC_CTYPE).
OPCJE
-nometa
Domyślnie wersja Debiana tekst html2 użyj znacznika „meta http-equiv” do wprowadzania danych
przekodowywanie. Ta opcja anuluje to zachowanie.
-asci Domyślnie, kiedy -nometa jest zaopatrywany, tekst html2 zastosowania UTF-8 na wyjściu.
Określanie tej opcji, zwykłe ASCII jest używany zamiast tego. Aby dowiedzieć się, jak nie-ASCII
znaki są renderowane, patrz plik "ascii.substitutes".
-utf8 Domyślnie, kiedy -nometa jest zaopatrywany, tekst html2 zastosowania ISO 8859-1 dla danych wejściowych.
Określając tę opcję, UTF-8 jest używany zamiast tego (zarówno dla danych wejściowych, jak i wyjściowych). Ten
opcja implikuje -Nobs.
-czek Ta opcja służy do celów diagnostycznych: dokument HTML jest tylko analizowany, a nie
przetwarzane w inny sposób. W tym trybie pracy tekst html2 zgłosi się na parsowanie
błędy i błędy skanowania, których nie ma w innych trybach pracy. Zauważ, że
Błędy parsowania i skanowania nie są krytyczne dla tekst html2, ale może powodować błędną interpretację
kodu HTML i/lub części połkniętego dokumentu.
-debug-parser
Niech tekst html2 raport o przesuwanych tokenach, stosowanych zasadach itp., podczas gdy
skanowanie dokumentu HTML. Ta opcja służy do celów diagnostycznych.
-debug-skaner
Niech tekst html2 raport o każdym zeskanowanym tokenie leksykalnym podczas skanowania kodu HTML
dokument. Ta opcja służy do celów diagnostycznych.
-Pomoc Wydrukuj podsumowanie wiersza poleceń i zakończ.
-Nobs Domyślnie oryginalny tekst html2 renderuje podkreślone litery z sekwencjami takimi jak
„podkreślenie-znak-backspace-” i pogrubione litery, takie jak „znak-cofnięcie-
charakter”. Z powodu problemów z UTF-8, wersja Debiana tekst html2 nie
produkują cofnięcia, więc ta opcja tak naprawdę nic nie robi.
-o plik wyjściowy
Zapisz wynik do plik wyjściowy zamiast standardowego wyjścia. Myślnik jako
plik wyjściowy jest alternatywnym sposobem określenia wyjścia standardowego.
-plik rc ścieżka
Spróbuj odczytać plik określony w ścieżka jako plik RC.
-Style ( kompaktowy | bardzo )
Styl bardzo zmienia niektóre domyślne wartości parametrów formatowania
udokumentowane w html2textrc(5). Aby dowiedzieć się, który i w jaki sposób parametr formatowania
domyślne są zmienione, sprawdź plik "pretty.style". Jeśli ta opcja zostanie pominięta,
styl kompaktowy przyjmuje się domyślnie.
-przeanalizuj
Ta opcja służy do celów diagnostycznych: Zamiast formatować analizowany dokument,
generować kod HTML, który gwarantuje poprawność składniową. Gdyby tekst html2
ma problemy z parsowaniem niepoprawnego składniowo dokumentu HTML, ta opcja może pomóc
żeby zrozumieć co tekst html2 myśli, że oryginalny kod HTML oznacza.
-wersja
Wydrukuj wersję programu i wyjdź.
-szerokość szerokość
Domyślnie tekst html2 formatuje dokumenty HTML dla szerokości ekranu 79
postacie. Jeśli przekierowujesz wyjście do pliku lub jeśli twój terminal ma szerokość
inne niż 80 znaków lub jeśli chcesz tylko zorientować się, jak to zrobić tekst html2 Promocje
przy dużych tabelach i różnych szerokościach zacisków możesz chcieć określić
różne szerokość.
Korzystaj z html2text online za pomocą usług onworks.net