To jest polecenie pdf2htmlEX, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS
PROGRAM:
IMIĘ
pdf2htmlEX - konwertuje PDF na HTML bez utraty tekstu i formatu.
ZASTOSOWANIE
pdf2htmlEX [opcje] [ ]
OPIS
pdf2htmlEX to narzędzie, które konwertuje pliki PDF na pliki HTML.
pdf2htmlEX stara się jak najlepiej renderować plik PDF, zachowując odpowiednią stylizację, podczas gdy
zachowywanie tekstu i optymalizacja pod kątem sieci Web.
Czcionki są wyodrębniane z pliku PDF, a następnie osadzane w HTML, tekst w przekonwertowanym pliku HTML
jest zwykle wybieralny i kopiowalny.
Inne obiekty są renderowane jako obrazy, a także osadzane.
OPCJE
O Nas
-F, --pierwsza strona (Domyślny: 1)
Określ pierwszą stronę do przetworzenia
-ja, --Ostatnia strona (Domyślny: trwać strona)
Określ ostatnią stronę do przetworzenia
Wymiary
--Powiększenie , --dopasuj szerokość , --dopasuj-wysokość
--zoom określa bezpośrednio współczynnik powiększenia; --fit-szerokość/wysokość określa maksimum
szerokość/wysokość strony, wartości podane są w pikselach.
W przypadku podania wielu wartości zostanie użyta minimalna.
Jeśli nie zostanie określony, strony będą renderowane w rozdzielczości 72DPI.
--użyj-cropbox <0|1> (Domyślny: 1)
Użyj CropBox zamiast MediaBox do wyjścia.
--HDPI , --vdpi (Domyślny: 144)
Określ poziome i pionowe DPI dla obrazów
Wydajność
--osadzać
--embed-css <0|1> (Domyślny: 1)
--embed-czcionka <0|1> (Domyślny: 1)
--osadź obraz <0|1> (Domyślny: 1)
--embed-javascript <0|1> (Domyślny: 1)
--umieszczanie-konspektu <0|1> (Domyślny: 1)
Określ, które elementy powinny być osadzone w wyjściowym pliku HTML.
Jeśli ta opcja jest wyłączona, oddzielne pliki będą generowane wraz z plikiem HTML dla
odpowiednie elementy.
--embed przyjmuje jako argument ciąg. Każda litera ciągu musi być jedną z
`cCfFiIjJoO`, który odpowiada jednemu z przełączników --embed-***. Małe litery
litery dla 0 i wielkie litery dla 1. Na przykład `--embed cFIJo` oznacza to
osadź wszystko oprócz plików CSS i konturów.
--podzielone strony <0|1> (Domyślny: 0)
Po włączeniu zawartość każdej strony jest przechowywana w osobnym pliku.
Ten przełącznik jest przydatny, jeśli chcesz, aby strony były ładowane oddzielnie i dynamicznie -- a
może być konieczny serwer pomocniczy.
Zobacz także --page-filename.
--dest-dir (Domyślny: .)
Określ folder docelowy.
--nazwa-pliku-css (Domyślny: )
Określ nazwę pliku wygenerowanego pliku css, jeśli nie jest osadzony.
Jeśli jest pusty, nazwa pliku zostanie określona automatycznie.
--nazwa-pliku-strony (Domyślny: )
Określ szablon nazwy pliku dla stron, gdy --split-pages wynosi 1
Symbol zastępczy %d może być zawarty w `filename`, aby wskazać, gdzie jest numer strony
powinno być umieszczone. Symbol zastępczy obsługuje ograniczony podzbiór normalnych liczb
symbole zastępcze, w tym określona szerokość i dopełnienie zerowe.
Jeśli `filename` nie zawiera symbolu zastępczego dla numeru strony, numer strony
zostanie wstawiony bezpośrednio przed rozszerzeniem pliku. Jeśli nazwa pliku nie ma
rozszerzenie, numer strony zostanie umieszczony na końcu nazwy pliku.
Jeśli nie podano --page-filename, zostanie użyty do wyjścia
nazwę pliku, zastępując rozszerzenie na .page i bezpośrednio dodając numer strony
przed rozszerzeniem.
Przykłady
pdf2htmlEX --podzielone strony 1 foo.pdf
Uzyskuje pliki stronicowe foo1.page, foo2.page itp.
pdf2htmlEX --podzielone strony 1 foo.pdf --nazwa-pliku-strony bar.baz
Uzyskuje pliki stron bar1.baz, bar2.baz itp.
pdf2htmlEX --podzielone strony 1 foo.pdf --nazwa-pliku-strony strona%dbar.baz
Uzyskuje pliki stron page1bar.baz, page2bar.baz itp.
pdf2htmlEX --podzielone strony 1 foo.pdf --nazwa-pliku-strony bar%03d.baz
Uzyskuje pliki stron bar001.baz, bar002.baz itp.
--nazwa-pliku-konspektu (Domyślny: )
Określ nazwę pliku wygenerowanego pliku konspektu, jeśli nie jest osadzony.
Jeśli jest pusty, nazwa pliku zostanie określona automatycznie.
--proces-nietekst <0|1> (Domyślny: 1)
Czy przetwarzać obiekty nietekstowe (jako obrazy)
--zarys procesu <0|1> (Domyślny: 1)
Czy pokazywać zarys w wygenerowanym kodzie HTML
--adnotacja-procesu <0|1> (Domyślny: 0)
Czy wyświetlać adnotację w wygenerowanym kodzie HTML
--proces-formularz <0|1> (Domyślny: 0)
Czy uwzględniać pola tekstowe i przyciski opcji w wygenerowanym kodzie HTML
--druk <0|1> (Domyślny: 1)
Włącz obsługę drukowania. Wyłączenie tej opcji może zmniejszyć rozmiar CSS.
--powrót <0|1> (Domyślny: 0)
Wyjście w trybie awaryjnym, dla lepszej dokładności i kompatybilności z przeglądarkami, ale
rozmiar staje się większy.
--tmp-limit-rozmiaru-pliku (Domyślny: -1)
Ogranicza to całkowity rozmiar (w KB) plików tymczasowych, co również ogranicza
całkowity rozmiar pliku wyjściowego. To jest oszacowanie i zatrzyma się po stronie,
gdy całkowity rozmiar plików tymczasowych jest większy niż ta liczba.
-1 oznacza brak limitu i jest wartością domyślną.
Czcionki
--embed-zewnętrzna-czcionka <0|1> (Domyślny: 1)
Określ, czy dopasowane czcionki lokalne, dla czcionek nieosadzonych w pliku PDF, powinny być
osadzony w HTML.
Jeśli ten przełącznik jest wyłączony, eksportowane są tylko nazwy czcionek, aby przeglądarki internetowe mogły próbować
samemu znaleźć odpowiednie czcionki, co może powodować problemy z nieprawidłową czcionką
metryka.
--format-czcionki (Domyślny: śmiać się)
Określ format czcionek wyodrębnionych z pliku PDF.
--decompose-ligatura <0|1> (Domyślny: 0)
Rozłóż ligatury. Na przykład 'fi' -> 'f''i'.
--auto-podpowiedź <0|1> (Domyślny: 0)
Jeśli ustawione na 1, podpowiedzi będą generowane dla czcionek za pomocą FontForge.
Może to być poprzedzone przez --external-hint-tool.
--zewnętrzne-podpowiedź-narzędzie (Domyślny: )
Jeśli określono, narzędzie zostanie wywołane w celu ulepszenia podpowiedzi dla czcionek, to
poprzedza --auto-podpowiedź.
Narzędzie zostanie nazwane jako „ ', gdzie będzie przyrostek
to samo, co określono dla --font-format.
--rozciągnij-wąski-glif <0|1> (Domyślny: 0)
Jeśli ustawione na 1, glify węższe niż opisane w PDF zostaną rozciągnięte; Inaczej
spacja zostanie dopełniona na prawo od glifów
--squeeze-wide-glif <0|1> (Domyślny: 1)
Jeśli ustawione na 1, glify szersze niż opisane w PDF zostaną ściśnięte; inaczej będzie
być obcięty.
--override-fstype <0|1> (Domyślny: 0)
Wyczyść bity fstype w czcionkach TTF/OTF.
Włącz tę opcję, jeśli Internet Explorer narzeka na „Uprawnienie musi być możliwe do zainstalowania”
I masz na to pozwolenie.
--typ-procesu3 <0|1> (Domyślny: 0)
Jeśli jest włączony, pdf2htmlEX spróbuje przekonwertować czcionki Type 3 tak, aby tekst mógł być
renderowane natywnie w HTML. W przeciwnym razie cały tekst z czcionkami Type 3 zostanie wyrenderowany
jako obraz.
Ta funkcja jest wysoce eksperymentalna.
Tekst
--hej , --veps (Domyślny: 1)
Określ maksymalne dopuszczalne przesunięcie poziome/pionowe (w pikselach).
pdf2htmlEX próbowałby zoptymalizować wygenerowany plik HTML przenoszący tekst w ramach tego
dystans.
--spacja-próg (Domyślny: 0.125)
pdf2htmlEX wstawi znak odstępu „ ”, jeśli odległość między nimi
kolejne litery w tej samej linii są szersze niż ratio * rozmiar_czcionki.
--mnożnik-rozmiaru-czcionki (Domyślny: 4.0)
Wiele przeglądarek internetowych ogranicza minimalny rozmiar czcionki, a wiele z nich zaokrągla podaną czcionkę
rozmiar, co powoduje nieprawidłowe renderowanie.
Określenie współczynnika większego niż 1 rozwiąże ten problem, ale może się zawiesić
niektóre przeglądarki.
Jednak w przypadku niektórych wersji Firefoksa problem może wystąpić, gdy rozmiar czcionki
jest zbyt duża, w takim przypadku należy podać tutaj mniejszą wartość.
--spacja-jako-przesunięcie <0|1> (Domyślny: 0)
Jeśli ustawiono na 1, znaki spacji będą traktowane jako przesunięcia, co pozwala na lepsze
optymalizacja.
W przypadku plików PDF ze złym kodowaniem włączenie tej opcji może spowodować utratę
postacie.
--tounicode <-1|0|1> (Domyślny: 0)
Mapa ToUnicode może być dostarczona dla każdej czcionki w pliku PDF, która wskazuje „znaczenie”
postaci. Jednak często są lepsze informacje "ToUnicode" w typie 0/1
czcionki, a czasami podana mapa ToUnicode jest błędna. Jeśli ta wartość jest ustawiona na
1, mapa ToUnicode jest zawsze stosowana, jeśli jest dostarczona w formacie PDF, a znaki mogą nie być
renderuj poprawnie w HTML, jeśli występują kolizje.
Jeśli jest ustawiony na -1, używana jest dostosowana mapa, dzięki której renderowanie będzie poprawne w HTML
(wizualnie takie same), ale możesz nie uzyskać poprawnych znaków, wybierając i kopiując &
pasta.
Jeśli jest ustawiony na 0, pdf2htmlEX postara się jak najlepiej zrównoważyć dwie powyższe metody.
--optymalizuj-tekst <0|1> (Domyślny: 0)
Jeśli jest ustawiony na 1, pdf2htmlEX spróbuje zmniejszyć liczbę elementów HTML używanych do
tekst. Wyłącz go, jeśli coś pójdzie nie tak.
--prawidłowa widoczność-tekstu <0|1> (Domyślny: 0)
Jeśli ustawiony na 1, pdf2htmlEX spróbuje wykryć teksty pokryte innymi grafikami i
odpowiednio je ułożyć, tzn. zakryte teksty stają się przezroczyste w warstwie tekstowej oraz
są rysowane na warstwie tła.
Tło Obraz
--format-bg (Domyślny: png)
Określ format obrazu tła. Uruchom `pdf2htmlEX -v`, aby sprawdzić wszystkie obsługiwane
formaty.
--svg-limit-liczby-węzłów (Domyślny: -1)
Jeśli liczba węzłów w obrazie tła SVG przekracza ten limit, cofnij tę stronę do
tło mapy bitowej; wartość ujemna oznacza brak limitu. Ta opcja jest przydatna tylko wtedy, gdy
Określono '--bg-format svg'. Zwróć uwagę, że liczba węzłów w svg jest po prostu obliczana
w przybliżeniu.
--svg-embed-bitmap <0|1> (Domyślny: 1)
Czy osadzać bitmapy w obrazie tła SVG. 1: osadzanie bitmap w tle svg;
0: zrzuć mapy bitowe do plików zewnętrznych, jeśli to możliwe.
Ta opcja jest przydatna tylko wtedy, gdy określono „--bg-format svg” i „--embed-image”
jest wyłączony.
Obecnie bitmapy RGB lub Gray JPEG w pliku PDF można zrzucić, podczas gdy te w innych
formaty lub przestrzenie kolorów są nadal osadzone. Jeśli mapy bitowe nie są zrzucane zgodnie z oczekiwaniami,
spróbuj wstępnie przetworzyć plik PDF przez ghostscript lub acrobat i upewnij się, że są w nim zawarte bitmapy
są konwertowane do formatu RGB/Gray JPEG. Zobacz wiki projektu, aby uzyskać więcej informacji.
PDF ochrona
-o, --hasło-właściciela
Określ hasło właściciela
-ty, --hasło użytkownika
Określ hasło użytkownika
--nie-drm <0|1> (Domyślny: 0)
Zastąp ustawienia DRM dokumentu
Włącz to tylko wtedy, gdy masz uprawnienia.
Różne.
--czyste-tmp <0|1> (Domyślny: 1)
Jeśli jest wyłączony, pliki pośrednie nie zostaną ostatecznie wyczyszczone.
--katalog danych (Domyślny: /usr/share/pdf2htmlEX)
Określ folder zawierający manifest i inne pliki (zobacz poniżej manifest
plik)`
--tmp-katalog (Domyślny: / Tmp or $ TMPDIR if set)
Określ folder tymczasowy, który będzie używany dla plików tymczasowych
--css-rysuj <0|1> (Domyślny: 0)
Eksperymentalny i nieobsługiwany rysunek CSS
--odpluskwić <0|1> (Domyślny: 0)
Wydrukuj informacje debugowania.
--dowód <0|1|2> (Domyślny: 0)
Wydrukuj wersję próbną. Jeśli określono wartość dodatnią, teksty są rysowane na obu
warstwa tekstowa i obraz tła dla porównania. Jeśli określono 2, teksty włączone
tło są w różnych kolorach. Jeśli używany jest format tła png/jpg, wyższy
hdpi/vdpi (np. 288) jest zalecane dla czytelności.
Meta
-v, --wersja
Wydrukuj informacje o prawach autorskich i wersji
--help Drukuj informacje o użytkowaniu
OCZYWISTY i KATALOG DANYCH
Gdy split-pages ma wartość 0, plik manifestu opisuje, jak powinna wyglądać ostateczna strona html
wygenerowane.
Domyślnie pdf2htmlEX użyje manifestu w domyślnym katalogu danych (uruchom `pdf2htmlEX -v`
do sprawdzenia), który daje proste demo jego składni.
Możesz zmodyfikować domyślny lub możesz utworzyć nowy i określić poprawny
katalog danych w wierszu poleceń.
Wszystkie pliki, do których odwołuje się manifest, muszą znajdować się w katalogu danych.
PRZYKŁAD
pdf2htmlEX /ścieżka/do/pliku.pdf
Konwertuj plik.pdf na plik.html
pdf2htmlEX --czyste-tmp 0 --odpluskwić 1 /ścieżka/do/pliku.pdf
Konwertuj plik.pdf i zostaw wszystkie pliki pośrednie.
pdf2htmlEX --dest-dir na zewnątrz --osadzać fi /ścieżka/do/pliku.pdf
Przekonwertuj plik.pdf na out/file.html i pozostaw oddzielone pliki czcionek/obrazów.
PRAWA AUTORSKIE
Prawa autorskie 2012,2013 Lu Wang[email chroniony]>
pdf2htmlEX jest objęty licencją GPLv3 z dodatkowymi warunkami, przeczytaj LICENCJA, aby uzyskać szczegółowe informacje.
Korzystaj z pdf2htmlEX online, korzystając z usług onworks.net