Ini adalah perintah html2text yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
html2text - pengonversi HTML-ke-teks tingkat lanjut
RINGKASAN
html2teks -bantu
html2teks -versi
html2teks [ -membongkar | -memeriksa ] [ -debug-pemindai ] [ -debug-parser ] [ -file rc path ] [
Gaya ( padat | cukup ) ] [ -lebar lebar ] [ -o berkas keluaran ] [ -bangsawan ] [ -ascii |
-utf8 ] [ -nometa ] [ file masukan ... ]
DESKRIPSI
html2teks membaca dokumen HTML dari file masukans, memformat masing-masing menjadi aliran
karakter teks biasa, dan menulis hasilnya ke output standar (atau ke berkas keluaran, Jika
itu -o opsi baris perintah digunakan).
Jika tidak file masukans ditentukan pada baris perintah, html2teks membaca dari input standar.
Tanda hubung sebagai file masukan adalah cara alternatif untuk menentukan input standar.
html2teks memahami semua konstruksi HTML 3.2, tetapi hanya dapat merender sebagian darinya karena
keterbatasan format output teks. Namun, program ini mencoba untuk memberikan yang baik
pengganti untuk elemen yang tidak dapat dirender. html2teks mem-parsing input HTML 4 juga, tapi
tidak selalu sesukses prosesor HTML lainnya. Itu juga menerima kesalahan sintaksis
masukan, dan mencoba untuk menafsirkannya "masuk akal".
Jalan html2teks format dokumen HTML dikendalikan dengan memformat properti read
dari file RC. html2teks mencoba membaca $HOME/.html2textrc (atau file yang ditentukan oleh
itu -file rc opsi baris perintah); jika file itu tidak dapat dibaca, html2teks mencoba membaca
/etc/html2textrc. Jika tidak ada file RC yang dapat dibaca (atau jika file RC tidak menimpa semua
memformat properti), maka default "masuk akal" diasumsikan. Format file RC adalah
Dijelaskan di html2teksrc(5) halaman manual.
Versi Debian dari html2teks juga dapat melakukan pengodean ulang input dan output (lihat
/usr/share/doc/html2text/README.Debian untuk info lebih lanjut). html2teks mencoba mengambil penyandian
dari dokumen HTML. Jika penyandian tidak ditentukan, Anda dapat menggunakan -ascii dan -utf8 Pilihan.
Output dikonversi ke charset lokal pengguna (LC_CTYPE).
PILIHAN
-nometa
Secara default, versi Debian dari html2teks gunakan tag 'meta http-equiv' untuk input
pengodean ulang. Opsi ini membatalkan perilaku ini.
-ascii Secara default, kapan -nometa disediakan, html2teks kegunaan UTF-8 untuk keluaran.
Menentukan opsi ini, polos ASCII digunakan sebagai gantinya. Untuk mengetahui bagaimana non-ASCII
karakter yang diberikan, lihat file "ascii.substitutes".
-utf8 Secara default, kapan -nometa disediakan, html2teks kegunaan ISO 8859-1 untuk masukan.
Menentukan opsi ini, UTF-8 digunakan sebagai gantinya (baik untuk input dan output). Ini
pilihan menyiratkan -bangsawan.
-memeriksa Opsi ini untuk tujuan diagnostik: Dokumen HTML hanya diuraikan dan tidak
diproses sebaliknya. Dalam mode operasi ini, html2teks akan melaporkan parse
kesalahan dan kesalahan pemindaian, yang tidak ada dalam mode operasi lain. Perhatikan bahwa
kesalahan penguraian dan pemindaian tidak fatal bagi html2teks, tetapi dapat menyebabkan salah tafsir
dari kode HTML dan/atau bagian dari dokumen yang ditelan.
-debug-parser
membiarkan html2teks laporkan token yang digeser, aturan yang diterapkan, dll., sambil
memindai dokumen HTML. Opsi ini untuk tujuan diagnostik.
-debug-pemindai
membiarkan html2teks laporkan setiap token leksikal yang dipindai, saat memindai HTML
dokumen. Opsi ini untuk tujuan diagnostik.
-bantu Cetak ringkasan baris perintah dan keluar.
-bangsawan Secara default, asli html2teks membuat huruf yang digarisbawahi dengan urutan seperti
"garis bawah-backspace-character" dan huruf tebal seperti "character-backspace-
karakter". Karena masalah dengan UTF-8, versi Debian dari html2teks tidak
menghasilkan spasi mundur, jadi opsi ini benar-benar tidak melakukan apa-apa.
-o berkas keluaran
Tulis outputnya ke berkas keluaran bukannya keluaran standar. Tanda hubung sebagai
berkas keluaran adalah cara alternatif untuk menentukan output standar.
-file rc path
Mencoba membaca file yang ditentukan dalam path sebagai file RC.
Gaya ( padat | cukup )
Gaya cukup mengubah beberapa nilai default dari parameter pemformatan
didokumentasikan dalam html2teksrc(5). Untuk mengetahui yang mana dan bagaimana parameter pemformatannya
default diubah, periksa file "pretty.style". Jika opsi ini dihilangkan,
gaya padat diasumsikan sebagai default.
-membongkar
Opsi ini untuk tujuan diagnostik: Alih-alih memformat dokumen yang diuraikan,
menghasilkan kode HTML, yang dijamin sintaksisnya benar. Jika html2teks
memiliki masalah saat menguraikan dokumen HTML yang salah secara sintaksis, opsi ini dapat membantu
kamu untuk mengerti apa html2teks berpikir bahwa kode HTML asli berarti.
-versi
Cetak versi program dan keluar.
-lebar lebar
Secara default, html2teks memformat dokumen HTML untuk lebar layar 79
karakter. Jika mengarahkan output ke file, atau jika terminal Anda memiliki lebar
selain 80 karakter, atau jika Anda hanya ingin tahu caranya html2teks penawaran
dengan tabel besar dan lebar terminal yang berbeda, Anda mungkin ingin menentukan a
berbeda lebar.
Gunakan html2text online menggunakan layanan onworks.net