АнглийскийФранцузскийИспанский

Значок OnWorks

tagsoup - Интернет в облаке

Запустите tagoup в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда tagsoup, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


tagsoup - преобразование неприятного, уродливого HTML в чистый XHTML

СИНТАКСИС


Ява -банка /usr/share/java/tagsoup.jar [ кредита ] [ файлов ]

ОПИСАНИЕ


Преобразуйте произвольный HTML в чистый XHTML, используя адаптированное описание HTML. Выход
будет правильно сформированный XML, но не обязательно действительный XHTML.

--файлы
множественный ввод файлов должны быть преобразованы в соответствующие выходные файлы

--encoding =кодирование
указывает кодировку входных файлов

--output-encoding =кодирование
указывает кодировку вывода (если имя кодировки начинается с `` utf '',
вывод не будет содержать символьных сущностей; в противном случае все символы, отличные от ASCII, будут
представлены как сущности)

--html выводить исправленный HTML, а не XML, опуская объявление XML и любые
объявления пространств имен

--method = html
выводить исправленный HTML, а не XML (закрывающие теги опускаются для пустых элементов и
в элементах скрипта и стиля экранирование символов не выполняется)

--omit-xml-декларация
опустить объявление XML

--лексический
вывод лексических функций (в частности, комментарии и любое объявление DOCTYPE)

--нет подавить пространства имен в выводе

--нобогоны
подавлять неизвестные элементы, отличные от HTML, в выводе

--nodefaults
подавить значения атрибутов по умолчанию

--ноколоны
изменить явные двоеточия в именах элементов и атрибутов на подчеркивания

--norestart
не перезапускайте перезапускаемые элементы

- недостойный
проходить через игнорируемые пробелы (пробелы в содержании только элементов) через SAX
обработчик метода ignorableWhitespace

--любой рассматривать неизвестные элементы, отличные от HTML, как разрешающие любой контент (по умолчанию)

--пустыебогоны
обрабатывать неизвестные элементы, отличные от HTML, как пустые.

--нороотбогоны
не позволять неизвестным элементам, отличным от HTML, быть корневыми элементами

--doctype-system =идентификатор системы
принудительно выводить объявление DOCTYPE с указанным системным идентификатором

--doctype-public =общедоступный идентификатор
принудительно выводить объявление DOCTYPE с указанным общедоступным идентификатором

--standalone = [да | нет]
указать автономный псевдоатрибут в выходном XML-объявлении

--version =версия
указать псевдоатрибут версии в выходном XML-объявлении (не влияет на фактические
версия вывода XML)

--nocdata
обрабатывать элементы CDATA-контента скрипт и стиль как обычные элементы (в основном для
тестирование)

--pyx выводить формат PYX, а не XML (в основном для тестирования)

- пиксин
ввод - HTML в формате PYX (в основном для тестирования)

- повторное использование
повторно использовать один и тот же объект Parser для внутренних целей (только для тестирования)

--Помогите вывести базовую справку

--версия
номер версии вывода

ТегСуп - это синтаксический анализатор и преобразователь для неприятного, уродливого HTML. Его нормальный режим обработки
принимать файлы HTML в командной строке или из стандартного ввода, если они не указаны,
и вывести их как чистый XML на стандартный вывод. Кодировка предполагается
локальная для платформы кодировка на входе и всегда UTF-8 на выходе.

Когда --файлы задана опция, каждый входной файл преобразуется в выходной файл
соответствующее имя с расширением, измененным на xhtml. Если расширение уже есть
xhtml, он изменен на xhtml_.

TagSoup исправит любыми необходимыми средствами нарушения корректности XML. В
в частности, он исправит искаженные имена атрибутов и предоставит отсутствующее значение атрибута
кавычки. Что еще более важно, он предоставляет конечные теги там, где это позволяет HTML.
опущено, а иногда и там, где его нет. Там, где это необходимо, он даже предоставит начальные теги;
например, если документ начинается с тег, TagSoup автоматически добавит к нему префикс
с участием .

Используйте tagsoup в Интернете с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

  • 1
    Авогадро
    Авогадро
    Авогадро — передовая молекулярная
    редактор, предназначенный для кросс-платформенного использования
    в вычислительной химии, молекулярная
    моделирование, биоинформатика, материалы
    наука и...
    Скачать Авогадро
  • 2
    XMLTV
    XMLTV
    XMLTV - это набор программ для обработки
    TV (tvguide) списки и помощь в управлении
    просмотр телевизора, сохранение объявлений в
    Формат на основе XML. Есть утилиты для
    делать...
    Скачать XMLTV
  • 3
    забастовщик
    забастовщик
    Проект свободного программного обеспечения Strikr. Артефакты
    выпущен по "намерениям"
    двойная лицензия: AGPLv3 (сообщество) и
    CC-BY-NC-ND 4.0 международный
    (коммерческий) ...
    Скачать забастовку
  • 5
    ГИФЛИБ
    ГИФЛИБ
    giflib — это библиотека для чтения и
    написание гифок. Это API и ABI
    совместим с libungif, который был в
    широкое использование при сжатии LZW
    алгоритм был...
    Скачать ГИФЛИБ
  • 6
    Alt-F
    Alt-F
    Alt-F предоставляет бесплатный и открытый исходный код
    альтернативная прошивка для DLINK
    DNS-320/320L/321/323/325/327L and
    ДНР-322Л. Alt-F имеет Samba и NFS;
    поддерживает ext2 / 3/4 ...
    Скачать Alt-F
  • Больше »

Команды Linux

Ad