Это приложение для Linux под названием DocWire DocToText, последнюю версию которого можно загрузить как doctotext-5.0.9-msvc.zip. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием DocWire DocToText с OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
DocWire
Ad
ОПИСАНИЕ
DocToText от DocWire — многофункциональный набор инструментов для разработки программного обеспечения для извлечения данных, который преобразует все виды файлов в обычный текст и html. Этот инструмент для извлечения данных, написанный на C++, имеет парсер, способный конвертировать файлы PST и OST, а также совершенно новый API для лучшей обработки файлов.
Для повышения полезности DocToText как инструмент извлечения данных может быть интегрирован с другими приложениями для интеллектуального анализа данных и анализа данных. Он оснащен высококачественным, программируемым и обучаемым OCR с распознаванием символов на основе нейронных сетей LSTM. Этот анализатор документов может извлекать метаданные вместе с аннотациями и поддерживает список форматов, включая: DOC, XLS, XLSB, PPT, RTF, ODF (ODT, ODS, ODP),
OOXML (DOCX, XLSX, PPTX), iWork (СТРАНИЦЫ, НОМЕРА, КЛЮЧ),
ODFXML (FODP, FODS, FODT), PDF, EML, HTML, Outlook (PST, OST),
Изображение (JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP)
Доступно по лицензии GNU General Public License версии 2.0 (GPLv2) и коммерческой лицензии.
Особенности
- Возможность извлекать/импортировать и экспортировать текст, изображения, форматирование и метаданные вместе с аннотациями.
- Данные можно преобразовывать между импортом и экспортом (фильтрация, агрегирование и т. д.).
- Оснащен несколькими импортерами
- Оснащен несколькими экспортерами
- Оснащен высококачественным, программируемым и обучаемым устройством оптического распознавания символов с распознаванием символов на основе нейронных сетей LSTM.
- Инкрементный анализ, возвращающий данные, как только они станут доступны.
- Кроссплатформенность: Linux, Windows, MacOSX (и скоро)
- Можно встроить в ваше приложение (SDK)
- Может быть интегрирован с другими приложениями для интеллектуального анализа и анализа данных.
- Процесс разбора можно легко спроектировать, соединив объекты трубой | оператор в цепочку
- Анализ связи элементов цепочки на основе сигналов Boost
- Могут быть добавлены пользовательские элементы цепочки синтаксического анализа (импортеры, преобразователи, экспортеры).
- Небольшие двоичные файлы, быстрый собственный код C++.
Аудитория
Опытные конечные пользователи, разработчики, конечные пользователи / рабочий стол
Интерфейс пользователя
Командная строка
Язык программирования
C ++, C
Категории
Это приложение также можно загрузить с https://sourceforge.net/projects/doctotext/. Он размещен в OnWorks, чтобы его можно было легко запускать в сети с помощью одной из наших бесплатных операционных систем.