Este é o aplicativo Linux denominado DocWire DocToText, cuja versão mais recente pode ser baixada como doctotext-5.0.9-msvc.zip. Ele pode ser executado online no provedor de hospedagem gratuito OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado DocWire DocToText with OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.
- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo, instale-o e execute-o.
DocWire DocToText
Ad
DESCRIÇÃO
DocToText da DocWire - Um kit de ferramentas de desenvolvimento de software de extração de dados multifacetado que converte todos os tipos de arquivos em texto simples e html. Escrito em C ++, esta ferramenta de extração de dados possui um analisador capaz de converter arquivos PST e OST junto com uma nova API para melhor processamento de arquivos.
Para aprimorar sua utilidade, o DocToText, como ferramenta de extração de dados, pode ser integrado a outros aplicativos de mineração e análise de dados. Ele vem equipado com um OCR programável e treinável de alto grau que possui reconhecimento de caracteres baseado em redes neurais LSTM. Este analisador de documento é capaz de extrair metadados junto com anotações e suporta uma lista de formatos que incluem: DOC, XLS, XLSB, PPT, RTF, ODF (ODT, ODS, ODP),
OOXML (DOCX, XLSX, PPTX), iWork (PÁGINAS, NÚMEROS, KEYNOTE),
ODFXML (FODP, FODS, FODT), PDF, EML, HTML, Outlook (PST, OST),
Imagem (JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP)
Disponível sob Licença Pública Geral GNU versão 2.0 (GPLv2) e licenciamento comercial.
Recursos
- Capacidade de extrair/importar e exportar texto, imagens, formatação e metadados junto com anotações
- Os dados podem ser transformados entre importação e exportação (filtragem, agregação etc.)
- Equipado com vários importadores
- Equipado com vários exportadores
- Equipado com um OCR programável e treinável de alta qualidade que possui reconhecimento de caracteres baseado em redes neurais LSTM
- Análise incremental retornando dados assim que estiverem disponíveis
- Plataforma cruzada: Linux, Windows, MacOSX (e mais estão por vir)
- Pode ser incorporado em seu aplicativo (SDK)
- Pode ser integrado com outros aplicativos de mineração e análise de dados
- O processo de análise pode ser facilmente projetado conectando objetos com tubos | operador em uma cadeia
- Análise da comunicação dos elementos da cadeia com base em sinais de reforço
- Elementos de cadeia de análise personalizados podem ser adicionados (importadores, transformadores, exportadores)
- Binários pequenos, código C++ nativo rápido
Público
Usuários finais avançados, desenvolvedores, usuários finais / desktop
Interface com o usuário
Linha de comando
Linguagem de Programação
C ++, C
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/doctotext/. Ele foi hospedado no OnWorks para ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.