InglêsFrancêsEspanhol

favicon do OnWorks

Corpus árabe

Download grátis do aplicativo Arabic Corpus Linux para rodar online no Ubuntu online, Fedora online ou Debian online

Este é o aplicativo Linux chamado Arabic Corpus, cuja versão mais recente pode ser baixada como Khaleej-2004-utf8.zip. Ele pode ser executado online no provedor de hospedagem gratuita OnWorks para estações de trabalho.

Baixe e execute online este aplicativo chamado Arabic Corpus with OnWorks gratuitamente.

Siga estas instruções para executar este aplicativo:

- 1. Baixe este aplicativo em seu PC.

- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.

- 3. Carregue este aplicativo em tal gerenciador de arquivos.

- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.

- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.

- 6. Baixe o aplicativo, instale-o e execute-o.

Corpus árabe


Ad


DESCRIÇÃO

The Arabic Corpus {compilado pelo Dr. Mourad Abbas ( http://sites.google.com/site/mouradabbas9/corpora ) O corpus Khaleej-2004 contém 5690 documentos. Está dividido em 4 tópicos (categorias). O corpus Watan-2004 contém 20291 documentos organizados em 6 tópicos (categorias). Os pesquisadores que usam esses dois corpora mencionariam as duas referências principais:
(1) Para o corpus Watan-2004
----------------------
M. Abbas, K. Smaili, D. Berkani, (2011) Evaluation of Topic Identification Methods on Arabic Corpora, JOURNAL OF DIGITAL INFORMATION MANAGEMENT, vol. 9, N. 5, pp.185-192.

2) Para Khaleej-2004 corpus
---------------------------------
M. Abbas, K. Smaili (2005) Comparison of Topic Identification Methods for Arab Language, RANLP05: Recent Advances in Natural Language Processing, pp. 14-17, 21-23 de setembro de 2005, Borovets, Bulgary.

Referências mais úteis para verificar:
-------------------------------------------
https://sites.google.com/site/mouradabbas9/corpora



Público

Tecnologia da informação, ciência / pesquisa, usuários finais avançados, desenvolvedores, engenheiros de qualidade, engenharia


Interface com o usuário

Win32 (MS Windows), KDE


Linguagem de Programação

Python, C ++, JavaScript


Ambiente de Banco de Dados

MySQL



Categorias

Tradução automática, aprendizado de máquina

Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/arabiccorpus/. Ele foi hospedado no OnWorks para ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.


Ad