InglésFrancésEspañol

icono de página de OnWorks

Corpus árabe

Descarga gratis la aplicación Arabic Corpus Linux para ejecutar en línea en Ubuntu en línea, Fedora en línea o Debian en línea

Esta es la aplicación de Linux llamada Arabic Corpus cuya última versión se puede descargar como Khaleej-2004-utf8.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.

Descargue y ejecute en línea esta aplicación llamada Corpus árabe con OnWorks de forma gratuita.

Siga estas instrucciones para ejecutar esta aplicación:

- 1. Descargue esta aplicación en su PC.

- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 3. Cargue esta aplicación en dicho administrador de archivos.

- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.

- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 6. Descarga la aplicación, instálala y ejecútala.

Corpus árabe


Ad


DESCRIPCIÓN

El Corpus árabe {compilado por el Dr. Mourad Abbas ( http://sites.google.com/site/mouradabbas9/corpora ) El corpus Khaleej-2004 contiene 5690 documentos. Está dividido en 4 temas (categorías). El corpus Watan-2004 contiene 20291 documentos organizados en 6 temas (categorías). Los investigadores que utilizan estos dos corpus mencionarían las dos referencias principales:
(1) Para el corpus de Watan-2004
----------------------
M. Abbas, K. Smaili, D. Berkani, (2011) Evaluación de métodos de identificación de temas en corporas árabes, REVISTA DE GESTIÓN DE INFORMACIÓN DIGITAL, vol. 9, N. 5, págs. 185-192.

2) Para el corpus Khaleej-2004
---------------------------------
M. Abbas, K. Smaili (2005) Comparación de métodos de identificación de temas para el idioma árabe, RANLP05: Avances recientes en el procesamiento del lenguaje natural, págs. 14-17, 21-23 de septiembre de 2005, Borovets, Bulgaria.

Referencias más útiles para comprobar:
-------------------------------------------
https://sites.google.com/site/mouradabbas9/corpora



Audiencia

Tecnología de la información, ciencia / investigación, usuarios finales avanzados, desarrolladores, ingenieros de calidad, ingeniería


Interfaz de usuario

Win32 (MS Windows), KDE


Lenguaje de programación

Python, C ++, JavaScript


Entorno de base de datos

MySQL



Categorías

Traducción automática, aprendizaje automático

Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/arabiccorpus/. Se ha alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.


Ad