Esta es la aplicación de Linux llamada Arabic Corpus cuya última versión se puede descargar como Khaleej-2004-utf8.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Corpus árabe con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
Corpus árabe
Ad
DESCRIPCIÓN
El Corpus árabe {compilado por el Dr. Mourad Abbas ( http://sites.google.com/site/mouradabbas9/corpora ) El corpus Khaleej-2004 contiene 5690 documentos. Está dividido en 4 temas (categorías). El corpus Watan-2004 contiene 20291 documentos organizados en 6 temas (categorías). Los investigadores que utilizan estos dos corpus mencionarían las dos referencias principales:
(1) Para el corpus de Watan-2004
----------------------
M. Abbas, K. Smaili, D. Berkani, (2011) Evaluación de métodos de identificación de temas en corporas árabes, REVISTA DE GESTIÓN DE INFORMACIÓN DIGITAL, vol. 9, N. 5, págs. 185-192.
2) Para el corpus Khaleej-2004
---------------------------------
M. Abbas, K. Smaili (2005) Comparación de métodos de identificación de temas para el idioma árabe, RANLP05: Avances recientes en el procesamiento del lenguaje natural, págs. 14-17, 21-23 de septiembre de 2005, Borovets, Bulgaria.
Referencias más útiles para comprobar:
-------------------------------------------
https://sites.google.com/site/mouradabbas9/corpora
Audiencia
Tecnología de la información, ciencia / investigación, usuarios finales avanzados, desarrolladores, ingenieros de calidad, ingeniería
Interfaz de usuario
Win32 (MS Windows), KDE
Lenguaje de programación
Python, C ++, JavaScript
Entorno de base de datos
MySQL
Categorías
Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/arabiccorpus/. Se ha alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.