これはArabicCorpusという名前のLinuxアプリで、最新リリースはKhaleej-2004-utf8.zipとしてダウンロードできます。 ワークステーション用の無料ホスティングプロバイダーOnWorksでオンラインで実行できます。
OnWorksでArabicCorpusという名前のこのアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
アラビア語コーパス
Ad
DESCRIPTION
アラビア語コーパス{Dr.Mourad Abbas( http://sites.google.com/site/mouradabbas9/corpora )コーパスKhaleej-2004には、5690のドキュメントが含まれています。 4つのトピック(カテゴリ)に分かれています。 コーパスWatan-2004には、20291つのトピック(カテゴリ)で編成された6のドキュメントが含まれています。 これらのXNUMXつのコーパスを使用する研究者は、次のXNUMXつの主要な参考資料に言及します。
(1)Watan-2004コーパスの場合
----------------------
M. Abbas、K。Smaili、D。Berkani、(2011)アラビア語コーパスのトピック識別方法の評価、JOURNAL OF DIGITAL INFORMATION MANAGEMENT、vol。 9、N。5、pp.185-192。
2)Khaleej-2004コーパスの場合
---------------------------------
M. Abbas、K。Smaili(2005)アラビア語のトピック識別方法の比較、RANLP05:自然言語処理の最近の進歩、pp。 14年17月21〜23日、2005〜XNUMX日、ブルガリのボロヴェッツ。
チェックするためのより有用なリファレンス:
-------------------------------------------
https://sites.google.com/site/mouradabbas9/corpora
Audience
情報技術、科学/研究、上級エンドユーザー、開発者、品質エンジニア、エンジニアリング
ユーザーインターフェース
Win32(MS Windows)、KDE
プログラミング言語
Python、C ++、JavaScript
データベース環境
MySQL
カテゴリー
これは、https://sourceforge.net/projects/arabiccorpus/からも取得できるアプリケーションです。 無料のオペレーティングシステムのXNUMXつから最も簡単な方法でオンラインで実行するために、OnWorksでホストされています。