英語フランス語スペイン語

OnWorksファビコン

オンラインの Linux で実行するコーパス冗長マネージャー

オンライン Linux で実行するコーパス冗長マネージャーを無料でダウンロード オンライン Ubuntu、オンライン Fedora、またはオンライン Debian でオンラインで実行する Linux アプリ

これは、オンライン Linux で実行する Corpus redundancy Manager という名前の Linux アプリで、最新リリースはcollocations.zip としてダウンロードできます。 ワークステーション用の無料ホスティング プロバイダー OnWorks でオンラインで実行できます。

Corpus redundancy manager という名前のこのアプリをオンラインでダウンロードして実行し、OnWorks を使用して Linux でオンラインで無料で実行します。

このアプリを実行するには、次の手順に従ってください。

-1。このアプリケーションをPCにダウンロードしました。

--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。

-3。このアプリケーションをそのようなファイルマネージャにアップロードします。

-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。

-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。

-6。アプリケーションをダウンロードし、インストールして実行します。

オンラインの Linux で実行するコーパス冗長マネージャー


Ad


DESCRIPTION

テキスト内のカット&ペースト操作による冗長性により、NLP の機械学習に偏りが生じます。
このモジュールはディレクトリを取得し、XNUMX つのファイル間の類似性の上限を指定して、そのディレクトリ内のファイルのサブセット (リスト内) を生成します。

特徴

  • 文書コーパス内のコピーペーストの冗長性を特定する
  • 入力: テキストドキュメントと類似性しきい値を含むフォルダー
  • 出力 (a) 非冗長ドキュメントのリスト (コーパスの非冗長サブセット)
  • 出力 (b) 冗長であることが判明した文書ペアのリストとそのペアの冗長量
  • Python スクリプト (2.6) - さまざまな Linux フレーバー + Windows XP/7 でテスト済み


Audience

科学/研究


ユーザーインターフェース

コンソール/ターミナル


プログラミング言語

Python



これは、https://sourceforge.net/projects/corpusredundanc/ から取得できるアプリケーションです。 無料のオペレーティング システムの XNUMX つから最も簡単な方法でオンラインで実行できるように、OnWorks でホストされています。


Ad