これは、オンライン Linux で実行する Corpus redundancy Manager という名前の Linux アプリで、最新リリースはcollocations.zip としてダウンロードできます。 ワークステーション用の無料ホスティング プロバイダー OnWorks でオンラインで実行できます。
Corpus redundancy manager という名前のこのアプリをオンラインでダウンロードして実行し、OnWorks を使用して Linux でオンラインで無料で実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
オンラインの Linux で実行するコーパス冗長マネージャー
Ad
DESCRIPTION
テキスト内のカット&ペースト操作による冗長性により、NLP の機械学習に偏りが生じます。このモジュールはディレクトリを取得し、XNUMX つのファイル間の類似性の上限を指定して、そのディレクトリ内のファイルのサブセット (リスト内) を生成します。
特徴
- 文書コーパス内のコピーペーストの冗長性を特定する
- 入力: テキストドキュメントと類似性しきい値を含むフォルダー
- 出力 (a) 非冗長ドキュメントのリスト (コーパスの非冗長サブセット)
- 出力 (b) 冗長であることが判明した文書ペアのリストとそのペアの冗長量
- Python スクリプト (2.6) - さまざまな Linux フレーバー + Windows XP/7 でテスト済み
Audience
科学/研究
ユーザーインターフェース
コンソール/ターミナル
プログラミング言語
Python
これは、https://sourceforge.net/projects/corpusredundanc/ から取得できるアプリケーションです。 無料のオペレーティング システムの XNUMX つから最も簡単な方法でオンラインで実行できるように、OnWorks でホストされています。