これは、Unsupervised TXT classifier という名前の Linux アプリで、最新リリースは classifier.zip としてダウンロードできます。 ワークステーション用の無料ホスティング プロバイダー OnWorks でオンラインで実行できます。
Unsupervised TXT classifier with OnWorks という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
教師なしTXT分類器
DESCRIPTION
このプログラムは、既知の分類アルゴリズムに関する4つの最も一般的な問題に対処するために作成されています。 第一に、過剰なトレーニングと第二に、カテゴリーのトレーニングのためのデータの不足です。 代わりに、各TXTファイルは、割り当てられたカテゴリではなく、それ自体がカテゴリです。 ある意味で、これはクラスタリングに似ていますが、トレーニングが含まれているため、実際にはクラスタリングアルゴリズムではありません。 ClassifierXNUMXJのサマライザーは、XNUMXつの入力を受け入れるように調整されています(AとBと呼びます)。 次に、サマライザはAでトレーニングされ、ドキュメントBを要約します。その逆も同様です。 これにより、両方のドキュメントに関連する構造が抽出され(したがって、過剰なトレーニングが回避され)、ベクトル空間分析を使用して比較され、あるドキュメントが別のドキュメントに属する範囲が示されます(したがって、情報の不足が回避されます)。 このメソッドを使用して、特定のカテゴリのテキストをマージしてユーザー定義クラスを作成し、ドキュメント間の関連する距離を計算できますが、これは必須ではありません。
Audience
教育、開発者、テスター
プログラミング言語
Java
カテゴリー
これは、https://sourceforge.net/projects/txtclassifier/からも取得できるアプリケーションです。 無料のオペレーティングシステムのXNUMXつから最も簡単な方法でオンラインで実行するために、OnWorksでホストされています。