これは go_spider という名前の Linux アプリで、その最新リリースは Version1.2.zip としてダウンロードできます。 これは、ワークステーション用の無料のホスティング プロバイダーである OnWorks でオンラインで実行できます。
OnWorks で go_spider という名前のこのアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
ゴースパイダー
DESCRIPTION
素晴らしい Go 並行クローラー (スパイダー) フレームワーク。 クローラーは柔軟でモジュール式です。 個別化されたクローラーに簡単に拡張することも、デフォルトのクロール コンポーネントのみを使用することもできます。 スパイダーは、クロールする URL を持つリクエストをスケジューラで取得します。 次に、Downloader は Request の結果 (html、json、jsonp、text) をダウンロードします。 結果は PageProcesser で解析するために Page に保存されます。 Html 解析は、goquery パッケージに基づいています。 Json 解析は、単純な JSON パッケージに基づいています。 Jsonp は json と会話します。 テキスト形式は、パーサーを使用しないプレーン テキスト コンテンツを表します。 PageProcesser モジュールは結果のみを解析します。 モジュラーは、次のステップでクロールする結果 (キーと値のペア) と URL を取得します。 これらのキーと値のペアは PageItems に保存され、url は Scheduler にプッシュされます。
特徴
- Go 1.2 以降が必要
- 同時
- 垂直コミュニティに適合
- 柔軟、モジュラー
- ネイティブ Go 実装
- 個別のクローラーに簡単に拡張できます
プログラミング言語
Go
カテゴリー
これは https://sourceforge.net/projects/go-spider.mirror/ からも取得できるアプリケーションです。 これは、OnWorks でホストされており、無料のオペレーティング システムの XNUMX つからオンラインで簡単に実行できます。