Dies ist die Windows-App namens go_spider, deren neueste Version als Version1.2.zip heruntergeladen werden kann. Es kann online im kostenlosen Hosting-Anbieter OnWorks für Workstations betrieben werden.
Laden Sie diese App namens go_spider mit OnWorks kostenlos herunter und führen Sie sie online aus.
Befolgen Sie diese Anweisungen, um diese App auszuführen:
- 1. Diese Anwendung auf Ihren PC heruntergeladen.
- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.
- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.
- 4. Starten Sie einen beliebigen OS OnWorks-Online-Emulator von dieser Website, aber einen besseren Windows-Online-Emulator.
- 5. Rufen Sie vom gerade gestarteten OnWorks Windows-Betriebssystem unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.
- 6. Laden Sie die Anwendung herunter und installieren Sie sie.
- 7. Laden Sie Wine aus den Software-Repositorys Ihrer Linux-Distributionen herunter. Nach der Installation können Sie dann auf die App doppelklicken, um sie mit Wine auszuführen. Sie können auch PlayOnLinux ausprobieren, eine schicke Schnittstelle über Wine, die Ihnen bei der Installation beliebter Windows-Programme und -Spiele hilft.
Wine ist eine Möglichkeit, Windows-Software unter Linux auszuführen, jedoch ohne Windows. Wine ist eine Open-Source-Windows-Kompatibilitätsschicht, die Windows-Programme direkt auf jedem Linux-Desktop ausführen kann. Im Wesentlichen versucht Wine, genügend Windows von Grund auf neu zu implementieren, damit alle diese Windows-Anwendungen ausgeführt werden können, ohne dass Windows tatsächlich benötigt wird.
SCREENSHOTS
Ad
go_spider
BESCHREIBUNG
Ein großartiges Go Concurrent Crawler(Spider)-Framework. Der Crawler ist flexibel und modular. Es kann einfach zu einem individualisierten Crawler erweitert werden oder Sie können nur die Standard-Crawler-Komponenten verwenden. Spider erhält eine Anfrage im Scheduler, die eine URL enthält, die gecrawlt werden soll. Dann lädt Downloader das Ergebnis (html, json, jsonp, text) der Anfrage herunter. Das Ergebnis wird in Page zum Parsen in PageProcesser gespeichert. Das HTML-Parsing basiert auf dem goquery-Paket. Json-Parsing basiert auf einem einfachen JSON-Paket. Jsonp wird sich mit json unterhalten. Das Textformular stellt reine Textinhalte ohne Parser dar. Der PageProcesser-Modulator parst nur Ergebnisse. Der Modulator erhält Ergebnisse (Schlüssel-Wert-Paare) und URLs, die im nächsten Schritt gecrawlt werden sollen. Diese Schlüssel-Wert-Paare werden in PageItems gespeichert und URLs werden in Scheduler übertragen.
Eigenschaften
- Erfordert Go 1.2 oder höher
- Gleichzeitig
- Fit für vertikale Gemeinschaften
- Flexibel, modular
- Native Go-Implementierung
- Einfach zu einem individualisierten Crawler erweiterbar
Programmiersprache
Go
Kategorien
Dies ist eine Anwendung, die auch von https://sourceforge.net/projects/go-spider.mirror/ abgerufen werden kann. Es wurde in OnWorks gehostet, damit es auf einfachste Weise online von einem unserer kostenlosen Betriebssysteme ausgeführt werden kann.