EnglischFranzösischSpanisch

OnWorks-Favicon

webStraktor-Download für Linux

Laden Sie die webStraktor-Linux-App kostenlos herunter, um sie online unter Ubuntu online, Fedora online oder Debian online auszuführen

Dies ist die Linux-App namens webStraktor, deren neueste Version als webStraktor-20140420-R01.zip heruntergeladen werden kann. Es kann online beim kostenlosen Hosting-Anbieter OnWorks für Workstations ausgeführt werden.

Laden Sie diese App namens webStraktor mit OnWorks kostenlos herunter und führen Sie sie online aus.

Befolgen Sie diese Anweisungen, um diese App auszuführen:

- 1. Diese Anwendung auf Ihren PC heruntergeladen.

- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.

- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.

- 4. Starten Sie den OnWorks Linux-Online- oder Windows-Online-Emulator oder den MACOS-Online-Emulator von dieser Website.

- 5. Rufen Sie vom gerade gestarteten OnWorks Linux-Betriebssystem aus unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.

- 6. Laden Sie die Anwendung herunter, installieren Sie sie und führen Sie sie aus.

SCREENSHOTS

Ad


webStraktor


BESCHREIBUNG

webStraktor ist ein programmierbarer Datenextraktions-Client für das World Wide Web. Sein Zweck besteht darin, HTML-basierte Inhalte über das HTTP-Protokoll zu scannen und relevante Informationen zu extrahieren. webStraktor verfügt über eine Skriptsprache, um das Sammeln, Extrahieren und Speichern von im Web verfügbaren Informationen, einschließlich Bildern, zu erleichtern. Die Skriptsprache verwendet Elemente der regulären Ausdrucks- und xPath-Syntax. Die Skriptsprache webStraktor verfügt über einen kleinen Befehlssatz und ihre Syntax ist leicht zu beherrschen.
Das Standardausgabeformat von webStraktor basiert auf XML, entweder in den Codepages ASCII, UTF-8 oder ISO-8859-1 (Latin1).
webStraktor verlässt sich beim Abrufen von Inhalten über das HTTP-Protokoll auf den Apache HttpClient. Es hält sich an das Robots Exclusion Protocol und kann für den anonymen Betrieb konfiguriert werden, indem eine Verbindung zu den vorherrschenden Arten von Web-Proxy-Servern hergestellt wird.
webStraktor erweitert die Funktionalität von Webcrawlern, Spidern oder Bots durch die Integration von Scraping- und Crawling-Funktionen.



Eigenschaften

  • programmierbarer Webcrawler (Web Spider oder Web Bot)
  • leicht zu beherrschende Skriptsprache
  • Java Swing-basierte grafische Entwicklungsumgebung
  • UTF8- oder ISO-8859-1-XML-Ausgabe
  • lässt sich in leicht verfügbare Planungsanwendungen integrieren
  • erschöpfende Konfiguration
  • Unterstützung für Web-Proxy-Server
  • Unterstützung des Roboterausschlussprotokolls
  • konfigurierbare User-Agent-Signatur
  • Schritt-für-Schritt-Anleitung und Beispielskripte
  • Apache HttpClient basiert


Publikum

Entwickler, Architekten


Benutzeroberfläche

Java-Schaukel


Programmiersprache

Javac


Datenbankumgebung

XML-basiert


Dies ist eine Anwendung, die auch von https://sourceforge.net/projects/webstraktor/ abgerufen werden kann. Es wurde in OnWorks gehostet, um es auf einfachste Weise online über eines unserer kostenlosen Betriebssysteme ausführen zu können.


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

  • 1
    AstroOrzPlayer
    AstroOrzPlayer
    AstrOrz Player ist ein kostenloser Mediaplayer
    Software, teilweise basierend auf WMP und VLC. Das
    Spieler ist in einem minimalistischen Stil, mit
    mehr als zehn Themenfarben und können auch
    b ...
    Laden Sie den AstrOrzPlayer herunter
  • 2
    movistv
    movistv
    Kodi Movistar+ TV ist ein ADDON für XBMC/
    Kodi que Permite disponer de un
    Dekodifikator der IPTV-Dienste de
    Movistar ist in einem Jahr integriert
    Mediacenter ma...
    Moviestartv herunterladen
  • 3
    Code :: Blocks
    Code :: Blocks
    Code::Blocks ist ein kostenloses Open-Source-Programm,
    plattformübergreifende C-, C++- und Fortran-IDE
    gebaut, um die anspruchsvollsten Anforderungen zu erfüllen
    seiner Nutzer. Es ist sehr konzipiert
    verlängert...
    Laden Sie Code::Blocks herunter
  • 4
    Inmitten
    Inmitten
    Inmitten oder Advanced Minecraft Interface
    und Data/Structure Tracking ist ein Werkzeug, um
    eine Übersicht über ein Minecraft anzeigen
    Welt, ohne sie tatsächlich zu erschaffen. Es
    können ...
    Herunterladen Mitten
  • 5
    MSYS2
    MSYS2
    MSYS2 ist eine Sammlung von Tools und
    Bibliotheken, die Ihnen eine bieten
    benutzerfreundliche Umgebung zum Erstellen,
    Installation und Ausführung von nativem Windows
    Software. Es besteht...
    Laden Sie MSYS2 herunter
  • 6
    libjpeg-turbo
    libjpeg-turbo
    libjpeg-turbo ist ein JPEG-Bildcodec
    das SIMD-Anweisungen verwendet (MMX, SSE2,
    NEON, AltiVec) zur Beschleunigung der Grundlinie
    JPEG-Komprimierung und -Dekomprimierung aktiviert
    x86, x8...
    Laden Sie libjpeg-turbo herunter
  • Mehr »

Linux-Befehle

Ad