EnglishFranceseSpagnolo

Favicon di OnWorks

Scarica webStraktor per Linux

Scarica gratuitamente l'app webStraktor Linux per eseguirla online su Ubuntu online, Fedora online o Debian online

Questa è l'app Linux denominata webStraktor la cui ultima versione può essere scaricata come webStraktor-20140420-R01.zip. Può essere eseguito online nel provider di hosting gratuito OnWorks per workstation.

Scarica ed esegui online questa app chiamata webStraktor con OnWorks gratuitamente.

Segui queste istruzioni per eseguire questa app:

- 1. Scaricata questa applicazione sul tuo PC.

- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.

- 3. Carica questa applicazione in tale file manager.

- 4. Avviare l'emulatore online OnWorks Linux o Windows online o l'emulatore online MACOS da questo sito Web.

- 5. Dal sistema operativo OnWorks Linux che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.

- 6. Scarica l'applicazione, installala ed eseguila.

IMMAGINI

Ad


webStraktor


DESCRIZIONE

webStraktor è un client programmabile per l'estrazione di dati dal World Wide Web. Il suo scopo è quello di raschiare il contenuto basato su HTML tramite il protocollo HTTP ed estrarre le informazioni rilevanti. webStraktor dispone di un linguaggio di scripting per facilitare la raccolta, l'estrazione e l'archiviazione delle informazioni disponibili sul web, comprese le immagini. Il linguaggio di scripting utilizza elementi della sintassi dell'espressione regolare e di xPath. Il linguaggio di scripting webStraktor ha un piccolo set di istruzioni e la sua sintassi è facile da padroneggiare.
Il formato di output standard di webStraktor è basato su XML, nelle code page ASCII, UTF-8 o ISO-8859-1 (Latin1).
webStraktor si basa su Apache HttpClient per il recupero dei contenuti tramite il protocollo HTTP. Aderisce al protocollo Robots Exclusion Protocol e può essere configurato per operare in modo anonimo collegandosi alle tipologie predominanti di web proxy server.
webStraktor estende le funzionalità di web crawler, spider o bot integrando capacità di scraping e crawling.



Caratteristiche

  • crawler web programmabile (web spider o web bot)
  • linguaggio di scripting facile da padroneggiare
  • ambiente di sviluppo grafico basato su java swing
  • Uscita XML UTF8 o ISO-8859-1
  • si integra con applicazioni di pianificazione prontamente disponibili
  • configurazione completa
  • supporto per server proxy web
  • supporto del protocollo di esclusione del robot
  • firma dell'agente utente configurabile
  • tutorial passo passo e script di esempio
  • Basato su Apache HTTPClient


Pubblico

Sviluppatori, Architetti


Interfaccia utente

Altalena Java


Linguaggio di programmazione

Java


Ambiente database

Basato su XML


Questa è un'applicazione che può anche essere scaricata da https://sourceforge.net/projects/webstraktor/. È stato ospitato in OnWorks per essere eseguito online in modo più semplice da uno dei nostri sistemi operativi gratuiti.


Server e workstation gratuiti

Scarica app per Windows e Linux

  • 1
    AstrOrzPlayer
    AstrOrzPlayer
    AstrOrz Player è un lettore multimediale gratuito
    software, in parte basato su WMP e VLC. Il
    giocatore è in uno stile minimalista, con
    più di dieci colori a tema, e può anche
    b ...
    Scarica AstrOrzPlayer
  • 2
    movistartv
    movistartv
    Kodi Movistar+ TV è un ADDON per XBMC/
    Kodi che permette di disporre di un
    decodificatore dei servizi IPTV de
    Movistar integrato in uno de los
    mediacenter ma...
    Scarica movistartv
  • 3
    Code :: Blocks
    Code :: Blocks
    Code::Blocks è un software gratuito, open-source,
    IDE multipiattaforma C, C++ e Fortran
    costruito per soddisfare le esigenze più esigenti
    dei suoi utenti. È progettato per essere molto
    estende...
    Scarica Codice::Blocchi
  • 4
    in mezzo a
    in mezzo a
    Tra o interfaccia avanzata di Minecraft
    e il monitoraggio dati/struttura è uno strumento per
    mostra una panoramica di un Minecraft
    mondo, senza crearlo. Esso
    Potere ...
    Scarica In mezzo
  • 5
    MSYS2
    MSYS2
    MSYS2 è una raccolta di strumenti e
    biblioteche che ti forniscono un
    ambiente di facile utilizzo per la costruzione,
    installazione ed esecuzione di Windows nativo
    Software. Con...
    Scarica MSYS2
  • 6
    libjpeg-turbo
    libjpeg-turbo
    libjpeg-turbo è un codec di immagine JPEG
    che utilizza istruzioni SIMD (MMX, SSE2,
    NEON, AltiVec) per accelerare la linea di base
    Compressione e decompressione JPEG attiva
    x86, x8...
    Scarica libjpeg-turbo
  • Di Più "

Comandi Linux

Ad