Questa è l'app Linux denominata WebMagic la cui ultima versione può essere scaricata come WebMagic-0.9.1.zip. Può essere eseguito online nel provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online questa app chiamata WebMagic con OnWorks gratuitamente.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avviare l'emulatore online OnWorks Linux o Windows online o l'emulatore online MACOS da questo sito Web.
- 5. Dal sistema operativo OnWorks Linux che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione, installala ed eseguila.
IMMAGINI
Ad
WebMagia
DESCRIZIONE
WebMagic è un framework crawler scalabile. Copre l'intero ciclo di vita di crawler, download, gestione degli URL, estrazione dei contenuti e persistente. Può semplificare lo sviluppo di un crawler specifico. WebMagic è un framework crawler semplice ma scalabile. Puoi sviluppare facilmente un crawler basato su di esso. WebMagic ha un nucleo semplice con elevata flessibilità, una semplice API per l'estrazione di html. Fornisce inoltre annotazioni con POJO per personalizzare un crawler e non è necessaria alcuna configurazione. Alcune altre caratteristiche includono il fatto che è multi-thread e ha il supporto per la distribuzione. WebMagic è molto facile da integrare. Aggiungi dipendenze al tuo pom.xml. WebMagic utilizza slf4j con l'implementazione slf4j-log4j12. Se hai personalizzato la tua implementazione slf4j, escludi slf4j-log4j12. È possibile scrivere un'implementazione di classe di PageProcessor.
Caratteristiche
- Nucleo semplice con elevata flessibilità
- API semplice per l'estrazione di html
- Annotazione con POJO per personalizzare un crawler, nessuna configurazione
- Supporto multi-thread e distribuzione
- Facile da integrare
- Copre l'intero ciclo di vita del crawler
Linguaggio di programmazione
Java
Categorie
Questa è un'applicazione che può anche essere recuperata da https://sourceforge.net/projects/webmagic.mirror/. È stato ospitato in OnWorks per poter essere eseguito online nel modo più semplice da uno dei nostri Sistemi Operativi gratuiti.