Il s'agit de l'application Windows nommée WebMagic dont la dernière version peut être téléchargée en tant que WebMagic-0.9.1.zip. Il peut être exécuté en ligne dans le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez en ligne gratuitement cette application nommée WebMagic avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez n'importe quel émulateur en ligne OS OnWorks à partir de ce site Web, mais un meilleur émulateur en ligne Windows.
- 5. Depuis le système d'exploitation OnWorks Windows que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application et installez-la.
- 7. Téléchargez Wine depuis les dépôts de logiciels de vos distributions Linux. Une fois installé, vous pouvez ensuite double-cliquer sur l'application pour les exécuter avec Wine. Vous pouvez également essayer PlayOnLinux, une interface sophistiquée sur Wine qui vous aidera à installer des programmes et des jeux Windows populaires.
Wine est un moyen d'exécuter un logiciel Windows sur Linux, mais sans Windows requis. Wine est une couche de compatibilité Windows open source qui peut exécuter des programmes Windows directement sur n'importe quel bureau Linux. Essentiellement, Wine essaie de ré-implémenter suffisamment de Windows à partir de zéro pour qu'il puisse exécuter toutes ces applications Windows sans avoir réellement besoin de Windows.
CAPTURES D'ÉCRAN
Ad
WebMagie
DESCRIPTION
WebMagic est un framework de crawler évolutif. Il couvre tout le cycle de vie du crawler, du téléchargement, de la gestion des URL, de l'extraction de contenu et de la persistance. Cela peut simplifier le développement d'un robot d'exploration spécifique. WebMagic est un framework de crawler simple mais évolutif. Vous pouvez facilement développer un robot d'exploration basé sur celui-ci. WebMagic a un noyau simple avec une grande flexibilité, une API simple pour l'extraction html. Il fournit également des annotations avec POJO pour personnaliser un robot d'exploration, et aucune configuration n'est nécessaire. Certaines autres fonctionnalités incluent le fait qu'il est multi-thread et qu'il prend en charge la distribution. WebMagic est très facile à intégrer. Ajoutez des dépendances à votre pom.xml. WebMagic utilise slf4j avec l'implémentation slf4j-log4j12. Si vous avez personnalisé votre implémentation slf4j, veuillez exclure slf4j-log4j12. Vous pouvez écrire une implémentation de classe de PageProcessor.
Fonctionnalités
- Noyau simple avec une grande flexibilité
- API simple pour l'extraction HTML
- Annotation avec POJO pour personnaliser un crawler, pas de configuration
- Prise en charge du multithread et de la distribution
- Facile à intégrer
- Il couvre tout le cycle de vie du crawler
Langage de programmation
Java
Catégories
Il s'agit d'une application qui peut également être récupérée à partir de https://sourceforge.net/projects/webmagic.mirror/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.