Il s'agit de l'application Windows nommée webStraktor dont la dernière version peut être téléchargée sous le nom webStraktor-20140420-R01.zip. Il peut être exécuté en ligne sur le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez en ligne cette application nommée webStraktor avec OnWorks gratuitement.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez n'importe quel émulateur en ligne OS OnWorks à partir de ce site Web, mais un meilleur émulateur en ligne Windows.
- 5. Depuis le système d'exploitation OnWorks Windows que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application et installez-la.
- 7. Téléchargez Wine depuis les dépôts de logiciels de vos distributions Linux. Une fois installé, vous pouvez ensuite double-cliquer sur l'application pour les exécuter avec Wine. Vous pouvez également essayer PlayOnLinux, une interface sophistiquée sur Wine qui vous aidera à installer des programmes et des jeux Windows populaires.
Wine est un moyen d'exécuter un logiciel Windows sur Linux, mais sans Windows requis. Wine est une couche de compatibilité Windows open source qui peut exécuter des programmes Windows directement sur n'importe quel bureau Linux. Essentiellement, Wine essaie de ré-implémenter suffisamment de Windows à partir de zéro pour qu'il puisse exécuter toutes ces applications Windows sans avoir réellement besoin de Windows.
CAPTURES D'ÉCRAN
Ad
webStraktor
DESCRIPTION
webStraktor est un client d'extraction de données World Wide Web programmable. Son objectif est de récupérer le contenu HTML via le protocole HTTP et d'extraire les informations pertinentes. webStraktor dispose d'un langage de script pour faciliter la collecte, l'extraction et le stockage des informations disponibles sur le web, y compris les images. Le langage de script utilise des éléments de l'expression régulière et de la syntaxe xPath. Le langage de script webStraktor a un petit jeu d'instructions et sa syntaxe est facile à maîtriser.
Le format de sortie standard de webStraktor est basé sur XML, soit dans les pages de codes ASCII, UTF-8 ou ISO-8859-1 (Latin1).
webStraktor s'appuie sur Apache HttpClient pour récupérer le contenu via le protocole HTTP. Il adhère au protocole d'exclusion des robots et peut être configuré pour fonctionner de manière anonyme en se connectant aux types prédominants de serveurs proxy Web.
webStraktor étend les fonctionnalités des robots d'exploration, des araignées ou des robots en intégrant des capacités de grattage et d'exploration.
Fonctionnalités
- robot d'indexation programmable (web spider ou web bot)
- langage de script facile à maîtriser
- environnement de développement graphique basé sur java swing
- Sortie XML UTF8 ou ISO-8859-1
- s'intègre aux applications de planification facilement disponibles
- configuration exhaustive
- prise en charge du serveur proxy Web
- prise en charge du protocole d'exclusion de robot
- signature de l'agent utilisateur configurable
- tutoriel étape par étape et exemples de scripts
- Basé sur Apache HttpClient
Audience
Développeurs, Architectes
Interface utilisateur
Balançoire Java
Langage de programmation
Java
Environnement de base de données
Basé sur XML
Il s'agit d'une application qui peut également être récupérée à partir de https://sourceforge.net/projects/webstraktor/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.