Il s'agit de l'application Linux nommée mec extraction de données simple dont la dernière version peut être téléchargée sous EnablePoetryvirtualenv.zip. Il peut être exécuté en ligne chez le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez en ligne gratuitement cette application nommée dude extraction de données simple avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN
Ad
mec extraction de données simple
DESCRIPTION
Dude est un cadre très simple pour écrire des grattoirs Web à l'aide de décorateurs Python. La conception, inspirée de Flask, consistait à créer facilement un grattoir Web en quelques lignes de code seulement. Dude a une syntaxe facile à apprendre. Dude est actuellement en pré-alpha. Veuillez vous attendre à des changements avec rupture. Vous pouvez exécuter votre scraper à partir du terminal/shell/ligne de commande en fournissant des URL, le nom de fichier de sortie de votre choix et les chemins d'accès à vos scripts python à la commande dude scrape.
Caractéristiques
- Grattoir Web minimal
- La sortie dans data.json doit contenir l'URL réelle et les métadonnées précédées d'un trait de soulignement
- Conception simple inspirée de Flask - construisez un grattoir avec des décorateurs
- Utilise l'API Playwright - exécutez votre scraper dans Chrome, Firefox et Webkit et tirez parti du puissant moteur de sélection de Playwright prenant en charge CSS, XPath, texte, regex, etc.
- Regroupement de données - résultats liés au groupe
- Correspondance de modèle d'URL - exécuter des fonctions sur les URL correspondantes
- Fonction de configuration - activez les étapes de configuration (en cliquant sur les boîtes de dialogue ou en vous connectant)
Langage de programmation
Python
Catégories
Il s'agit d'une application qui peut également être récupérée à partir de https://sourceforge.net/projects/dude-uncomp-data-ext.mirror/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.