Il s'agit de l'application Linux nommée Petastorm dont la dernière version peut être téléchargée en tant que Releasev0.12.1.zip. Il peut être exécuté en ligne dans le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez en ligne gratuitement cette application nommée Petastorm avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN:
Pétatempête
DESCRIPTION:
La bibliothèque Petastorm permet la formation et l'évaluation sur une seule machine ou distribuée de modèles d'apprentissage en profondeur à partir d'ensembles de données au format Apache Parquet. Il prend en charge les frameworks ML tels que Tensorflow, Pytorch et PySpark et peut être utilisé à partir de code Python pur. Petastorm est une bibliothèque d'accès aux données open source développée chez Uber ATG. Cette bibliothèque permet la formation et l'évaluation de modèles d'apprentissage en profondeur sur une seule machine ou distribuée directement à partir d'ensembles de données au format Apache Parquet. Petastorm prend en charge les frameworks d'apprentissage automatique (ML) populaires basés sur Python, tels que Tensorflow, PyTorch et PySpark. Il peut également être utilisé à partir de code Python pur. Un jeu de données créé à l'aide de Petastorm est stocké au format Apache Parquet. En plus d'un schéma Parquet, petastorm stocke également des informations de schéma de niveau supérieur qui font des tableaux multidimensionnels une partie native d'un jeu de données petastorm. Petastorm prend en charge les codecs de données extensibles. Ceux-ci permettent à un utilisateur d'utiliser l'une des compressions de données standard (jpeg, png) ou d'implémenter la sienne.
Fonctionnalités
- Lecture de colonne sélective
- Bibliothèque d'accès aux données open source
- Plusieurs stratégies de parallélisme : thread, process, mono-thread (pour le débogage)
- API Python simple
- Filtrage des lignes (prédicats de ligne)
- Partitionnement pour la formation multi-GPU
Langage de programmation
Python
Catégories
Il s'agit d'une application qui peut également être récupérée sur https://sourceforge.net/projects/petastorm.mirror/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.