Esta es la aplicación de Linux llamada Petastorm cuya última versión se puede descargar como Releasev0.12.1.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Petastorm con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
SCREENSHOTS
Ad
petarda
DESCRIPCIÓN
La biblioteca Petastorm permite el entrenamiento y la evaluación distribuidos o en una sola máquina de modelos de aprendizaje profundo a partir de conjuntos de datos en formato Apache Parquet. Admite marcos de ML como Tensorflow, Pytorch y PySpark y se puede usar desde código Python puro. Petastorm es una biblioteca de acceso a datos de código abierto desarrollada en Uber ATG. Esta biblioteca permite el entrenamiento y la evaluación distribuidos o de una sola máquina de modelos de aprendizaje profundo directamente desde conjuntos de datos en formato Apache Parquet. Petastorm es compatible con marcos populares de aprendizaje automático (ML) basados en Python, como Tensorflow, PyTorch y PySpark. También se puede utilizar desde código Python puro. Un conjunto de datos creado con Petastorm se almacena en formato Apache Parquet. Además de un esquema de Parquet, petastorm también almacena información de esquema de nivel superior que convierte las matrices multidimensionales en una parte nativa de un conjunto de datos de petastorm. Petastorm admite códecs de datos extensibles. Estos le permiten al usuario usar una de las compresiones de datos estándar (jpeg, png) o implementar la suya propia.
Caracteristicas
- Lectura de columna selectiva
- Biblioteca de acceso a datos de código abierto
- Múltiples estrategias de paralelismo: subproceso, proceso, subproceso único (para depuración)
- API de Python simple
- Filtrado de filas (predicados de fila)
- Particionamiento para entrenamiento multi-GPU
Lenguaje de programación
Python
Categorías
Esta es una aplicación que también se puede obtener desde https://sourceforge.net/projects/petastorm.mirror/. Ha sido alojado en OnWorks para poder ejecutarse online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.