这是名为 Petastorm 的 Linux 应用程序,其最新版本可以下载为 Releasev0.12.1.zip。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为 Petastorm 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
暴风雨
商品描述
Petastorm 库支持从 Apache Parquet 格式的数据集中对深度学习模型进行单机或分布式训练和评估。 它支持 ML 框架,例如 Tensorflow、Pytorch 和 PySpark,并且可以从纯 Python 代码中使用。 Petastorm 是 Uber ATG 开发的开源数据访问库。 该库支持直接从 Apache Parquet 格式的数据集中对深度学习模型进行单机或分布式训练和评估。 Petastorm 支持流行的基于 Python 的机器学习 (ML) 框架,例如 Tensorflow、PyTorch 和 PySpark。 它也可以在纯 Python 代码中使用。 使用 Petastorm 创建的数据集以 Apache Parquet 格式存储。 在 Parquet 模式之上,petastorm 还存储更高级别的模式信息,这些信息使多维数组成为 petastorm 数据集的本机部分。 Petastorm 支持可扩展的数据编解码器。 这些使用户能够使用标准数据压缩之一(jpeg、png)或实现她自己的。
产品优势
- 选择性列读数
- 开源数据访问库
- 多种并行策略:线程、进程、单线程(用于调试)
- 纯 Python API
- 行过滤(行谓词)
- 多 GPU 训练的分区
程式语言
Python
分类
这是一个也可以从 https://sourceforge.net/projects/petastorm.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便以最简单的方式从我们的免费操作系统之一在线运行。