英语法语西班牙语

OnWorks 网站图标

scrapy - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 scrapy

这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 scrapy,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


scrapy - Scrapy 命令行工具

概要


scrapy [命令[配置] ...

商品描述


Scrapy 是通过 scrapy 命令行工具。 该脚本提供了几个
命令,用于不同的目的。 每个命令都支持它自己的特定语法。 在
换句话说,每个命令都支持一组不同的参数和选项。

配置


[OPTION] 网址
使用 Scrapy 下载器获取 URL

--标题
打印响应 HTTP 标头而不是正文

运行蜘蛛 [OPTION] 蜘蛛文件
运行蜘蛛

--输出=文件
将抓取的项目以 XML 格式存储到 FILE

设置 [OPTION]
查询 Scrapy 设置

--get=设置
打印原始设置值

--getbool=设置
打印设置值,解释为布尔值

--getint=设置
打印设置值,解释为整数

--getfloat=设置
打印设置值,解释为浮点数

--getlist=设置
打印设置值,解释为浮点数

- 在里面 打印初始设置值(加载扩展和蜘蛛之前)

网址 | 文件
启动交互式抓取控制台

启动项目 项目名
使用初始项目模板创建新项目

- 帮助, -h
打印命令帮助和选项

--logfile=文件
日志文件。 如果省略 stderr 将被使用

--loglevel=级别, -L LEVEL
日志级别(默认:无)

--nolog
完全禁用日志记录

--spider=蜘蛛
当参数是 url 时总是使用这个蜘蛛

--profile=文件
将 python cProfile 统计数据写入 FILE

--lsprof=文件
将 lsprof 分析统计数据写入 FILE

--pidfile=文件
将进程 ID 写入 FILE

--set=NAME=VALUE, -s NAME = VALUE
设置/覆盖设置(可重复)

使用 onworks.net 服务在线使用scrapy


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    移相器
    移相器
    Phaser 是一个快速、免费且有趣的开放式
    源 HTML5 游戏框架,提供
    WebGL 和 Canvas 渲染
    桌面和移动网络浏览器。 游戏
    可以共...
    下载移相器
  • 2
    附庸引擎
    附庸引擎
    VASSAL 是一个游戏引擎,用于创建
    电子版传统板
    和纸牌游戏。 它提供支持
    游戏块渲染和交互,
    和...
    下载 VASSAL 引擎
  • 3
    OpenPDF - iText 的分支
    OpenPDF - iText 的分支
    OpenPDF 是一个 Java 库,用于创建
    以及使用 LGPL 编辑 PDF 文件和
    MPL 开源许可证。 OpenPDF 是
    iText 的 LGPL/MPL 开源继承者,
    一个...
    下载 OpenPDF - iText 的分支
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - 自动化系统
    地球科学分析 - 是地理
    信息系统 (GIS) 软件
    地理数据的强大功能
    加工和分析...
    下载 SAGA GIS
  • 5
    Java/JTOpen 工具箱
    Java/JTOpen 工具箱
    IBM Toolbox for Java / JTOpen 是一个
    Java类库支持
    客户端/服务器和互联网编程
    模型到运行 OS/400 的系统,
    i5/OS, 哦...
    下载 Java/JTOpen 工具箱
  • 6
    D3.js
    D3.js
    D3.js(或数据驱动文档的 D3)
    是一个 JavaScript 库,它允许你
    生成动态的交互式数据
    Web 浏览器中的可视化。 与D3
    您...
    下载 D3.js
  • 更多 ”

Linux 命令

Ad