Đây là ứng dụng Linux có tên Grab Framework Project, có thể tải xuống bản phát hành mới nhất dưới dạng v0.6.40.zip. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng này có tên Grab Framework Project with OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH
Ad
Dự án khung Grab
MÔ TẢ
Grab là một khung python để xây dựng trình dọn dẹp web. Với Grab, bạn có thể xây dựng các trình thu thập dữ liệu web có độ phức tạp khác nhau, từ các tập lệnh 5 dòng đơn giản đến trình thu thập dữ liệu trang web không đồng bộ phức tạp xử lý hàng triệu trang web. Grab cung cấp một API để thực hiện các yêu cầu mạng và để xử lý nội dung nhận được, ví dụ như tương tác với cây DOM của tài liệu HTML. API yêu cầu/phản hồi duy nhất cho phép bạn tạo yêu cầu mạng, thực hiện yêu cầu đó và làm việc với nội dung nhận được. API được xây dựng trên các thư viện urllib3 và lxml. API Spider để xây dựng trình thu thập dữ liệu web không đồng bộ. Bạn viết các lớp xác định trình xử lý cho từng loại yêu cầu mạng. Mỗi trình xử lý có thể sinh ra các yêu cầu mạng mới. Các yêu cầu mạng được xử lý đồng thời với một nhóm ổ cắm web không đồng bộ. Grab cung cấp giao diện có tên là Spider để phát triển các công cụ dọn dẹp trang web đa luồng.
Tính năng
- Hỗ trợ cookie (phiên) tự động
- Hỗ trợ proxy HTTPS/SOCKS có/không có xác thực
- IDN hỗ trợ
- Công cụ để làm việc với các biểu mẫu web
- Dễ dàng tải lên nhiều tập tin
- Tùy chỉnh linh hoạt các yêu cầu HTTP
Ngôn ngữ lập trình
Python
Danh Mục
Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/grab-framework-project.mirror/. Nó đã được lưu trữ trong OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong các Hệ điều hành miễn phí của chúng tôi.