هذا هو تطبيق Linux المسمى go_spider والذي يمكن تنزيل أحدث إصدار له باسم Version1.2.zip. يمكن تشغيله عبر الإنترنت في مزود الاستضافة المجاني OnWorks لمحطات العمل.
قم بتنزيل وتشغيل هذا التطبيق المسمى go_spider مع OnWorks عبر الإنترنت مجانًا.
اتبع هذه التعليمات لتشغيل هذا التطبيق:
- 1. قم بتنزيل هذا التطبيق على جهاز الكمبيوتر الخاص بك.
- 2. أدخل في مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX باسم المستخدم الذي تريده.
- 3. تحميل هذا التطبيق في هذا الملف.
- 4. ابدأ تشغيل OnWorks Linux عبر الإنترنت أو محاكي Windows عبر الإنترنت أو محاكي MACOS عبر الإنترنت من هذا الموقع.
- 5. من نظام تشغيل OnWorks Linux الذي بدأته للتو ، انتقل إلى مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX مع اسم المستخدم الذي تريده.
- 6. قم بتنزيل التطبيق وتثبيته وتشغيله.
SCREENSHOTS
Ad
go_spider
الوصف
إطار عمل (العنكبوت) الزاحف المتزامن الرائع. الزاحف مرن وقياسي. يمكن توسيعه إلى برنامج زاحف فردي بسهولة أو يمكنك استخدام مكونات الزحف الافتراضية فقط. يحصل العنكبوت على طلب في المجدول يحتوي على عنوان url ليتم الزحف إليه. ثم يقوم Downloader بتنزيل نتيجة الطلب (html ، json ، jsonp ، text). يتم حفظ النتيجة في الصفحة لتحليلها في معالج الصفحة. يعتمد تحليل Html على حزمة goquery. يعتمد تحليل Json على حزمة JSON البسيطة. سوف تتحدث Jsonp إلى json. يمثل نموذج النص محتوى نص عادي بدون محلل. معامل PageProcesser يوزع النتائج فقط. يحصل الوسيط على النتائج (أزواج المفتاح والقيمة) وعناوين URL ليتم الزحف إليها في الخطوة التالية. سيتم حفظ أزواج المفاتيح والقيمة هذه في PageItems وسيتم دفع عناوين url في المجدول.
المميزات
- يتطلب Go 1.2 أو أعلى
- منافس
- يصلح للمجتمعات الرأسية
- مرنة ، معيارية
- تنفيذ Native Go
- يمكن توسيعها إلى زاحف فردي بسهولة
لغة البرمجة
Go
الأقسام
هذا تطبيق يمكن جلبه أيضًا من https://sourceforge.net/projects/go-spider.mirror/. تمت استضافته في OnWorks ليتم تشغيله عبر الإنترنت بأسهل طريقة من أحد أنظمتنا التشغيلية المجانية.