זוהי אפליקציית לינוקס בשם Scrapy שניתן להוריד את המהדורה האחרונה שלה בתור 2.11.0sourcecode.zip. ניתן להפעיל אותו באופן מקוון בספק האירוח החינמי OnWorks עבור תחנות עבודה.
הורד והפעל באינטרנט את האפליקציה הזו בשם Scrapy עם OnWorks בחינם.
בצע את ההוראות הבאות כדי להפעיל את האפליקציה הזו:
- 1. הורד את היישום הזה למחשב שלך.
- 2. הזן במנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש שאתה רוצה.
- 3. העלה את היישום הזה במנהל קבצים כזה.
- 4. הפעל את האמולטור המקוון של OnWorks Linux או Windows מקוון או אמולטור מקוון של MACOS מאתר זה.
- 5. ממערכת ההפעלה OnWorks Linux שזה עתה התחלת, עבור אל מנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש הרצוי.
- 6. הורד את האפליקציה, התקן אותה והפעל אותה.
בצילומי מסך
Ad
גרד
תיאור
Scrapy היא מסגרת מהירה, קוד פתוח, ברמה גבוהה לסריקת אתרים וחילוץ נתונים מובנים מאתרים אלו. נייד וכתוב ב-Python, זה יכול לרוץ על Windows, Linux, macOS ו-BSD.
Scrapy הוא עוצמתי, מהיר ופשוט, וגם ניתן להרחבה בקלות. פשוט כתוב את הכללים כדי לחלץ את הנתונים, והוסף פונקציונליות חדשה אם תרצה מבלי לגעת בליבה. Scrapy עושה את השאר, וניתן להשתמש בו במספר יישומים. זה יכול לשמש עבור כריית נתונים, ניטור ובדיקות אוטומטיות.
תכונות
- תמיכה מובנית בבחירה וחילוץ נתונים ממקורות HTML/XML באמצעות ביטויי XPath מורחבים ובוררי CSS, עם שיטות עוזרות לחילוץ באמצעות ביטויים רגולריים
- מסוף מעטפת אינטראקטיבי לשימוש בביטויי CSS ו-XPath כדי לגרד נתונים
- תמיכה מובנית ביצירת יצוא עדכונים במספר פורמטים שונים (JSON, XML, CSV) ואחסון שלהם בקצה אחורי (S3, FTP, מערכת קבצים מקומית)
- תמיכה בקידוד וזיהוי אוטומטי
- תמיכה חזקה בהרחבה
- שפע של הרחבות מובנות ותוכנות ביניים עבור קובצי Cookie וטיפול בהפעלה, robots.txt, הגבלת עומק סריקה ועוד
- קונסולת Telnet לחיבור לקונסולת Python הפועלת בתהליך ה-Scrapy שלך
- עכבישים לשימוש חוזר, צינור מדיה, פותר DNS למטמון ועוד
שפת תכנות
פיתון
כל הקטגוריות
זוהי אפליקציה שניתן להביא גם מ-https://sourceforge.net/projects/scrapy.mirror/. זה התארח ב-OnWorks על מנת להפעיל אותו באינטרנט בצורה הקלה ביותר מאחת ממערכות ההפעלה החינמיות שלנו.