นี่คือแอป Linux ชื่อ webStraktor ซึ่งสามารถดาวน์โหลดรุ่นล่าสุดเป็น webStraktor-20140420-R01.zip สามารถเรียกใช้ออนไลน์ใน OnWorks ผู้ให้บริการโฮสต์ฟรีสำหรับเวิร์กสเตชัน
ดาวน์โหลดและเรียกใช้แอปนี้ออนไลน์ชื่อ webStraktor พร้อม OnWorks ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ
Ad
เว็บStraktor
DESCRIPTION
webStraktor เป็นไคลเอนต์การดึงข้อมูลเวิลด์ไวด์เว็บที่ตั้งโปรแกรมได้ จุดประสงค์คือเพื่อขูดเนื้อหาที่ใช้ HTML ผ่านโปรโตคอล HTTP และดึงข้อมูลที่เกี่ยวข้อง webStraktor นำเสนอภาษาสคริปต์เพื่ออำนวยความสะดวกในการรวบรวม การดึงข้อมูล และการจัดเก็บข้อมูลที่มีอยู่บนเว็บ รวมถึงรูปภาพ ภาษาสคริปต์ใช้องค์ประกอบของนิพจน์ทั่วไปและไวยากรณ์ xPath ภาษาสคริปต์ของ webStraktor มีชุดคำสั่งขนาดเล็กและไวยากรณ์ของภาษานั้นง่ายต่อการควบคุม
รูปแบบเอาต์พุต webStraktor มาตรฐานเป็นแบบ XML ทั้งในหน้าโค้ด ASCII, UTF-8 หรือ ISO-8859-1 (Latin1)
webStraktor อาศัย Apache HttpClient ในการดึงเนื้อหาผ่านโปรโตคอล HTTP มันยึดตาม Robots Exclusion Protocol และสามารถกำหนดค่าให้ทำงานในลักษณะที่ไม่ระบุตัวตนได้โดยการเชื่อมต่อกับเว็บพร็อกซีเซิร์ฟเวอร์ประเภทหลัก
webStraktor ขยายฟังก์ชันการทำงานของโปรแกรมรวบรวมข้อมูลเว็บ สไปเดอร์ หรือบอท โดยการผสานรวมความสามารถในการดึงข้อมูลและการรวบรวมข้อมูล
คุณสมบัติ
- โปรแกรมรวบรวมข้อมูลเว็บที่ตั้งโปรแกรมได้ (เว็บสไปเดอร์หรือเว็บบอท)
- ง่ายต่อการใช้ภาษาสคริปต์
- สภาพแวดล้อมการพัฒนากราฟิกตาม java สวิง
- เอาต์พุต XML UTF8 หรือ ISO-8859-1
- ผสานรวมกับแอปพลิเคชันการตั้งเวลาที่พร้อมใช้งาน
- การกำหนดค่าที่ละเอียดถี่ถ้วน
- รองรับเว็บพร็อกซีเซิร์ฟเวอร์
- รองรับโปรโตคอลการยกเว้นโรบ็อต
- ลายเซ็นตัวแทนผู้ใช้ที่กำหนดค่าได้
- บทแนะนำทีละขั้นตอนและสคริปต์ตัวอย่าง
- Apache HttpClient ตาม
ผู้ชม
นักพัฒนา สถาปนิก
ส่วนติดต่อผู้ใช้
ชวา สวิง
ภาษาโปรแกรม
ชวา
สภาพแวดล้อมฐานข้อมูล
แบบ XML
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/webstraktor/ มีการโฮสต์ใน OnWorks เพื่อให้ทำงานออนไลน์ในวิธีที่ง่ายที่สุดจากหนึ่งในระบบปฏิบัติการฟรีของเรา