ภาษาอังกฤษอาหารฝรั่งเศสสเปน

ไอคอน Fav ของ OnWorks

ดาวน์โหลด webStraktor สำหรับ Linux

ดาวน์โหลดแอป webStraktor Linux ฟรีเพื่อทำงานออนไลน์ใน Ubuntu ออนไลน์, Fedora ออนไลน์หรือ Debian ออนไลน์

นี่คือแอป Linux ชื่อ webStraktor ซึ่งสามารถดาวน์โหลดรุ่นล่าสุดเป็น webStraktor-20140420-R01.zip สามารถเรียกใช้ออนไลน์ใน OnWorks ผู้ให้บริการโฮสต์ฟรีสำหรับเวิร์กสเตชัน

ดาวน์โหลดและเรียกใช้แอปนี้ออนไลน์ชื่อ webStraktor พร้อม OnWorks ฟรี

ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:

- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ

- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ

- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว

- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้

- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ

- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้

ภาพหน้าจอ

Ad


เว็บStraktor


DESCRIPTION

webStraktor เป็นไคลเอนต์การดึงข้อมูลเวิลด์ไวด์เว็บที่ตั้งโปรแกรมได้ จุดประสงค์คือเพื่อขูดเนื้อหาที่ใช้ HTML ผ่านโปรโตคอล HTTP และดึงข้อมูลที่เกี่ยวข้อง webStraktor นำเสนอภาษาสคริปต์เพื่ออำนวยความสะดวกในการรวบรวม การดึงข้อมูล และการจัดเก็บข้อมูลที่มีอยู่บนเว็บ รวมถึงรูปภาพ ภาษาสคริปต์ใช้องค์ประกอบของนิพจน์ทั่วไปและไวยากรณ์ xPath ภาษาสคริปต์ของ webStraktor มีชุดคำสั่งขนาดเล็กและไวยากรณ์ของภาษานั้นง่ายต่อการควบคุม
รูปแบบเอาต์พุต webStraktor มาตรฐานเป็นแบบ XML ทั้งในหน้าโค้ด ASCII, UTF-8 หรือ ISO-8859-1 (Latin1)
webStraktor อาศัย Apache HttpClient ในการดึงเนื้อหาผ่านโปรโตคอล HTTP มันยึดตาม Robots Exclusion Protocol และสามารถกำหนดค่าให้ทำงานในลักษณะที่ไม่ระบุตัวตนได้โดยการเชื่อมต่อกับเว็บพร็อกซีเซิร์ฟเวอร์ประเภทหลัก
webStraktor ขยายฟังก์ชันการทำงานของโปรแกรมรวบรวมข้อมูลเว็บ สไปเดอร์ หรือบอท โดยการผสานรวมความสามารถในการดึงข้อมูลและการรวบรวมข้อมูล



คุณสมบัติ

  • โปรแกรมรวบรวมข้อมูลเว็บที่ตั้งโปรแกรมได้ (เว็บสไปเดอร์หรือเว็บบอท)
  • ง่ายต่อการใช้ภาษาสคริปต์
  • สภาพแวดล้อมการพัฒนากราฟิกตาม java สวิง
  • เอาต์พุต XML UTF8 หรือ ISO-8859-1
  • ผสานรวมกับแอปพลิเคชันการตั้งเวลาที่พร้อมใช้งาน
  • การกำหนดค่าที่ละเอียดถี่ถ้วน
  • รองรับเว็บพร็อกซีเซิร์ฟเวอร์
  • รองรับโปรโตคอลการยกเว้นโรบ็อต
  • ลายเซ็นตัวแทนผู้ใช้ที่กำหนดค่าได้
  • บทแนะนำทีละขั้นตอนและสคริปต์ตัวอย่าง
  • Apache HttpClient ตาม


ผู้ชม

นักพัฒนา สถาปนิก


ส่วนติดต่อผู้ใช้

ชวา สวิง


ภาษาโปรแกรม

ชวา


สภาพแวดล้อมฐานข้อมูล

แบบ XML


นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/webstraktor/ มีการโฮสต์ใน OnWorks เพื่อให้ทำงานออนไลน์ในวิธีที่ง่ายที่สุดจากหนึ่งในระบบปฏิบัติการฟรีของเรา


เซิร์ฟเวอร์และเวิร์กสเตชันฟรี

ดาวน์โหลดแอพ Windows & Linux

คำสั่ง Linux

Ad