Ini adalah aplikasi Linux bernama webStraktor yang rilis terbarunya dapat diunduh sebagai webStraktor-20140420-R01.zip. Ini dapat dijalankan secara online di penyedia hosting gratis OnWorks untuk workstation.
Unduh dan jalankan aplikasi ini secara online bernama webStraktor dengan OnWorks secara gratis.
Ikuti petunjuk ini untuk menjalankan aplikasi ini:
- 1. Download aplikasi ini di PC Anda.
- 2. Masuk ke file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan username yang anda inginkan.
- 3. Upload aplikasi ini di filemanager tersebut.
- 4. Jalankan emulator online OnWorks Linux atau Windows online atau emulator online MACOS dari situs web ini.
- 5. Dari OS Linux OnWorks yang baru saja Anda mulai, buka file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan nama pengguna yang Anda inginkan.
- 6. Download aplikasinya, install dan jalankan.
Tangkapan layar
Ad
webStraktor
DESKRIPSI
webStraktor adalah klien ekstraksi data World Wide Web yang dapat diprogram. Tujuannya adalah untuk mengikis konten berbasis HTML melalui protokol HTTP dan mengekstrak informasi yang relevan. webStraktor memiliki bahasa skrip untuk memfasilitasi pengumpulan, ekstraksi, dan penyimpanan informasi yang tersedia di web, termasuk gambar. Bahasa scripting menggunakan elemen dari Regular Expression dan sintaks xPath. Bahasa skrip webStraktor memiliki set instruksi kecil dan sintaksnya mudah dikuasai.
Format keluaran webStraktor standar berbasis XML, baik dalam halaman kode ASCII, UTF-8 atau ISO-8859-1 (Latin1).
webStraktor bergantung pada Apache HttpClient untuk mengambil konten melalui protokol HTTP. Ini mematuhi Protokol Pengecualian Robot dan dapat dikonfigurasi untuk beroperasi secara anonim dengan menghubungkan ke jenis server proxy web yang dominan.
webStraktor memperluas fungsionalitas perayap web, laba-laba, atau bot dengan mengintegrasikan kemampuan pengikisan dan perayapan.
Fitur
- perayap web yang dapat diprogram (web spider atau bot web)
- bahasa scripting yang mudah dikuasai
- lingkungan pengembangan grafis berbasis java swing
- Keluaran XML UTF8 atau ISO-8859-1
- terintegrasi dengan aplikasi penjadwalan yang tersedia
- konfigurasi lengkap
- dukungan server proxy web
- dukungan protokol pengecualian robot
- tanda tangan Agen Pengguna yang dapat dikonfigurasi
- tutorial langkah demi langkah dan contoh skrip
- Berbasis Apache HttpClient
Para penonton
Pengembang, Arsitek
User interface
Ayunan Jawa
Bahasa Pemrograman
Jawa
Lingkungan Basis Data
berbasis XML
Ini adalah aplikasi yang juga dapat diambil dari https://sourceforge.net/projects/webstractor/. Ini telah di-host di OnWorks untuk dijalankan secara online dengan cara termudah dari salah satu Sistem Operasi gratis kami.