Bu, en son sürümü webStraktor-20140420-R01.zip olarak indirilebilen webStraktor adlı Linux uygulamasıdır. İş istasyonları için ücretsiz barındırma sağlayıcısı OnWorks'te çevrimiçi olarak çalıştırılabilir.
WebStraktor adlı bu uygulamayı OnWorks ile ücretsiz olarak indirin ve çevrimiçi çalıştırın.
Bu uygulamayı çalıştırmak için şu talimatları izleyin:
- 1. Bu uygulamayı PC'nize indirdiniz.
- 2. Dosya yöneticimize https://www.onworks.net/myfiles.php?username=XXXXX istediğiniz kullanıcı adını girin.
- 3. Bu uygulamayı böyle bir dosya yöneticisine yükleyin.
- 4. Bu web sitesinden OnWorks Linux çevrimiçi veya Windows çevrimiçi öykünücüsünü veya MACOS çevrimiçi öykünücüsünü başlatın.
- 5. Yeni başladığınız OnWorks Linux işletim sisteminden, istediğiniz kullanıcı adıyla https://www.onworks.net/myfiles.php?username=XXXXX dosya yöneticimize gidin.
- 6. Uygulamayı indirin, kurun ve çalıştırın.
EKRAN
Ad
webStraktörü
TANIM
webStraktor, programlanabilir bir World Wide Web veri çıkarma istemcisidir. Amacı, HTML tabanlı içeriği HTTP protokolü aracılığıyla sıyırmak ve ilgili bilgileri çıkarmaktır. webStraktor, resimler de dahil olmak üzere web'de bulunan bilgilerin toplanmasını, çıkarılmasını ve depolanmasını kolaylaştırmak için bir komut dosyası diline sahiptir. Komut dosyası dili, Normal İfade ve xPath sözdiziminin öğelerini kullanır. webStraktor betik dilinin küçük bir komut seti vardır ve sözdiziminde ustalaşmak kolaydır.
Standart webStraktor çıktı formatı, ASCII, UTF-8 veya ISO-8859-1 (Latin1) kod sayfalarında XML tabanlıdır.
webStraktor, HTTP protokolü aracılığıyla içerik almak için Apache HttpClient'e güvenir. Robotları Dışlama Protokolüne bağlıdır ve baskın web proxy sunucu türlerine bağlanarak anonim bir şekilde çalışacak şekilde yapılandırılabilir.
webStraktor, kazıma ve tarama yeteneklerini entegre ederek web tarayıcılarının, örümceklerin veya botların işlevselliğini genişletir.
Özellikler
- programlanabilir web tarayıcısı (web örümceği veya web botu)
- ustalaşması kolay betik dili
- java salıncak tabanlı grafik geliştirme ortamı
- UTF8 veya ISO-8859-1 XML çıktısı
- hazır zamanlama uygulamalarıyla bütünleşir
- kapsamlı yapılandırma
- web proxy sunucu desteği
- robot dışlama protokolü desteği
- yapılandırılabilir Kullanıcı Aracısı imzası
- adım adım öğretici ve örnek komut dosyaları
- Apache HttpClient tabanlı
Seyirci
Geliştiriciler, Mimarlar
Kullanıcı arabirimi
Java Salıncak
Programlama dili
Java
Veritabanı Ortamı
XML tabanlı
Bu, https://sourceforge.net/projects/webstraktor/ adresinden de getirilebilen bir uygulamadır. Ücretsiz İşletim Sistemlerimizden birinden en kolay şekilde çevrimiçi çalıştırılabilmesi için OnWorks'te barındırılmıştır.