Ini adalah perintah httrack yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
httrack - browser offline : salin situs web ke direktori lokal
RINGKASAN
httrack [ url ] ... [ -Saring ] ... [ + filter ] ... [ -HAI, --jalur ] [ -w, --cermin ] [ -W,
--cermin-penyihir ] [ -G, --get-file ] [ -Saya, --melanjutkan ] [ -Y, --mirrorlink ] [ -P,
--proksi ] [ -%F, --httpproxy-ftp[=N] ] [ -%B, --mengikat ] [ -rn, --kedalaman[=N] ] [ -%eN,
--ext-kedalaman[=N] ] [ -M N, --max-file[=N] ] [ -M N, --ukuran-maks[=N] ] [ -EN, --max-waktu[=N] ]
[ -NS, --tingkat maksimum[=N] ] [ -%cN, --koneksi-per-detik[=N] ] [ -GN, --max-jeda[=N] ] [
-cN, --socket[=N] ] [ -TN, --waktu habis[=N] ] [ -RN, --coba lagi[=N] ] [ -JN, --tingkat-min[=N] ]
[ -HN, --host-kontrol[=N] ] [ -%P, --penguraian-diperluas[=N] ] [ -N, --di dekat ] [ -T, --tes ]
[ -%L, --Daftar ] [ -%S, --daftar url ] [ -NN, --struktur[=N] ] [ -%D,
--cached-delayed-type-check ] [ -%M, --mime-html ] [ -LN, --nama-panjang[=N] ] [ -KN,
--keep-link[=N] ] [ -X, --ganti-eksternal ] [ -%X, --nonaktifkan-kata sandi ] [ -%Q,
--termasuk-permintaan-string ] [ -Hai, --menghasilkan-kesalahan ] [ -X, --purge-old[=N] ] [ -%P,
--melestarikan ] [ -%T, --utf8-konversi ] [ -bN, --kuki[=N] ] [ -kamu, --tipe-periksa[=N] ] [
-J, --parse-java[=N] ] [ -sn, --robot[=N] ] [ -%H, --http-10 ] [ -%k, --berusaha agar hidup ] [
-%B, --toleran ] [ -%S, --perbarui peretasan ] [ -%u, --urlhack ] [ -%SEBUAH, --menganggap ] [ -@di dalam,
--protokol[=N] ] [ -%w, --nonaktifkan-modul ] [ -F, --Agen pengguna ] [ -%R, --perujuk ] [ -%E,
--dari ] [ -%F, --catatan kaki ] [ -%l, --bahasa ] [ -%A, --menerima ] [ -%X, --header ] [ -C,
--cache[=N] ] [ -k, --store-semua-dalam-cache ] [ -%N, --jangan-menangkap kembali ] [ -%v, --menampilkan ] [
-Q, --jangan-log ] [ -Q, --diam ] [ -z, --ekstra-log ] [ -Z, --debug-log ] [ -di, --bertele-tele
] [ -F, --file-log ] [ -f2, --log-tunggal ] [ -SAYA, --indeks ] [ -%Saya, --build-top-index ] [
-%SAYA, --indeks-pencarian ] [ -PN, --prioritas[=N] ] [ -S, --tetap di-sama-dir ] [ -D,
--bisa-turun ] [ -kamu, --bisa-naik-naik ] [ -B, --bisa-naik-turun ] [ -Sebuah,
--tinggal di alamat yang sama ] [ -D, --tetap di-domain yang sama ] [ -aku, --tetap di-sama-tld ] [ -e,
--pergi-ke mana-mana ] [ -%H, --debug-header ] [ -%!, --nonaktifkan-batas-keamanan ] [ -V,
--userdef-cmd ] [ -%W, --panggilan balik ] [ -K, --keep-link[=N] ] [
DESKRIPSI
httrack memungkinkan Anda mengunduh situs World Wide Web dari Internet ke lokal
direktori, membangun secara rekursif semua direktori, mendapatkan HTML, gambar, dan file lainnya
dari server ke komputer Anda. HTTrack mengatur tautan relatif situs asli-
struktur. Cukup buka halaman situs web "tercermin" di browser Anda, dan Anda dapat
jelajahi situs dari tautan ke tautan, seolah-olah Anda melihatnya secara online. HTTtrack juga bisa
perbarui situs cermin yang ada, dan lanjutkan unduhan yang terputus.
CONTOH
httrack www.someweb.com/bob/
situs cermin www.someweb.com/bob/ dan hanya situs ini
httrack www.someweb.com/bob/ www.anothertest.com/mike/ +*.com/*.jpg -mime:aplikasi/*
mirror kedua situs bersama-sama (dengan tautan bersama) dan terima file .jpg apa pun di
situs .com
httrack www.someweb.com/bob/bobby.html +* -r6
berarti dapatkan semua file mulai dari bobby.html, dengan 6 kedalaman tautan, dan kemungkinan
pergi ke mana-mana di web
httrack www.someweb.com/bob/bobby.html --laba-laba -P proxy.myhost.com:8080
menjalankan laba-laba di www.someweb.com/bob/bobby.html menggunakan proxy
httrack --memperbarui
memperbarui cermin di folder saat ini
httrack
akan membawa Anda ke mode interaktif
httrack --melanjutkan
melanjutkan cermin di folder saat ini
PILIHAN
Umum pilihan:
-O path untuk mirror/logfiles+cache (-O path mirror[,path cache dan logfiles]) (--path
)
Tindakan pilihan:
-w *mirror situs web (--mirror)
-W mirror situs web, semi-otomatis (mengajukan pertanyaan) (--mirror-wizard)
-g hanya mendapatkan file (disimpan di direktori saat ini) (--get-files)
-i melanjutkan mirror yang terputus menggunakan cache (--continue)
-Y mencerminkan SEMUA tautan yang terletak di halaman tingkat pertama (tautan cermin) (--mirrorlinks)
wakil pilihan:
-P penggunaan proxy (-P proxy:port atau -P pengguna:pass@proxy:port) (--proxy )
-%f *gunakan proxy untuk ftp (f0 jangan gunakan) (--httpproxy-ftp[=N])
-%b gunakan nama host lokal ini untuk membuat/mengirim permintaan (-%b nama host) (--bind )
Batas pilihan:
-rN mengatur kedalaman cermin ke N (* r9999) (--kedalaman[=N])
-%eN mengatur kedalaman tautan eksternal ke N (* %e0) (--ext-depth[=N])
-mN panjang file maksimum untuk file non-html (--max-files[=N])
-mN,N2 panjang file maksimum untuk non html (N) dan html (N2)
-MN ukuran keseluruhan maksimum yang dapat diunggah/dipindai (--max-size[=N])
-EN waktu cermin maksimum dalam detik (60=1 menit, 3600=1 jam) (--max-time[=N])
-AN kecepatan transfer maksimum dalam byte/detik (maks 1000=1KB/s) (--max-rate[=N])
-%cN jumlah maksimum koneksi/detik (*%c10) (--koneksi-per-detik[=N])
-GN jeda transfer jika N byte tercapai, dan tunggu hingga file kunci dihapus
(--max-jeda[=N])
Aliran kontrol:
-cN jumlah beberapa koneksi (*c8) (--socket[=N])
-TN timeout, jumlah detik setelah link non-responding dimatikan (--timeout[=N])
-RN jumlah percobaan ulang, dalam kasus timeout atau kesalahan non-fatal (*R1) (--retries[=N])
-Kontrol kemacetan lalu lintas JN, kecepatan transfer minimum (byte/detik) yang dapat ditoleransi untuk sebuah tautan
(--tingkat minimum[=N])
-HN host ditinggalkan jika: 0=tidak pernah, 1=timeout, 2=lambat, 3=timeout atau lambat
(--host-kontrol[=N])
Link pilihan:
-%P *penguraian yang diperluas, coba untuk menguraikan semua tautan, bahkan dalam tag atau Javascript yang tidak dikenal
(%P0 tidak digunakan) (--extended-parsing[=N])
-n dapatkan file non-html di dekat file html (mis: gambar yang terletak di luar) (--dekat)
-t menguji semua URL (bahkan yang terlarang) (--test)
-%L tambahkan semua URL yang terletak di file teks ini (satu URL per baris) (--list )
-%S tambahkan semua aturan pemindaian yang terletak di file teks ini (satu aturan pemindaian per baris)
(--daftar url )
Membangun pilihan:
-NN tipe struktur (0 *struktur asli, 1+: lihat di bawah) (--struktur[=N])
-atau struktur yang ditentukan pengguna (-N "%h%p/%n%q.%t")
-%N pemeriksaan tipe tertunda, jangan melakukan tes tautan apa pun tetapi tunggu unduhan file dimulai
sebagai gantinya (eksperimental) (%N0 jangan gunakan, %N1 gunakan untuk ekstensi yang tidak dikenal, * %N2 selalu
menggunakan)
-%D cache cek tipe tertunda, jangan menunggu tipe jarak jauh selama pembaruan, untuk mempercepat
mereka (%D0 tunggu, * %D1 jangan menunggu) (--cached-delayed-type-check)
-%M menghasilkan arsip lengkap yang dienkapsulasi RFC MIME (.mht) (--mime-html)
-LN nama panjang (L1 *nama panjang / L0 8-3 konversi / L2 ISO9660 kompatibel)
(--nama-panjang[=N])
-KN menyimpan tautan asli (mis http://www.adr/link) (K0 *tautan relatif, K mutlak
tautan, tautan asli K4, tautan URI absolut K3, tautan proxy transparan K5)
(--simpan-tautan[=N])
-x ganti tautan html eksternal dengan halaman kesalahan (--ganti-eksternal)
-%x tidak menyertakan kata sandi untuk situs web yang dilindungi kata sandi eksternal (%x0 termasuk)
(--nonaktifkan-sandi)
-%q *termasuk string kueri untuk file lokal (tidak berguna, hanya untuk tujuan informasi) (%q0
tidak termasuk) (--termasuk-query-string)
-o *menghasilkan file html keluaran jika terjadi kesalahan (404..) (o0 tidak menghasilkan)
(--menghasilkan-kesalahan)
-X *bersihkan file lama setelah update (X0 terus hapus) (--purge-old[=N])
-%p mempertahankan file html apa adanya (identik dengan -K4 -%F "" ) (--preserve)
-%T menautkan konversi ke UTF-8 (--utf8-conversion)
Labah-labah pilihan:
-bN menerima cookie di cookies.txt (0=tidak menerima,* 1=menerima) (--cookies[=N])
-u periksa jenis dokumen jika tidak diketahui (cgi,asp..) (u0 jangan centang, * u1 centang tetapi /, u2
periksa selalu) (--check-type[=N])
-j *mengurai Kelas Java (j0 tidak mengurai, bitmask: |1 mengurai default, |2 tidak mengurai
.class |4 jangan parse .js |8 jangan agresif) (--parse-java[=N])
-sN mengikuti tag robots.txt dan meta robots (0=tidak pernah,1=kadang-kadang,* 2=selalu, 3=selalu
(bahkan aturan ketat)) (--robots[=N])
-%h memaksa permintaan HTTP/1.0 (mengurangi fitur pembaruan, hanya untuk server atau proxy lama)
(--http-10)
-%k gunakan keep-alive jika memungkinkan, sangat mengurangi latensi untuk file kecil dan pengujian
permintaan (%k0 jangan gunakan) (--tetap-hidup)
-%B permintaan toleran (menerima tanggapan palsu di beberapa server, tetapi tidak standar!)
(--toleran)
-%s peretasan pembaruan: berbagai peretasan untuk membatasi transfer ulang saat memperbarui (ukuran identik,
tanggapan palsu..) (--updatehack)
-%u url hacks: berbagai hacks untuk membatasi duplikat URL (strip //, www.foo.com==foo.com..)
(--urlhack)
-%A berasumsi bahwa tipe (cgi,asp..) selalu ditautkan dengan tipe mime (-%A
php3,cgi=text/html;dat,bin=application/x-zip) (--anggap )
-dapat juga digunakan untuk memaksa jenis file tertentu: --assume foo.cgi=text/html
-@iN protokol internet (0=keduanya ipv6+ipv4, 4=ipv4 saja, 6=ipv6 saja) (--protokol[=N])
-%w menonaktifkan modul mime eksternal tertentu (-%w htsswf -%w htsjava) (--disable-module
)
Browser ID:
-F bidang agen pengguna dikirim dalam header HTTP (-F "nama agen pengguna") (--agen pengguna )
-%R bidang rujukan default dikirim dalam header HTTP (--referer )
-%E dari alamat email yang dikirim dalam header HTTP (--from )
-%F footer string dalam kode Html (-%F "Dicerminkan [dari host %s [file %s [di %s]]]"
(--footer )
-%l bahasa pilihan (-%l "fr, en, jp, *" (--bahasa )
-%a format yang diterima (-%a "teks/html,gambar/png;q=0.9,*/*;q=0.1" (--accept )
-%X baris header HTTP tambahan (-%X "X-Magic: 42" (--headers )
Catatan, indeks, Cache
-C membuat/menggunakan cache untuk pembaruan dan percobaan ulang (C0 tanpa cache, C1 cache adalah prioritas,* C2
uji pembaruan sebelumnya) (--cache[=N])
-k menyimpan semua file dalam cache (tidak berguna jika file pada disk) (--store-all-in-cache)
-%n jangan mengunduh ulang file yang terhapus secara lokal (--jangan-recatch)
-%v ditampilkan di layar nama file yang diunduh (dalam waktu nyata) - * %v1 versi pendek - %v2
animasi penuh (--tampilan)
-Q tanpa log - mode senyap (--jangan-log)
-q tidak ada pertanyaan - mode senyap (--tenang)
-z log - info tambahan (--extra-log)
-Z log - debug (--debug-log)
-v masuk layar (--verbose)
-f *masuk file (--file-log)
-f2 satu file log tunggal (--log tunggal)
-Saya *membuat indeks (I0 tidak membuat) (--indeks)
-%i membuat indeks teratas untuk folder proyek (* %i0 tidak dibuat) (--build-top-index)
-%Saya membuat indeks yang dapat dicari untuk cermin ini (* %I0 tidak dibuat) (--indeks-pencarian)
Expert pilihan:
-pN mode prioritas: (* p3) (--priority[=N])
-p0 cukup pindai, jangan simpan apa pun (untuk memeriksa tautan)
-p1 hanya menyimpan file html
-p2 hanya menyimpan file non html
-*p3 simpan semua file
-p7 dapatkan file html sebelumnya, lalu perlakukan file lain
-S tetap di direktori yang sama (--stay-on-same-dir)
-D *hanya bisa turun ke subdir (--can-go-down)
-U hanya bisa pergi ke direktori atas (--can-go-up)
-B keduanya dapat naik & turun ke dalam struktur direktori (--bisa-naik-turun)
-a *tinggal di alamat yang sama (--stay-on-same-address)
-d tetap di domain utama yang sama (--tetap di domain yang sama)
-l tetap di TLD yang sama (misalnya: .com) (--tetap di-sama-tld)
-e pergi ke mana-mana di web (--pergi-ke mana-mana)
-%H men-debug header HTTP di file log (--debug-headers)
Guru pilihan: (melakukan JANGAN menggunakan if bisa jadi)
-#X *gunakan mesin yang dioptimalkan (pemeriksaan batas memori terbatas) (--mesin cepat)
-#0 uji filter (-#0 *.gif www.bar.com/foo.gif ) (--debug-testfilters )
-#1 menyederhanakan tes (-#1 ./foo/bar/../foobar)
-#2 jenis tes (-#2 /foo/bar.php)
-#C daftar cache (-#C *.com/spider*.gif (--debug-cache )
-#R cache repair (cache rusak) (--repair-cache)
-#d pengurai debug (--debug-parsing)
-#E ekstrak meta-data cache new.zip di meta.zip
-#f selalu menyiram file log (--advanced-flushlogs)
-#FN jumlah maksimum filter (--advanced-maxfilters[=N])
-#h info versi (--versi)
-#K memindai stdin (debug) (--debug-scanstdin)
-#L jumlah maksimum tautan (-#L1000000) (--advanced-maxlinks)
-#p menampilkan informasi kemajuan yang buruk (--advanced-progressinfo)
-#P menangkap URL (--catch-url)
-#R rutin FTP lama (debug) (--repair-cache)
-#T menghasilkan operasi transfer. log setiap menit (--debug-xfrstats)
-#u waktu tunggu (--advanced-wait)
-#Z menghasilkan statistik kecepatan transfer setiap menit (--debug-ratestats)
Berbahaya pilihan: (melakukan JANGAN menggunakan kecuali kalau Anda persis tahu apa Anda adalah sedang mengerjakan)
-%! melewati batas keamanan bawaan yang ditujukan untuk menghindari penyalahgunaan bandwidth (bandwidth,
koneksi simultan) (--disable-security-limits)
-PENTING
CATATAN: OPSI BERBAHAYA, HANYA COCOK UNTUK AHLI
-GUNAKAN DENGAN PERHATIAN EKSTRIM
Garis komando tertentu pilihan:
-V menjalankan perintah sistem setelah setiap file ($0 adalah nama file: -V "rm \$0")
(--userdef-cmd )
-%W menggunakan fungsi perpustakaan eksternal sebagai pembungkus (-%W myfoo.so[,myparameters])
(--panggilan balik )
rincian: pilihan N
-N0 Struktur situs (default)
-N1 HTML di web/, gambar/file lain di web/gambar/
-N2 HTML di web/HTML, gambar/lainnya di web/gambar
-N3 HTML di web/, gambar/lainnya di web/
-N4 HTML di web/, gambar/lainnya di web/xxx, di mana xxx adalah ekstensi file (semua gif
akan ditempatkan ke web/gif, misalnya)
-N5 Gambar/lainnya di web/xxx dan HTML di web/HTML
-N99 Semua file di web/, dengan nama acak (gadget!)
-N100 Struktur situs, tanpa www.domain.xxx/
-N101 Identik dengan N1 kecuali "web" diganti dengan nama situs
-N102 Identik dengan N2 kecuali "web" diganti dengan nama situs
-N103 Identik dengan N3 kecuali "web" diganti dengan nama situs
-N104 Identik dengan N4 kecuali "web" diganti dengan nama situs
-N105 Identik dengan N5 kecuali "web" diganti dengan nama situs
-N199 Identik dengan N99 kecuali "web" diganti dengan nama situs
-N1001 Identik dengan N1 kecuali tidak ada direktori "web"
-N1002 Identik dengan N2 kecuali tidak ada direktori "web"
-N1003 Identik dengan N3 kecuali bahwa tidak ada direktori "web" (opsi disetel untuk opsi g)
-N1004 Identik dengan N4 kecuali tidak ada direktori "web"
-N1005 Identik dengan N5 kecuali tidak ada direktori "web"
-N1099 Identik dengan N99 kecuali tidak ada direktori "web"
rincian: Ditetapkan pengguna Option N
%n Nama file tanpa jenis file (mis: gambar)
%N Nama file, termasuk jenis file (mis: image.gif)
%t Jenis file (mis: gif)
%p Path [tanpa akhiran /] (mis: /someimages)
%h Nama host (mis: www.someweb.com)
%M URL MD5 (128 bit, 32 ascii byte)
%Q string kueri MD5 (128 bit, 32 ascii byte)
%k string kueri lengkap
%r nama protokol (mis: http)
%q string kueri kecil MD5 (16 bit, 4 ascii byte)
%S? Versi nama pendek (mis: %sN)
%[param] variabel param dalam string kueri
%[param:before:after:empty:notfound] ekstraksi variabel lanjutan
rincian: Ditetapkan pengguna Option N dan maju variabel ekstraksi
%[param:sebelum:setelah:kosong:tidak ditemukan]
-param : nama parameter
-sebelum
: string untuk ditambahkan jika parameter ditemukan
-after : string untuk ditambahkan jika parameter ditemukan
-tidak ditemukan
: penggantian string jika parameter tidak dapat ditemukan
-empty : penggantian string jika parameternya kosong
-semua bidang, kecuali yang pertama (nama parameter), boleh kosong
rincian: pilihan K
-K0 foo.cgi?q=45 -> foo4B54.html?q=45 (URI relatif, default)
-K -> http://www.foobar.com/folder/foo.cgi?q=45 (URL absolut) (--keep-links[=N])
-K3 -> /folder/foo.cgi?q=45 (URI absolut)
-K4 -> foo.cgi?q=45 (URL asli)
-K5 -> http://www.foobar.com/folder/foo4B54.html?q=45 (URL proxy transparan)
Pintasan:
--cermin
*buat mirror dari situs (s) (default)
--Dapatkan
dapatkan file yang ditunjukkan, jangan mencari URL lain (-qg)
--Daftar
tambahkan semua URL yang terletak di file teks ini (-%L)
--mirrorlink
cerminkan semua tautan di halaman tingkat 1 (-Y)
--testlink
tautan uji di halaman (-r1p0C0I0t)
--laba-laba
situs spider, untuk menguji tautan: melaporkan Kesalahan & Peringatan (-p0C0I0t)
--tempat ujian
identik dengan --spider
--kerangka
buat cermin, tetapi hanya mendapat file html (-p1)
--memperbarui
perbarui cermin, tanpa konfirmasi (-iC2)
--melanjutkan
melanjutkan cermin, tanpa konfirmasi (-iC1)
--menangkap
buat proxy sementara untuk menangkap URL atau URL pos formulir
--membersihkan
hapus cache & file log
--http10
paksa permintaan http/1.0 (-%h)
rincian: pilihan %W: Luar panggilan balik prototipe
melihat htsdefines.h
Gunakan httrack online menggunakan layanan onworks.net