pavuk - Online sa Cloud

Ito ang command na pavuk na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


pavuk - HTTP, HTTP sa SSL, FTP, FTP sa SSL at Gopher recursive na pagkuha ng dokumento
programa

SINOPSIS


gagamba [-mode {normal | resumeregets | singlepage | singlereget | i-sync | dontstore | ftpdir
| salamin}] [-X] [-runX] [-bg/-nobg] [prefs/-noprefs] [-h] [-v] [-progress/-noprogress]
[-stime/-nostime] [-xmaxlog $nr] [-logfile $file] [-slogfile $file] [-auth_file $file]
[-msgcat $dir] [-wika $str] [-gui_font $font] [-tahimik/-verbose [-read_css/-noread_css]
[-cdir $dir] [-scndir $dir] [-scenario $str] [-dumpscn $filename] [-lmax $nr] [-dmax $nr]
[-leave_level $nr] [-maxsize $nr] [-minsize $nr] [-Lugar $list] [-dsite $list] [-adomain
$list] [-ddomain $list] [-asfx $list] [-dsfx $list] [-apfix $list] [-dprefix $list]
[-amimt $list] [-dmimet $list] [-pattern $pattern] [-url_pattern $pattern] [-rpattern
$regexp] [-url_rpattern $regexp] [-skip_pattern $pattern] [-skip_url_pattern $pattern]
[-skip_rpattern $regexp] [-skip_url_rpattern $regexp] [-mas bago_sa $time] [-mas luma sa
$time] [-iskedyul $time] [-reschedule $nr] [-dont_leave_site/-leave_site]
[-dont_leave_dir/-leave_dir] [-http_proxy $site[:$port]] [-ftp_proxy $site[:$port]]
[-ssl_proxy $site[:$port]] [-gopher_proxy $site[:$port]] [-ftp_httpgw/-noftp_httpgw]
[-ftp_dirtyproxy/-noftp_dirtyproxy] [-gopher_httpgw/-nogopher_httpgw] [-noFTP/-FTP]
[-noHTTP/-HTTP] [-noSSL/-SSL] [-noGopher/-Gopher] [-FTPdir/-noFTPdir] [-noCGI/-CGI]
[-FTPlist/-noFTPlist] [-FTPhtml/-noFTPhtml] [-noRelocate/-Relocate]
[-force_reget/-noforce_reget] [-nocache/-cache] [-check_size/-nocheck_size]
[-noRobots/-Robots] [-noEnc/-Enc] [-auth_name $user] [-auth_passwd $pass] [-auth_scheme
1/2/3/4/user/Basic/Digest/NTLM] [-auth_reuse_nonce/-no_auth_reuse_nonce] [-http_proxy_user
$user] [-http_proxy_pass $pass] [-http_proxy_auth 1/2/3/4/user/Basic/Digest/NTLM]
[-auth_reuse_proxy_nonce/-no_auth_reuse_proxy_nonce] [-ssl_key_file $file] [-ssl_cert_file
$file] [-ssl_cert_passwd $pass] [-mula sa $email] [-send_from/-nosend_from] [-pagkakakilanlan $str]
[-auto_referer/-noauto_referer] [-referer/-noreferer] [-alang $list] [-acharset $list]
[-subukang muli $nr] [-nregets $nr] [-nredirs $nr] [-rollback $nr] [-tulog $nr] [-timeout $nr]
[-preserve_time/-nopreserve_time] [-preserve_perm/-nopreserve_perm]
[-preserve_slinks/-nopreserve_slinks] [-bufsize $nr] [-maxrate $nr] [-minrate $nr]
[-user_condition $str] [-cookie_file $file] [-cookie_send/-nocookie_send]
[-cookie_recv/-nocookie_recv] [-cookie_update/-nocookie_update] [-cookies_max $nr]
[-disabled_cookie_domains $list] [-disable_html_tag $TAG,[$ATTRIB][;...]]
[-enable_html_tag $TAG,[$ATTRIB][;...]] [-tr_del_chr $str] [-tr_str_str $str1 $str2]
[-tr_chr_chr $chrset1 $chrset2] [-index_name $str] [-store_index/-nostore_index]
[-store_name $str] [-debug/-nodebug] [-debug_level $level] [-browser $str] [-urls_file
$file] [-file_quota $nr] [-trans_quota $nr] [-fs_quota $nr] [-enable_js/-disable_js]
[-fnrules $t $m $r] [-store_info/-nostore_info] [-all_to_local/-noall_to_local]
[-sel_to_local/-nosel_to_local] [-all_to_remote/-noall_to_remote] [-url_strategie
$diskarte] [-remove_adv/-noremove_adv] [-adv_re $RE] [-check_bg/-nocheck_bg]
[-send_if_range/-nosend_if_range] [-sched_cmd $str] [-unique_log/-nounique_log] [-post_cmd
$str] [-ssl_version $v] [-unique_sslid/-nounique_sslid] [-aip_pattern $re] [-dip_pattern
$re] [-use_http11/-nouse_http11] [-local_ip $addr] [-hiling $req] [-formdata $req]
[-httpad $str] [-mga thread $nr] [-immesg/-noimmesg] [-dumpfd $nr] [-dump_urlfd $nr]
[-unique_name/-nounique_name] [-leave_site_enter_dir/-dont_leave_site_enter_dir]
[-max_time $nr] [-del_after/-nodel_after] [-singlepage/-nosinglepage]
[-dump_after/-nodump_after] [-dump_response/-nodump_response] [-auth_ntlm_domain $str]
[-auth_proxy_ntlm_domain $str] [-js_pattern $re] [-follow_cmd $str]
[-retrieve_symlink/-noretrieve_symlink] [-js_transform $p $t $h $a] [-js_transform2 $p $t
$h $a] [-ftp_proxy_user $str] [-ftp_proxy_pass $str] [-limit_inlines/-dont_limit_inlines]
[-ftp_list_options $str] [-fix_wuftpd_list/-nofix_wuftpd_list]
[-post_update/-nopost_update] [-info_dir $dir] [-mozcache_dir $dir] [-aport $list] [-dport
$list] [-hack_add_index/-nohack_add_index] [-default_prefix $str] [-rsleep/-norsleep]
[-ftp_login_handshake $host $pagkamay] [-js_script_file $file] [-dont_touch_url_pattern
$pat] [-dont_touch_url_rpattern $pat] [-dont_touch_tag_rpattern $pat] [-tag_pattern $tag
$attrib $url] [-tag_rpattern $tag $attrib $url] [-nss_cert_dir $dir]
[-nss_accept_unknown_cert/-nonss_accept_unknown_cert]
[-nss_domestic_policy/-nss_export_policy] [-[no]verify] [-tlogfile $file] [-trelative
{bagay | programa}] [-transparent_proxy FQDN[:port]] [-transparent_ssl_proxy FQDN[:port]]
[-sdemo] [-noencode] [Mga URL]

gagamba -mode {normal | singlepage | singlereget} [-base_level $nr]

gagamba -mode i-sync [-ddays $nr] [-subdir $dir] [-remove_old/-noremove_old]

gagamba -mode resumeregets [-subdir $dir]

gagamba -mode linkupdate [-X] [-h] [-v] [-cdir $dir] [-subdir $dir] [-scndir $dir]
[-scenario $str]

gagamba -mode paalala [-remind_cmd $str]

gagamba -mode salamin [-subdir $dir] [-remove_old/-noremove_old]
[-remove_before_store/-noremove_before_store] [-always_mdtm/-noalways_mdtm]

DESCRIPTION


Inilalarawan ng manu-manong pahinang ito kung paano gamitin ang pavuk. Maaaring gamitin ang Pavuk upang i-mirror ang mga nilalaman ng
internet/intranet server at upang mapanatili ang mga kopya sa isang lokal na puno ng mga dokumento. Pavuk
nag-iimbak ng mga nakuhang dokumento sa lokal na nakamapang espasyo sa disk. Ang istraktura ng lokal na puno
ay kapareho ng nasa remote server. Ang bawat suportadong serbisyo (protocol) ay may kanya-kanyang sarili
subdirectory sa lokal na puno. Ang bawat reference na server ay may sariling subdirectory sa mga ito
mga subdirectory ng protocol; sinusundan ng numero ng port kung saan nakatira ang serbisyo,
na nililimitahan ng karakter ay maaaring mabago. Gamit ang opsyon -fnrules maaari mong baguhin ang
default na layout ng lokal na puno ng dokumento, nang hindi nawawala ang pagkakapare-pareho ng link.
may gagamba posibleng magkaroon ng up-to-date na mga kopya ng malayuang dokumento sa lokal na disk
espasyo.
Sa bersyon 0.3pl2, maaaring awtomatikong i-restart ng pavuk ang mga sirang koneksyon, at mabawi
bahagyang nilalaman mula sa isang FTP server (na dapat suportahan ang REST command), mula sa isang maayos
naka-configure na HTTP/1.1 server, o mula sa HTTP/1.0 server na sumusuporta Mga saklaw.
Mula sa bersyon 0.6, posible na pangasiwaan ang mga pagsasaayos sa pamamagitan ng tinatawag na mga senaryo. Ang
pinakamahusay na paraan upang lumikha ng naturang configuration file ay ang paggamit ng X Window interface at simple
i-save ang ginawang configuration. Ang iba pang paraan ay ang paggamit ng -dumpscn switch.
Sa bersyon 0.7pl1, posible na mag-imbak ng impormasyon sa pagpapatunay sa isang awthinfo
file, na maaaring i-parse at gamitin ng pavuk.
Sa bersyon 0.8pl4, ang pavuk ay maaaring kumuha ng mga dokumento para magamit sa isang lokal na proxy/cache server
nang hindi iniimbak ang mga ito sa puno ng lokal na dokumento.
Bilang ng bersyon 0.9pl4 pavuk sumusuporta Medyas (4 / 5) proxy kung mayroon kang kinakailangan
mga aklatan.
Sa bersyon 0.9pl12, maaaring mapanatili ng pavuk ang mga pahintulot ng malalayong file at simbolikong link,
kaya maaari itong magamit para sa malakas na FTP mirroring.
Sinusuportahan ng Pavuk ang mga koneksyon sa SSL sa mga FTP server, kung tinukoy mo ang ftps:// URL sa halip na
ftp://.
Awtomatikong kayang pangasiwaan ng Pavuk ang mga pangalan ng file na may mga hindi ligtas na character para sa filesystem. Ito ay
ngunit ipinatupad lamang para sa Win32 platform at ito ay mahirap na naka-code.
Magagamit na ni Pavuk HTTP / 1.1 protocol para sa komunikasyon sa mga HTTP server. Maaari itong gamitin
paulit-ulit na mga koneksyon, kaya isang koneksyon sa TCP ang dapat gamitin upang maglipat ng ilang mga dokumento
nang hindi ito isinasara. Ang tampok na ito ay nakakatipid ng bandwidth ng network at nagpapabilis din ng network
komunikasyon.
Magagawa ng Pavuk na mai-configure POST mga kahilingan sa mga server ng HTTP at suporta din sa pag-upload ng file
sa pamamagitan ng kahilingan sa HTTP POST.
Maaaring awtomatikong punan ng Pavuk ang mga nahanap na HTML form, kung magbibigay ang user ng data para sa mga field nito
bago na may opsyon -formdata.
Ang Pavuk ay maaaring magpatakbo ng maaaring i-configure na bilang ng sabay-sabay na pagpapatakbo ng pag-download ng mga thread kapag
pinagsama-sama sa suporta sa multithreading.

format of suportado Mga URL


HTTP
http://[[user][:password]@]host[:port][/document]
[[user][:password]@]host[:port][/document]

HTTPS
https://[[user][:password]@]host[:port][/document]
ssl[.domain][:port][/document]

FTP
ftp://[[user][:password]@]host[:port][/relative_path][;type=x]
ftp://[[user][:password]@]host[:port][//absolute_path][;type=x]
ftp[.domain][:port][/document][;type=x]

FTPS
ftps://[[user][:password]@]host[:port][/relative_path][;type=x]
ftps://[[user][:password]@]host[:port][//absolute_path][;type=x]
ftps[.domain][:port][/document][;type=x]

Gopher
gopher://host[:port][/type[document]]
gopher[.domain][:port][/type[document]]

default paggawa ng mga mapa of Mga URL sa lokal mga filename


HTTP
http://[[user][:password]@]host[:port][/document][?query]
sa
http/host_port/[document][?query]

HTTPS
https://[[user][:password]@]host[:port][/document][?query]
sa
https/host_port/[document][?query]

FTP
ftp://[[user][:password]@]host[:port][/path]
sa
ftp/host_port/[path]

FTPS
ftps://[[user][:password]@]host[:port][/path]
sa
ftps/host_port/[path]

Gopher
gopher://host[:port][/type[document]]
sa
gopher/host_port/[type[document]]

TANDAAN: Gagamitin ng Pavuk ang string kung saan nagtatanong ito sa target na server bilang pangalan ng
file ng mga resulta. Ang pangalan ng file na ito ay maaaring, sa ilang mga kaso, ay naglalaman ng mga bantas tulad ng $,?,=,& at iba pa
Ang ganitong bantas ay maaaring magdulot ng mga problema kapag sinusubukan mong i-browse ang mga na-download na file gamit ang
iyong browser o sinusubukan mong iproseso ang mga na-download na file gamit ang mga script o view ng shell
mga file na may mga kagamitan sa pamamahala ng file na tumutukoy sa pangalan ng file ng mga resulta. kung ikaw
naniniwala na maaaring magdulot ito ng mga problema para sa iyo, pagkatapos ay maaari mong alisin ang lahat ng bantas mula sa
ang pangalan ng file ng resulta na may opsyon: -tr_del_chr [:punct:] o sa iba pang mga opsyon para sa
pagsasaayos ng mga filename.

Opsyon


Ang lahat ng mga opsyon ay case insensitive.

listahan of pagpipilian kabanata


paraan
Tulong
Ipahiwatig/Pag-log/Interface pagpipilian
Netli pagpipilian
espesyal simula
Sitwasyon/Gawain pagpipilian
Directory pagpipilian
Panatilihin pagpipilian
Kahalili pagpipilian
Kahalili pagpapatunay
Protocol/Download Opsyon
pagpapatunay
Site/Domain/Port Limitasyon Options
Limitasyon Dokumento mga katangian
Limitasyon Dokumento pangalan
Limitasyon Protokol Opsyon
iba Limitasyon Options
Javascript suportahan
Cookie
HTML muling pagsusulat makina apinasyon pagpipilian
Filename/URL Conversion Opsyon
iba Options

paraan


-mode {normal, linkupdate, i-sync, singlepage, singlereget, resumeregets}
Itakda ang mode ng pagpapatakbo.
normal - kinukuha ang mga recursive na dokumento
linkupdate - i-update ang mga malalayong URL sa mga lokal na HTML na dokumento sa mga lokal na URL kung ang mga URL na ito
umiiral sa lokal na puno
i-sync - i-synchronize ang mga malalayong dokumento sa lokal na puno (kung isang lokal na kopya ng isang dokumento
ay mas matanda kaysa sa remote, ang dokumento ay kukunin muli, kung hindi, walang mangyayari)
singlepage - Ang URL ay kinukuha bilang isang pahina kasama ang lahat ng inline na bagay (larawan, tunog
...) ang mode na ito ay hindi na ginagamit ngayon ng -singlepage pagpipilian.
resumeregets - Ini-scan ng pavuk ang lokal na puno para sa mga file na hindi ganap na nakuha
at kinukuha muli ang mga ito (gumagamit ng partial get kung maaari)
singlereget - kumuha ng URL hanggang sa ito ay makuha nang buo
dontstore - paglipat ng pahina mula sa server, ngunit huwag itabi ito sa lokal na puno. Ito
Ang mode ay angkop para sa pagkuha ng mga pahina na gaganapin sa isang lokal na proxy/cache server.
paalala - ginagamit upang ipaalam sa gumagamit ang tungkol sa mga binagong dokumento
ftpdir - ginagamit sa listahan ng mga nilalaman ng mga direktoryo ng FTP

ang default na mode ng operasyon ay normal mode.

Tulong


-h Mag-print ng mahabang verbose na mensahe ng tulong

-v Ipakita ang mga impormasyon ng bersyon at pagsasaayos sa oras ng pag-compile.

Ipahiwatig/Pag-log/Interface pagpipilian


-tahimik Huwag magpakita ng anumang mga mensahe sa screen.

-salita
Piliting ipakita ang mga output na mensahe sa screen (default)

-pag-unlad/-walang pag-unlad
Ipakita ang pag-unlad sa pagkuha habang tumatakbo sa terminal (default ay naka-off ang pag-unlad)

-stime/-nostime
Ipakita ang oras ng pagsisimula at pagtatapos ng paglipat. (default ay hindi ipinapakita ang impormasyong ito)

-xmaxlog $nr
Pinakamataas na bilang ng mga linya ng log sa widget ng Log. 0 ay nangangahulugang walang limitasyon. Ang pagpipiliang ito ay
magagamit lamang kapag pinagsama-sama sa GTK+ GUI. (default na halaga ay 0)

-logfile $file
File kung saan nakaimbak ang lahat ng ginawang mensahe.

-unique_log/-nounique_log
Kapag ang logfile tulad ng tinukoy sa opsyon -logfile ay ginagamit na ng iba
proseso, subukang bumuo ng bagong natatanging pangalan para sa log file. (default ang opsyong ito
Naka-off)

-slogfile $file
File upang mag-imbak ng mga maiikling log in. Ang file na ito ay naglalaman ng isang linya ng mga impormasyon bawat
naprosesong dokumento. Ito ay sinadya upang magamit kaugnay ng anumang uri ng script
upang makagawa ng ilang istatistika, para sa pagpapatunay ng mga link sa iyong website, o para sa pagbuo
mga simpleng sitemap. Maaaring gamitin ng maraming proseso ng pavuk ang file na ito nang sabay-sabay, nang walang
pag-overwrite sa bawat isa sa mga entry. Istraktura ng record:

- PID ng proseso ng pavuk
- TIME oras ngayon
- COUNTER sa kasalukuyang format/kabuuang bilang ng mga URL
- STATUS naglalaman ng uri ng error: FATAL, ERR,
BABALA o OK
- ERRCODE ay ang number code ng error
(tingnan ang errcode.h sa pavuk sources)
- URL ng dokumento
- PARENTURL unang parent na dokumento ng URL na ito
(kapag wala itong magulang - [wala])
- FILENAME ay ang pangalan ng lokal na file na
naka-save ang dokumento sa ilalim
- SIZE laki ng hiniling na dokumento kung alam
- DOWNLOAD_TIME oras na nangangailangan ng pag-download nito
dokumento sa format na segundo.mili_segundo
- HTTPRESP naglalaman ng unang linya ng HTTP server
tugon

-langing $str
Katutubong wika na dapat gamitin ng pavuk para sa komunikasyon sa gumagamit nito (gumagana lamang
kapag mayroong isang katalogo ng mensahe para sa wikang iyon) GNU gettext suporta (para sa mensahe
internationalization) ay dapat ding pinagsama-sama. Ang default na wika ay kinuha mula sa iyong
Mga variable ng kapaligiran ng NLS.

-gui_font $ font
Font na ginamit sa interface ng GUI. Upang ilista ang mga magagamit na X font gamitin ang xlsfonts utos.
Available lang ang opsyong ito kapag pinagsama-sama sa suporta ng GTK+ GUI.

Netli pagpipilian


-[no]read_css
Paganahin o huwag paganahin ang pagkuha ng mga bagay na binanggit sa mga style sheet.

-[no]i-verify
Paganahin o huwag paganahin ang pag-verify ng CERTS ng server sa SSL mode.

-tlogfile $file
I-on ang Netli logging na may output sa tinukoy na file.

-kamag-anak {bagay | programa}
Gawing kaugnay ang mga timing ng Netli sa simula ng unang bagay o ng programa.

-transparent_proxy FQDN[:port]
Kapag pinoproseso ang URL, ipadala ang orihinal, ngunit ipadala ito sa IP address sa FQDN

-transparent_ssl_proxy FQDN[:port]
Kapag nagpoproseso ng HTTPS URL, ipadala ang orihinal, ngunit ipadala ito sa IP address sa FQDN

-sdemo Output sa sdemo compatible na format. Ito ay ginagamit lamang ng sdemo. (Sa ngayon, simple lang
ibig sabihin ang output ay '-1' sa halip na '*' kapag ang mga sukat ay hindi wasto.)

-noencode
Huwag takasan ang mga character na "hindi ligtas" sa URLS.

espesyal simula


-X Magsimula ng programa gamit ang X Window interface (kung pinagsama-sama sa suporta para sa GTK+). Pavuk
bilang default ay nagsisimula nang walang GUI, at kumikilos bilang regular na commandline tool.

-runX Kapag ginamit kasama ng -X opsyon, sisimulan agad ng pavuk ang pagproseso ng mga URL
pagkatapos mailunsad ang window ng GUI. Kung wala ang -X ibinigay, ang pagpipiliang ito ay wala
anumang epekto. Available lang kapag pinagsama-sama sa suporta ng GTK+ .

-bg/-nobg
Binibigyang-daan ng opsyong ito ang pavuk na humiwalay sa terminal nito at tumakbo sa background mode.
Ang Pavuk ay hindi maglalabas ng anumang mga mensahe sa terminal kaysa. Kung gusto mong makita
mga mensahe, kailangan mong gamitin ang -log_file opsyon upang tukuyin ang isang file kung saan ang mga mensahe
isusulat. Ang default na pavuk ay isinasagawa sa foreground.

-check_bg/-nocheck_bg
Karaniwan, ang mga program na ipinadala sa background pagkatapos na tumakbo sa foreground ay nagpapatuloy
upang mag-output ng mga mensahe sa terminal. Kung naka-activate ang opsyong ito, titingnan ng pavuk kung
ito ay tumatakbo bilang background job at hindi magsusulat ng anumang mensahe sa terminal
kasong ito. Pagkatapos nitong maging foreground job muli, magsisimula itong magsulat ng mga mensahe
sa terminal sa normal na paraan. Ang pagpipiliang ito ay magagamit lamang kapag ang iyong system
sumusuporta sa pagkuha ng terminal info sa pamamagitan ng tc*() function.

-prefs/-noprefs
Kapag na-on mo ang opsyong ito, papanatilihin ng pavuk ang lahat ng setting kapag lalabas, at
kapag nagpatakbo ka muli ng pavuk na may interface ng GUI, maibabalik ang lahat ng mga setting. Ang
ang mga setting ay maiimbak sa ~./pavuk_prefs file. Default na pavuk gusto ibalik nito
opsyon kapag nagsimula. Available lang ang opsyong ito kapag pinagsama-sama sa GTK+.

-iskedyul $ oras
Isagawa ang pavuk sa oras na tinukoy bilang parameter. Ang Format ng $time na parameter
ay YYYY.MM.DD.hh.mm. Kailangan mo ng maayos na naka-configure na pag-iiskedyul kasama ang at utos
sa iyong system para sa paggamit ng opsyong ito. Kung ang default na pagsasaayos (sa -f %f %t
%d.%m.%Y) ng utos sa pag-iiskedyul ay hindi gagana sa iyong system, subukang ayusin ito gamit ang
-sched_cmd pagpipilian.

-mag-reschedule $nr
Magsagawa ng pavuk sa pana-panahon na may panahon ng $nr na oras. Kailangan mong i-configure nang maayos
pag-iskedyul kasama ang at command sa iyong system para sa paggamit ng opsyong ito.

-sched_cmd $str
Utos na gagamitin para sa pag-iiskedyul. Tahasang sinusuportahan ng Pavuk ang pag-iskedyul sa at $str
dapat maglaman ng mga regular na character at macro, na na-escape ng % karakter. Sinusuportahan
ang mga macro ay:
%f
- para sa script filename
%t
- para sa oras (sa format na HH:MM)
- lahat ng macro bilang suportado ng strftime() tungkulin

-urls_file $file
Kung gagamitin mo ang opsyong ito, babasahin ng pavuk ang mga URL mula sa $file bago ito magsimula
pagpoproseso. Sa file na ito, kailangang nasa hiwalay na linya ang bawat URL. Pagkatapos ng huli
URL, isang tuldok . na sinusundan ng isang LF (line-feed) na character na nagsasaad ng dulo. Pavuk
magsisimulang magproseso kaagad pagkatapos na basahin ang lahat ng mga URL. Kung $file ay ibinigay bilang
ang - character, mababasa ang karaniwang input.

-store_info/-nostore_info
Ang pagpipiliang ito ay nagiging sanhi ng pavuk na mag-imbak ng impormasyon tungkol sa bawat dokumento sa isang hiwalay
file sa .pavuk_info direktoryo. Ang file na ito ay ginagamit upang iimbak ang orihinal na URL mula sa
kung saan na-download ang dokumento. Para sa mga file na na-download sa pamamagitan ng HTTP o HTTPS
protocol, ang buong header ng tugon ng HTTP ay naka-imbak doon. Inirerekomenda kong gamitin ito
opsyon kapag gumagamit ka ng mga opsyon na nagbabago sa default na layout ng lokal
document tree, dahil ang info file na ito ay tumutulong sa pavuk na imapa ang lokal na filename sa
URL. Napaka-kapaki-pakinabang din ang opsyong ito kapag ang iba't ibang URL ay may parehong filename
ang lokal na puno. Kapag nangyari ito, nakita ito ng pavuk gamit ang mga file ng impormasyon, at gagawin ito
prefix ang lokal na pangalan na may mga numero. Sa default ay hindi pinagana ang pag-iimbak ng dagdag na ito
mga impormasyong

-info_dir $dir
Maaari mong itakda sa opsyong ito ang lokasyon ng hiwalay na direktoryo para sa pag-iimbak ng mga file ng impormasyon
nilikha noong -store_info ginagamit ang opsyon. Ito ay kapaki-pakinabang kapag hindi mo gustong maghalo
sa patutunguhang direktoryo ang mga file ng impormasyon na may mga regular na file ng dokumento. Ang istraktura
Ang mga file ng impormasyon ay napanatili, naka-imbak lamang sa iba't ibang direktoryo.

-hiling $req
Sa pagpipiliang ito maaari mong tukuyin ang pinalawak na impormasyon para sa mga panimulang URL. Sa
ang pagpipiliang ito ay maaari mong tukuyin ang data ng query para sa POST or GET . Kasalukuyang syntax nito
ang pagpipilian ay: URL:["]$url["] [METHOD:["]{GET|POST}["]] [ENCODING:["]{u|m}["]]
[FIELD:["]variable=value["]] [FILE:["]variable=filename["]
[LNAME:["]local_filename["]]

- URL: tumutukoy sa URL ng kahilingan
- Pamamaraan: tumutukoy sa paraan ng paghiling para sa URL at ay
isa sa GET or POST.
- PAG-ENCOD: tumutukoy sa pag-encode para sa data ng katawan ng kahilingan.
m ay para sa mga maramihang bahagi/form-data pag-encode
u ay para sa mga application / x-www-form-urlencoded
pag-encode
- LARANGAN: tumutukoy sa field ng data ng kahilingan sa format
variable=halaga. Para sa pag-encode ng mga espesyal na character
in nagbabago at halaga maaari mong gamitin ang parehong pag-encode
gaya ng ginagamit sa application / x-www-form-urlencoded
encoding.
- FILE: tumutukoy sa espesyal na field ng query, which is
ginamit upang tukuyin ang file para sa POST nakabatay sa pag-upload ng file.
- LNAME: tumutukoy sa localname para sa kahilingang ito
Kapag kailangan mong gamitin sa loob ng LARANGAN: at FILE: espesyal na mga patlang ng detalye ng kahilingan
mga character, dapat mong gamitin ang application / x-www-form-urlencoded pag-encode ng mga character.
Nangangahulugan ito ng lahat ng nonASCII character, quote character ("), space character ( ), ampersand
character (&), percent character (%) at equal character (=) ay dapat na naka-encode sa form %xx
saan xx ay hexadecimal na representasyon ng ASCII na halaga ng karakter. Kaya halimbawa %
character ay dapat na naka-encode tulad ng % 25.

-formdata $req
Ang pagpipiliang ito ay nagbibigay sa iyo ng pagkakataong tukuyin ang mga nilalaman para sa mga HTML na form na natagpuan sa panahon
tumatawid sa puno ng dokumento.
Ang kasalukuyang syntax ng opsyong ito ay pareho sa para sa -hiling pagpipilian, ngunit PAG-ENCOD: at
Pamamaraan: ay walang kahulugan sa pagpipiliang ito semantics.
In URL: kailangan mong tukuyin ang HTML form na URL ng pagkilos, na itutugma sa
mga URL ng aksyon na matatagpuan sa mga naprosesong HTML na dokumento. Kung nakita ng pavuk ang action URL na alin
mga tugma na ibinigay sa -formdata opsyon, gagawa si pavuk GET or POST humiling
mula sa data na ibinigay sa opsyong ito at mula sa default na form na mga value ng field na ibinigay sa
HTML na dokumento. Ang mga value na ibinibigay sa commandline ay nauuna bago ang ibinigay
sa HTML file.

-mga thread $nr
Sa pamamagitan ng opsyong ito maaari mong tukuyin kung gaano karaming magkakasabay na mga thread ang magda-download
mga dokumento. Ang default na pavuk ay nagpapatupad ng 3 sabay-sabay na pag-download ng mga thread. Ang pagpipiliang ito ay
magagamit lamang kapag ang pavuk ay pinagsama-sama upang suportahan ang multithreading.

-immesg/-noimmesg
Ang default na pag-uugali ng pavuks kapag nagpapatakbo ng maramihang pag-download ng mga thread ay ang buffer lahat
output ng mga mensahe sa memory buffer at flush na buffered data lamang kapag thread
tinatapos ang pagproseso ng isang dokumento. Sa opsyong ito maaari mong baguhin ang pag-uugaling ito
upang makita kaagad ang mga mensahe kapag ginawa ito. Ito ay magagamit lamang kapag ikaw
gustong mag-debug ng ilang espesyal sa multithreading na kapaligiran. Ang pagpipiliang ito ay
magagamit lamang kapag ang pavuk ay pinagsama-sama upang suportahan ang multithreading.

-dumpfd $nr
Para sa scripting kung minsan ay magagamit upang makapag-download ng dokumento nang direkta sa pipe
o variable sa halip na iimbak ito sa regular na file. Sa ganitong kaso maaari mong gamitin ito
opsyon na mag-dump ng data halimbawa sa stdout ($nr = 1).

-dump_after/-nodump_after
Habang ginagamit -dumpfd opsyon sa multithreaded pavuk, ito ay kinakailangan upang dump dokumento
sa isang sandali dahil maaaring mag-overlap ang mga dokumentong na-download sa maraming thread. Ito
Ang opsyon ay kapaki-pakinabang din kapag gusto mong itapon ang dokumento pagkatapos ayusin ng pavuk ang mga link
sa loob ng mga dokumentong HTML.

-dump_response/-nodump_response
Ang pagpipiliang ito ay may epekto lamang kapag ginamit kasama ng -dumpfd opsyon. Ito ay ginagamit upang dump HTTP
mga header ng tugon.

-dump_urlfd $nr
Kapag gagamitin mo ang opsyong ito, ilalabas ng pavuk ang lahat ng URL na makikita sa mga HTML na dokumento
sa file descriptor $nr. Magagamit mo ang opsyong ito para i-extract at i-convert ang lahat ng URL sa
ganap.

Sitwasyon/Gawain pagpipilian


-scenario $str
Pangalan ng senaryo na ilo-load at/o tatakbo. Ang mga sitwasyon ay mga file na may katulad na istraktura
sa .pavukrc file. Ang mga sitwasyon ay naglalaman ng mga naka-save na configuration. Magagamit mo ito para sa
panaka-nakang pagsasalamin. Ang mga parameter mula sa mga senaryo na tinukoy sa command line ay maaari
ma-overwrite ng mga parameter ng command line. Upang magamit ang opsyong ito, kailangan mo
upang tukuyin ang scenario base na direktoryo na may opsyon -scndir.

-dumpscn $filename
I-store ang aktwal na configuration sa scenario file na may pangalan $filename. Ito ay kapaki-pakinabang
upang mabilis na gumawa ng mga paunang na-configure na mga sitwasyon para sa manu-manong pag-edit.

Directory pagpipilian


-msgcat $dir
Direktoryo na naglalaman ng katalogo ng mensahe para sa pavuk. Kung wala ka
pahintulot na mag-imbak ng isang katalogo ng mensahe ng pavuk sa direktoryo ng system, dapat mong
lumikha lamang ng katulad na istraktura ng mga direktoryo sa iyong home directory habang ito ay nasa
ang iyong system.

para halimbawa:

Ang iyong katutubong wika ay German, at ang iyong home directory ay /home/jano.

Dapat mo munang likhain ang direktoryo /home/jano/locales/de/LC_MESSAGES/, pagkatapos
ilagay ang German pavuk.mo doon at itakda ang -msgcat sa /home/jano/locales/. Kung mayroon kang
maayos na itakda ang mga lokal na halaga ng kapaligiran, makikita mo ang pavuk na nagsasalita ng Aleman. Ito
Ang opsyon ay magagamit lamang kapag nag-compile ka bilang suporta para sa GNU gettext messages
internasyonalisasyon.

-cdir $dir
Direktoryo kung saan nakaimbak ang lahat ng nakuhang dokumento. Kung hindi tinukoy, ang
kasalukuyang direktoryo ang ginagamit. Kung ang tinukoy na direktoryo ay hindi umiiral, ito ay magiging
nilikha.

-scndir $dir
Direktoryo kung saan nakaimbak ang iyong mga sitwasyon. Dapat mong gamitin ang opsyong ito kapag ikaw
ay naglo-load o nag-iimbak ng mga file ng senaryo.

Panatilihin pagpipilian


-preserve_time/-nopreserve_time
Mag-imbak ng na-download na dokumento na may parehong oras ng pagbabago tulad ng sa malayong site.
Itatakda lamang ang oras ng pagbabago kapag available ang naturang impormasyon (ilang FTP
hindi sinusuportahan ng mga server ang MDTM command, at ang ilang mga dokumento sa mga HTTP server ay
nilikha online upang hindi makuha ng pavuk ang oras ng pagbabago ng dokumentong ito). Sa
ang default na oras ng pagbabago ng mga dokumento ay hindi pinapanatili.

-preserve_perm/-nopreserve_perm
Mag-imbak ng na-download na dokumento na may parehong mga pahintulot tulad ng sa malayong site. Ito
ang opsyon ay may epekto lamang kapag nagda-download ng file sa pamamagitan ng FTP protocol at ipinapalagay
na ang -ftplist ginagamit ang opsyon. Sa default, ang mga pahintulot ay hindi pinapanatili.

-preserve_slinks/-nopreserve_slinks
Magtakda ng mga simbolikong link upang tumuro nang eksakto sa parehong lokasyon tulad ng sa malayong server; huwag
gumawa ng anumang relokasyon. Ang pagpipiliang ito ay may epekto lamang kapag nagda-download ng file sa pamamagitan ng FTP
protocol at ipinapalagay na ang -ftplist ginagamit ang opsyon. Ang mga default na simbolikong link ay
hindi pinapanatili, at kinukuha bilang mga regular na dokumento na may buong nilalaman ng naka-link
file.

Halimbawa, ipagpalagay na sa FTP server na ftp.xx.org ay mayroong simbolikong link
/pub/pavuk/pavuk-current.tgz, na tumuturo sa /tmp/pub/pavuk-0.9pl11.tgz. Pavuk
gagawa ng simbolikong link ftp/ftp.xx.org_21/pub/pavuk/pavuk-current.tgz
kung ang opsyon -preserve_slinks ay gagamitin ang simbolikong link na ito ay ituturo sa
/tmp/pub/pavuk-0.9pl11.tgz
kung gustong gamitin ang opsyon -preserve_slinks, ang simbolikong link na ito ay ituturo sa
../../tmp/pub/pavuk-0.9pl11.tgz

-retrieve_symlink/-noretrieve_symlink
Kunin ang mga file sa likod ng mga simbolikong link sa halip na kopyahin ang mga symlink sa lokal na puno.

Kahalili pagpipilian


-http_proxy $site[:$port]
Kung gagamitin ang parameter na ito, ang lahat ng kahilingan sa HTTP ay dumadaan sa proxy na ito
server. Ito ay kapaki-pakinabang kung ang iyong site ay nasa likod ng isang firewall, o kung gusto mo
gumamit ng HTTP proxy cache server. Ang default na numero ng port ay 8080. Pinapayagan ka ng Pavuk
upang tukuyin ang maramihang mga HTTP proxy (gamit ang maramihang -http_proxy na mga opsyon) at ito ay
i-rotate ang mga proxy na may roundrobin priority na hindi pinapagana ang mga proxy na may mga error.

-nocache/-cache
Gamitin ang opsyong ito sa tuwing gusto mong makuha ang dokumento nang direkta mula sa site at
hindi mula sa iyong HTTP proxy cache server. Pinapayagan ng default na pavuk ang paglipat ng dokumento
mga kopya mula sa cache.

-ftp_proxy $site[:$port]
Kung gagamitin ang parameter na ito, ang lahat ng kahilingan sa FTP ay dumadaan sa proxy na ito
server. Ito ay kapaki-pakinabang kapag ang iyong site ay nasa likod ng isang firewall, o kung gusto mo
gumamit ng FTP proxy cache server. Ang default na numero ng port ay 22. Sinusuportahan ng Pavuk ang tatlo
iba't ibang uri ng mga proxy para sa FTP, tingnan ang mga opsyon -ftp_httpgw, -ftp_dirtyproxy.
Kung wala sa mga nabanggit na opsyon ang ginagamit, pagkatapos ay ipinapalagay ng pavuk ang isang regular na FTP proxy
sa USER user@host kumokonekta sa malayong FTP server.

-ftp_httpgw/-noftp_httpgw
Ang tinukoy na FTP proxy ay isang HTTP gateway para sa FTP protocol. Default na FTP proxy
ay regular na FTP proxy.

-ftp_dirtyproxy/-noftp_dirtyproxy
Ang tinukoy na FTP proxy ay isang HTTP proxy na sumusuporta sa a CONNECT kahilingan (pavuk
dapat gumamit ng buong FTP protocol, maliban sa mga aktibong koneksyon ng data). Default na FTP
Ang proxy ay regular na FTP proxy. Kung ang parehong -ftp_dirtyproxy at -ftp_httpgw ay tinukoy,
-ftp_dirtyproxy ay mas gusto.

-gopher_proxy $site[:$port]
Gopher gateway o proxy/cache server.

-gopher_httpgw/-nogopher_httpgw
Ang tinukoy na Gopher proxy server ay isang HTTP gateway para sa Gopher protocol. Kailan
-gopher_proxy ay nakatakda at ito -gopher_httpgw hindi ginagamit ang opsyon, ginagamit ang pavuk
proxy bilang HTTP tunnel na may CONNECT humiling na magbukas ng mga koneksyon sa mga server ng Gopher.

-ssl_proxy $site[:$port]
SSL proxy (tunneling) server [gaya ng sa CERN httpd + patch o sa Squid] na may
Pinagana CONNECT kahilingan (hindi bababa sa port 443). Available lang ang opsyong ito kapag
pinagsama-sama sa suporta ng SSL (kailangan mo ang SSleay o OpenSSL na mga aklatan na may
mga header ng pag-unlad)

Kahalili pagpapatunay


-http_proxy_user $user
Username para sa HTTP proxy authentication.

-http_proxy_pass $pass
Password para sa HTTP proxy authentication.

-http_proxy_auth {1/2/3/4/user/Basic/Digest/NTLM}
Scheme ng pagpapatunay para sa proxy na pag-access. Katulad na kahulugan ng -auth_scheme
opsyon (tingnan ang tulong para sa opsyong ito para sa higit pang mga detalye). Default ay 2 (Basic scheme).

-auth_proxy_ntlm_domain $str
NT o LM domain na ginamit para sa awtorisasyon muli HTTP proxy server kapag NTLM
kinakailangan ang scheme ng pagpapatunay. Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama
na may mga OpenSSL o libdes na mga aklatan.

-auth_reuse_proxy_nonce/-noauth_reuse_proxy_nonce
Kapag gumagamit ng HTTP Proxy Digest access authentication scheme gamitin ang unang natanggap
nonce value sa maraming sumusunod na kahilingan.

-ftp_proxy_user $user
Username para sa FTP proxy authentication.

-ftp_proxy_pass $pass
Password para sa FTP proxy authentication.

Protocol/Download Options


-ftp_passive
Gumagamit ng passive ftp kapag nagda-download sa pamamagitan ng ftp.

-ftp_active
Gumagamit ng aktibong ftp kapag nagda-download sa pamamagitan ng ftp.

-active_ftp_port_range $min:$max
Ang pagpipiliang ito ay nagpapahintulot na tukuyin ang mga port na ginagamit para sa aktibong ftp. Pinapadali nito
configuration ng firewall dahil maaaring paghigpitan ang hanay ng mga port.

Random na pipili ang Pavuk ng isang numero mula sa loob ng tinukoy na hanay hanggang sa isang bukas
matatagpuan ang port. Kung walang makikitang bukas na mga port sa loob ng ibinigay na hanay, gagawin ng pavuk
default sa isang normal na kernel-assigned port, at isang mensahe (debug level net) ay
output.

Ang napiling hanay ng port ay dapat na nasa hanay na hindi may pribilehiyo (hal. mas malaki kaysa sa o
katumbas ng 1024); Lubos na INIREREKOMENDA na ang napiling hanay ay sapat na malaki upang
humahawak ng maraming sabay-sabay na aktibong koneksyon (halimbawa, 49152-65534, ang IANA-
nakarehistrong ephemeral port range).

-always_mdtm/-noalways_mdtm
Pilitin ang pavuk na palaging gamitin ang "MDTM" upang matukoy ang oras ng pagbabago ng file at hindi kailanman
gumagamit ng mga naka-cache na oras na tinutukoy kapag naglilista ng mga malayuang file.

-remove_before_store/-noremove_before_store
Pilitin ang pag-unlink ng mga file bago maimbak ang bagong nilalaman sa isang file. Ito ay nakakatulong
kung ang mga lokal na file ay naka-hardlink sa ibang direktoryo at pagkatapos i-mirror ang
sinusuri ang mga hardlink. Ang lahat ng "sirang" hardlink ay nagpapahiwatig ng pag-update ng file.

-subukang muli $nr
Itakda ang bilang ng mga pagtatangka upang ilipat ang naprosesong dokumento. Ang default ay itinakda sa 1, ito
ibig sabihin, muling susubukan ng pavuk nang isang beses upang makakuha ng mga dokumentong nabigo sa unang pagsubok.

-nregets $nr
Itakda ang bilang ng mga pinapayagang regets sa isang dokumento, pagkatapos ng sirang paglipat.
Ang default na halaga para sa opsyong ito ay 2.

-nredirs $nr
Itakda ang bilang ng mga pinapayagang pag-redirect ng HTTP. (gamitin ito para sa pag-iwas sa mga loop) Default
ang halaga para sa opsyong ito ay 5, at umaayon sa detalye ng HTTP.

-force_reget/-noforce_reget
Pilitin ang pagbawi ng buong dokumento pagkatapos ng sirang paglilipat kapag ang server
ay hindi sumusuporta sa pagkuha ng bahagyang nilalaman. Ang default na gawi ng Pavuk ay huminto
pagkuha ng mga dokumento na hindi nagpapahintulot sa pag-restart ng paglipat mula sa tinukoy na posisyon.

-timeout $nr
Timeout para sa mga natigil na koneksyon sa ilang minuto. Ginagamit din ang halagang ito para sa koneksyon
mga timeout. Para sa mga sub-minutong timeout, maaari mong gamitin ang mga numero ng floating point. Default
ang timeout ay 0, ibig sabihin ay hindi pinagana ang timeout checking.

-noRobots/-Robots
Pinipigilan ng switch na ito ang paggamit ng robots.txt pamantayan, na ginagamit sa
higpitan ang pag-access ng mga Web robot sa ilang lokasyon sa web server. Default ay
pinapayagang suriin ang mga robots.txt file sa mga HTTP server. Paganahin ang opsyong ito palagi
kapag nagda-download ka ng malalaking hanay ng mga pahina na may hindi nahuhulaang layout. Ito
pinipigilan ka na magalit sa mga administrator ng server :-).

-noEnc/-Enc
Pinipigilan ng switch na ito ang paggamit ng gzip or magsiksik or magpaputok pag-encode sa paglilipat. ako
hindi alam kung ang ilang mga server ay sira o ano, ngunit sila ay nagpapalaganap ng MIME na iyon
i-type ang application/gzip o application/compress bilang naka-encode. I-off ang opsyong ito,
kapag wala kang suporta sa libz na pinagsama-sama at gayundin gzip programa na ginagamit
upang i-decode ang dokumentong naka-encode sa ganitong paraan. Sa default ay ang pag-decode ng na-download na dokumento
may kapansanan

-check_size/-nocheck_size
Ang opsyon na -nocheck_size ay dapat gamitin kung sinusubukan mong mag-download ng mga pahina mula sa a
HTTP server na nagpapadala ng mali Haba ng Nilalaman: field sa MIME header ng
tugon. Default na pag-uugali ng pavuk ay suriin ang field na ito at magreklamo kung kailan
may mali.

-maxrate $nr
Kung hindi mo gustong ibigay ang lahat ng iyong transfer bandwidth sa pavuk, gamitin ang opsyong ito upang
itakda ang pinakamataas na rate ng paglipat ng pavuk. Tumatanggap ang opsyong ito ng floating point number sa
tukuyin ang rate ng paglipat sa kB/s. Kung gusto mong makakuha ng pinakamainam na mga setting, mayroon ka rin
upang i-play ang laki ng read buffer (opsyon -bufsize) dahil ginagawa ni pavuk
kontrol ng daloy lamang sa antas ng aplikasyon. Sa default pavuk gumamit ng buong bandwidth.

-minrate $nr
Kung ayaw mo ng mabagal na rate ng paglipat, pinapayagan ka ng opsyong ito na masira ang mga paglilipat
mabagal na bilis. Maaari mong itakda ang pinakamababang rate ng paglipat, at kung makuha ang koneksyon
mas mabagal kaysa sa ibinigay na rate, ang paglipat ay ititigil. Ang pinakamababang rate ng paglipat
ay ibinibigay sa kB/s. Sa default, hindi sinusuri ng pavuk ang limitasyong ito.

-bufsize $nr
Ginagamit ang opsyong ito upang tukuyin ang laki ng read buffer (default na laki: 32kB).
Kung mayroon kang napakabilis na koneksyon, maaari mong dagdagan ang laki ng buffer na makukuha
isang mas mahusay na pagganap ng pagbabasa. Kung kailangan mong bawasan ang rate ng paglipat, maaaring kailanganin mo
upang bawasan ang laki ng buffer at itakda ang maximum na rate ng paglipat gamit ang
-maxrate opsyon. Tinatanggap ng opsyong ito ang laki ng buffer sa kB.

-fs_quota $nr
Kung nagpapatakbo ka ng pavuk sa isang multiuser system, maaaring kailanganin mong iwasan ang pagpuno
iyong file system. Hinahayaan ka ng opsyong ito na tukuyin kung gaano karaming espasyo ang dapat manatiling libre. Kung
Nakita ng pavuk ang isang underrun ng libreng espasyo, hihinto ito sa pag-download ng mga file.
Tukuyin ang quota na ito sa kB. Ang default na halaga ay 0, at ang ibig sabihin nito ay walang pagsuri nito
quota.

-file_quota $nr
Kapaki-pakinabang ang opsyong ito kapag gusto mong limitahan ang pag-download ng malalaking file, ngunit gusto mo
mag-download ng hindi bababa sa $nr kilobytes mula sa malalaking file. Isang malaking file ang ililipat,
at kapag ito ay umabot sa tinukoy na laki, ang paglipat ay masisira. Ang nasabing dokumento ay magiging
naproseso bilang maayos na na-download, kaya mag-ingat kapag ginagamit ang opsyong ito. Sa default
Ang pavuk ay naglilipat ng buong laki ng mga dokumento.

-trans_quota $nr
Kung alam mo na ang iyong pinili ay dapat tumugon sa isang malaking halaga ng data, magagawa mo
gamitin ang opsyong ito upang limitahan ang dami ng inilipat na data. Ang default ay ayon sa laki
walang limitasyong paglipat.

-max_time $nr
Itakda ang maximum na dami ng oras para sa pagpapatakbo ng programa. Matapos lumampas ang oras, hihinto ang pavuk
nagda-download. Ang oras ay tinukoy sa minuto. Ang default na halaga ay 0, at ang ibig sabihin nito
hindi limitado ang oras ng pag-download.

-url_diskarte $estratehiya
Binibigyang-daan ka ng opsyong ito na tumukoy ng order sa pag-download para sa mga URL sa document tree.
Tinatanggap ng opsyong ito ang mga sumusunod na string bilang mga parameter :

antas - mag-o-order ng mga URL habang nilo-load ito mula sa mga HTML file (default)
leveli - tulad ng dati, ngunit ang mga inline na bagay na URL ang mauna
pre - ay maglalagay ng mga URL mula sa aktwal na HTML na dokumento sa simula, bago ang iba
prei - tulad ng dati, ngunit ang mga inline na bagay na URL ang mauna

-send_if_range/-nosend_if_range
magpadala If-Range: header sa kahilingan sa HTTP. Nalaman ko, na ang ilang mga HTTP server
(pagbati, MS :-)) ay nagpapadala ng iba ETag: mga patlang sa iba't ibang mga tugon para sa
pareho, hindi nabagong dokumento. Nagdudulot ito ng mga problema kapag sinubukan ng pavuk na i-reget a
dokumento mula sa naturang server: tatandaan ng pavuk ang lumang halaga ng ETag at gagamitin ito
sumusunod na mga kahilingan para sa dokumentong ito. Kung susuriin ito ng server gamit ang bagong ETag
halaga at ito ay naiiba, ito ay tatanggi na magpadala lamang ng bahagi ng dokumento, at magsimula
ang pag-download mula sa simula.

-ssl_version $v
Itakda ang kinakailangang bersyon ng SSL protocol para sa SSL na komunikasyon. $v ay isa sa ssl2, ssl23,
ssl3 o tls1. Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama sa suporta ng SSL.
Ang default ay ssl23.

-unique_sslid/-nounique_sslid
Maaaring gamitin ang opsyong ito kung gusto mong gumamit ng kakaiba SSL ID para sa lahat ng SSL session.
Ang default na gawi ng pavuk ay ang makipag-ayos sa bawat oras na may bagong session ID para sa bawat isa
koneksyon. Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama sa suporta ng SSL.

-use_http11/-nouse_http11
Ginagamit ang opsyong ito upang lumipat sa pagitan ng HTTP/1.0 at HTTP/1.1 na protocol na ginagamit sa HTTP
mga server. Ngayon ay gumagamit ng HTTP/1.1 protocol na hindi default dahil ang pagpapatupad nito
ay napakasariwa at hindi 100% nasubok. Kahit na ang paggamit ng HTTP/1.1 ay napaka
inirerekomenda, dahil mas mabilis ito kaysa sa HTTP/1.0 at gumagamit ng mas kaunting bandwidth ng network para sa
pagsisimula ng mga koneksyon. Sa anumang karagdagang bersyon ay ia-activate ko ang paggamit ng HTTP/1.1 bilang
default.

-local_ip $ addr
Magagamit mo ang opsyong ito kapag gusto mong gumamit ng tinukoy na interface ng network para sa
komunikasyon sa ibang mga host. Ang pagpipiliang ito ay angkop para sa mga multihomed host na may
ilang mga interface ng network. Dapat ilagay ang address bilang regular na IP address o bilang
pangalan ng host.

-pagkakakilanlan $str
Binibigyang-daan ka ng opsyong ito na tukuyin ang nilalaman ng Ahente ng Gumagamit: larangan ng kahilingan sa HTTP.
Ito ay magagamit, kapag ang mga script sa malayong server ay nagbabalik ng magkaibang dokumento sa pareho
URL para sa iba't ibang browser, o kung ang ilang HTTP server ay tumangging maghatid ng dokumento para sa Web
mga robot tulad ng pavuk. Ang default na pavuk ay nagpapadala Ahente ng Gumagamit: parang pavuk/$VERSION string.

-auto_referer/-noauto_referer
Pinipilit ng opsyong ito ang pavuk na magpadala ng HTTP Referer: field ng header na may mga panimulang URL.
Ang nilalaman ng field na ito ay magiging sariling URL. Ang paggamit ng opsyong ito ay kinakailangan, kapag malayo
sinusuri ng server ang Referer: field. Sa default, hindi ipapadala ni pavuk ang Referer: field na may
mga panimulang URL.

-referer/-noreferer
Ang pagpipiliang ito ay nagbibigay-daan upang paganahin at huwag paganahin ang pagpapadala ng HTTP Referer: header
patlang. Sa default, ipinapadala ng pavuk ang Referer: field.

-httpad $str
Sa ilang mga kaso, maaaring gusto mong magdagdag ng mga field na tinukoy ng gumagamit sa mga kahilingan sa HTTP/HTTPS. Ito
ang pagpipilian ay eksaktong para sa layuning ito. Sa $str maaari mong direktang tukuyin ang nilalaman ng
karagdagang header. Kung hilaw na header lang ang tutukuyin mo, gagamitin lang ito para sa
pagsisimula ng mga kahilingan. Kapag gusto mong gamitin ang header na ito sa bawat kahilingan habang
pag-crawl, lagyan ng prefix ang header na may + na karakter.

-del_after/-nodel_after
Binibigyang-daan ka ng opsyong ito na tanggalin ang FILES mula sa REMOTE server, kapag ang pag-download ay
maayos na natapos. Sa default, naka-off ang opsyong ito.

-FTPlist/-noFTPlist
Kapag gagamitin ang opsyon -FTPlist, kukunin ng pavuk ang nilalaman ng mga direktoryo ng FTP
gamit ang FTP command LIST sa halip ng NLST. Kaya't ang parehong listahan ay kukunin bilang
na may "ls -l" na utos ng UNIX. Ang pagpipiliang ito ay kinakailangan kung kailangan mong panatilihin
mga pahintulot ng malalayong file o kailangan mong panatilihin ang mga simbolikong link. Sumusuporta si Pavuk
malawak na listahan sa mga FTP server na may regular BSD or SYSV istilong "ls -l" na direktoryo
listahan, sa mga FTP server na may EPFL format ng listahan, VMS listahan ng istilo, DOS/Windows
listahan ng istilo at Kathambuhay format ng listahan. Default na pag-uugali ng pavuk ay ang paggamit ng NLST pabalik-balik
Mga listahan ng direktoryo ng FTP.

-ftp_list_options $str
Ang ilang mga FTP server ay nangangailangan na magbigay ng mga karagdagang opsyon sa LIST o NLST FTP na mga command sa
ipakita nang maayos ang lahat ng mga file at direktoryo. Ngunit siguraduhing huwag gumamit ng anumang mga karagdagang opsyon
na maaaring mag-reformat ng output ng listahan. Kapaki-pakinabang ay lalo na -a opsyon na alin
pilitin ang FTP server na ipakita din ang mga tuldok na file at direktoryo at may sirang WuFTP
mga server nakakatulong din ito upang makagawa ng buong listahan ng direktoryo hindi lamang ng mga file.

-fix_wuftpd/-nofix_wuftpd
Ang pagpipiliang ito ay resulta ng ilang mga pagtatangka upang gumana nang maayos ang
-tanggalin_luma opsyon sa WuFTPd server kapag -ftplist ginagamit ang opsyon. Ang problema ay
na FTP command LIST sa WuFTPd ay hindi tututol kapag sinusubukang ilista ang wala
direktoryo, at nagpapahiwatig ng tagumpay sa FTP response code. Kapag na-activate mo ito
opsyon, ang pavuk ay gumagamit ng dagdag na FTP command (STAT -d dir) upang suriin kung ang direktoryo
talagang umiiral. Huwag gamitin ang opsyong ito hangga't hindi ka nakakatiyak na talagang kailangan mo ito!

pagpapatunay


-auth_file $file
File kung saan ka nag-imbak ng impormasyon ng pagpapatunay para sa pag-access sa ilang serbisyo.
Para sa istraktura ng file tingnan sa ibaba sa MGA FILE seksyon.

-auth_name $user
Kung ginagamit mo ang parameter na ito, ang programa ay gumagawa ng pagpapatunay sa bawat HTTP
access sa dokumento. Gamitin lang ito kung alam mo na maaaring isang HTTP server lang
na-access o ginagamit -Lugar opsyon upang tukuyin ang site kung saan mo ginagamit ang pagpapatunay.
Kung hindi, ipapadala ang iyong mga parameter ng auth sa bawat na-access na HTTP server.

-auth_passwd $passwd
Ang halaga ng parameter na ito ay ginagamit bilang password para sa pagpapatunay

-auth_scheme {1/2/3/4/user/Basic/Digest/NTLM}
Tinutukoy ng parameter na ito ang ginamit na scheme ng pagpapatunay.
1 or gumagamit paraan gumagamit Ang scheme ng pagpapatunay ay ginagamit bilang tinukoy sa HTTP/1.0 o
HTTP/1.1. Ang password at user name ay ipinadala nang hindi naka-encode.
2 or Basic paraan Basic Ang scheme ng pagpapatunay ay ginagamit gaya ng tinukoy sa HTTP/1.0.
Ang password at user name ay ipinadala BASE64 na naka-encode.
3 or Digest paraan Digest i-access ang scheme ng pagpapatunay batay sa mga MD5 checksum bilang
tinukoy sa RFC2069.
4 or NTLM paraan NTLM proprietary access authentication scheme na ginagamit ng Microsoft
IIS o Proxy server. Kapag ginamit mo ang scheme na ito, dapat mo ring tukuyin ang NT o LM
domain na may opsyon -auth_ntlm_domain. Ang scheme na ito ay sinusuportahan lamang kapag pinagsama-sama
na may mga OpenSSL o libdes na mga aklatan.

-auth_ntlm_domain $str
NT o LM domain na ginamit para sa awtorisasyon muli HTTP server kapag NTLM authentication
kailangan ang scheme. Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama sa OpenSSL o
mga aklatan ng libdes.

-auth_reuse_nonce/-noauth_reuse_nonce
Habang gumagamit ng HTTP Digest access authentication scheme, gumamit ng unang natanggap nang hindi pa natatanggap
halaga sa higit pang mga sumusunod na kahilingan. Ang default na pavuk ay nakikipag-negotiate ng wala para sa bawat kahilingan.

-ssl_key_file $file
File na may pampublikong key para sa SSL certificate (matuto nang higit pa mula sa SSLeay o OpenSSL
dokumentasyon) Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama sa suporta ng SSL (ikaw
kailangan ng SSleay o OpenSSL na mga library at development header)

-ssl_cert_file $file
Certificate file sa PEM format (matuto nang higit pa mula sa SSLeay o OpenSSL na dokumentasyon)
Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama sa suporta ng SSL (kailangan mo ng SSleay o
OpenSSL library at development header)

-ssl_cer_passwd $str
Password na ginamit upang bumuo ng certificate (matuto nang higit pa mula sa SSLeay o OpenSSL
dokumentasyon) Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama sa suporta ng SSL (ikaw
kailangan ng SSLeay o OpenSSL na mga library at development header)

-nss_cert_dir $dir
Direktoryo ng config para sa mga certificate ng NSS (Netscape SSL implementation). Karaniwan
~/.netscape (nilikha ng Netscape communicator/navigator) o direktoryo ng profile sa ibaba
~/.mozilla (nilikha ng Mozilla browser). Ang direktoryo ay dapat maglaman cert7.db at
susi3.db mga file. Kung hindi mo ginagamit ang Mozilla o Netscape, dapat mong likhain ang mga file na ito sa pamamagitan ng
mga utility na ipinamahagi sa mga aklatan ng NSS. Ang Pavuk ay nagbubukas ng database ng sertipiko lamang
Basahin lamang. Available lang ang opsyong ito kapag pinagsama-sama ang pavuk na may suporta sa SSL
ibinigay ng pagpapatupad ng Netscape NSS SSL.

[-nss_accept_unknown_cert/-nonss_accept_unknown_cert]
Bilang default, tatanggihan ng pavuk ang koneksyon sa SSL server kung aling sertipiko ang hindi
nakaimbak sa lokal na database ng sertipiko (itinakda ni -nss_cert_dir opsyon). Kailangan mo
tahasang pilitin ang pavuk na payagan ang koneksyon sa mga server na may hindi kilalang mga sertipiko.
Available lang ang opsyong ito kapag pinagsama-sama ang pavuk na may suportang SSL na ibinigay ng
Pagpapatupad ng Netscape NSS SSL.

[-nss_domestic_policy/-nss_export_policy]
Pumipili ng mga hanay ng mga cipher na pinapayagan/na-disable ng mga panuntunan sa pag-export ng USA. Ang pagpipiliang ito ay
magagamit lamang kapag ang pavuk ay pinagsama-sama sa suporta ng SSL na ibinigay ng Netscape NSS SSL
pagpapatupad.

Mula sa $email
Ginagamit ang parameter na ito kapag ina-access ang anonymous na FTP server bilang password o ay
opsyonal na ipinasok sa mula sa field sa kahilingan ng HTTP. Kung hindi tinukoy pavuk
natuklasan ito mula sa USER variable ng kapaligiran at mula sa hostname ng site.

-send_from/-nosend_from
Ginagamit ang opsyong ito para sa pagpapagana o hindi pagpapagana ng pagpapadala ng pagkakakilanlan ng user,
pumasok sa Mula sa opsyon, bilang FTP anonymous user password at Mula sa: larangan ng HTTP
hiling. Bilang default, naka-off ang opsyong ito.

-ftp_login_handshake $host $pagkamay
Kapag kailangan mong gumamit ng hindi karaniwang pamamaraan sa pag-log in para sa ilan sa mga FTP server, magagawa mo
gamitin ang opsyong ito para baguhin ang default na pavuk login procedure. Upang payagan ang higit na kakayahang umangkop,
maaari mong italaga ang pamamaraan sa pag-log in sa ilang server o sa lahat. Kailan $host is
tinukoy bilang walang laman na string (""), kaysa sa naka-attach na pamamaraan sa pag-log in ay itinalaga sa lahat
Mga FTP server bukod sa mga nagtalaga ng sariling mga pamamaraan sa pag-login. Nasa $pagkamay
parameter na maaari mong tukuyin ang eksaktong pamamaraan sa pag-login na tinukoy ng mga utos ng FTP na sinundan
sa pamamagitan ng inaasahang FTP na mga response code na nililimitahan ng backslash () character.
Halimbawa ito ay default na pamamaraan sa pag-login kapag nag-log in sa regular na ftp server
nang hindi dumaan sa proxy server: USER %u\331\PASS %p\230. Mayroong dalawang
mga command na sinusundan ng dalawang response code. Pagkatapos ng utos ng USER, inaasahan ni pavuk ang FTP
tugon code 331 at pagkatapos ng PASS command inaasahan pavuk mula sa server FTP tugon
code 230. Sa ftp commands maaari mong gamitin ang mga sumusunod na macros na papalitan ng
kaukulang halaga:

%u - user name na ginamit para ma-access ang FTP server
%p - password na ginamit upang ma-access ang FTP server
%U - user name na ginamit upang ma-access ang FTP proxy server
%P - password na ginamit upang ma-access ang FTP proxy server
%h - hostname ng FTP server
%s - Port number kung saan nakikinig ang FTP server

Site/Domain/Port Limitasyon Options


-Lugar $listahan
Tukuyin ang listahan ng pinaghihiwalay ng kuwit ng mga pinapayagang site kung saan naroroon ang mga isinangguni na dokumento
nakaimbak

-dsite $listahan
Tukuyin ang pinaghihiwalay ng kuwit na listahan ng mga hindi pinapayagang site. Ang dating parameter ay kabaligtaran
sa isang ito. Kung pareho ang ginamit ang huling paglitaw ng mga ito ay ginagamit upang maging wasto.

-adomain $listahan
Tukuyin ang listahan na pinaghihiwalay ng kuwit ng mga pinapayagang domain kung saan naroroon ang mga isinangguni na dokumento
nakaimbak

-ddomain $listahan
Tukuyin ang comma separated list ng mga hindi pinapayagang domain. Ang dating parameter ay kabaligtaran
sa isang ito. Kung pareho ang ginamit ang huling paglitaw ng mga ito ay ginagamit upang maging wasto.

-aport $listahan
In $listahan, maaari kang magsulat ng listahan ng mga port na pinaghihiwalay ng kuwit kung saan mo pinapayagan
mag-download ng mga dokumento.

-dport $listahan
Ang opsyon na ito ay kabaligtaran ng opsyon sa nakaraang opsyon. Ito ay ginagamit upang tukuyin ang tinanggihan
mga daungan. Kung pareho -aport at -dport ang mga pagpipilian ay ginagamit ang huling paglitaw ng mga ito ay
dating wasto at lahat ng iba pang pangyayari ay aalisin.

Limitasyon Dokumento mga katangian


-amimet $listahan
Listahan ng mga pinaghihiwalay ng kuwit na pinapayagang mga uri ng MIME. Maaari mo ring gamitin ang pagpipiliang ito
mga pattern ng wildcard.

-dmimet $listahan
Listahan ng mga pinaghihiwalay ng kuwit na hindi pinapayagan ang mga uri ng MIME. Maaari mo ring gamitin ang pagpipiliang ito
mga pattern ng wildcard. Ang nakaraang parameter ay kabaligtaran sa isang ito. Kung pareho ang ginagamit
ang huling paglitaw ng mga ito ay ginagamit upang maging wasto.

-maxsize $nr
Pinakamataas na pinapayagang laki ng dokumento. Nalalapat lang ang opsyong ito kapag kaya ng pavuk
upang makita ang dokumento bago simulan ang paglipat. Ang default na halaga ay 0, at ito
nangangahulugan na ang limitasyong ito ay hindi nalalapat.

-maliit $nr
minimal na pinapayagang laki ng dokumento. Nalalapat lang ang opsyong ito kapag kaya ng pavuk
upang makita ang dokumento bago simulan ang paglipat. Ang default na halaga ay 0, at ito
nangangahulugan na ang limitasyong ito ay hindi nalalapat.

-mas bago_kaysa $ oras
Pahintulutan lamang ang paglipat ng mga dokumento na may oras ng pagbabago na mas bago kaysa sa tinukoy sa
parameter $oras. Ang format ng $time ay: YYYY.MM.DD.hh:mm. Upang ilapat ang pagpipiliang ito pavuk
dapat na matukoy ang oras ng pagbabago ng dokumento.

-mas luma sa $ oras
Pahintulutan lamang ang paglipat ng mga dokumento na may oras ng pagbabago na mas matanda kaysa sa tinukoy sa
parameter $oras. Ang format ng $time ay: YYYY.MM.DD.hh:mm. Upang ilapat ang pagpipiliang ito pavuk
dapat na matukoy ang oras ng pagbabago ng dokumento.

-walangCGI/-CGI
pinipigilan ng switch na ito ang paglipat ng mga dynamic na nabuong parametric na dokumento sa pamamagitan ng
CGI interface. Natukoy ito sa paglitaw ng ? character sa loob ng URL. Default
Ang pag-uugali ng pavuk ay upang payagan ang paglipat ng mga URL na may mga string ng query.

-alang $listahan
binibigyang-daan ka nitong tukuyin ang ordered comma separated list ng gustong natural
mga wika. Gumagana lang ang opsyong ito sa paggamit ng HTTP at HTTPS protocol Tanggapin-
Wika: patlang ng MIME.

-acharset $listahan
Binibigyang-daan ka ng mga opsyong ito na maglagay ng listahan na pinaghihiwalay ng kuwit ng ginustong pag-encode ng
mga inilipat na dokumento. Gumagana lamang ito sa mga url ng HTTP at HTTPS at kung ganoon lang
ang mga pag-encode ng dokumento ay matatagpuan sa patutunguhang server.
halimbawa: -acharset iso-8859-2,windows-1250,utf8

Limitasyon Dokumento pangalan


-asfx $listahan
Binibigyang-daan ka ng parameter na ito na tukuyin ang hanay ng mga suffix na ginamit upang paghigpitan ang pagpili ng
mga dokumentong ipoproseso.

-dsfx $listahan
Set ng mga suffix na ginagamit upang tukuyin ang paghihigpit sa pagpili ng mga dokumento.
Ang isang ito ay kabaligtaran sa nakaraang opsyon. Pinaghihiwalay nila ang isa't isa.

-apfix $list, -dprefix $listahan
Nagbibigay-daan sa iyo ang dalawang opsyong ito na tukuyin ang hanay ng mga pinapayagan o hindi pinapayagang prefix ng
mga dokumento. Pinaghihiwalay nila ang isa't isa.

-pattern $pattern
Binibigyang-daan ka ng opsyong ito na tukuyin ang pattern ng wildcard para sa mga dokumento. Ang lahat ng mga dokumento ay
sinubukan kung tumutugma sila sa pattern na ito.

-rpattern $reg_exp
Ito ay pantay na opsyon tulad ng nauna, ngunit gumagamit ito ng mga regular na expression. Available
sa mga platform lamang na mayroong anumang suportadong pagpapatupad ng RE.

-skip_pattern $pattern
Binibigyang-daan ka ng opsyong ito na tukuyin ang wildcard pattern para sa mga dokumentong dapat
nilaktawan. Sinusubukan ang lahat ng mga dokumento kung tumutugma ang mga ito sa pattern na ito.

-skip_rpattern $reg_exp
Ito ay pantay na opsyon tulad ng nauna, ngunit gumagamit ito ng mga regular na expression. Available
sa mga platform lamang na mayroong anumang suportadong pagpapatupad ng RE.

-url_pattern $pattern
Binibigyang-daan ka ng opsyong ito na tukuyin ang pattern ng wildcard para sa mga URL. Lahat ng URL ay sinusubok kung
tumutugma sila sa pattern na ito.
Halimbawa:
-url_pattern http://\*.idata.sk:\*/~ondrej/\* . pinapagana ng opsyong ito ang lahat ng HTTP URL
mula sa domain na .idata.sk sa lahat ng port na matatagpuan sa ilalim ng /~ondrej/.

-url_rpattern $reg_exp
Ito ay pantay na opsyon tulad ng nauna, ngunit gumagamit ito ng mga regular na expression. Available
sa mga platform lamang na mayroong anumang suportadong pagpapatupad ng RE.

-skip_url_pattern $pattern
Binibigyang-daan ka ng opsyong ito na tukuyin ang wildcard pattern para sa mga URL na dapat laktawan.
Sinusubukan ang lahat ng URL kung tumutugma ang mga ito sa pattern na ito.

-skip_url_rpattern $reg_exp
Ito ay pantay na opsyon tulad ng nauna, ngunit gumagamit ito ng mga regular na expression. Available
sa mga platform lamang na mayroong anumang suportadong pagpapatupad ng RE.

-aip_pattern $re
Binibigyang-daan ka ng opsyong ito na limitahan ang hanay ng mga inilipat na dokumento sa pamamagitan ng IP address ng server.
Maaaring tukuyin ang IP address bilang mga regular na expression, kaya posibleng tukuyin
set ng mga IP address sa pamamagitan ng isang expression. Magagamit lamang sa mga platform na mayroon
suportadong pagpapatupad ng RE.

-dip_pattern $re
Ang opsyong ito ay katulad ng nakaraang opsyon, ngunit ginagamit upang tukuyin ang hanay ng hindi pinapayagang IP
mga address. Magagamit lamang sa mga platform na mayroong anumang suportadong pagpapatupad ng RE.

-tag_pattern $tag $attrib $url
Mas malakas na bersyon ng -url_pattern opsyon para sa mas tumpak na pagtutugma ng pinapayagan
Mga URL batay sa pattern ng pangalan ng HTML tag, pattern ng pangalan ng attribute ng HTML tag at sa URL
pattern. Magagamit mo sa lahat ng tatlong parameter ng opsyong ito ang mga pattern ng wildcard, sa gayon
isang bagay tulad ng -tag_pattern '*' '*' url_pattern ay katumbas ng -url_pattern
url_pattern. ang $tag at $attrib ang mga parameter ay palaging itinutugma muli sa uppercase
mga string. Halimbawa kung gusto mo hayaan lang ang pavuk na sundin lamang ang mga regular na link na hindi pinapansin
anumang mga stylesheet, larawan, atbp., gamitin ang opsyon -tag_pattern A HREF '*'.

-tag_rpattern $tag $attrib $url
Ito ay pagkakaiba-iba sa -tag_pattern. Gumagamit ito ng mga pattern ng regular na expression sa
mga parameter sa halip na mga pattern ng wildcard na ginamit sa nakaraang opsyon.

Limitasyon Protokol Opsyon


-noHTTP/-HTTP
Pinipigilan ng switch na ito ang lahat ng paglilipat sa pamamagitan ng HTTP protocol. Default ay transfer
sa pamamagitan ng HTTP na pinagana.

-walangSSL/-SSL
Pinipigilan ng switch na ito ang lahat ng paglilipat sa pamamagitan ng HTTPS protocol (HTTP protocol over
SSL). Ang default ay ang paglipat sa pamamagitan ng HTTPS na pinagana. Available lang ang opsyong ito
kapag pinagsama-sama sa suporta ng SSL (kailangan mo ng SSleay o OpenSSL na mga aklatan at
mga header ng pag-unlad)

-noGopher/-Gopher
Pigilan ang lahat ng paglilipat sa pamamagitan ng Gopher Internet protocol. Default ay transfer
trough Gopher pinagana.

-noFTP/-FTP
Pinipigilan ng switch na ito ang pagproseso ng mga dokumentong nakalaan sa lahat ng FTP server. Default ay
pinagana ang paglipat sa pamamagitan ng FTP.

-noFTPS/-FTPS
Pinipigilan ng switch na ito ang pagproseso ng mga dokumentong nakalaan sa lahat ng FTP server na na-access
sa pamamagitan ng SSL. Ang default ay ang paglipat sa pamamagitan ng FTPS na pinagana. Available ang opsyong ito
kapag pinagsama-sama lamang sa suporta ng SSL (kailangan mo ng SSleay o OpenSSL na mga aklatan at
mga header ng pag-unlad)

-FTPhtml/-noFTPhtml
Sa pamamagitan ng paggamit ng opsyon -FTPhtml maaari mong pilitin ang pavuk na iproseso ang mga HTML na file na na-download
na may FTP protocol. Sa default, hindi i-parse ng pavuk ang mga HTML file mula sa mga FTP server.

-FTPdir/-noFTPdir
Pilitin din ang recursive na pagproseso ng mga direktoryo ng FTP. Sa default ay recursive
tinanggihan ang pag-download mula sa mga FTP server.

-disable_html_tag $TAG,[$ATTRIB][;...]
-enable_html_tag $TAG,[$ATTRIB][;...] Paganahin o huwag paganahin ang pagproseso ng partikular
Mga HTML tag o attribute. Sa default lahat ng sinusuportahang HTML tags ay pinagana.

Halimbawa kung hindi mo gustong iproseso ang lahat ng mga larawan dapat mong gamitin ang opsyon
-disable_html_tag 'IMG,SRC;INPUT,SRC;BODY,BACKGROUND' .

iba Limitasyon Options


-subdir $dir
Subdirectory ng lokal na direktoryo ng puno, upang limitahan ang ilan sa mga mode {sync,
resumeregets, linkupdate} sa tree scan nito.

-dont_leave_site/-leave_site
(Huwag) umalis sa panimulang lugar. Sa default, ang pavuk ay maaaring sumasaklaw sa host kapag umuulit
WWW puno.

-dont_leave_dir/-leave_dir
(Huwag) umalis sa panimulang direktoryo. Kung ginamit ang -dont_leave_dir na opsyon ay mananatili ang pavuk
lamang sa panimulang direktoryo (kabilang ang sarili nitong mga subdirectory). Sa default na pavuk
maaaring umalis sa mga panimulang direktoryo.

-leave_site_enter_dir/-dont_leave_site_enter_dir
Kung nagda-download ka ng WWW tree na sumasaklaw sa maraming host na may malalaking puno, maaari mong
nais na payagan ang pag-download ng dokumento na nasa hierarchy ng direktoryo sa ibaba
direktoryo na aming binisita bilang una sa bawat site. Upang makuha ito, gamitin ang opsyon
-dont_leave_site_enter_dir. Bilang default, mapupunta din ang pavuk sa mas mataas na direktoryo
mga antas sa site na iyon.

-lmax $nr
Itakda ang maximum na pinapayagang antas ng pagtawid ng puno. Ang default ay nakatakda sa 0, ano ang ibig sabihin nito
maaaring tumawid ang pavuk nang walang katapusan. Sa bersyon 0.8pl1 inline na mga bagay ng mga pahina ng HTML
ay inilalagay sa parehong antas ng parent HTML page.

-leave_level $nr
Pinakamataas na antas ng mga dokumento sa labas ng site ng panimulang URL. Ang default ay nakatakda sa 0,
at 0 ay nangangahulugan na ang pagsuri ay hindi inilapat.

-site_level $nr
Pinakamataas na antas ng mga site sa labas ng site ng panimulang URL. Ang default ay nakatakda sa 0, at
0 ay nangangahulugan na ang pagsuri ay hindi inilapat.

-dmax $nr
Itakda ang maximum na pinapayagang bilang ng mga dokumentong naproseso. Ang default na halaga ay 0.
Nangangahulugan iyon na walang mga paghihigpit na ginagamit sa bilang ng mga naprosesong dokumento.

-singlepage/-nosinglepage
Paggamit ng opsyon -singlepage nagbibigay-daan sa iyo na maglipat lamang ng mga HTML na pahina kasama ang lahat nito
mga inline na bagay (mga larawan, tunog, mga dokumento ng frame, ...). Bilang default ay hindi pinagana
paglipat ng isang pahina. Ginagawa ng pagpipiliang ito -mode singlepage lipas na ang opsyon.

-limit_inlines/-dont_limit_inlines
Sa opsyong ito, makokontrol mo kung nalalapat din ang mga opsyon sa paglilimita sa inline
mga bagay (larawan, tunog, ...). Ito ay kapaki-pakinabang kapag gusto mong i-download ang tinukoy
hanay ng mga HTML page na may lahat ng inline na opsyon nang walang anumang paghihigpit.

-kondisyon_user $str
Pangalan ng script o program para sa mga sariling kundisyon ng mga user. Maaari kang magsulat ng anumang script na
dapat na may exit value ang magpasya kung i-download ang URL o hindi. Nakukuha ang script mula sa pavuk any
bilang ng mga pagpipilian, na may ganitong kahulugan:

-url $url - naprosesong URL
-magulang $url - anumang bilang ng mga URL ng magulang
Antas ng $nr - antas ng URL na ito mula sa panimulang URL
-laki $nr - laki ng hiniling na URL
-petsa $datenr - oras ng pagbabago ng hiniling na URL sa format YYYYMMDDhhmmss

Ang exit status 0 ng script o program ay nangangahulugan na ang kasalukuyang URL ay dapat tanggihan
at ang nonzero exit status ay nangangahulugan na ang URL ay dapat tanggapin.
babala : gumamit lamang ng mga kundisyon ng user kung kinakailangan dahil sa malalaking paghina na dulot ng
forking script para sa bawat naka-check na URL.

-follow_cmd $str
Binibigyang-daan ka ng opsyong ito na tukuyin ang script o program na maaaring sa pamamagitan ng katayuan ng paglabas nito
magpasya kung susundin ang mga URL mula sa kasalukuyang HTML na dokumento. Ang script na ito ay magiging
tinawag pagkatapos ng pag-download ng bawat HTML na dokumento. Makakakuha ang script ng mga sumusunod na opsyon
bilang ito ay mga parameter:

-url $url - URL ng kasalukuyang HTML na dokumento
-infile $file - lokal na file kung saan nakaimbak ang HTML na dokumento

Ang exit status 0 ng script o program ay nangangahulugan na ang mga URL mula sa kasalukuyang dokumento ay
hindi pinapayagan, ang ibig sabihin ng ibang exit status, na maaaring sundin ng pavuk ang mga link mula sa kasalukuyan
HTML na dokumento.

Javascript suportahan


Ang suporta para sa mga wika sa pag-script tulad ng JavaScript o VBScript sa pavuk ay medyo hacky
paraan. Walang interpreter para sa mga wikang ito, kaya hindi lahat ng bagay ay gagana. buo
Ang suporta na mayroon ang pavuk para sa mga wikang ito ng scripting ay batay sa regular na expression
mga pattern na tinukoy ng gumagamit. Pavuk search para sa mga pattern na ito sa DOM event attributes ng HTML
mga tag, sa javascript:... mga URL, sa mga inline na script sa mga HTML na dokumento na nakapaloob sa pagitan
mga tag at sa magkahiwalay na javascript file. Suporta para sa mga wika ng script
ay magagamit lamang kapag ang pavuk ay pinagsama-sama ng wastong regular na expression na library
(POSIX/GNU/PCRE).

-enable_js/-disable_js
Ang mga opsyon na ito ay ginagamit upang paganahin o huwag paganahin ang pagproseso ng mga bahagi ng Javascript ng HTML
mga dokumento. Dapat mong paganahin ang pagpipiliang ito upang magamit ang pagproseso ng javascript
mga pattern.

-js_pattern $re
Sa opsyong ito, tinutukoy mo kung anong mga pattern ang tumutugma sa mga interesadong bahagi ng
Javascript para sa pagkuha ng mga URL. Ang parameter ay dapat na RE pattern na may eksaktong isa
subpattern na eksaktong tumutugma sa bahagi ng URL. Halimbawa upang tumugma sa URL sa sumusunod
uri ng javascript expression:
document.b1.src='pics/button1_pre.jpg'
maaari mong gamitin ang pattern na ito
"^dokumento.[a-zA-Z0-9_]*.src[ ]*=[ ]*'(.*)'$"

-js_transform $p $t $h $a
Ang opsyong ito ay katulad ng dati, ngunit maaari mong gamitin ang mga custom na panuntunan sa pagbabago para sa
Mga bahagi ng URL ng mga pattern at tukuyin din ang eksaktong HTML tag at attribute kung saan pupunta
hanapin ang pattern na ito. Ang $p ay ang pattern upang tumugma sa interesadong bahagi ng
iskrip. Ang $t ay transform rule para sa URL, sa parameter na ito ang $x mga bahagi ay
ay papalitan ng x-th subpattern ng $p pattern Ang $h ang parameter ay eksaktong HTML
tag o "*" kapag nalalapat ito sa javascript: URL o DOM event attrib o "" (walang laman
string) kapag nalalapat ito sa javascript body ng HTML na dokumento o hiwalay na JS file.
Ang $a Ang parameter ay eksaktong HTML attrib ng tag o "" (walang laman na string) kapag ang panuntunang ito
ilapat sa javascript body.

-js_transform2 $p $t $h $a
Ang pagpipiliang ito ay halos kapareho sa nauna. Ang kahulugan ng lahat ng mga parameter ay pareho,
pattern lang $p maaaring magkaroon lamang ng isang substring na gagamitin sa pagbabago
mamuno $t. Ito ay kinakailangan upang payagan ang muling pagsulat ng mga bahagi ng URL ng mga tag at script.
Magagamit din ang opsyong ito para pilitin ang pavuk na kilalanin ang mga pares ng HTML targ/attribute
na hindi sinusuportahan ng pavuk.

Cookie


-cookie_file $file
File kung saan nakaimbak ang mga impormasyon ng cookie. Ang file na ito ay dapat nasa Netscape cookie file
format (binuo gamit ang Netscape Navigator o Communicator ...).

-cookie_send/-nocookie_send
Gumamit ng mga nakolektang cookies sa mga kahilingan sa HTTP/HTTPS. Ang Pavuk ay hindi magpapadala sa default
cookies

-cookie_recv/-nocookie_recv
Mag-imbak ng natanggap na cookies mula sa mga tugon ng HTTP/HTTPS sa memory cookie cache. Sa
default na hindi maaalala ng pavuk ang natanggap na cookies.

-cookie_update/-nocookie_update
I-update ang cookie file sa disk at i-synchronize ito sa mga pagbabagong ginawa ng anumang kasabay
mga proseso. Sa default, hindi ia-update ng pavuk ang cookie file sa disk.

-cookies_max $nr
Pinakamataas na bilang ng cookies sa memory cookie cache. Ang default na halaga ay 0, at iyon
nangangahulugang walang mga paghihigpit para sa numero ng cookies.

-disabled_cookie_domains $listahan
Listahan ng mga cookie domain na pinaghihiwalay ng kuwit na pinahihintulutang magpadala ng cookies na nakaimbak
sa cookie cache

-cookie_check/-nocookie_check
Suriin kapag tumatanggap ng cookie, kung ang domain ng cookie ay katumbas ng domain ng server na kung saan
nagpapadala ng cookie na ito. Sa default na pavuk check ay ang server ay nagtatakda ng cookies para dito
domain, at kung susubukan nitong magtakda ng cookie para sa dayuhang domain ay magrereklamo si pavuk
iyon at tatanggihan ang naturang cookie.

HTML muling pagsusulat makina apinasyon pagpipilian


-noRelocate/-Relocate
Pinipigilan ng switch na ito ang program na muling isulat ang mga kamag-anak na URL sa ganap, pagkatapos ng HTML
inilipat ang dokumento. Default na pag-uugali ng pavuk ay upang mapanatili ang pagkakapare-pareho ng link ng
HTML na mga dokumento. Kaya palagi kapag na-download ang HTML na dokumento ay muling isusulat ng pavuk ang lahat
Mga URL na ituturo sa lokal na dokumento kung ito ay magagamit at kung ito ay hindi ito magagamit
ituturo sa malayong dokumento. Matapos ma-download nang maayos ang dokumento, gagawin ng pavuk
i-update ang mga link sa mga HTML na dokumento, na tumuturo sa isang ito.

-all_to_local/-noall_to_local
Pinipilit ng opsyong ito ang pavuk na baguhin ang lahat ng URL sa loob ng HTML na dokumento sa mga lokal na URL
kaagad pagkatapos mag-download ng dokumento. Default ay hindi pinagana ang opsyong ito.

-sel_to_local/-nosel_to_local
Pinipilit ng opsyong ito ang pavuk na baguhin ang lahat ng URL, na nagsasagawa ng mga kundisyon para sa
download, sa lokal sa loob ng HTML na dokumento kaagad pagkatapos ng pag-download ng dokumento. ako
Inirerekomenda na gamitin ang opsyong ito, kapag sigurado ka na, ang paglilipat na iyon ay walang anuman
mga problema. Ang pagpipiliang ito ay maaaring makatipid ng maraming oras ng processor. Default ang opsyong ito
may kapansanan

-all_to_remote/-noall_to_remote
Pinipilit ng opsyong ito ang pavuk na baguhin ang lahat ng URL sa loob ng HTML na dokumento sa mga malalayong URL
kaagad pagkatapos mag-download ng dokumento. Default ay hindi pinagana ang opsyong ito.

-post_update/-nopost_update
Ang pagpipiliang ito ay partikular na idinisenyo upang payagan ang pagpasok -fnrules opsyon sa paggawa ng mga panuntunan batay sa
Uri ng MIME ng dokumento. Pinipilit ng opsyong ito ang pavuk na bumuo ng mga lokal na pangalan para sa
mga dokumento pagkatapos lang malaman ng pavuk kung ano ang uri ng MIME ng dokumento. Ito ay may malaki
epekto sa rewriting engine ng mga link sa loob ng mga HTML na dokumento. Ang pagpipiliang ito ay sanhi
disfunction ng iba pang mga opsyon para sa pagkontrol sa link rewriting engine. Gamitin mo to
option lang kapag alam mo ang ginagawa mo :-)

-dont_touch_url_pattern $pat
Ang mga pagpipiliang ito ay nagsisilbing tanggihan ang muling pagsulat at pagproseso ng mga partikular na URL sa HTML
mga dokumento sa pamamagitan ng pavuk HTML rewriting engine. Ang opsyong ito ay tumatanggap ng mga pattern ng wildcard sa
tukuyin ang mga naturang URL. Ang pagtutugma ay ginagawa laban sa mga hindi nagalaw na URL kaya kapag siya ay URL
kamag-anak, dapat kang gumamit ng pattern na tumutugma sa kamag-anak na URL, kapag ito ay ganap,
dapat kang gumamit ng ganap na URL.

-dont_touch_url_rpattern $pat
Ang pagpipiliang ito ay pagkakaiba-iba sa nakaraang opsyon. Gumagamit ang isang ito ng mga regular na pattern para sa
pagtutugma ng mga URL sa halip na mga pattern ng wildcard na ginamit ni -dont_touch_url_pattern
opsyon. Available lang ang opsyong ito kapag pinagsama-sama ang pavuk na may suporta para sa
mga pattern ng regular na expression.

-huwag hawakan ang_tag_rpattern $pat
Ang pagpipiliang ito ay pagkakaiba-iba sa nakaraang opsyon, ang pagtutugma lamang ay ginawa sa buong HTML na tag
kasama ang <>. Tumatanggap ang opsyong ito ng mga pattern ng regular na expression. Ito ay magagamit
kapag ang pavuk ay pinagsama-samang may suporta para sa mga pattern ng regular na expression.

Filename/URL Conversion Opsyon


-tr_del_chr $str
Lahat ng mga character na matatagpuan sa $str ay tatanggalin mula sa lokal na pangalan ng dokumento. $str
dapat maglaman ng mga pagkakasunud-sunod ng pagtakas katulad ng sa tr command:
\n - bagong linya
\r - pagbabalik ng karwahe
\t - pahalang na puwang ng tab
\0xxx - hexadecimal na halaga ng ASCII
[:itaas:] - lahat ng malalaking titik
[:baba:] - lahat ng maliliit na titik
[:alpha:] - lahat ng mga titik
[:alnum:] - lahat ng mga titik at digit
[:digit:] - lahat ng digit
[:xdigit:] - lahat ng hexadecimal digit
[:space:] - lahat ng pahalang at patayong whitespace
[:blangko:] - lahat ng pahalang na whitespace
[:cntrl:] - lahat ng control character
[:print:] - lahat ng napi-print na character kasama ang espasyo
[:nprint:] - lahat ng hindi napi-print na character
[:punct:] - lahat ng punctation character
[:graph:] - lahat ng napi-print na character hindi kasama ang espasyo

-tr_str_str $str1 $str2
Pisi $str1 mula sa lokal na pangalan ng dokumento ay papalitan ng $str2.

-tr_chr_chr $chrset1 $chrset2
Mga character mula sa $chrset1 mula sa lokal na pangalan ng dokumento ay papalitan ng
kaukulang karakter mula sa $chrset2. $charset1 at $charset2 dapat pareho
syntax bilang $str in -tr_del_chr pagpipilian.

-store_name $str
Kapag gusto mong baguhin ang lokal na filename ng unang file na na-download gamit ang singlepage
mode, dapat mong gamitin ang pagpipiliang ito.

-index_name $str
Sa pagpipiliang ito maaari mong baguhin ang pangalan ng index ng direktoryo. Bilang default ay ginagamit _._.html .

-store_index/-nostore_index
Sa opsyon -nostore_index dapat mong tanggihan ang pag-iimbak ng mga index ng direktoryo sa HTML
file.

-fnrules $t $m $r
Ito ay isang napakalakas na pagpipilian! Ang pagpipiliang ito ay ginagamit upang flexible baguhin ang layout ng
lokal na puno ng dokumento. Tumatanggap ito ng tatlong mga parameter. Unang parameter $t ay ginagamit upang sabihin
anong uri ang sumusunod na pattern. F ay ginagamit para sa pattern ng wildcard (mga gamit fnmatch())
at R ay ginagamit para sa regular na pattern ng expression (gamit ang anumang suportadong RE
pagpapatupad). Ang pangalawang parameter ay pagtutugma ng pattern na ginamit upang pumili ng mga URL para dito
tuntunin. Kung tumugma ang URL sa pattern na ito, kinukuwenta ang lokal na pangalan para sa URL na ito
sumusunod sa mga patakaran ng ikatlong parameter. At ang ikatlong parameter ay ang pagbuo ng lokal na pangalan
tuntunin. Sinusuportahan na ngayon ng Pavuk ang dalawang uri ng mga panuntunan sa pagbuo ng lokal na pangalan. Ang isa ay simple
nakabatay lamang sa simple macros at iba pang mas kumplikado pinahaba tuntunin, na din
nagbibigay-daan upang maisagawa ang ilang mga function. Pagkilala sa pagitan ng dalawang uri ng mga patakaran
ay ginagawa sa pamamagitan ng pagtingin sa unang katangian ng panuntunan. Sa kaso kapag ang unang karakter ay
'(', pinalawig ang panuntunan at sa lahat ng iba pang kaso ito ang simpleng uri ng panuntunan.

Simple mamuno dapat maglaman ng mga literal o escaped na macro. Ang mga macro ay na-escape ng %
karakter o sa pamamagitan ng $ character.

dito is listahan of tinanggap mga macro:

$x - kung saan ang x ay anumang positibong numero. Ang macro na ito ay pinalitan ng x-th substring
tumugma sa pattern ng RE. (Kung gagamitin mo ito kailangan mong maunawaan ang RE!)
%i - ay pinalitan ng protocol id (http, https, ftp, gopher)
%p - ay pinalitan ng password. (gamitin lamang ito kapag magagamit)
%u - ay pinalitan ng username.
%h - ay pinalitan ng pangalan ng host.
%m - ay pinalitan ng domain name.
%r - ay pinalitan ng port number.
%d - ay pinalitan ng landas patungo sa dokumento.
%n - ay pinalitan ng pangalan ng dokumento.
%b - ay pinalitan ng basename ng dokumento (nang walang extension).
%e - ay pinalitan ng extension.
%s - ay pinalitan ng searchstring.
%M - ay pinalitan ng uri ng MIME ng dokumento. Kapag ginagamit mo ang macro na ito, ikaw
*dapat* gamitin din -post_update opsyon kung hindi ito gagana.
%E - ay pinalitan ng default na extension na itinalaga sa uri ng MIME ng dokumento. kapag ikaw
ay gumagamit ng macro na ito, *dapat* gamitin mo rin -post_update opsyon kung hindi ito gagana.
%x - kung saan ang x ay positibong numero. Ang macro na ito ay pinalitan ng x-th na direktoryo mula sa
landas patungo sa dokumento mula sa simula.
%-x - kung saan ang x ay positibong numero. Ang macro na ito ay pinalitan ng x-th na direktoryo mula sa
landas patungo sa dokumento mula sa dulo.

Narito ang halimbawa. Kung gusto mong ilagay ang dokumento sa iisang direktoryo ayon sa extension,
dapat mong gamitin ang sumusunod na opsyon sa fnrules:
-fnrules F '*' '/%e/%n'

Pinahaba mamuno kailanman ay nagsisimula sa karakter '('. Gumagamit ito ng ilang uri ng LISP gaya ng
Syntax.

dito ay base patakaran para pagsulat pinahaba patakaran : - ang lokal na filename nito
uri ay pagbabalik halaga function
- Ang bawat function ay nakapaloob sa loob ng round braces ()
- Ang unang token pagkatapos ng pagbubukas ng brace ay pangalan ng function
- Ang bawat function ay may nonzero fixed na bilang ng mga parameter
- Ang bawat function ay nagbabalik ng numeric o string na halaga
- Ang mga parameter ng function ay pinaghihiwalay ng anumang bilang ng mga character sa espasyo
- Ang parameter ng function ay dapat na string, numero, macro o iba pang function
- ang string ay palaging sinipi na may "
- Ang bawat numerong parameter ay maaaring nasa anumang pag-encode na sinusuportahan ng strtod() tungkulin
(octal, decimal, hexadecimal, ...)
- walang implicit na conversion mula sa numero patungo sa string
- ang bawat macro ay prefix ng % karakter at isang karakter ang haba
- Ang bawat macro ay pinapalitan ng string na representasyon nito mula sa kasalukuyang URL
- Ang mga parameter ng function ay mahigpit na nai-type
- Ang pag-andar ng toplevel ay dapat magbalik ng halaga ng string

Sinusuportahan ng pinalawig na panuntunan ang buong hanay ng % nakatakas na mga macro na sinusuportahan ng mga simpleng panuntunan,
kasama ang dalawang sumusunod na macro sa karagdagan:
%U - URL string
%o - default na localname para sa URL

dito is paglalarawan of lahat suportado function

sc - concat dalawang string na mga parameter
- tumatanggap ng dalawang parameter ng string
- nagbabalik ng halaga ng string
ss - substring form na string
- tumatanggap ng tatlong mga parameter.
- una ay string kung saan gusto naming i-cut subpart
- pangalawa ay numero na kumakatawan sa panimulang posisyon sa string
- pangatlo ay numero na kumakatawan sa pagtatapos ng posisyon sa string
- nagbabalik ng halaga ng string
hsh - compute modulo hash value mula sa string na may tinukoy na base
- tumatanggap ng dalawang parameter
- una ay string kung saan kami ay computing ang hash halaga
- pangalawa ay numeric value para sa base ng modulo hash
- nagbabalik ng numeric na halaga
md5 - compute MD5 checksum para sa string
- tumatanggap ng isang halaga ng string
- nagbabalik ng string na kumakatawan sa MD5 checksum
lo - I-convert ang lahat ng character sa loob ng string sa lower case
- tumatanggap ng isang halaga ng string
- nagbabalik ng halaga ng string
up - I-convert ang lahat ng mga character sa loob ng string sa upper case
- tumatanggap ng isang halaga ng string
- nagbabalik ng halaga ng string
ue - I-encode ang mga hindi ligtas na character sa string na may parehong pag-encode na ginagamit para sa
pag-encode ng mga hindi ligtas na character sa loob ng URL (%xx) Bilang default ay naka-encode ang lahat ng nonascii
mga halaga kapag ginamit ang function na ito.
- tumatanggap ng dalawang halaga ng string
- una ay string na gusto naming i-encode
- pangalawa ay ang string na naglalaman ng mga hindi ligtas na character
- ibalik ang halaga ng string
dc - tanggalin ang mga hindi gustong character mula sa string (may katulad na functionality bilang
-tr_del_chr option)
- tumatanggap ng dalawang halaga ng string
- una ay string kung saan gusto naming tanggalin
- pangalawa ay string na naglalaman ng mga character na gusto naming tanggalin.
- nagbabalik ng halaga ng string
tc - palitan ang character ng ibang character sa string (may katulad na functionality
as -tr_chr_chr option)
- tumatanggap ng tatlong halaga ng string
- una ay string sa loob kung saan gusto naming palitan ang mga character
- pangalawa ay set ng mga character na gusto naming palitan
- ang pangatlo ay set ng mga character na pinapalitan namin
- nagbabalik ng halaga ng string
ts - palitan ang ilang string sa loob ng string ng anumang iba pang string (may katulad
functionality bilang -tr_str_str option)
- tumatanggap ng tatlong halaga ng string
- una ay string sa loob kung saan gusto naming palitan ang string
- pangalawa ay ang mula sa string
- pangatlo ay ang string
- nagbabalik ng halaga ng string
spn - kalkulahin ang paunang haba ng string na naglalaman lamang ng tinukoy na hanay ng
mga karakter. (may parehong pag-andar tulad ng strspn() function ng libc)
- tumatanggap ng dalawang halaga ng string
- una ay input string
- pangalawa ay set ng mga katanggap-tanggap na character
- nagbabalik ng numeric na halaga
cspn - kalkulahin ang paunang haba ng string na hindi naglalaman ng tinukoy na hanay ng
mga karakter. (may parehong pag-andar tulad ng strcspn() function ng libc)
- tumatanggap ng dalawang halaga ng string
- una ay input string
- pangalawa ay set ng mga hindi katanggap-tanggap na character
- nagbabalik ng numeric na halaga
sl - kalkulahin ang haba ng string
- tumatanggap ng isang halaga ng string
- nagbabalik ng numeric na halaga
ns - I-convert ang numero sa string ayon sa format
- tumatanggap ng dalawang parameter
- Ang unang parameter ay ang format ng string na katulad ng para sa printf() tungkulin
- pangalawa ay numero na gusto naming i-convert
- nagbabalik ng halaga ng string
lc - Ibalik ang posisyon ng huling paglitaw ng tinukoy na character sa loob ng string
- tumatanggap ng dalawang parameter ng string
- unang string na aming hinahanap
- Ang pangalawang string ay naglalaman ng character na hinahanap namin
- nagbabalik ng numeric na halaga
+ - magdagdag ng dalawang numerong halaga
- tumatanggap ng dalawang numerong halaga
- nagbabalik ng numeric na halaga
- - ibawas ang dalawang numerong halaga
- tumatanggap ng dalawang numerong halaga
- nagbabalik ng numeric na halaga
% - modulo karagdagan
- tumatanggap ng dalawang numerong halaga
- nagbabalik ng numeric na halaga
* - maramihang dalawang numerong halaga
- tumatanggap ng dalawang numerong halaga
- nagbabalik ng numeric na halaga
/ - hatiin ang dalawang numeric na halaga
- tumatanggap ng dalawang numerong halaga
- nagbabalik ng numeric na halaga
rmpar - alisin ang parameter mula sa query string
- tumatanggap ng dalawang string
- ang unang string ay string na aming inaayos
- Ang pangalawang parameter ay pangalan ng parameter na dapat alisin
- nagbabalik ng naayos na string
getval - kumuha ng query string parameter value
- tumatanggap ng dalawang string
- ang unang string ay query string kung saan makukuha ang parameter
halaga (karaniwang %s)
- Ang pangalawang string ay pangalan ng parameter na gusto nating makuha
ang halaga
- nagbabalik ng halaga ng parameter o walang laman na string kapag ang parameter
ay hindi umiiral
nakakagamot - lohikal na desisyon
- tumatanggap ng tatlong mga parameter
- una ay numeric at kung kailan ay zero kaysa sa resulta ng desisyong ito
ay resulta ng pangalawang parameter, kung hindi ang resulta ay resulta ng pangatlo
parametro
- pangalawang parameter ay string
- pangatlong parameter ay string
- nagbabalik ng string na resulta ng desisyon
! - hindi lohikal
- tumatanggap ng isang numerong parameter
- nagbabalik ng negasyon ng parameter
& - lohikal at
- tanggapin ang dalawang numeric na parameter
- nagbabalik ng lohikal at ng mga parameter
| - lohikal o
- tanggapin ang dalawang numeric na parameter
- nagbabalik ng lohikal o ng mga parameter
gettext - kumuha ng extension ng file
- tanggapin ang isang tibo (filename o path)
- return string na naglalaman ng extension ng parameter
seq - ihambing ang dalawang string
- tumatanggap ng dalawang string para sa paghahambing
- nagbabalik ng numeric na halaga 0 - kung iba 1 - kung katumbas
jsf - isagawa ang function ng JavaScript
- tumatanggap ng isang string parameter na may pangalan ng
JavaScript function na tinukoy sa script na na-load ng
-js_script_file pagpipilian.
- nagbabalik ng string value na katumbas ng return value ng
Pag-andar ng JavaScript
- Ang function na ito ay magagamit lamang kapag ang pavuk ay pinagsama-sama
na may suporta para sa JavaScript bindings

Halimbawa, kung nag-mirror ka ng napakalaking bilang ng mga site sa internet sa pareho
lokal na direktoryo, masyadong maraming mga entry sa isang direktoryo, ay dapat magdulot ng pagganap
mga problema. Maaari mong gamitin halimbawa hsh or md5 mga function upang makabuo ng isang karagdagang
antas ng mga direktoryo ng hash batay sa hostname kahit isa sa mga sumusunod na opsyon :

-fnrules F '*' '(sc (nc "%02d/" (hsh %h 100)) %o)'
-fnrules F '*' '(sc (ss (md5 %h) 0 2) %o)'

-base_level $nr
Bilang ng mga antas ng direktoryo na aalisin sa lokal na puno.

Halimbawa kapag nagda-download ng URL ftp://ftp.idata.sk/pub/unix/www/pavuk-0.7pl1.tgz
pumasok ka sa command line -base_level 4 sa lokal na puno ay malilikha
www/pavuk-0.7pl1.tgz hindi ftp/ftp.idata.sk_21/pub/unix/www/pavuk-0.7pl1.tgz bilang
normal

-default_prefix $str
Default na prefix ng naka-mirror na direktoryo. Ginagamit lang ang opsyong ito kapag sinusubukan mo
upang i-synchronize ang nilalaman ng malayuang direktoryo na na-download gamit ang -base_level
opsyon. Dapat mo ring gamitin ang paraan ng pag-synchronize na nakabatay sa direktoryo, hindi batay sa URL
paraan ng pag-synchronize. Ito ay lalong kapaki-pakinabang, kapag ginamit kasabay ng
-tanggalin_luma pagpipilian.

-remove_adv/-noremove_adv
Ginagamit ang opsyong ito para i-on/i-off ang pag-alis ng mga HTML tag na naglalaman
mga banner ng ad. Ang mga banner ay hindi tinanggal mula sa HTML file, ngunit ito ay
nagkomento. Hindi rin mada-download ang mga naturang URL. Ang pagpipiliang ito ay may epekto
lamang kapag ginamit na may opsyon -adv_re. Naka-off ang default. Ang pagpipiliang ito ay
magagamit lamang kapag ang iyong system ay may suporta para sa isa sa mga regular na sinusuportahan
pagpapatupad ng mga expression.

-adv_re $RE
Ginagamit ang opsyong ito upang tukuyin ang mga regular na expression para sa pagtutugma ng mga URL ng
mga banner ng ad. Halimbawa: -adv_re http://ad.doubleclick.net/.* Ginagamit
upang tumugma sa lahat ng mga file mula sa server ad.doubleclick.net. Available lang ang opsyong ito
kapag ang iyong system ay may anumang suportadong pagpapatupad ng mga regular na expression.

-unique_name/-nounique_name
Ang Pavuk bilang default ay palaging sinusubukang magtalaga ng natatanging lokal na filename sa natatanging URL. Kung
ang pag-uugali na ito ay hindi gusto, maaari mong gamitin ang opsyon -nounique_name upang huwag paganahin ito.

iba Options


-matulog $nr
Binibigyang-daan ka ng opsyong ito na tukuyin ang bilang ng mga segundo habang ang programa ay magiging
sinuspinde sa pagitan ng dalawang paglilipat. Kapaki-pakinabang upang tanggihan ang labis na karga ng server. Default na halaga para sa
ang pagpipiliang ito ay 0.

-rsleep/-norsleep
Kapag aktibo ang opsyong ito, i-randomize ng pavuk ang oras ng pagtulog sa pagitan ng mga paglilipat
sa pagitan sa pagitan ng zero at halaga na tinukoy sa -matulog opsyon. Default ay ito
hindi aktibo ang opsyon.

-mga araw $nr
Kung ang dokumento ay may oras ng pagbabago mamaya bilang $nr araw, pagkatapos ay sa sync mode pavuk
sumusubok na kunin ang mas bagong kopya ng dokumento mula sa malayong server. Ang default na halaga ay 0.

-remove_old/-noremove_old
Alisin ang mga hindi wastong dokumento (na, na wala sa malayong site). Ang pagpipiliang ito
may epekto lamang kapag ginamit sa nakabatay sa direktoryo i-sync mode. Kapag ginamit sa batay sa URL
sync mode, hindi aalisin ng pavuk ang anumang mga lumang file na hindi kasama sa dokumento
tree at hindi isinangguni sa anumang HTML na dokumento. Dapat mo ring gamitin ang opsyon
-subdir, upang hayaan ang pavuk na makahanap ng mga file na kabilang sa kasalukuyang salamin. Bilang default na pavuk
ay hindi mag-aalis ng anumang mga lumang file.

-browser $str
ay ginagamit upang itakda ang iyong browser command (sa URL tree dialog na maaari mong gamitin ang right click to
raise menu, kung saan maaari mong simulan ang browser sa aktwal na napiling URL). Ito
ang opsyon ay magagamit lamang kapag pinagsama-sama sa GTK GUI at may suporta para sa URL tree
preview.

-debug/-nodebug
Ino-on ang pagpapakita ng mga mensahe sa pag-debug. Ang pagpipiliang ito ay magagamit lamang kapag pinagsama-sama
kasama ang -DDEBUG. Kung ang pagpipiliang -debug ay ginamit ang pavuk ay maglalabas ng verbose na impormasyon tungkol sa
mga dokumento, buong impormasyon sa antas ng protocol, mga impormasyon sa pag-lock at higit pa (depende
on -debug_level setup). Ginagamit ang mga opsyong ito tulad ng trigger upang paganahin ang output ng
debug na mga mensahe na pinili ni -debug_level opsyon. Default ay naka-off ang debug mode.

-debug_level $level
Itakda ang antas ng kinakailangang impormasyon sa pag-debug. $level maaaring numerong halaga na
kumakatawan sa binary mask para sa hiniling na mga antas ng pag-debug, o pinaghihiwalay ng kuwit na listahan ng
suportadong mga antas ng pag-debug. Kasalukuyang sinusuportahan ng pavuk ang mga sumusunod na antas ng pag-debug :
html - para sa HTML parser debugging
mga protos - upang makita ang mga mensahe ng protocol sa gilid ng server
protoc - upang makita ang mga mensahe ng protocol sa panig ng kliyente
mga procs - upang makita ang ilang mga espesyal na tawag sa pamamaraan
kandado - para sa pag-debug ng pag-lock ng mga dokumento
neto - para sa pag-debug ng ilang bagay na mababa ang antas ng network
Misc - para sa iba't ibang unsorted debug na mensahe
gumagamit - para sa verbose user level na mga mensahe
lahat - humiling ng lahat ng kasalukuyang sinusuportahang antas ng pag-debug
mtlock - pag-lock ng mga mapagkukunan sa multithreading na kapaligiran
mtthr - paglulunsad/paghihina/pagtulog/paghinto ng mga thread sa multithreaded na kapaligiran
protod - para sa PAG-DEBUGG ng mga kahilingan sa POST
mga limitasyon - para sa pag-debug ng mga opsyon sa paglilimita, makikita mo ang dahilan kung bakit partikular
Ang mga URL ay tinanggihan ng pavuk at kung aling opsyon ang nagdulot nito.
ssl - upang paganahin ang verbose na pag-uulat tungkol sa mga bagay na nauugnay sa SSL.

-paalalahanan_cmd $str
Ang pagpipiliang ito ay may epekto lamang kapag nagpapatakbo ng pavuk in paalala mode. Upang mag-utos
tinukoy sa pagpipiliang ito ang pavuk ay nagpapadala ng resulta ng pagpapatakbo ng mode ng paalala. meron
mga nakalistang URL na binago at mga URL na mayroong anumang mga error. Default na paalala
Ang command ay "mailx user@server -s \"pavuk reminder result\"" .

-nscache_dir $dir
Path sa Netscape browser cache directory. Kung tinukoy mo ang landas na ito, subukan ang pavuk
upang malaman kung mayroon kang URL sa cache na ito. Kung naroon ang URL, kukunin pa ito
Ida-download ito ng pavuk mula sa net. Dapat pangalanan ang cache directory index file
index.db at dapat na matatagpuan sa direktoryo ng cache. Upang suportahan ang tampok na ito,
Ang pavuk ay kailangang maiugnay sa BerkeleyDB 1.8x .

-mozcache_dir $dir
Path sa direktoryo ng cache ng browser ng Mozilla. Parehong pag-andar tulad ng dati
opsyon, para lamang sa iba't ibang browser na may iba't ibang mga format ng cache. Sumusuporta si Pavuk
parehong mga format ng Mozilla browser disk cache (luma para sa mga bersyon <0.9 at bagong ginamit sa
0.9=<). Ang lumang format na direktoryo ng cache ay dapat maglaman ng cache directory index database
may pangalan cache.db. Pagkatapos ang bagong format na direktoryo ng cache ay dapat maglaman ng file ng mapa
_CACHE_MAP_, at tatlong block file _CACHE_001_, _CACHE_002_, _CACHE_003_. Upang
suportahan ang lumang format ng cache ng Mozilla, kailangang iugnay ang pavuk sa BerkeleyDB 1.8x. Bago
Ang format ng Mozilla cache ay hindi nangangailangan ng anumang panlabas na library.

-post_cmd $str
Post-processing command, na isasagawa pagkatapos ng matagumpay na pag-download ng
dokumento. Ang utos na ito ay maaaring kahit papaano ay humawak sa dokumento. Sa oras ng pagtakbo
ang utos na ito, iniiwan ng pavuk na naka-lock ang aktwal na dokumento, kaya walang pagkakataon na ang ilan
iba pang proseso ng pavuk ay magbabago ng dokumento. Makukuha ang postprocessing command na ito
tatlong karagdagang mga parameter mula sa pavuk.
- lokal na pangalan ng dokumento
- 1/0 1 kung ang dokumento ay HTML na dokumento, 0 kung hindi
- orihinal na URL ng dokumentong ito

-hack_add_index/-nohack_add_index
Ito ay medyo hacky na opsyon. Pinipilit nitong idagdag ang pavuk sa URL queue din sa direktoryo
mga index ng lahat ng nakapila na dokumento. Nagbibigay-daan ito sa pavuk na mag-download ng higit pang mga dokumento mula sa
site, kaysa ito ay makakamit sa normal na pagtawid ng mga HTML na dokumento. Medyo madumi
ngunit kapaki-pakinabang sa ilang mga kaso.

-js_script_file $file
Ang Pavuk ay may opsyonal na builtin na JavaScript interpreter upang payagan ang mataas na antas
pagpapasadya ng ilang mga panloob na pamamaraan. Sa kasalukuyan ay pinapayagan kang mag-customize
gamit ang iyong sariling JavaScript function na dalawang bagay. Magagamit mo ito para magtakda ng tumpak
nililimitahan ang mga opsyon, o maaari kang magsulat ng sariling mga function na maaaring magamit sa loob ng mga panuntunan ng
-fnrules opsyon. Sa pagpipiliang ito maaari mong i-load ang script ng JavaScript na may mga function
sa pavuks panloob na JavaScript interpreter. Upang matuto nang higit pa tungkol sa mga kakayahan na ito
basahin ang hiwalay na dokumento jsbind.txt na kasama ng pavuk source sa toplevel
direktoryo. Available lang ang opsyong ito kapag naipon mo ang pavuk na may suporta
para sa mga binding ng JavaScript.

EXIT STATUS


Sa bersyon 0.9pl29, binago ng pavuk ang indikasyon ng status sa pamamagitan ng mga exit code. Sa kanina
versions exit status 0 ay para sa walang error at nonzero exit status ay parang count
ng mga nabigong dokumento. Sa lahat ng bersyon pagkatapos ng 0.0pl29 mayroong mga tinukoy na sumusunod na mga exit code:

0 - walang error, OK ang lahat
1 - error sa pagsasaayos ng mga pagpipilian sa pavuk o
error sa config files
2 - may naganap na error habang nagda-download ng mga dokumento

Ukol sa kapaligiran MGA VARIABLE


USER variable ay ginagamit upang bumuo ng email address mula sa user at hostname

LC_* or WIKA
ginamit upang itakda ang internasyonal na kapaligiran

PAVUKRC_FILE
sa variable na ito maaari mong tukuyin ang alternatibong lokasyon para sa iyong pavukrc
configuration file.

KAILANGAN Panlabas MGA PROGRAMA


at ay ginagamit para sa pag-iskedyul.

baril ay ginagamit upang i-decode ang gzip o i-compress ang mga naka-encode na dokumento.

Bug


Kung may mahanap ka, mangyaring ipaalam sa akin.

Gamitin ang pavuk online gamit ang mga serbisyo ng onworks.net



Pinakabagong Linux at Windows online na mga programa