Wget
GNU/Wget ekraanitõmmis | |
Tüüp: | |
Arendaja: | Mauro Tortonesi |
Litsents: | GNU General Public License |
Viimane versioon: | 1.10.2 October 13, 2005 |
Staatus: | |
Eesti keel: | {{{eesti_keel}}} |
Koduleht: | GNU Wget |
Foorum: |
Sisukord
GNU/Wget
Üldine
GNU/Wget on käsureaprogramm, millega saab veebi- ja ftp-serveritest hankida faile. Nimi on tuletatud lühendist WWW (World Wide Web) ja selle põhifunktsioonist GET (ingl.k hankima). wget võimaldab faile tõmmata üle HTTP, HTTPS ja FTP protokolli, mis on TCP/IP protokollidest kõige laiemalt levinud. Programm sai alguse aastal 1996, kui toimus veebi populaarsuse hüppeline kasv ja sellega seoses hakati wget-i *NIX-i kasutajate seas laialt pruukima. Nüüd on wget porditud paljudele keskkondale, sealhulgas Mac OS X-i, MS Windowsi ja OpenVMS-i jaoks.
Võimalused
GNU/Wget võimaldab :
- laadida faile tagaplaanil, isegi kui kasutaja pole sisseloginud.
- sul käivitada, jätkata ja lõpetada failide tarimist ilma otsese sekkumiseta ja automaatselt.
- kopeerida rekursiivselt eemalasuva veebilehe sinu kõvakettale . Soovi korral muudab GNU/Wget HTML dokumendis olevad lingid nii et need osutaksid kohalikkele failidele- võimaldades faile vaadata ilma võrguühenduseta.
- failide tirimisel kasutada metamärke.
- sünkroseerida faile ftp ja http serveritega ja luua peegeldusi.
- tõmmata faile üle aeglase või ebakindla võrguühenduse.
- tarida faile ka läbi proxy serverite, mis aitab vähendada võrgukoormust, kiirendada kohalejõudmist ja tagab ühenduse ka tulemüüri tagand.
- seadistada, millised HTML ja XHTML linke GNU/Wget äratunneks ja jälitaks.
Kasutamine
Lihtne süntaks:
'wget [võtmed]... [URL]...'
Võtmeid ja aadresse saab määratleda kas läbi faili .wgetrc või käsurea parameetrina.
Peamised võtmed:
- -o logifail
--output-file=logifail
Logib kõik sõnumid etteantud logifaili. Vaikimisi logitakse neid standardvigade logifaili.
- -q
--quiet
Keelab ekraanile tulemuse väljastamise.
- -i fail
--input-file=file
Loeb URL aadressid failist.
- -F
--force-html
Kui sisend loetakse failist, siis kohtleb sisendaadresside faili kui HTML faili.
- -t arv
--tries=arv
Määrab ära mitu korda proovitakse allalaadimist jätkata. Vaikimisi on 20 korda (va juhud kui ühendusest keeldutakse ja faili ei eksisteeri), kui korduste arvuks on määratud 0, siis jätkatakse lõpmatult.
- -nc
--no-clobber
Keelab juba olemasoleva faili allatirimise.
- -c
--continue
Jätkab pooleliolevat allalaadimist.
- -N
--timestamping
Jälgib faili loomis- ja muutmisaegu.
- -S
--server-response
Kuvab serveripoolse vastuse.
- --spider
Käitub kui veebiämblik: lehti ei tõmmata alla, vaid kontrollitakse olemasolu.
- -T sekundid
--timeout=sekundid
Määrab ära võrguühenduseta aja, mille ületamisel tegevus katkestatakse.
- --limit-rate=kiirus[k/m]
Fikseerib allalaadimise maksimaalse kiiruse. Vaikimisi ühikuks on baiti sekundis, kuid kui lisada kiiruse taha k või m, siis on ühikuks vastavalt kilobaiti või megabaiti sekundis. Näiteks --limit-rate=20k piirab allalaadimise kiiruse 20 kilobaidile sekundis.
- -w aeg[m/h/d]
--wait=aeg
Määrab kui pikk on tirimiste vahel paus. Kui lõppu lisada täiend m, siis on etteantud aeg minutides ja h vastavalt tunnid ja d päevad.
- -Q suurus[k/m]
--quota=suurus[k/m]
Määrab ära allatiritava faili maksimaalse suuruse.
- --retry-conrefused
Käsitleb ühendusest keeldumist kui tavalist viga ning proovib uuesti.
- --user=kasutajanimi
Täpsustab kasutajanime.
- --password=salasõna
Täpsustab kasutaja salasõna.
- -x
--force-directories
Loo jõuga kataloogide hierarhia.
- -r
--recursive
Tirib rekursiivselt.
- -l sügavus
--level=sügavus
Määrab ära rekursiivsel tirimisel kataloogi sügavuse. Vaikimisi on selleks 5.
- -k
--convert-links
Peale allalaadimist muudab dokumendis olevad lingid lokaalseks.
- -m
--mirror
Käivitab sisupeegeldamise. -r -N -l <arv> --no-remove-listings on võrdväärne sellega.
- -p
--page-requisites
Tõmbab alla kõik failid, et antud HTML dokumenti saaks korralikult kuvada (nt stiililehed ja pildid).
- -np
--no-parent Määrab ära, et GNU/Wget rekursiivsel tirimisel ei liiguta antud kataloogist ülespoole.
Näited
- wget --tries=45 http://fly.srk.fer.hr/jpg/flyweb.jpg &
Tirib antud pildi tagaplaanil alla.Kui ebaõnnestub, siis proovib 45korda uuesti.
- wget -r -l1 --no-parent -A.gif http://host/dir/
Võimaldab allatirida kõik kataloogis dir olevad gif failid. `wget http://host/dir/*.gif ` ei pruugi töötada.
- wget ftp://ftp.gnu.org/pub/gnu/ links index.html
Moodustab antud kataloogilistingu ja konveteerib selle HTML faili.
- wget -nc -r http://www.gnu.org/
Kui tirimine jäi mingil põhjusel pooleli, siis ära juba allalaetud faile uuesti tiri.
- wget --mirror -A.html http://www.w3.org/
Lihtne moodus peegeldada eemalolevat veebilehte.
- wget --mirror http://www.gnu.org/ -o /home/me/weeklog
Väike peegeldamise näide, soovitav on kasutada cron faili, et peegeldus oleks aktuaalne.
- wget -t 7 -w 5 --waitretry=14 --random-wait --user-agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.0.1) Gecko/20060111 Firefox/1.5.0.1" -m -k -K -e robots=off http://www.oreilly.com/catalog/upt3/errata/ -o ./myLog.log
Antud näide laeb alla ühe O'Reilly kirjastuse raamatu veafailid. ning järgib kõiki linke rekursiivselt ning võimaldab neid vaadata kohelikul kettal ning allalaadimisel kasutab pause ning sätib kasutajakliendiks Firefox2.0 ning ignoreerib roboti juhendfaili.