Wget

Allikas: Pingviini viki


Wget
Wget-screenshot.png
GNU/Wget ekraanitõmmis
Tüüp:
Arendaja: Mauro Tortonesi
Litsents: GNU General Public License
Viimane versioon: 1.10.2
October 13, 2005
Staatus:
Eesti keel: {{{eesti_keel}}}
Koduleht: GNU Wget
Foorum:

GNU/Wget

Üldine

GNU/Wget on käsureaprogramm, millega saab veebi- ja ftp-serveritest hankida faile. Nimi on tuletatud lühendist WWW (World Wide Web) ja selle põhifunktsioonist GET (ingl.k hankima). wget võimaldab faile tõmmata üle HTTP, HTTPS ja FTP protokolli, mis on TCP/IP protokollidest kõige laiemalt levinud. Programm sai alguse aastal 1996, kui toimus veebi populaarsuse hüppeline kasv ja sellega seoses hakati wget-i *NIX-i kasutajate seas laialt pruukima. Nüüd on wget porditud paljudele keskkondale, sealhulgas Mac OS X-i, MS Windowsi ja OpenVMS-i jaoks.

Võimalused

GNU/Wget võimaldab :

  • laadida faile tagaplaanil, isegi kui kasutaja pole sisseloginud.
  • sul käivitada, jätkata ja lõpetada failide tarimist ilma otsese sekkumiseta ja automaatselt.
  • kopeerida rekursiivselt eemalasuva veebilehe sinu kõvakettale . Soovi korral muudab GNU/Wget HTML dokumendis olevad lingid nii et need osutaksid kohalikkele failidele- võimaldades faile vaadata ilma võrguühenduseta.
  • failide tirimisel kasutada metamärke.
  • sünkroseerida faile ftp ja http serveritega ja luua peegeldusi.
  • tõmmata faile üle aeglase või ebakindla võrguühenduse.
  • tarida faile ka läbi proxy serverite, mis aitab vähendada võrgukoormust, kiirendada kohalejõudmist ja tagab ühenduse ka tulemüüri tagand.
  • seadistada, millised HTML ja XHTML linke GNU/Wget äratunneks ja jälitaks.


Kasutamine

Lihtne süntaks:

'wget [võtmed]... [URL]...'

Võtmeid ja aadresse saab määratleda kas läbi faili .wgetrc või käsurea parameetrina.

Peamised võtmed:

  • -o logifail

--output-file=logifail

Logib kõik sõnumid etteantud logifaili. Vaikimisi logitakse neid standardvigade logifaili.

  • -q

--quiet

Keelab ekraanile tulemuse väljastamise.

  • -i fail

--input-file=file

Loeb URL aadressid failist.

  • -F

--force-html

Kui sisend loetakse failist, siis kohtleb sisendaadresside faili kui HTML faili.

  • -t arv

--tries=arv

Määrab ära mitu korda proovitakse allalaadimist jätkata. Vaikimisi on 20 korda (va juhud kui ühendusest keeldutakse ja faili ei eksisteeri), kui korduste arvuks on määratud 0, siis jätkatakse lõpmatult.

  • -nc

--no-clobber

Keelab juba olemasoleva faili allatirimise.

  • -c

--continue

Jätkab pooleliolevat allalaadimist.

  • -N

--timestamping

Jälgib faili loomis- ja muutmisaegu.

  • -S

--server-response

Kuvab serveripoolse vastuse.

  • --spider

Käitub kui veebiämblik: lehti ei tõmmata alla, vaid kontrollitakse olemasolu.

  • -T sekundid

--timeout=sekundid

Määrab ära võrguühenduseta aja, mille ületamisel tegevus katkestatakse.

  • --limit-rate=kiirus[k/m]

Fikseerib allalaadimise maksimaalse kiiruse. Vaikimisi ühikuks on baiti sekundis, kuid kui lisada kiiruse taha k või m, siis on ühikuks vastavalt kilobaiti või megabaiti sekundis. Näiteks --limit-rate=20k piirab allalaadimise kiiruse 20 kilobaidile sekundis.

  • -w aeg[m/h/d]

--wait=aeg

Määrab kui pikk on tirimiste vahel paus. Kui lõppu lisada täiend m, siis on etteantud aeg minutides ja h vastavalt tunnid ja d päevad.

  • -Q suurus[k/m]

--quota=suurus[k/m]

Määrab ära allatiritava faili maksimaalse suuruse.

  • --retry-conrefused

Käsitleb ühendusest keeldumist kui tavalist viga ning proovib uuesti.

  • --user=kasutajanimi

Täpsustab kasutajanime.

  • --password=salasõna

Täpsustab kasutaja salasõna.

  • -x

--force-directories

Loo jõuga kataloogide hierarhia.

  • -r

--recursive

Tirib rekursiivselt.

  • -l sügavus

--level=sügavus

Määrab ära rekursiivsel tirimisel kataloogi sügavuse. Vaikimisi on selleks 5.

  • -k

--convert-links

Peale allalaadimist muudab dokumendis olevad lingid lokaalseks.

  • -m

--mirror

Käivitab sisupeegeldamise. -r -N -l <arv> --no-remove-listings on võrdväärne sellega.

  • -p

--page-requisites

Tõmbab alla kõik failid, et antud HTML dokumenti saaks korralikult kuvada (nt stiililehed ja pildid).

  • -np

--no-parent Määrab ära, et GNU/Wget rekursiivsel tirimisel ei liiguta antud kataloogist ülespoole.

Näited

Tirib antud pildi tagaplaanil alla.Kui ebaõnnestub, siis proovib 45korda uuesti.

Võimaldab allatirida kõik kataloogis dir olevad gif failid. `wget http://host/dir/*.gif ` ei pruugi töötada.

Moodustab antud kataloogilistingu ja konveteerib selle HTML faili.

Kui tirimine jäi mingil põhjusel pooleli, siis ära juba allalaetud faile uuesti tiri.

Lihtne moodus peegeldada eemalolevat veebilehte.

Väike peegeldamise näide, soovitav on kasutada cron faili, et peegeldus oleks aktuaalne.

  • wget -t 7 -w 5 --waitretry=14 --random-wait --user-agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.0.1) Gecko/20060111 Firefox/1.5.0.1" -m -k -K -e robots=off http://www.oreilly.com/catalog/upt3/errata/ -o ./myLog.log

Antud näide laeb alla ühe O'Reilly kirjastuse raamatu veafailid. ning järgib kõiki linke rekursiivselt ning võimaldab neid vaadata kohelikul kettal ning allalaadimisel kasutab pause ning sätib kasutajakliendiks Firefox2.0 ning ignoreerib roboti juhendfaili.

Vaata ka

cUrl

Välised viited