Wget

A MathWikiből
A lap korábbi változatát látod, amilyen Urbane (vitalap | szerkesztései) 2007. május 11., 14:54-kor történt szerkesztése után volt.
(eltér) ←Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

Tartalomjegyzék


Mi a Wget?

A GNU Wget egy nagyon jól paraméterezhető, hatékony parancssori letöltésvezérlő program, amely a HTTP, HTTPS és FTP protokollokat támogatja. A Wget egy nem interaktív program, ami azt jelenti, hogy a háttérben is futtatható a felhasználó bejelentkezése nélkül, tehát akár ki is jelentkezhetünk a rendszerből, az elindított letöltés ettől nem fog leállni. Egyik leghasznosabb funkciója a rekurzív letöltés, melynek segítségével teljes HTTP vagy FTP struktúrákat másolhatunk.


A Wget használata

Szintaktika

 wget [opciók] [URL]

Az opciókat egy kötőjel után adhatjuk meg (külön-külön vagy ömlesztve), az URL formátuma többféle is lehet:

  • http://szerver(:port)/elérésiút (pl. http://wiki.math.bme.hu, http://www.math.bme.hu/~wettl/okt/info1/2006/wfre.pdf)
  • ftp://szerver(:port)/elérésiút (pl. ftp://ftp.gnu.vbs.at/emacs/emacs-21.3.tar.gz)
  • ftp://felhasználónév:jelszó@szerver/könyvtár/állomány


Fontosabb opciók

A Wget rengeteg hasznos opcióval rendelkezik, segítségükkel akár egészen bonyoltult, összetett letöltési feladatokat is könnyen megoldhatunk. Az opciók megadásánál lényeges a kis- és nagybetű. Néhány a legfontosabbak közül:

  • -b: Ha ezt az opciót bekapcsoljuk, a letöltés a háttérben fog zajlani.
  • -c: Ez az opció a letöltés esetleges megszakadásakor automatikusan újraindítja a töltést onnan, ahol az megszakadt.
  • -p: Letölthetünk vele egy HTML-oldalt, az összes megjelenítéshez és működéshez szükséges egyéb állománnyal együtt.
  • -k: A HTML-dokumentumban található külső hivatkozásokat átalakítja relatív hivatkozásokra, hogy teljes mértékben a saját gépünkön böngészhessük a letöltött oldalakat.
  • -r: Bekapcsolja a rekurzív letöltési módot. Ez HTTP oldalaknál azt jelenti, hogy a megadott URL-t letölti, majd mindazon állományokat, amikre a HTML-dokumentum hivatkozik, szintén letölti, és ezt folytatja megadott mélységig (az alapértelmezett 5). A letöltött fájlok könyvtárstruktúrája meg fog egyezni az eredetivel. FTP esetén a rekurzív letöltés a megadott könyvtár összes alkönyvtárának letöltését jelenti, hasonlóan a HTTP rekurzív letöltéséhez.
  • -l: A rekurzív letöltés mélységét állíthatjuk be vele, pl. -l3 három szintet jelent. Lehetőleg tartózkodjuk a -l0 használatától, mert az végtelen mélységig történő letöltést jelent, és az igencsak leterhelheti a rendszert, amin dolgozunk.
  • -P: Ezzel az opcióval megadhatjuk, hogy hova töltsön a Wget. Alapértelmezetten ez a ".", tehát a könyvtár, amiben éppen dolgozunk. Ha azt akarjuk, hogy pl. a download nevű könyvtárba kerüljenek a letöltött állományok, akkor a -P download opciót kell megadni. Használhatjuk a szokásos relatív és abszolút unixos könyvtármegadásokat.
  • -h: Felsorolja az összes opciót és ismerteti használatukat.


Néhány példa

Egyszerű letöltés (az adott állományt letölti az aktuális könyvtárba):

 wget http://ftp.gnu.org/pub/gnu/emacs/emacs-21.4a.tar.gz

Tegyük fel, hogy valami miatt megszakadt a letöltésünk, és az emacs-21.4a.tar.gz állomány hiányosan található meg a gépünkön. Ekkor folytathatjuk a letöltést, ha bekapcsoljuk a -c opciót:

 wget -c http://ftp.gnu.org/pub/gnu/emacs/emacs-21.4a.tar.gz

Ha egy weboldalt (pl. http://www.weitz.de/regex-coach/) szeretnénk elmenteni 1 mélységben (tehát azokat az oldalakat, amikre a weboldal hivatkozásai mutatnak, nem szeretnénk lemásolni), akkor a következőt írjuk a parancssorba:

 wget -p -k http://www.weitz.de/regex-coach/

Ha ugyanezt szeretnénk megtenni, de 3 mélységig, akkor a következő a parancs:

 wget -p -k -r -l3 http://www.weitz.de/regex-coach/

Az utóbbi két parancs az oldalakat a www.weitz.de/regex-coach/ könyvtárba fogja tenni. Ha azt szeretnénk, hogy mondjuk a public_html/rc könyvtárba másolja a Wget a weboldalt, akkor a -nd (nem rendezi könyvtárakba a letöltött állományokat) és a -P opciókat használjuk:

 wget -p -k -r -l3 -nd -P public_html/rc http://www.weitz.de/regex-coach/

Ha a letöltendő weboldal nem HTML-dokumentum (pl. .shtml, .php, .asp, stb. kiterjesztésű), akkor a -E opció segíthet (HTML-re konvertálja a dokumentumot):

 wget -p -k -E http://www.thinkgeek.com/


Linkek

Személyes eszközök