Wget
61. sor: | 61. sor: | ||
*[http://www.wget.info/man-wget.html A Wget teljes kézikönyve] | *[http://www.wget.info/man-wget.html A Wget teljes kézikönyve] | ||
*[http://progkor.inf.elte.hu/MAN/HTML/wget.htm A Wget kézikönyvének kivonata magyarul] | *[http://progkor.inf.elte.hu/MAN/HTML/wget.htm A Wget kézikönyvének kivonata magyarul] | ||
+ | |||
[[User:Urbane|Urbane]] | [[User:Urbane|Urbane]] |
A lap 2006. december 13., 22:34-kori változata
Tartalomjegyzék |
Mi a Wget?
A GNU Wget egy nagyon jól paraméterezhető, hatékony parancssori letöltésvezérlő program, amely a HTTP, HTTPS és FTP protokollokat támogatja. A Wget egy nem interaktív program, ami azt jelenti, hogy a háttérben is futtatható a felhasználó bejelentkezése nélkül, tehát akár ki is jelentkezhetünk a rendszerből, az elindított letöltés ettől nem fog leállni. Egyik leghasznosabb funkciója a rekurzív letöltés, melynek segítségével teljes HTTP vagy FTP struktúrákat másolhatunk.
A Wget használata
Szintaktika
wget [opciók] [URL]
Az opciókat egy kötőjel után adhatjuk meg (külön-külön vagy ömlesztve), az URL formátuma többféle is lehet:
- http://szerver(:port)/elérésiút (pl. http://wiki.math.bme.hu, http://www.math.bme.hu/~wettl/okt/info1/2006/wfre.pdf)
- ftp://szerver(:port)/elérésiút (pl. ftp://ftp.gnu.vbs.at/emacs/emacs-21.3.tar.gz)
- ftp://felhasználónév:jelszó@szerver/könyvtár/állomány
Fontosabb opciók
A Wget rengeteg hasznos opcióval rendelkezik, segítségükkel akár egészen bonyoltult, összetett letöltési feladatokat is könnyen megoldhatunk. Az opciók megadásánál lényeges a kis- és nagybetű. Néhány a legfontosabbak közül:
- -b: Ha ezt az opciót bekapcsoljuk, a letöltés a háttérben fog zajlani.
- -c: Ez az opció a letöltés esetleges megszakadásakor automatikusan újraindítja a töltést onnan, ahol az megszakadt.
- -p: Letölthetünk vele egy HTML-oldalt, az összes megjelenítéshez és működéshez szükséges egyéb állománnyal együtt.
- -k: A HTML-dokumentumban található külső hivatkozásokat átalakítja relatív hivatkozásokra, hogy teljes mértékben a saját gépünkön böngészhessük a letöltött oldalakat.
- -r: Bekapcsolja a rekurzív letöltési módot. Ez HTTP oldalaknál azt jelenti, hogy a megadott URL-t letölti, majd mindazon állományokat, amikre a HTML-dokumentum hivatkozik, szintén letölti, és ezt folytatja megadott mélységig (az alapértelmezett 5). A letöltött fájlok könyvtárstruktúrája meg fog egyezni az eredetivel. FTP esetén a rekurzív letöltés a megadott könyvtár összes alkönyvtárának letöltését jelenti, hasonlóan a HTTP rekurzív letöltéséhez.
- -l: A rekurzív letöltés mélységét állíthatjuk be vele, pl. -l3 három szintet jelent. Lehetőleg tartózkodjuk a -l0 használatától, mert az végtelen mélységig történő letöltést jelent, és az igencsak leterhelheti a rendszert, amin dolgozunk.
- -P: Ezzel az opcióval megadhatjuk, hogy hova töltsön a Wget. Alapértelmezetten ez a ".", tehát a könyvtár, amiben éppen dolgozunk. Ha azt akarjuk, hogy pl. a download nevű könyvtárba kerüljenek a letöltött állományok, akkor a -P download opciót kell megadni. Használhatjuk a szokásos relatív és abszolút unixos könyvtármegadásokat.
- -h: Felsorolja az összes opciót és ismerteti használatukat.
Néhány példa
Egyszerű letöltés (az adott állományt letölti az aktuális könyvtárba):
wget http://ftp.gnu.org/pub/gnu/emacs/emacs-21.4a.tar.gz
Tegyük fel, hogy valami miatt megszakadt a letöltésünk, és az emacs-21.4a.tar.gz állomány hiányosan található meg a gépünkön. Ekkor folytathatjuk a letöltést, ha bekapcsoljuk a -c opciót:
wget -c http://ftp.gnu.org/pub/gnu/emacs/emacs-21.4a.tar.gz
Ha egy weboldalt (pl. http://www.weitz.de/regex-coach/) szeretnénk elmenteni 1 mélységben (tehát azokat az oldalakat, amikre a weboldal hivatkozásai mutatnak, nem szeretnénk lemásolni), akkor a következőt írjuk a parancssorba:
wget -p -k http://www.weitz.de/regex-coach/
Ha ugyanezt szeretnénk megtenni, de 3 mélységig, akkor a következő a parancs:
wget -p -k -r -l3 http://www.weitz.de/regex-coach/
Az utóbbi két parancs az oldalakat a www.weitz.de/regex-coach/ könyvtárba fogja tenni. Ha azt szeretnénk, hogy mondjuk a public_html/rc könyvtárba másolja a Wget a weboldalt, akkor a -nd (nem rendezi könyvtárakba a letöltött állományokat) és a -P opciókat használjuk:
wget -p -k -r -l3 -nd -P public_html/rc http://www.weitz.de/regex-coach/
Ha a letöltendő weboldal nem HTML-dokumentum (pl. .shtml, .php, .asp, stb. kiterjesztésű), akkor a -E opció segíthet (HTML-re konvertálja a dokumentumot):
wget -p -k -E http://www.thinkgeek.com/