wget - Linux download manager - spis ważniejszych opcji i tricków¶
man wget - najciekawsze opcje ;)¶
-q, --quiet
Tryb cichy. Wyłącza wyjście Wget.
-t liczba, --tries=liczba
Ustawia liczbę ponawiania prób na liczbę. Dla nieskończonego
ponawiania: 0
-O plik, --output-document=plik
Dokumenty będą zapisywane do pojedynczego pliku (jeśli podano parę -
zostaną sklejone). Jeśli plik istnieje, to zostanie nadpisany.
Włączenie tej opcji automatycznie ustawia liczbę prób na 1.
-c, --continue
Kontynuuje pobieranie częściowo ściągniętego pliku. Opcja -c wpływa
tylko na wznawianie pobrań zaczętych przed bieżącym wywołaniem Wget
i tylko dla tych plików, których lokalne kopie nadal istnieją.
Istnieje wiele ograniczeń w stosunku do tej opcji należy jej używać
z rozwagą.
--limit-rate=wielkość
Ogranicza prędkości pobierania do wielkość bajtów na sekundę. Na
przykład --limitrate=20k ograniczy prędkość ściągania do 20KB/s, a
--limitrate=1m do 1MB/s.
--header=dodatkowy-nagłówek
Opcja ta pozwala na określenie dodatkowego nagłówka przesyłanego
serwerom HTTP. Możliwe jest określenie więcej niż jednego
dodatkowego nagłówka przez kilkakrotne podanie opcji --header.
wget --header='Accept-Charset: utf-8' --header='Accept-Language: pl' http://jakas.strona.pl/
Podanie pustego łańcucha jako nagłówka kasuje wszystkie uprzednio
zdefiniowane przez użytkownika nagłówki.
--referer=url
Zamieszcza nagłówek ‘Referer: url’ w żądaniu HTTP. Przydatne do
pobierania dokumentów z dodatkowym filtrowaniem po stronie serwera
(obejście blokowania leechowania obrazków).
--user-agent=nazwa-agenta
Wget przedstawia się serwerowi HTTP jako agent o określonej nazwie -
modyfikowany nagłówek "User-Agent"
-r, --recursive
Włącza pobieranie rekurencyjne - czyli wraz z podkatalogami,
odnośnikami.
-l głębokość, --level=głębokość
Podaje maksymalny poziom głębokości rekurencji. Domyślnie jest to 5.
-p, --page-requisites
Ta opcja powoduje, że Wget ściągnie wszystkie pliki niezbędne do
poprawnego wyświetlenia danej strony HTML. Obejmuje to takie rzeczy
jak grafikę i powiązane arkusze stylów - polecam użycie wraz z opcją
-k. Należy zauważyć, że Wget pobierze tylko pojedynczą stronę i jej
elementy. Program nie będzie podążał za odnośnikami z tej strony do
zewnętrznych dokumentów. Do ściągania pojedynczej strony i
wszystkich towarzyszących jej elementów (nawet jeśli leżą one na
odrębnych serwerach WWW) i upewnienia się, że całość lokalnie
poprawnie się wyświetla, autor oprócz -p powinno korzystać się z
kilku dodatkowych opcji:
wget -E -H -k -K -p http://jakis.serwer.pl/1.html
-A lista_akc --accept lista_akc
-R lista_odrz --reject lista_odrz
Jedna z opcji rekurencyjnego akceptowania/odrzucania. Podaje listę
oddzielonych przecinkami przyrostków nazw plików (rozszerzeń plików)
lub wzorców nazw, jakie mają być akceptowane lub odrzucane.
-D lista_domen, --domains=lista_domen
Ustala domeny, do których program może przechodzić. lista_domen
jest listą separowaną przecinkami. Opcja ta nie włącza -H.
--exclude-domains lista_domen
Podaje domeny, do których program ma nie przechodzić.
-H, --span-hosts
Włącza przechodzenie pomiędzy hostami przy pobieraniu rekurencyjnym.
-np, --no-parent
Powoduje, że Wget przy pobieraniu rekurencyjnym nigdy nie wchodzi do
katalogu nadrzędnego. Przydatna opcja, gdyż gwarantuje, że ściągane
będą tylko pliki poniżej pewnego poziomu.
Część z poniższych porad znalazłem, a część sam wymyśliłem ;).
wget ignorowanie pliku robots.txt (ignore robots)¶
wget -erobots=off http://jakas.strona.pl/
Jak zalogować się do formularza korzystając z wgeta?¶
wget --post-data="login=user&password=pw" http://jakas.strona.pl/form.php
Co oznaczają te opcje?¶
--http-user=użytkownik, --http-passwd=hasło
Określają nazwę użytkownika i hasło, które Wget prześle serwerowi
HTTP. W zależności od rodzaju protokołu, Wget koduje je stosując
albo uwierzytelnianie podstawowe ("basic", niechronione) albo w
oparciu o skrót ("digest"). Żeby uchronić hasła przed podpatrzeniem,
należy przechowywać je w pliku .wgetrc lub .netrc i, za pomocą
“chmod", zapewnić tym plikom ochronę przed innymi użytkownikami.
Podsumowanie¶
Wget to naprawdę program o dużych możliwościach, a dzięki niewielkiemu rozmiarowi jest dostępny w niemal wszystkich możliwych dystrybucjach Linuxa.
Początkujących użytkowników może odstraszyć jego konsolowy interfejs, ale naprawdę warto się z nim zapoznać - bo nie ma lepszego programu do pobierania plików z sieci (przynajmniej ja nie znam).