Wget

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 25. prosince 2019; kontroly vyžadují 11 úprav .
GNU Wget
Typ správce stahování
Autor Hrvoje Nikšić [1]
Vývojáři Mauro Tortonesi, Giuseppe Scrivano a další.
Zapsáno v C [3]
Rozhraní příkazový řádek
Operační systém Linux a další UNIXové , Windows
Jazyky rozhraní ruština a dalších 38 jazyků
První vydání ledna 1996
Nejnovější verze
Vygenerované formáty souborů Soubor webového archivu
Stát aktivní
Licence GPL 3.0+ [4] [5]
webová stránka gnu.org/software/wget/
 Mediální soubory na Wikimedia Commons

Wget [6]  — (GNU Wget) bezplatný neinteraktivní konzolový program pro stahování souborů přes síť. Podporuje protokoly HTTP , FTP a HTTPS a také podporuje práci přes HTTP proxy server . Program je součástí téměř všech distribucí GNU/Linuxu .

Wget je neinteraktivní program. To znamená, že po jeho spuštění může uživatel ovlivnit jeho chod pouze s pomocí nástrojů pro řízení procesů operačního systému. Zpravidla se k tomu používají klávesové zkratky Ctrl+C, když je potřeba přerušit program a Ctrl+Z pro umístění aktuální úlohy na pozadí. Moderní webové prohlížeče mají obvykle funkci nahrávání souborů, ale protože je prohlížeč navržen pro interaktivní režim, ruční stahování velkého množství souborů může být únavné. Prohlížeče obvykle neposkytují prostředky k automatizaci těchto úloh. Wget například podporuje stahování URL specifikovaných v souboru. Můžete si tedy vytvořit seznam souborů a kdykoli si je stáhnout pomocí wget. Rozhraní příkazového řádku umožňuje ovládat wget z jiných programů a skriptů , což se používá při automatizaci stahování souborů (pravidelné aktualizace, sledování dostupnosti serveru atd.).

Wget vám umožňuje stahovat jakékoli soubory na World Wide Web (včetně ( X ) HTML stránek) pomocí protokolů http a https, stejně jako soubory a výpisy adresářů pomocí protokolu ftp.

Soubory lze stahovat rekurzivně z odkazů na stránkách HTML, a to jak z jednoho webu s určitou hloubkou následujících odkazů, tak z několika. Navíc při stahování přes ftp lze soubory stahovat „podle masky“ názvu (tj. skupinu souborů můžete určit pomocí „*“).

Wget podporuje obnovení souboru v případě selhání připojení.

Vyvíjí se pokračování Wgetu, Wget2 [7] .

Příklady

Načítání všech adres URL uvedených v místním nebo externím SOUBORu:

wget -i SOUBOR

Stáhnout soubory do zadaného adresáře (-P) [8] :

wget -P /cesta/pro/uložit ftp://ftp.example.org/nejaky_soubor.iso

Použití uživatelského jména a hesla na FTP/HTTP (možnost 1):

wget ftp://login:password@ftp.example.org/some_file.iso

Použití uživatelského jména a hesla na FTP/HTTP (možnost 2):

wget --user = přihlášení --password = heslo ftp://ftp.example.org/some_file.iso

Stažení na pozadí (-b):

wget -b ftp://ftp.example.org/some_file.iso

Pokračovat (-c pokračovat) ve stahování dříve neúplně staženého souboru:

wget -c http://example.org/file.iso

Stáhnout bez kontroly certifikátu (--no-check-certificate):

wget --no-check-certificate http://example.org/file.iso

Stáhněte si obsah adresáře http://example.org/~user/my-archive/  (nedostupný odkaz) a všechny jeho podadresáře, aniž byste museli jít nahoru v hierarchii adresářů:

wget -r --no-parent http://example.org/~user/my-archive/

Podporována je také identifikace na serveru:

wget --save-cookies cookies.txt \ --post-data 'user=foo&password=bar' \ http://example.org/auth.php

Stáhněte si celý web (hloubka rekurze - 10):

wget -r -l 10 -k -o log-file.txt -p http://example.org/ -r, --recursive povolí rekurzivní stahování -l, --level = NUMBER hloubka rekurze ( inf a 0 - nekonečno ) -k, --convert-links vytvoří odkazy lokální v načteném HTML nebo CSS -o, --output-file = SOUBOR zapisuje zprávy ( logy ) do SOUBORU -p, --page-rekvizity načte všechny obrázky atd. potřebné k vykreslení stránky HTML -m, --mirror krátká volba, ekvivalentní -N -r -l inf --no-remove-listing.

Vytiskněte obsah odpovědi do konzole:

wget http://example.org --quiet -O -

Návratový stav

Před verzí 1.12 vrací 0 při úspěchu a 1 při chybě. Od verze 1.12 [9] se v případě chyby vrací od 1 do 8 v závislosti na typu.

Kritika

Vývoj Wgetu je pomalý, mnoho nových rozšíření protokolu HTTP, FTP , skriptů JavaScript a dalších funkcí není podporováno.

V některých případech může být dobrou alternativou cURL a rsync se obvykle používá k vytváření zrcadel stránek (což cURL nemůže [10] ) . Ve verzi 1.17 a vyšší je vyžadována podpora instrukcí SSE2 ze strany procesoru.

wget2

Další velká aktualizace Wgetu by měla být ve wget2, který ji má nahradit. wget2 má oproti Wgetu značný počet vylepšení, především z hlediska výkonu:

  • podpora HTTP/2
  • HTTP komprese
  • Paralelní připojení
  • Rychlé otevření TCP

a řada dalších.

Hlavním vývojářem wget2 je Tim Rühsen, který je také jedním z hlavních vývojářů a současných správců Wgetu.

Klony

Vestavěné systémy mívají omezenou paměť a mají klony, které napodobují rozhraní a chování GNU Wget, ale mají méně možností, většinou jen stahování souboru:

Viz také

Poznámky

  1. Domovská stránka Wget. . Získáno 6. října 2021. Archivováno z originálu dne 15. září 2021.
  2. ↑ Vydán Shah D. wget-1.21.3  – 2022 .
  3. Projekt wget Open Source na Open Hub: Stránka jazyků - 2006.
  4. https://www.gnu.org/software/wget/
  5. https://git.savannah.gnu.org/cgit/wget.git/tree/README
  6. Kvůli *nix konvencím na příkazovém řádku je tento program vyvolán slovem začínajícím malým písmenem:wget
  7. wget2 na Gitlabu Archivováno 1. března 2018 na Wayback Machine 
  8. GNU wget manuál . Získáno 6. října 2021. Archivováno z originálu dne 6. října 2021.
  9. wget manuál Archivováno 6. října 2021 na Wayback Machine Returning status (cs)
  10. cURL FAQ Archivováno 6. října 2021 na Wayback Machine : "Curl není program pro zrcadlení webových stránek."

Odkazy