« Le système d'exploitation GNU-Linux/Autres commandes utiles » : différence entre les versions

Un livre de Wikilivres.
Contenu supprimé Contenu ajouté
imported>Baletandesu2
imported>Luckas-bot
m r2.7.1) (robot Ajoute: sv:Wget
Ligne 98 : Ligne 98 :
[[pt:Wget]]
[[pt:Wget]]
[[ru:Wget]]
[[ru:Wget]]
[[sv:Wget]]
[[uk:Wget]]
[[uk:Wget]]
[[zh:Wget]]
[[zh:Wget]]

Version du 23 février 2011 à 22:25

Modèle:Infobox Logiciel

Wget est un gestionnaire de téléchargement libre issu du projet GNU. Il permet le téléchargement avancé de fichiers sur des réseaux et sur Internet

Description

wget permet notamment de créer des miroirs de sites, ou d'effectuer des téléchargements récursifs. Son nom vient de World Wide Web et de GET qui est le nom de la commande utilisée dans le protocole HTTP pour récupérer un fichier. Il est capable de communiquer avec les protocoles HTTP et FTP.

Il est écrit en C dans un style extrêmement portable. C'est un programme en ligne de commande utilisé principalement sur les systèmes Unix. Des frontaux graphiques tels que gwget et des versions pour Windows existent également.

wget est non interactif, ce qui signifie qu'il peut travailler en arrière-plan, sans que l'utilisateur ne soit identifié sur sa machine. Au contraire, la plupart des navigateurs web nécessitent la présence constante de l'utilisateur, ce qui peut être très gênant lors de transferts importants de données.

Lorsqu'il crée un miroir ou qu'il « télécharge récursivement », wget respecte le protocole robots.txt. wget peut être paramétré pour convertir en local les liens des fichiers HTML téléchargés afin qu'ils soient consultables hors-ligne.

Les caractères génériques de nom de fichiers et les images miroirs récursives de répertoire sont disponibles lors d'un transfert via FTP. wget peut lire l'estampille temporelle fournie par les serveurs HTTP et les serveurs FTP, et l'enregistrer localement. wget peut ainsi vérifier si un fichier distant a été modifié depuis la dernière recherche, et éventuellement télécharger automatiquement la nouvelle version. wget est donc un outil approprié pour créer des miroirs de sites FTP, ou de pages d'accueil.

wget a été conçu pour être robuste si la connexion réseau est lente ou instable; si un téléchargement échoue à cause d'un problème de réseau, il va réessayer jusqu'à ce que tout le fichier soit récupéré, en reprenant là où il s'était arrêté.

wget supporte les serveurs proxy, ce qui peut réduire la charge du réseau, accélérer le téléchargement et permettre un accès derrière un pare-feu.

wget ne gérait pas les fichiers de plus de 2 gigaoctets avant la version 1.10 ; certaines personnes se sont donc tournées vers des alternatives, telles que ncftpget ou cURL.

Certaines portions de cet article sont basées sur la documentation Wget.

Utilisation de Wget

Modèle:Guide pratique

Utilisation de base

Typiquement Wget s'utilise par la ligne de commande, avec un ou plusieurs URLs passés en paramètres. De nombreuses options permettent d'affiner le comportement souhaité (téléchargement multiple, suivre les liens...).

# Télécharge la page à la racine du site exemple.fr dans un ficher
# nommé "index.html".
wget http://www.exemple.fr/
# Télécharger les sources de Wget depuis le serveur FTP de GNU.
wget ftp://ftp.gnu.org/pub/gnu/wget/wget-latest.tar.gz

Il est possible de télécharger automatiquement plusieurs URLs dans une hiérarchie de dossiers.

# Télécharge tous les fichiers *.gif d'un serveur web
# (Les syntaxes de type glob, comme "wget http://www.serveur.com/dir/*.gif", ne marche que avec FTP)
wget -e robots=off -r -l1 --no-parent -A.gif http://www.serveur.com/dir/
# Télécharge la page page racine de exemple.fr, avec les images et les 
# feuilles de styles utilisées pour afficher la page, et converti les 
# URLs internes pour fonctionner avec les copies locales.
wget -p -k http://www.exemple.fr/
# Télécharge le contenu entier de exemple.fr
wget -r -l 0 http://www.exemple.fr/

Liens externes

Modèle:Portail logiciels libres