Le protocole HTTP: Aspirateur web


Récupérez un site entier pour le consulter off-line ou comprendre les astuces utilisées par son webmaster

En attendant une version locale, je vous recommande celle-ci :



et voici un petit script shell qui permet de récupérer tous les fichiers totoxx.yyy, ou xx varie de n a n' et yyy est une extension quelconque. ca donne : nwget http://www.salemioche.com/http_prog .htm 1 5
ca permet de recuperer les fichiers http_prog1.htm, htpp_prog2.htm ...

function nwget {
  i=$3
  l=$4
  while test $i -le $l ; do
    wget http:/${1}${i}${2}
    let i=i+1
  done
}^M


le meme mais cette fois ca ajoute un 0 si le nombre est inferieur a 10, pour recuperer titi09.htm mais titi10.htm par exemple :
function nwget0 {
  i=$3
  l=$4
  while test $i -le $l ; do
    if test $i -lt 10 ; then
      wget http:/${1}0${i}${2}
    else
      wget http:/${1}${i}${2}
    fi
    let i=i+1
  done
}^M