• Étape 3: La prochaine étape consistait à faire un tableau en 3 colonnes et où dans la troisième colonne il y aurait les pages aspirées, c'est à dire l'aspiration des urls qui étaient stockés dans le dossier URLS.

    Pour cela nous nous sommes servi de la commande wget.

    Petit rappelle: Wget est une commande non interactive de téléchargement de fichiers à partir du Web. Wget nous permet le simple téléchargement d'un fichier, mais aussi et c'est ce qui nous intéresse le plus, la recopie en local de tout ou d'une partie d'un site qui sera par la suite consultable hors-ligne.

    Voici donc notre script :

     

    A la commande wget nous avons ajouté l'option -O qui nous permet d'indiquer où le fichier va être stocké.

    En lançant le script ci-dessus dans le terminal:


    Nous aspirons les pages correspondant à nos Urls et les enregistrons dans le fichier PAGES-ASPIREES. On vérifie si les pages aspirées sont stockés au bon endroit:


    et nous obtenons alors notre tableau à trois colonnes:


    Une petite remarque sur la commande wget est qu'elle permet de reprendre un téléchargement échoué dû par exemple dans notre cas à une rupture de connexion, ce qui fait le mérite de cette commande!


    1 commentaire
  • Partant du tableau n°1 nous avons entrepris la réalisation d'un second tableau qui nécessite l'ajout d'une colonne comptabilisant le nombre d'urls du tableau.

    Voici donc notre script :

    Script n°2 : Tableau deux colonnes

     

    Nous avons apporté les modifications suivantes :

    Ligne 7 : (i=1;) déclaration de la variable i qui nous sert de compteur.

    Ligne 10 : (<td>$i</td>) ajout d'une colonne qui affiche la valeur de i selon la ligne.

    Ligne 11 : (let "i=i+1") instruction d'incrémentation de la valeur de i, instruction let qui nous a causé bien des soucis...

    Lors de l'exécution du script, nous avons eu en retour l'erreur suivante :

    Script n°2 : Tableau deux colonnes

     

    La commande let n'est pas trouvée lors de l'exécution du script, pourtant, après l'avoir testée dans le terminal, nous avons constaté qu'elle est fonctionnelle.

    Après de longues recherches afin de comprendre l'origine du problème et bien que nous ayons pris la précaution de déclarer dans la première ligne du script que nous voulions utiliser le Bash, nous avons réalisé que le Shell par défaut sous Ubuntu est le Dash. Or, let est une commande du Bash.

    Il nous a fallu modifier la configuration du Shell par défaut via la commande suivante :

    Script n°2 : Tableau deux colonnes

     

    Pour pouvoir l'exécuter, nous avons changé de session pour celle de l'utilisateur principal. La commande sudo permet d'invoquer les droits de super-utilisateur nécessaires à de telles modifications.

    Après avoir entrée le mot de passe, la fenêtre suivante s'affiche :

    Script n°2 : Tableau deux colonnes

     

    Selectionner non permet de désactiver le Dash par défaut.

    Voilà ce qui suit :

    Script n°2 : Tableau deux colonnes

     

    Voici le tableau test crée par notre script :

    Script n°2 : Tableau deux colonnes


    1 commentaire
  •  

    La première phase de notre projet consiste à créer un tableau html dans lequel on mettra les liens trouvés autour de notre mot-clé. Pour cela on écrit un script dans lequel on récupère nos liens stockés dans un fichier, on crée un tableau à une colonne et on place nos liens dans cette première colonne.Voici donc notre premier script :

    Script n°1 : Tableau avec une colonne de lien URL

    Dans le terminal vérifie où on se situe grâce à la commande pwd et on se place dans le dossier projet à l'aide de la commande cd.

    Le terminal suivant notre programme nous demande le nom du fichier dans lequel on a stocké nos liens Urls. Puis nous demande le nom du tableau dans lequel il va afficher nos lien! IL ne faudra surtout pas oublier que c'est un tableau Html, donc .html!

    Script n°1 : Tableau avec une colonne de lien URL

    et voici donc notre tout premier tableau:

    Script n°1 : Tableau avec une colonne de lien URL

     


    votre commentaire


    Suivre le flux RSS des articles de cette rubrique
    Suivre le flux RSS des commentaires de cette rubrique