diff options
author | RochDLY <roch.delannay@gmail.com> | 2024-01-28 11:05:18 +0100 |
---|---|---|
committer | RochDLY <roch.delannay@gmail.com> | 2024-01-28 11:05:18 +0100 |
commit | 458dbca4bed03c6995395b21a9f0a3f515d7a442 (patch) | |
tree | b4158d3b9c13216c08d638787a5a4ccd96658b76 /src | |
parent | 68c388a5bf59e32792d3e2a475153211d083969a (diff) | |
download | pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.tar.gz pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.tar.bz2 pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.zip |
billet archiver un site web: update + ajout du gif
documentation de la création d'une version statique du site web et ajout d'un petit gif pour montrer le résultat obtenu.
Diffstat (limited to 'src')
-rw-r--r-- | src/posts/2024-01-26-archiver-un-site-web.md | 36 |
1 files changed, 36 insertions, 0 deletions
diff --git a/src/posts/2024-01-26-archiver-un-site-web.md b/src/posts/2024-01-26-archiver-un-site-web.md index 3587ff9..24e6a2c 100644 --- a/src/posts/2024-01-26-archiver-un-site-web.md +++ b/src/posts/2024-01-26-archiver-un-site-web.md @@ -4,6 +4,7 @@ date: 2024-01-26 --- ## Contexte + Ce billet permet de documenter un ensemble de procédures et de questions en cours de réflexion. @@ -226,3 +227,38 @@ passe quand même sur ces ressources, les télécharge, puis les supprime. Il me reste un peu moins d'une heure de train pour rentrer à Paris, on va voir ce que j'arrive à récupérer d'ici là. + +## La commande qui fonctionne +C'était un peu trop ambitieux d'espérer récupérer tout le site web avec la +dernière commande en simplement une heure. + +Il aura été nécessaire de laisser tourner `wget` pendant plus de 11h pour +récupérer l'intégralité du site web avec la commande suivante : + +```bash +> wget --wait=1 \ + --level=inf \ + --recursive \ + --page-requisites \ + --user-agent=Mozilla \ + --no-parent \ + --convert-links \ + --adjust-extension \ + --no-clobber \ + --reject=xml,json,csv,atom,rss,rss2,tmp \ + -e robots=off \ + https://anr-collabora.parisnanterre.fr/observatoire/ +``` + +La différence avec la commande précédente est la réduction du temps d'attente +entre chaque requête d'une seconde (`wait=1`). + +On a pu récupérer plus de 11600 fichiers constituant tout le site web ! La +plupart des fonctionnalités ont été préservées (recherche par mot-clés ou par +tag), le CSS et les images sont bien présents. + +Il ne reste plus qu'à supprimer la version existante avec Omeka Classic et +déposer l'archive statique sur le serveur pour vérifier que tout fonctionne +correctement ! + +![](/images/archiveWeb.gif) |