diff options
| author | RochDLY <roch.delannay@gmail.com> | 2024-01-28 11:05:18 +0100 | 
|---|---|---|
| committer | RochDLY <roch.delannay@gmail.com> | 2024-01-28 11:05:18 +0100 | 
| commit | 458dbca4bed03c6995395b21a9f0a3f515d7a442 (patch) | |
| tree | b4158d3b9c13216c08d638787a5a4ccd96658b76 /src/posts/2024-01-26-archiver-un-site-web.md | |
| parent | 68c388a5bf59e32792d3e2a475153211d083969a (diff) | |
| download | pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.tar.gz pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.tar.bz2 pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.zip | |
billet archiver un site web: update + ajout du gif
documentation de la création d'une version statique du site web et ajout d'un petit gif pour montrer le résultat obtenu.
Diffstat (limited to 'src/posts/2024-01-26-archiver-un-site-web.md')
| -rw-r--r-- | src/posts/2024-01-26-archiver-un-site-web.md | 36 | 
1 files changed, 36 insertions, 0 deletions
| diff --git a/src/posts/2024-01-26-archiver-un-site-web.md b/src/posts/2024-01-26-archiver-un-site-web.md index 3587ff9..24e6a2c 100644 --- a/src/posts/2024-01-26-archiver-un-site-web.md +++ b/src/posts/2024-01-26-archiver-un-site-web.md @@ -4,6 +4,7 @@ date: 2024-01-26  ---  ## Contexte +  Ce billet permet de documenter un ensemble de procédures et de questions en cours  de réflexion. @@ -226,3 +227,38 @@ passe quand même sur ces ressources, les télécharge, puis les supprime.  Il me reste un peu moins d'une heure de train pour rentrer à Paris, on va voir  ce que j'arrive à récupérer d'ici là. + +## La commande qui fonctionne +C'était un peu trop ambitieux d'espérer récupérer tout le site web avec la +dernière commande en simplement une heure. + +Il aura été nécessaire de laisser tourner `wget` pendant plus de 11h pour +récupérer l'intégralité du site web avec la commande suivante :  + +```bash +> wget --wait=1 \ +     --level=inf \ +     --recursive \ +     --page-requisites \ +     --user-agent=Mozilla \ +     --no-parent \ +     --convert-links \ +     --adjust-extension \ +     --no-clobber \ +     --reject=xml,json,csv,atom,rss,rss2,tmp \ +     -e robots=off \ +     https://anr-collabora.parisnanterre.fr/observatoire/ +``` + +La différence avec la commande précédente est la réduction du temps d'attente +entre chaque requête d'une seconde (`wait=1`). + +On a pu récupérer plus de 11600 fichiers constituant tout le site web ! La +plupart des fonctionnalités ont été préservées (recherche par mot-clés ou par +tag), le CSS et les images sont bien présents. + +Il ne reste plus qu'à supprimer la version existante avec Omeka Classic et +déposer l'archive statique sur le serveur pour vérifier que tout fonctionne +correctement ! + + | 
