summaryrefslogtreecommitdiff
path: root/src/posts/2024-01-26-archiver-un-site-web.md
diff options
context:
space:
mode:
authorRochDLY <roch.delannay@gmail.com>2024-01-28 11:05:18 +0100
committerRochDLY <roch.delannay@gmail.com>2024-01-28 11:05:18 +0100
commit458dbca4bed03c6995395b21a9f0a3f515d7a442 (patch)
treeb4158d3b9c13216c08d638787a5a4ccd96658b76 /src/posts/2024-01-26-archiver-un-site-web.md
parent68c388a5bf59e32792d3e2a475153211d083969a (diff)
downloadpandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.tar.gz
pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.tar.bz2
pandoc-site-458dbca4bed03c6995395b21a9f0a3f515d7a442.zip
billet archiver un site web: update + ajout du gif
documentation de la création d'une version statique du site web et ajout d'un petit gif pour montrer le résultat obtenu.
Diffstat (limited to 'src/posts/2024-01-26-archiver-un-site-web.md')
-rw-r--r--src/posts/2024-01-26-archiver-un-site-web.md36
1 files changed, 36 insertions, 0 deletions
diff --git a/src/posts/2024-01-26-archiver-un-site-web.md b/src/posts/2024-01-26-archiver-un-site-web.md
index 3587ff9..24e6a2c 100644
--- a/src/posts/2024-01-26-archiver-un-site-web.md
+++ b/src/posts/2024-01-26-archiver-un-site-web.md
@@ -4,6 +4,7 @@ date: 2024-01-26
---
## Contexte
+
Ce billet permet de documenter un ensemble de procédures et de questions en cours
de réflexion.
@@ -226,3 +227,38 @@ passe quand même sur ces ressources, les télécharge, puis les supprime.
Il me reste un peu moins d'une heure de train pour rentrer à Paris, on va voir
ce que j'arrive à récupérer d'ici là.
+
+## La commande qui fonctionne
+C'était un peu trop ambitieux d'espérer récupérer tout le site web avec la
+dernière commande en simplement une heure.
+
+Il aura été nécessaire de laisser tourner `wget` pendant plus de 11h pour
+récupérer l'intégralité du site web avec la commande suivante :
+
+```bash
+> wget --wait=1 \
+ --level=inf \
+ --recursive \
+ --page-requisites \
+ --user-agent=Mozilla \
+ --no-parent \
+ --convert-links \
+ --adjust-extension \
+ --no-clobber \
+ --reject=xml,json,csv,atom,rss,rss2,tmp \
+ -e robots=off \
+ https://anr-collabora.parisnanterre.fr/observatoire/
+```
+
+La différence avec la commande précédente est la réduction du temps d'attente
+entre chaque requête d'une seconde (`wait=1`).
+
+On a pu récupérer plus de 11600 fichiers constituant tout le site web ! La
+plupart des fonctionnalités ont été préservées (recherche par mot-clés ou par
+tag), le CSS et les images sont bien présents.
+
+Il ne reste plus qu'à supprimer la version existante avec Omeka Classic et
+déposer l'archive statique sur le serveur pour vérifier que tout fonctionne
+correctement !
+
+![](/images/archiveWeb.gif)