Archivage du web : pour commencer

Publié le par CC-Blog2doc

Fin 2004, on estimait à environ 100 000 nouvelles pages web la production quotidienne française. Près de la moitié disparaît en moins d’un mois ; au total ce sont au moins 500 000 pages qui disparaissent tous les ans (rien qu’en France).
Même si ces chiffres, établis par le RIPE (Réseaux IP Européens), ne sont qu’un ordre de grandeur, on comprend à quel point il est urgent de se préoccuper de la conservation de ce patrimoine numérique.

La réflexion autour de la conservation de la mémoire du web a été entamée au milieu des années 1990 avec Internet Archive aux Etats-Unis. Association à but non lucratif, Internet Archive s'est fixée un but ambitieux : archiver la toile mondiale. Depuis 1996, c’est près de 40 milliards de pages qui ont été archivées. La Wayback Machine (machine à remonter le temps) consultable en ligne permet de visualiser des sites tels qu’ils s’affichaient à des dates antérieures.

En France parmi les premiers chantiers mis en œuvre dans ce secteur, on peut citer l’archivage thématique des sites électoraux entrepris par la Bnf autour des présidentielles et législatives de 2002, ainsi que des régionales et européennes de 2004, ou encore le site des archives du 1er ministre qui présente les versions successives du site depuis 1996 (gouvernement Jupé soit 6 versions).


Voir aussi :

- La rubrique Archivage du web du site bibnum de la bnf, espace professionnel sur les documents numériques
- La liste de diffusion web-archive

Publié dans Archivage du web

Pour être informé des derniers articles, inscrivez vous :
Commenter cet article