Table ronde : « Usages militants du Net : quelles archives pour le futur ? La sauvegarde des archives électroniques des mouvements sociaux »
Dans le prolongement du numéro de Matériaux pour l’histoire de notre temps consacré à la question des archives électroniques des mouvements sociaux (Internet et mouvements sociaux : nouvelles pratiques militantes, nouvelles sources pour l’histoire, n° 79, juillet-septembre 2005), la BDIC, le CODHOS et le Centre d'Histoire sociale du XXème siècle ont organisé une table ronde sur ce thème le 12 janvier dernier à l’Université Paris X – Nanterre.
Afin que les futurs historiens du social puissent travailler à partir de ces nouvelles sources il faut que des politiques d’archivage électronique soient dès à présent mises en place.
Il est donc grand temps de tenter de répondre à des questions cruciales : quelles archives doit-on conserver ? qui devra se charger de ce travail ? et avec quels moyens, que ceux-ci soient financiers, techniques ou humains ? Quelles formes de coopérations sont possibles dans ce domaine ?
Au vu de l’étendue du champ concerné (les « mouvements sociaux »), et compte tenu de la masse de documents électroniques désormais produits par les différents acteurs de ce domaine, les réponses à ces questions seront nécessairement le résultat de réflexions collectives et partagées. »
La réunion d’acteurs d’horizons si divers est suffisamment rare pour être soulignée même s’il faut bien reconnaître qu’il n’a pas toujours été simple de s’accorder sur un langage commun… !
Je vous livre ici quelques unes de mes notes, un peu plus fournies quant aux projets institutionnels et à l'archivage du web.
On parle de born-digital archives - archives électroniques natives (sites web, blogs, courriel...)
I - Projets institutionnels
La Bnf et l’archivage du web – Catherine Lupovici & Gildas Ilien
L’International Internet Preservation Consortium (IIPC) piloté par la BNF et créée à son initiative en 2003 oeuvre pour une collaboration internationale en matière de préservation des contenus en ligne. Le Consortium comprend également la Bibliothèque du Congrès, la British Library et les bibliothèques nationales d'Australie, du Canada, du Danemark, de la Finlande, d'Islande, d'Italie, de Norvège, de Suède, à qui s'est jointe la fondation américaine Internet Archive.
Les différentes étapes dans l'archivage du web :
- Expérimentation de 1998 à 2004 : collecte automatique à grande échelle et collecte automatique ciblée ; constitution des premières collections
- Passage en mode « opérationnel » depuis 2005 ; attente de la loi et de son décret d’application pour 2007
Quelques chiffres :
- instantané du domaine .fr (fin 2004-début 2005) : 118 millions de fichiers – 3 téraoctets
- instantané (printemps 2004) des domaines génériques et français : 2 128 milliards de fichiers – 21 téraoctets
En cours :
- instantané du domaine .fr : 140 millions de fichiers
- collectes automatiques ciblées de 4000 sites : 40 millions de fichiers (dont 1/3 de blogs)
- copies d’instantanés historiques 2001-2003 : 38 téraoctets
Ces chiffres donnent le vertige !
En revanche et malgré ces chiffres, la Bnf "avoue" qu'il est rare d'obtenir un document complet lorsque celui-ci est complexe (base de données...). Cela implique différents modes de collecte.
L’unité documentaire = le site et ses liens
1 – Des étudiants de Sciences-Po vont travailler sur le corpus des élections (2002 & 2004)
2 – Préparation de la collecte pour la campagne électorale de 2007 ; collaboration avec d’autres institutions et organismes pour le repérage des sites.
Expérimentations à l’INA dans le cadre du dépôt légal – Thomas Drugeon
De nouveaux enjeux apparaissent : archivage d’un medium interactif, hétérogénéité et évolution des formats (notamment streaming), domaine en perpétuelle évolution.
La collecte de sites est lancée grâce à la détection automatique des mises à jour, l’INA ayant développé ses propres outils.
Archives de France et archives électroniques – Françoise Banat-Berger (DAF)
L’archivage électronique a longtemps été réduit à l’archivage de statistiques (INED, INSEE) conservées jusque-là au Centre des Archives contemporaines de Fontainebleau (CAC).
Préconisations :
- prévoir des migrations de support
- archiver les métadonnées des documents électroniques en même temps que le document lui-même.
Rappel du nouveau contexte juridique avec la loi du 13 mars 2000 ; les informations électroniques ont une valeur probante au même titre que les informations sur support papier ; nouvelle production issue de l’e-administration.
Le projet Migr’archives - Dana Diminescu (Groupe d’Etudes sur l’usage des TIC dans les migrations, EHESS)
Le projet Migr’archives est un programme d'archivage de sites web destiné aux
chercheurs sur les migrations. Il est développé en collaboration avec l’INA.
Il permet à chaque chercheur de se constituer son propre corpus de sites web et d’effectuer sa collecte à l’aide d’un robot configuré avec des mots clefs.
A noter la parution du numéro 23 de la revue Migrance, « Les documents numériques : méthodologie d’archivage et perspectives de recherche sur les migrations ».
Les archives du forum social européen 2003 - Jérôme Malois & Cécile Milot (Université de Bourgogne)
Le programme a ici consisté à collecter l'ensemble des échanges électroniques au sein de l'organisation du forum social européen de 2003.
Le travail en amont avec le producteur se révèle indispensable.
Collecte des documents sur les ordinateurs personnels des organisateurs (mais il manque le contexte de production), collecte des listes de diffusion, formats très divers...
La publication d’un instrument de recherche avec Pleade (Arkeia et DTD EAD) est prévue.