Du grec « meta » qui signifie « ce qui dépasse, ce qui englobe un objet, une science" (Le Robert). Les métadonnées sont des données à propos d'autres données.
Il s’agit d’un ensemble de données structurées, standardisées qui décrivent le contenu d’une ressource quelconque qu’elle soit physique ou numérique.
Aujourd’hui, c'est un terme que l’on utilise généralement à propos de ressources électroniques.
En réalité, les spécialistes de l'information créent des métadonnées depuis bien longtemps ; lorsque les bibliothécaires cataloguent des ouvrages, elles créent des métadonnées.
Le concept de métadonnées est donc antérieur à Internet et au Web. Toutefois, c'est avec le développement de l'édition électronique ou des bibliothèques numériques que les acteurs d’Internet et notamment les professionnels de l’information et de la documentation ont fait évoluer les langages de description et d’échange de données vers plus de standards et de structuration.
Pour compléter mon précédent billet voici quelques liens vers divers glossaires thématiques :
- Glossaire du libre accès à l'information, hébergé sur le site de l’INIST, qui rassemble des « termes utilisés dans le cadre du Libre Accès et plus particulièrement des archives ouvertes ». Le glossaire, basé sur le travail de terminologie réalisé pour le livre Les Archives ouvertes : enjeux et pratiques. Guide à l’usage des professionnels de l’information, édité par l’ADBS en 2005, est régulièrement enrichi par de nouveaux termes.
- Glossaire des normes, des protocoles et des formats liés à la bibliothèque numérique réalisé par les services de technologie de l'information de la bibliothèque nationale du Canada. Il donne accès à « plus de 90 termes choisis portant sur les normes, les protocoles et les formats de documents axés sur la technologie et qui sont pertinents aux activités d'une bibliothèque numérique. Pour chaque entrée, on retrouve l'acronyme, le nom au complet et une description ou un commentaire succinct, selon le cas. »
- Petit Glossaire à l'usage des documentalistes sur le site de l’ENSSIB et réalisé par Pierre André. On y trouve « les définitions des principales notions relatives au métier de documentaliste, à l'informatique documentaire, aux échanges électroniques de données, aux Services Web. »
- Vocabulaire d'internet, glossaire réalisé par l’Office québécois de la langue française. Il contient « plus d'un millier de termes sans cesse enrichi par l'ajout de néologismes reflétant l'évolution du réseau Internet. » Outre les définitions des termes, synonymes ou notions apparentées sont aussi fournies.
- Lexique français-anglais et anglais-français pour la recherche documentaire sur le site de l’Urfist.
Voilà un lien très utile signalé sur Deanie oueblog. Il s'agit d'un glossaire anglais-français dans le domaine de la documentation, en ligne sur le site de la Maîtrise des Sciences de l'information de l'Université Paris I - Panthéon-Sorbonne.
Fin 2004, on estimait à environ 100 000 nouvelles pages web la production quotidienne française. Près de la moitié disparaît en moins d’un mois ; au total ce sont au moins 500 000 pages qui disparaissent tous les ans (rien qu’en France).
Même si ces chiffres, établis par le RIPE (Réseaux IP Européens), ne sont qu’un ordre de grandeur, on comprend à quel point il est urgent de se préoccuper de la conservation de ce patrimoine numérique.
La réflexion autour de la conservation de la mémoire du web a été entamée au milieu des années 1990 avec Internet Archive aux Etats-Unis. Association à but non lucratif, Internet Archive s'est fixée un but ambitieux : archiver la toile mondiale. Depuis 1996, c’est près de 40 milliards de pages qui ont été archivées. La Wayback Machine (machine à remonter le temps) consultable en ligne permet de visualiser des sites tels qu’ils s’affichaient à des dates antérieures.
En France parmi les premiers chantiers mis en œuvre dans ce secteur, on peut citer l’archivage thématique des sites électoraux entrepris par la Bnf autour des présidentielles et législatives de 2002, ainsi que des régionales et européennes de 2004, ou encore le site des archives du 1er ministre qui présente les versions successives du site depuis 1996 (gouvernement Jupé soit 6 versions).
Voir aussi :
- La rubrique Archivage du web du site bibnum de la bnf, espace professionnel sur les documents numériques
- La liste de diffusion web-archive


