Éléments constituant du document d’archives
Pour concevoir une standardisation des pratiques, le premier pas est de comprendre de quoi est construite une archive. L’ouvrage Les écrits s’envolent de Charles KECSKEMÉTI et Lajos KÖRMENDY donne des pistes.
L’archive est constituée de plusieurs éléments qui lui sont intrinsèques. Ces éléments sont le support, la forme, le contenu, les identifiants, la structure, et le contexte.
Que faut-il retenir de ces éléments ?
Le support : c’est ce sur quoi est écrite l’archive. Contrairement au papier, au cours de sa vie, l’archive va changer plusieurs fois de support ! Un exemple : un producteur verse une archive numérique sur un CD ou un disque dur externe. L’archiviste l’intègre sur un disque optique puis la déplacera sur une bande lorsque ses chances d’être consultées deviendront quasi très faible. Enfin, si le temps de conservation est plus long que la durée de vie de la bande, l’archive sera migrée sur un nouveau support. Ainsi, l’importance du support a considérablement diminué dans le monde numérique.
La forme : c’est l’apparence de l’archive. Dans le monde numérique la forme va dépendre de l’outil utilisé pour la lecture. Par exemple, si l’archive est lue sur un outil ne reconnaissant pas ses polices, l’outil les convertira automatiquement en polices reconnues par lui et par conséquent changera la forme de l’archive.
Son importance dépend du type de document. Si elle est très importante pour du graphique est l’est beaucoup moins pour du texte.
Les informations liées à la forme peuvent être séparées du contenu de l’archive. Ainsi la forme et le contenu peuvent être conservés dans des fichiers différents.
La conversion de l’archive dans un format pérenne pour une conversation à long terme a souvent pour effet de modifier la forme de l’archive. Il est donc primordial de savoir faire des compromis avec la forme pour garantir une conservation à long terme.
Le contenu : c’est l’information
[protected]
immanente relative au sujet du document. De ce fait son importance est identique dans le monde numérique et le monde analogique.
L’identifiant : c’est ce qui rend l’archive unique. Il répond à 2 objectifs :
1/ identifier le document individuellement et prouver son unicité et son authenticité ;
2/ lui désigner sa place dans un système documentaire.
Son importance est vitale dans le monde du numérique car c’est sur lui que repose l’accès à l’archive.
Il peut exister également d’autres identifiants invisibles. Comme la forme, les identifiants peuvent être intégrés à l’archive ou enregistrés à part, dans une base de données.
La structure : ici, il faut différencier la structure interne de la structure externe de l’archive.
Structure interne : dans le cas d’une archive sur support papier, la structure interne permet de repérer facilement une date, un objet, un destinataire, une signature. Dans le cas d’une archive électronique ces données seront des données techniques ou métadonnées. La structure interne peut-être particulièrement menacée en cas de conversion de l’archive vers un format de fichier différent car, alors, ces métadonnées structurels peuvent disparaître. La valeur des documents se dégrade alors fortement.
Structure externe : c’est ce qui relie l’archive à un ensemble. La norme internationale de description ISADg (publiée par le Conseil international des Archives en 1994) décrit six niveaux hiérarchisés : la pièce, le dossier, la sous-série, la série, le sous-fonds, et le fonds. Cette structure correspond en général au plan de classement de l’organisation.
La structure externe peut-être verticale (c’est le cas d’une page Web dans l’ensemble du site), ou horizontal c’est le cas d’une page Web par rapport à une autre page Web du même site).
Dans le monde du papier la structure externe se perçoit immédiatement : des papiers rangés dans des dossiers, eux-mêmes rangés dans des cartons. Dans le monde numérique c’est plus compliqué : l’archive est noyée au milieu d’une multitude d’autres documents sans liens les uns avec les autres. Ce sont les métadonnées associées qui permettront de construire la structure externe d’une archive. Cette notion ne doit donc pas être négligée car sans elle, l’archive perd immanquablement de sa valeur.
Le contexte : ce sont les informations et les données relatives aux producteurs des documents : leur histoire, leur vie, leurs activités, leurs compétences et fonctions, leur structure organisationnelle, leurs relations avec d’autres organismes, etc. Mais également ce qui entoure le producteur et l’archive sur les plans juridique, politique et social.
Le contexte technique informatique est également très important. Il s’agit entre autres des informations sur le format du fichier, le matériel et le logiciel ayant permis sa création. Ces informations prennent toute leur importance lors d’une conservation dans le format d’origine pour avoir une chance de le relire plus tard.
Le contexte est généralement consigné comme métadonnées de l’archive lors de son enregistrement. En raison des exigences techniques, il a gagné en importance par rapport à l’archive papier.
La séparation des éléments constitutifs du document :
Dans le monde analogique, support, forme et contenu constituent un ensemble indivisible.
Dans le monde numérique tout cela s’est radicalement transformé. Support, forme et contenu sont dissociables. Quant à l’identifiant, la structure et le contexte, ils ont vu leur valeur augmenter parce qu’indispensables pour assurer l’identité, l’intégrité et l’authenticité des archives rendant très vulnérables et par là-même difficile à conserver de façon pérenne.
Les métadonnées
Les métadonnées sont des données sur des données (documents). Dans le monde analogique, elles s’apparentent à la fiche du document dans le catalogue d’une collection. Leur fonction principale consiste à pouvoir être traitées, interrogées et manipulées par des ordinateurs. Comment s’organisent-elles ?
Les métadonnées peuvent être intégrées au fichier du document d’archive (recommandé) ou bien placées dans un tableau séparé constituant une base de données des métadonnées.
Parmi les éléments constitutifs du document d’archives (Cf. la partie III), l’identifiant est une métadonnée. La structure et le contexte sont décrits par des métadonnées.
Les métadonnées peuvent être classifiées de plusieurs manières. Le Making of America II Testbed Project a établi dans les années 90’s, les 3 groupes suivants :
- Les métadonnées descriptives : constituées de données nécessaires à l’identification des documents et à la mise à jour des informations relatives à leur contenu ;
- Les métadonnées administratives : constituées de données nécessaires à l’utilisation du document telles que ses spécifications techniques (format, version du logiciel source, etc.) et ses conditions de production ou restrictions de communicabilité ;
- Les métadonnées structurelles : constituées de données relatives aux connexions techniques et archivistiques entre les composantes des objets numériques.
Les métadonnées peuvent être également classifiées suivant le cycle de vie des documents électroniques :
- Les métadonnées d’archives courantes : elles sont générées en général par le système de gestion électronique des documents (GED), en même temps que le document. Elles peuvent contenir le nom de l’auteur, la date de création, le titre, le niveau de la restriction de communicabilité, les mots-clés du document, etc. ;
- Les métadonnées d’archives : elles sont générées après la clôture des dossiers, soit chez le producteur, soit après le versement aux archives. Elles peuvent contenir la date du dernier contrôle, le nom de l’organisme producteur, etc. ;
- Les métadonnées techniques : nécessaires pour la reconnaissance et la gestion technique des documents, elles sont, de préférence, générées automatiquement par le producteur. Elles seront générées par les archives uniquement si ces dernières opèrent une conversion des documents lors de leur versement.
La planification, l’interopérabilité (qui permet une indépendance vis-à-vis des matériels et logiciels sources) et l’échange (qui permet d’exporter, importer, fusionner et intégrer) sont grandement facilités par la standardisation des métadonnées.
Pour cela, il existe des normes internationales acceptées qui seront détaillées dans une prochaine partie. Parmi elles, citons toutefois la norme Dublin Core (http://dublincore.org/), l’ISADg et l’ISAAR publiées par le Conseil international des Archives (ICA).
Dans le domaine des métadonnées de conservation, citons le dictionnaire de données PREMIS (PREservation Metadata : Implementation Strategies) et la norme METS (Metadata Encoding and Transmission Standard – http://www.loc.gov/standards/mets/).
[/protected]