Dans la réflexion engagée par le CR2PA sur les relations existantes et à venir entre l’intelligence artificielle et la démarche d’archivage (archivage managérial d’abord et conservation à des fins patrimoniales ensuite), il est intéressant de constater que la question de l’impact des technologies sur les modes d’archivage est déjà bien présente dans le monde anglo-saxon, notamment avec le groupe de recherche InterPARES (International Research on Permanent Authentic Records in Electronic Systems).
InterPARES, les technologies disruptives et l’archivage
Le groupe de recherche pluridisciplinaire InterPARES a été créé en 1998 par Luciana Duranti, professeur à l’université de Colombie-Britannique à Vancouver (Canada). Il met en relation les apports de l’archivistique et de la diplomatique avec les technologies de l’information, la sécurité informatique et la cybersécurité, mais aussi le droit, les investigations informatiques légales (digital forensics), les sciences de l’information, le journalisme. Quatre projets de recherche se sont succédés: InterPARES 1 sur l’authenticité et l’intégrité des documents archivés électroniquement; InterPARES 2 sur la conservation à long terme d’archives artistiques, scientifiques ou administratives dans des systèmes interactifs et dynamiques; InterPARES 3 sur la mise en œuvre de ces principes dans des structures de petites taille ou de taille moyenne dans le secteur public. InterPARES 4, renommé InterPARES Trust (https://interparestrust.org/), a démarré en 2013 et est dédié à la question de la confiance et des critères de confiance pour les données et les documents archivés en ligne, notamment dans le cloud. Les objectifs d’InterPARES Trust sont de développer un cadre théorique et méthodologique et de proposer des normes ou des réglementations permettant d’assurer un archivage numérique fiable et pérenne.
Une des thématiques de recherche émergeantes concerne l’impact des technologies dites disruptives, telle que l’intelligence artificielle, le machine learning, la blockchain, le big data ou l’Internet des objets, sur l’archivage. Les recherches portent principalement sur le secteur public, même si les liens avec le secteur privé sont nombreux. L’équipe Europe d’InterPARES vient ainsi de proposer à un fonds de financement européen un projet intitulé Interdisciplinary Research on Public Administration Disrupted e-Services.
Il est dommage que ce groupe international qui inclut environ trois cents professionnels de l’archivage (records managers, enseignants-chercheurs, experts) ne compte qu’un seul membre français. Cette quasi-absence de la France dans ces recherches prive le public français de résultats de recherche intéressants et ne favorise pas le partage des réflexions élaborées en France hors de l’hexagone.
Algorithme et document engageant
L’originalité d’InterPARES est d’aborder les technologies de l’information, dont l’Intelligence artificielle, avec une grille de lecture archivistique et diplomatique, c’est-à-dire en utilisant les fondamentaux de ces disciplines séculaires pour interroger l’environnement numérique. Dans la mesure où les données collectées, traitées ou produites par les outils numériques sont le résultat d’une activité humaine, d’une transaction entre deux personnes ou entre un système et une personne, les objets de données qui résultent de ces activités tracent un engagement, sont sources de mémoire, ont un émetteur et/ou un détenteur responsable des données, sont datés ou datables, etc. Ce sont donc des données qui relèvent de l’archivage et de ses règles de conservation, de sécurité et d’accès.
Il est intéressant dans ce contexte de rappeler la définition de « record » dans le glossaire d’InterPARES: a document made or received in the course of a practical activity as an instrument or a by-product of such activity, and set aside for action or reference. Cette définition se démarque de la norme ISO 15489 sur le records management et davantage encore de la définition traditionnelle du document d’archives. Ce qui est souligné ici, c’est d’une part le statut d’instrument ou de sous-produit du document (un document engageant n’est pas sa propre finalité, il est au service d’une action), d’autre part le geste managérial de mise en sécurité pour une finalité ultérieure identifiée (exploitation de l’information ou preuve).
Dans cette logique, InterPARES distingue les reprospective records, c’est-à-dire les documents qui trace une décision ou un fait, cas où l’écrit est postérieur à l’action et a pour rôle d’en préserver la preuve ou la mémoire, et les prospective records qui sont des données, des écrits qui précèdent les faits dans la mesure où ils permettent à l’action d’avoir lieu ou expliquent comment elle doit être réalisée. C’est le cas d’une procédure qui détaille les étapes de réalisation d’une opération administrative ou technique et qui généralement doit être archivée pour pouvoir dire plus tard sur quelles données s’est appuyée une personne pour opérer de telle ou telle façon, par exemple un technicien pour la réparation d’un équipement; c’est ce que InterPARES appelle un « instructive record ». C’est également le statut des algorithmes lorsqu’ils sont le fondement d’une décision; dans ce cas, la liste d’instructions mathématiques qui constituent l’algorithme est un objet d’information avec un contenu et une finalité qui non seulement permet de traiter des données mais aussi documente la décision issue du traitement; c’est ce que InterPARES appelle un « enabling record ».
Pour plus de détail sur les typologies fonctionnelles des « records » voir mon article: http://transarchivistique.fr/les-six-categories-de-records-dinterpares/
Ce rôle de documentation d’une action engageante fait entrer l’algorithme dans le périmètre des données potentiellement candidates à l’archivage c’est-à-dire des données susceptibles d’apporter un élément de preuve ou de connaissance au document engageant auxquelles elles se rapportent. Ceci ne signifie pas qu’il faille archiver tous les algorithmes. Que la technologie intervienne ou non dans la production des décisions, le choix d’archiver cette décision et les éléments sur lesquels elle s’appuie (l’algorithme mais aussi les données brutes) exige le même discernement et est soumis au même processus d’analyse de risque de non-disponibilité et d’exploitabilité de ces données dans le futur, qu’un document sur support papier.
Pour l’archivage, l’enjeu est toujours d’apprécier quel agrégat d’informations il est pertinent de conserver pendant combien de temps pour quel motif.
Par Marie-Anne Chabin