Le CR2PA a organisé une table ronde le Jeudi 13 avril 2023 à la Maison des Travaux Public : FNTP, 9 rue de Berri, Parie 8ème sur le thème : « Modèles numériques, données et archivage : quels enjeux ? »
Nos méthodes de travail s’appuient presque exclusivement sur des outils numériques. Les données sont démultipliées dans des systèmes d’information métiers qui forment des écosystèmes. Le besoin de traçabilité, de garantir l’intégrité et l’exploitabilité sur le long terme est un véritable défi pour les professionnels de l’information, archivistes, informaticiens, ingénieurs, opérationnels. Que faut-il conserver ? Pour quels enjeux ? Avec quels moyens ? Ce sont toutes les questions auxquelles se confrontait cette table ronde.
En ouverture de la réunion, Chantal Pasquier (EGIS), Estelle Pichat (Systra) et Anne Redon (SNCF Réseau) ont présenté les résultats des travaux qu’elles ont menés dans le groupe de travail « BIM et Archivage » du projet de recherche MINnD.
Quelques définitions :
MINnD : Modélisation des INformations INteropérables pour les INfrastructures Durables – programme de recherche lancé en 2014, dont la 2ème saison s’est déroulée sur la période 2019-2023
BIM : Building Information Modelling – la maquette numérique des chantiers de construction de bâtiments et d’infrastructures
IFC : Industry Foundation Classes (https://www.buildingsmart.org/standards/bsi-standards/industry-foundation-classes/) / norme ISO 16739 : standard d’échange de données BIM
STEP (STandard for the Exchange of Product model data) ou norme ISO 10303: famille de formats standards de sauvegarde pour l’échange de données d’ingénierie, dont les IFC.
Le groupe de travail a listé les enjeux de l’archivage :
Les besoins sont de 2 types : d’une part justifier et établir des preuves en cas de contentieux, et d’autre part retrouver et réutiliser les données au fur et à mesure de la vie de l’ouvrage.
Cela nécessite de répondre à de nombreux éléments de complexité :
- Qui est responsable de quoi dans un projet mené en mode collaboratif ?
- A quel moment faut-il archiver une maquette qui évolue tout le temps au cours du projet ?
- Avec quels moyens et dans quels formats pour pouvoir toujours exploiter les données dans 10 ans, 20 ans, 30 ans… ?
- Comment le faire de façon performante et efficiente ?
Il a défini un cycle de vie de la donnée, circulaire, qui va de « concevoir le projet » à « réutiliser les données » (et par là rouvrir un nouveau cycle).
Il a analysé la norme ISO 19650 « Organisation et numérisation des informations relatives aux bâtiments et ouvrages de génie civil », et mis en évidence certains besoins de précisions et de compléments.
Il a écouté des acteurs de terrain et des experts, et entendu des sujets déjà bien connus des archivistes :
- Le besoin d’une politique d’archivage claire,
- La synergie à établir entre les opérationnels des différents métiers et les experts de la gestion de l’information,
- Le besoin d’un glossaire des termes métiers et de ceux de l’archivage,
mais aussi des questionnements nouveaux : typologie des objets traités, formats ouverts et normés, taille des fichiers, outils spécifiques, dissémination des informations dans différentes plateformes, dynamique d’évolution permanente du BIM.
Cela lui a permis d’établir des recommandations :
- Malgré les spécificités, la méthodologie « classique » de l’archivage reste la référence opérante : définir une politique, établir des procédures, et utiliser les outils spécifiques de l’archivage numérique.
- Les problématiques techniques ont reçu des éléments de réponse, qui restent toutefois à éprouver dans des projets réels et à adapter aux méthodes de travail des parties prenantes.
- La sensibilisation des acteurs est fondamentale, en s’appuyant notamment sur le référentiel connu de l’analyse des risques.
Puis est venue la table ronde proprement dite, réunissant 5 experts d’entreprises et de sociétés de services, qui ont commencé par présenter chacun les enjeux de son domaine d’activités :
Pierre Benning, Directeur de l’Information Technique chez Bouygues Travaux Publics :
La maquette numérique de la construction est un objet très évolutif.
C’est un domaine très siloté, qui fait intervenir Maître d’Ouvrage, Maître d’œuvre, constructeurs, exploitants / mainteneurs, chacun gérant des informations qui vont être utilisées par d’autres.
Un projet de construction est un partenariat à chaque fois nouveau, avec des partenaires qui ne travaillent pas de la même façon, et qui à la fin du projet doivent récupérer chacun l’information dont il est responsable pour la porter dans ses propres systèmes d’information.
Il y a un enjeu de savoir-faire et de propriété intellectuelle à protéger, qui doit être pris en compte dans la sélection des données à partager.
Le besoin de conservation va bien au-delà de la garantie décennale ; il porte sur toute la durée de vie de l’ouvrage, et cela peut aller jusqu’aux générations futures. Pour prendre un cas extrême : la ligne 1 du métro parisien a été mise en service en 1900, elle fonctionne encore et cela va continuer dans le futur.
Sylvain Marie, Director AEC & Plant Industry vertical chez Eurostep :
Eurostep se spécialise sur « la collaboration pour la continuité numérique en entreprise étendue », et intervient dans les secteurs de la défense, de l’industrie et de la construction.
Le domaine de la construction se caractérise par la complexité des objets traités : le BIM, qui consiste à associer des données à un environnement spatial, mais aussi des nuages de points, des systèmes d’information géographiques.
Le cycle de vie des objets peut se représenter par la double roue du PIM (Project Information Management) et de l’AIM (Asset Information Management). L’archivage est positionné comme un jalon d’aboutissement du PIM.
Les enjeux de l’archivage sont (de façon non exhaustive) :
- De répondre aux exigences informatiques : volumétrie, contraintes de localisation des données, réversibilité,
- D’assurer la conformité vis-à-vis de réglementations comme la REP (Responsabilité largie des Producteurs) ou le CIL (Carnet d’Information du Logement),
- De permettre la gestion d’actifs grâce au système documentaire et à l’image numérique de l’ouvrage : analyse d’impact, résilience, maintien de la performance.
Florent Vincent, Product Owner d’outils d’archivage chez Thales :
Dans ses différents domaines d’activité : transport terrestre, espace, aéronautique, défense et sécurité, identité et sécurité numérique, Thales est un concepteur et producteur de systèmes complexes. Cela se traduit par :
- Une volumétrie très importante de documentation,
- Des formats très divers, qui vont de la bureautique de base aux données enregistrées lors d’essais en vol,
- Des durées de conservation très élevées : pour un modèle CAO la durée est « tant que l’équipement est en vol + 5 ans » – en sachant que la conception du Rafale date des années 1980 et que son remplaçant est seulement à l’étude, cela peut faire beaucoup !
Pour le système d’archivage, cela nécessite de répondre aux contraintes de volumétrie, de pérennité des formats, mais aussi de qualité des critères de recherche futurs qui sont ceux que l’on crée au moment où l’on archive.
Stéphane Wulc, Head of Records Management chez Sanofi :
Toutes les informations produites au cours de la vie du médicament sont auditables sur une durée supérieure à 30 ans.
Pour Sanofi, cela se traduit par 420 km d’archives papier, 400 m3 d’archives biologiques, 35 TB d’enregistrements numériques provenant de plus de 300 applications décommissionnées.
Il faut considérer que 100% des applications informatiques qui produisent des données seront abandonnées avant que les données qu’elles produisent aient atteint leur durée de conservation. Cela représente plusieurs milliers d’applications à décommissionner sur les 10 prochaines années.
Pour y faire face, la politique de Sanofi repose sur 3 piliers :
- La responsabilisation des métiers vis-à-vis de l’archivage, qui doit être intégré comme un élément de chaque processus,
- L’obligation d’intégrer un flux d’archivage dans chaque nouveau projet informatique,
- La mise en place d’une « usine d’archivage numérique », sous-traitée un partenaire, pour être en capacité d’arrêter des dizaines d’applications par mois.
Hervé Streiff, Directeur de la stratégie digitale chez Xelians :
Les sociétés qui ont constitué Xelians ont démarré leurs activités il y a plus de 40 ans par l’archivage du papier, avec 37 sites logistiques gérant des kilomètres d’archives papier.
On a vu ensuite arriver le document numérique, avec des applications de GED ou de workflow.
Ce qu’on voit apparaître maintenant, la prochaine étape, c’est que l’élément d’entrée n’est plus le document mais la donnée qui arrive par le workflow, et le document devient un accessoire : à certains moments seulement on fige les données sous forme de document pour répondre à un besoin de preuve. C’est un changement de paradigme qui remet en question les GED et SAE et appelle d’autres solutions.
Dans le domaine du bâtiment les demandes de nos clients ne portent pas encore sur le BIM, mais sur la gestion des actifs : qu’est-ce qui se passe après la construction ?, avec notamment les problématiques de cession avec ouverture de data rooms.
Sur les questions concernant l’archivage de la donnée nous voyons apparaître deux autres besoins importants :
- L’archivage de transactions, par exemple des paiements bancaires, des parcours digitaux non supportés par des documents : dans un parcours de consentement dématérialisé, comment je peux garantir dans 10 ou 15 ans que la personne qui a consenti l’a fait dans le bon état de l’art ? Cela nécessite d’archiver non pas un document signé mais le contexte de signature qui permet d’affirmer la validité de la signature.
- Le deuxième, c’est le décommissionnement d’applications anciennes. Par exemple : le système de maintenance d’un fournisseur de compagnies aériennes, où l’on arrête le système mais il faut continuer à avoir accès, dans des contraintes fortes de délai, aux opérations de maintenance effectuées sur les aéronefs.
Après cette présentation, ils se sont efforcés de répondre aux questions :
Quand positionner l’archivage dans le processus ?
Pour Pierre Benning, cela reste un point difficile. Pour les documents : contrats, notes de calcul, plans, etc…, le besoin d’archivage est en fin de projet, mais les documents sont produits au fil de l’eau et stockés dans des GED, voire des espaces individuels, avec un classement souvent basé sur des arborescences qui parlent à l’utilisateur mais qui sont difficiles à indexer a posteriori.
Pour la maquette numérique, il y a des jalons où on fige la maquette, mais ça n’est pas très bien suivi dans la pratique, et il y a beaucoup de problèmes liés aux formats : format natif, pas interopérables, formats trop facilement modifiables, etc..
Pour Florent Vincent, il faut séparer les outils métier et les outils d’archivage, et transférer la « photo » de la donnée dans l’outil d’archivage au moment où elle devient engageante, c’est-à-dire quand elle est validée et diffusée. Ensuite, la donnée existe en double dans l’application métier et dans le système d’archivage.
On définit des jalons avec une check-list de toutes les informations qu’il faut mettre dans le système d’archivage. C’est le responsable métier qui sait et qui « tamponne » la donnée à archiver.
Pour Stéphane Wulc, l’archivage intervient quand la donnée n’est plus accessible dans le système d’origine. L’effort est mis sur le développement du « live archiving » : prévoir le flux d’archivage dès la conception de l’application pour éviter d’avoir à faire du rétro-engineering.
Comment archiver des systèmes complexes ?
Hervé Streiff rappelle que le coût de l’archivage dans un SAE dépend du nombre d’objets qu’on archive. Pour chaque objet, on va créer des métadonnées, des données d’indexation pour la recherche, des logs dans un système de journalisation : jusqu’à une quinzaine d’informations pour chaque objet archivé. Si on archive individuellement chaque donnée le coût va être vite astronomique.
Pour gérer de la très haute volumétrie il y a 2 voies de réponses :
- Archiver dans un SAE des blocs de données, pour mutualiser les métadonnées et l’indexation. Ensuite par la recherche on récupérera un bloc, puis on analysera le bloc pour retrouver la donnée.
- Une deuxième alternative encore expérimentale consiste à se passer de SAE en stockant les données structurées dans des fichiers indépendants et de format simple (de type xml par exemple). Cela suffit pour répondre à un besoin interne d’exploitation. S’il y a un besoin de valeur probante, on peut prendre des hash de ces fichiers et les enregistrer dans une chaîne de hash interne. S’il y a un besoin probant vis-à-vis de tiers cela peut se faire dans une blockchain ou par un horodatage par un tiers de confiance.
La question des formats ?
Tous les intervenants sont d’accord pour considérer que la cible est d’archiver dans des formats ouverts, car les formats natifs des éditeurs sont tous voués à l’obsolescence à plus ou moins long terme.
Cependant, Hervé Streiff estime que pour la maquette numérique on ne peut pas aujourd’hui exiger des éditeurs de standardiser les formats, car cela serait un frein à l’innovation.
Sylvain Marie explique que le secteur du BTP a choisi la voie la plus difficile (« l’ascension par la face Nord ») en décidant de développer des standards d’échange de données au niveau objet plutôt qu’au niveau enveloppe. C’est un très gros chantier, mais il est en passe de réussir, et cela offrira beaucoup plus de possibilités que si l’on se contente des standards des éditeurs. Et Pierre Benning rappelle qu’on fait maintenant normaliser par l’ISO les standards IFC qu’on a développés.
Pour Florent Vincent et Thales, pour les échanges avec les fournisseurs, si les outils ne sont pas compatibles on passe par un format STEP, et dans ce cas on archive les données en format natif et en format STEP. Le transfert de format peut amener à perdre de l’information, et dans ce cas il faut la transmettre en annexe par un autre moyen.
Dans le cas de Stéphane Wulc et Sanofi, il ne s’agit pas de données géométriques, et la problématique est de pouvoir fournir des preuves à un auditeur sous une forme qu’il puisse lire directement par lui-même. Pour cela, on archive non pas des données brutes, mais des résultats sous forme de pdf.
Comment gérer la co-conception ?
Pierre Benning rappelle que les partenaires qui coopèrent sur le projet sont aussi des concurrents. A la fin du projet, on transfère les données au client et chacun veut aussi récupérer ses données ; on doit savoir pour chaque transaction qui a généré l’information et à qui elle appartient. Les risques de divulgation d’information de savoir-faire confidentiel sont élevés. On définit par contrat ce que chacun a le droit de récupérer.
Dans cette réversibilité, il faut pouvoir récupérer non seulement les données, mais aussi toutes les métadonnées pertinentes.
Sylvain Marie souligne que l’enjeu d’interopérabilité est considéré comme très important en Europe, mais qu’on est encore loin de pouvoir assurer intégralement le « jumeau numérique » de l’ouvrage. Parmi les difficultés :
- On n’a jamais une maquette intégrale, mais des fédérations de maquettes, y compris les réseaux électriques, réseaux de chauffage, etc… etc… (Pour le chantier du tribunal de grande instance de Paris : 280 maquettes)
- Pour obtenir la normalisation ISO, on a sélectionné les propriétés qui étaient suffisamment génériques, et écarté d’autres spécifiques à un cadre national ou à une société ; pour prendre en compte celles-qui ne sont pas normalisées, il faut se référer à des dictionnaires en ligne en intégrant dans la maquette des liens vers des url difficiles à pérenniser.
Et le facteur humain ?
Pierre Benning montre les difficultés d’un processus reposant sur la bonne volonté des opérateurs : celui qui effectue l’archivage n’est pas celui qui va l’exploiter dans le futur, l’équipe change de dimension au cours de projet et intègre de nouveaux arrivants, ceux qui sont présents à la fin du chantier ne sont pas ceux qui ont réalisé le projet, etc…
Stéphane Wulc insiste sur le travail de sensibilisation et d’éducation à mener auprès des responsables de projet pour qu’ils prennent en compte le besoin d’archivage dans la conception, alors que cela ne va pas naturellement leur paraître une priorité. En revanche, le processus de traitement lui-même ne doit pas être dépendant de l’humain. La personne experte est vouée à partir, il faut pouvoir faire confiance aux process.
Pour terminer la séance, le public a été invité à poser ses questions.
Le format IFC permet-il de reconstituer l’information ?
Le but du format IFC est de permettre des échanges dans un contexte où beaucoup de logiciels différents sont utilisés. Les IFC permettent de récupérer le « tel que construit », mais ils ne permettent pas de refaire la conception car leur capacité de gérer des objets paramétriques n’est pas implémentée par les éditeurs de logiciels, et ils contiennent donc moins de valeur que le fichier source.
Si on norme un format, on a une perte, de même que le pdf perd de l’information par rapport au fichier excel d’origine.
Pour des essais réalisés par calcul, faut-il conserver les moyens de rejouer le calcul ?
Non, cela nécessiterait de conserver en état des matériels et des logiciels obsolètes. On va conserver les jeux de données, la méthode calcul, les références des logiciels et les résultats.
Quelle recommandation pour archiver un système SAP ? Faut-il conserver le système d’information producteur de la donnée ?
Si on décommissionne un système, c’est parce qu’il ne va plus être exploitable ; il faut donc migrer vers des systèmes plus ouverts que le système source. Il faut chercher à extraire des informations
intelligentes, il est possible que des données consolidées suffisent (par exemple, en comptabilité, le grand livre), sans avoir besoin de garder tout le modèle de données.
Comment prendre en compte le coût de l’archivage ?
Dans un SAE les coûts dépendent de la granularité de l’archivage plus que du volume de stockage. Il n’y a pas de solution unique, c’est un arbitrage à faire en fonction de l’usage qu’on va avoir et du coût qu’on est prêt à y mettre.
Il faut archiver au juste nécessaire, d’où l’intérêt de le définir au début du projet.