Le 15 septembre dernier, le Club des Utilisateurs francophones d’Oracle a organisé une Commission « Archivage des données critiques RH & Finance » pour ses adhérents, commission à laquelle l’AFCDP (Association française des correspondants à la protection des données à caractère personnel) et le CR2PA (Club de l’archivage managérial) étaient invités, à côté de plusieurs intervenants utilisateurs des solutions Oracle. J’ai eu le plaisir de représenter le CR2PA à cette manifestation, avec une présentation intitulée « Archivage des données sensibles Dépasser la contradiction ! » à partir des retours d’expérience des adhérents du club et des témoignages du MOOC « Bien archiver : la réponse au désordre numérique » et en insistant sur la nécessaire qualification des données en amont.
Sans donner un compte rendu de chaque intervention, je voudrais souligner quelques points forts des débats très intéressants sur les tenants et aboutissants des projets d’archivage de données RH et comptables produites au sein d’ERP.
L’archivage : un sujet d’attention croissant
Xavier Leclerc, co-fondateur et vice-président de l’AFCDP, a souligné que, dans le contexte de la réglementation Informatique et Libertés, la question de la durée de conservation et de l’archivage constituait une des problématiques les plus importantes et surtout la plus complexe à mettre en oeuvre.
Emmanuel Ruez, d’Orange, a fait remarquer de son côté que l’archivage devient de plus en plus mature et peut prendre le pas sur d’autres projets.
L’événement déclencheur de l’archivage
Dans les projets présentés, on voit que les situations sont variées avec un volet réglementaire prédominant.
Pour telle entreprise de service, c’est d’abord une question de volumétrie : les données doivent être migrées sur un nouvel outil et il est impératif de maîtriser les volumes pour des raisons de coûts ;
[protected]
la migration impose un archivage et une purge, dans le respect de la réglementation. Les prestataires qui organisent cette opération doivent avant tout proposer une méthodologie qui rassure le client.
Dans une autre entreprise, industrielle et internationale, la volumétrie n’est pas un problème ; le point sensible est la réglementation et les durées légales de conservation hétérogènes. La question-clé se situe en amont : déterminer ce qu’il faut archiver ou pas. Sur ce plan la communication entre la DSI et métiers n’est pas toujours facile, d’autant que les métiers ne veulent pas investir tous les ans dans une opération d’archivage. Pourtant, rien ne vaut un archivage régulier. L’idée est donc de modéliser au mieux les données pour fluidifier la gestion de leur cycle de vie.
Il y a des événements, par exemple les fusions-acquisitions, qui renforcent le besoin de maîtriser les données des ERP des sociétés rachetées parfois sur une décennie ou deux.
On a aussi le cas où le métier (par exemple la comptabilité) est plus demandeur d’archivage que la DSI.
Base de production versus base archives
La base archives est constituée par des données déportées de production. Cette base archives doit être maintenue ; l’archivage n’est pas une opération « one shot » !. Il faut considérer totu le cycle de vie de la donnée. La question se pose de la modification des tables de la base de production : faut-il reporter ces modifications dans la base archives ? Tout dépend de la nature des modifications ; certaines métadonnées des données archivées sont modifiables, d’autres pas ; l’exigence est de ne pas modifier le sens des données et de permettre de restituer l’information telle qu’elle était lors de l’archivage (voir ce que dit sur le sujet la norme européenne sur l’archivage électronique MoReq2).
Faut-il accéder à la base archives à partir de la base de production ou directement ? C’est une question de coût (format de stockage et lourdeur de gestion) et d’organisation (gérer des habilitations aux deux bases).
Volumétrie et coûts
Les volumes sont importants du fait de la croissance des données liées à l’activité mais aussi à cause des migrations, des bases récupérées lors des fusions-acquisitions. Il faut aussi compter avec les bases de préproduction et les bases de secours. Avec des exigences de conservation de 30 ou 50 ans (conservation sécurisée et pérenne), on voit les volumes croître de manière vertigineuse.
Plusieurs intervenants soulignent l’augmentation du coût des systèmes non actifs : on migre sans reprise des données mais on ne détruit pas. On entasse (j’ai entendu l’expression : les cimetières d’applications).
On ne peut continuer de passer son temps à acheter du disque de stockage ! Il faut donc archiver (les données et le modèles des données) et purger. Or, si on gère dès le départ le cycle de vie et la volumétrie, on atteint des résultats satisfaisants.
L’expérience montre qu’il est plus sécurisant d’archiver que de ne rien faire, car le coût du Go archivé est bien plus faible que le coût du Go de production. Et finalement, on arrive à démontrer qu’archiver n’est pas si compliqué.
Qualifier les données
Il faut parfois un développement spécifique des progiciels pour permettre ou faciliter l’archivage. Cela suppose de connaître les exigences de conservation.
Deux questions sont adressées aux métiers : au bout de combien de mois on doit archiver ? Et au bout de combien de mois on doit purger ?
La durée de conservation est une question délicate car il n’existe pas de durée légale de conservation pour toutes les données. C’est souvent une évaluation du risque, dans le contexte réglementaire mais au sein de chaque entreprise, qui permet de définir la durée. Il faut aussi prendre en compte le fait que les entreprises publiques sont soumises à une obligation d’archivage historique.
Par exemple, les données pouvant servir de preuve ou de témoignage pour une procédure contentieuse liée à une maladie contractée sur le lieu de travail peuvent/doivent être conservées pendant plusieurs décennies : le délai de prise en charge des soins par la sécurité sociale peut donner une indication (50 ans aujourd’hui pour les maladies liées au nucléaire) mais une entreprise peut décider plus ou moins longtemps. C’est une évaluation du risque, ce qui suppose de bien identifier et bien qualifier les données.
Suppression des données
Autre question, celle de la suppression des données à échéance de la durée de conservation. La destruction des données n’est pas toujours possible et la réponse pratique est parfois de supprimer l’accès à ces données, voire de les anonymiser. Il se pose alors d’autres questions :
- si les données ne sont pas détruites, l’entreprise continue-t-elle de payer leur stockage ?
- l’entreprise qui a demandé la destruction des données est-elle toujours considérée comme leur propriétaire ?
- comment l’entreprise effectue-t-elle l’audit de la conservation des données chez son hébergeur ?
- les autorités judiciaires y ont-elles accès ?
De ce point de vue les notions d’archivage courant et d’archivage intermédiaire (vocabulaire des Archives de France et de la CNIL) ne sont pas très claires. La première question est la valeur de la donnée (qui trace un acte engageant ou pas) et non le fait qu’elle soit active ou non active (ce qui constitue la seconde question).
Voilà de quoi alimenter d’autres rencontres….
[/protected]