Traiter les archives numériques
Classer des archives numériques : pratiques, difficultés et objectifs
Le traitement d’un fonds d’archives numérique suppose, comme pour les archives papiers, des pratiques établies permettant de respecter les réglementations en vigueur. Ces méthodes, bien qu’elles doivent être adaptées en fonction des cas, restent sensiblement les mêmes et permettent d’établir de nombreuses similitudes avec la méthodologie de classement d’un fonds papier.
Le classement d’archives numériques fait apparaitre en filigrane les futurs défis inhérents à la multiplication des procédures, totalement ou partiellement dématérialisées, et à l’augmentation exponentielle de la production documentaire sous format numérique dans les entreprises et les administrations. A partir des missions réalisées pour le Syndicat Intercommunal d’Energies de la Marne (SIEM51) et pour les communes de Cère et Garein (40), passons en vue les pratiques, les difficultés et les objectifs du traitement d’archives numériques.
L’audit
Comme pour un classement papier, le classement d’un fonds numérique induit plusieurs étapes préalables permettant d’identifier les spécificités du fonds et le volume de données concernées. Cette étape d’audit s’apparente à une étape de récolement impliquant l’utilisation de plusieurs logiciels tels que Windirstat, Archifiltre et Alldup pour pouvoir analyser les profondeurs d’arborescence, les espaces serveurs concernés et la quantité de doublons à éliminer.
Le récolement fait apparaitre des problématiques, notamment de formats, les logiciels tels qu’Archifiltre et Alldup ne permettent pas l’analyse des dossiers compressés type .ZIP et .RAR ce qui peut rapidement entrainer une sous-estimation du temps de classement nécessaire et donc des coûts engendrés par la mobilisation d’un salarié sur une période plus longue que prévue. Ces dossiers compressés nécessitent un traitement préalable impliquant leur ouverture systématique pour pouvoir établir le volume de données réellement concerné.
Cette étape concerne toutes les entités, et tous les types de documents : de la simple sauvegarde, à la conservation hors durée d’utilité administrative (DUA) de plis de marchés publics en allant jusqu’aux photos de famille d’un employé.
Le tri et le classement
Après cette étape de récolement, plusieurs cas de figure apparaissent : réorganiser les données selon le plan type établi par le Service Inter-ministériel des Archives de France (SIAF) ou réorganiser les données selon les compétences de la structure et ses spécificités, qui se transformeront en sous-série. Par exemple, une commune des Landes va être impliquée dans les différentes actions liées aux tempêtes sévissant régulièrement sur ce territoire ainsi qu’à la gestion des forêts. Ses compétences seront visibles jusque dans la réorganisation de ses données.
Une fois ce plan de classement établi et validé avec toutes les parties prenantes du projet, l’étape de tri peut débuter.
Le tri d’archives numériques suit la même méthodologie que le tri papier. Si quelques logiciels permettent l’identification rapide de doublons, l’étape de tri est fastidieuse et nécessite souvent d’ouvrir systématiquement les fichiers pour établir leur utilité administrative et leur délai de conservation. En somme, comme pour les archives papier, les documents à éliminer sont mis de côté, puis répertoriés dans un bordereau d’élimination qui sera transmis au service d’archives compétent pour validation.
Le renommage
Le renommage des fichiers et répertoires sont des points particulièrement importants d’un classement : ils permettent l’identification rapide du contenu et de la version pour permettre un tri et un classement plus rapide et intelligible. Lors de cette étape on veille à proscrire l’utilisation de tous les caractères spéciaux, surtout les accents. Ces consignes peuvent être réunies dans une charte de nommage partagée à l’ensemble des utilisateurs. Pour mettre en place ces pratiques, l’utilisation d’Ant Renamer permet la suppression et le remplacement en masse de caractères interdits et facilite le travail sans pour autant remplacer l’archiviste dans l’identification du contenu.
Le stockage
Au cours de l’identification et du classement, les espaces de stockage ont leur importance, au-delà du respect de la règlementation RGPD, l’utilisation de certains services comme la suite Office 365 pose problème. L’intégration des SharePoint, attractifs et clef en main, à la suite bureautique office entraine deux choses :
– Au niveau des métadonnées des documents, aucun logiciel métier ne nous permet d’identifier des doublons venant d’un serveur SharePoint, leurs empreintes et dates de création et de modification semblent être altérées.
– Un autre volet de ce problème est juridique, si les données des utilisateurs sont bien hébergées en Europe, elles sont répliquées aux Etats-Unis sur les serveurs Microsoft comme « copie de sécurité ». Mais cette « copie de sécurité » fait partie des données incluses dans la portée du Cloud Act, incompatible avec le RGPD européen.
– Enfin, le dernier obstacle est technique et concerne le rapatriement des données depuis des serveurs Microsoft, qui peut prendre des jours voire des semaines en fonction du volume de données à transférer.
La sensibilisation
Une fois le tri puis les classements réalisés sur des espaces de stockage définis, il est important de sensibiliser les agents ou les salariés de la structure concernée. Dans le cas des petites communes, les référents archives sont souvent les secrétaires de mairie qui font face aux flux documentaires constants des administrations et des usagers. Pour les structures plus importantes comme les syndicats intercommunaux, plusieurs référents archives sont nommés en fonction des différentes compétences exercées. L’organisation d’une formation pour les référents archives est impérative et permet de pérenniser les nouvelles pratiques qui entourent le nouveau plan de classement.
A partir d’une certaine échelle, il est aussi pertinent d’organiser une formation plus globale de l’ensemble des agents ou des salariés pour sensibiliser à la nouvelle organisation des arborescences et des lieux de stockage mais surtout du nommage des fichiers et répertoires qui sont la première clef de recherche utilisée par les utilisateurs pour retrouver les documents de travail. Avec en moyenne 7h perdues par semaine à chercher ses documents, la bonne méthode de nommage est non seulement bénéfique pour la fluidité dans la transmission des informations mais aussi pour la santé financière de l’entreprise, la collectivité ou l’administration concernée.