Un plan de gestion des données, pour quoi faire ?
Favoriser l’ouverture des données de recherche
Les plans de gestion de données (PGD) ou Data Management Plans (DMP) favorisent la structuration et l’ouverture des données de recherche. C’est dans le cadre de sa politique science ouverte (en lien avec le plan national pour la science ouverte), que l’Inserm a élaboré son modèle de plan de gestion des données. L’Institut contribuant ainsi au mouvement international d’ouverture des données de la recherche.
Répondre aux demandes des financeurs
Les PGD sont des outils destinés à faciliter et améliorer la gestion des données de recherche. De nombreux financeurs ont rendu leur rédaction obligatoire. L’ANR et la Commission européenne, notamment, listent les rubriques indispensables à la composition d’un PGD. Le modèle proposé par l’Inserm est conforme aux exigences des financeurs tout en tenant compte des spécificités de l’Institut.
Pérenniser le patrimoine informationnel
Les plans de gestion des données permettent de pérenniser le patrimoine informationnel d’une structure de recherche. En ce sens, les PGD sont des outils majeurs pour rendre les données trouvables, accessibles, interopérables et réutilisables (principes FAIR).
De quelles informations s’agit-il ?
Décrire les données du projet
Les plans de gestion des données servent à décrire les données utilisées, manipulées et/ou produites dans le cadre d’un projet de recherche. Ces informations relèvent des domaines :
- Technique (volumétrie, format, infrastructures…),
- Scientifique (mots clés, utilisation et utilité des données, description…)
- Juridique (restrictions d’accès, ouverture, durée de conservation…).
Le PGD renseigne, en outre, sur les propriétaires de ces données et sur les promoteurs des études.
Des informations utiles tout au long du projet
- En début de projet, le PGD permet de se poser les bonnes questions concernant notamment : le type, le format, la volumétrie, le stockage, la durée de conservation, ou les utilisateurs de ces données.
- En cours de projet, maintenir le PGD permet d’identifier rapidement les écarts et d’agir en conséquence. Ai-je besoin de plus d’espace de stockage que prévu ? Mes données sont-elles utilisées comme elles devraient ?
- En fin de projet, le PGD permet d’augmenter les chances que les données produites dans le cadre du projet soient utilisées et valorisées.
Qui fait quoi et quand ?
Le coordonnateur et les équipes associées
Le coordonnateur du projet et les équipes associées remplissent le PGD. Selon le cadre du projet et l’organisme financeur, le plan est soumis en complément des rapports d’activités et des rapports et financiers définis dans le règlement de subventions. Il est transmis par le coordonnateur à l’institution.
Respecter les bonnes pratiques
La première version met en évidence une gestion des données conforme aux bonnes pratiques de collecte, d’organisation, de stockage, de documentation… L’équipe s’appuie, tant que possible, sur les standards des disciplines concernées, dans le respect d’un cadre éthique et juridique.
Dans les six premiers mois, puis tout au long du projet
Le coordonnateur soumet comme livrable une première version du PGD dans les six premiers mois du projet. Puis, il met à jour le PGD chaque fois que des modifications significatives interviennent durant le projet. Bien sûr, en début de projet, certaines questions (notamment pour les modalités de partage) ne sont pas encore été traitées par le collectif du projet. Ces informations pourront figurer dans les versions ultérieures.
Le modèle de plan de gestion des données de l’Inserm
Le modèle proposé par l’Inserm (en français et en anglais) contient des recommandations et des exemples de réponses pour aider les équipes de recherche dans la rédaction de ce document.
Des notes apportent des explications sur les attendus, les bonnes pratiques, et proposent des ressources et des outils. Un ou plusieurs exemples de réponse viennent compléter cette note.
Ces exemples ne doivent, en aucun cas, être copiés-collés. La réponse doit être adaptée au projet pour lequel le PGD est rédigé.
Quand un projet comporte plusieurs jeux de données, il faut identifier chaque jeu dans la section Produit de recherche (en sélectionnant le type Dataset). L’onglet Jeux de données est ensuite automatiquement subdivisé en autant de sous-onglets qu’il y a de produits de recherche (tout comme l’onglet Informations générales sur les données) pour permettre une description détaillée de chaque jeu de données.