Pour connaitre les consignes en vigueur, consultez la page COVID-19 sur le site Web de l’Université Laval.

Gestion des données de recherche

La Bibliothèque de l'Université Laval offre du soutien aux membres de la communauté universitaire pour faciliter la gestion de données de recherche. Vous trouverez sur cette page des informations utiles pouvant vous aider à rédiger un plan de gestion de données et à bien documenter ces dernières.

Rédiger un plan de gestion de données

Un plan de gestion de données est un document formel à concevoir dès le début d’un projet de recherche. Ce plan vise à expliquer la façon dont les données, les logiciels et autres éléments créés seront gérés tout au long du cycle de vie du projet. Il s'agit d'un document évolutif devant être entretenu et mis à jour pendant la durée entière du projet de recherche.

Pourquoi rédiger un plan de gestion de données (PGD)

  1. La rédaction d’un PGD doit accompagner certaines demandes de subvention.
  2. Le PGD permet d’estimer les coûts de la gestion de données de recherche, et de préciser dans une demande de subvention un montant en conséquence.
  3. La rédaction d'un PGD facilite le dépôt de données, obligatoire ou fortement recommandé lors de la publication dans certaines revues (ex.: SAGE, Wiley, Elsevier, etc.).
  4. Un PGD permet de réduire le coût de la recherche en augmentant l’efficience du traitement des données.
  5. Un PGD permet d’isoler les données de recherche du reste de la planification du projet. Celui-ci clarifie aussi, par rapport aux données, les rôles et responsabilités de toutes les personnes contributrices au projet.
  6. La rédaction d’un PGD permet d’anticiper les problèmes juridiques, éthiques et techniques, et de réfléchir à la sécurité des données personnelles, sensibles ou stratégiques.
  7. Un PGD permet de définir les forces et faiblesses des pratiques de gestion de données dans une recherche.
  8. Les divers éléments d’information dans un PGD visent la transparence, l’intégrité scientifique et la reproductibilité des recherches.
  9. Un PGD facilite le partage de données au sein d’un collectif de projet.
  10. La rédaction d’un PGD offre l’occasion de se mettre à jour quant aux standards et aux nouveautés dans une discipline.

Assistant PGD de Portage

L’Université Laval a choisi d’adopter l’Assistant PGD du réseau Portage. Les membres de la communauté de recherche sont encouragés à l’utiliser pour élaborer leur plan de gestion de données (PGD).

L’Assistant PGD est un outil de gestion de données en ligne bilingue, de portée nationale. Disponible gratuitement pour la communauté de recherche, cet outil permet d'élaborer un PGD à partir d'une série de questions clés sur la gestion de données. Pour en savoir plus, consultez le tutoriel d’introduction de la Bibliothèque «Plan de gestion de données – Se familiariser avec l’Assistant PGD», disponible sur sa chaine YouTube.

Accédez à l’Assistant PGD (Welcome to DMP Assistant).

Le réseau Portage a développé des modèles et quelques exemples de PGD. Vous les trouverez sur le site Web de Portage, menu Outils et ressources, section Ressources de formation de Portage

Conseils de rédaction d’un PGD

  • Utilisez un outil de rédaction de PGD en provenance du pays où sera soumise la demande de subvention (voir une liste sommaire de ces outils à la section suivante, Ressources sur les PGD).
  • Dès le début de votre rédaction, inscrivez les informations que vous avez en main, et précisez-les au fur et mesure qu’elles évoluent.
  • Répondez à toutes les questions; si elles ne s'appliquent pas à votre projet, indiquez-le.
  • Évitez d’utiliser un jargon propre à une discipline. 
  • Justifiez vos décisions (ex.: si vous utilisez un format propriétaire, spécifiez vos raisons). 
  • Définissez les acronymes, au moins une fois par section. 
  • Maintenez votre PGD à jour pendant toute la durée de votre projet. 

Comment créer un plan de gestion des données efficace (PDF), Guide Portage 

Ressources sur les PGD

D’autres outils et modèles peuvent être utilisés, en fonction des exigences de l’organisme subventionnaire ou de la discipline pour laquelle les données sont générées.

La communauté de recherche est encouragée à se prévaloir des formations et des services offerts par la Bibliothèque. Pour obtenir de l’aide, écrivez à gdr@bibl.ulaval.ca.

Assistant PGD en provenance d’autres pays

Exemple de plans de gestion de données 

Ressources complémentaires

Documenter ses données

Une donnée en elle-même n’est pas intelligible. Il faut la décrire et la documenter adéquatement pour la rendre compréhensible. 

Vocabulaires contrôlés

Les vocabulaires contrôlés normalisent l’indexation des documents, ce qui facilite la recherche et le repérage de l’information. On s’assure ainsi que les données portant sur un même sujet seront décrites avec les mêmes termes préférentiels.

  • Les termes utilisés sont reconnus, normalisés et validés par un groupe. 
  • Les définitions des termes sont sans ambiguïté et non redondantes.   

Thésaurus
Le thésaurus est une liste des termes choisis pour représenter des concepts. Ils sont liés entre eux par des relations sémantiques. Voici des exemples de thésaurus:

Métadonnées

Les données de recherche sont rarement explicites, c'est pourquoi elles doivent être accompagnées de métadonnées, soit des renseignements qui décrivent les données selon les meilleures pratiques de la communauté.

Schémas de métadonnées

Les schémas de métadonnées, qui facilitent le repérage et la classification de données, regroupent des éléments servant à décrire une ressource pour un domaine spécialisé. Pour chaque élément sont spécifiés:

  • le nom;
  • la sémantique (la signification de l'élément).

Parfois, les schémas indiquent:

  • les règles de contenu (comment celui-ci doit être formulé);
  • les règles de représentation (ex.: les règles de capitalisation);
  • les valeurs d'élément autorisées (ex.: utilisation d'un vocabulaire contrôlé).

Pour en savoir plus sur les notions de base, écoutez la vidéo «Les schémas de métadonnées» produite par DoRANum.

Voici des exemples de schéma de métadonnées. 

  • Dublin Core: multidisciplinaire avec éléments de base
  • Darwin Core: extension du Dublin Core, utilisé pour informatique et biodiversité
  • ISO 19115: standard ISO pour données géospatiales 
  • DDI: utilisé pour sciences humaines et sociales 
  • MARC21: utilisé pour renseignements bibliographiques, autorités, fonds, classification et données sur renseignements communautaires
  • ISA-Tab: utilisé pour comprendre les objectifs et les moyens employés lors d’une expérience (ex.: caractéristiques de l'échantillon, technologies, type de mesures)
  • LOM (Learning Object Metadata): utilisé pour la description de ressources d’enseignement et d’apprentissage
  • VRA Core: utilisé pour la description d’œuvres visuelles et des images les documentant
  • TEI: utilisé pour la description de textes numériques

Le format XML est à privilégier lors du partage des métadonnées. Il assure une interopérabilité avec les divers autres systèmes qui pourront en extraire le contenu. Pour créer un schéma de métadonnées général, utilisez l'outil DataCite Metadata Generator

Documents d’accompagnement

Fichier LISEZ-MOI 

Un fichier LISEZ-MOI (README) fournit des informations à propos d’un fichier ou d’un jeu de données. Il permet d’assurer la pérennité de l’interprétation correcte des données par toutes les personnes qui les consulteront.

Les fichiers LISEZ-MOI comprennent généralement les informations suivantes.

  • Le contexte de production des données
  • La liste des fichiers présents dans l’ensemble de données
  • La description du contenu des fichiers
  • Les instructions d'exploitation des fichiers
  • La description des méthodes de collecte et d’analyse des données
  • Les logiciels (incluant leur version) et les systèmes d’exploitation utilisés pour la collecte et la transformation
  • Le format des fichiers
  • Les informations sur les conditions de réutilisation des données
  • La citation recommandée du jeu de données

Les fichiers LISEZ-MOI doivent être enregistrés sous forme de fichier texte (.txt) et devraient utiliser une numérotation forcée dans le nom du fichier (par exemple: 00_Lisez-Moi.txt) ou des caractères en majuscule.

  • Modèle en anglais: ReadmeTemplate.txt (Cornell University) 
  • Adaptation française: bientôt en ligne

Dictionnaires des données 

Les dictionnaires de données comprennent la description des variables et des unités de mesure, ainsi que la définition des abréviations employées dans les fichiers de données.

Ces dictionnaires de données varient considérablement en termes de qualité et de quantité d'informations présentées, mais devraient inclure les éléments suivants.  

  • Les informations sur la structure, le contenu et la mise en page d'un fichier de données
  • Les définitions de différents types d'enregistrement 
  • Les codes de réponse pour chaque variable 
  • Les codes utilisés pour indiquer la non-réponse et les données manquantes (important: évitez les cases vides!)
  • Les questions exactes utilisées dans une enquête, et les séquences pour les questions ignorées
  • Les fréquences de réponse 

 

Cahier de laboratoire
Le cahier de laboratoire sert à noter de façon quotidienne la méthodologie de recherche, les calculs et les résultats. Il favorise la traçabilité, la publication et le partage des données de recherche.

Voici des lignes directrices et des guides pour aider à la conception et à l’utilisation des cahiers de laboratoire.

Nommage et versionnage

L’un des aspects d’une gestion efficace de documents et de fichiers numériques consiste à les nommer et les classer de manière adéquate afin d’en faciliter le repérage. Pour obtenir quelques conseils sur le nommage de fichiers, consultez de document de la Bibliothèque «Nommage des fichiers numériques» (PDF).

Il est aussi souhaitable d’indiquer avec précision quelle version d'un ensemble de données est à la base des résultats publiés dans un article, afin d’assurer la fiabilité et la reproductibilité d’une recherche. Les ressources suivantes aident à bien versionner les données.

Ressources sur les métadonnées

Un moyen efficace d’assurer une bonne gestion de données de recherche est de rendre ces dernières «FAIR» (faciles à trouver, accessibles, interopérables et réutilisables).  Plusieurs ressources expliquent les principes FAIR. Voici deux sites Web qui fournissent des trucs et conseils pour adhérer aux principes FAIR et qui permettent d’évaluer un jeu de données.

Services de la Bibliothèque

Les services offerts par la Bibliothèque font la promotion des bonnes pratiques liées à la gestion des données de recherche. À la demande, des formations sur mesure peuvent être données pour une discipline en particulier. Un soutien personnalisé est aussi disponible pour les outils suivants.

Pour toute question, écrivez à gdr@bibl.ulaval.ca.

Autres sources d’informations liées à la GDR

Pour obtenir des informations sur la politique fédérale des organismes subventionnaires et les principes qui sous-tendent la GDR au Canada, sur l’écosystème de la recherche à l’Université Laval, ainsi que sur le dépôt de données, visitez le site Web du Vice-rectorat à la recherche, à la création et à l'innovation de l’Université Laval (VRRCI).

Autre sujet d’intérêt: les protections s’appliquant aux données. Pour en savoir plus sur le sujet, consultez la section Propriété des données de recherche sur le site Web du Bureau du droit d’auteur de l’Université Laval (BDA).

Joindre l'équipe de la gestion des données de recherche