Aller au contenu principal

Gestion des données de recherche

La Bibliothèque de l'Université Laval offre du soutien aux membres de la communauté universitaire pour faciliter la gestion de données de recherche. Vous trouverez sur cette page des informations utiles pouvant vous aider à rédiger un plan de gestion des données et à bien documenter ces dernières.

Rédiger un plan de gestion des données

Un plan de gestion des données est un document formel à concevoir dès le début d’un projet de recherche. Ce plan vise à expliquer la façon dont les données, les logiciels et autres éléments créés seront gérés tout au long du cycle de vie du projet. Il s'agit d'un document évolutif devant être entretenu et mis à jour pendant la durée entière du projet de recherche.

Pourquoi rédiger un plan de gestion de données (PGD)

  1. La rédaction d’un PGD doit accompagner certaines demandes de subvention.
  2. Le PGD permet d’estimer les coûts de la gestion de données de recherche, et de préciser dans une demande de subvention un montant en conséquence.
  3. La rédaction d'un PGD facilite le dépôt de données, obligatoire ou fortement recommandé lors de la publication dans certaines revues (ex.: SAGE, Wiley, Elsevier, etc.).
  4. Un PGD permet de réduire le coût de la recherche en augmentant l’efficience du traitement des données.
  5. Un PGD permet d’isoler les données de recherche du reste de la planification du projet. Celui-ci clarifie aussi, par rapport aux données, les rôles et responsabilités de toutes les personnes contributrices au projet.
  6. La rédaction d’un PGD permet d’anticiper les problèmes juridiques, éthiques et techniques, et de réfléchir à la sécurité des données personnelles, sensibles ou stratégiques.
  7. Un PGD permet de définir les forces et faiblesses des pratiques de gestion de données dans une recherche.
  8. Les divers éléments d’information dans un PGD visent la transparence, l’intégrité scientifique et la reproductibilité des recherches.
  9. Un PGD facilite le partage de données au sein d’un collectif de projet.
  10. La rédaction d’un PGD offre l’occasion de se mettre à jour quant aux standards et aux nouveautés dans une discipline.

Assistant PGD

L’Université Laval a choisi d’adopter l’Assistant PGD de l’Alliance de recherche numérique du Canada (ci-après nommé Alliance). Il est conseillé aux membres de la communauté de recherche de l’utiliser pour élaborer leur plan de gestion des données (PGD).

L’Assistant PGD est un outil de gestion de données en ligne bilingue, de portée nationale. Disponible gratuitement pour la communauté de recherche, cet outil permet d'élaborer un PGD à partir d'une série de questions clés sur la gestion de données. Pour en savoir plus, consultez le tutoriel d’introduction de la Bibliothèque «Plan de gestion des données – Se familiariser avec l’Assistant PGD», disponible sur sa chaine YouTube.

Accédez à l’Assistant PGD (Welcome to DMP Assistant).

L'Alliance a développé des modèles et quelques exemples de PGD. Vous les trouverez sur le site Web l’Alliance, menu Apprentissage et ressources, section Ressources de formation.

L’Université Laval a également élaboré et mis en ligne un modèle de PGD que vous pouvez utiliser directement dans l’Assistant PGD. Pour y accéder, lors de la création de votre plan de gestion, choisissez «Université Laval» comme organisme de recherche principal. L’option «Université Laval – modèle institutionnel» apparaîtra dans la liste des modèles de PGD.

Conseils de rédaction d’un PGD

  • Utilisez un outil de rédaction de PGD en provenance du pays où sera soumise la demande de subvention (voir une liste sommaire de ces outils à la section suivante, Ressources sur les PGD).
  • Dès le début de votre rédaction, inscrivez les informations que vous avez en main, et précisez-les au fur et mesure qu’elles évoluent.
  • Répondez à toutes les questions; si elles ne s'appliquent pas à votre projet, indiquez-le.
  • Évitez d’utiliser un jargon propre à une discipline. 
  • Justifiez vos décisions (ex.: si vous utilisez un format propriétaire, spécifiez vos raisons). 
  • Définissez les acronymes, au moins une fois par section. 
  • Maintenez votre PGD à jour pendant toute la durée de votre projet.
  • Ajustez votre PGD à son objectif : demande de financement ou soutien au fonctionnement d’un projet de recherche.

Comment créer un plan de gestion des données efficace (PDF), Guide Portage 

Ressources sur les PGD

D’autres outils et modèles peuvent être utilisés, en fonction des exigences de l’organisme subventionnaire ou de la discipline pour laquelle les données sont générées.

La communauté de recherche est encouragée à se prévaloir des formations et des services offerts par la Bibliothèque. Pour obtenir de l’aide, écrivez à gdr@bibl.ulaval.ca.

Ressources complémentaires

Décrire ses données

Une donnée en elle-même n’est pas intelligible. Il faut la décrire et la documenter adéquatement pour la rendre compréhensible. Les métadonnées sont des renseignements qui décrivent les données selon les meilleures pratiques de la communauté

Nommage et versionnage

L’un des aspects d’une gestion efficace de documents et de fichiers numériques consiste à les nommer et les classer de manière adéquate afin d’en faciliter le repérage. Pour obtenir quelques conseils sur le nommage de fichiers, consultez de document de la Bibliothèque «Nommage des fichiers numériques» (PDF).

Il est aussi souhaitable d’indiquer avec précision quelle version d'un ensemble de données est à la base des résultats publiés dans un article, afin d’assurer la fiabilité et la reproductibilité d’une recherche. Les ressources suivantes aident à bien versionner les données.

Documents d’accompagnement

Fichier LISEZ-MOI 

Un fichier LISEZ-MOI (README) fournit des informations à propos d’un fichier ou d’un jeu de données. Il permet d’assurer la pérennité de l’interprétation correcte des données par toutes les personnes qui les consulteront.

Les fichiers LISEZ-MOI comprennent généralement les informations suivantes.

  • Le contexte de production des données
  • La liste des fichiers présents dans l’ensemble de données
  • La description du contenu des fichiers
  • Les instructions d'exploitation des fichiers
  • La description des méthodes de collecte et d’analyse des données
  • Les logiciels (incluant leur version) et les systèmes d’exploitation utilisés pour la collecte et la transformation
  • Le format des fichiers
  • Les informations sur les conditions de réutilisation des données
  • La citation recommandée du jeu de données

Les fichiers LISEZ-MOI doivent être enregistrés sous forme de fichier texte (.txt) et devraient utiliser une numérotation forcée dans le nom du fichier (par exemple: 00_Lisez-Moi.txt) ou des caractères en majuscule.

Dictionnaires des données 

Les dictionnaires de données comprennent la description des variables et des unités de mesure, ainsi que la définition des abréviations employées dans les fichiers de données.

Ces dictionnaires de données varient considérablement en termes de qualité et de quantité d'informations présentées, mais devraient inclure les éléments suivants.  

  • Les informations sur la structure, le contenu et la mise en page d'un fichier de données
  • Les définitions de différents types d'enregistrement 
  • Les codes de réponse pour chaque variable 
  • Les codes utilisés pour indiquer la non-réponse et les données manquantes (important: évitez les cases vides!)
  • Les questions exactes utilisées dans une enquête, et les séquences pour les questions ignorées
  • Les fréquences de réponse 

Voici des ressources pour vous guider lors de la création d’un dictionnaire de données.

Cahier de laboratoire
Le cahier de laboratoire sert à noter de façon quotidienne la méthodologie de recherche, les calculs et les résultats. Il favorise la traçabilité, la publication et le partage des données de recherche.

Voici des lignes directrices et des guides pour aider à la conception et à l’utilisation des cahiers de laboratoire.

Vocabulaires contrôlés

Les vocabulaires contrôlés normalisent l’indexation des documents, ce qui facilite la recherche et le repérage de l’information. On s’assure ainsi que les données portant sur un même sujet seront décrites avec les mêmes termes préférentiels.

  • Les termes utilisés sont reconnus, normalisés et validés par un groupe. 
  • Les définitions des termes sont sans ambiguïté et non redondantes.   

Thésaurus
Le thésaurus est une liste des termes choisis pour représenter des concepts. Ils sont liés entre eux par des relations sémantiques. Voici des exemples de thésaurus:

Ressources sur la documentation et les métadonnées

Vous pouvez consulter ces quelques ressources pour en savoir plus sur la gestion des données de recherche et les métadonnées.

Schémas de métadonnées

Les schémas de métadonnées, qui facilitent le repérage et la classification de données, regroupent des éléments servant à décrire une ressource pour un domaine spécialisé. Pour chaque élément sont spécifiés:

  • le nom;
  • la sémantique (la signification de l'élément).

Parfois, les schémas indiquent:

  • les règles de contenu (comment celui-ci doit être formulé);
  • les règles de représentation (ex.: les règles de capitalisation);
  • les valeurs d'élément autorisées (ex.: utilisation d'un vocabulaire contrôlé).

Pour en savoir plus sur les notions de base, écoutez la vidéo «Les schémas de métadonnées» produite par DoRANum.

Voici des exemples de schéma de métadonnées. 

  • Dublin Core: multidisciplinaire avec éléments de base
  • Darwin Core: extension du Dublin Core, utilisé pour informatique et biodiversité
  • ISO 19115: standard ISO pour données géospatiales 
  • DDI: utilisé pour sciences humaines et sociales
  • ISA-Tab: utilisé pour comprendre les objectifs et les moyens employés lors d’une expérience (ex.: caractéristiques de l'échantillon, technologies, type de mesures)
  • LOM (Learning Object Metadata): utilisé pour la description de ressources d’enseignement et d’apprentissage
  • VRA Core: utilisé pour la description d’œuvres visuelles et des images les documentant
  • TEI: utilisé pour la description de textes numériques

Le format XML est à privilégier lors du partage des métadonnées. Il assure une interopérabilité avec les divers autres systèmes qui pourront en extraire le contenu. Si vous désirez explorer plus en profondeur les schémas de métadonnées ou en créer un, nous vous recommandons fortement de contacter les spécialistes de la Bibliothèque.

Principes FAIR

Un moyen efficace d’assurer une bonne gestion de données de recherche est de rendre ces dernières «FAIR» (faciles à trouver, accessibles, interopérables et réutilisables).  Plusieurs ressources expliquent les principes FAIR. Voici deux sites Web qui fournissent des trucs et conseils pour adhérer aux principes FAIR et qui permettent d’évaluer un jeu de données.

Services de la Bibliothèque

Les services offerts par la Bibliothèque font la promotion des bonnes pratiques liées à la gestion des données de recherche. À la demande, des formations sur mesure peuvent être données pour une discipline en particulier. Un service de révision des plans de gestion des données est offert à la communauté de l’Université Laval. Pour une révision dans les périodes de pointe, prévoir un délai de trois à quatre jours svp. Un soutien personnalisé est aussi disponible pour les questions suivantes.

Pour toute question, écrivez à gdr@bibl.ulaval.ca.

Autres sources d’informations liées à la GDR

Pour obtenir des informations sur la politique fédérale des organismes subventionnaires et les principes qui sous-tendent la GDR au Canada, sur l’écosystème de la recherche à l’Université Laval, ainsi que sur le dépôt de données, visitez le site Web du Vice-rectorat à la recherche, à la création et à l'innovation de l’Université Laval (VRRCI). Vous y trouverez aussi une foire aux questions sur la GDR.

Autre sujet d’intérêt: les protections s’appliquant aux données. Pour en savoir plus sur le sujet, consultez la section Propriété des données de recherche sur le site Web du Bureau du droit d’auteur de l’Université Laval (BDA).

Capsules de sensibilisation à la GDR

Vous trouverez sur la chaine YouTube de la Bibliothèque les cinq premières capsules d’une série ludique couvrant divers thèmes liés à la GDR: l’accès, la collaboration, les métadonnées et la documentation, la préservation et la réutilisation des données de recherche

Ces courtes capsules animées ont été conçues par des membres du groupe de travail sur la gestion des données de recherche du Partenariat des bibliothèques universitaires du Québec (PBUQ).

Joindre l'équipe de la gestion des données de recherche