FAIR & Open Data

Un certain nombre de raisons encouragent le partage des données de recherche. Ce partage

  • facilite la reproduction et la vérification des expériences et recherches menées ;
  • rend davantage visible les travaux et résultats de recherche ;
  • augmente le nombre de citation des articles scientifiques pour lesquels les données de recherche sont également publiées ;
  • encourage les nouvelles collaborations et nouvelles pistes de recherche ;
  • soutient le principe d’intégrité scientifique ;
  • répond aux exigences de certains bailleurs de fonds et éditeurs scientifiques.

L’UNIL prône une recherche intègre et responsable qui vise à gérer les données de recherche de manière transparente et ouverte, dans les limites du droit et des prescriptions scientifiques en matière d’éthique, de déontologie et du respect des standards en matière de protection de l’individu et de la propriété intellectuelle.

A l'instar de l'Union européenne et de son programme Horizon2020, l'UNIL prône donc une publication des données "as open as possible, as closed as necessary". Cela signifie une ouverture dans les limites du droit et des prescriptions scientifiques en matière d’éthique, de déontologie et du respect des standards en matière de protection de l’individu et de la propriété intellectuelle (voir la Stratégie Open science de l'UNIL).

Open source et code informatique

La notion d'Open source n'est pas à confondre avec l'Open research Data.

L'Open source est un moyen transparent de développer des logiciels et de les rendre librement accessibles à d'autres utilisateurs. Le code source d'un programme est mis à la disposition des individus pour qu'ils puissent y accéder, le modifier et le réutiliser, contrairement aux logiciels propriétaires.

Pour le partage et le dépôt du code informatique, l'UNIL recommande la plateforme suisse non-commerciale c4science, une infrastructure pour la co-création, conservation, partage et tests de codes scientifiques. Disponible pour l'ensemble de la communauté universitaire suisse et accessible aux collaborateur·trice·s externes, cette plateforme est hébergée sur SWITCHengines, gérée par l'EPFL-SCITAS, créée via EnhanceR.

Pour plus d'infomation, vous référer aux pages dédiées du Digital Curation Center (DCC).

De manière générales, les principes FAIR (Wilkinson et al., 2016) concernent l'ouverture, la communication, l'appropriation et la réutilisation des données de recherche.

Pour le Fonds national de la recherche suisse et l'UNIL, les données doivent donc être gérées selon les principes FAIR. Ces principes permettent de s'assurer qu'un ensemble de données puisse être facile à trouver (Findable), qu'il soit accessible (Accessible), interopérable (Interoperable) et réutilisable (Re-usable).

Télécharger les explications des principes FAIR promus par le FNS.

Les aspects Findable et Accessible s'intéressent principalement à l'endroit où les données sont déposées. Les considérations importantes à prendre en compte comprennent la disponibilité de DOI persistants, des métadonnées, du suivi de la réutilisation des données, des licences, du contrôle d'accès et de la disponibilité à long terme (conservation pérenne).

Les aspects Interoperable et Re-usable soulignent l'importance de réfléchir au format des données (propriétaire vs. ouvert) et à la façon dont ces formats pourraient changer à l'avenir, ainsi qu'à l'interopérabilité (ouverture via API) du dépôt choisi vers d'autres méta-dépôts internationaux ou disciplinaires, ou d'autres outils de mise en valeur. L'aspect d'une documentation détaillée entre également en compte dans la réutilisabilité des données ainsi que du code.

15 principes ont été édictés par FORCE11, une comunauté regroupant des chercheurs, bibliothécaires, archivistes, responsables de publications scientifiques, instituts de financement, etc. Ces principes se regroupent sous les 4 principes généraux : Facile à trouver, Accessible, Interopérable et Réutilisable.

Sur la base des 15 principes ci-dessus, un ensemble de 14 paramètres ont été définis pour quantifier les niveaux de "FAIRness". Ces derniers développements sont disponibles sur le site GO-FAIR.

Une bonne gestion des données est un moyen de soutenir les principes FAIR.

En pratique, le DMP est l'instrument naturel de la "FAIRification" de la recherche, en mettant en place la découverte des données, leur accessibilité, leur interopérabilité et leur réutilisation.

Why open and share your research data ?

There are a number of reasons for sharing research data. This sharing :

  • facilitates the reproduction and verification of experiments and research carried out ;
  • makes research work and results more visible ;
  • increases the number of citations of scientific articles for which research data is also published;
  • encourages new collaborations and new avenues of research ;
  • supports the principle of scientific integrity ;
  • meets the requirements of some scientific funders and publishers.

UNIL promotes honest and responsible research that aims to manage research data in a transparent and open manner, within the limits of the law and scientific requirements in terms of ethics, deontology and compliance with standards for the protection of the individual and intellectual property.

Following the example of the European Union and its Horizon2020 programme, UNIL therefore advocates the publication of data "as open as possible, as closed as necessary".

Open source

The notion of Open source is not to be confused with Open research Data.

Open source is a transparent way to develop software and make it freely accessible to other users. The source code of a program is made available to individuals so that they can access, modify and reuse it, unlike proprietary software.

For more information, please refer to the dedicated pages of the Digital Curation Center (DCC).

FAIR data principles

In general, the FAIR principles relate to openness, communication, appropriation and reuse of research data. Data need not necessarily be accessible or open to be FAIR, but openness makes sense through the FAIR principles (originally published in 2016 : Wilkinson et al., 2016).

For the Swiss National Research Foundation, the data are managed according to the FAIR principles. These principles ensure that a data set can be easily found (Findable), accessible (Accessible), interoperable (Interoperable) and reusable (Re-usable).

Download the explanations of the FAIR principles promoted by the SNSF.

The Findable and Accessible aspects focus mainly on where the data are stored. Important considerations to be taken into account include the availability of persistent DOIs, metadata, data reuse tracking, licensing, access control and long-term availability (long-term preservation).

The Interoperable and Re-usable aspects highlight the importance of considering the data format (proprietary vs. open) and how these formats may change in the future, as well as the connectivity (opening via API) of the chosen repository to other international or disciplinary meta repositories, or other enhancement tools. The aspect of detailed documentation is also a factor in the reusability of data and code.

15 principles have been laid down by FORCE11, a community of researchers, librarians, archivists, managers of scientific publications, funding institutes, etc. These principles are grouped under the 4 general principles: Easy to find, Accessible, Interoperable and Reusable.

On the basis of the 15 principles above, a set of 14 parameters have been defined to quantify the levels of FAIRness. These latest developments are available on the GO-FAIR website.

Good data management is one way to support the FAIR principles.

In practice, DMP is the natural instrument for the "FAIRification" of research, implementing data discovery, accessibility, interoperability and reuse.

Follow us:    

Explanations of the FAIR principles by the SNSF

Did you know ?

The European Commission has estimated the annual cost of not having FAIR data at a minimum of €10.2 billion per year !

Cost-benefit analysis for FAIR research data, 2019

Make scientific data FAIR !

All disciplines should follow geoscience and require best practices for publishing and sharing data....

Read this article published in Nature in June 2019.

Data Management Expert Guide

Data_Management_Expert_Guide_-_CESSDA_TRAINING.jpg

Find many resources on the Data Management Expert Guide to help you in the FAIR management of your data.