Research data in your thesis: recommendations and good practices May 17, 2022

Doctoral theses contain data collected in a raw form (in the appendix of the thesis, or more rarely deposited on an open data repository), often original and in significant quantities. The data in the thesis represents a significant investment on the part of the doctoral student and his/her supervisors and is likely to be reused beyond the thesis.

Kirsley Chennen and Baptiste Lafabrègue are post-doctoral students and talk in this webinar about their experience of data management during their thesis. Kirsley Chennen is a postdoctoral fellow at the Engineering, Computing and Imaging Sciences Laboratory (iCube). He completed his thesis from 2012 to 2016 at the Medical Genetics Laboratory (LGM) of the University of Strasbourg, jointly with the French National Institute for Health and Medical Research (Inserm). Baptiste Lafabrègue has a PhD in computer science and teaches at the University of Strasbourg. He carried out his thesis from 2018 to 2021 at the Institut de Recherche en Informatique, Mathématiques, Automatique et Signal (IRIMAS) of the Université de Haute Alsace (UHA).

The meeting will be moderated by Olivier Poch, research director at the Laboratory of Engineering, Computer Science and Imaging (iCube) and co-director of the Laboratory of Integrative Bioinformatics and Genomics (LGBI).

In his section, Baptiste Lafabrègue will discuss the evaluation of a method, which is essential to validate its relevance. The choice or creation of evaluation data plays an important role in the quality of this evaluation. How can we ensure this quality? This is the question that will be addressed during this webinar, through different issues such as the dependence between train and test, cherry-picking or the relevance of data.

To find out more about Baptiste LAFABREGUE's thesis work : Clustering et apprentissage profond interactif pour l’analyse de séries d’images de télédétection à haute fréquence temporelle

Kirsley Chennen will address the issue of reproducibility in the era of Big Data, which cuts across all fields of science. FAIR principles will be introduced to promote better data exploitation, especially in bioinformatics.

For more information on Kirsley CHENNEN's thesis work: Maladies rares et « Big Data » : solutions bioinformatiques vers une analyse guidée par les connaissances : applications aux ciliopathies

---

Les thèses de doctorat comportent des données rassemblées de façon brutes (en annexe de la thèse, ou plus rarement déposées sur un entrepôt de données ouvertes), souvent originales et en quantité importante. Les données dans la thèse représentent un investissement important de la part du doctorant/de la doctorante et de ses tutelles et sont susceptibles d’être réutilisées au-delà de la thèse.

Kirsley Chennen et Baptiste Lafabrègue sont postdoctorants et reviennent dans ce webinaire sur leur expérience de gestion des données au cours de leur thèse. Kirsley Chennen est postdoctorant au Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (iCube). Il a effectué sa thèse de 2012 à 2016 au Laboratoire de génétique médicale (LGM) de l'Université de Strasbourg, conjoint avec l'Institut national de la santé et de la recherche médiale (Inserm). Baptiste Lafabrègue est docteur en informatique et enseigne à l'Université de Strasbourg. Il a effectué sa thèse de 2018 à 2021 au sein de l'Institut de Recherche en Informatique, Mathématiques, Automatique et Signal (IRIMAS) de l'Université de Haute Alsace (UHA). 

La rencontre sera modérée par Olivier Poch, directeur de recherche au Laboratoire des sciences de l’ingénieur, de l’informatique et de l’imagerie (iCube) et co-responsable du Laboratoire de Bioinformatique et Génomique Intégratives (LGBI).

 Baptiste Lafabrègue abordera dans sa partie l'évaluation d'une méthode, qui est primordiale pour en valider la pertinence. Le choix ou la création des données d'évaluation joue un rôle important dans la qualité de cette évaluation. Comment s'assurer de cette qualité? C'est la question qui sera abordée au cours de ce webinar, à travers différents problèmes dont la dépendance entre train et test, le cherry-picking ou encore la pertinence des données.  

Pour en savoir plus sur le travail de thèse de Baptiste LAFABREGUE : Clustering et apprentissage profond interactif pour l’analyse de séries d’images de télédétection à haute fréquence temporelle

Kirsley Chennen abordera dans sa partie la problématique de la reproductibilité malgré l'ère des Big Data qui traverse tous les domaines de la science. Les principes du FAIR seront introduits pour promouvoir une meilleure exploitation des données, plus particulièrement en bioinformatique.

Pour en savoir plus sur le travail de thèse de Kirsley CHENNEN : Maladies rares et « Big Data » : solutions bioinformatiques vers une analyse guidée par les connaissances : applications aux ciliopathies




Start video
Check the box to indicate the beginning of playing desired.

Scoreboard

Click below to refresh the information.