Retrouvez nos coordonnées
sur la page
Informations pratiques
Tous les ARNs ne se sont pas uniformément distribués dans la cellule. Pour certains gènes, une distribution asymétrique et localisée des transcripts peut être observée. Ce phénomène participe à la régulation de l'expression génétique. Actuellement, pour étudier la localisation intracellulaire des ARNs, une méthode appropriée est le emph{single molecule FISH} (smFISH). Les molécules d'ARN sont ciblées avec des marqueurs fluorescents et peuvent ainsi être observées au microscope. Cette technique, et ses variantes, permet d'étudier des milliers de transcripts à l'échelle de la cellule. Toutefois, les outils informatiques utilisées pour ces expériences présentent des limites. Lors d'une expérience avec des images de smFISH, une analyse complète nécessite souvent d'intégrer des outils différents, de les calibrer et de développer du code propre à l'étude. Cela pénalise le passage à l'échelle sur des études avec un grand volume de données, ainsi que leur reproductibilité. Avec cette thèse, je présente une nouvelle version de FISH-quant, un outil destiné à l'analyse des images de smFISH. Les actions les plus communes et nécessaires pour traiter les images d'ARNs y sont disponibles et améliorées : la détection des ARNs, la segmentation des cellules et des noyaux, ainsi qu'une sélection d'indicateurs statistiques, le tout réuni dans un seul outil. En outre, nous avons étudié la possibilité d'entraîner un modèle d'apprentissage à partir de nuages d'ARNs simulés, afin de pouvoir classifier différents schéma de localisation. Enfin, nous avons utilisé FISH-quant dans différentes études avec des données réelles. Ces expériences ont permis d'étudier plusieurs dizaines de gènes à travers plus de 100000 cellules identifiées. Nous avons d'abord développé un modèle de classification pour reconnaître les schémas de localisation d'ARN les plus fréquents. Ensuite, nous nous sommes intéressés à quantifier et décrire statistiquement différents types de localisation autour du centrosome ou dans les extensions périphériques de la cellule. Nous avons notamment caractérisé des schémas de localisation liés à la traduction des protéines ou au cycle cellulaire.
RNAs do not necessarily have a random distribution in the cell. Specific localization patterns have been observed and such asymmetric distributions are of functional importance for the spatial regulation of gene expression. Current methods to study intra-cellular RNA localization use single molecule FISH (smFISH) protocols or its multiplexing variants. Each RNA molecule is targeted with fluorescent probes and can be imaged by fluorescence microscopy. These techniques enable single cell level analyses and can be scaled to thousands of transcripts. However, computational methods to quantify RNA localization suffer different flaws, such as the consistency of spot detection between experiments. A complete analysis pipeline typically requires the use of different frameworks and the development of in-house pieces of code, making smFISH analysis difficult to scale and reproduce. In this thesis, I present a new version of FISH-quant, a comprehensive computational framework to process smFISH images. It provides improved modules for the most common operations needed for smFISH analysis such as RNA detection, nucleus and cell segmentation as well as feature engineering, all in the same framework, designed to be flexible and scalable. In addition, I investigate the use of point cloud models directly trained from simulations to address the classification of RNA localization patterns, without the need to compute hand-crafted features. Lastly, I apply FISH-quant to experimental datasets in biological studies that include several dozens of transcripts, analyzed through 100,000 individual cells. For this, I design a classification pipeline to discriminate several generic RNA localization patterns. This allows us to discover translation factories, a new mechanism of spatial control of gene expression. Third, we focus on the centrosomal and protrusion patterns to provide a statistical description of several genes of interest. Altogether, these studies reveal regulation mechanisms more complex than expected with various spatial and temporal dynamics.
Date de soutenance : jeudi 15 décembre 2022 à h00
Adresse de soutenance : Mines Paris 60 Bd Saint-Michel, 75272 Paris France - C107
Directeur de thèse : Thomas WALTER
: France FLOC'H
International
Un docteur CRI à UCL avec la ministre de l'ESR
Robin Le Conte des Floris, jeune docteur de la thèse
> En savoir +
Formation
Séminaire HPC / thèse à Rabat
Claude Tadonki, enseignant-chercheur au CRI, a
> En savoir +
Formation
CloudTech au Maroc
Claude Tadonki, enseignant-chercheur au Centre de recherche en informatique
> En savoir +
Formation
Samuel Forest, élu membre de l’Académie des
Samuel Forest lors de sa réception à
> En savoir +
Formation
Les politiques publiques doivent-elles sauver des
Photo de Andre Taissin sur Unsplash François
> En savoir +
Formation
Prix TTI.5 de la controverse environnementale
Le 31 mai, à la Maison de l’Océan à
> En savoir +