2018 | DynaRNA - Labex DigiCosme

Dynamics of RNA

Axe & tâche scientifique DigiCosme : SciLex – IID
Coordinateurs :Loïc Paulevé – Yann Ponty
Nom & Prénom du Candidat : Christelle Rovetta
Adresse mail :christelle.rovetta à inria.fr
Laboratoire(s) : LRI/LIX
Adossé à l’action DigiCosme :GT TheoBioR
Durée & Dates de la mission : 1 an – 01/10/2018 — 30/09/2019

Contexte :
Les molécules, ou brins, d’ARN sont des chaînes de nucléotides formées par la transcription d’une portion de l’ADN. Suivant différentes forces d’attractions, les nucléotides d’un brin d’ARN peuvent alors s’apparier, influençant la conformation spatiale de l’ARN. Le repliement de l’ARN impacte alors sa capacité à interagir avec les autres molécules de la cellule, et en particulier sa traduction en protéine.
Le repliement des ARN a fait l’objet de très nombreux travaux en biologie expérimentale, mais également en physique, mathématiques et informatique (combinatoire et simulation), en particulier pour la prédiction des conformations stables d’une séquence de nucléotide donnée, c’est-à-dire des repliements d’énergie libre (quasi-)minimale. Il existe désormais des méthodes informatiques très efficaces permettant d’échantillonner l’espace des conformations d’un ARN pour en extraire les repliements les plus stables 1. Ces approches s’avèrent toutefois limitées pour la prédiction du repliement de certains types d’ARN : certaines séquences peuvent admettre plusieurs repliements stables très différents (riboswitch), il devient alors nécessaire de savoir prédire les probabilités de repliement dans ces structures stables d’un brin d’ARN juste transcrit ou en cours de transcription. De plus, la durée pour modifier le repliement d’un brin d’ARN et atteindre une certaine conformation stable est une caractéristique importante : un ARN peut ne jamais avoir le temps d’atteindre la conformation stable et ainsi intéragir avec une conformation non prédite car non stable. Ainsi, l’étude de la dynamique du repliement des ARN promet une meilleure compréhension de leurs différents mécanismes. Toutefois, il existe à ce jour peu de méthodes pour aborder la dynamique du repliement d’ARN. Alors que les méthodes exactes basées sur la simulation 2 ont du mal à passer à l’échelle, les quelques approximations existantes 3 ne permettent pas encore de prédire avec suffisamment de précision les probabilités et durées de changements de conformations.

Objectif :
L’objectif de ce travail est d’étudier le repliement des ARN comme un système dynamique modélisé par des chaînes de Markov à temps continu (CTMC) et de chercher (1) à appliquer les techniques existantes pour estimer les temps et probabilités d’atteinte d’états donnés ; (2) mettre au point et évaluer différentes approximations du temps de premier passage (hitting time);(3) utiliser ces approximations pour obtenir un modèle hybride réduit, où les états seraient les conformations les plus stables. Il conviendra alors d’étudier l’influence du choix de distribution du temps des transitions dans le modèle réduit et, en particulier, d’effectuer un choix entre des distributions exponentielles ou des distributions Gamma (CTMC non-homogènes). Pistes de travail À partir de la séquence de l’ARN étudié, la dynamique de son repliement peut se modéliser aisément sous la forme d’une CTMC : les états sont les différentes conformations, compatibles avec les règles d’appariement entre nucléotides ; les transitions relient des repliements qui ne différent que par un unique appariement, la propension de chaque transition dépend alors directement de la différence d’énergie libre entre les deux structures. La CTMC ainsi obtenue est irréductible (le graphe de transition forme un graphe fortement connexe). Toujours à partir de la séquence de l’ARN, des travaux très récents de l’équipe AMIB du LIX 4 permettent d’échantillonner sans redondance les minima-locaux du paysage énergétique, ce en suivant une probabilité proportionnelle à leur degré de stabilité. Cette approche permet d’obtenir efficacement les conformations de l’ARN les plus stables, et donc d’identifier un nombre, typiquement plus restreint, d’états d’intérêt pour la dynamique de son repliement. Étant donné une conformation initiale et une conformation stable, notre objectif est de caractériser un ensemble de chemins “probables” et d’en calculer la durée et variance. À cette fin, le travail portera sur la mise au point de méthodes de simulation avec réduction de variance (importance sampling), pouvant se baser sur le calcul d’un chemin direct qui sera alors généralisé, ou encore sur les techniques de fenêtres glissantes (sliding windows). Cette dernière permettra de ne prendre en compte qu’un sous-ensemble d’état (concentrant la majorité de la masse de probabilité) pendant un court laps de temps. Dans un second temps, le modèle de repliement sera étendu pour prendre en compte le repliement co-transcriptionels, où le repliement s’effectue en parallèle de la synthèse du brin d’ARN, provoquant l’adoption de structures transientes stables qui jouent un rôle important dans la cinétique du repliement. Des applications à différents systèmes biologique (SRP RNA, SAM Riboswitch, maturation 5’UTR of the Levivirus. . .) où le rôle de la cinétique a été établi expérimentalement seront réalisées dans le cadre d’une collaboration de Y. Ponty avec l’institut de biochimie théorique (TBI) de l’université de Vienne, notamment au travers du projet ANR-FWF 2015-2019 RNALands, auquel participe également L. Paulevé. Avec ce projet, nous espérons fortement engager de nouvelles collaborations avec d’autres participants au GT TheoBioR et d’autres équipes de Paris-Saclay travaillant sur les systèmes hybrides à grande échelle. Notamment, nous envisageons dès le début du projet des liens avec le LSV autour des méthodes de model-checking statistiques et d’abstractions de systèmes hybrides développées par Serge Haddad 5. Cette thématique devrait d’ailleurs faire l’objet d’une réunion organisée par le GT TheoBioR.