IBISC : Le premier outil d’exploration du domaine émergent des ARN bifonctionnels

Le laboratoire Ibisc de l'Université d’Évry Paris-Saclay a développé le 1er outil d’identification des ARN bifonctionnels, récemment découverts pour leur rôle au cours du développement ou dans les cancers.

Le laboratoire IBISC a mis au point IRSOM2, le premier outil bio-informatique de prédiction des ARN bifonctionnels, une classe nouvellement découverte d’ARN qui cumulent une activité biologique propre et la capacité à être traduits en protéines fonctionnelles. Le modèle repose sur les réseaux de neurones et la méthode des cartes auto-organisatrices. Il identifie les ARN codants, non-codants et une 3e classe qui regroupe les ARN potentiellement bifonctionnels. Librement accessible et simple d’utilisation, IRSOM2 fournit aux biologistes des candidats à étudier et contribue ainsi aux progrès des connaissances dans le domaine naissant des ARN bifonctionnels.

Ces 20 dernières années ont démontré le rôle central des ARN non codants dans les processus biologiques et dans les maladies, notamment le cancer. Issus des régions de notre génome qui ne codent pas pour des protéines et que l’on a longtemps pensé inutiles, ces ARN ont révélé une fonction essentielle de régulateurs de l’expression des gènes. Très récemment, une nouvelle classe d’ARN a émergé : les ARN « bifonctionnels » qui cumulent les fonctions codante et non codante. Ils peuvent, d’une part, coder pour la synthèse d’une protéine disposant d’une fonction physiologique et, d’autre part, assurer en tant qu’ARN une fonction régulatrice, selon les paramètres environnementaux, le stade de développement de l’organisme ou encore des perturbations pathologiques.

En 2019, le groupe Bioinformatique des ARN dirigé par Fariza TAHI, au sein de l’équipe AROB@S du laboratoire génopolitain IBISC (Université d’Evry Paris-Saclay), a développé IRSOM, une méthode bio-informatique innovante d’identification des ARN codants et non codants à partir de données de séquences liées aux ORFs (« Open Reading Frame » correspondant aux séquences susceptibles d’être lues et traduites en protéines), aux k-mers (séquences de longueurs k), à la fréquence de certains nucléotides, etc. Reposant sur les réseaux de neurones, l’outil permet de séparer ARN codants et non codants, et fournit aux biologistes une représentation graphique du classement facilement interprétable, grâce à la méthode des cartes auto-organisatrices (SOM pour Self Organizing Map).
La particularité d’IRSOM est également d’identifier les cas ambigus.

Pour accompagner l’émergence des ARN bifonctionnels, l’équipe dirigée par Fariza TAHI a mis au point IRSOM2. Le nouvel outil exploite notamment la propriété d’IRSOM de rejet des cas ambigus : les chercheurs d’IBISC ont fait l’hypothèse d’une forte probabilité pour que ces cas soient bifonctionnels.

Les scientifiques ont validé leur stratégie et ajusté les seuils de probabilité du modèle IRSOM2 en utilisant en particulier les bases de données Spencer, d’ARN longs impliqués dans le cancer, et cncRNAdb, de divers types d’ARN issus d’organismes différents. La 3e classe d’ARN d’IRSOM2 fournit ainsi aux biologistes des candidats bifonctionnels pour une étude approfondie.

Compte tenu des connaissances encore parcellaires sur cette nouvelle classe d’ARN, le modèle IRSOM2 offre également aux équipes l’option de ré-entraîner en autonomie le modèle sur leurs jeux de données, de manière à générer leur propre modèle.

Retour à la liste d'actualités