Des biologistes de l'UNIL, en collaboration avec l'EPFL et l'Institut Suisse de Bioinformatique (ISB-SIB), découvrent chez différentes espèces allant de l'homme à la grenouille le fonctionnement d'un type de gènes méconnus conservés durant l'évolution. Leur article paraît dans Nature.
Les gènes «standards» fabriquent des protéines essentielles au fonctionnement des cellules. Le cas des longs ARNs non-codants est plus mystérieux. Or nous savons depuis quatre ou cinq ans qu'il y a dans le génome de l'homme et de la souris des milliers de ces gènes encore très mal connus et dont la particularité est de ne pas produire de protéines. Comment et dans quels organes sont-ils activés? Cette matière noire biologique est-elle un simple bruit de fond ou a-t-elle une utilité?
Onze espèces analysées
Une équipe dirigée au Centre intégratif de génomique (CIG) de l'UNIL par Henrik Kaessmann, professeur associé à la FBM, a dressé un véritable catalogue de ces longs ARNs non-codants chez onze espèces animales. En adoptant une analyse évolutive, elle a mis en particulier au jour la présence d'environ 2'500 gènes de longs ARNs non-codants très anciens, apparus chez l'ancêtre de la plupart des mammifères placentaires voici au moins 90 millions d'années. Ces gènes anciens sont particulièrement intéressants du point de vue fonctionnel.
Première auteure de l'article qui paraît le 19 janvier 2014 dans Nature, Anamaria Necsulea, engagée depuis novembre 2012 à l'EPFL, a élargi le champ d'investigation de ces longs ARNs non-codants à six espèces de primates (de l'homme au macaque, en passant par le chimpanzé, le bonobo, le gorille et l'orang-outan), aux souris, à l'opossum (un mammifère dit marsupial), à l'ornithorynque (un mammifère monotrème, qui pond des oeufs et nourrit ses petits avec du lait), sans oublier un «groupe externe» composé par un oiseau (le poulet) et un amphibien (la grenouille).
Des gènes retenus par l'évolution
L'ancêtre commun à tous ces tétrapodes remonte à plus de 350 millions d'années, rappelle la biologiste, qui a utilisé pour identifier les longs ARNs non-codants dans plusieurs organes majeurs des 11 espèces considérées la plateforme de génomique du CIG, ainsi que le centre de calcul Vital-IT de l'Institut Suisse de Bioinformatique. «Avec la bioinformatique, nous avons découvert des séquences d'ARN produites par des endroits du génome ne comprenant aucun gène connu», explique-t-elle. «Nous avons analysé ces gènes pour savoir s'ils codent ou non pour des protéines et répertorié ainsi entre 3'000 et 15'000 gènes non-codants, selon les espèces».
Dans un deuxième temps, une comparaison entre les différentes espèces a permis de situer l'apparition de ces gènes dans l'histoire de l'évolution. Si 11'000 longs ARNs non-codants sont partagés par tous les primates, 2'500 remontent à l'ancêtre commun de l'homme et de la souris, voici 90 millions d'années, et seule une centaine provient de l'ancêtre commun aux onze espèces considérées, y compris les oiseaux et les amphibiens. «Non seulement tous ces gènes non-codants sont régulés comme les autres gènes par les facteurs de transcription, mais encore, soulignent les chercheurs, nous avons pu constater que les 2'500 gènes les plus anciens le sont par des facteurs spécifiques du développement embryonnaire. Cela suggère que, parmi ces 2'500 longs ARNs non-codants conservés au cours de l'évolution des mammifères placentaires, une grande proportion pourrait fonctionner spécifiquement dans le développement embryonnaire».
Nouveau réseau d'interactions entre les gènes
Une troisième étape de la recherche a pu mettre en lumière un réseau d'interactions - de type co-expression, c'est-à-dire activation de ces gènes dans les mêmes organes ou types cellulaires - impliquant aussi bien les gènes de longs ARNs non-codants que les gènes codants pour des protéines. Certains gènes non-codants sont par exemple fortement associés à des gènes codants impliqués dans le fonctionnement du cerveau, ou dans la spermatogenèse, ce qui suggère des fonctions similaires pour ces gènes d'ARNs non-codants.
Une association impliquant chez les mammifères placentaires le gène H19 (qui fut le premier long ARN non-codant identifié voici de nombreuses années) a permis de mettre au jour le gène H19X qui lui est associé: «Le H19 empêche le placenta de se développer exagérément dans l'utérus de la mère», souligne Anamaria Necsulea. «On peut supposer que notre H19X contribue à cette fonction. Notre prochaine recherche consistera à le désactiver chez la souris afin de prouver cette action sur le placenta».
Parmi les sous-catégories de gènes produisant de l'ARN, ces très nombreux ARNs longs, méconnus et faiblement exprimés chez l'homme et la souris, sont-ils plus utiles qu'il n'y paraît? En les répertoriant dans 11 espèces différentes, cette nouvelle étude d'une envergure inédite suggère que la «matière noire» de nos organismes continue à agir au fil du temps sur le développement et le fonctionnement des cellules et des tissus les plus vitaux. De futures études expérimentales permettront de clarifier le rôle de ces gènes qui livrent ici leurs premiers secrets.