Le séquençage est une technologie qui permet de « lire » le génome d’un organisme et ainsi de détecter les mutations dont il est porteur. Certains pays y ont recouru massivement dans le cadre de l’épidémie de Covid-19. Mais la France, peu : plus d’un an après le début de l’épidémie, le nombre de séquences de génomes du coronavirus SARS-CoV-2 mises à disposition de la communauté internationale par notre pays est très faible.
Directeur de recherche au CNRS, affecté au laboratoire MIVEGEC (IRD, CNRS, Université de Montpellier), Samuel Alizon décrypte les raisons de cette situation qui interpelle, à l’heure où les variants détectés initialement au Royaume-Uni, en Afrique du Sud ou au Brésil se propagent rapidement.
Samuel Alizon : Les coronavirus évoluent constamment. À chaque infection, les virus se multiplient, produisant de grandes quantités de nouvelles particules virales, aussi appelées « virions ». Chaque reproduction du virus implique une copie du matériel génétique et ce processus comporte toujours des erreurs : les mutations.
Une grande partie de ces mutations sont neutres, c’est-à-dire qu’elles n’ont pas d’effet sur le cycle de vie du virus. Parmi celles qui ont un effet, beaucoup sont délétères et les virus qui les portent sont généralement rapidement éliminés.
En France, comme dans tous les pays, il y a eu ce qu’on appelle des « effets fondateurs » lorsque le coronavirus SARS-CoV-2 s’est implanté. Ce concept de génétique des populations traduit la fixation au hasard de multiples mutations, notamment lorsqu’un faible nombre d’individus colonise un nouvel environnement. Ainsi, en janvier 2020, un faible nombre d’infections par le coronavirus SARS-CoV-2 ont initié des chaînes de transmission, qui ont engendré la vague épidémique du printemps.
On désigne sous le terme de « lignée » les virus qui ont une telle origine commune. Ainsi, les lignées de SARS-CoV-2 circulant en France sont assez différentes de celles circulant en Asie. En revanche, les virus ne s’arrêtent pas aux frontières, et une même lignée peut se propager dans différents pays. Le point important est que, bien qu’ayant des mutations qui leur sont propres, les lignées causent des infections similaires.
On parle en revanche de souche (ce qui correspond au terme médiatique de « variant ») lorsque les mutations que porte une lignée ne sont plus neutres, mais modifient l’infection, augmentant par exemple sa contagiosité, sa virulence, ou l’efficacité des vaccins.
Il semble par exemple aujourd’hui assez clair que le variant qui a évolué en Angleterre (et qui correspond à la lignée B.1.1.7) est plus transmissible que les virus qui circulaient dans le pays avant son émergence. Pour les variants détectés initialement en Afrique du Sud (la lignée B.1.351) ou au Brésil (la lignée P.1), la contagiosité accrue n’est pas encore démontrée. En revanche, on s’inquiète de leur capacité à réinfecter des personnes ayant déjà contracté une infection par des virus SARS-CoV-2 qui circulaient avant eux.
SA : Les mutations du SARS-CoV-2 sont intéressantes à suivre pour plusieurs raisons.
La première est évidente : c’est de détecter d’éventuels variants qui pourraient expliquer pourquoi la dynamique de l’épidémie change. C’est ce qui s’est passé en Afrique du Sud ou en Angleterre. Les autorités ont détecté une augmentation rapide des cas, qui a constitué l’élément déclencheur. Partant de ce constat, elles ont ensuite pu en comprendre les raisons très rapidement, car les données de séquences étaient déjà disponibles.
On a ainsi découvert que les lignées à l’origine de ce phénomène avaient accumulé bien plus de mutations dans leur génome que la moyenne, mutations dont un certain nombre concernent la protéine Spike du virus et avaient déjà des effets connus in vitro. On peut citer entre autres la mutation N501Y, qui facilite l’entrée du virus dans les cellules humaines, ou encore la mutation E484K, qui diminue la reconnaissance par les anticorps produits par le système immunitaire.
La seconde raison qui justifie de recourir au séquençage n’est pas liée aux variants. Il s’agit plutôt de suivre les mutations neutres, afin d’assurer un traçage des lignées virales. Cette discipline s’appelle la phylodynamique. Grâce à elle, on peut étudier la structure de l’épidémie. On peut par exemple déterminer si, dans notre pays, il y a une épidémie par département, ou si au contraire l’épidémie est peu structurée, avec des échanges de virus au niveau national.
Au-delà de ces informations sur la structure de l’épidémie, l’approche phylodynamique permet aussi de comprendre comment elle se propage. Ces techniques ont été très employées pour étudier les épidémies causées par le virus de l’immunodéficience humaine (VIH), avec beaucoup de succès, comme l’illustre la Cohorte Suisse pour l’Étude du VIH. L’épidémie d’Ebola en Afrique de l’Ouest en 2013-2016 les a encore davantage popularisées. Avec la pandémie de Covid-19, elles ont à nouveau été propulsées sur le devant de la scène. C’est grâce à ces techniques que l’on a par exemple pu estimer l’effet de la mutation D614G sur la transmissibilité du virus, ou encore détecter des événements de super-propagation dans la région de Boston aux États-Unis.
Il faut souligner ici le rôle central de l’initiative GISAID, qui a permis de rapidement centraliser tous les différents génomes de SARS-CoV-2 séquencés. Les scientifiques ont ainsi pu analyser l’épidémie quasiment en temps réel, à des échelles nationales et internationales.
SA : La France a énormément de retard sur ce sujet. Même dans le cas d’une épidémie comme celle du VIH, l’utilisation du séquençage pour le suivi épidémiologique est marginale. Quand on séquence le VIH, c’est uniquement pour détecter des mutations de résistance aux traitements. Dans le cas du coronavirus, la situation est assez similaire. Pourtant, notre pays était dans les délais au début de cette pandémie, puisque le Centre national de Référence de Paris publiait les premiers génomes de coronavirus SARS-CoV-2 européens en janvier 2020.
En outre, dès fin mars notre équipe a réalisé une des seules analyses au niveau national, initialement sur 69 puis sur 196 génomes de SARS-CoV-2 issus de toute la France. Nous avons ainsi pu découvrir que le virus avait été introduit à plusieurs reprises en France, et nous avons pu dater le début de la vague épidémique à la deuxième quinzaine de janvier. Cette approche nous a aussi permis d’estimer la vitesse de propagation de l’épidémie, et même de détecter le ralentissement lié au confinement dès la fin du mois de mars. Ce travail, désormais publié en anglais, illustre que la collaboration entre les laboratoires de recherche fondamentale du CNRS et les laboratoires de virologie clinique est possible.
Malheureusement, après ces débuts encourageants, le séquençage s’est arrêté presque aussi net : de tout l’été, il n’y a eu quasiment aucune contribution française à la base de données de GISAID. Aujourd’hui, plus de 500 000 génomes ont été partagés au niveau mondial. La France en a procuré à peu près 5 000 ; le Royaume-Uni, quarante fois plus… Certes, ce sont des chercheurs britanniques qui ont mis au point le séquençage dans les années 1970 et ce pays a toujours été très en pointe dans ce secteur, mais cela n’explique pas tout… En fait, le retard par rapport aux Britanniques est assez global pour tout ce qui touche aux données et à leur analyse.
L’exemple du variant B.1.1.7 détecté dans le Kent, en Angleterre, illustre bien cette situation. Ce qui a d’abord alerté Public Health England, c’était la proportion de tests PCR de chez Thermo-Fisher qui ne s’avéraient que partiellement positifs. En effet, ce test cible trois régions du génome du coronavirus. Or, dans les régions où les contaminations explosaient, la proportion de tests dans lesquels seules 2 régions étaient détectées au lieu des 3 attendues était anormalement élevée. Le séquençage des échantillons concernés a permis de comprendre ce qui se passait et de caractériser ce nouveau variant.
En France, même avec une préparation d’un mois, il a été compliqué de mettre sur pied une telle surveillance, qui s’avère bien moins précise puisque le recours au séquençage est limité.
SA : Non, pas du tout. Notre pays possède l’expertise nécessaire pour mener d’ambitieux projets de séquençage. Par exemple, le CNRS, dans le cadre du projet Tara Océans, a réalisé un séquençage d’organismes marins d’une telle ampleur que la revue Science y a consacré un numéro spécial.
Selon moi, le problème est ailleurs, et résulte de la conjonction de deux facteurs. Le premier est en lien avec la politique d’austérité budgétaire qui touche le secteur de la santé publique. Depuis 20 à 30 ans, la France a mis en place une politique d’austérité dans les milieux hospitalo-universitaires. Or le séquençage dit « de nouvelle génération » (Next Generation Sequencing, NGS, en anglais) coûte près de 10 fois plus cher que le séquençage Sanger classique. Sans parler de l’analyse bio-informatique supplémentaire associée.
Le second facteur est que les techniques de phylodynamie sont relativement récentes : les premières publications datent des 20 voire 30 dernières années. Or, on sait que les avancées scientifiques mettent un certain temps à diffuser. Et que ce temps augmente avec le manque de moyens. En France, la place de la recherche, notamment publique, dans les priorités budgétaires, a reculé au cours des 20 dernières années. La dernière Loi de Programmation sur la Recherche entérine cette baisse de budget tout en augmentant la précarité matérielle, mais aussi scientifique, avec un pilotage accru déploré entre autres par le Conseil économique, social et environnemental.
Ces dernières années, nos voisins suisses ou encore britanniques ont eu des dynamiques inverses en encourageant des médecins à se former à l’épidémiologie et l’évolution et en recrutant des chercheurs en statistiques et en modélisation dans les agences de santé publique. Toutefois, il faut aussi préciser que ces échanges se font souvent sur des contrats courts et précaires. En France, la percolation entre la recherche publique et les agences de santé publique reste limitée. À ma connaissance, Santé publique France ne fait quasiment pas de modélisation mathématique. À l’inverse, l’agence de santé publique Public Health England a des membres qui font même de la phylodynamie.
SA : Bien entendu. Aujourd’hui, le séquençage des génomes viraux a tout pour être un outil central en santé publique.
Sa mise en place, cependant, n’est pas une mince affaire. Tout d’abord, le fait de travailler sur du matériel biologique soulève des questions juridiques et éthiques. On ne peut pas séquencer n’importe comment, il y a des cadres réglementaires et des autorisations dont les scientifiques qui ne sont pas familiers du domaine n’ont pas toujours conscience. Ensuite, même dans un laboratoire qui fait du séquençage NGS, s’attaquer au génome du SARS-CoV-2 nécessite de mettre au point un protocole spécifique. Cela peut nécessiter plusieurs semaines de mise au point et coûter un peu cher. À ce jour, moins d’une dizaine de laboratoires publics ou privés peuvent séquencer plus de 100 génomes de ce coronavirus par semaine. Cela reste peu, d’autant que les fonds sont limités.
Après le séquençage, vient l’analyse bio-informatique. Il faut savoir que les données brutes qui sortent de la machine nécessitent une phase de traitement, pour être transcrites sous forme d’un génome viral qui pourra ensuite être comparé aux autres. Celui-ci peut être automatisé, surtout une fois que les méthodes sont partagées au niveau mondial, mais l’étape de mise en place est parfois limitante.
Enfin, il faut être capables d’analyser ces génomes viraux et de les utiliser pour estimer la structure de l’épidémie, sa vitesse de propagation, etc. Là encore, non seulement peu d’équipes savent le faire en France, mais en outre la plupart, comme la nôtre, n’ont pas le personnel suffisant pour le faire en routine.
Une coordination nationale semble incontournable pour le succès d’une telle approche : dès mars 2020, les Britanniques mettaient en place le Covid-19 Genomics UK Consortium en lui allouant 20 millions de livres sterling. À titre de comparaison, en mars 2020, la France lançait péniblement, via l’Agence Nationale de la Recherche, un appel à projets de 3 millions d’euros dont on ne sait d’ailleurs toujours pas qui l’a évalué ni quel a été son taux de succès. À l’inverse, l’État a débloqué 200 millions en juin pour Sanofi de manière bien plus généreuse et sans appel à projet…
SA : En règle générale, il a été décidé de s’appuyer sur les tests RT-PCR.
Santé publique France a d’abord coordonné des « Enquêtes Flash », afin de faire remonter la proportion de tests réalisés avec la technique de Thermo-Fischer qui n’avaient que 2 cibles sur 3 positives (ce qui est une indication potentielle d’infection par le variant qui a émergé en Angleterre). Certains des échantillons suspects ont pu être séquencés, notamment grâce au travail du Centre National de Référence de Lyon. Il faut souligner que du fait du sous-investissement national dans la gestion des données, les laboratoires français ont dû déployer d’importants efforts pour répondre à cette enquête. En Angleterre, cette étude a été bien plus triviale à réaliser.
La technique de Thermo-Fischer étant relativement peu utilisée en France (10 % des tests effectués contre 25 % au Royaume-Uni), il a également fallu trouver une autre solution. Au final, il a été décidé de tester tous les échantillons positifs par PCR une seconde fois, en employant plusieurs tests PCR spécifiques destinées à détecter des mutations propres aux variants détectés initialement en Angleterre, en Afrique du Sud, ou au Brésil.
Au final, le séquençage reste encore à l’heure actuelle marginal puisqu’il n’est remboursé que si le patient revient de l’étranger et n’a pas déjà été testé par les PCR spécifiques pour variants.
SA : Oui et non. Il faut tenir compte du retard français en termes de séquençage, de centralisation et d’analyse des données : il faudra un regroupement d’expertises, des financements et une volonté politique pour se mettre à niveau. Or, pour le moment, tout cela fait défaut.
Sur le long terme, la stratégie actuelle coûte probablement plus cher que de séquencer 5 % des tests positifs, comme le font les Britanniques, car nos laboratoires doivent retester tous les tests positifs avec des PCR spécifiques.
Cela étant, la stratégie actuelle est a priori une situation transitoire. En effet, dans la plupart des scénarios, les modèles épidémiologiques suggèrent que d’ici un mois la majorité des infections en France seront causées par le variant B.1.1.7. Mais saura-t-on mettre en place les ressources nécessaires pour pouvoir recourir au séquençage ?
Il faut bien comprendre que l’approche s’appuyant sur les tests PCR implique que l’on connaît déjà ce que l’on cherche : lorsqu’on envisage de détecter un variant donné, il faut avoir à disposition le test qui l’identifie spécifiquement. Le problème est que si d’autres variants évoluent et se propagent, ce qui n’est pas à exclure, une telle stratégie impliquera rapidement de devoir multiplier le nombre de tests spécifiques de ces nouveaux venus…
Ce qui interroge, c’est que l’on savait déjà avant la pandémie qu’il est important de séquencer pour comprendre une telle épidémie. Même les personnes les plus réticentes ont été convaincues fin 2020, lorsqu’a été confirmée l’évolution des variants. En réaction, les Britanniques ont rajouté 12 millions de livres au budget du Covid-19 Genomics UK Consortium. En France, il n’y a pour le moment pas l’ombre d’une coordination nationale pour la génomique ou d’une mise en commun des capacités des différents laboratoires publics et privés…
Samuel Alizon, Directeur de Recherche au CNRS, Institut de recherche pour le développement (IRD)
Cet article est republié à partir de The Conversation partenaire éditorial de UP’ Magazine. Lire l’article original.