SMF

Mathématiques & covid-19 : témoignage d'Amaury Lambert

Amaury Lambert est mathématicien, professeur à Sorbonne Université et professeur associé au département de biologie de l’École normale supérieure. Il anime l’équipe SMILE au Collège de France. Sa recherche se situe à l’intersection de l’évolution, de l’écologie et des probabilités. Il nous explique ci-dessous sa réponse de mathématicien travaillant à l’interface avec la biologie face à la crise sanitaire.

Avant tu faisais quoi?

Je suis probabiliste de formation, je m’intéresse aux graphes et aux arbres aléatoires, à la modélisation en écologie et en biologie évolutive.

Par exemple, la généalogie d’un gène ainsi que la phylogenèse, c’est-à-dire l’historique évolutif des espèces, sont décrites par des arbres. Si l’on considère un échantillon d’individus appartenant à différentes espèces, on obtient en plus de l’arbre des espèces un arbre pour chaque gène. Ces arbres  ne coïncident pas nécessairement, même s’ils sont fortement corrélés. La description des relations prédateur/proie ou plante/pollinisateur se fait aussi par des graphes, cette fois bipartis.

En fait, le concept même d’espèce peut être décrit en termes de graphe : si l’on considère un ensemble d’individus issus d’espèces diverses et qu’on relie par une arête deux individus qui peuvent se croiser, les espèces peuvent alors être vues comme les composantes connexes du graphe obtenu. Le graphe évolue au gré des naissances et des morts qu'on peut supposer aléatoires. Un nouvel individu peut se croiser avec les mêmes individus que ses parents, modulo la divergence génétique. Cette divergence empêche certains de ces croisements. On peut la modéliser en supposant que chaque arête ainsi héritée disparaît à l’issue d’un nombre aléatoire de générations. Ce processus modélise la formation et l’évolution des espèces.

Comment travailles-tu?

J’anime l’équipe SMILE (Stochastic Models for the Inference of Life Evolution) accueillie au Collège de France. Elle rassemble des biologistes et des mathématiciens qui collaborent pour proposer des modèles innovants des phénomènes évolutifs et pour déduire des données observées les meilleurs de ces modèles. On traite en général des données génomiques, mais aussi de certaines mesures d’abondance (taille d’une population, prévalence d’une maladie).

Comment t’es-tu mobilisé à l’occasion de la crise sanitaire?

Nos intérêts touchaient aussi à l’épidémiologie. L’équipe compte d’ailleurs un spécialiste en épidémiologie évolutive, François Blanquart. Mais, au tout début, j’ai pensé qu’il y avait déjà un trop grand nombre de spécialistes plus pointus que nous sur le sujet. C’est en discutant avec Mircea Sofonea de Montpellier, un ancien membre de l’équipe, que j’ai réalisé que c’était ce que tous les spécialistes pensaient. À la mi-mars, je me suis dit: “il faut qu’on s’y mette”.

Dès le 11 mars, j’avais demandé aux membres de l’équipe de rester chez eux. J’étais sûr qu’on allait se confiner. Pendant tout le confinement, on a continué, tous les jours vers 11h, à faire un point en visioconférence. Ca a été important de ne pas parler que de la Covid, ne serait-ce que pour le moral ! Au début du confinement ça n’était pas évident. Mais j’en ai parlé un peu plus chaque jour. Fin mars, deux thésards de l’équipe, Elise Kerdoncuff et Félix Foutel-Rodier m’ont dit: “on veut prêter main-forte”, et j’ai commencé à proposer des problèmes qui ont débouché sur 5 projets différents.

Peux-tu décrire quelques-uns de ces projets?

Le projet Alcov2  vise à comprendre la propagation du virus au sein des foyers. L’idée c’est qu’on a un même processus de “mini-épidémie” qui s’est reproduit un grand nombre de fois (une fois par foyer contaminé) et dans des conditions relativement bien contrôlées (puisque tout le monde était confiné). On a lancé un questionnaire recensant la présence possible de 16 symptômes et les dates d’apparition de ces symptômes. D’abord via l’INSMI  et l’UMS GRICAD qui a une expertise dans ce type d’enquête. On a reçu ainsi près de 5.000 réponses. Ensuite via l’institut de sondage BVA et son opérateur Bilendi qui a obtenu plus de 1.000 réponses après avoir contacté 10.000 personnes. On a donc reçu des informations sur près de 6.000 foyers dont l’un des membres a été malade. Avec Grégory Nuel, du LPSM, on cherche à en déduire des données fondamentales comme le taux de malades asymptomatiques ou la probabilité de contamination journalière. On peut trouver davantage d’information en lisant le communiqué de presse du CNRS.

Un autre projet étudie le rôle de l’hétérogénéité et de l’aléatoire dans la propagation de l’épidémie. On peut en effet modéliser l’évolution macroscopique de l’épidémie en découpant la population en compartiments ou types comme le stade infectieux, l’état clinique ou l’âge, au sens du temps écoulé depuis l’infection. Avec Emmanuel Schertzer, Félix Foutel-Rodier et le reste de l’équipe, nous avons abouti à une EDP classique dite de McKendrick-von Foerster décorée par les types, dont la condition initiale est aléatoire.

Cette représentation découple les dépendances entre types et par rapport au temps. Il s’agit d’une loi des grands nombres qui s’établit spontanément via le processus de croissance de l’épidémie.

Un autre projet visait à comprendre le traçage des contacts post-confinement et l’efficacité qu’on pouvait attendre des applications mobiles comme Stopcovid. J’étais très préoccupé par ce qui allait se passer lors du déconfinement. On sait qu’avec la Covid-19, on peut contaminer d’autres personnes avant d’avoir ou sans avoir soi-même de symptômes. Je fondais donc tous mes espoirs sur ce traçage, c’était ce qui allait nous sortir d’affaire. Mais en faisant les calculs, je me suis aperçu que ça ne marchait pas du tout. Sauf si le taux de reproduction de base (le fameux “R0”) est déjà faible (proche de 1), il faut que l’application soit utilisée par 60 à 70% de la population pour avoir un impact significatif. Cela est dû à un effet non linéaire que l’on peut comprendre assez facilement : pour pouvoir détecter un contact à risque il faut que les deux personnes - la source et la cible - utilisent l’application.

La crise sanitaire a-t-elle modifié ta façon de travailler?

Oui, de deux façons. On s’est tous mis dans l’équipe à bosser sur ce même sujet. Ce n’était jamais arrivé. Les plus jeunes ont fait de la recherche de données pour calibrer les modèles, les étudiants de master ont exploré la littérature scientifique, les biologistes ont fait de l’inférence, les mathématiciens ont établi des théorèmes limite comme ceux justifiant le passage des modèles stochastiques aux EDP.

C’était très sympa, même si ça a été parfois compliqué à coordonner. On avait toujours eu l’idée d’un projet commun à toute l’équipe mais là, c’était la première fois qu’on était tous sur le même sujet. Toute l’équipe c’est plus de 15 personnes (cette année: 4 thésards, 2 postdocs, 4 permanents et 6 stagiaires de master).

L’autre nouveauté a fait suite à l’appel du Sorbonne Center for Artificial Intelligence qui nous a mis en rapport avec datacraft, un club de data scientists pour développer le projet Alcov2. Isabelle Hillali,  la responsable de ce club, nous a à son tour mis en contact avec BVA, Bilendi et Ekimetrics, une agence de conseil en data science. Tout ce monde s’est mis à travailler ensemble, gracieusement. Je me suis retrouvé en équipe avec des gens que je ne connaissais pas, avec qui je n’avais jamais travaillé et venus d’horizons très variés.

Et par rapport aux médecins et aux responsables politiques ?

Alcov2 se fait en liaison avec des médecins infectiologues et virologues qui participent notamment via un conseil scientifique à l’élaboration des modèles et des questionnaires. Les médecins viennent avec leurs propres questions et sont à l’écoute de ce qu’on peut leur apporter. Ils sont sensibles au fait que nous ayons nos propres données, au-delà des questions de modélisation.

Ça fait presque vingt ans que je travaille avec des biologistes et je sais à peu près comment faire pour qu’on se comprenne. Il faut éviter les malentendus qui peuvent susciter des attentes impossibles à satisfaire et dissiper certaines incompréhensions sur la modélisation mathématique qui sont finalement assez communes. Que tout le monde soit “naïf” sur la Covid-19 facilite peut-être le dialogue !

Entre les responsables politiques et nous, il y a MODCOV19, la plateforme créée par l’INSMI. C’est quelque chose qui marche vraiment bien. Ils font un boulot monstrueux et vraiment utile. Au plan scientifique, ils mettent en relation des gens qui se posent des questions similaires avec des méthodes complémentaires. Ils assurent une veille scientifique et animent des groupes de travail. Les responsables de MODCOV19 sont en contact avec certains responsables politiques. Ce que je comprends c’est qu’il y a beaucoup de déception quant à ce que les politiques tirent des résultats scientifiques.

Les responsables politiques sont soumis à des contraintes spécifiques et préfèrent les solutions de bon sens, mais le bon sens n’est pas toujours de bon conseil. Les preuves par a+b de la faible utilité de l’application Stopcovid ou de la nécessité de groupes témoins pour  étudier l'hydroxychloroquine n’ont pas été prises en compte.

Quelles contributions peuvent apporter les mathématiques à la sortie de la crise sanitaire?

D’abord, n’oublions pas le concept de taux de reproduction initial, le fameux R0. C’est un apport fondamental des maths à la compréhension des épidémies. Cet exemple illustre aussi que les maths mettent du temps à “percoler”, à irriguer les autres domaines. J’ai mis certains de mes résultats sur Twitter et on voit que certains résultats mathématiques peuvent aujourd’hui circuler beaucoup plus vite.

Comment vois-tu la suite?

Avec l’épidémiologie on est resté dans les sujets de l’équipe SMILE. On a accumulé un gros jeu de données qui va mettre du temps à être complètement analysé et sans doute être réutilisé par d’autres scientifiques. À mon avis, l’équipe va très probablement continuer à travailler dessus pour un ou deux ans au moins.

Je vais continuer à militer pour que nos gouvernants comprennent l’importance de la recherche sur le temps long. On voit à quel point on a été pris de court sur ce sujet du coronavirus. N’oublions pas que des recherches étaient en cours sur ces virus avant d’être interrompues par les financeurs. 

La recherche a besoin de temps long, de postes, de financements récurrents. Les chercheurs ne doivent pas passer leur temps à écrire des dossiers de financements mais à chercher !

Mais j’ai l’impression qu’on est les dindons de la farce; même après cet épisode où chercheurs et professions médicales ont été lourdement mis à contribution (de mon côté je travaillais de 7h à 23h pendant le confinement, à la limite du burn-out), on voit que la LPPR va passer en l’état, ça en dit long sur la façon dont la recherche est gouvernée.

As-tu un message pour les collègues?

Je veux remercier les collègues de MODCOV19, en particulier Jean-Stéphane Dhersin, Amandine Veber, Vincent Bansaye et Elisabeta Vergu avec qui j’ai été en contact direct. C’est grâce à leurs efforts pour améliorer le dialogue entre mathématiciens et biologistes depuis 10 ou 15 ans qu’ils ont pu monter rapidement la plateforme MODCOV19, certes constituée principalement de mathématiciens mais en liaison avec des modélisateurs biologistes. Le rapprochement entre maths et bio ne date pas du mois de mars 2020 ! La crise démontre la valeur de ce rapprochement.

 

 

 

Amaury Lambert

est mathématicien, professeur à Sorbonne Université et professeur associé au département de biologie de l’École normale supérieure. Il anime l’équipe SMILE au Collège de France. Sa recherche se situe à l’intersection de l’évolution, de l’écologie et des probabilités.

 

Interview réalisée le 12 juin 2020 par Jérôme Buzzi.
 

N.B. Les liens ont été choisis par la rédaction.

Publiée le 20.09.2020