Mathématiques & covid-19 : témoignage de Mircea T. Sofonea
Comment vous situez-vous par rapport à la communauté mathématique ?
Culturellement, j’en suis très proche ! D’abord, mes deux parents sont mathématiciens (enseignante et universitaire). Mais c’est en préparant le concours de l’Éns en biologie que j’ai décidé de m’orienter vers les mathématiques appliquées au vivant. Les sujets de mathématiques, rédigés pendant plusieurs années par Amaury Lambert, m’ont fait sortir des exercices calculatoires et révéler à la fois la puissance analytique et conceptuelle de la modélisation. J’ai découvert ensuite la littérature correspondante, à l’interface entre les deux domaines, essentiellement via les probabilités et les systèmes dynamiques.
Une fois à l’Éns, j’ai naturellement choisi de suivre les cours d’Amaury dans un cursus de biologie en contact avec des mathématiciens. C’est en voulant concilier ce nouvel intérêt avec celui, antérieur, pour l’évolution des maladies infectieuses, que j’ai quitté Paris pour Montpellier afin de réaliser une thèse en épidémiologie évolutive sous la direction de Yannis Michalakis et Samuel Alizon (tous deux DR CNRS). Il est à noter que la modélisation des maladies infectieuses est un sujet de recherche bien moins développé en France que dans les pays anglo-saxons, et qui reflète plus globalement une moindre percolation des approches quantitatives en biologie et médecine.
Ainsi, au Royaume-Uni il n’est pas rare de devenir épidémiologiste après un premier socle en mathématiques ou physique théorique. La transdisciplinarité de leur recherche en santé publique est historique.
Si la pandémie a été un coup de projecteur sur le rôle des mathématiques et de la modélisation dans ce domaine, elle a aussi montré le besoin pressant de développer ces aspects en France.
Que représentent les mathématiques dans vos recherches ?
Dans la formation en biologie ou en médecine, il y a l’idée que l’exploitation statistique des données suffit à trancher la plupart des questions. Les écueils liés à de mauvaises pratiques statistiques sont bien connus. Mais plus profondément, c’est une vision où les mathématiques n’arrivent qu’à la fin, pour établir la fameuse “valeur p”. Cela est très différent de ce qui se passe en physique où l’approche empirique et la modélisation s'enrichissent mutuellement. C’est la modélisation qui, avant même de disposer de données détaillées, permet de proposer un mécanisme, de vérifier une idée (proof of concept), d’une façon plus satisfaisante qu’un raisonnement purement verbal Quand le modèle présente un comportement non trivial, cela suggère que le phénomène réel, que l’on peut voir comme un analogue présentant davantage de degrés de liberté, peut lui aussi l’exhiber. La modélisation permet aussi de se focaliser sur les aspects essentiels du phénomène étudié et d’éviter d’être tributaire de variations peu informatives, peu utiles. Ce compromis entre réalisme et pertinence est à l’origine de l’étiquette “hors-sol” assignée à la modélisation, pourtant cette dernière n’a jamais l’ambition de décrire exactement le réel mais uniquement de répondre à une question scientifique particulière : mieux décrire et comprendre le phénomène en isolant une part du signal, ou en explorer le comportement futur en réduisant le nombre de degrés de liberté.
Avec qui collaborez-vous ?
Actuellement, les collaborations hors de l’équipe intéressent la communauté des biologistes médicaux, des virologues, avec qui nous travaillons principalement sur les données de dépistage, et en particulier au sujet des variants. Mais avant la pandémie, je participais fréquemment aux congrès où j'interagissais aussi bien avec des biologistes que des mathématiciens travaillant sur l’étude fondamentale des dynamiques épidémio-évolutives. Par exemple, en 2018 j’ai été invité en Finlande par la Société européenne de biologie mathématique et théorique, à l’occasion de l’année des biomathématiques. En France, et notamment au CIRM, plusieurs conférences internationales ont eu lieu ces dernières années en dynamique des populations, en épidémiologie, en biologie évolutive.
Alors vous êtes un mathématicien ?
Ma contribution aux mathématiques appliquées est marginale. En revanche je me sens vraiment à l'interface entre des mathématiciens, physiciens et informaticiens d’une part, et des biologistes, infectiologues et les chercheurs en santé publique en général d’autre part. On peut dire que les maladies infectieuses sont un des sujets scientifiques étudiés par le plus de disciplines différentes.
Ce qui m’intéresse c’est de faire dialoguer deux communautés qui sont encore cloisonnées en France. Je voudrais être un passeur, du recueil des données à leur analyse quantitative. Si la biologie des populations est traditionnellement très mathématique, les collaborations entre mathématiciens et médecins sont beaucoup plus rares. Il faut plusieurs années pour que les notions dégagées par les mathématiques soient utilisées en santé publique. Le nombre de reproduction, le fameux R, en est le contre-exemple le plus fameux ! Mais ceci est aussi vrai dans l’autre sens : certains travaux de mathématiques appliquées motivés par un problème biologique sont parfois amenés à faire des hypothèses que les données empiriques ont invalidées entre-temps. Pour que cette recherche transdisciplinaire produise des résultats de grande portée et éventuellement aboutisse à des applications, il est essentiel d’accélérer la translation des résultats entre les domaines. Et cet enjeu passe aussi par la formation.
Cette position est-elle permise par votre formation ?
Oui, les enseignements en classes préparatoires et à l’Éns permettent cela. Les cursus universitaires sont traditionnellement moins poreux, mais à Montpellier il existe une communauté d’enseignants-chercheurs et chercheurs, essentiellement rattachés à la biologie des populations, qui s’efforcent de proposer un enseignement approfondi et cohérent d’analyse quantitative et modélisation aux étudiants de biologie en licence et en master (la formation doctorale viendra plus tard je l’espère). Par rapport à un cursus mathématique, on insiste moins sur les preuves que sur les explorations computationnelles et le traitement statistique des données, le nerf de la guerre en sciences empiriques. On s’efforce de fournir à nos étudiants un bon sens mathématique, incluant les aspects aléatoires, souvent négligés et parfois contre-intuitifs.
Inversement, je pense que trop de formations mathématiques classiques délaissent la culture scientifique au sens large. On renonce à développer la curiosité vis-à-vis des problèmes actuels, dont certains peuvent déboucher sur des mathématiques originales. L’absence de cette culture peut constituer un frein à l’intégration de mathématiciens dans des équipes multidisciplinaires.
Ces questions de formation se posent bien sûr aussi pour le grand public. La crise sanitaire souligne le besoin vital d’une culture scientifique partagée par tous. On aurait aujourd’hui besoin d’une culture multidisciplinaire dès le secondaire comme socle indispensable pour comprendre les changements comportementaux nécessaires ou le caractère fallacieux de certains discours. Il y aura là des leçons à tirer pour l’éducation secondaire et supérieure, à rebours de l’abandon en terminale d’une des trois matières scientifiques permis par la récente réforme du lycée.
Avant la crise vous travailliez sur quoi ?
Je travaillais en épidémiologie évolutive des maladies infectieuses. Mon sujet de thèse portait sur l'évolution de la virulence en présence d'infections multiples. Il existe plus d'un millier de pathogènes de l'espèce humaine et de nombreuses infections sont en réalité des coinfections de plusieurs souches. Mon objectif était de bâtir un modèle générique à même de rendre compte de la diversité génétique et des interactions intra-hôte entre ces souches, et ce afin d’étudier l’impact de ces processus sur l’épidémiologie et l’évolution des maladies infectieuses, avec des applications potentielles en épidémiosurveillance et en contrôle.
Plus récemment je travaillais avec Ramsès Djidjou-Demasse (CR IRD) sur le couplage quantitatif entre pharmacodynamique et évolution de l’antibiorésistance. Ces modèles formulés en termes d'équations intégro-différentielles à partir des données biologiques ont des applications de santé publique évidentes : comment adapter les antibiothérapies pour minimiser ce risque d'antibiorésistance.
Et quand la crise est survenue ?
Quand le COVID est arrivé, ces recherches sont passées au second plan. Mon équipe, Evolution Théorique & Expérimentale, appartient à un laboratoire (MIVEGEC) commun Université de Montpellier-CNRS-IRD. Elle regroupe des agents à travers le monde, notamment dans les pays du Sud, aux profils très variés : biologistes, mathématiciens, bioinformaticiens.
Comme beaucoup, nous n’avons pas pris immédiatement la mesure de la gravité du COVID compte tenu de l’analogie avec le SRAS qui avait été rapidement contrôlé en 2003. Même si le SRAS était beaucoup plus létal, les symptômes précédaient la contagiosité. La possibilité d’une transmission présymptomatique du SARS-CoV-2 a tout bouleversé.
On a vu la situation en France se dégrader sans pour autant observer la production d’analyses quantitatives publiques à l’instar de nos collègues britanniques, par exemple au sujet de l’estimation du R01.
Nous nous sommes réunis le 12 mars pour jeter les bases des premiers modèles et simulations. Ces outils nous étaient familiers. A l'époque, il y avait peu de données : les décès hospitaliers, plus quelques données de dépistages. Les admissions en réa n'ont été régulièrement publiées qu'à partir du 19. On visait donc quelque chose de large sur le R0. On avait des estimations asiatiques autour de 2, mais le R0 dépend du comportement social, donc il était potentiellement différent en France. A partir de ce moment-là, nous n'avons plus fait que cela, avec des réunions d’équipe en visioconférence quotidiennes, sans compter le travail le week-end et une partie de la nuit.
Le 16, l'Imperial College publiait ses projections, le lendemain la France était confinée, et très vite s’est posé la question de l’efficacité de la mesure, de la date et de la hauteur du pic d’occupation hospitalière ainsi que du nombre de personnes déjà infectées. Quelques jours plus tard, le 6 avril, nous mettions en ligne la première version en libre accès de notre simulateur (COVIDSIM - depuis devenu COVIDici grâce au travail de Corentin Boennec) qui donnait les premiers éléments de réponse numérique à ces questions. Le même jour, Ramsès Djidjou-Demasse déposait sur medRxiv un travail devenu une référence du contrôle optimal appliqué à la pandémie. Ces recherches ont mobilisé toute l'équipe, y compris les étudiants. Les projections se sont affinées au fur et à mesure que Santé Publique France publiait les données nationales, en particulier au sujet de la cinétique hospitalière
Samuel Alizon (DR CNRS) qui anime on ne peut plus activement les travaux de l’équipe depuis le début, a alors doté cette dernière d’un site dédié à la pandémie pour y publier nos rapports réguliers et mettre à disposition du grand public des explications méthodologiques en français, illustrées par les dernières estimations nationales. Les collègues non spécialistes étaient enthousiastes, nous avons eu beaucoup de retours positifs puis la sollicitation des médias, ininterrompue depuis.
Parallèlement, nous étions plongés dans la littérature qui se constituait à une vitesse inédite, avec, occasionnellement, les écueils de l’urgence comme une lettre parue dans le Lancet début mars affirmant que 60% de la population allait être infectée. Cette proportion 1-1/R0 (soit 60% pour un R0=2,5) est bien connue: c'est la proportion minimale d'immunisés permettant d'empêcher une vague épidémique à partir de quelques cas. Or, une fois qu'il y a une vague épidémique, le nombre total de contaminations est bien plus important (la solution de log(1-x)+R0.x=0, soit 89%, toujours pour R0=2,5) . C'est un des résultats les plus classiques pourtant ! Cette erreur a été reprise un peu partout, jusque dans les discours d'Angela Merkel - au passage, les situations dans lesquelles l’épidémie a été très peu freinée, comme à Manaus au Brésil, ont bien montré que l’incidence cumulée pouvait dépasser le seuil d’immunité collective. Pour l’anecdote, le Lancet ne répondra négativement que trois mois plus tard à notre commentaire correctif, ne le jugeant alors plus d’actualité.
Y a-t-il eu un dialogue avec les décideurs ?
Au mois d’avril 2020, les auditions de l'Office parlementaire d’évaluation des choix scientifiques et techniques ont été un moment fort. Son actuel président, Cédric Villani, nous avait demandé d'exposer nos travaux. On a compris qu'il y avait quelque chose d’important à faire de ce côté, que nos outils, disponibles en ligne, pouvaient être utilisés par les décideurs. Bien sûr, aucune décision ne doit être prise sur la base d'un modèle isolé. Des approches complémentaires moins parcimonieuses explorant la stochasticité ou l’hétérogénéité, négligées dans les modèles compartimentés déterministes, doivent aussi être envisagées. Dans tous les cas, la confrontation aux données est essentielle afin d’améliorer la modélisation. Nous en discutons en particulier dans ce texte en français. En 2021, l’Office parlementaire nous a à nouveau sollicités au sujet de la dynamique épidémio-évolutive des variants du SARS-CoV-2.
Passée une première phase exploratoire correspondant à la mise en route des plates-formes de simulation et aux soumissions des premiers résultats (jusqu’à mai 2020), les équipes françaises de recherche en modélisation des maladies infectieuses se sont progressivement rapprochées et ont commencé à dialoguer régulièrement, notamment à la faveur d’initiatives fédératives comme MODCOV19. Cette dynamique témoignait d’un véritable élan de contribution collective à l’étude de l’épidémie, maintenu même lorsque celle-ci était moins inquiétante, au cours de l’été.
On peut dès lors regretter qu’il n’y ait pas eu davantage de sollicitation de cette force de recherche publique et que la préférence se soit parfois portée sur du conseil sans expertise dans le domaine.
L’expression mathématique de la plupart de modèles est relativement simple, mais la difficulté du travail réside dans l’intégration des données épidémiologiques et cliniques, l’inférence statistique, l’analyse de sensibilité qui et la prise en compte de nouveaux processus comme les variants et la vaccination. D’où la nécessité d’être autant familier de la littérature biomédicale que numéricienne.
Et maintenant ?
Nous continuons à travailler sur plusieurs aspects :
- l’amélioration de la quantification de la dynamique épidémiologique et les projections en temps réel,
- des approches stochastiques et spatialisées de l’épidémie en France,
- l’évolution virale avec la propagation des variants d’intérêt et la pression de sélection exercée par les vaccins.
À l’issue de cette pandémie, il sera important de construire un cadre de travail robuste pouvant être déployé face à une maladie émergente. On a déjà les capacités computationnelles et de modélisation (les outils existaient bien avant 2020). Par contre, il faudra établir à froid un cahier des charges pour prévoir la coordination et les priorités (notamment quelles données doivent être collectées au plus vite et comment) en vue de permettre une prise de décision à la fois précoce et informée. Le confinement, c'est une façon de s'acheter du temps mais c’est aussi un aveu d'échec à chaque fois qu’il est réitéré. Son usage doit se faire avec la plus grande parcimonie, d’où l’utilité des simulations, entre autres éclairages scientifiques.
Aujourd'hui a-t-on les données nécessaires ?
Certaines manquent encore à l’appel. Il n’y a toujours pas d'estimation française de l'intervalle sériel, uniquement des données asiatiques. Certes il n'y a pas de raison virologique que cela soit différent, mais sans cette hypothèse nous ne pourrions inscrire la dynamique dans le temps absolu.
Une dernière chose ?
Je ne pourrai jamais assez remercier tous les membres de l’équipe (listés ici ) pour le travail collectif réalisé sans relâche depuis des mois, malgré des moyens limités.
Enfin, je pense que cette crise sanitaire montre à quel point le dialogue entre les mathématiques et la santé publique constitue un enjeu d’avenir, dans le but de contenir de façon plus rapide et précise les risques infectieux émergents des prochaines décennies. Mais ce défi pourra difficilement être relevé sans un investissement à la hauteur dans cette thématique au niveau de la recherche et l’enseignement supérieur.
1- Le R0, ou le nombre de reproduction de base, est le nombre moyen de cas secondaires contaminés par une seule personne infectée.
Mircea Sofonea
est maître de conférences en épidémiologie & évolution des maladies infectieuses à l'université de Montpellier et responsable de l'équipe ETE, UMR MIVEGEC - Univ. Montpellier, CNRS, IRD
Interview réalisée le 04 décembre 2020 par Jérôme Buzzi. Révision du 04 avril 2021.