Afficher les dates des mesures restrictives nationales
* Le modèle utilise les données d'admission en réanimation pour inférer les paramètres et produire les résultats ci-dessous.
** Les projections réalisées se basent sur la tendance du modèle durant les 12 (resp. 21) derniers jours pour la tendance courte (resp. longue), des erreurs sont possibles, les résultats sont à prendre avec précaution.
*** Les limites de capacité d'accueil affichées dans l'onglet "Occupation des services de soins critiques" prennent en compte uniquement les lits de réanimations et omettent d'autres types de lit (soins intensifs, surveillance continue) que certains infectés peuvent occuper

Analyse fine de l'épidémie de Covid-19

Groupe de modélisation de l'équipe ETE (Laboratoire MIVEGEC, CNRS, IRD, Université de Montpellier) 22/01/2021

drawing

Préambule

Ce logiciel, comme l'ensemble de nos travaux, est à visée académique, fruit d'un travail de recherche fondamentale indépendant des autorités compétentes en matière de santé. En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus.

Les travaux de l’équipe de modélisation de l’équipe ETE ont été rendus possibles par la liberté de recherche que les postes permanents et les crédits récurrents garantissent. Tout ceci est remis en cause par la récente loi sur la recherche. Pour plus d’informations, voir par exemple l’analyse du Groupe Jean-Pierre Vernant, la note budgétaire de Rogue ESR ou le rapport officiel du CESE.

Pourquoi ce logiciel ?

Ce site internet diffère de la plupart de ceux qui existent sur l'épidémie de COVID-19 en France car il est basé sur un modèle épidémiologique détaillé (décrit dans ce manuscrit en anglais).

drawing

La plupart des sites qui présentent des analyses et des tendances se basent sur des modèles purement mathématique (pour simplifier, ils recherchent la courbe la plus proche de tous les points), le notre met en jeu le cycle de vie du virus et s'appuie sur des connaissances supplémentaires liées à l'intervalle sériel ou encore la proportion de létalité ou la durée d'hospitalisation.

Le second intérêt de ce site est que les estimations du modèle sont déclinées aux niveaux régional et départemental.

Attention, plus on regarde une échelle fine, moins la loi des grands nombres s'applique, et plus les prévisions sont à prendre avec précautions ! De plus, des changements intenses (confinement, déconfinement) perturbent aussi les prévisions.

Contexte

Depuis sa première vague épidémique qui a touché la France dans la deuxième quinzaine de janvier 2020, le SARS-CoV-2 se transmet largement causant des milliers de décès et de dizaines de milliers de formes graves. La majorité des infections causant des formes légères de l'infection, le suivi en est difficile. En particulier, les cas dépistés ne recensent qu'une faible proportion des infections.

Les chiffres hospitaliers, notamment le nombre de personnes en soins critiques permettent d'avoir un suivi plus exhaustif de la population infectée. Toutefois, ils ont deux limites. D'une part, il est délicat de lier le nombre de personnes développant des formes graves et le nombre d'infections car la virulence dépend de l'âge et aussi de la prise en charge. De plus, il s'écoule en moyenne deux semaines entre l'infection et une éventuelle hospitalisation.

Pour analyser au mieux les données d'incidence (nombre de nouveaux cas par jour) et de prévalence (nombre de cas à un moment donné) de cas sévères mis à disposition grâce au travail de Santé Publique France, nous avons développé un modèle mécanistique détaillé (nous sommes sans nouvelles du manuscrit soumis le 31 juillet 2020 au journal Epidemics et toujours en revue). Ce modèle s'est révélé très approprié pour capter des tendances au niveau national, par exemple formuler début septembre des scénarios qui se sont malheureusement révélés exacts. En revanche, ce modèle ne pouvait pas prendre en compte les disparités (parfois très fortes) entre régions ou, plus encore, entre départements.

Nous avons réutilisé le cycle de vie de l'infection, tel que décrit dans notre Rapport 9, pour réaliser une inférence à un niveau plus fin. Les détails méthdologiques se situent en fin de rapport mais quelques points importants sont les suivants :

  • les estimations sont réalisés en deux phases, une première utilisant les cas sévères ainsi que les décès afin d'affiner les mesures, puis une seconde phase se basant uniquement sur les cas sévères (admissions en réanimation).

  • les paramètres directement liés au virus (\(\mathcal{R}_0\), durée avant hospitalisation) sont d'abord calculés au niveau national et supposés identiques dans toutes les régions et départements.

  • au niveau national, des intervalles de temps ad hoc sont définis selon les grands événements nationaux (confinements, couvre-feux, vacances scolaires) alors qu'au niveau régional ou départemental nous alternons entre des événements nationnaux (uniquement le premier confinement dans la version actuelle) et un découpage régulier de periodes de 7 jours pour s'adapter aux spécificités territoriales de chaque lieu. Cette approche induit une valeur de R(t) pour chaque semaine, ce qui provoque un résultat en dent de scie. La courbe “réelle” du taux de reproduction étant certainement plus lisse.

  • dans les départements où le nombre de cas est faible, on utilise directement le nombre de cas par jour pour l'inférence et non plus une moyenne glissante de 7 jours,

  • l'extrapolation de la tendance à 15 jours est réalisée à partir des chiffres d'hospitalisation des 12 jours précédents pour la tendance courte : l'avantage est que cela permet de rapidement détecter un changement de tendance, le risque est que cela peut amplifier une tendance passagère.

  • l'extrapolation de la tendance à 15 jours est réalisée à partir des chiffres d'hospitalisation des 21 jours précédents pour la tendance longue : l'avantage est que cela permet de moins s'exposer aux tendances passagères, le risque est de manquer une dynamique nouvelle.

En résumé, ces résultats sont à prendre à titre indicatif, en particulier si le nombre de cas sévères est faible.

Résultats représentés

Sur chacun des graphiques, les points sont les valeurs raportées par Santé Publique France (data), la courbe lisse est l'estimation médiane du modèle (inférence) et la zone colorée l'intervalle de confiance à 95 % du modèle.

Les variables présentées sont les suivantes :

  • nombre de nouveaux décès par jour (hors EHPADs) : ce chiffre dépend beaucoup de la proportion de létalité qui peut varier,

  • nombre cumulé de décès (hors EHPADs),

  • nombre journalier des nouvelles admissions en réanimation pour COVID-19 (les données utilisées pour l'inférence),

  • nombre de personnes en réanimation : ce chiffre dépend beaucoup de la durée des séjours en réanimation,

  • nombre de reproduction temporel (\(\mathcal{R}_t\)) : nombre moyen de personnes infectées par une personne infectée au cours de son infection pour un jour donné (s'il est supérieur à 1, l'épidémie est en croissance dans le département),

  • nombre de cas cumulés : ce chiffre est une estimation du nombre total d'infections ayant eu lieu depuis le début de l'épidémie,

  • nombre de nouveaux cas : ce chiffre dépend énormément de la proportion des cas qui conduisent à une hospitalisation,

  • nombre de personnes porteuses du virus : lui aussi dépendant de nombreux facteurs délicats à inclure dans le modèle,

  • nombre de personnes vaccinées : chiffre annoncé de personnes vaccinées (les données ne sont pas disponible au niveau départemental).

L'interface permet aussi la visualisation de l'avancé de la vaccination par région.

Méthodes détaillées

Pour des précisions concernant le modèle épidémiologique, on peut se référer à la prépublication de Sofonea et alii. En revanche, la méthode d'inférence statistique utilisée ici diffère en plusieurs points. Le plus important est que nous utilisons une approche bayésienne (via le package BayesianTools de R) et non plus une approche par maximum de vraisemblance.

Certains paramètres sont supposés identiques à tous les niveaux (national, régional et départental) notamment les paramètres liés au système hospitalier. La recherche de valeur pour ces paramètres s'effectue alors dans une fourchette obtenue en entendant l'intervalle de confiance de la valeur du paramètre à l'échelle nationale [intervalle de confiance 2.5-97.5% \(\pm\) 10%].

Pour d'autres paramètres, nous supposons qu'ils dépendent de la localité. C'est le cas pour les taux de contact par période, ou la date d'arrivée de l'épidémie (dans le département, la région ou le pays). Un intervalle de crédibilité est fournie pour ces paramètres. On suppose aussi que les taux de contacts ne peuvent pas être très inférieur à ceux observés lors du premier confinement. D'autre part, on suppose aussi que ces taux ne peuvent pas être supérieur à ceux observés avant l'application des premières mesures de contrôle.

Nous utilisons une distribution uniforme sur ces intervalles pour créer une première distribution a priori. Une première inférence est alors réalisée pour permettre à la simulation de cibler des intervalles de valeurs permettant au modèle de capturer la tendance des décès mais aussi des cas sévères.

La distribution obtenue est utilisée comme distribution a priori pour une nouvelle inférence en utilisant les données de cas sévères de COVID-19, ces données correspondent à peu près aux patient⋅e⋅s en réanimation.

La prévision est donnée sur les deux prochaines semaines. Celle-ci se base sur le nombre de reproduction temporel de l'épidémie le plus récent. L'interface offre deux options :

  • la tendance courte se base sur les chiffres des admissions en réanimation des 12 derniers jours, elle est très sensible aux variations récentes et peut se révéler trompeuse,

  • la tendance longue se base sur le 21 derniers jours, elle est moins sensible aux variations récentes, mais elle sera plus lente à détecter une variation de l'épidémie.

Données utilisées

Les données realtives à la mortalité cumulée ainsi qu'à l'occupation des services de soins intensifs dans les départements, régions et à l'echelle de la France proviennent de Santé Publique France disponible sur data.gouv.fr et peuvent être téléchargées ici

Les données realtives à la mortalité quotidienne ainsi qu'aux admissions dans les unités de soins intensifs au sein des départements, régions et à l'echelle de la France proviennent de Santé Publique France disponible sur data.gouv.fr et peuvent être téléchargées ici

Les données concernant la population par tranche d'age et par département, région et à l'echelle de la france peuvent être consultées ici

Sources et remerciements

Références

  • [preprint] Bastien Reyné, Gonché Danesh, Samuel Alizon, Mircea T. Sofonea (2020, medRxiv) Rt2: computing and visualising COVID-19 epidemics temporal reproduction number [PDF]

  • [preprint] Mircea T. Sofonea, Bastien Reyné, Baptiste Elie, Ramsès Djidjou-Demasse, Christian Selinger, Yannis Michalakis, Samuel Alizon (2020, medRxiv) Epidemiological monitoring and control perspectives: application of a parsimonious modelling framework to the COVID-19 dynamics in France [PDF]