COVID-19 BioSP Webpage

COVID-19 BioSP Webpage

Eclairages sur ce que révèlent les données Références et liens

3 avril 2020 | M. Ribaud, O. Guilmin | A quelle date l'ensemble des lits de réanimation et de soin intensif dans le Vaucluse seront occupés ?

Au 2 avril, le Vaucluse compte 22 lits en réanimation et soin intensif (RSI) occupés sur 43. En s’appuyant sur l'évolution temporelle des nombres de lits RSI occupés dans les autres départements (source : Santé publique France), l'objectif est d'estimer la date à laquelle les 43 lits RSI du Vaucluse seront occupés. Une démarche en 3 étapes est appliquée : (1) La première étape consiste à regrouper les départements similaires en termes de démographie. Un clustering est effectué sur les variables suivantes : densité de population, proportions des moins de 20 ans, des 20-39 ans, des 40-59 ans, des 60-74 ans et des plus de 75 ans par départements. Cette classification supervisée mène à un cluster incluant le Vaucluse de 23 départements. (2) La seconde étape consiste à décaler les courbes d’évolution du nombre de lits RSI afin d’identifier les départements du "cluster Vaucluse" en avance par rapport au Vaucluse. Cette étape s’appuie sur l’hypothèse que les courbes suivent une évolution parabolique en fonction du temps (c'est-à-dire en t+t2, où t représente le temps). Le décalage optimal pour chaque département est identifié en maximisant le R2 de la régression. La figure 1 montre l’évolution du ratio du nombre de lits utilisés en réanimation en fonction du temps avant et après le décalage temporel. (3) La dernière étape consiste à calculer la régression sur la base des données du Vaucluse. Le Vaucluse atteindrait les 43 litrs RSI occupés autour du 10-11 avril.

 

Figure 1: Evolution du ratio du nombre de lits RSI occupés en fonction du temps et par département du "cluster Vaucluse" (avant le décalage temporel à gauche et après le décalage à droite). 

 

Figure 2: Nombre de lits RSI occupés en fonction de la date (points bleus) et prédiction (ligne orange) pour le département du Vaucluse superposés à la prédiction pour le "cluster Vaucluse" visible également sur la figure 1 (à droite).

 

2 avril 2020 | S. Soubeyrand | Quelle prédiction pour les Etats-Unis d'Amérique ?

Les USA sont avec une forte probabilité sur une trajectoire italienne (données et méthodologie similaire à celles du post du 28 mars). Cependant, le faible nombre de prédicteurs disponibles (c'est-à-dire le nombre de régions du monde "en avance" sur les Etats-Unis) et la probable hétérogénéité spatiale (c'est-à-dire entre états) de la mortalité dûe au COVID-19 aux USA, doivent être pris en compte pour évaluer notre prédiction comme relativement incertaine.

28 mars 2020 | S. Soubeyrand | Sur quelles trajectoires sont le Royaume Uni et les Pays-Bas ? 

Appliquons la méthodologie présentée dans le post du 25 mars aux courbes de mortalité du Royaume Uni d'une part et des Pays-Bas d'autre part (source des données : Johns Hopkins University Center for Systems Science and Engineering). Les prédicteurs considérés sont les courbes de mortalité de l'Italie, l'Espagne, la province d'Hubei, la France et l'Iran. Le Royaume Uni serait sur une trajectoire italienne, les Pays-Bas sur une trajectoire italienne (proba. = 0.56) ou française (proba. = 0.44). Ceci dit, en ayant ramené les tailles des populations des pays utilisés comme "prédicteurs" au niveau de la taille de population du pays d'intérêt (en l'occurrence le Royaume Uni ou les Pays-Bas), on perçoit, au vu des décalages temporels, que les Pays-Bas sont en avance par rapport au Royaume Uni et sont synchrones avec la France (décalage temporel nul).  Ainsi, le "prédicteur français" qui a du poids pour les Pays-Bas ne permet pas en réalité de prédire le futur des Pays-Bas et il faut se rabattre sur le seul "prédicteur italien". Tailles des populations (en millions d'habitants) : UK 65.76, NL 17.28, IT 60.36, SP 46.93, Hubei 59.17, FR 67.80, Iran 82.02. 

26 mars 2020 | L. Roques | Vers un changement de régime de la dynamique du nombre de morts : confirmation d'un infléchissement de la croissance exponentielle

Nombre de décès en France vs Italie au 25 mars 2020 (source : Johns Hopkins University Center for Systems Science and Engineering ; extrait des données). Les données françaises restent comparables aux données italiennes, toujours avec un décalage de 13 jours. Le ralentissement de la croissance exponentielle que nous avions anticipé pour la France il y a trois jours semble se confirmer. En Italie, le taux de croissance exponentielle continue de décroître.

25 mars 2020 | S. Soubeyrand | Quel devenir pour la dynamique du nombre de décès en région PACA ? 

Reprenons le principe du graphique dans le post du 24 mars et appliquons le au niveau régional français. On cherche à prédire la dynamique future en PACA à l'aide des dynamiques des régions qui devancent PACA (source : ARS ; les données nécessaires à cette analyse en Ile de France ne sont pas disponibles). En ajustant un modèle de mélange aux données récupérées jusqu'au 24 mars (et ce en tenant compte du décalage temporel pour chaque région devançant PACA), on peut estimer la probabilité que la dynamique en PACA suive chacune des dynamiques de mortalité en compétition, en l'occurrence celles des régions Auvergne-Rhône-Alpes, Bourgogne-Franche-Compté, Grand-Est et Hauts-de-France.

Résultat. Le prédicteur le plus probable (proba. = 0.73) est celui fourni par la dynamique de Bourgogne-Franche-Compté, lorsque l'on ramène les tailles de populations au niveau de PACA. Cependant, la dynamique future en PACA pourrait également ressembler à celle moins rapide de la région Auvergne-Rhône-Alpes avec une probabilité de 0.27. L'accumulation des données dans les jours à venir permettra d'affiner la prédiction.

24 mars 2020 | S. Soubeyrand | Quel pays peut servir de prédicteur pour la dynamique épidémique française ? 

Nombre de décès en France et dans les pays / régions devançant la France en terme de nombre de décès (source : Johns Hopkins University Center for Systems Science and Engineering). La dynamique de chaque autre pays / région a été décalée temporellement en considérant la date à laquelle a été franchie la valeur des 860 décès (c'est-à-dire le nombre de décès en France le 23/03/2020).

Variantes du graphique : sans lissage ; avec lissage (± 5 jours max) ; en ramenant les tailles de populations au niveau français

Interprétation. La dynamique française (bleue) est relativement proche de la dynamique italienne (verte) sur les 10 derniers jours. La courbe de l'Italie pourrait donc être le meilleur prédicteur parmi les courbes empiriques disponibles. Sur la variante du graphique où la taille de la population de chaque pays / région est ramenée au niveau français, la courbe française est légèrement moins pentue que celle de l'Italie, ce qui laisse suggérer que le "prédicteur italien" sur-estime légèrement le futur de la dynamique française. A suivre...

23 mars 2020 | L. Roques | Vers un changement de régime de la dynamique du nombre de morts ? 

Nombre de décès en France vs Italie au 22 mars 2020 (source : Johns Hopkins University Center for Systems Science and Engineering ; extrait des données). Les données françaises sont représentées avec un décalage de 13 jours. On note un ralentissement de la croissance exponentielle du nombre de décès en Italie autour du 10 mars. Si la dynamique Française suit la dynamique Italienne, on devrait observer ce ralentissement dans les tous prochains jours en France. Si ce n'est pas le cas, on s'orientera vers une croissance plus rapide en France qu'en Italie.

22 mars 2020 | L. Roques | Modèle SIR mécanistico-statistique pour l'estimation du nombre d'infectés et du taux de mortalité par COVID-19

L'unité BioSP est spécialisée dans le développement d'approches dites 'mécanistico-statistiques', avec plusieurs applications à des invasions biologiques et des questions d'épidémiologie végétale (Aedes albopictus, Megastigmus schimitscheki, Ophraella communa, Thaumetopoea pityocampa, Xylella fastidiosa, ...). Ce formalisme repose sur un couplage entre (1) un modèle mécaniste décrivant un processus non observé, (2) un modèle probabiliste décrivant le processus de collecte des données conditionnellement à la solution du modèle mécaniste et (3) une méthode statistique d'estimation des paramètres du modèle mécaniste. Nous appliquons ici cette méthode, avec un modèle mécaniste d'EDO de type SIR, pour tenter d'estimer  le nombre réel de personnes infectées par le COVID-19 et le taux de mortalité associé en France.

Principaux résultats. Nous trouvons que le nombre réel d'infectés en France est bien supérieur aux observations, avec un facteur x5  (IC 95% 3.5-7.8), et que le taux de létalité au 17 mars est de  0.5% (IC 95% 0.3-0.8), réajusté à 0.8% en prenant en compte les données des EHPAD.   Lien vers le rapport de recherche PDF.

22 mars 2020 | L. Roques | Mechanistic-statistical SIR modelling for early estimation of the actual number of cases and mortality rate from COVID-19

BioSP lab is specialized in the development of 'mechanistic-statistical' approaches, with several applications to biological invasions and questions of plant epidemiology (Aedes albopictus, Megastigmus schimitscheki, Ophraella communa, Thaumetopoea pityocampa, Xylella fastidiosa, ...). This formalism is based on a coupling between (1) a mechanistic model describing an unobserved process, (2) a probabilistic model describing the data collection process conditional on the solution of the mechanistic model and (3) a statistical method for the estimation of the parameters of the mechanistic model. We apply this method here, with a SIR (ODE) mechanistic model, to estimate the actual number of cases and death rate from COVID-19 in France.

Main results. The actual number of infected cases in France is probably much higher than the observations: we find here a factor x5 (95%-CI: 3.5-7.8), which leads to an infection fatality rate of 0.5% (95%-CI: 0.3-0.8) at the end of the observation period. Adjusting for the number of deaths in nursing homes, we obtain an IFR of 0.8%. Link to the PDF research report.

Baudrot V., Rey J.-F. (2020). COVID-19 spatio-temporal mapping. BioSP Shiny Apps.

Roques L., Klein E., Papaïx J., Soubeyrand S. (2020). Modèle SIR mécanistico-statistique pour l’estimation du nombre d’infectés et du taux de létalité par COVID-19. [Preprint]. .

Roques L., Klein E., Papaïx J., Sar A.,  Soubeyrand S. (2020). Using early data to estimate the actual infection fatality ratio from COVID-19 in France. [Preprint]. .