Dynamique épidémique du COVID-19 : Modélisation raisonnée de l’évolution des proportions cumulées de cas, estimation des dates de fin des vagues épidémiques et des taux d’infection des populations dans différents pays

Travaux menés et dirigés par Patrick Gasqui – Contact: patrick.gasqui@inrae.fr

Commentaires et diffusion: Maude Jacquot, Anais Bompard, Thibaut Lurier, Gwenaël Vourc’h, Xavier Bailly.

Dernière mise à jour le Lundi 29 juin 2020

Note: Ce travail est en cours et n’a pas été soumis à une évaluation par les pairs. Nous travaillons actuellement sur la validation du modèle et à l’amélioration de ce travail, ce qui se traduira par des mises à jour régulière de la page. Notre ambition est de proposer des éléments de réflexion en temps de crise. Contenu additionnel disponible ici.

RÉSUMÉ

Ce travail vise à modéliser l’allure des proportions d’individus confirmés actifs, guéris et décédés de COVID-19 dans différents pays au cours du temps. Le modèle développé semble efficace pour capter la dynamique générale des vagues épidémiques, et pour en déduire des estimations de leurs durées ainsi que des taux de décès et d’infection des populations. Plus que les prédictions obtenues, ce sont donc les variations de ces prédictions au cours du temps qui permettent d’approcher la dynamique évolutive du processus épidémique et donc d’évaluer les conséquences des mesures prises lutter contre la maladie. Dans chaque pays, le risque que l’épidémie reprenne semble important si les levées de confinement sont trop précoce au regard des dynamiques des vagues épidémiques, et ceci d’autant plus si les taux d’infection des populations sont aussi faibles que prédits. Des améliorations de notre approche sont encore nécessaires afin notamment d’évaluer et tester les différentes mesures de précaution prises dans les différents mais ce modèle présente l’avantage de pouvoir être mis en œuvre simplement, d’être évolutif et offre l’opportunité de pouvoir suivre quotidiennement l’évolution du processus épidémique.

INTRODUCTION

Suite à l’émergence du nouveau coronavirus (SARS-CoV-2) dans la province de Wuhan en Chine en décembre 2019, puis à son introduction et propagation sur plusieurs continents dont l’Europe, une pandémie a été déclarée par l’OMS le 12 mars 20201 (Figure 1) .

Figure 1 : Vagues épidémiques mondiales. Proportion des cas confirmés de Covid-19 étant cas actifs, guéris et décédés au cours du temps depuis le 22 Janvier 2020 dans le monde. La première vague correspond à la propagation du virus SARS-CoV-2 en Chine. La seconde reflète la propagation du virus dans le reste du monde, notamment en Europe et aux États-Unis. Si l’influence du climat intervient réellement sur la propagation épidémique2, comme cela a déjà été identifié pour l’effet saisonnier du virus de la grippe influenza3, on peut s’attendre à une troisième vague épidémique touchant l’hémisphère sud et notamment l’Afrique, l’Australie et l’Amérique du Sud. Ces trois vagues avaient déjà été observées lors de la pandémie de grippe espagnole en 1918 et au début de 1919.

Selon les états, l’identification des cas symptomatiques s’est mise en place plus ou moins rapidement. Des mesures de précautions et de distanciation sociale, allant souvent jusqu’au confinement des populations, ont été prises selon des modalités et à des stades de l’épidémie variables. Cependant, les données disponibles ont été rapidement mises à disposition de tous4 permettant une analyse rapide de cette situation de crise.

L’élaboration d’un modèle épidémiologique classique (à compartiments de type Sensibles-Infectieux-Retirés – SIR) robuste, fiable et généralisable des dynamiques épidémiques est difficile en raison des caractéristiques nouvelles et inconnues de cette pandémie et de la grande variabilité des mesures prises pour contrer la progression du virus dans le monde5,6. Malgré tout, il est primordial de disposer de modèles permettant de prédire l’évolution de l’épidémie au sein des états afin d’éclairer les décisions de lutte à prendre contre la maladie. Ces modèles peuvent notamment donner des estimations sur la durée probable de l’épidémie. C’est une donnée stratégique pour pouvoir proposer des dates de levée des différents confinements mis en place au sein de nombreux pays qui soient les plus appropriées possibles. Ces mesures radicales ont, entre autre, un impact considérable sur l’économie et la santé mentale des populations et doivent donc être maintenues le moins longtemps possible. Toutefois, si les levées sont effectuées trop tôt, un redémarrage du processus épidémique pourrait conduire à une seconde vague épidémique dont l’ampleur pourrait dépasser la première. 

Nous avons donc développé ici un modèle à compartiment visant à estimer la durée de l’épidémie au sein d’un pays, à partir de critères objectifs pouvant caractériser la phase finale de celle-ci, et cherché à estimer la proportion de la population ayant alors été infectée en fonction des situations locales. 

MATÉRIEL ET MÉTHODES

Les données

Les données utilisées sont les nombres cumulés de “cas confirmés”, “cas guéris” et “cas décédés” par jour et par pays depuis le 22 janvier 2020, compilées quotidiennement par le CSSE (Center for Systems Science and Engineering) de l’université Johns Hopkins aux États-Unis4 dont une visualisation est disponible ici. Les résultats présentés ici ont été obtenus en utilisant les données jusqu’au 28 Juin 2020 inclus.

Le modèle

Toutes les informations concernant la construction du modèle et l’estimation des paramètres sont disponibles ici. Les scripts permettant la mise en œuvre du modèle et la reproduction des figures sont en accès libre sur github, cliquez ici pour les obtenir.

RÉSULTATS

Pour de nombreux pays, le modèle s’ajuste bien aux dix dernières valeurs observées pour les proportions de « cas actifs » et les proportions cumulées de « cas guéris » et de « cas décédés ». Ceci nous permet d’utiliser d’ores et déjà le modèle pour faire des estimations bien qu’une validation plus poussée de celui-ci soir en cours.

Pour l’Espagne par exemple, la proportion de « cas décédés » est actuellement de 11% (ZD apparent actuel = 0.11), et l’estimation en fin d’épidémie est de 14% (ZD apparent final = 0.14) (Figure 2). On estime une date de croisement des courbes de proportions de « cas actifs » (ZA) et de « cas guéris » (ZG) qui a eu lieu le 10 mai, et la date de passage de la proportion de « cas actifs » ZA sous les seuils de 0.01 ou 0.001 devraient se produire respectivement le 26 février 2021 et le 7 août 2021 (Figure 2). Une augmentation soudaine de cas explique le décrochage observé pour la courbe des proportions de « cas actifs ».

Figure 2 : Résultats du modèle pour l’Espagne. Proportions des cas confirmés étant « actifs », « guéris » ou « décédés » au cours du temps. Les données observées sont tracées en traits pleins. Les traits pointillés correspondent à la dynamique prédite avec le modèle. Dans l’encadré rouge à gauche se trouve la proportion de décès à la dernière date pour laquelle des données sont disponibles (ZD apparent actuel). Dans celui de droite, la proportion de décès estimée par le modèle en fin d’épidémie (ZD apparent final). Les deux barres verticales en pointillés noires correspondent aux dates ou la proportion de « cas actifs » (ZA) pourrait devenir inférieure à 0.01 et 0.001.

En Italie, la vague épidémique a rapidement concerné la propagation virale intra-communautaire. Le croisement des deux courbes des proportions ZA et ZG qui a eu lieu autour de la date du 27 avril, et la date de passage de la proportion ZA de « cas actifs » sous les seuils de 0.01 ou 0.001 est estimée aux dates respectives du 23 août et du 25 octobre. La proportion ZD de « cas décédés » est actuellement de 0.15, et l’estimation en fin d’épidémie est de l’ordre de 15%.

Figure 3 : Résultats du modèle pour l’Italie. Proportions des cas confirmés étant « actifs », « guéris » ou « décédés » au cours du temps. Les données observées sont tracées en traits pleins. Les traits pointillés correspondent à la dynamique prédite avec le modèle. Dans l’encadré rouge à gauche se trouve la proportion de décès à la dernière date pour laquelle des données sont disponibles (ZD apparent actuel). Dans celui de droite, la proportion de décès estimée par le modèle en fin d’épidémie (ZD apparent final). Les deux barres verticales en pointillés noires correspondent aux dates ou la proportion de « cas actifs » (ZA) pourrait devenir inférieure à 0.01 et 0.001.

En Suisse, la vague épidémique semble être plus courte (Figure 4). Elle a dépassé le croisement des deux courbes à la date estimée du 16 avril. La date de passage de la proportion ZA de « cas actifs » sous les seuils de 0.01 et de 0.001 est estimée respectivement aux dates du 29 juin et du 6 août. La proportion de « cas décédés » est de 0.06 actuellement, et l’estimation en fin d’épidémie est de l’ordre de 6%. 

Figure 4 : Résultats du modèle pour la Suisse. Proportions des cas confirmés étant « actifs », « guéris » ou « décédés » au cours du temps. Les données observées sont tracées en traits pleins. Les traits pointillés correspondent à la dynamique prédite avec le modèle. Dans l’encadré rouge à gauche se trouve la proportion de décès à la dernière date pour laquelle des données sont disponibles (ZD apparent actuel). Dans celui de droite, la proportion de décès estimée par le modèle en fin d’épidémie (ZD apparent final). Les deux barres verticales en pointillés noires correspondent aux dates ou la proportion de « cas actifs » (ZA) pourrait devenir inférieure à 0.01 et 0.001.

Pour la France, les estimations du modèle restaient problématiques du fait du regroupement tardif d’informations provenant du milieu non-hospitalier illustré par l’ajout brutal de données comme pour les « décès » en EHPAD (Figure 5A). Depuis la décroissante de la proportion de cas actifs est très lente, comme pour la Belgique (Figure 5h), alors que ces deux pays ont entamé leur levée du confinement ; la vague épidémique dans ces deux pays semble vouloir durer jusqu’en 2022, à moins qu’un vaccin soit élaboré et utilisé d’ici là. 

Pour le Canada, il semble y avoir une sous-estimation du nombre cumulé de « décès », au début de l’épidémie (Figure 5B). Dans ce  pays comme en France, la variabilité de l’épidémie est grande selon les régions en France, et selon les provinces et territoires au Canada. Pour les USA, la vague épidémique est encore dans sa phase ascendante, les estimations ne sont donc pas encore stabilisées et fiables (Figure 5C). Pour le Portugal, un ajout « brutal »  du nombre de guérison modifié dernièrement, permet d’espérer une évolution favorable  de l’épidémie (Figuret 5D). 

Pour les pays ayant largement débuté leur déconfinement, comme l’Autriche, le Danemark, l’Allemagne et la Suisse, malgré un léger « rebond » de cas, ce qui s’est traduit par une pente plus faible de la proportion des cas actifs, et un décalage entre la date de croisement estimée et celle observée, l’épidémie est en voie d’être totalement maîtrisée. La durée de l’épidémie semble avoir été modérément  rallongée pour ces pays. Pour l’Italie, malgré des conséquences importantes en termes épidémiques, l’évolution est aussi favorable avec une fin d’épidémie estimée pour la fin du mois d’octobre 2020 (Figure 3). Pour l’Espagne, par contre, le déconfinement semble avoir été suivi d’une augmentation du nombre de cas actifs, et donc entraînée une modification de la dynamique épidémique qui semble maintenant moins favorable (Figure 2). La fin de l’épidémie pour ce pays est estimée seulement pour le milieu de l’année 2021.

Figure 5 : Résultats du modèle pour la France (A), le Canada (B), les États-Unis (C), le Portugal (D), le Danemark (E), l’Autriche (F), l’Allemagne (G) et la Belgique (H). Proportions des cas confirmés étant « actifs », « guéris » ou « décédés » au cours du temps. Les données observées sont tracées en traits pleins. Les traits pointillés correspondent à la dynamique prédite avec le modèle. Dans l’encadré rouge à gauche se trouve la proportion de décès à la dernière date pour laquelle des données sont disponibles (ZD apparent actuel). Dans celui de droite, la proportion de décès estimée par le modèle en fin d’épidémie (ZD apparent final). Les deux barres verticales en pointillés noires correspondent aux dates ou la proportion de « cas actifs » (ZA) pourrait devenir inferieure à0.01 et 0.001.

Par contre pour le Royaume-Uni, les Pays-Bas et la Suède, il semble y avoir un problème de disponibilité des cas de guérison au cours du temps ; le modèle ne peut pas s’ajuster correctement aux données. 

En résumé, on obtient donc pour chaque pays, les différentes estimations issues de la modélisation de la vague épidémique principale, que l’on résume dans le tableau suivant :

Table 1. Résumé des résultats du modèle. p1 et p2 sont respectivement les estimations des taux de décès et de guérison du modèle de SEDO. ZD est la proportion cumulée de « décès apparent », ZDF est la proportion cumulée prédite de « décès » à la fin de la vague épidémique. ZA est la proportion de « cas actifs » et ZG la proportion cumulée de « cas guéris ».

Certains pays ont indiqué des dates de déconfinement au moment où le pic de cas cumulés ou la date de croisement des deux courbes des « cas actifs » et « cas guéris » a été atteint. En l’absence de connaissance sur l’effectif du compartiment de la population des « individus infectés sans symptômes », ce processus de déconfinement reste risqué. Cette incertitude doit donc être prise en compte dans la stratégie des actions à mettre en place au moment du déconfinement s’il a bien lieu à cette date. La chine a initié son déconfinement lorsque l’effectif des « cas actifs » s’est approché de zéro, soit en général près de deux semaines après le croisement des deux courbes ZA et ZG (plus d’information sur la vague épidémique en Chine ici).

Les estimations de la proportion d’individus ayant été infectés par rapport à l’ensemble de la population du pays, pour trois « taux de décès réel » (TDR) en intégrant l’estimation de l’effectif cumulé des individus « infectés sans-symptômes » ayant guéris, sont présentées en Table 2.

Table 2. Estimations des proportions d’individus ayant été infectés à ce jour par rapport à l’ensemble de la population de différent pays, selon trois taux de létalité globale dans la population générale : 0.5, 1 et 2%.

On peut aussi visualiser ces estimations de la proportion des individus ayant été infectés par rapport à l’ensemble de la population du pays, au cours du temps (Figure 6). Cela montre que ces estimations ont tendance à augmenter et vont tendre vers une limite maximale en fin d’épidémie (Table 3). On constate ainsi que les pays ayant des stratégies de « contrôle » différentes ne se comportent pas de la même façon. 

Figure 6 : Estimations de la proportion d’individus ayant été infectés par rapport à l’ensemble de la population de différent pays au cours du temps, avec une projection jusqu’à la fin de l’épidémie, pour un taux de létalité de 0.5%.
Table 3. Estimations des proportions d’individus ayant été infectés à ce jour par rapport à l’ensemble de la population de différent pays, et les valeurs prédites en fin dépidémie, avec un taux de létalité de 0.5%

On constate que les estimations de ces proportions d’individus infectés au niveau de chaque pays restent très faibles, tout en étant plus importantes que les valeurs estimées pour les trois provinces chinoises. Il est important de noter que ces valeurs doivent montrer une forte variabilité au sein de ces pays, les zones intra-pays pouvant avoir été infectées et sujet à un processus de diffusion très variable comme en France (régions) ou au Canada (provinces). On peut donc s’attendre à ce que les valeurs soient plus élevées pour les zones les plus touchées par la contamination intra-communautaire. Pour la Belgique on obtient une valeur prédite en fin d’épidémie de 28%, alors que c’est le pays ayant décidé un recensement exhaustif des cas de décès. On ne peut donc pas s’attendre à ce que ces valeurs puissent atteindre un niveau permettant d’envisager un effet protecteur (immunité de groupe) ultérieur de la population.

Une fois la vague épidémique passée au niveau d’un pays, un rebond est toujours possible. Leurs identifications et leurs contrôles sont primordiales au risque de voir réapparaître une nouvelle vague épidémique. Dans les deux provinces chinoises de Henan et de Hunan, de nouveaux « cas confirmés » ont été identifiés sur les données journalières bien après la fin de la première vague épidémique (Figure 7). Ils sembleraient correspondre à de nouveaux « cas importés » que la Chine a décidé de maîtriser via des mises en quarantaine des personnes revenant en Chine.

Figure 7 : Vagues et rebonds épidémiques en Chine dans les deux provinces de Henan et de Hunan. Nombres de cas confirmés, décédés et guéris par jour au cours du temps. On a entouré en rouge les quelques rebonds de cas observés après la principale vague épidémique. 

CONCLUSION ET DISCUSSION

Le modèle développé ici vise à modéliser l’allure des proportions d’individu confirmés actifs (ZA), guéris (ZG) et décédés(ZD) du COVID-19 dans chacun des pays considérés. L’obtention de ces proportions est très dépendante des mesures de gestions de l’épidémie dans chaque pays et en particulier de l’effort réalisé par chaque pays ou province pour détecter les individus infectés par le SARS-CoV-2. Néanmoins, ces données sont à ce jour les données les plus fiables car directement observées dans chaque zone étudiée. Les estimations des paramètres du modèle sont réalisées sur des données directement observées et ne font aucune hypothèse ni sur la transmissibilité du virus (R0) ni sur les taux de guérisons, d’incubation ou d’autres paramètres biologiques liés au SARS-CoV-2 pour lesquels de nombreuses incertitudes subsistent actuellement.

Ajustement du modèle aux données

L’ajustement du modèle proposé aux données observées dans les trois provinces chinoises dont la vague épidémique est complète, nous parait satisfaisant pour pourvoir l’appliquer aux autres pays de l’étude. Des travaux complémentaires sont en cours pour valider plus finement l’adéquation du modèle aux données observées, mais ces travaux devront probablement être réalisés, en partie, a posteriori, une fois que l’ensemble des données seront disponibles pour chaque pays. Les prédictions réalisées pour des dates ultérieures aux données disponibles permettent d’évaluer les durées potentielles de vague épidémique ainsi que les taux de décès apparents pour chaque pays. Les prédictions que nous présentons ici ne sont valables que si la dynamique du COVID-19 reste stable pendant la période de temps concernée. Or nous savons que les mesures de gestions de l’épidémie influence précisément la dynamique de transmission (i.e. le R0). Plus que les prédictions obtenues à partir des dix jours considérés, ce sont donc les variations de ces prédictions au jour le jour, qui permettent d’approcher la dynamique évolutive du processus épidémique et donc d’évaluer les conséquences des mesures prises précédemment.

Évolution des dynamiques dans les différents pays

La durée de la vague épidémique au sein d’un pays semble dépendre de l’importance du nombre de cas importés, du processus de progression des contaminations intra-communautaires plus ou moins bien contrées par les mesures de précautions et de distanciation sociale mises en place. On estime par exemple qu’en Italie, l’épidémie pourrait se poursuivre jusqu’à la fin-octobre dans les conditions actuelles de transmission (i.e. en confinement). En Suisse, l’épidémie selon le même critère devrait prendre fin vers début-août. On peut s’attendre à ce que dans les pays qui ont tardé à prendre des mesures de confinement comme les USA ou la Grande-Bretagne, ou qui n’en ont pas pris comme en Suède, la vague épidémique soit de plus forte intensité et dure beaucoup plus longtemps. Pour l’instant on n’observe pas encore de ralentissement et donc pas d’estimations favorables du processus épidémique pour ces pays. Mais comme en Italie avec un taux apparent de décès de 0.15, celui-ci risque d’y être très élevé. L’Allemagne semble s’orienter vers un taux beaucoup plus faible de 0.05, proche de celui finalement observé en Chine, ou même observé en Suisse avec 0.06, en Autriche avec  0.04, au Danemark avec 0.05 et au Portugal avec 0.05.

Le risque que l’épidémie reprenne dans un pays semble important si la date de déconfinement choisie est trop précoce par rapport à la dynamique de la vague épidémique, et ceci d’autant plus si le taux d’infection de la population (i.e. le taux de protection de la population) est aussi faible qu’attendu. De même, l’utilité de la mise en œuvre de tests sérologiques sur une partie ou sur l’ensemble de la population d’un pays pose question au vu de la faible proportion des individus d’un pays ayant été en contact avec le virus. Et ceci d’autant plus si les anticorps ne persistent que quelques semaines/mois et que l’immunité acquise ne l’est que pour une courte durée et modulée suivant l’intensité des symptômes venant renforcer à nouveau le compartiment des susceptibles. Il semble très important au moment du déconfinement d’identifier les cas actifs et de les isoler le plus rapidement et le plus efficacement possible.

Limites

En termes de modélisation, l’approche choisie permet d’estimer la dynamique récente de l’épidémie. Par contre les éventuels changements dans les procédures de confinement ne peuvent pas être directement pris en compte dans le processus d’estimation ; ces modifications entraînant une éventuelle recrudescence de « cas confirmés », induisent une augmentation de la proportion de « cas actifs », et donc une diminution de la pente de décroissance de ces « cas actifs ». Il est d’autant plus important de pouvoir suivre ce processus en temps réel, qu’un certain délai existe entre la contamination d’un individu et son éventuel identification. Si ces mesures de contrôles sont variables, on obtiendra des proportions qui apparaîtront relativement bruitées. D’où l’importance d’estimer la dynamique avec les dernières valeurs les plus stables du processus épidémique. Des améliorations sont donc encore nécessaires si on veut pouvoir évaluer et tester les différentes mesures de précaution prises dans les différents pays au cours du temps.

Il est clair que ce modèle est grandement simplifié par rapport à la réalité du processus épidémique. En effet sans pouvoir être exhaustif, on ne prend pas en compte par exemples, l’impact des différentes stratégies de dépistage mises en place dans les différents pays, l’impact des décalages dans le temps des reports des décès (hospitaliers vs non-hospitaliers), la structure d’âge dans chacun des pays, ni les facteurs sociaux et anthropiques, écologiques et environnementaux qui peuvent influencer la diffusion virale. De même la procédure d’estimation pour les pays présentant une vague épidémique encore incomplète, considère que les dispositions de distanciation sociale restent inchangées et homogènes sur l’ensemble du territoire durant les dix jours utilisés pour estimer les valeurs des paramètres  et donc prédire la dynamique épidémique.

Intérêt du modèle

Par contre ce modèle semble relativement efficace pour capter la dynamique générale d’une vague épidémique, et pour en déduire des estimations de la durée totale de l’épidémie, du taux de décès final et obtenir une estimation du taux d’infection générale de la population. Il a l’avantage de pouvoir être mis en œuvre simplement et ainsi de pouvoir suivre quotidiennement l’évolution du processus épidémique. Grâce à sa simplicité initiale, il est possible de le complexifier ultérieurement en fonction des questions auxquelles on désire répondre.

Références

1 – http://www.euro.who.int/fr/health-topics/health-emergencies/coronavirus-covid-19/news/news/2020/3/who-announces-covid-19-outbreak-a-pandemic

2 – Mohammad M. Sajadi, Parham Habibzadeh, Augustin Vintzileos, Shervin Shokouhi,  Fernando Miralles-Wilhelm, Anthony Amoroso. 2020. Temperature, humidity, and latitude analysis to predict potential spread and seasonality for COVID-19. https://ssrn.com/abstract=3550308

3 – Jon Cohen. 2020. Why do dozens of diseases wax and wane with the seasons—and will COVID-19? Science Research Highlights 

4 – E Dong, H Du, and L Gardner. 2020. An interactive web-based dashboard to track covid-19 in real time. The Lancet Infectious Diseases

5 – Imperial College COVID-19 Response Team, 30 March 2020. Estimating the number of infections and the impact of non-pharmaceutical interventions on COVID-19 in 11 European countries. https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/Imperial-College-COVID19-Europe-estimates-and-NPI-impact-30-03-2020.pdf

6 –  Imperial College COVID-19 Response Team, 16 March 2020. Impact of non-pharmaceutical interventions (NPIs) to reduce COVID-19 mortality and healthcare demand. https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/Imperial-College-COVID19-NPI-modelling-16-03-2020.pdf


Notes

Ce travail est en cours et nous travaillons à son amélioration.

Nous ferons des mis à jour régulièrement!

Nous souhaitons ici proposer des pistes de réflexions en temps de crise.

Mais attention, nous sommes épidémiologistes et ne considérons que les aspects sanitaires.

Cette étude n’a pas été soumise à une évaluation par les pairs…

… Et contient donc certainement des failles et/ou des erreurs! N’hésitez pas à nous faire part de vos avis.

Des idées? Des commentaires? Des questions ou des envies de collaborations?


Créer un nouveau site sur WordPress.com
Commencer
%d blogueurs aiment cette page :