Visualiser les données de contamination du COVID


En matière de traitement de données, les données en open-date (voir notre article sur le sujet: Qu’est-ce que l’open data ?) sont une mine d’or à la fois pour comprendre, analyser, et appréhender les outils d’analyse de données.

Rien qu’en projetant les données brutes sous forme d’un graphique, ci-dessous les contaminations par le covid depuis le début 2020, on peut observer de nombreuses tendances.

Nous en sommes déjà à la septième vague de covid…

Tout d’abord les différents pics de contamination. Nous en sommes déjà à la 7e vague. On peut aussi voir la hauteur des différents pics, et l’écart de temps entre deux vagues.

Une autre information intéressante avec ce types de données ouvertes est que l’on peut faire des calculs de moyenne sur ces données ! Avec les contaminations au covid, on sait qu’il y a un biais dans les données publiées correspondant au nombre de centres de dépistages ouverts, ainsi les dimanches et lundi les chiffres de contamination baissent car ils concernent les prélèvements du week-end, et généralement en phase haussière le mardi on a une augmentation significative et impressionnante. Pour gommer et lisser ce biais on peut faire ce que l’on appelle une moyenne mobile. Le principe est très simple, pour un jour donnée on va calculer la moyenne des cas des 7 derniers jours et des 30 derniers jours. On obtient ainsi deux moyennes mobiles, une MM7 hebdomadaire et une MM30 mensuelle.

Grace à ces moyennes mobiles, on peut mieux voir dans les données, et on peut calculer des tendances car le pourcentage de hausse hebdomadaire permettant de voir s’il y a une accélération de la vitesse de transmission, un plateau ou une baisse. Mais on peut aussi combiner les deux moyennes mobiles pour calculer leur écart, ce qui est très intéressant pour confronter l’évolution court-terme des indicateurs par rapport à l’évolution long terme. Graphiquement lorsque la courbe à court terme décolle par rapport à la tendance long terme cela signifie un amorçage de vague.

En bleu la MM7 et en vert la MM30. On voit bien que dès que ces courbes s’écartent il y a un changement de tendance.

Ainsi concernant la septième vague, le graphique permet de dater précisément au 11 juin 2022 le croisement des deux courbes signifiant le début d’un retournement.

On voit aussi qu’en ce mardi 5 juillet avec 206,554 nouveaux cas la moyenne mobile hebdo est de 118,991 et mensuelle de 67,437. Sur une base hebdomadaire la MM7 est en hausse de 39,7% et se détache très nettement de la MM30.

Cette tendance haussière hebdomadaire de la moyenne mobile indique que l’épidémie est en phase de reprise. Quand la tendance se réduira on passera sur un plateau avant l’inversion. Seule le recroisement de la MM7 avec la MM30 confirmera une décrue. Donc graphiquement on est clairement dans cette septième vague et une nouvelle fois la visualisation des données publiques permet de s’en convaincre.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *