Tâche 1 Introduction Aux Séries Temporelles

COVID-19 - Analysis, Visualization &
Comparisons
SARA LABIAD
Le code fourni importe plusieurs modules Python pour différentes
opérations. Tout d'abord, le module `json` est importé pour pouvoir
charger des fichiers JSON. Ensuite, la classe `timedelta` est importée du
module `datetime` pour effectuer des opérations sur les dates et les
heures. Le module ùrllib.request` est importé pour utiliser la fonction
ùrlopen` et récupérer le contenu web. En ce qui concerne les opérations
mathématiques, bien que le commentaire mentionne l'importation du
module `math`, il n'est pas utilisé dans le code fourni. En revanche, le
module `numpy` est importé sous l'alias `np` pour effectuer des analyses
numériques, notamment sur des tableaux multidimensionnels. Enfin, le
module `pandas` est importé sous l'alias `pd` pour stocker et traiter les
données dans des dataframes, une structure de données couramment
utilisée pour la manipulation et l'analyse de données tabulaires.
code importe plusieurs packages pour la visualisation de données. Tout
d'abord, le package `matplotlib.pyplot` est importé sous l'alias `plt` pour
fournir des fonctionnalités de visualisation de base. Ensuite, le package
`seaborn` est importé sous l'alias `sns` pour des tracés avancés. Pour une
visualisation interactive, le package `plotly.express` est importé sous l'alias
`px` pour créer des graphiques expressifs, et le package `plotly.graph_objs`
est importé sous l'alias `go` pour définir des objets graphiques personnalisés.
De plus, la fonction `make_subplots` est importée du module
`plotly.subplots` pour créer des tracés avec des sous-graphiques. Dans
l'ensemble, ces imports fournissent des fonctionnalités pour créer des
visualisations statiques et interactives, avec des options avancées pour la
personnalisation et la disposition des graphiques.
Ce code effectue la lecture de fichiers CSV contenant des données sur les rapports de
virus Corona. Tout d'abord, le fichier "covid_19_clean_complete.csv" est lu à l'aide de la
fonction `pd.read_csv()` et stocké dans la variable `full_table`. Ensuite, le fichier
"full_grouped.csv" est également lu et stocké dans la variable `full_grouped`. La colonne
'Date' dans `full_grouped` est convertie en format de date et d'heure à l'aide de
`pd.to_datetime()`. Enfin, le fichier "day_wise.csv" est lu et stocké dans la variable
`day_wise`, et la colonne 'Date' est également convertie en format de date et d'heure.
Ces opérations permettent de charger les données de différents fichiers CSV dans des
variables pour les manipuler et les analyser ultérieurement.
Ce code lit les fichiers CSV contenant des données sur les rapports de virus Corona pour des statistiques spécifiques aux
pays et aux données de Worldometer. Tout d'abord, le fichier "country_wise_latest.csv" est lu à l'aide de `pd.read_csv()`
et stocké dans la variable `country_wise`. Ensuite, toutes les valeurs vides (chaînes de caractères vides) dans
`country_wise` sont remplacées par des valeurs NaN (Non a Number) à l'aide de la fonction `replace()` suivie de
`fillna(0)` pour remplacer les NaN par des zéros. De même, le fichier "worldometer_data.csv" est également lu et stocké
dans la variable `worldometer_data`, suivi des mêmes étapes de remplacement des valeurs vides par des NaN et des
NaN par des zéros. Ces opérations permettent de charger les données relatives aux pays et aux statistiques de
Worldometer dans des variables pour une utilisation ultérieure.
Ce code effectue une visualisation de données à l'aide d'un treemap (carte en treillis). Tout d'abord,
une variable `temp` est créée en sélectionnant les colonnes 'Date', 'Deaths', 'Recovered' et 'Active' à
partir du dataframe `day_wise` et en prenant la dernière ligne à l'aide de `.tail(1)`. Ensuite, la variable
`temp` est transformée à l'aide de la fonction `melt()`, où la colonne 'Date' est conservée comme
variable d'identification (id_vars) et les colonnes 'Active', 'Deaths' et 'Recovered' sont transformées en
variables de valeur (value_vars). Le résultat est un nouveau dataframe qui représente les valeurs
'Active', 'Deaths' et 'Recovered' pour une date spécifique.
Ensuite, un treemap est créé en utilisant `px.treemap()` du module `plotly.express` en utilisant le

dataframe `temp`. Les variables 'variable' et 'value' sont spécifiées pour les axes du treemap, où
'variable' représente les catégories ('Active', 'Deaths', 'Recovered') et 'value' représente les valeurs
correspondantes. La hauteur du treemap est définie à 225 pixels et la séquence de couleurs est définie
à partir des variables àct`, `rec`, et `dth`.
Enfin, des ajustements sont apportés à l'affichage du treemap en utilisant `fig.data[0].textinfo` pour
spécifier les informations à afficher pour chaque case (étiquette, texte et valeur). Finalement, le
treemap est affiché à l'aide de `fig.show()`. Cette séquence de code génère une visualisation
interactive du treemap représentant les catégories 'Active', 'Deaths' et 'Recovered' avec leurs valeurs
correspondantes pour une date spécifique.
Ce code définit une fonction appelée "plot_map" qui prend trois arguments: "df" (un DataFrame),
"col" (une colonne du DataFrame) et "pal" (une palette de couleurs). Dans la première ligne, le
DataFrame est filtré pour exclure les lignes où la valeur de la colonne spécifiée est inférieure ou égale
à zéro. Ensuite, un graphique choroplèthe est créé à l'aide de la bibliothèque "plotly.express"
(importée sous le nom "px"), en utilisant les données du DataFrame filtré. Le graphique affiche une
carte choroplèthe où chaque pays est représenté par une couleur basée sur la valeur de la colonne
spécifiée. Le titre du graphique est défini comme la valeur de la colonne spécifiée. Lorsque le
graphique est affiché, il inclut également des informations supplémentaires lorsque vous survolez les
pays, affichant la valeur de la colonne spécifiée. Le schéma de couleurs continu pour la carte est
spécifié par la palette "pal". La ligne commentée "fig.update_layout(coloraxis_showscale=False)"
désactive l'affichage de la légende de couleur. Enfin, la fonction "plot_map" est appelée avec un
DataFrame appelé "country_wise", la colonne 'Confirmed' et la palette 'matter'.
Ce code appelle la fonction "plot_map" avec les arguments
"country_wise" (un DataFrame), 'Deaths' (une colonne du DataFrame) et
'matter' (une palette de couleurs). La fonction "plot_map" filtre le
DataFrame pour exclure les lignes où la valeur de la colonne 'Deaths' est
inférieure ou égale à zéro. Ensuite, elle génère un graphique choroplèthe
basé sur les données filtrées. La carte affiche chaque pays avec une
couleur correspondant à la valeur de la colonne 'Deaths'. Le titre du
graphique est défini comme 'Deaths'. Lorsque vous survolez les pays, le
graphique affiche également la valeur de la colonne 'Deaths'. La palette
de couleurs 'matter' est utilisée pour représenter les données sur la
carte.
Ce code appelle la fonction "plot_map" avec les arguments "country_wise" (un DataFrame),
'Deaths / 100 Cases' (une colonne du DataFrame) et 'matter' (une palette de couleurs). La
fonction "plot_map" filtre le DataFrame pour exclure les lignes où la valeur de la colonne
'Deaths / 100 Cases' est inférieure ou égale à zéro. Ensuite, elle génère un graphique
choroplèthe basé sur les données filtrées. La carte affiche chaque pays avec une couleur
correspondant à la valeur de la colonne 'Deaths / 100 Cases'. Le titre du graphique est défini
comme 'Deaths / 100 Cases'. Lorsque vous survolez les pays, le graphique affiche également
la valeur de la colonne 'Deaths / 100 Cases'. La palette de couleurs 'matter' est utilisée pour
représenter les données sur la carte.
Ce code génère un graphique choroplèthe animé qui représente l'évolution des cas confirmés au
fil du temps pour chaque pays. Il utilise la bibliothèque "plotly.express" (importée sous le nom
"px"). Le DataFrame "full_grouped" est utilisé comme source de données. Les emplacements
géographiques des pays sont spécifiés par la colonne "Country/Region". La couleur des pays sur la
carte est déterminée en prenant le logarithme des valeurs de la colonne "Confirmed" du
DataFrame. Le mode de localisation est défini comme "country names". Lorsque vous survolez les
pays, le nom du pays est affiché. Le graphique est animé en utilisant les dates de la colonne "Date"
du DataFrame, converties au format 'AAAA-MM-JJ'. Le titre du graphique est défini comme 'Cases
over time'. La palette de couleurs utilisée est "matter" de la bibliothèque
"plotly.express.colors.sequential". La ligne "fig.update(layout_coloraxis_showscale=False)"
désactive l'affichage de la légende de couleur. Enfin, le graphique est affiché à l'aide de la fonction
"fig.show()".
Ce code contient deux fonctions et une séquence d'instructions supplémentaires pour créer des graphiques
représentant l'évolution des cas de récupération, de décès et d'actifs au fil du temps. La première fonction,
"plot_daywise", crée un graphique à barres en utilisant le DataFrame "day_wise". La colonne spécifiée par l'argument
"col" est représentée sur l'axe des y, et la colonne "Date" est représentée sur l'axe des x. La largeur du graphique est
fixée à 700 pixels. La couleur des barres est définie par la séquence de couleurs discrètes spécifiée par l'argument
"hue". Le titre du graphique est défini comme la valeur de l'argument "col", et les titres des axes x et y sont laissés
vides. La deuxième fonction, "plot_daywise_line", crée un graphique en ligne similaire en utilisant le DataFrame
Ajouter un sous-titre
"day_wise" mais avec une représentation en ligne plutôt qu'en barres. Ensuite, un nouveau DataFrame appelé "temp"
est créé en regroupant les données du DataFrame "full_grouped" par date et en calculant la somme des colonnes
"Recovered", "Deaths" et "Active". Les colonnes sont ensuite fondues dans une colonne "Count" avec une colonne
"Case" qui spécifie le type de cas. Un graphique en aires est créé en utilisant le DataFrame "temp", avec la date sur
l'axe des x, le nombre sur l'axe des y et la couleur des aires déterminée par la colonne "Case". La hauteur du
graphique est fixée à 600 pixels et la largeur à 700 pixels. Le titre du graphique est défini comme 'Cases over time', et
les séquences de couleurs discrètes spécifiques pour chaque type de cas sont définies. Un curseur de plage est ajouté
à l'axe des x pour permettre une exploration temporelle interactive. Enfin, les graphiques sont affichés à l'aide de la
fonction "fig.show()".
Le code "plot_daywise('Confirmed', '#333333')" semble être une fonction appelée "plot_daywise" avec deux arguments :
"Confirmed" et "#333333". Cependant, sans le contexte du code complet et de sa définition, il est difficile de donner
une explication précise. Néanmoins, je peux vous donner une explication générale de ce que le code pourrait faire.
Il semble que la fonction "plot_daywise" soit utilisée pour tracer un graphique ou un diagramme. L'argument
"Confirmed" suggère qu'il s'agit peut-être d'une représentation graphique des cas confirmés d'une maladie ou d'une
autre mesure de confirmation.
L'argument "#333333" est probablement utilisé pour spécifier la couleur à utiliser dans le graphique. Dans ce cas,
"#333333" représente un code couleur hexadécimal pour une teinte de gris foncé.
Cependant, sans plus d'informations sur le reste du code ou la définition complète de la fonction "plot_daywise", il est
difficile de dire exactement ce que fait cette fonction ou quel type de graphique elle produit.
Le code "plot_daywise('Active', '#333333')" semble être une autre utilisation de la fonction "plot_daywise", cette fois
avec les arguments "Active" et "#333333".
Comme dans l'exemple précédent, il est probable que cette fonction "plot_daywise" soit utilisée pour tracer un
graphique ou un diagramme. Cependant, la différence réside dans le fait que cette fois, la mesure "Active" est utilisée
comme argument.
"Active" pourrait se référer à une mesure spécifique, par exemple, le nombre de cas actifs d'une maladie à un moment
donné. Le graphique généré par cette fonction pourrait donc représenter l'évolution des cas actifs au fil du temps.
L'argument "#333333" est utilisé pour spécifier la couleur du graphique, comme dans l'exemple précédent. Dans ce cas,
"#333333" représente un code couleur hexadécimal pour une teinte de gris foncé.
Comme auparavant, il est important de noter que sans plus de contexte sur le reste du code ou la définition complète
de la fonction "plot_daywise", il est difficile de fournir une explication plus précise sur le fonctionnement de cette
fonction ou le type de graphique qu'elle produit.
Le code "plot_daywise('New cases', '#333333')" semble être une autre utilisation de la fonction "plot_daywise" avec les
arguments "New cases" et "#333333".
Comme dans les exemples précédents, il semble que la fonction "plot_daywise" soit utilisée pour tracer un graphique
ou un diagramme. Cette fois-ci, l'argument "New cases" est utilisé, ce qui suggère que le graphique représente
l'évolution des nouveaux cas au fil du temps.
"New cases" pourrait faire référence à la quantité de nouveaux cas enregistrés pour une maladie ou une autre mesure
spécifique. Le graphique généré par cette fonction pourrait donc représenter l'augmentation ou la diminution des
nouveaux cas quotidiens au fil du temps.
L'argument "#333333" est utilisé pour spécifier la couleur du graphique, comme dans les exemples précédents. Dans ce
cas, "#333333" représente un code couleur hexadécimal pour une teinte de gris foncé.
Cependant, sans plus de contexte sur le reste du code ou la définition complète de la fonction "plot_daywise", il est
difficile de fournir une explication plus précise sur le fonctionnement de cette fonction ou le type de graphique
qu'elle produit.
Le code "plot_daywise('Deaths', dth)" semble être une autre utilisation de la fonction "plot_daywise" avec les
arguments "Deaths" et "dth".
Comme dans les exemples précédents, il est probable que la fonction "plot_daywise" soit utilisée pour tracer un
graphique ou un diagramme. Cette fois-ci, l'argument "Deaths" est utilisé, ce qui suggère que le graphique représente
l'évolution des décès liés à une maladie ou à une autre mesure spécifique.
L'argument "dth" est utilisé pour fournir les données spécifiques à utiliser pour le graphique. Il est probable que "dth"
soit une variable ou un objet contenant les données des décès, qui est ensuite utilisé comme source de données pour
le tracé du graphique.
qu'elle produit.
Le code "plot_daywise('New deaths', dth)" appelle une fonction "plot_daywise" pour tracer un
graphique. Le graphique représente probablement l'évolution des nouveaux décès quotidiens.
L'argument "New deaths" indique que le graphique se concentre sur les nouveaux décès
enregistrés. L'argument "dth" fournit les données spécifiques à utiliser pour le graphique,
probablement stockées dans une variable ou un objet. Sans plus de contexte, il est difficile de
fournir une explication plus précise sur le fonctionnement de la fonction ou le type de
graphique produit.
Le code "plot_daywise('Recovered', rec)" semble être une utilisation de la fonction "plot_daywise" avec les arguments
"Recovered" et "rec".
Cela suggère que la fonction "plot_daywise" est utilisée pour tracer un graphique ou un diagramme. Cette fois-ci, le
graphique représenterait probablement l'évolution des cas de récupération, c'est-à-dire le nombre de personnes qui
se sont rétablies d'une maladie ou d'une autre mesure spécifique.
L'argument "Recovered" indique que le graphique se concentre sur les cas de récupération.
L'argument "rec" est utilisé pour fournir les données spécifiques à utiliser pour le graphique. "rec" est probablement
une variable ou un objet contenant les données des cas de récupération, qui sont utilisées pour générer le graphique.
qu'elle produit.
Le code "plot_daywise('New recovered', rec)" semble être une utilisation de la fonction "plot_daywise" avec les
arguments "New recovered" et "rec".
Cela indique que la fonction "plot_daywise" est utilisée pour tracer un graphique ou un diagramme. Cette fois-ci, le
graphique représenterait probablement l'évolution des nouveaux cas de récupération quotidiens, c'est-à-dire le
nombre de personnes qui se sont rétablies récemment d'une maladie ou d'une autre mesure spécifique.
L'argument "New recovered" indique que le graphique se concentre sur les nouveaux cas de récupération enregistrés
quotidiennement.
L'argument "rec" est utilisé pour fournir les données spécifiques à utiliser pour le graphique. "rec" est probablement
une variable ou un objet contenant les données des nouveaux cas de récupération, qui sont utilisées pour générer le
graphique.
qu'elle produit.
Le code "plot_daywise_line('Deaths / 100 Cases', dth)" semble être une utilisation de la fonction "plot_daywise_line"
avec les arguments "Deaths / 100 Cases" et "dth".
Cette fonction "plot_daywise_line" semble être spécifiquement conçue pour tracer un graphique en ligne. L'argument
"Deaths / 100 Cases" suggère que le graphique représente une mesure relative des décès par rapport aux cas, peut-
être en utilisant une échelle de 100 pour rendre les valeurs plus significatives.
soit une variable ou un objet contenant les données des décès et des cas, nécessaires pour calculer et tracer le
graphique.
Cependant, sans plus de contexte sur le reste du code ou la définition complète de la fonction "plot_daywise_line", il
est difficile de fournir une explication plus précise sur le fonctionnement de cette fonction ou le format exact du
graphique qu'elle produit.
Le code "plot_daywise_line('Deaths / 100 Recovered', dth)" semble être une utilisation de la fonction
"plot_daywise_line" avec les arguments "Deaths / 100 Recovered" et "dth".
Cette fonction "plot_daywise_line" est probablement utilisée pour tracer un graphique en ligne. L'argument "Deaths /
100 Recovered" suggère que le graphique représente une mesure relative des décès par rapport aux récupérations,
peut-être en utilisant une échelle de 100 pour rendre les valeurs plus significatives.
soit une variable ou un objet contenant les données des décès et des récupérations, nécessaires pour calculer et
tracer le graphique.
Le code "plot_daywise_line('Recovered / 100 Cases', rec)" semble être une utilisation de la fonction
"plot_daywise_line" avec les arguments "Recovered / 100 Cases" et "rec".
Cette fonction "plot_daywise_line" est probablement utilisée pour tracer un graphique en ligne. L'argument
"Recovered / 100 Cases" suggère que le graphique représente une mesure relative des récupérations par rapport aux
cas, peut-être en utilisant une échelle de 100 pour rendre les valeurs plus significatives.
L'argument "rec" est utilisé pour fournir les données spécifiques à utiliser pour le graphique. Il est probable que "rec"
soit une variable ou un objet contenant les données des récupérations et des cas, nécessaires pour calculer et tracer
le graphique.
Le code "plot_daywise('No. of countries', '#035aa6')" semble être une utilisation de la fonction "plot_daywise" avec les
arguments "No. of countries" et "#035aa6".
Cette fonction "plot_daywise" est probablement utilisée pour tracer un graphique ou un diagramme. L'argument "No.
of countries" suggère que le graphique représente le nombre de pays ou de paysages spécifiques.
L'argument "#035aa6" est utilisé pour spécifier la couleur du graphique. Dans ce cas, "#035aa6" représente un code
couleur hexadécimal pour une teinte de bleu.
qu'elle produit.
Ce code crée une variable temp contenant les colonnes 'Date', 'Recovered' et 'Active' d'un ensemble de données
appelé day_wise. Ensuite, il transforme ces données dans un format "long" en utilisant la fonction melt(), créant une
colonne 'Variable' et une colonne 'Count' pour représenter les valeurs. Enfin, il utilise la fonction px.line() de Plotly
Express pour tracer un graphique de ligne en utilisant les données de temp, où 'Date' est utilisé comme axe des
abscisses (x), 'Count' comme axe des ordonnées (y) et 'Variable' pour différencier les lignes. Ainsi, le graphique
représente l'évolution des valeurs 'Recovered' et 'Active' au fil du temps.
Ce code définit deux fonctions pour tracer des graphiques à barres horizontales. La première fonction, "plot_hbar",
prend un dataframe "df", une colonne "col", un nombre "n" et une liste de données supplémentaires à afficher au
survol des barres. Elle utilise la bibliothèque Plotly Express (px) pour créer un graphique à barres horizontales avec les
pays/régions sur l'axe des ordonnées et les valeurs de la colonne "col" sur l'axe des abscisses. La couleur des barres
est déterminée par la colonne "WHO Region". Le graphique est ensuite affiché avec un titre, des axes légendes et une
commande pour masquer les étiquettes de texte redondantes.
La deuxième fonction, "plot_hbar_wm", utilise les données du dataframe "worldometer_data" pour filtrer les pays
ayant une population supérieure à "min_pop" (par défaut, 1 million). Elle trie ensuite les données en fonction de la
colonne "col" et sélectionne les "n" dernières lignes. Le reste de la fonction est similaire à "plot_hbar", avec la création
et l'affichage du graphique à barres horizontales.
Enfin, le code appelle la fonction "plot_hbar" avec le dataframe "country_wise", la colonne "Confirmed" et le nombre
"15" pour tracer un graphique des 15 pays/régions ayant le plus grand nombre de cas confirmés.
Le code "plot_hbar(country_wise, 'Active', 15)" semble appeler une fonction nommée "plot_hbar" avec trois arguments :
"country_wise", "'Active'", et "15".
Sans plus d'informations sur le contexte et les détails de cette fonction, il est difficile de fournir une explication
précise. Cependant, je peux vous donner une explication générale basée sur les conventions courantes en matière de
programmation.
Il semble que la fonction "plot_hbar" soit conçue pour créer un graphique à barres horizontales (horizontal bar chart)
en utilisant des données spécifiques, probablement stockées dans l'objet "country_wise". Les barres du graphique
sont basées sur les valeurs de la colonne "Active" (qui peut être une mesure du nombre d'activités, d'utilisateurs
actifs, etc.) dans les données. Le paramètre "15" semble indiquer que seules les 15 premières valeurs doivent être
incluses dans le graphique.
En résumé, le code appelle une fonction "plot_hbar" pour générer un graphique à barres horizontales en utilisant les
données de "country_wise" et en se concentrant sur la colonne "Active". Seules les 15 premières valeurs de cette
colonne seront affichées dans le graphique.
Le code "plot_hbar(country_wise, 'Deaths', 15)" semble appeler une fonction nommée "plot_hbar" avec trois arguments
: "country_wise", "'Deaths'" et "15".
À partir de ces informations, on peut déduire que la fonction "plot_hbar" est utilisée pour créer un graphique à barres
horizontales (horizontal bar chart) basé sur des données spécifiques, probablement stockées dans l'objet
"country_wise". Les barres du graphique représentent les valeurs de la colonne "Deaths" (décès) dans les données. Le
paramètre "15" indique que seules les 15 premières valeurs de cette colonne doivent être incluses dans le graphique.
En résumé, le code appelle la fonction "plot_hbar" pour générer un graphique à barres horizontales qui représente les
décès (Deaths) dans les données de "country_wise". Seules les 15 premières valeurs de la colonne "Deaths" seront
affichées dans le graphique.
Le code "plot_hbar(country_wise, 'Deaths / 100 Cases', 15)" appelle une fonction "plot_hbar" avec trois arguments :
"country_wise", "'Deaths / 100 Cases'", et "15". La fonction crée un graphique à barres horizontales basé sur les
données de "country_wise". Les barres représentent les valeurs de la colonne "Deaths / 100 Cases", qui est un taux de
mortalité normalisé par rapport au nombre de cas. Seules les 15 premières valeurs de cette colonne sont incluses
dans le graphique.
Le code "plot_hbar(country_wise, 'Recovered', 15)" appelle une fonction nommée "plot_hbar" avec trois arguments :
"country_wise", "'Recovered'", et "15".
En se basant sur ces informations, on peut comprendre que la fonction "plot_hbar" est utilisée pour créer un
graphique à barres horizontales (horizontal bar chart) en utilisant les données spécifiques stockées dans l'objet
"country_wise". Les barres du graphique représentent les valeurs de la colonne "Recovered" (récupérés) dans les
données.
Le paramètre "15" indique que seules les 15 premières valeurs de cette colonne doivent être incluses dans le
graphique.
En résumé, le code appelle la fonction "plot_hbar" pour générer un graphique à barres horizontales représentant les
cas récupérés dans les données de "country_wise". Seules les 15 premières valeurs de la colonne "Recovered" seront
affichées dans le graphique.
Ce code définit deux fonctions : "plot_stacked(col)" et "plot_line(col)". La fonction "plot_stacked(col)" utilise la bibliothèque Plotly
Express (px) pour créer un graphique à barres empilées. Elle prend en paramètre une colonne de données et crée un graphique avec
la date en abscisse, la colonne spécifiée en ordonnée, et la couleur des barres en fonction du pays/région. Le graphique a une
hauteur de 600 pixels et un titre correspondant à la colonne. La séquence de couleurs utilisée est définie par
"px.colors.cyclical.mygbm". La fonction "plot_line(col)" fonctionne de manière similaire, mais crée un graphique en ligne au lieu d'un
graphique à barres empilées. Enfin, le code appelle la fonction "plot_stacked('Confirmed')" pour créer un graphique empilé en
utilisant la colonne 'Confirmed' comme donnée en ordonnée. Le graphique est affiché à l'aide de la méthode "show()" de l'objet "fig".
Ce code définit une fonction "gt_n(n)" qui prend un entier "n" en paramètre. Il utilise les données "full_grouped" pour
filtrer les pays/régions dont le nombre de cas confirmés dépasse "n". Ensuite, il effectue des opérations de
regroupement et de manipulation de données pour calculer le nombre de jours depuis la première fois où le nombre
de cas confirmés a dépassé "n" pour chaque pays/région. Il crée ensuite un graphique en ligne à l'aide de la
bibliothèque Plotly Express (px) pour représenter les données. Le graphique a pour axe des abscisses le nombre de
jours depuis le "n"-ème cas, et pour axe des ordonnées le nombre de cas confirmés. Chaque pays/région est
représenté par une couleur différente. Le titre du graphique indique "N days from [valeur de n] case". Enfin, le code
appelle la fonction "gt_n(100000)" pour générer le graphique en utilisant "n" égal à 100000. Le graphique est affiché à
l'aide de la méthode "show()" de l'objet "fig".
Ce code crée un graphique de dispersion (scatter plot) à l'aide de la bibliothèque Plotly Express (px). Le graphique
représente les données contenues dans le dataframe "country_wise", triées par ordre décroissant en fonction du
nombre de décès (colonne 'Deaths'). Seuls les 20 premiers pays/régions sont inclus dans le graphique. L'axe des
abscisses (x) représente le nombre de cas confirmés ('Confirmed'), tandis que l'axe des ordonnées (y) représente le
nombre de décès ('Deaths'). Chaque point sur le graphique correspond à un pays/région et est coloré en fonction de
la colonne 'Country/Region'. La taille des points est proportionnelle au nombre de cas confirmés. Le graphique a une
hauteur de 700 pixels et affiche le nom de chaque pays/région à proximité de son point correspondant. Les échelles
des axes des abscisses et des ordonnées sont logarithmiques (log_x=True, log_y=True). Le titre du graphique indique
que l'échelle utilisée est en base 10 logarithmique. Les paramètres "update_traces", "update_layout" et "show" sont
utilisés pour apporter quelques ajustements à l'apparence du graphique, tels que la position du texte, la visibilité de
la légende et l'affichage du curseur pour la plage des valeurs sur l'axe des abscisses. Enfin, la méthode "show()" est
appelée pour afficher le graphique.
Ce code définit une fonction "plot_treemap(col)" qui utilise la bibliothèque Plotly Express pour créer un graphique de
treemap à partir des données du dataframe "country_wise". Le treemap représente les pays/régions comme des
rectangles emboîtés, où la taille de chaque rectangle est proportionnelle à la valeur de la colonne spécifiée. La
fonction affiche ensuite le treemap avec le texte comprenant l'étiquette du pays/région, le texte et la valeur
correspondant à la colonne. Le code appelle ensuite la fonction deux fois, une fois avec la colonne 'Confirmed' et une
fois avec la colonne 'Deaths', pour générer deux treemaps distincts.
Ce code crée un heatmap à partir des données du dataframe "full_grouped". Il extrait les colonnes pertinentes dans
un nouveau dataframe et ajoute une colonne pour indiquer si de nouveaux cas ont été signalés. Le code utilise
ensuite Plotly pour générer le graphique de heatmap avec les valeurs correspondantes, les dates et les pays/régions
en tant qu'axes. Des ajustements de mise en page sont appliqués avant d'afficher le graphique.
Ce code effectue une analyse des données de la table `full_table` qui contient des informations sur les cas confirmés
et les décès liés à un pays et à une date spécifiques. Il regroupe d'abord les données par pays, date, puis calcule la
différence entre les totaux de cas confirmés et de décès pour chaque pays à des dates successives. Ensuite, il masque
les valeurs de cas confirmés et de décès lorsqu'il y a un changement de pays. Ensuite, il sélectionne les pays ayant
plus de 100 000 cas confirmés et les filtre dans le tableau temporaire. Ensuite, il crée une disposition de sous-
graphiques à l'aide de la bibliothèque Plotly pour afficher les barres représentant le nombre de nouveaux cas
confirmés pour chaque pays, avec les dates sur l'axe des x. Enfin, il met à jour la mise en page du graphique en
spécifiant la hauteur, le titre et l'absence de légende, puis affiche le graphique.
Ce code crée une correspondance entre les noms des États américains et leurs codes abrégés. Ensuite, il ajoute une
colonne "Code" au DataFrame "usa_grouped" qui contient les données regroupées par État pour les cas confirmés et
les décès liés au COVID-19. Le code utilise la colonne "Province_State" du DataFrame pour mapper les noms d'État aux
codes correspondants à l'aide du dictionnaire "us_code". Ensuite, il lit un fichier CSV contenant les données sur les
comtés aux États-Unis et extrait les dernières données disponibles. Ensuite, il regroupe ces données par État en
calculant la somme des cas confirmés et des décès, puis réinitialise l'index du DataFrame résultant.
Ce code effectue une analyse des données relatives à la pandémie de COVID-19 par région de l'OMS (Organisation
mondiale de la santé). Il regroupe d'abord les données du DataFrame "country_wise" par région de l'OMS en calculant
la somme des cas confirmés, des décès, des guérisons, des cas actifs, des nouveaux cas et des cas confirmés de la
semaine précédente, puis réinitialise l'index du DataFrame résultant. Ensuite, il calcule le taux de létalité en
pourcentage en divisant le nombre de décès par le nombre de cas confirmés. De plus, il calcule le taux de guérison en
pourcentage en divisant le nombre de guérisons par le nombre de cas confirmés. Ensuite, il groupe les données du
DataFrame "full_grouped" par région de l'OMS et par date, en calculant la somme des cas confirmés, des décès, des
guérisons, des cas actifs, des nouveaux cas et des nouveaux décès, puis réinitialise l'index du DataFrame résultant. Le
code fournit également une fonction "plot_hbar" qui trace des graphiques à barres horizontales pour différentes
colonnes du DataFrame "who", en utilisant la bibliothèque Plotly Express. Enfin, il trace des graphiques de dispersion
en utilisant les données du DataFrame "temp" pour comparer les cas confirmés avec les décès et la population par
région de l'OMS, en utilisant à nouveau Plotly Express.
Ce code effectue plusieurs opérations pour analyser les données COVID-19 regroupées par semaine. Tout d'abord, il
ajoute une nouvelle colonne "Week No." à un DataFrame appelé "full_grouped", en extrayant le numéro de semaine à
partir de la colonne "Date". Ensuite, il groupe les données par numéro de semaine et calcule la somme des colonnes
'Confirmed', 'Deaths', 'Recovered', 'Active', 'New cases', 'New deaths', et 'New recovered'. Ces données regroupées par
semaine sont stockées dans un autre DataFrame appelé "week_wise". Le code comprend également une fonction
appelée "plot_weekwise" qui prend deux arguments, "col" et "hue", et utilise la bibliothèque Plotly pour générer un
graphique à barres montrant l'évolution de la variable "col" au fil des semaines, en utilisant la couleur "hue" pour la
mise en évidence. Le graphique est affiché à l'aide de la méthode "show()" de l'objet de la figure.

Tâche 1 Introduction Aux Séries Temporelles

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Tâche 1 Introduction Aux Séries Temporelles

Transféré par

Droits d'auteur :

Formats disponibles

COVID-19 - Analysis, Visualization &

Ensuite, un treemap est créé en utilisant `px.treemap()` du module `plotly.express` en utilisant le

Vous aimerez peut-être aussi