Vous êtes sur la page 1sur 16

B2080 Probabilités et statistiques :

Mon travail ci-dessous parlera des effets du coronavirus dans notre société. J’aimerais le voir
d’un point de vue qu’est le taux de mortalité. Donc mon sujet est le suivant :

‘’Le coronavirus, a-t-il un impact de mortalité différent selon les pays en Europe et selon
l’âge ?’’

Destinataires : Madame Conreur,

Monsieur Hillewaere,

Monsieur Jonas.

Auteur : Brahim Mezghad

Matricule : 18008

A remettre pour le 29 mai 2020 au plus tard à 16 heures.

Source : https://www.google.fr/search?q=coronavirus&source=lnms&tbm=isch&sa=X&ved=2ahUKEwjT3Y6ymNXpAhXL-
qQKHTLKDlQQ_AUoAnoECB0QBA&biw=1366&bih=657#imgrc=UB2PLpI-UXoddM

1
Résumé :

Suite à l’expansion du COVID-19, nous avons reçu de l’ECAM, un travail à remettre


sur ce sujet. Le but de mon rapport est de savoir répondre à une problématique que j’ai
choisi, qui est de savoir si l’impact de mortalité est diffèrent entre les pays européens. Le
virus s’est propagé partout dans le monde et en Europe mais on ne vit pas tous la même
chose. Les conséquences sont différentes partout, est-ce dû au climat, à la taille du
territoire, à la manière dont chaque pays à l’habitude de fonctionner et j’en passe. Pour
pouvoir répondre à ma problématique, plusieurs méthodes sont utilisées pour pouvoir y
répondre. L’analyse descriptive, le test goodness-of-fit, le test d’hypothèse. Toutes ces
méthodes devraient me donner le même résultat, c’est-à-dire que l’impact de mortalité
est différent selon le territoire. J’ai fait la comparaison entre 2 pays européens, la France
et la Belgique. J’ai remarqué que le taux de mortalité était très différent entre les 2 pays.
On pourrait en conclure, que plusieurs paramètres influent l’expansion de ce virus, le
respect du confinement, le port du masque, les règles d’hygiène

2
Table des matières

I. Introduction ..................................................................................................................................... 4
II. Contexte et données ....................................................................................................................... 5
1. Description de mon choix et des données .................................................................................. 5
2. Méthode statistique, cheminement............................................................................................ 6
3. Analyse combinatoire .................................................................................................................. 6
4. Analyse descriptive et données................................................................................................... 7
5. Variables aléatoires et leur distribution ...................................................................................... 9
6. Test d’hypothèse ......................................................................................................................... 9
7. Test goodness-of-fit:.................................................................................................................. 12
III. Résultats et analyse ................................................................................................................... 13
IV. Conclusion : ............................................................................................................................... 14
V. Référence : .................................................................................................................................... 15
VI. Annexes : ................................................................................................................................... 15

3
I. Introduction

Aujourd’hui, il n’existe pas un jour où on n’entend pas le mot coronavirus ou


COVID-19. Ce virus est devenu viral en un rien de temps. Il a débuté en Chine et a fait le
tour du monde. Le premier cas a été détecté au début du mois de décembre 2019 en
Chine pour une raison qui nous échappe encore. Actuellement, nous sommes au mois de
mai 2020 et le coronavirus court toujours.

Etant considéré comme moins grave que la grippe et que les personnes les plus touchées
sont ceux qui possèdent un faible système immunitaire (les personnes âgées, les
nouveaux nés). Plusieurs pays n’ont pas fait attention et n’ont pas pris de mesures
drastiques afin de protéger leurs populations. Et donc, le virus s’est propagé partout
dans le monde. Dorénavant, le coronavirus est considéré comme dix fois plus dangereux
que la grippe. Ce virus ne possède aucun vaccin à nos jours. Ce qui provoque une
augmentation du taux de mortalité.

Par suite d’un taux de mortalité élevé, pour éviter une propagation exponentielle. Les
pays ont eu recours à un confinement total pour limiter les nombres d’infections et ainsi
les nombres de morts. Plusieurs mesures sont prises par les gouvernants : les
rassemblements sont interdits, plus de visites, plus de sports, les bars et restaurants
fermés, usines fermés.

Dans la suite de ce travail, je vais faire une analyse du taux de mortalité par rapport aux
pays européens. Pour cela je vais diviser le nombre de décès par le nombre d’infectés. Et
travailler à l’aide d’outils mathématiques comme l’analyse combinatoire, la loi normale,
la loi binomiale, un test Goodness-of-fit et un test d’hypothèse.

4
II. Contexte et données

1. Description de mon choix et des données

Pour mon travail, j’ai décidé de travailler sur un sujet un peu triste qu’est le taux
de mortalité car c’est intéressant qu’un même virus ait des conséquences différentes
selon les pays. Pour ma part, je me baserais sur cette différence entre 2 pays européens
sur 30 jours (11/03 au 9/04). Et je classerais mes valeurs dans l’ordre croissant.

Nombre de décès :

Durée Belgique France


Jour 1 0 3
Jour 2 0 12
Jour 3 0 15
Jour 4 1 21
Jour 5 1 27
Jour 6 3 31
Jour 7 4 36
Jour 8 5 78
Jour 9 7 89
Jour 10 8 108
Jour 11 13 112
Jour 12 16 112
Jour 13 30 186
Jour 14 34 231
Jour 15 42 240
Jour 16 56 292
Jour 17 64 299
Jour 18 69 319
Jour 19 78 365
Jour 20 82 418
Jour 21 123 499
Jour 22 132 518
Jour 23 140 541
Jour 24 164 833
Jour 25 183 880
Jour 26 185 984
Jour 27 192 1053
Jour 28 205 1120
Jour 29 283 1341
Jour 30 403 1417

Source : - https://www.levif.be/actualite/sante/l-evolution-du-coronavirus-en-belgique-en-italie-et-en-france-
infographies/article-normal-1260685.html?cookie_check=1589217201

5
2. Méthode statistique, cheminement

Ma méthode n’est pas compliquée, j’ai trouvé une courbe qui m’indiquait le
nombre décès et le nombre d’infecté en fonction du temps. J’ai décidé de prendre une
période ou le COVID-19 était bien présent en Europe. Ma période a débuté le 11 mars
2020 et s’est finit le 09 avril 2020. Pour savoir le nombre exact d’infectés ou de morts, il
me suffisait juste de prendre le nombre total du jour qui m’intéressait et de le soustraire
au jour qui le précédait. Le cheminement est de prendre ces données et d’essayer
d’obtenir des paramètres comme la moyenne, l’écart-type, la variance, le succès, c’est-à-
dire le taux de mortalités malheureusement et grâce au succès, on pouvait obtenir l’échec.
Mais ces données, sont des valeurs discrètes, c’est-à-dire que je ne peux pas appliquer une
loi normale, mais je peux utiliser une loi binomiale et essayer de me rapprocher d’une loi
normale. Car mes données ne sont pas continues. Il me suffit de rendre mes valeurs
discrètes en valeurs continues, C’est ce que je fais aux points 2.5, grâce à cela, je peux
approximer une loi normale. Et grâce à cela, je pourrais répondre mon test d’hypothèse
et affirmer ou rejeter mon hypothèse. Au point suivant, j’ai utilisé un exercice connexe
pour utiliser une analyse combinatoire sur l’âge et son taux de mortalités.

3. Analyse combinatoire

Exemple de calcul combinatoire par rapport à l’âge :

Un groupe de 30 personnes, 10 personnes sont âgées de moins de 40 ans, 14


personnes sont dans la quarantenaires et 6 personnes sont dans la quinquagénaires. Les
probabilités qu’elles perdent la vie à cause du COVID-19 sont respectivement de 0,2%,
0,4% et 1,3%. Soit X1, X2 ou X3 la variable qui représente le nombre de morts sur une
période de 20 jours.

a) Quelle est la probabilité que 6 personnes perdent la vie dans chaque groupe ?
b) Quelle est la probabilité que 10 personnes perdent la vie dans le premier groupe,
8 personnes dans le deuxième groupe et 4 personnes dans le dernier groupe ?
a) Je connais la probabilité pour chaque tranche d’âge et cette probabilité équivaut à
mon succès et mon échec qui serait 1 moins la probabilité du succès. Il me suffit de

6
faire une combinaison sur la période choisie. Et de multiplier la combinaison par le
succès et par l’échec.

6
P(X1=6) = 𝐶20 *0,002⁶ *0,998¹⁴ = 2,412*10⁻¹² Maintenant je multiplie toutes

6
P(X2=6) = 𝐶20 * 0,004⁶ *0,996¹⁴ = 1,5*10⁻¹⁰ les probabilités pour trouver la

6
P(X3=6) = 𝐶20 * 0,013⁶ *0,987¹⁴ =1,56*10⁻⁷ la probabilité totale.

P(totale) = 2,412*10⁻¹² * 1,5*10⁻¹⁰ * 1,56*10⁻⁷ = 6,032*10⁻²²

b) L’exercice est similaire mais avec d’autres données.

10
P(X1=10) = 𝐶20 * 0,002¹⁰ * 0,998¹⁰ = 1,854*10⁻²² Faire de même qu’à l’exercice

8
P(X2=8) = 𝐶20 * 0,004⁸ * 0,996¹² = 7,86*10⁻¹⁵ a)

4
P(X3=4) = 𝐶20 * 0,013⁴ * 0,987¹⁶ = 1,12*10⁻⁴

P(totale) = 1,854*10⁻²²*7,86*10⁻¹⁵*1,12*10⁻⁴ = 1,632*10⁻⁴⁰

4. Analyse descriptive et données

Dans une autre plateforme (Excel), j’ai calculé plusieurs paramètres par rapport aux
pays européens que j’analyse, c’est-à-dire la France, la Belgique. J’ai calculé leurs
moyennes, leurs variances, leurs modes, leurs étendues, leurs écarts-types, leurs
médianes sur une période de 30 jours par rapport aux décès total dans les pays
respectifs.

• J’ai calculé la moyenne d’une manière classique. Le procédé est le même pour les
2 pays d’Europe. J’additionne les nombres de morts durant la période que je veux
analyser par pays. Et ensuite je prends le total et divise par 30. Mais ceci est pour
une variable aléatoire discrète.
• La variance, c’est la moyenne des carrés des écarts à la moyenne. Un peu
𝑁
(𝑥−𝜇)2
compliqué à comprendre, voici une formule : Var = ∑ où
𝑖=1 𝑁

• L’écart-type, c’est un paramètre qui mesure la dispersion des valeur autour de la


moyenne. C’est tout simplement la racine carré de la variance.

7
• Le mode, c’est tout simplement la valeur qui revient le plus souvent.
• L’étendue, c’est faire la différence entre la valeur la plus grande et la valeur la
plus petite.
• La médiane, c’est juste le fait de replacer mes valeurs dans l’ordre croissant et
prendre la valeur qui se situe au milieu. Etant donné que j’ai 30 valeurs et que
c’est un nombre pair, je prendrais le quinzième et seizième jours et j’en ferais la
moyenne.

Suite à la description de mon choix et grâce au logiciel et aux formules d’Excel, j’obtiens
ce tableau suivant :

Belgique France
Moyenne 84,1 406
Variance 9505,89 175178,13
Ecart type 97,50 418,54
Mode 0 112
Etendue 403 1414
Médiane 49 298

1600

1400

1200
Nombre de mort

1000

800

600 Belgique
France
400

200

Date

8
5. Variables aléatoires et leur distribution

Vu mon sujet principal qui porte sur l’impact de mortalité qu’à le coronavirus sur
l’Europe, les valeurs calculés dans le tableau ci-dessus, sont des valeurs discrètes et
donc, je peux utiliser une loi binomiale, mais mon échantillon est trop élevé, ce qui fait
que ma combinaison sera très compliquée à calculer. Pour cela, je dois rendre mes
valeurs discrètes en valeurs continues pour approximer une loi normale. Pour cela je vais
utiliser de nouvelles formules. Et je vais prendre un échantillon élevé de personne
infectée pour les 2 pays. Pour le succès (p), je vais prendre le nombre total de décès que
je divise par le nombre total d’infecté dans son pays respectif. L’échec (q) se calculera de
cette manière ‘’q = 1- p’’. La moyenne se fait en multipliant l’échantillon au succès. De
même pour la variance qui se calcule de la manière suivante : on multiplie l’échantillon
au succès et à l’échec. Et pour le dernier paramètre, qui est l’écart-type. C’est tout
simplement la racine carré de la variance.

Variable aléatoire Belgique France

Echantillon 24983 84550

Succès = p 0,10098 0,144

Echec = q 0,89901133 0,85594323

Moyenne 2523 12180

Variance 2268,20557 10425,3885

Ecart-type 47,6256819 102,104792

6. Test d’hypothèse

Pour faire mon test d’hypothèse, 10 étapes sont nécessaires pour savoir si je rejette
ou si j’accepte mon hypothèse grâce à une intervalle de confiance. J’utilise un seuil de
signification de 5 %, j’ai des variables discrètes, donc je peux utiliser la loi binomiale,

9
maintenant, étant donné que mes échantillons sont grands, je peux approximer ma loi
binomiale en loi normale.

1. J’ai besoin de valeurs que j’ai calculé auparavant :


Belgique France
n (Echantillon) = 24983 m(Echantillon) = 84450
x̅ = 𝑝 = 0,10098 y̅ = 𝑝 = 0,144
q = 0,89902 q = 0,856
σx̅ = 1,90625.10⁻³ σy̅ = 1,20742.10⁻³

2. Maintenant, il faut formuler les hypothèses avec lesquelles je vais travailler.

𝐻0 : La différence de la moyenne du taux de mortalité est égale à 0. μx̅ = μy̅

H₁ : La différence de moyenne du taux de mortalité est différente de 0. μx̅ ≠ μy̅

3. Faut savoir si mon test se fait en unilatéral ou en bilatéral ?


Selon mon hypothèse de travail, je peux travailler en bilatéral car on parle
d’égalité entre les moyennes, on ne parle pas de supériorité d’une moyenne par
rapport à une autre où d’infériorité. Car si je parlais de supériorité ou
d’infériorité, j’utiliserais un test unilatéral.
4. Avec mon test, je peux travailler sur mon 𝐻0 et vérifier s’il est bon. Je dois
supposer que 𝐻0 est vraie. Si mon hypothèse est bonne, alors la différence des
moyennes de mes échantillons vaut 0. Je dois faire la différence de mes
statistiques pour chaque pays. Voici mes nouvelles valeurs : μx̅−y̅ = 0 et

σ2x̅ σ2y̅
σx̅−y̅ = √ + = 1,275*10⁻⁵
24983 84550

5. Nous ne travaillons pas en petite échantillon, mes échantillons sont plus grands
que 30. Mes échantillons tendent vers l’infini.
6. Vu la taille de mon échantillon : n et m>30, ce qui fait que ma distribution
s’approche d’une loi normale. J’aurais une distribution normale.

10
7. Voici ma distribution normale, étant donné que j’ai un grand échantillon,
j’obtiens cette distribution. J’ai utilisé un seuil de signification de 5% et un test
bilatéral. Donc j’ai cherché dans la table de la loi normale, pour 95%, la valeur est
1,96.σx̅−y̅ .

8. Je dois chercher mon intervalle de confiance à 95%. Grâce au dessin juste au-
dessus. 𝜇𝑥̅ −𝑦̅ − 1,96 ⋅ 𝜎𝑥̅ −𝑦̅ < 𝜇𝑥̅ −𝑦̅ < 𝜇𝑥̅ −𝑦̅ + 1,96 ⋅ 𝜎𝑥̅ −𝑦̅

Pour donner suite à mon H0 , la différence de ma moyenne est égale à 0. Donc il me


reste juste :

−1,96 ⋅ 𝜎𝑥̅ −𝑦̅ < 0 < 1,96 ⋅ 𝜎𝑥̅ −𝑦̅ où 𝜎𝑥̅ −𝑦̅ = 1,275*10⁻⁵

Donc mon intervalle de confiance est : [-2,5.10⁻⁵ : 2,5.10⁻⁵]

9. Grâce à mon intervalle de confiance à 95%, si la différence de moyenne que je


calculerais à l’étape 10 se situe dans l’intervalle entre -2,5.10⁻⁵ et 2,5.10⁻⁵, alors
mon H0 est vraie. Sinon, si ma valeur est en dehors de cet intervalle, alors on
rejette l’ H0 .
10. Enfin nous sommes à la fin de ce test d’hypothèse. Pour déterminer le rejet ou la
validité de mon H0 .
Pour cela, je reprends les données que j’ai introduit à l’étape 1 : 𝑥̅ = 0,10098
̅𝑦 = 0,144
La différence de ces moyennes est égale : 𝑦̅ − 𝑥̅ = 4,30.10⁻²

11
Cette valeur se trouve en dehors de mon intervalle, donc on peut rejeter
H0 .Alors le taux de mortalités entre les pays ne sont pas les mêmes. On n’est pas
sûr de pouvoir rejeter H0 à 100%. Il y a une petite erreur lorsqu’on rejette une
hypothèse. Dans notre cas, c’est une erreur de type 1. L’erreur de type 1 dans
notre sujet est de 5%.

7. Test goodness-of-fit:

Ce test qu’on surnomme aussi, la loi Khi 2 : C’est une méthode qui nous permet d’utiliser
une variable aléatoire qui suit une loi normale de moyenne 0 et d’écart-type 1. Ce test
me permet de valider ou de rejeter mon H0. Pour utiliser cette loi, je vais utiliser une
table de contingence. Dans ce tableau, je mettrais les pays que je veux traiter, la France
et la Belgique. Dans l’autre partie du tableau, je mettrais le nombre de mort et d’infecté
pour ces pays. J’utiliserais un seuil de signification de 10% pour pouvoir évaluer mon
hypothèse, pour le faire, il me suffit de chercher les 10% dans une table de distribution
du Khi 2 et la comparer avec la valeur que je calculerais par la suite.

Voici mes 2 hypothèses :

H0 : Le taux de mortalité ne change pas entre les pays

H1 : Le taux de mortalité change entre les pays.

Tableau de contingence :

Belgique France Total

Infectés 24983 84550 109533


(Théorie) (24249,28) (85277,16) (88,16%)
Morts 2523 12180 14703
(Théorie) (3253,95) (11443,15) (11,83%)
Total 27506 96730 124236(100%)

Je suppose que H0 est vraie :

J’ai besoin trouver mon degrés de liberté, j’ai 2 colonnes et 2 lignes :

DDL = (2-1) colonnes x (2-1) lignes

12
DDL = 1, mon degré de liberté est de 1.

En rouge dans mon tableau, se sont les valeurs attendues en supposant que H 0 est vraie.

La formule Khi 2 est une variable aléatoire qui se calcule de la manière suivante :

(24983 − 24249,28)2 (84550 − 85277,16)2 (2523 − 3253,98)2 (12180 − 11443,15)2


𝜒12 = + + +
24249,28 85277,16 3253,98 11443,15

𝜒12 = 240

Grâce à mon seuil de signification de 10% et à la table de distribution de la loi du Khi 2, je


peux trouver une valeur critique. Je la comparerais à la valeur calculé ci-dessus, si ma
valeur est plus grande que le Khi critique, alors je pourrais rejeter mon H0 .

Ici j’obtiens 𝜒12 = 240, et c’est supérieur au Khi critique du tableau qui équivaut à 2,70.
Donc je peux rejeter mon H0 et prendre H1.

III. Résultats et analyse

D’après les différentes méthodes utilisées, j’ai pu répondre à ma problématique


qui est la suivante : ‘’Le coronavirus, a-t-il un impact de mortalité différent selon les pays
en Europe et selon l’âge ?’’. Suite aux données obtenues lors d’une période bien précise,
c’est-à-dire du 11 mars au 9 avril. J’ai calculé plusieurs paramètres importants comme la
moyenne, la variance et l’écart-type. En faisant la différence des moyennes entre la
Belgique et la France, j’obtiens une différence de moyenne de 4,30.10-2. Pour vérifier la
signification de cette valeur, il me suffisait de calculer un intervalle de confiance de 95%.
L’intervalle de confiance à 95% est la suivante : [-2,5.10⁻⁵ : 2,5.10⁻⁵]. La différence de
moyenne ne se trouve pas dans mon intervalle de confiance. De même pour le test
goodness-of-fit, avec les valeurs obtenues de plusieurs sources fiables, j’ai conçu un
tableau de contingence, puis j’ai calculé ma variable Khi 2 : 𝜒12 = 240. Cette valeur est
bien supérieure au Khi critique de mon seuil de signification. Donc pour ces 2 test,
j’obtiens le même résultat, ce résultat est le rejet de l’hypothèse nul. C’est-à-dire que le
taux de mortalité est différent selon les pays européens.

13
IV. Conclusion :

En conclusion, le COVID-19 s’est propagé partout dans le monde et s’est installé en


Europe. Beaucoup de décès sont apparus durant plusieurs mois. Et actuellement, le
COVID-19 est toujours d’actualité, aucun vaccin n’est disponible pour stopper cette
maladie récente à ce jour. Pour éviter la propagation du COVID-19, de nouvelles mesures
ont fait surface dans le monde, notamment le port du masque devenu obligatoire, le
confinement de la population, respect de l’hygiène. Malgré cela, les morts n’ont cessés
d’augmenter. Mais le nombre de décès est différent selon les pays, les régions, l’âge. J’ai
décidé de travailler sur ce sujet et de savoir si le taux de mortalité était différent entre
les pays européens. J’ai choisi la Belgique et la France car ce sont 2 territoires différents
qui se situent en Europe. De ce fait, plusieurs outils m’ont aidé à calculer ce taux de
mortalité et les comparer entre des pays européens. J’ai pris une période définie pour
pouvoir répondre à ma problématique. J’ai obtenu des valeurs pour ces différents outils
pour la France et la Belgique. Pour goodness-of-fit, ma variable que j’ai calculée est
beaucoup plus grande que la valeur critique. Ce qui a pour conséquence, le rejet de H0.
J’ai utilisé un autre outil qui est le test d’hypothèse, 10 étapes sont nécessaires pour
vérifier mon hypothèse et savoir si je peux l’accepter ou la rejeter. Pour cela j’ai calculé
un intervalle de confiance à 95% et la différence de moyenne des 2 pays. J’ai remarqué
que la différence de moyenne ne rentrait pas dans mon intervalle à 95%. Ce qui me
ramène à la même conclusion que mon test goodness-of-fit. C’est-à-dire, le rejet de H0.

Suite à ces calculs, j’affirme que le taux de mortalité est différent entre les pays
européens. Il y a plusieurs moyens de faire stagner cette propagation du COVID-19. On
peut y remédier en utilisant des mesures drastiques pour que la population prend
vraiment au sérieux cette épidémie. On pourrait donner des masques gratuits à toute la
population car tout le monde n’a pas accès à ces masques. Ce n’est que main dans la
main que nous pourrons avancer et combattre cette maladie, nous ne devons pas penser
que nous vivons seuls cette situation. Nous sommes tous concernés, après avoir lu ce
travail, n’oubliez pas de vous laver les mains.

14
V. Référence :

https://www.passeportsante.net/fr/Actualites/Dossiers/Fiche.aspx?doc=coronavirus-populations-a-
risque

https://www.linternaute.com/actualite/guide-vie-quotidienne/2486227-coronavirus-dans-le-monde-
plus-de-300-000-morts-point-sur-la-situation-aux-usa-en-espagne-italie/ -------
https://fr.statista.com/statistiques/1101324/morts-coronavirus-monde/

https://covid19.sciensano.be/sites/default/files/Covid19/Derni%C3%A8re%20mise%20%C3%A0%20j
our%20 de%20la%20situation%20%C3%A9pid%C3%A9miologique.pdf

https://www.google.fr/search?q=coronavirus+page+de+garde&source=lnms&tbm=isch&sa=X&ved=
2ahUKEwimi9Col6npAhXQzaQKHaDED5EQ_AUoAXoECAsQAw&biw=1366&bih=657#imgrc=UB2PLpI-
UXoddM

https://www.passeportsante.net/fr/Actualites/Dossiers/Fiche.aspx?doc=coronavirus-populations-a-
risque

VI. Annexes :

Excel : Base de données

15
16

Vous aimerez peut-être aussi