Vous êtes sur la page 1sur 25

Année universitaire :

2021 / 2022

Rapport d’analyse des données

Réalisé par :
BENEDHAIBA Yassmine 19010321
BOUKHAR Malak 19012763
Encadré par : Mr. JAHIDI Rachid DINANE Hafsa 19011707
EL BEJAUI AHMIMES Hanaa P120060596
ZARIOUH Bouthaina 19011682
Tables de matière :
Introduction générale .............................................................................................................2
Partie I : L’analyse en composantes principales ..................................................................3
1 : Qu’est ce qu’un ACP et ses objectifs : ................................................................4
2: Statistiques descriptives : ......................................................................................5
3 : La matrice de corrélation : ...................................................................................6
4 :Indice de KMO et test de Barlett : ........................................................................7
5 :La qualité de représentation :................................................................................7
6 :La variance totale expliqué ....................................................................................8
7: Graphique des valeurs propres : .........................................................................9
8 :Matrice des composantes : ...................................................................................10
9 :Diagramme des composantes : ............................................................................11
10 :Diagramme des individus : ..................................................................................12

Partie II : L’analyse typologique ........................................................................................14


1 : Qu’est ce qu’un AT et ses objectifs : .................................................................15
2: La matrice de proximité : ....................................................................................16
3 : La chaine des agrégations : .................................................................................18
4 : La stalactite verticale : ........................................................................................19
5 :L’arbre hiérarchique : .........................................................................................20
6 : Récapitulatif des observations : ..........................................................................21
7: Annova à 1 facteur : .............................................................................................22
Conclusion ............................................................................................................................23
Webographie ( la liste des sources)......................................................................................24

1
Introduction

L’économie mondiale est basée essentiellement sur la consommation et le commerce. Elle a donc fait
face à une année 2020 complexe, et l’apparition du Covid-19 en est la cause. Alors que la propagation
du virus était circonscrite en Chine en fin 2019, elle s’est ensuite rapidement diffusée dans le reste du
monde. Après le développement du virus, plusieurs pays ont mis en œuvre des mesures qui ont eu un
impact sur l’importation et l’exportation des biens et services au niveau de plusieurs pays.

Puisque l’année 2020 est passée, on a décidé de mener une étude pour évaluer comment cette pandémie
a affecté plusieurs variables durant cette année au niveau de plusieurs pays autour du monde.

D’après ce que nous avons étudié au cours de l’analyse des données durant ce semestre, et pour mieux
maîtriser le logiciel SPSS, nous avons mené une étude sur une base de données réelle. Cette dernière
regroupe des informations à propos de 23 pays qui ont fait face à la pandémie du Covid 19.

Nous avons décidé de travailler sur les 7 variables suivantes :

• PIB ;
• Taux d’inflation ;
• Taux de chômage ;
• Volume d’importation des biens et services ;
• Volume d’importation des biens et services ;
• Dépenses publiques ;
• Taux de mortalité ;

L’objectif de notre étude est d’identifier l’impact de la pandémie du Covid-19 au niveau de ces
variables pour différents pays.

Dans ce cadre, nous avons effectué l’étude de ces variables par le biais de deux méthodes, à savoir
l’analyse des composantes principales, ainsi que l’analyse typologique.

2
Partie I :

3
❖ Qu’est-ce que l’ACP ?
L’analyse en composantes principales est une méthode d’analyse multidimensionnelle des données. C’est
une technique d'analyse statistique, principalement descriptive, consistant à représenter sous forme
graphique le plus d'informations possibles contenues dans un tableau.

❖ Quels sont les objectifs de l’ACP ?


• Fournir des outils simples et lisibles de représentation des informations traitées, permettant de faire
ressortir des données brutes les éventuels liens existants entre les variables (en termes de corrélation),

• Donner des indications sur la nature, la force et la pertinence de ces liens, afin de faciliter leur
interprétation et découvrir quelles sont les tendances dominantes de l'ensemble de données,

• Réduire efficacement le nombre de dimensions étudiées (et ainsi simplifier l'analyse), en cherchant à
exprimer le plus fidèlement possible l'ensemble original de données grâce aux relations détectées entre les
variables.

❖ Que permet l’ACP ?


• Identifier les dimensions ou les facteurs fondamentaux qui expliquent les corrélations entre plusieurs
variables.

• Elle permet une analyse bien structurée des diverses variables statistiques définies sur les caractères
étudiés

• Elle permet de construire des variables artificielles (car non mesurés mais calculés à partir des données)
qui expliquent l’ensemble des variables statistiques prises en compte dans l’ACP.

4

Statistiques descriptives

Moyenne Ecart-type n analyse

PIB -3,600130 4,1328017 23


VolumeExportation -8,935522 10,7921619 23
VolumeImportation -8,259565 10,8468733 23
Tauxdechomage 7,610000 4,8740808 23
Tauxdinflation 2,620043 2,1878422 23
Tauxdemortalité/1000habitant 7,898696 2,9904231 23
Dépensespubliques 34,293783 14,3933615 23

5
 Interprétation :
Le tableau suivant présente la moyenne et l’écart type de chaque variable, il est utile pour
déterminer le degré d’homogénéité de nos individus.
Avec la moyenne 34,29 qui représente « Les dépenses publiques », on peut dire que durant la crise
sanitaire (en 2020) les dépenses publiques ont été augmenté dans plusieurs pays
À travers ce tableau on peut dire que notre échantillon est hétérogène selon les écarts types des
variables qui excèdent les moyennes, par exemple le volume d’exportation, le volume
d’importation, et le PIB traduisant une grande dispersion autour des moyennes. Alors on peut dire
que les individus de notre base de données sont hétérogènes.

Matrice de corrélation

PIB VolumeExp VolumeImp Tauxdechom Tauxdinflation Tauxdemortalit Dépensespubli

ortation ortation age é ques

/1000habitant

PIB 1,000 ,292 ,535 -,403 ,489 -,272 -,344

VolumeExportation ,292 1,000 ,624 -,281 ,028 ,307 -,029

VolumeImportation ,535 ,624 1,000 -,359 ,402 ,260 -,068

Tauxdechomage -,403 -,281 -,359 1,000 -,058 -,060 -,193


Corrélation
Tauxdinflation ,489 ,028 ,402 -,058 1,000 -,201 -,246

Tauxdemortalité/100
-,272 ,307 ,260 -,060 -,201 1,000 ,369
0habitant

Dépensespubliques -,344 -,029 -,068 -,193 -,246 ,369 1,000

 Interprétation :
La matrice de corrélation nous permet de vérifier l’existence d’inter corrélation entre les variables pour
pouvoir en extraire des dimensions homogènes.
À partir de la matrice de corrélation associée à notre base de données, on peut conclure que les
corrélations les plus fortes existent entre les variables suivantes :
▪ Les variables « volume d’exportation » et « volume d’importation » sont corrélées avec une
corrélation de 0,624.
▪ Les variables « PIB » et « volume d’importation » sont corrélées avec une corrélation de
0,535

6
Indice KMO et test de Bartlett

Mesure de précision de l'échantillonnage de Kaiser-Meyer-


,605
Olkin.
Khi-deux approximé 43,327

Test de sphéricité de Bartlett ddl 21

Signification de Bartlett ,003

 Interprétation :
L’indice KMO permet de mesurer la précision de l’échantillonnage.

• Un KMO étant égale à (0,605 > 0,5) est assez élevé.


• Le test de sphéricité de Barlett = 0,003 est quasiment proche de 0 donc il signifie qu’il y a une forte
corrélation entre les variables.

Nous pouvons déduire qu’une analyse en composantes principales s’avère très intéressante.

Qualité de représentation

Initial Extraction

PIB 1,000 ,781


VolumeExportation 1,000 ,621
VolumeImportation 1,000 ,804
Tauxdechomage 1,000 ,381
Tauxdinflation 1,000 ,519
Tauxdemortalité/1000habitant 1,000 ,665
Dépensespubliques 1,000 ,531

Méthode d'extraction : Analyse en composantes


principales.

 Interprétation :
Les extractions sont obtenues grâce à la sommation des cos² des deux composantes, aussi elles nous
permettent de vérifier la bonne représentation des variables. Ainsi, plus la valeur de l’extraction est
proche de 1, plus la variable qui lui correspond est mieux représentée.

7
Dans notre cas, la plupart des variables sont supérieurs à 0,5, donc elles sont bien représentées au niveau de
notre carte.

Variance totale expliquée


Composante Valeurs propres initiales Extraction Sommes des carrés des facteurs
retenus
Total % de la % cumulés Total % de la % cumulés
variance variance
1 2,495 35,637 35,637 2,495 35,637 35,637
2 1,807 25,818 61,455 1,807 25,818 61,455
3 ,963 13,760 75,215
4 ,774 11,052 86,267
5 ,429 6,129 92,396
6 ,302 4,318 96,714
7 ,230 3,286 100,000
Méthode d'extraction : Analyse en composantes principales.

 Interprétation :
Dans le tableau de la variance totale expliquée on ne retient que les valeurs propres qui sont
supérieures à 1, dans ce cas elles correspondent aux deux premières composantes qui sont équivalentes à
61,455% de variance cumulée expliquée.
Nous disposons de deux composantes représentatives dans la base de données

La première composante a une valeur propre de 2,495 représente à elle seule 35,637% de la variance
expliquée donc détient la plus grande part d’informations, alors que la deuxième composante a une valeur
propre de 1,807 qui représente 25,818 % du total de l’information donc on peut dire malgré la réduction de
7 variables à 2 composantes la richesse de ces dernières en termes d’informations retenues dépasse les
61,455%.

8
 Interprétation :
Dans notre cas, la première composante explique 2,5 des valeurs propres. Ainsi, la deuxième
composante illustre près de 1.75 des valeurs propres. Cependant les autres composantes ont une faible part
donc, on ne retiendra que les 2 premières composantes pour une représentation avec deux axes parce que
leurs valeurs propres sont supérieures à 1.

9
Matrice des composantes

Composante

1 2

PIB ,821 -,328


VolumeExportation ,635 ,466
VolumeImportation ,856 ,268
Tauxdechomage -,535 -,309
Tauxdinflation ,574 -,436
Tauxdemortalité/1000habitant ,009 ,815
Dépensespubliques -,264 ,679

 Interprétation :
Cette matrice sert à savoir quelle variable faut retenir pour chaque composante. Une variable n’est
significative que si sa contribution est d’au moins 0,50, et donc plus une variable à une forte corrélation
plus elle contribue à la formation de cette composante, et plus elle sert à sa désignation. La matrice nous
permet également de vérifier que le point est bien représenté graphiquement et ceci grâce au deux
composantes 1 et 2. Pour ce il faut les lever au carré et leur somme doit être inférieur à 1.
 La variable (VolumeExportation) : 0,635 ² + 0,466 ² = 0,620 < 1
 La variable (Tauxdinflation) : 0,574 ²+ (- 436) ² = 0,519 < 1

D’où les deux variables sont bien représentées graphiquement donc leurs points sont proches des cercles
de corrélation.

La première composante principale est fortement corrélée avec les variables :

• PIB (0,821)
• Volume Exportation (0,635)
• Volume d’Importation (0,856)
• Taux de chômage (-0,535)
• Taux d’inflation (0,574)

La deuxième composante principale est fortement corrélée avec les variables :

10
• Taux de mortalité/1000 habitants (0,815)
• Dépenses publiques (0,679)

 Interprétation :
Chaque point représente une variable. Sur le diagramme, on peut voir les corrélations entre les
variables :
 Une forte corrélation positive entre les variables : VolumeExportation, VolumeImportation,
PIB et Taux d’inflation, mais ces variables sont faiblement corrélées avec le taux de
mortalité/1000 habitants.
 Ces variables sont négativement corrélées avec les dépenses publiques et le taux de chômage.

11
3 2

4 1

 Interprétation :
Le diagramme ci-dessus, nous permet de déterminer les différents groupes d’individus ayant un
comportement identique, et ceux ayant un comportement isolé.

D’après ce graphique, nous pouvons remarquer qu’il existe 4 groupes :

Le groupe 1 : Constitue des pays riches dont l’économie n’a pas été beaucoup affectée par le Covid
19 et ayant un faible taux de mortalité/1000 habitants et de dépenses publiques.

Le groupe 2 : Constitue des pays riches aussi dont l’économie n’a pas été beaucoup affectée par le
Covid 19 mais ils ont un fort taux de mortalité/1000 habitants et de dépenses publiques.

12
Le groupe 3 : Constitue des pays moins riches, leur économie a été grandement affecté par le Covid
19 et ayant un fort taux de mortalité/1000 habitants et de dépenses publiques.

Le groupe 4 : Constitue des pays moins riches, leur économie a été grandement affecté par le Covid
19, mais ayant un faible taux de mortalité/1000 habitants et de dépenses publiques.

13
Partie II :
L’Analyse typologique

14
➢ Qu’est-ce que l’AT ?
L’analyse, ou classification, typologique correspond à un ensemble de méthodes multidimensionnelles
visant à prendre des éléments (sujets ou variables) provenant de certains ensembles de données pour les
regrouper dans des clusters (types) d’éléments similaires (sujets ou variables). L’analyse typologique permet
de répartir la population de l’enquête en un nombre défini de sous-groupes aussi différents que possibles les
uns des autres et dans lesquels les individus sont aussi semblables que possible entre eux.

➢ Quels sont les objectifs de l’AT ?


• Construire à partir des variables choisies a priori des groupes d’individus.

• Vise à classer et à constituer des groupes d’individus ou d’objets, ces individus étant décrits par un
ensemble de caractéristiques.
• Constituer des groupes de façon que :
✓ Les individus appartenant à un même groupe se rassemblent le plus possible.
✓ Les groupes soient les plus différents possibles les uns des autres .

15
➢ Les interprétations :

16
 Interprétation :
La matrice de proximité a pour rôle de révéler les distances euclidiennes au carré existantes entre les
différentes variables, par conséquent plus la distance entre deux variables est faible ou presque nulle, plus
on peut facilement les agréger et les regrouper. Les variables sont en lignes et en colonnes. Le chiffre
présenté est la distance calculée avec la méthode et la mesure sélectionnées. Cette matrice est triangulaire,
c’est à dire qu’elle est séparée par sa diagonale qui contient la valeur nulle (distance d’un par rapport à
lui-même égale 0).

Tel est le cas par exemple pour « Canada avec Royaume-Uni » et « Allemagne avec France » ainsi
que « Rwanda avec Chad » et « Pologne avec Chad ».

17
Chaîne des agrégations
Etape Regroupement de classes Coefficients Etape d'apparition de la classe Etape suivante
Classe 1 Classe 2 Classe 1 Classe 2
1 4 9 18,454 0 0 5
2 12 22 38,150 0 0 9
3 18 21 87,898 0 0 10
4 19 20 142,681 0 0 12
5 4 23 205,468 1 0 15
6 1 2 280,204 0 0 11
7 10 11 357,324 0 0 16
8 8 14 441,309 0 0 16
9 12 13 540,942 2 0 15
10 16 18 652,345 0 3 13
11 1 6 821,646 6 0 18
12 7 19 993,988 0 4 18
13 15 16 1186,841 0 10 19
14 3 17 1423,532 0 0 20
15 4 12 1695,055 5 9 22
16 8 10 2016,554 8 7 17
17 5 8 2425,482 0 16 19
18 1 7 3051,188 11 12 20
19 5 15 3747,807 17 13 21
20 1 3 4643,833 18 14 21
21 1 5 7413,892 20 19 22
22 1 4 10908,926 21 15 0

 Interprétation :
D’abord, on a réuni les deux classes les plus proches dans un même regroupement, la distance entre
les deux classes est les coefficients et cette distance est affichée dans la colonne coefficients, selon un
ordre croissant.

A partir de la chaine on remarque que le premier saut brusque est entre l’étape 19 et 20. Si on réalise
notre coupe à partir de ce niveau on aura une solution en 4 classes.

 Qualité en 4 classes : (10908,926-3747,807) /10908,926 = 0,67.

18
 Interprétation :
Le diagramme est une présentation graphique du l’ordre d’obtention des résultats de la classification
ou des regroupements des individus. Dans notre cas il est présenté verticalement et donc la lecture se fait
de haut en bas.

On peut voir directement notre solution en 4classes à travers la stalactite :

- La 1ère classe : Maroc, Algérie, Égypte, Bahreïn, Mexique, Brésil.

- La 2ème classe : Espagne, Gabon.

-La 3ème classe : Kenya, Burkina Faso, Côte d’Ivoire, Malawi, Chad, Rwanda, Chine, Ireland, Etats-
Unis.

-La 4ème classe : France, Canada, Royaume Uni, Pologne, Allemagne, ukrainien.

19
 Interprétation :
Le dendrogramme met en évidence la composition des différentes classes, ainsi que l’ordre dans lequel
elles ont été formées. Lors de la lecture du dendrogramme on doit bien repérer ou lire le gain d’inertie
intra classe pour trouver le seuil idéal. Dans ce cas-là il est intéressant de faire une coupe entre la 19ème
et la 20ème étape, vu qu’on note un saut très important après ce niveau-là. Le dendrogramme, en utilisant
la méthode Ward, montre le niveau proportionnel à notre niveau d’agrégation.

Dans notre cas, Le saut est fait au niveau coupé par le trait, donc nous pouvons observer sur le
dendrogramme que nous avons une solution en 4 classes car ces derniers se détachent nettement.

20
Récapitulatif des observations

Ward Method PIB Tauxdechoma VolumeExpor VolumeImpor Tauxdinflatio Dépensespubli Tauxdemortal

ge tation tation n ques ité/1000habita

nt

N 6 6 6 6 6 6 6
1
Moyenne -4,244500 9,626167 -19,358333 -19,267167 2,944000 28,586833 5,060000

N 2 2 2 2 2 2 2
2
Moyenne -6,735000 18,235000 -3,108500 -10,848000 2,235000 15,555000 8,490000

N 6 6 6 6 6 6 6
3
Moyenne -6,991000 7,032333 -11,164667 -12,136500 1,481167 54,000667 10,908333

N 9 9 9 9 9 9 9
4
Moyenne -,213333 4,289889 -1,795778 2,238667 3,248889 29,124667 7,653333

N 23 23 23 23 23 23 23
Total
Moyenne -3,600130 7,610000 -8,935522 -8,259565 2,620043 34,293783 7,898696

 Interprétation :
Le tableau récapitulatif des observations permet de comparer les classes et déterminer la similarité des
profils. Dans notre étude, on remarque :
• La classe 1 : est caractérisée par le volume d’exportation et le volume d’importation, ces
variables réalisent un minimum, les dépenses publiques sont assez élevées ainsi qu’un taux de
mortalité/1000 habitant très faible par rapport aux moyennes de la totalité des pays, c’est la classe
des pays pauvres avec un faible taux de mortalité. Ce sont Maroc, Algérie, Égypte, Bahreïn,
Mexique, Brésil.
• La classe 2 : représentée par l’Espagne et le Gabon réalisent un maximum au niveau du taux de
chômage et un minimum au niveau du PIB et des dépenses publiques, ces pays n’allouent pas des
bonnes dépenses publiques en les comparant avec les autres pays
• La classe 3 : réalise un maximum au niveau des dépenses publiques et le taux de mortalité/1000
habitant ainsi qu’un minimum au niveau du taux d’inflation, ces pays sont Kenya, Burkina Faso,
Côte d’Ivoire, Malawi, Chad, Rwanda, Chine, Ireland, Etats-Unis.

21
• La classe 4 : qui englobe la France, Canada, Royaume Uni, Pologne, Allemagne, ukrainien
réalise un maximum au niveau de taux d’inflation, volume d’exportation, volume d’importation
et le PIB, alors qu’un minimum ai niveau du taux de chômage, ce sont les pays riches

ANOVA à 1 facteur
Somme des ddl Moyenne F Signification
carrés des carrés
Inter-groupes 194,368 3 64,789 6,786 ,003
PIB Intra-groupes 181,393 19 9,547
Total 375,761 22
Inter-groupes 351,381 3 117,127 12,994 ,000
Tauxdechomage Intra-groupes 171,265 19 9,014
Total 522,647 22
Inter-groupes 1208,316 3 402,772 5,652 ,006
VolumeExportation Intra-groupes 1354,040 19 71,265
Total 2562,357 22
Inter-groupes 1822,503 3 607,501 15,071 ,000
VolumeImportation Intra-groupes 765,899 19 40,310
Total 2588,403 22
Inter-groupes 12,267 3 4,089 ,835 ,491
Tauxdinflation Intra-groupes 93,039 19 4,897
Total 105,306 22
Inter-groupes 103,938 3 34,646 7,093 ,002
Tauxdemortalité/100
Intra-groupes 92,800 19 4,884
0habitant
Total 196,738 22
Inter-groupes 3468,345 3 1156,115 20,164 ,000
Dépensespubliques Intra-groupes 1089,370 19 57,335
Total 4557,715 22

 Interprétation :

Annova détermine les variables qui ont contribué au regroupement. Une variable ayant contribué plus au
regroupement a une grande valeur de F. par exemple les dépenses publiques ont contribué de 1156,115
Cependant, la variable de taux d’inflation a contribué juste de 4,089.

22
Conclusion :

Pour réaliser cette étude avec succès, on a opté, dans un premier lieu, pour une analyse en composantes
principales et qui a pu mettre en valeur nos connaissances théoriques et les tourner en pratique en interpellant
l’ensemble des outils d’analyse des données étudiés.

L’analyse en composante principale nous a permis de réduire notre base de données, voire les dimensions
au niveau des variables choisies, sans la déformer et en gardant le maximum de l’information représentée dans
les données initiales, ce qui nous a aidé à réussir la visualisation des individus à savoir l’impact de la crise
sanitaire sur les différents pays

Tandis que l’analyse typologique nous a permis ensuite de constituer des regroupements des variables
ayant des caractéristiques plus ou moins similaires. Par conséquent, nous avons eu quatre classes différentes
où chacune englobe des individus assez homogènes.

Sous ce rapport, on a bien réussi à avoir un aperçu ou une sorte d’image sur le PIB, volume d’exportation,
volume d’importation, taux de chômage, taux d’inflation, taux de mortalités/1000 habitant et les dépenses
publiques des différents pays durant la crise sanitaire et surtout dans l’année 2020.

23
Webographie :
https://www.imf.org/en/Publications/WEO/weo-database/2020/October/select-country-group

https://www.hcp.ma/downloads/Enquete-sur-l-impact-du-coronavirus-sur-la-situation-economique-sociale-et-
psychologique-des-menages_t21765.html

https://www.hcp.ma/region-agadir/m/br-DOSSIER-SUR-LA-PANDEMIE-DU-CORONAVIRUS-COVID-19_a110.html

https://www.imf.org/fr/Topics/imf-and-covid19

https://www.imf.org/fr/News/Articles/2020/09/18/blog-imf-lending-during-the-pandemic-and-beyond

https://www.imf.org/en/Search#q=covid%20impact&sort=relevancy&f:type=[FACTSHEETS]

https://fr.countryeconomy.com/pays

24

Vous aimerez peut-être aussi