Académique Documents
Professionnel Documents
Culture Documents
2021 / 2022
Réalisé par :
BENEDHAIBA Yassmine 19010321
BOUKHAR Malak 19012763
Encadré par : Mr. JAHIDI Rachid DINANE Hafsa 19011707
EL BEJAUI AHMIMES Hanaa P120060596
ZARIOUH Bouthaina 19011682
Tables de matière :
Introduction générale .............................................................................................................2
Partie I : L’analyse en composantes principales ..................................................................3
1 : Qu’est ce qu’un ACP et ses objectifs : ................................................................4
2: Statistiques descriptives : ......................................................................................5
3 : La matrice de corrélation : ...................................................................................6
4 :Indice de KMO et test de Barlett : ........................................................................7
5 :La qualité de représentation :................................................................................7
6 :La variance totale expliqué ....................................................................................8
7: Graphique des valeurs propres : .........................................................................9
8 :Matrice des composantes : ...................................................................................10
9 :Diagramme des composantes : ............................................................................11
10 :Diagramme des individus : ..................................................................................12
1
Introduction
L’économie mondiale est basée essentiellement sur la consommation et le commerce. Elle a donc fait
face à une année 2020 complexe, et l’apparition du Covid-19 en est la cause. Alors que la propagation
du virus était circonscrite en Chine en fin 2019, elle s’est ensuite rapidement diffusée dans le reste du
monde. Après le développement du virus, plusieurs pays ont mis en œuvre des mesures qui ont eu un
impact sur l’importation et l’exportation des biens et services au niveau de plusieurs pays.
Puisque l’année 2020 est passée, on a décidé de mener une étude pour évaluer comment cette pandémie
a affecté plusieurs variables durant cette année au niveau de plusieurs pays autour du monde.
D’après ce que nous avons étudié au cours de l’analyse des données durant ce semestre, et pour mieux
maîtriser le logiciel SPSS, nous avons mené une étude sur une base de données réelle. Cette dernière
regroupe des informations à propos de 23 pays qui ont fait face à la pandémie du Covid 19.
• PIB ;
• Taux d’inflation ;
• Taux de chômage ;
• Volume d’importation des biens et services ;
• Volume d’importation des biens et services ;
• Dépenses publiques ;
• Taux de mortalité ;
L’objectif de notre étude est d’identifier l’impact de la pandémie du Covid-19 au niveau de ces
variables pour différents pays.
Dans ce cadre, nous avons effectué l’étude de ces variables par le biais de deux méthodes, à savoir
l’analyse des composantes principales, ainsi que l’analyse typologique.
2
Partie I :
3
❖ Qu’est-ce que l’ACP ?
L’analyse en composantes principales est une méthode d’analyse multidimensionnelle des données. C’est
une technique d'analyse statistique, principalement descriptive, consistant à représenter sous forme
graphique le plus d'informations possibles contenues dans un tableau.
• Donner des indications sur la nature, la force et la pertinence de ces liens, afin de faciliter leur
interprétation et découvrir quelles sont les tendances dominantes de l'ensemble de données,
• Réduire efficacement le nombre de dimensions étudiées (et ainsi simplifier l'analyse), en cherchant à
exprimer le plus fidèlement possible l'ensemble original de données grâce aux relations détectées entre les
variables.
• Elle permet une analyse bien structurée des diverses variables statistiques définies sur les caractères
étudiés
• Elle permet de construire des variables artificielles (car non mesurés mais calculés à partir des données)
qui expliquent l’ensemble des variables statistiques prises en compte dans l’ACP.
4
➢
Statistiques descriptives
5
Interprétation :
Le tableau suivant présente la moyenne et l’écart type de chaque variable, il est utile pour
déterminer le degré d’homogénéité de nos individus.
Avec la moyenne 34,29 qui représente « Les dépenses publiques », on peut dire que durant la crise
sanitaire (en 2020) les dépenses publiques ont été augmenté dans plusieurs pays
À travers ce tableau on peut dire que notre échantillon est hétérogène selon les écarts types des
variables qui excèdent les moyennes, par exemple le volume d’exportation, le volume
d’importation, et le PIB traduisant une grande dispersion autour des moyennes. Alors on peut dire
que les individus de notre base de données sont hétérogènes.
Matrice de corrélation
/1000habitant
Tauxdemortalité/100
-,272 ,307 ,260 -,060 -,201 1,000 ,369
0habitant
Interprétation :
La matrice de corrélation nous permet de vérifier l’existence d’inter corrélation entre les variables pour
pouvoir en extraire des dimensions homogènes.
À partir de la matrice de corrélation associée à notre base de données, on peut conclure que les
corrélations les plus fortes existent entre les variables suivantes :
▪ Les variables « volume d’exportation » et « volume d’importation » sont corrélées avec une
corrélation de 0,624.
▪ Les variables « PIB » et « volume d’importation » sont corrélées avec une corrélation de
0,535
6
Indice KMO et test de Bartlett
Interprétation :
L’indice KMO permet de mesurer la précision de l’échantillonnage.
Nous pouvons déduire qu’une analyse en composantes principales s’avère très intéressante.
Qualité de représentation
Initial Extraction
Interprétation :
Les extractions sont obtenues grâce à la sommation des cos² des deux composantes, aussi elles nous
permettent de vérifier la bonne représentation des variables. Ainsi, plus la valeur de l’extraction est
proche de 1, plus la variable qui lui correspond est mieux représentée.
7
Dans notre cas, la plupart des variables sont supérieurs à 0,5, donc elles sont bien représentées au niveau de
notre carte.
Interprétation :
Dans le tableau de la variance totale expliquée on ne retient que les valeurs propres qui sont
supérieures à 1, dans ce cas elles correspondent aux deux premières composantes qui sont équivalentes à
61,455% de variance cumulée expliquée.
Nous disposons de deux composantes représentatives dans la base de données
La première composante a une valeur propre de 2,495 représente à elle seule 35,637% de la variance
expliquée donc détient la plus grande part d’informations, alors que la deuxième composante a une valeur
propre de 1,807 qui représente 25,818 % du total de l’information donc on peut dire malgré la réduction de
7 variables à 2 composantes la richesse de ces dernières en termes d’informations retenues dépasse les
61,455%.
8
Interprétation :
Dans notre cas, la première composante explique 2,5 des valeurs propres. Ainsi, la deuxième
composante illustre près de 1.75 des valeurs propres. Cependant les autres composantes ont une faible part
donc, on ne retiendra que les 2 premières composantes pour une représentation avec deux axes parce que
leurs valeurs propres sont supérieures à 1.
9
Matrice des composantes
Composante
1 2
Interprétation :
Cette matrice sert à savoir quelle variable faut retenir pour chaque composante. Une variable n’est
significative que si sa contribution est d’au moins 0,50, et donc plus une variable à une forte corrélation
plus elle contribue à la formation de cette composante, et plus elle sert à sa désignation. La matrice nous
permet également de vérifier que le point est bien représenté graphiquement et ceci grâce au deux
composantes 1 et 2. Pour ce il faut les lever au carré et leur somme doit être inférieur à 1.
La variable (VolumeExportation) : 0,635 ² + 0,466 ² = 0,620 < 1
La variable (Tauxdinflation) : 0,574 ²+ (- 436) ² = 0,519 < 1
D’où les deux variables sont bien représentées graphiquement donc leurs points sont proches des cercles
de corrélation.
• PIB (0,821)
• Volume Exportation (0,635)
• Volume d’Importation (0,856)
• Taux de chômage (-0,535)
• Taux d’inflation (0,574)
10
• Taux de mortalité/1000 habitants (0,815)
• Dépenses publiques (0,679)
Interprétation :
Chaque point représente une variable. Sur le diagramme, on peut voir les corrélations entre les
variables :
Une forte corrélation positive entre les variables : VolumeExportation, VolumeImportation,
PIB et Taux d’inflation, mais ces variables sont faiblement corrélées avec le taux de
mortalité/1000 habitants.
Ces variables sont négativement corrélées avec les dépenses publiques et le taux de chômage.
11
3 2
4 1
Interprétation :
Le diagramme ci-dessus, nous permet de déterminer les différents groupes d’individus ayant un
comportement identique, et ceux ayant un comportement isolé.
Le groupe 1 : Constitue des pays riches dont l’économie n’a pas été beaucoup affectée par le Covid
19 et ayant un faible taux de mortalité/1000 habitants et de dépenses publiques.
Le groupe 2 : Constitue des pays riches aussi dont l’économie n’a pas été beaucoup affectée par le
Covid 19 mais ils ont un fort taux de mortalité/1000 habitants et de dépenses publiques.
12
Le groupe 3 : Constitue des pays moins riches, leur économie a été grandement affecté par le Covid
19 et ayant un fort taux de mortalité/1000 habitants et de dépenses publiques.
Le groupe 4 : Constitue des pays moins riches, leur économie a été grandement affecté par le Covid
19, mais ayant un faible taux de mortalité/1000 habitants et de dépenses publiques.
13
Partie II :
L’Analyse typologique
14
➢ Qu’est-ce que l’AT ?
L’analyse, ou classification, typologique correspond à un ensemble de méthodes multidimensionnelles
visant à prendre des éléments (sujets ou variables) provenant de certains ensembles de données pour les
regrouper dans des clusters (types) d’éléments similaires (sujets ou variables). L’analyse typologique permet
de répartir la population de l’enquête en un nombre défini de sous-groupes aussi différents que possibles les
uns des autres et dans lesquels les individus sont aussi semblables que possible entre eux.
• Vise à classer et à constituer des groupes d’individus ou d’objets, ces individus étant décrits par un
ensemble de caractéristiques.
• Constituer des groupes de façon que :
✓ Les individus appartenant à un même groupe se rassemblent le plus possible.
✓ Les groupes soient les plus différents possibles les uns des autres .
15
➢ Les interprétations :
❖
❖
16
Interprétation :
La matrice de proximité a pour rôle de révéler les distances euclidiennes au carré existantes entre les
différentes variables, par conséquent plus la distance entre deux variables est faible ou presque nulle, plus
on peut facilement les agréger et les regrouper. Les variables sont en lignes et en colonnes. Le chiffre
présenté est la distance calculée avec la méthode et la mesure sélectionnées. Cette matrice est triangulaire,
c’est à dire qu’elle est séparée par sa diagonale qui contient la valeur nulle (distance d’un par rapport à
lui-même égale 0).
Tel est le cas par exemple pour « Canada avec Royaume-Uni » et « Allemagne avec France » ainsi
que « Rwanda avec Chad » et « Pologne avec Chad ».
17
Chaîne des agrégations
Etape Regroupement de classes Coefficients Etape d'apparition de la classe Etape suivante
Classe 1 Classe 2 Classe 1 Classe 2
1 4 9 18,454 0 0 5
2 12 22 38,150 0 0 9
3 18 21 87,898 0 0 10
4 19 20 142,681 0 0 12
5 4 23 205,468 1 0 15
6 1 2 280,204 0 0 11
7 10 11 357,324 0 0 16
8 8 14 441,309 0 0 16
9 12 13 540,942 2 0 15
10 16 18 652,345 0 3 13
11 1 6 821,646 6 0 18
12 7 19 993,988 0 4 18
13 15 16 1186,841 0 10 19
14 3 17 1423,532 0 0 20
15 4 12 1695,055 5 9 22
16 8 10 2016,554 8 7 17
17 5 8 2425,482 0 16 19
18 1 7 3051,188 11 12 20
19 5 15 3747,807 17 13 21
20 1 3 4643,833 18 14 21
21 1 5 7413,892 20 19 22
22 1 4 10908,926 21 15 0
Interprétation :
D’abord, on a réuni les deux classes les plus proches dans un même regroupement, la distance entre
les deux classes est les coefficients et cette distance est affichée dans la colonne coefficients, selon un
ordre croissant.
A partir de la chaine on remarque que le premier saut brusque est entre l’étape 19 et 20. Si on réalise
notre coupe à partir de ce niveau on aura une solution en 4 classes.
18
Interprétation :
Le diagramme est une présentation graphique du l’ordre d’obtention des résultats de la classification
ou des regroupements des individus. Dans notre cas il est présenté verticalement et donc la lecture se fait
de haut en bas.
-La 3ème classe : Kenya, Burkina Faso, Côte d’Ivoire, Malawi, Chad, Rwanda, Chine, Ireland, Etats-
Unis.
-La 4ème classe : France, Canada, Royaume Uni, Pologne, Allemagne, ukrainien.
19
Interprétation :
Le dendrogramme met en évidence la composition des différentes classes, ainsi que l’ordre dans lequel
elles ont été formées. Lors de la lecture du dendrogramme on doit bien repérer ou lire le gain d’inertie
intra classe pour trouver le seuil idéal. Dans ce cas-là il est intéressant de faire une coupe entre la 19ème
et la 20ème étape, vu qu’on note un saut très important après ce niveau-là. Le dendrogramme, en utilisant
la méthode Ward, montre le niveau proportionnel à notre niveau d’agrégation.
Dans notre cas, Le saut est fait au niveau coupé par le trait, donc nous pouvons observer sur le
dendrogramme que nous avons une solution en 4 classes car ces derniers se détachent nettement.
20
Récapitulatif des observations
nt
N 6 6 6 6 6 6 6
1
Moyenne -4,244500 9,626167 -19,358333 -19,267167 2,944000 28,586833 5,060000
N 2 2 2 2 2 2 2
2
Moyenne -6,735000 18,235000 -3,108500 -10,848000 2,235000 15,555000 8,490000
N 6 6 6 6 6 6 6
3
Moyenne -6,991000 7,032333 -11,164667 -12,136500 1,481167 54,000667 10,908333
N 9 9 9 9 9 9 9
4
Moyenne -,213333 4,289889 -1,795778 2,238667 3,248889 29,124667 7,653333
N 23 23 23 23 23 23 23
Total
Moyenne -3,600130 7,610000 -8,935522 -8,259565 2,620043 34,293783 7,898696
Interprétation :
Le tableau récapitulatif des observations permet de comparer les classes et déterminer la similarité des
profils. Dans notre étude, on remarque :
• La classe 1 : est caractérisée par le volume d’exportation et le volume d’importation, ces
variables réalisent un minimum, les dépenses publiques sont assez élevées ainsi qu’un taux de
mortalité/1000 habitant très faible par rapport aux moyennes de la totalité des pays, c’est la classe
des pays pauvres avec un faible taux de mortalité. Ce sont Maroc, Algérie, Égypte, Bahreïn,
Mexique, Brésil.
• La classe 2 : représentée par l’Espagne et le Gabon réalisent un maximum au niveau du taux de
chômage et un minimum au niveau du PIB et des dépenses publiques, ces pays n’allouent pas des
bonnes dépenses publiques en les comparant avec les autres pays
• La classe 3 : réalise un maximum au niveau des dépenses publiques et le taux de mortalité/1000
habitant ainsi qu’un minimum au niveau du taux d’inflation, ces pays sont Kenya, Burkina Faso,
Côte d’Ivoire, Malawi, Chad, Rwanda, Chine, Ireland, Etats-Unis.
21
• La classe 4 : qui englobe la France, Canada, Royaume Uni, Pologne, Allemagne, ukrainien
réalise un maximum au niveau de taux d’inflation, volume d’exportation, volume d’importation
et le PIB, alors qu’un minimum ai niveau du taux de chômage, ce sont les pays riches
ANOVA à 1 facteur
Somme des ddl Moyenne F Signification
carrés des carrés
Inter-groupes 194,368 3 64,789 6,786 ,003
PIB Intra-groupes 181,393 19 9,547
Total 375,761 22
Inter-groupes 351,381 3 117,127 12,994 ,000
Tauxdechomage Intra-groupes 171,265 19 9,014
Total 522,647 22
Inter-groupes 1208,316 3 402,772 5,652 ,006
VolumeExportation Intra-groupes 1354,040 19 71,265
Total 2562,357 22
Inter-groupes 1822,503 3 607,501 15,071 ,000
VolumeImportation Intra-groupes 765,899 19 40,310
Total 2588,403 22
Inter-groupes 12,267 3 4,089 ,835 ,491
Tauxdinflation Intra-groupes 93,039 19 4,897
Total 105,306 22
Inter-groupes 103,938 3 34,646 7,093 ,002
Tauxdemortalité/100
Intra-groupes 92,800 19 4,884
0habitant
Total 196,738 22
Inter-groupes 3468,345 3 1156,115 20,164 ,000
Dépensespubliques Intra-groupes 1089,370 19 57,335
Total 4557,715 22
Interprétation :
Annova détermine les variables qui ont contribué au regroupement. Une variable ayant contribué plus au
regroupement a une grande valeur de F. par exemple les dépenses publiques ont contribué de 1156,115
Cependant, la variable de taux d’inflation a contribué juste de 4,089.
22
Conclusion :
Pour réaliser cette étude avec succès, on a opté, dans un premier lieu, pour une analyse en composantes
principales et qui a pu mettre en valeur nos connaissances théoriques et les tourner en pratique en interpellant
l’ensemble des outils d’analyse des données étudiés.
L’analyse en composante principale nous a permis de réduire notre base de données, voire les dimensions
au niveau des variables choisies, sans la déformer et en gardant le maximum de l’information représentée dans
les données initiales, ce qui nous a aidé à réussir la visualisation des individus à savoir l’impact de la crise
sanitaire sur les différents pays
Tandis que l’analyse typologique nous a permis ensuite de constituer des regroupements des variables
ayant des caractéristiques plus ou moins similaires. Par conséquent, nous avons eu quatre classes différentes
où chacune englobe des individus assez homogènes.
Sous ce rapport, on a bien réussi à avoir un aperçu ou une sorte d’image sur le PIB, volume d’exportation,
volume d’importation, taux de chômage, taux d’inflation, taux de mortalités/1000 habitant et les dépenses
publiques des différents pays durant la crise sanitaire et surtout dans l’année 2020.
23
Webographie :
https://www.imf.org/en/Publications/WEO/weo-database/2020/October/select-country-group
https://www.hcp.ma/downloads/Enquete-sur-l-impact-du-coronavirus-sur-la-situation-economique-sociale-et-
psychologique-des-menages_t21765.html
https://www.hcp.ma/region-agadir/m/br-DOSSIER-SUR-LA-PANDEMIE-DU-CORONAVIRUS-COVID-19_a110.html
https://www.imf.org/fr/Topics/imf-and-covid19
https://www.imf.org/fr/News/Articles/2020/09/18/blog-imf-lending-during-the-pandemic-and-beyond
https://www.imf.org/en/Search#q=covid%20impact&sort=relevancy&f:type=[FACTSHEETS]
https://fr.countryeconomy.com/pays
24