Académique Documents
Professionnel Documents
Culture Documents
2
REMERCIEMENTS :
3
Avant-propos :
4
INTRODUCTION ……………………………………………………………………………………………………………………………..1
PARTIE 1 : ANALYSE EN COMPOSANTE PRINCIPALE :…………………………………………………………………….3
Introduction générale de l’ACP ……………………………………………………………………………………………….4
Statistiques descriptive…………………………………………………………………………………………………………….5
Matrice de corrélation …………………………………………………………………………………………………………....5
Dendrogrammes…………………………………………………………………………………………………………………….19
Test ANOVA……………………………………………………………………………………………………………………………22
CONCLUSION :………………………………………………………………..………………………………………………………..24
5
INTRODUCTION :
I- Le Bien Être
Définir le bien-être nous amène au cœur d'un rapport intime d'une part entre
l'individu et son corps et, d'autre part, dans un rapport entre l'individu, son esprit et
son rapport avec les autres. Communément défini comme un "état agréable résultant
de la satisfaction des besoins du corps et du calme de l'esprit", le bien-être touche
tant à la dimension biologique de la vie humaine qu'à sa dimension sociale.
En se basant sur la base de données fournie par l’OCDE , l’objet de notre étude est
de déceler une répartition entre une vingtaine des pays de l’OCDE tout en examinant
les écarts et les ressemblances entre ces pays, et cela à partir des critères d’analyse
bien précis.
1
Notre étude comporte 24 pays de L’OCDE à savoir : Autriche, Belgique, Danemark,
Estonie, Finlande, France, Allemagne, Grèce, Hongrie, Irlande, Italie, Lettonie,
Lituanie, Mexique, Pays-Bas, Norvège, Pologne, Portugal, République slovaque,
Slovénie, Espagne, Suède, Royaume-Uni, Canada.
Les critères d’analyses retenus pour établir notre étude sont : le taux d'emploi, le
taux de chômage de long-terme, les jeunes sans emploi et sans formation, les
heures longues de travail (rémunéré), le salaires, l’accessibilité financière du
logement, le soutien social et finalement le sentiment de sécurité durant la nuit.
L’étude de notre base de données a fait l’objet d’une ACP et d’une analyse
typologique AT via le logiciel SPSS.
Au niveau de l’ACP, nous avons abouti à 3 résultats majeurs :
• La matrice de corrélation (les variables sont fortement corrélées)
• L’Indice de Kaiser-Meyer-Olin (= 0.704)
• Le test de sphéricité de Bartlett (niveau de signification = 0)
D’où l’intérêt de notre analyse ACP.
Et un résultat majeur au niveau de l’AT :
• La chaîne des agglomérations
D’où la composition des pays selon X classes :
Classe A:
Classe B :
Classe C :
2
3
Objectifs :
Condenser l'information contenu dans notre base de données par une analyse des
corrélations linéaires entre choisies a priori (Salaire, taux de chômage, taux d’emploi, …) et
une visualisation graphique des distances entre les pays d’OECD. Elle nous permettra de
dégager les liaisons entre variables et les ressemblances entre les pays.
Les 24 pays décrits par 8 variables peuvent être représentés comme un nuage de 24 points
dans un espace de 2 à 3 dimensions appelé espace des individus. Ce regroupement
suggère des caractéristiques similaires par rapport aux variables considérées entre les pays.
Etapes de l’analyse :
- Il faut que notre l’ACP fait ces trois objectifs (Chi-2 du Bartlett’s Test est suffisamment
grand avec une signification quasi nulle; le KMO est supérieur à 0,7
- Déterminer le nombre d’axes à retenir pour avoir plus de 75 % de variance expliquée
et les repérer dans le Scree plot, le « coude » des valeurs propres; ce qui doit
correspondre au nombre d’axes déterminés précédemment.
- Repérer les groupes de variables et interpréter leurs regroupements. Les variables
proches des axes permettent de donner un sens aux axes, en mettant
éventuellement en valeur des oppositions.
- La mise en valeur des groupements des pays dans le nuage des points (les pays
avec une bonne qualité de vie vs les pays avec une mauvaise qualité de vie) ; la
position relative des groupes des pays par rapport aux axes ( facilité et difficulté
d'accès au logement).
4
Statistiques descriptives :
Interprétation :
D’après ce tableau on peut constater l’existence d’une homogénéité au niveau de
notre échantillon, à l’exception du salaire qui affiche une dispersion assez élevée de
12299 ,86. Cette dispersion est due d’une part à l’effet de taille, vu que la moyenne
des salaires s’élève à 40908 ,83 et d’autre part l’hétérogénéité au niveau des pays
inclus dans notre ACP. A titre d’illustration les pays d’Europe ont en moyenne un
salaire plus élevé que les pays d’Amérique latine tel le cas pour le Mexique.
Matrice de corrélation :
5
Interprétation :
La matrice de corrélation donne un aperçu global sur la nature de liaison entre les
variables étudiées.
Ainsi au niveau de notre ACP nous ne retiendrons que les variables fortement
corrélées, ce qui implique la pertinence d’une analyse en composante principale.
Ainsi plus les variables présentent de forte corrélation plus elles peuvent être
regroupées en dimension homogène.
Pour notre cas, on peut constater des fortes corrélations notamment entre :
Une forte corrélation négative, entre le taux d’emploi et le taux de chômage qui
se chiffrent à ( -0,728), ce qui reflète effectivement la réalité. En effet quand le taux
d’employabilité augmente le taux de chômage diminue et vice versa.
Une forte corrélation positive entre les variables salaire et sécurité qui a atteint
(0,632), en effet ces deux variables se comportent d’une manière identique de telle
sorte que quand une variable augmente l’autre suit la même tendance. Autrement dit,
quand le niveau de salaires augmente cela se répercute sur le sentiment de
sécurité.
Toutefois cette corrélation reste à confirmer par le test de Bartlett.
Interprétation :
Le test vient pour confirmer la corrélation entre nos variables, ainsi le khi-deux
approximé atteint une valeur assez significative statistiquement parlant le khi-deux
est grand puisque la signification est quasiment nulle, ce qui nous permet de rejeter
l’hypothèse de l’indépendance entre les variables, de plus le KMO se stabilise à
une valeur de 0,704 qui est bonne pour un ACP. Ce qui affirme une autre fois la
corrélation entre les variables en absence des corrélations partielles.
6
Variance totale expliquée :
Interprétation :
En premier lieu, en appliquant la règle de Kaiser qui stipule la rétention unique des
valeurs propres supérieurs à 1, on retient les deux premières composantes qui
forment le premier plan principal permettant ainsi de récupérer 65,963%
d’information soit une perte d’inertie maintenue à 34,04%.
La première composante a une variance de 46,75%, alors que la deuxième a une
variance de 19,213%.
Cette variance est obtenue par le rapport entre la valeur propre de la composante et
le nombre de la composante. A titre d’illustration la variance de la première
composante est calculée comme suit :
Λ=3,740 ; P=8
Donc la variance est : (3,740/8) *100 = 46,750%
7
Interprétation :
Ce graphique vient pour confirmer le résultat précèdent à savoir le choix de deux
axes pour notre ACP. Ils nous ont permis de repérer dans le Scree Plot, le cout des
valeurs propres, ainsi nous ne retiendrons que les valeurs propres supérieures à 1.
Cela correspond à l’intersection entre le point de changement de convexité de la
courbe avec l’axe des abscisses, soit deux composantes.
Interprétation :
La matrice des composantes nous permet de repérer les variables ayant des fortes
contributions négatives ou positives sur chaque axe, afin de donner un sens à ces
axes et effectuer des oppositions intéressantes.
Pour notre cas, la première composante est expliquée d’une part positivement par
le taux d’emploi, salaire, soutien social, sécurité durant la nuit. Et d’autre part
négativement par heure longue de travail, le taux de chômage et les jeunes
sans emploi ni formation. De ce fait on peut qualifier cet axe comme étant une
représentation de la qualité de vie, ainsi on peut constater une opposition
intéressante, entre la bonne et la mauvaise qualité de vie.
Au niveau de la deuxième composante, la variable accessibilité financière au
logement contribue le plus à son explication. De même on peut opposer entre la
difficulté et la facilité d’accès au logement.
Toutefois, pour la variable taux de chômage à long terme contribue à l’explication
des deux axes donc une rotation s’avère intéressante dans la mesure où elle va nous
permettre non seulement de redistribuer l’information mais aussi permettre à une
variable d’être expliqué par une seule composante.
8
Qualité de représentation :
Interprétation :
La qualité de représentation d’une variable est obtenue grâce à la somme au carré
de corrélation par rapport au composantes retenues, à titre d’illustration le taux
d’emploi qui sa qualité s’élève à 0,882
Soit :
(0,846) ²+(-0,369) ² = 0,882
Ainsi on peut affirmer que l’ensemble de nos variables sont très bien représentées
sur nos cartes, puisque leurs valeurs respectives d’extraction excèdent 0,5.
Afin de juger la qualité de représentation de nos variables, on prend en considération
leur proximité au cercle de corrélation de diamètre 1. Pour notre cas l’ensemble
de nos variables sont proches de ce dernier.
Diagramme de composantes :
De même on peut distinguer des variables fortement corrélées proches l’une de
l’autre, tel que le soutien social et salaire. Ainsi on peut relever quartes catégories de
regroupement possible des variables à savoir :
9
• Le haut à droite : Une bonne qualité de vie et une difficulté d’accès au
logement.
• Le haut à gauche : Une mauvaise qualité vie et une difficulté d’accès au
logement.
• Le bas à droite : Une bonne qualité de vie et une facilité d’accès au logement.
• Le bas à gauche : Une mauvaise qualité de vie et une facilité d’accès au
logement.
Interprétation :
Apres la rotation on remarque que la variable taux de chômage à long terme est
expliqué par une seule composante à savoir la deuxième composante, certes la
rotation nous a aidé pour cette variable mais au détriment des autres variables à
savoir : jeunes sans emploi et taux d’emploi. Donc on a décidé de procéder par
une analyse en composante principale sans rotation.
10
Avant de procéder à l’interprétation de ce nuage, nous calculons en premier lieu la
qualité de représentation des individus au niveau de nos cartes afin de ne
prendre en considération que les pays bien représentés.
La qualité de représentation des individus est obtenue grâce à la somme des
fameux cosinus carrés.
11
Ainsi nous ne retiendrons au niveau de notre analyse que les individus bien
représentés dont la qualité est supérieure à 0.5 à savoir : (Autriche, Danemark,
Estonie, Finlande, Grèce, Italie, Mexique, Pays-Bas, Norvège, Slovénie,
Espagne, Suède, et Canada).
Pour conclure, ce nuage d’individus nous permet de regrouper les pays qui peuvent
être interprétés globalement du fait qu’ils sont regroupés en classes homogènes
représentant des caractéristiques similaires ainsi on peut repérer :
➢ Des pays qui ont une bonne qualité de vie et une difficulté d’accès au
logement (Autriche, Danemark, Finlande, pays bas, canada) : le point
commun entre ces pays est la cherté des logements et du niveau de vie
relativement plus important que les autres pays représentés dans notre
échantillon, de plus la sophistication de leurs systèmes de prévoyance et
de soutien sociale ;
➢ Des pays qui ont Une mauvaise qualité vie et une difficulté d’accès au
logement (Grèce, Italie, Espagne) : ce résultat est largement expliqué par les
répercussions néfastes de la crise économique en 2008 qui a touché
sévèrement ces pays, et continue à la dégradation du niveau de vie et
l’augmentation des tensions inflationnistes ;
➢ Des pays qui ont une bonne qualité de vie et une facilité d’accès au
logement (Norvège, Slovénie, Suède, Estonie) : ce groupe d’individus est
caractérisé par une forte présence des pays scandinaves, qui affichent des
performances économiques relativement plus importants que les autres
pays présentés ;
➢ Des pays qui ont une mauvaise qualité de vie et une facilité d’accès au
logement (Mexique) : c’est le cas pour le Mexique, un pays d’Amérique
centrale caractérisé par une richesse moins importante que les autres pays
avec une surexploitation de la classe ouvrière, toutefois avec un niveau de
vie moins chère.
Certes, l’analyse en deux composantes qui affiche des valeurs propres supérieur à 1
suivant la règle de KAIZER, nous a permis de tirer des conclusions intéressantes,
toutefois il faut utiliser ces règles empiriques avec modération.
Au niveau du deuxième ACP nous opterons pour 3 composantes qui récupèrent
77.233 d’information.
12
La troisième composante nous permet de récupérer un supplément d’information
de 11.27 par rapport au plan principale, soit un cumul de variance expliquée de
77.233 supérieurs à 75%.
Matrice de composantes :
Interprétation :
Plusieurs variables contribuent à l’explication des différentes composantes
retenues, notamment le taux de chômage à long terme et heures longues de
travail, donc une rotation s’avère intéressante afin d’améliorer notre ACP.
Interprétation :
La rotation a permis d’améliorer notre ACP et d’apporter des nouvelles informations,
ainsi nous pouvons déduire que :
13
La première composante est expliquée par le salaire, soutien sociale, et sécurité,
ces variables permettent de refléter le niveau de la qualité de vie.
La deuxième composante s’explique d’une part à travers le taux d’emploi et
l’accessibilité financière au logement, et d’autre part le taux de chômage long
terme et jeune sans emplois et sans formations, ces variables constituent des
indicateurs socio-économiques majeurs pour la croissance et la prospérité
d’un pays, ainsi nous pouvons donner un sens à cette composante comme étant la
prospérité économique.
Tandis que pour la troisième composante est expliqué majoritairement par la
variable heure longue de travail, nous pouvons la qualifier comme la
surexploitation de la classe ouvrière.
Ainsi au niveau de nos nuages, nous ne retiendrons pour l’interprétation que les
individus suffisamment loin de l’origine, et ils sont généralement bien représentés.
Pour notre premier nuage, nous prenons la première et la deuxième composante,
qui expliquent respectivement la bonne qualité de vie et la prospérité
économique.
• Des pays avec une bonne qualité de vie et une prospérité économique, on
remarque une forte présence des pays scandinaves notamment le Suède et la
Norvège, ce résultat est expliqué dans la mesure où ces deux pays sont caractérisés
par un taux de rémunération élevées et un système de sécurité et de soutien
sociale assez développé, en effet ces pays possèdent un modèle économique et
social qui conjugue L’Etat-providence et l’économie de marché, avec chacun
leurs spécificités.
• Des pays caractérisés par une mauvaise qualité de vie, mais avec une prospérité
économique, essentiellement les pays d’Europe orientale et le Mexique.
• Des pays caractérisés par une bonne qualité de vie, toutefois une récession
économique, notamment l’Espagne, sous l’égide de la crise économique de 2008.
• Des pays avec des conditions de vie assez médiocre, avec une récession
économique, notamment la Grèce, un pays sévèrement ravagé par la crise
économique de 2008.
14
Pour notre deuxième nuage, nous prenons la première et la troisième
composante, qui expliquent respectivement la bonne qualité de vie et la
surexploitation de la classe ouvrière.
15
16
Objectifs :
- Construire à partir des variables choisies a priori (Salaire, taux de chômage, taux
d’emploi, …) des groupes d’individus (Dans notre cas ce sont les pays d’OECD).
Donc chaque individu (Pays) constitue une classe.
- Constituer des groupes de façon que :
Etapes de l’analyse :
✓ Les Données :
✓ Choix de l’algorithme :
• L’analyse hiérarchique ascendante
Chaque individu (pays) constitue une classe en soi. Dans la première étape, les deux
individus (pays) les plus proches sont fusionnés pour former une classe et ainsi de
suite, la fusion pouvant se faire soit entre les classes soit entre une classe et un
individu.
Puisque la première classe sera composée de deux individus (pays), il faudra
déterminer la méthode de sélection des individus.
Pour notre cas nous allons travailler sur SPPS donc la méthode la plus adaptée est
celle de Ward, le classement de cette méthode se fait en regroupant les individus
(pays) qui minimisent le mieux la perte d’information.
17
La matrice de proximité ou de dissimilarité
Utilité : C’est une matrice diagonale qui utilise la distance le carré de la distance
euclidienne et nous permet de visualiser les pays qui peuvent être facilement
agrégés dont la distance faible, à titre d’illustration :
CANADA DENMARK (1.417) ;
DENMARK FINLANDE (1.611).
Et des pays avec forte dissimilarités :
MEXIQUE et DENMARK (73.787)
18
Pour notre cas que le saut le plus important se situe au niveau de la colonne des
coefficients et nous remarquons que ce dernier est présent au niveau de l’étape 19 :
(75,457- 59.825)
Ainsi nous optons pour une solution en 4 classes à travers le calcul effectué dans
l’étape 20 jusqu’à l’étape 23, en ajoutant « 1 ».
On calcule alors la qualité de la typologie en quatre classes soit (184 – 75,457) /184
~ 60% < 75%.
Dendrogrammes :
Ce dendrogramme affirme les résultats que nous avons obtenu au niveau de l’ACP :
on distingue 4 classes.
Il nous donne également la décomposition des différentes classes, ainsi que l’ordre
dans lequel elles ont été formées.
19
Tableau récapitulatif :
20
Interprétation :
Ce tableau sert comme un récapitulatif des caractéristiques de chaque classe, en
utilisant la moyenne par rapport à chaque variable, et on constate :
• Le taux d’emploi : la classe dont elle dispose le maximum est la deuxième
classe avec 79,42% tandis que pour le minimum est retenu par la troisième
classe avec 65,23%.
• Taux de chômage à long terme : le maximum est retenu par la troisième
classe à 9,02%, alors que le minimum est retenu par la quatrième classe avec
0,06%.
• Jeunesse sans emploi et sans formation : le maximum se positionne à la
quatrième classe, alors que le minimum se présente au niveau de la deuxième
classe, soit en chiffre respectivement 18,29% et 7,86%.
• Heures longues de travail rémunéré : le minimum est détenu par la deuxième
classe et le maximum par la quatrième classe, avec respectivement 2,87 et
28,15.
• Salaire : le minimum est détenu par la quatrième classe et le maximum par la
première classe, avec respectivement 17594 $ et 46484 $.
• Accessibilité financière au logement : La classe dont elle dispose le maximum
est la quatrième classe avec 82,18% tandis que pour le minimum est retenu
par la première et la troisième classe avec approximativement 77%.
• Soutien sociale : le maximum figure au niveau de la première classe à 93,98
tandis que le minimum figure au niveau du quatrième classe avec 84,5%.
• Sécurité : le maximum figure au niveau de la première classe à 78,27 tandis
que le minimum figure au niveau du quatrième classe avec 40,73%.
21
Test ANOVA :
ANOVA
Somme des
carrés ddl Carré moyen F Sig.
Taux d’emploi Intergroupes 404.298 3 134.766 14.926 .000
Intragroupes 180.578 20 9.029
Total 584.877 23
Total 150.895 23
Total 310.925 23
Total 714.712 23
Total 3479589795.333 23
Total 118.292 23
Total 339.793 23
Total 3329.620 23
22
La différence entre les classes se constate à travers la signification qui se
positionne à une faible valeur, ce qui nous permet de dire que les groupes sont
assez différents.
23
Conclusion :
• Récente.
• Correcte et Vérifiée.
• Adaptée au sujet de notre étude.
Dans notre première tentative de création de ce projet, on a retrouvé peu de bases
de données qui correspondent à nos critères, parmi eux une qui s’intéresse aux
réactions des pays face à la pandémie du Covid-19. Vu que c’est un sujet qui est
surexploité, notre équipe a jugé qu’il serait intéressant de se focaliser sur les pays
africains, on a lancé alors notre étude, seulement pour faire face à un nouveau
problème : le manque de données au niveau du continent africain.
Ce problème nous a fait perdre beaucoup de temps, et il fallait lancer encore une fois
la recherche des bases de données vérifiant nos critères, mais cette fois-ci, après de
longues recherches, on a retrouvé la base parfaite, elle s’agit de celle des pays de
l’OCDE.
Après avoir retrouvé la bonne base de données, une nouvelle étape vient ensuite,
mais avant qu’on puisse l’entamer, il faut tout d’abord maitriser un logiciel qui est
nouveau, complexe, mais extrêmement performant : le fameux SPSS.
Enfin, on souhaite exprimer notre immense joie et fierté d’avoir réalisé un travail
aussi détaillé et profond que celui-ci, dans une durée très limitée, et on espère que
ce projet sera à la hauteur des attentes.
24