Vous êtes sur la page 1sur 9

Analyse des composantes principales

Statistique descriptive

Avec une moyenne de 2.14, la variable publicité représente la caractéristique qui satisfait le
moins les interrogés de cet échantillon. D’autre part, nous remarquons que « rapport qualité
prix » est la variable qui leur intéresse plus avec une moyenne qui s’élève à 3.1368

Force est de constater qu’il y a une dispersion chose qui implique, dans certaine mesure,
l’hétérogénéité quant au degré de satisfaction des individus interrogés par rapport aux
attributs de leurs voitures.

Matrice de corrélation
La matrice de corrélation consiste à nous indiquer les variables a forte corrélations et qui
sont susceptibles d’être regroupées.

On remarque, dans notre cas, que la matrice de corrélation comporte en majorité des
corrélations positives que la quasi majorité des variables sont fortement corrélées entres elles
avec des valeurs qui tendent vers 1 (0.994 entre  confort et publicité, 0.986 entre qualité-
prix et réputation..) à l’exception des deux variables « disponibilité des pièces » et
« consommation » avec des corrélations généralement négatives et inférieures à 0.5 (-0.042)
entre « consommation » et le variable « qualité de publicité » (une corrélation de- 0.027) ce
qui signifie une faible corrélation dans le sens opposé avec les autres variables

Tableau de qualité de représentation

Ce tableau nous permet d’avoir une idée sur la qualité de représentation des variables dans le
plan factoriel. En principe, plus que l’extraction correspond à chaque variable est proche de 1
plus sa représentation est bonne.

Les variables dans notre cas sont très bien représentées sur le plan factoriel et donc on est près
à une représentation totale de l’information, l’exemple de la variable fiabilité qui a une
représentation totale de 99.7%. Toutefois, nous remarquons que la variable « disponibilité des
pièces » est mal représentée car le plan factoriel n’explique que 43,6% de la variance totale de
cette variable.

Tableau de variance totale expliquée :


Ce tableau sert à déterminer le nombre de composantes principales à retenir. En effet, on
s’intéresse à étudier les valeurs propres dont la contribution à la variance totale est supérieure
a la moyenne, ceci revient a analyser les composantes principales dont la valeur propre est
supérieure a 1, donc les deux premières composantes principales qui devront être retenues du
fait que leurs valeurs propres supérieures à 1. En outre, ces deux composantes nous
fournissent un peu près 90% de la variance totale expliquée

Graphique de valeurs propres

Le choix des composantes principales pourrait être fait également en utilisant le graphique de
valeurs propres. D’autant plus, le principe de ce diagramme est de choisir les composantes
principales jusqu’au arriver au coude. Dans notre cas, il affirme notre choix des deux
premières composantes car le coude correspond à la deuxième valeur propre
Matrice des composantes

La matrice de composante consiste à donner une idée sur la contribution de chaque


variable dans la formation des axes principaux. Force est de constater que nos variables
contribuent fortement à la formation des deux axes retenus. À titre d’exemple, la première
composante explique 99.8% de la variance totale de la variable fiabilité. Il va falloir constater
également que les variables contribuant à la formation de l’un des deux axes ne contribuent
pas à la formation de l’autre et donc notre analyse ne nécessite pas une rotation.

Diagramme de composantes
le role de ce diagramme est de positionner les variables sur le plan formé par les axes
factoriels retenus. Ce positionnement permet de donner un sens ou bien une appelation aux
composantes.

En effet , nous remarquons que les variables disponibilité des pièces et consommation
forment la deuxième composante principale qu’on l’pourrait la nommer comme axe de
« consommation disponibilité des pièces ». en ce qui concerne la deuxième composante est
formée par le reste des variables qu’on l’pourrait appelée « qualité perçue produit et sa
commercialisation »

Qualité de représentation
Pour avoir une idée sur la qualité de représentation des individus on procède par le calcul de
la somme des cosinus carré des individus par rapport aux composantes principales, en
principe plus le cosinus tend vers 1 plus la qualité de représentation des individus est bonne

Dans notre cas tous les individus sont bien représentés puisque leurs cosinus carrés sont
supérieurs a 0,5, par exemple la qualité de représentation de la marque DACIA égale a 1 d’où
on peut constater qu’elle est très bien représentée

Diagramme des individus

Ce diagramme va nous permettre de positionner les individus dans le plan factoriel autour de
l’axe (0,0) qui correspond à la moyenne de l’échantillon afin de mettre en valeur les groupes
d’individus, les individus isolés et la position relative de groupe d’individus par rapport aux
axes.

Nous constatons que :

Les marques Volkswagen et Ford sont deux marques homogènes qui sont caractérisées par
une bonne qualité perçue du produit et un bon niveau de commercialisation et leurs pièces ne
sont pas assez disponibles. On constate aussi que la marque Volkswagen a une faible
consommation par contre celle qui correspond à Ford est assez importante.

Les marques KIA et Peugeot sont deux marques ayant une qualité faiblement perçue par
les clients (inférieure à la moyenne), car ils sont jugées comme des marques de faible rapport
qualité prix, moins fiable, qui ne respectent pas l’environnement et avec une mauvaise qualité
de publicité mais qu’elles sont considérés comme des voitures a faible consommation avec
des pièces qui ne sont pas trop disponibles.

La marque Dacia est caractérisée par une qualité perçue du produit assez médiocre et sa
consommation est importante mais avec des pièces qui sont disponibles dans le marché.

En ce qui concerne Renault elle est possible d’être regroupée avec Dacia puisqu’elles sont
tous les deux mal perçue par les clients avec une consommation importante et leurs pièces
sont disponibles dans le marché.

Analyse typologique
Matrice de proximité
Cette matrice révèle les distances existantes entre les différentes variables, par conséquent
plus la distance entre deux variable est faible plus on peut facilement les agréger

On peut par exemple agréger les deux individus FIAT et KIA comme premier classe a former
car la distance entre eux est la plus petite.

Le reste des regroupements se présentent dans la chaine des agrégations.

La chaîne des agrégations

Cette chaine nous permet de suivre l’historique des agrégations des classes dans ordre
croissants des variables ayant une faible distance

On observe dans la colonne du coefficient un saut maximum entre la 5éme et la 6éme étape,
donc la question qui se pose, est ce qu’on va opter pour une solution a 3 classes ; la première
est composée des marque de voitures dont la qualité perçue du produit et le niveau de
commercialisation n’est pas bonne et avec un niveau de consommation bas et une certaine
rareté des pièces ou a deux classes, la deuxième qu’il s’agit des voiture avec des pièces
disponible, consommation élevée et une qualité perçue et un niveau de commercialisation
médiocre. Et la troisième classe qui correspond a des marque avec une très bonne qualité
perçue du produit, une consommation moins importante et leurs pièces ne sont pas assez
disponibles

Ce constat s’est traduit clairement dans la carte factorielle des individus. D’autant plus, les
marques formant ces classes ont, dans certaine mesure, presque le même comportement par
rapport aux axes factoriels

Arbre hiérarchique

l’arbre hiérarchique met en évidence la composition des différentes classes, ainsi que l’ordre
dans lequel elles ont été formées.

Dans notre cas, il est préférable de faire une coupe entre la 5ème et la 6 ème étape du fait qu’il
y a un saut important entre elles.
Dans le récapitulatif des observations on arrive à vérifié s’elle y a une hétérogénéité entre les
classes qu’on a formé en fonction des variables. En effet, en se basant sur les moyennes des
classes selon la variable confort, on peut dire qu’il y une certaine hétérogénéité entres les
trois classes particulièrement la troisième avec les autres. De la meme façon avec les autres
variables on pourrait constater que l’agrégation entre ces 3 classes est impossibles vu
l’hétérogénéité ,constatée, entre elles.

Vous aimerez peut-être aussi