Vous êtes sur la page 1sur 21

Les analyses multi-varies

Au stade des analyses, les rponses aux questions deviennent des variables explicatives sur lesquelles on applique des outils statistiques afin dexpliquer le phnomne, objet sous lequel porte lenqute. Or la plupart de ces phnomnes sont dtermins par linteraction de plus de deux variables, se qui nous amne faire recours une srie de techniques dites multivaries

I. Mthodes multivaries
1- Les mthodes multivaries pour expliquer

2-Les mthodes multivaries pour synthtiser


3-Les mthodes multivaries pour classifier: Les typologies

II La rgression multiples
Conclusion

I. Mthodes multivaries
Selon les types des questions (variables) et lobjectif de lanalyse statistique on distingue trois catgories des mthodes multivaris:

Mthodes multivaries pour expliquer Mthodes multivaries pour synthtiser Mthodes multivaries pour classifier

1 Les mthodes multivaries pour expliquer

Principe

Il sagit de comprendre comment une variable est ventuellement influence par une srie dautres variables et de dgager limpact ou non de chaque variable Rgression multiple Matrice importanceperformance Arbre de dcision

Exemples de techniques

Illustrations

V1 V2 V3

V4

1-1 La rgression multiple

Cette technique danalyse sapplique exclusivement aux variables numriques, cest--dire dans les enqutes: aux questions ouvertes numriques ; aux questions fermes chelles; aux questions fermes uniques dichotomiques: oui-non ou 0/1. Il sagit dune extension de lanalyse de rgression simple , mais dont lanalyse sappuie sur plus de deux variables. Autrement dit, on cherche comprendre comment se comporte une variable expliquer y en fonction de plusieurs variables explicatives x1, x2 ,x3

1-2 La matrice importance-performance

Il sagit dune application particulire de lanalyse de rgression multiple utilis souvent dans le cadre dune enqute de satisfaction qui sintresse gnralement a mesurer la satisfaction globale, puis donner une mesure dtaille dun ensemble des critres identifis a priori comme les composantes partielles de la perception du client ou du collaborateur. Souvent les individus sont questionns sur limportance relative quils accordent chaque item particulier afin de mettre en perspective la satisfaction sur chaque critre avec son importance. Cette matrice permet donc de dgager la satisfaction du rpondant et limportance quil accorde aux diffrents facteurs valus en conduisant une carte, o chaque critre est plac sur deux dimensions: horizontalement, performance mesure par les notes moyennes de critres sur lensemble des rpondants; verticalement, limportance quon peut apprcier selon plusieurs mthodes dont les dtails ne font pas objet de cette expos.

1-3 Les arbres de dcision

Les arbres de dcision savrent plutt utile pour identifier les caractristiques dune population cible dont on cherche expliquer en fonction dun ensemble de variables, afin de dgager celles qui ont les plus dimpact. A titre dexemple, une enqute de satisfaction pourrait sintresser identifier ce qui caractrise les clients non satisfaits. Pour ce faire lalgorithme de larbre de dcision effectue tous les croisements possibles afin de mettre en avant les variables les plus lies celles qui nous intressent, et surtout les modalits qui correspondent le mieux la cible que lon cherche a caractriser

2 Les mthodes multivaries pour synthtiser

Principe

Il sagit de simplifier les donnes en identifiant les variables ou modalits similaires et qui mesurent la mme chose. Ce groupe de variables corrles sont par la suite regrouper afin de restituer les rsultats dun point de vue plus synthtique et donc plus simple. Analyse factorielle en composantes principales Analyse factorielle des correspondances

Exemples de techniques Illustrations

2-1 Lanalyse factorielle en composantes principales ou ACP

LACP sert observer les questions redondantes est celles qui mesurent la mme chose car fortement corrles entre eux . On pourra ainsi synthtiser linformation puis la restituer sur une carte factorielle, cest--dire sur un plan deux dimensions plus facile lire . Cest noter que lACP semploie pour des variables numriques: Questions ouvertes numrique, fermes chelles ou fermes uniques binaires.

q1 q2 q3 q4 q5 q6q16

F1 F2

2-2 Lanalyse factorielle des correspondances ou AFC

Ayant les mmes principes de base que lACP, lAFC sapplique quant elle aux variables nominales-les questions fermes. Dans ce cas ci on sintresse non pas aux combinaisons des variables mais aux combinaisons des modalits afin didentifier les grandes dimensions des rsultats, et les modalits qui sont lies statistiquement. LAFC est employe surtout pour croiser simultanment plus de deux variables nominales-les rponses des questions fermes.

3 Les mthodes multivaries pour classifier: Les typologie

Principe

Les mthodes de classification sintressent non pas aux variables mais aux individus. Toujours dans un objectif de simplification, on cherche identifier des groupes de rpondants aux comportements similaires.

Exemples de techniques

Analyses typologiques

Illustrations

I. II La rgression multiple
Pour dterminer sous forme dquation linaire la relation explicative amenant des variables explicatives expliquer ou non un phnomne (variable explique)

V1 V2 V3 Vn Variables explicatives

V0
Variable explique

Equation de rgression multiple: Vo = a1xV1 + a2xV2 + a3xV3 + anxVn

Exemple illustratif

Expliquer la dpense touristique totale V1 en fonction des dpenses dhbergement V2, dalimentation V3, de restauration V4 et de loisir V5

On obtient un modle du type: V1= aV2+bV3+cV4+ rsidu


La qualit de lajustement sapprcie par rapport la valeur du coefficient de corrlation. Plus la valeur absolue est leve, plus faible est lcart entre les valeurs calcules par lquation et les valeurs observes en ralit (cet cart est appel rsidu)

Equation de la rgression :

Dpense totale = +0.796 * Dpense hbergement +1.638 * Dpense alimentation +0.734 * Dpense restaurant +1.858 * Dpense loisirs +174.856

Les 4 variables expliquent 80.2% de la variance de Dpense totale et le coefficient de rgression multiple = 0,9 Significativit des paramtres : 'Dpense hbergement' : coefficient = 0,80, cart-type = 0,23 'Dpense alimentation' : coefficient = 1,64, cart-type = 0,28 'Dpense restaurant' : coefficient = 0,73, cart-type = 0,45 (Peu influent) 'Dpense loisirs' : coefficient = 1,86, cart-type = 0,29 Leffet de chaque variable explicative dpend du coefficient de rgression figurant dans lquation. Plus celui-ci est lev, plus la variable explicative considre influence la variable explique.

Cependant , il faut galement prendre en compte lcart type de chacun de ces coefficients : plus il est lev, moins linfluence de la variable considre est marque. Certains termes de l'quation sont peu influents, leur rapport coefficient / cart-type est infrieur 2 La matrice des coefficients de corrlation peut se prsenter sous la forme dun tableau ou dun diagramme :

Conclusion
Lanalyse multivarie des donnes comme une procdure statistique se prte pour analyser simultanment plus de deux variables afin soit de dcrire, soit de dresser des typologies soit de synthtiser.

Vous aimerez peut-être aussi