Académique Documents
Professionnel Documents
Culture Documents
Au stade des analyses, les rponses aux questions deviennent des variables explicatives sur lesquelles on applique des outils statistiques afin dexpliquer le phnomne, objet sous lequel porte lenqute. Or la plupart de ces phnomnes sont dtermins par linteraction de plus de deux variables, se qui nous amne faire recours une srie de techniques dites multivaries
I. Mthodes multivaries
1- Les mthodes multivaries pour expliquer
II La rgression multiples
Conclusion
I. Mthodes multivaries
Selon les types des questions (variables) et lobjectif de lanalyse statistique on distingue trois catgories des mthodes multivaris:
Mthodes multivaries pour expliquer Mthodes multivaries pour synthtiser Mthodes multivaries pour classifier
Principe
Il sagit de comprendre comment une variable est ventuellement influence par une srie dautres variables et de dgager limpact ou non de chaque variable Rgression multiple Matrice importanceperformance Arbre de dcision
Exemples de techniques
Illustrations
V1 V2 V3
V4
Cette technique danalyse sapplique exclusivement aux variables numriques, cest--dire dans les enqutes: aux questions ouvertes numriques ; aux questions fermes chelles; aux questions fermes uniques dichotomiques: oui-non ou 0/1. Il sagit dune extension de lanalyse de rgression simple , mais dont lanalyse sappuie sur plus de deux variables. Autrement dit, on cherche comprendre comment se comporte une variable expliquer y en fonction de plusieurs variables explicatives x1, x2 ,x3
Il sagit dune application particulire de lanalyse de rgression multiple utilis souvent dans le cadre dune enqute de satisfaction qui sintresse gnralement a mesurer la satisfaction globale, puis donner une mesure dtaille dun ensemble des critres identifis a priori comme les composantes partielles de la perception du client ou du collaborateur. Souvent les individus sont questionns sur limportance relative quils accordent chaque item particulier afin de mettre en perspective la satisfaction sur chaque critre avec son importance. Cette matrice permet donc de dgager la satisfaction du rpondant et limportance quil accorde aux diffrents facteurs valus en conduisant une carte, o chaque critre est plac sur deux dimensions: horizontalement, performance mesure par les notes moyennes de critres sur lensemble des rpondants; verticalement, limportance quon peut apprcier selon plusieurs mthodes dont les dtails ne font pas objet de cette expos.
Les arbres de dcision savrent plutt utile pour identifier les caractristiques dune population cible dont on cherche expliquer en fonction dun ensemble de variables, afin de dgager celles qui ont les plus dimpact. A titre dexemple, une enqute de satisfaction pourrait sintresser identifier ce qui caractrise les clients non satisfaits. Pour ce faire lalgorithme de larbre de dcision effectue tous les croisements possibles afin de mettre en avant les variables les plus lies celles qui nous intressent, et surtout les modalits qui correspondent le mieux la cible que lon cherche a caractriser
Principe
Il sagit de simplifier les donnes en identifiant les variables ou modalits similaires et qui mesurent la mme chose. Ce groupe de variables corrles sont par la suite regrouper afin de restituer les rsultats dun point de vue plus synthtique et donc plus simple. Analyse factorielle en composantes principales Analyse factorielle des correspondances
LACP sert observer les questions redondantes est celles qui mesurent la mme chose car fortement corrles entre eux . On pourra ainsi synthtiser linformation puis la restituer sur une carte factorielle, cest--dire sur un plan deux dimensions plus facile lire . Cest noter que lACP semploie pour des variables numriques: Questions ouvertes numrique, fermes chelles ou fermes uniques binaires.
q1 q2 q3 q4 q5 q6q16
F1 F2
Ayant les mmes principes de base que lACP, lAFC sapplique quant elle aux variables nominales-les questions fermes. Dans ce cas ci on sintresse non pas aux combinaisons des variables mais aux combinaisons des modalits afin didentifier les grandes dimensions des rsultats, et les modalits qui sont lies statistiquement. LAFC est employe surtout pour croiser simultanment plus de deux variables nominales-les rponses des questions fermes.
Principe
Les mthodes de classification sintressent non pas aux variables mais aux individus. Toujours dans un objectif de simplification, on cherche identifier des groupes de rpondants aux comportements similaires.
Exemples de techniques
Analyses typologiques
Illustrations
I. II La rgression multiple
Pour dterminer sous forme dquation linaire la relation explicative amenant des variables explicatives expliquer ou non un phnomne (variable explique)
V1 V2 V3 Vn Variables explicatives
V0
Variable explique
Exemple illustratif
Expliquer la dpense touristique totale V1 en fonction des dpenses dhbergement V2, dalimentation V3, de restauration V4 et de loisir V5
Equation de la rgression :
Dpense totale = +0.796 * Dpense hbergement +1.638 * Dpense alimentation +0.734 * Dpense restaurant +1.858 * Dpense loisirs +174.856
Les 4 variables expliquent 80.2% de la variance de Dpense totale et le coefficient de rgression multiple = 0,9 Significativit des paramtres : 'Dpense hbergement' : coefficient = 0,80, cart-type = 0,23 'Dpense alimentation' : coefficient = 1,64, cart-type = 0,28 'Dpense restaurant' : coefficient = 0,73, cart-type = 0,45 (Peu influent) 'Dpense loisirs' : coefficient = 1,86, cart-type = 0,29 Leffet de chaque variable explicative dpend du coefficient de rgression figurant dans lquation. Plus celui-ci est lev, plus la variable explicative considre influence la variable explique.
Cependant , il faut galement prendre en compte lcart type de chacun de ces coefficients : plus il est lev, moins linfluence de la variable considre est marque. Certains termes de l'quation sont peu influents, leur rapport coefficient / cart-type est infrieur 2 La matrice des coefficients de corrlation peut se prsenter sous la forme dun tableau ou dun diagramme :
Conclusion
Lanalyse multivarie des donnes comme une procdure statistique se prte pour analyser simultanment plus de deux variables afin soit de dcrire, soit de dresser des typologies soit de synthtiser.