Vous êtes sur la page 1sur 1

Master Miage M1

EXAMEN Session de juin 2008 Nombre de pages : 1

Code du Module : C106 Intitul du module : Analyse de donnes Nom de lenseignant : Grard-Michel Cochard Dure de lpreuve : 2 heures

Note : lusage de documents papier est autoris ; lusage d'une calculette ou d'un tableur est autoris. Une tude sociologique effectue en Grande-Bretagne examine pour un chantillon d'individus le nombre annuel x de kilomtres parcourus pendant les congs et le nombre annuel y de botes de petits pois achetes : individus x y 1 520 50 2 430 40 3 120 10 4 875 90 5 950 100 6 1200 11 7 50 7 8 500 45 9 780 82 10 320 30 La statistique donne ci-dessus n'est pas conforme la ralit. Elle est purement imaginaire et volontairement rduite en nombre d'individus pour viter des calculs trop longs. I On a) b) c) envisage une corrlation linaire entre x et y Calculer la moyenne des variables x et y Calculer les carts-types de x et y Calculer le coefficient de corrlation linaire et en tirer une conclusion.

II On envisage dappliquer une analyse en composantes principales 1) Remplacer le tableau prcdent par un tableau Y faisant apparatre les variables centres et normes X1 et X2 correspondant aux variables initiales x et y respectivement. Rappelons que Xi = (xi - <x>)/i o <x> dsigne la moyenne et i lcart-type pour une variable x de valeurs xi. 2) A partir de ce tableau Y calculer la matrice c des corrlations 3) Les valeurs propres de c sont 1 = 1,99247 et 2. Combien vaut 2 et que peut-on en dduire ? 4) En dduire les vecteurs propres u1 et u2 de la matrice c. 5) Reprsenter graphiquement les points individus (X1, X2) ainsi que les axes factoriels dfinis par les vecteurs propres u1 et u2. Quelle est votre conclusion ?