Académique Documents
Professionnel Documents
Culture Documents
i 1 2 3 4 5 6 7 8 9 10 11 12
Variable X ge 7 8 9 7 9 8 7 9 8 9 8 7
1/8
2. Calculez laide de votre machine la moyenne, lcart type et la variance de la variable X et de la variable Y: Rponse : Moyenne de X = 8 cart type de X =0,82 Moyenne de Y=7,67 cart type de Y =1,07
2/8
cov XY = rXY .S X . SY
On ouvre Statistics dans le menu VARS pour chercher la valeur de rXY , Sx et Sy :
5. Dterminez le rsultat prdit au test pour un enfant g de 10 ans. Reprsentez la droite de rgression sur le nuage de points. Rponse : Pour trouver Y1 on doit ouvrir VARS, Nous allons introduire lquation de la placer le curseur sur Y-VARS et choisir droite de rgression dans grce la function puis Y1 : commande Y1 :
Le graphique :
3/8
6. Interprtez vos rsultats partir des mesures calcules et partir du graphique que vous avez trac. Rponse : Lexamen du graphique de dispersion nous indique quil y a une association positive entre la variable X, ge de lenfant, et la variable Y, score obtenu au test. En effet, on constate que presque la totalit des points se trouvent soit dans le quadrant infrieur gauche soit dans le quadrant suprieur droit. Cette interprtation est renforce par covXY qui est positive. Nous observons aussi (et cette valeur est plus facile interprter que celle de covXY) que la valeur de rXY est positive et que daprs le diagramme de dispersion, les points ont tendance saligner selon une droite de pente positive. Le coefficient de dtermination est de 0,63. Ceci signifie que seulement 63% des variations de la variable Y (score au test) entre individus peuvent tre expliques par linfluence linaire de X sur Y.
4/8
T.P. 7 Exercice Supplmentaire 2 Srie statistique bivarie Nuages de points - Covariance (Corrig)
Considrons un chantillon de 10 employs du mme age, dune entreprise. Soit X le nombre dannes dtudes effectues et Y le revenu mensuel (en milliers de francs) touch par chacun dentre eux. Les observations sont contenues dans le tableau suivant :
Xi X
Xi
1 2 3 4 5 6 7 8 9 10
n
Yi
41 72 48 82 61 86 102 78 112 108
(X X)
i
Yi Y
(Y Y ) ( X X )(Y Y )
2 i
i i
6 8 9 10 10 11 12 14 16 18
-5.4 -3.4 -2.4 -1.4 -1.4 -0.4 0.6 2.6 4.6 6.6 0
29.16 11.56 5.76 1.96 1.96 0.16 0.36 6.76 21.16 43.56 122.40
205.20 23.80 74.40 -4.20 25.20 -2.80 13.80 -2.60 151.80 191.40 676
i =1
114 790
xi - xb
(xi,yi)
yi - yb
y = Rev. mensuel
80 70 60 50 40 30 20 10 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
G=(xb,yb)
5/8
3. Calculez manuellement les valeurs suivantes : NB : Vous pouvez vous baser sur les sommes calcules au point 2. Rponse : Moyenne de X : X = 11,4 Moyenne de Y : Y = 79 Variance de Y Variance de X :
2 SY =
S2 = X
122,40 = 12,24 10
5296 = 529, 6 10
SY = 529,6 = 23,01
Covariance de X et Y : 676 cov XY = S XY = = 67 ,6 10
6/8
Rponse :
5. Sur le graphique du point 1, tracez les droites dfinissant les 4 quadrants dans le plan.
Y = 16,04 + 5,52 X
7/8
7. Interprtez vos rsultats sur base du graphique que vous avez trac et des valeurs que vous avez calcules. Rponse : Les valeurs de X et de Y sont trs diffrentes entre elles : elles sont mesures dans des units diffrentes. Cependant nous pouvons valuer la force du lien qui les unit. Nous voyons que la covariance entre les deux variables est positive : cela signifie que plus le nombre dannes d'tudes effectues est lev, plus le revenu mensuel des individus lest. En regardant le graphique, nous constatons en effet que de faon gnrale, les sujets qui se situent en dessous de la moyenne pour la variable X, se situent galement en dessous de la moyenne pour la variable Y ; de mme, si un sujet se trouve au-del de la moyenne pour la variable X, il se situe galement au-del de la moyenne pour la variable Y. Ceci sobserve grce au fait que sur le graphique de dispersion, les points se trouvent soit dans le quadrant infrieur gauche, soit dans le quadrant suprieur droit. Trois sujets sont dans les deux autres quadrants : ce sont des sujets qui sont proches de la moyenne pour les deux variables, elles sont proches du centre de gravit. Le coefficient de dtermination est de 0,70. Ceci signifie que seulement 70% des variations de la variable Y (le revenu) entre individus peuvent tre expliques par linfluence linaire de X sur Y.
8/8