Vous êtes sur la page 1sur 8

T.P.

7 - Exercice supplmentaire 1 Rgression linaire simple (Corrig)


On a administr un test de lecture 12 enfants gs de 7, 8 et 9 ans. Voici les rsultats obtenus par ces sujets :

i 1 2 3 4 5 6 7 8 9 10 11 12

Variable X ge 7 8 9 7 9 8 7 9 8 9 8 7

Variable Y Note au test 6 8 8 7 9 8 6 9 7 8 9 7

1. Reprsentez cette srie statistique par un nuage de points. Rponse :

T.P. 7. ex.suppl. 1 (corrig)

1/8

2. Calculez laide de votre machine la moyenne, lcart type et la variance de la variable X et de la variable Y: Rponse : Moyenne de X = 8 cart type de X =0,82 Moyenne de Y=7,67 cart type de Y =1,07

Pour la variance on ouvre Statistics dans le menu Vars :

3. Dterminez lquation de la droite de rgression de Y en X. Rponse :

T.P. 7. ex.suppl. 1 (corrig)

2/8

4. Dterminez la covariance entre X et Y. Rponse :

cov XY = rXY .S X . SY
On ouvre Statistics dans le menu VARS pour chercher la valeur de rXY , Sx et Sy :

5. Dterminez le rsultat prdit au test pour un enfant g de 10 ans. Reprsentez la droite de rgression sur le nuage de points. Rponse : Pour trouver Y1 on doit ouvrir VARS, Nous allons introduire lquation de la placer le curseur sur Y-VARS et choisir droite de rgression dans grce la function puis Y1 : commande Y1 :

Le graphique :

T.P. 7. ex.suppl. 1 (corrig)

3/8

6. Interprtez vos rsultats partir des mesures calcules et partir du graphique que vous avez trac. Rponse : Lexamen du graphique de dispersion nous indique quil y a une association positive entre la variable X, ge de lenfant, et la variable Y, score obtenu au test. En effet, on constate que presque la totalit des points se trouvent soit dans le quadrant infrieur gauche soit dans le quadrant suprieur droit. Cette interprtation est renforce par covXY qui est positive. Nous observons aussi (et cette valeur est plus facile interprter que celle de covXY) que la valeur de rXY est positive et que daprs le diagramme de dispersion, les points ont tendance saligner selon une droite de pente positive. Le coefficient de dtermination est de 0,63. Ceci signifie que seulement 63% des variations de la variable Y (score au test) entre individus peuvent tre expliques par linfluence linaire de X sur Y.

T.P. 7. ex.suppl. 1 (corrig)

4/8

T.P. 7 Exercice Supplmentaire 2 Srie statistique bivarie Nuages de points - Covariance (Corrig)
Considrons un chantillon de 10 employs du mme age, dune entreprise. Soit X le nombre dannes dtudes effectues et Y le revenu mensuel (en milliers de francs) touch par chacun dentre eux. Les observations sont contenues dans le tableau suivant :
Xi X

Xi
1 2 3 4 5 6 7 8 9 10
n

Yi
41 72 48 82 61 86 102 78 112 108

(X X)
i

Yi Y

(Y Y ) ( X X )(Y Y )
2 i
i i

6 8 9 10 10 11 12 14 16 18

-5.4 -3.4 -2.4 -1.4 -1.4 -0.4 0.6 2.6 4.6 6.6 0

29.16 11.56 5.76 1.96 1.96 0.16 0.36 6.76 21.16 43.56 122.40

-38 -7 -31 3 -18 7 23 -1 33 29 0

1444 49 961 9 324 49 529 1 1089 841 5296

205.20 23.80 74.40 -4.20 25.20 -2.80 13.80 -2.60 151.80 191.40 676

i =1

114 790

1. Reprsentez cette srie par un nuage de points. Graphique :


120 110 100 90

xi - xb

(xi,yi)

yi - yb

y = Rev. mensuel

80 70 60 50 40 30 20 10 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

G=(xb,yb)

x = Nbr. annes d'tude

T.P. 7. ex.suppl. 1 (corrig)

5/8

2. Compltez les cellules vides du tableau des donnes.

3. Calculez manuellement les valeurs suivantes : NB : Vous pouvez vous baser sur les sommes calcules au point 2. Rponse : Moyenne de X : X = 11,4 Moyenne de Y : Y = 79 Variance de Y Variance de X :
2 SY =

S2 = X

122,40 = 12,24 10

5296 = 529, 6 10

cart type de Y cart type de X S X = 12,24 = 3,5

SY = 529,6 = 23,01
Covariance de X et Y : 676 cov XY = S XY = = 67 ,6 10

4. Vrifiez vos rsultats laide de la TI 84 +

T.P. 7. ex.suppl. 1 (corrig)

6/8

Rponse :

Pour la variance : VARS STATISTICS :

5. Sur le graphique du point 1, tracez les droites dfinissant les 4 quadrants dans le plan.

6. Dterminez lquation de la droite de rgression de Y en fonction de X. Rponse :

Y = 16,04 + 5,52 X

T.P. 7. ex.suppl. 1 (corrig)

7/8

7. Interprtez vos rsultats sur base du graphique que vous avez trac et des valeurs que vous avez calcules. Rponse : Les valeurs de X et de Y sont trs diffrentes entre elles : elles sont mesures dans des units diffrentes. Cependant nous pouvons valuer la force du lien qui les unit. Nous voyons que la covariance entre les deux variables est positive : cela signifie que plus le nombre dannes d'tudes effectues est lev, plus le revenu mensuel des individus lest. En regardant le graphique, nous constatons en effet que de faon gnrale, les sujets qui se situent en dessous de la moyenne pour la variable X, se situent galement en dessous de la moyenne pour la variable Y ; de mme, si un sujet se trouve au-del de la moyenne pour la variable X, il se situe galement au-del de la moyenne pour la variable Y. Ceci sobserve grce au fait que sur le graphique de dispersion, les points se trouvent soit dans le quadrant infrieur gauche, soit dans le quadrant suprieur droit. Trois sujets sont dans les deux autres quadrants : ce sont des sujets qui sont proches de la moyenne pour les deux variables, elles sont proches du centre de gravit. Le coefficient de dtermination est de 0,70. Ceci signifie que seulement 70% des variations de la variable Y (le revenu) entre individus peuvent tre expliques par linfluence linaire de X sur Y.

T.P. 7. ex.suppl. 1 (corrig)

8/8

Vous aimerez peut-être aussi