Vous êtes sur la page 1sur 10

Sries statistiques doubles

4me Sciences

I.

Mai 2010
A. LAATAOUI

Nuage de points
1. Introduction
Une srie statistique deux variables, X et Y, est le rsultat de lobservation des deux caractres X et Y pour
chaque individu dune population.
Lorsque les caractres sont quantitatifs , on peut associer, chaque individu i, un couple de nombres rels not
( xi , yi ) .
Exemple :
Le tableau suivant donne, en millions de dinars, le chiffre daffaires xi et la somme consacre aux dpenses de
publicit yi pour cinq entreprises :
Entreprises

xi

yi

30

55

4,5

60

20

1,5

50

Placer les points M i ( xi , yi ) dans le repre orthogonal ci dessous :


y
11
10
9
8
7
6
5
4
3
2
1

-1

10

11

12

13

14

15

2. Dfinition
Dans un repre orthogonal du plan, le nuage de points associs la srie statistique deux variables, X et Y,
est lensemble des points M i de coordonnes ( xi , yi ) reprsentatifs de tous les individus i de la population.

3. Point moyen
1

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

On note X le caractre : le chiffre daffaires de chaque entreprise et Y : les dpenses de publicit .


Calculer la moyenne, la variance et lcart type de chaque caractre.
On rappelle que :
2

1
1
1
X = ni xi , V ( X ) = ni ( xi - X ) = ni xi - X et s ( X ) = V ( X ) .
N i =1
N i =1
N i =1
. x1 , x2 ,......, xN dsignent les valeurs distinctes prises par la variable X si elle est discrte , ou les centres des
classes si la variable X est continue
. N est la taille de lchantillon
. Dans notre exemple ni = 1 , pour tout 1 i N
Entreprises

xi

yi

30

55

4,5

60

20

1,5

50

xi2

yi2

xi yi

Somme

X = ; V ( X ) = . ; s ( X ) =
Y = ; V (Y ) = . ; s (Y ) = .
Dfinition

Le point G X , Y est appel point moyen du nuage de points associ la srie


statistique deux variables X et Y.
Exemple : Placer le point moyen G dans le repre prcdent.
II.

Liaison entre deux caractres Mthode dajustement par les moindres carrs
1. Droite dajustement
Lorsque le nuage a tendance de saccumuler autour dune droite, alors on cherche une quation de la droite D
qui approche le mieux possible les points du nuage, cest ce quon appelle un ajustement linaire.
Cet ajustement est lie deux paramtres appels Covariance et Coefficient de corrlation linaire.

2. Covariance
Dfinition
Soit (X,Y) une srie statistique double caractres quantitatifs donns par des observations individuelles
( xi , yi ) o 1 i n , n tant leffectif de la population observe.
On appelle covariance de (X,Y) le rel not cov( X , Y ) dfini par : cov( X , Y ) =
encore cov( X , Y ) =

1
N

( x

-x

)( y - y ) ou
i

1
xi yi - x y .
N i

Remarque
Comme pour le calcul de la variance, la formule cov( X , Y ) =

1
xi yi - x y est souvent la plus simple
N i

utiliser pour les calculs.


Exemple

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

La covariance de la srie statistique ci dessus est :


..
Proprits

cov( X , Y ) = cov(Y , X ) .
cov( X , X ) = V ( X ) .
cov 2 ( X , Y ) V ( X ) V (Y ) cov( X , Y ) s ( X ) s (Y ) .

Avec la calculatrice :
Pour programmer le tableau statistique de la page 1 :
. Choisir le mode de fonctionnement de statistique deux variables
MODE 3 Stat 1
. Entrer les couples xi

STO y j

M+

. Pour obtenir par exemple la moyenne X appuyez sur RCL


3. Coefficient de corrlation linaire
Dfinition

Le coefficient de corrlation linaire entre deux variables, X et Y, est le nombre r


dfini par : r =

cov( X , Y )
.
s ( X ) s (Y )

Proprits

cov( X , Y ) s ( X ) s (Y ) 0

cov( X , Y )

s ( X ) s (Y )

1 -1 r 1

Les points du nuage sont aligns si et seulement si r = 1 ou r = -1 .

Si r

3
alors la corrlation linaire entre X et Y est forte. On peut trouver une droite approximative
2

liant X et Y.

Si r <

3
alors la corrlation linaire entre X et Y est faible. Il est inutile de chercher exprimer Y
2

comme fonction affine de X mais il peut exister dautres types de relations.


Exemple
Le coefficient de corrlation linaire est r = ..
On en dduit que : .

4. Droites de rgression
Soient X et Y deux sries statistiques quantitatives non constantes et observes dans une population donne.
On suppose que le coefficient de corrlation r vrifie : r

3
alors il est possible dapprocher la liaison
2

entre X et Y par une relation affine de type Y en fonction de X ou aussi X en fonction de Y.

La premire droite est appele droite de rgression de Y en X, elle a pour quation :


cov( X , Y )
D : y = ax + b o a =
et b = Y - a X .
V (X )
La deuxime droite est appele droite de rgression de X en Y, elle a pour quation : D ' : x = a ' y + b '
cov( X , Y )
o a ' =
et b ' = X - a ' Y .
V (Y )

( )

Ces deux droites affines passent par le point G x, y .

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

Exemple
1) Donner une quation de chacune des droites D et D.
a = ; b = .
D : .
a ' = ; b ' =
D ' : .
2) Tracer D et D dans le mme repre R.
3) Quelle estimation peut on faire quant la somme consacre aux dpenses de publicit pour une entreprise
ayant un chiffre daffaire gal 200 millions de dinars

Exercice
Le tableau ci-dessous donne lvolution de la dette des pays du tiers-monde entre
1978 et 1992 ( en milliards de dollars ).
Anne

1978

1982

1986

1990

1992

Rang de lanne xi

12

14

Dette yi

383

753

1089

1346

1510

Source : Banque mondiale, FMI, 1993.

1. Le plan est rapport un repre orthogonal. Reprsenter le nuage de points ( xi , yi ) , et le point moyen G
de cette srie.
2. a) Calculer le coefficient de corrlation linaire de cette srie double.
Un ajustement affine peut il tre envisag ? Pourquoi ?
b) Ecrire une quation de la droite de rgression D de Y en X. Tracer D.
c) Estimer, 1 milliard de dollars prs, le montant prvisible de la dette des
pays du tiers monde en 2010.
Remarque : il existe une autre mthode dajustement dite mthode de Mayer
( Voir paragraphe du livre page (106 Sc) ou page (217 Maths) )
Exercice :
Le tableau ci-dessous donne la consommation quotidienne Y en fuel dune chaudire ( en litres) en
fonction des relevs de temprature extrieure X

On a reprsent le nuage de points

1) Dterminer un ajustement affine de Y en X par la mthode de Mayer

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

.
..
2) Retrouver cet ajustement par la mthode des moindres carrs

3) A quelle temprature, la consommation en fuel dpassera elle 100 litres par jour

III.

Distributions marginales
1. Construction dun tableau double entre :
Activit
Dans une population de 50 mnages on a observ les deux caractres quantitatifs discrets suivants :
X nombre denfants dans chaque mnage
Y nombre de pices du logement habit par chaque mnage
Les rsultats de ces observations sont consigns dans les tableaux suivants :
Numro
du mnage
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Nombre
Denfants
0
3
0
3
1
3
2
1
4
3
2
1
1
1
0
3
2
2
0
1
2
2
4
1
2

Nombre
De pices
1
3
2
2
1
3
2
2
2
2
1
4
2
3
1
3
2
3
2
2
3
2
3
2
3

Numro
du mnage
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

Nombre
Denfants
4
2
2
2
3
1
1
4
2
2
3
0
4
0
4
2
3
5
1
3
5
2
2
3
2

Nombre
De pices
4
2
4
3
3
1
3
3
3
2
4
1
4
3
4
3
3
4
2
4
3
3
4
2
3

1) Quelles sont les valeurs prises par X et par Y


..
..

2) Les donnes prsentes dans le tableau prcdent tant nombreuses , on se propose, dans la suite , de les prsenter
sous une forme plus rduite et laide dun tableau double entre . Complter le tableau suivant :

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

Tableau double entre ( tableau des effectifs ) :


Y
X
0

Total

Total

50

Pour (1 i 6 ) et (1 j 4 ) , on a associ au couple xi , y j

) un nombre appel effectif que lon note n

ij

Exemple : leffectif correspondant au couple ( x4 , y2 ) = ( 3, 2 ) est n4 2 = 3.


Il indique le nombre de mnages ayant 3 enfants et un logement de 2 pices.
Dfinition :

ni j est appel effectif associ au couple ( xi , y j ) .

2. Distributions marginales :
Du tableau prcdent, on peut extraire deux sries statistiques une variable. La premire donne la rpartition
de 50 mnages selon le nombre denfants X dans chaque mnage et la seconde donne la rpartition de 50
mnages selon le nombre de pices Y du logement habit par chaque mnage.
On obtient alors les deux tableaux suivants :
Tableau 1 :
Nbre denfants X

Total

Effectif ni des mnages

10

16

10

50

Nbre de pices Y

Total

Effectif n j des mnages

16

19

50

Tableau 2 :

Chacun des tableaux 1 et 2 dfinit une srie statistique une variable, appele distribution marginale.

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

Calculer X et Y , donner le point moyen G :


...
...
...
...
...
...
Calculer V ( X ) , V (Y ) , s ( X ) et s (Y ) :
...
...
...
...
...
...
...
La covariance de cette srie est :

cov( X , Y ) =

1 p q
ni j xi - X
N i =1 j =1

cov( X , Y ) =

)( y

j -Y =

1
N

n x y
i =1 j =1

ij i

-X Y .

1 6 4
nij xi y j - XY
50 i =1 j =1

Cette formule parait complique, pour cela on considre le tableau suivant qui
nous facilite la tache

Y
1

Totaux

X
0
1
2
3
4
5

Totaux

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

Calculer le coefficient de corrlation linaire ; que peut on remarquer ?

Avec la calculatrice :
Pour programmer le tableau statistique double entre :
. Choisir le mode de fonctionnement de statistique deux variables MODE 3
. Entrer les triplets xi

Stat

STO y j STO nij M+

. Pour obtenir par exemple la moyenne X appuyez sur RCL X


Exercice :
Le tableau suivant donne la rpartition de 800 agriculteurs suivant les deux variables statistiques suivantes :
X : superficie de lexploitation agricole (en ha)
Y : ge de lagriculteur

[ 20,30[

[30, 40[

[ 40,50[

[50, 60[

60 ans et plus

]0,5[
[5,15[
[15, 25[
[ 25,35[
[35, 45[

15

50

90

80

25

10

45

60

50

20

30

40

35

12

40

35

25

20

15

20

45 et plus

15

10

10

Y
X

1) Dterminer les distributions marginales de X et Y


2) Calculer X , Y , V(X) , V(Y) , s X et s Y
3) Calculer cov(X,Y) et le coefficient de corrlation du couple (X,Y). Peut on envisager un ajustement affine liant X
et Y ?
Cas dun ajustement non affine :
Activit
On a mesur, entre 1989 et 1974, leffet de la population sur une population piscicole dune rivire
Les rsultats prsents dans le tableau suivant donnent une estimation du nombre y i de poissons, exprim en milliers,
correspondant lanne dont le rang est x i
Anne

1989

1990

1991

1992

1993

1994

Rang de lanne x i

yi

591,3

106,7

96,5

63,2

21

9,4

1) On considre la srie statistique double ( x i , y i ) . Calculer le coefficient de corrlation entre x et y. Expliquer pourquoi
un ajustement linaire ne parat pas bien adapt

2) On pose : zi = Log y i , pour i 1, 2, 3, 4, 5, 6


a)

Calculer les nombres

zi

b) Reprsenter dans un repre orthogonal le nuage de points xi , z i


c)

Calculer le coefficient de corrlation de cette srie. Justifier lutilisation dun ajustement affine pour la srie

( xi , z i )

d) Dterminer lquation de la droite de rgression de z en x. Tracer cette droite dans le repre de la question 2) b)
3) On suppose que lvolution de cette population se poursuit sur le mme modle
a) A partir de quelle anne, cette population sera-t-elle strictement infrieure 1000 ?
b) Donner une estimation de la population de cette rivire en lan 2010.
8

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

Statistiques deux variables


Exercices
Exercice n1 :
Le tableau suivant donne la rpartition de cent
anciens lves dun tablissement daprs
les deux caractre : X le nombre dannes
passes dans cet tablissement et Yson ge
1) a) Donner les distributions marginales de X et Y
b) Calculer :

20
25

0
5

8
20

30
7

30

25

X, Y, s X et s Y

2) Calculer la covariance et le coefficient de corrlation linaire entre X et Y, et interprter


le rsultat obtenu
3) a) Dterminer la droite de rgression de Y en X
b) Donner une estimation de lge dun lve qui a pass 5 ans dans cet tablissement
Exercice n2 :
Les mesures relatives la vitesse d'un automobiliste et la distance ncessaire pour arrter le vhicule sont runies dans
le tableau suivant .

xi ( Km / h )

27

43

62

80

98

115

yi ( distance d'arrt en m )

6,8

20,5

35,9

67,8

101,2

135,8

1) Dans un repre orthogonal , construire le nuage des points associs la srie statistique ( xi , yi ) .
2) a)
b)
c)
d)
e)

Calculez x , y , V ( X ) , V (Y ) et cov( X , Y ) .
Calculez le coefficient de corrlation linaire .
Dterminez et tracez la droite de rgression de y en x .
Dduire la valeur estime de x correspondante une distance d'arrt de 180 m .
Quelle est la distance d'arrt en mtre , correspondante une vitesse de 150 Km / h ?

Exercice n3 :
Ltude de la population dune ville a donn les rsultas suivants : h est le nombre dhabitants par milliers.
Anne
2001 2002 2003 2004 2005
Rang de lanne xi
1
2
3
4
5
Nombre dhabitants hi 24,5 27,38 31,205 36,125 37,845

rr
1. Reprsenter dans un repre orthonorm le nuage de points de la srie (x , h) dans un repre orthogonal R(O, i, j ) . Sur
laxe des abscisses placer 0 lorigine 1 cm reprsente 1
Sur laxe des ordonnes placer 20 lorigine 1 cm reprsente mille
2. a) Calculer le coefficient de corrlation linaire entre x et h
b) Justifier lutilisation dun ajustement affine pour la srie (x , h)
c) Dterminer lquation de la droite de rgression de h en x
3. On suppose que lvolution de cette population se poursuit sur le mme modle et que les
dpenses de la municipalit de cette ville en une anne en milliers des dinars not y obit
la loi : y = 10 hi + 200
a) Donner une estimation de la population de cette ville lanne 2010 ?
b) Donner une estimation des dpenses de cette municipalit lanne 2010

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com

c) A partir de quelle anne les dpenses de cette municipalit dpasseront-elles les 300 milles dinars.
Exercice n4 :
Pour une srie ( xi , yi ) avec (1 i 15) deux variables , la mthode des moindres carrs a permit de trouver : Lquation de
la droite (D) de rgression de y par rapport x. D : y = 0,37 x + 12,59
Lquation de la droite (D) de rgression de x par rapport y . D ' : x = 0,9 y + 14, 07
1. Dterminer le coefficient de corrlation linaire de cette srie
2. Dterminer les coordonnes du point moyen G associ cette srie
15

3. On suppose que

xi2 = 25205 . Calculer : Cov (x , y ) ;


i =1

15

xi yi et
i =1

15

y
i =1

2
i

Exercice n5 :
Le tableau suivant donne les rsultats obtenus partir de six essais de laboratoire concernant la charge de rupture dun
acier en fonction de sa teneur en carbone
Teneur en carbone X ( pour 10000)

60

62

64

68

70

74

Charge de rupture Y ( en Kg )

70

75

80

82

85

100

1. a) Reprsenter dans un repre orthogonal le nuage des points de la srie ( X , Y )


b) Dterminer le point moyen de ce nuage
2. a) Calculer V ( X ) ; V (Y ) et COV ( X , Y )
b) Est il possible denvisager un ajustement linaire entre X et Y ? Justifier
c) Dterminer et construire la droite de rgression de Y en X
3. Quelle pourrait tre la charge de rupture dun acier ayant une teneur en carbone de 90 pour 10000

10

Sries statistiques doubles. 4me Sciences 09 10.

www.espacemaths.com