Vous êtes sur la page 1sur 5

Cours

: Srie statistique deux variables (srie statistique double)

1 2 3 4 5

Dfinition dune srie statistique double _____________________________________ 1 Quelques exemples_______________________________________________________ 1 Reprsentation graphique _________________________________________________ 2 Covariance dune srie statistique double ____________________________________ 3 Ajustement affine________________________________________________________ 3
5.1 5.2 Principe_____________________________________________________________ 3 Mthodes____________________________________________________________ 4

5.2.1 Mthode au jug _________________________________________________________ 4 5.2.2 Mthode de Mayer___________________________________________________________ 4 5.2.3 Mthode des moindres carrs ___________________________________________________ 4 5.2.3.1 Principe _________________________________________________________________ 4 5.2.3.2 Dtermination des coefficients ________________________________________________ 5

Coefficient de corrlation linaire __________________________________________ 5

Les statistiques une variable sintressaient, pour une population donne, un caractre donn : les notes un devoir surveill dune classe, les salaires dans une entreprise, etc Lorsque lon sintresse ltude simultane de deux caractres dune mme population, on fait ce que lon appelle des statistiques deux variables, en tudiant des sries statistiques doubles.

Dfinition dune srie statistique double


Dfinition 1 : On considre une population d'effectif n, si on tudie deux caractres X et Y de cette population, on dit que l'on tudie une srie statistique double. Chaque individu de cette population est dsign par un nombre compris entre 1 et n. A chaque individu i ( 1 i n) correspond un couple (x i ; y i) , ou xi est la modalit du caractre X et yi est la modalit du caractre Y associ l'individu i. Lensemble des couples (x i ; y i) dfinit une srie statistique deux variables.

2 Quelques exemples
Exemple 1 : Le tableau ci-dessous donne, pour chaque ville, le nombre moyen dheures densoleillement dans lanne, ainsi que la temprature moyenne :

Page 1

Guesmi.B

Ville JENDOUBA Ensoleillement 2790 Temprature 14,7

TUNIS

KAIROUAN

KEF

BIZERTE

AIN DRAHAM

TALA

2072 11,4

2763 14,2

1729 10,8

1574 9,7

1833 11,2

1685 9,7

Population : les sept villes tudies Caractre n1 : nombre moyen dheures densoleillement dans la ville Caractre n2 : temprature moyenne dans la ville

Exemple 2 : Le tableau ci-dessous permet de suivre l'volution de l'esprance de vie la naissance (en annes) en Tunisie de 1990 1999 pour les femmes: Anne Esprance de vie 1990 80,9 1991 81,1 1992 81,3 1993 81,4 1994 81,8 1995 81,9 1996 82,0 1997 82,3 1998 82,4 1999 82,4

population: les femmes en TUNISIE

Caractre n1 : lanne Caractre n2 : lesprance de vie

Dfinition 2 : Lorsque lun des deux caractres est une anne, une date, on dit que la srie statistique double est une srie chronologique .

3 Reprsentation graphique
Dfinition 3 : Si lon appelle x1 , x2 , , xn les n valeurs du premier caractre (on notera cette srie (x i )), et si lon appelle y 1 , y2 ,, yn les n valeurs du second caractre (on notera cette srie ( y i )), alors on reprsente cette srie statistique double par un nuage de points dans un repre du plan, constitu des points Mi de coordonnes (x i , y i ) Exemple 3 : Chaque mois, une entreprise consacre une somme des oprations publicitaires. On met en regard le montant des ventes chaque mois. Une tude portant sur 8 mois a donn les rsultats suivants exprims en millions deuros. X=Frais de pub 0,24 0,3 0,25 0,32 0,35 0,2 0,18 0,3 Y=Ventes 38 42 39 40 45 35 34 41

50 45 40 35 30 25 20 15 10 5 0 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4

Ventes

Frais de pub
Remarque 1 : De la donne de la srie statistique double, on peut dduire les sries statistiques simples dcrivant sparment les caractres X et Y :

Page 2

Guesmi.B

X=Frais de pub 0,18 0,2 0,24 0,25 0,3 0,32 0,35 Effectifs 1 1 1 1 2 1 1

Y=Ventes 34 35 38 39 40 41 42 45 Effectifs 1 1 1 1 1 1 1 1

Dfinition 4 : Soit coordonnes ( ; double.

la moyenne de la srie ( x i ), et la moyenne de la srie ( y i ). Le point G de ) est appel point moyen du nuage de points associ cette srie statistique

4 Covariance dune srie statistique double


Dfinition 5 : On appelle covariance d'une srie statistique double (X ; Y) o les caractre X et Y sont quantitatifs le nombre not cov(X, Y) ou XY dfini par :

et

sont les moyennes des sries statistiques simples.

Thorme de Huyghens-Knig :

Proprit 1 : Soient , , , des constantes relles , U et V les caractres statistiques dfinis par: U = X + et V = X + . C'est--dire tels que pour tout i tel que 1 i n : ui = xi + et vi = ' yi + ' Alors : cov (U, V) = ' cov(X, Y)

5 Ajustement affine
5.1 Principe

Soit (x i , y i ) une srie statistique double, avec un nuage de points Mi (x i , y i ) associ. Lorsque les points du nuage paraissent presque aligns, on peut chercher une relation de la forme y = ax + b qui exprime de faon approche les valeurs de la srie (y i ) en fonction des valeurs de la srie (x i ) , autrement dit, une fonction affine f telle que lgalit y = f(x ) sajuste au mieux avec les donnes. Graphiquement, cela signifie quon cherche une droite qui passe au plus prs de tous les points du nuage . Une telle relation permettrait notamment de faire des prvisions. Il existe de nombreuses manires dobtenir un ajustement affine satisfaisant.

Page 3

Guesmi.B

5.2

Mthodes
5.2.1 Mthode au jug

A vous de tracer une droite qui passe le plus prs possible de tous les points du nuage, si possible en la faisant passer par le point moyen du nuage. Cest peu prcis, mais peut suffire dans certains cas.

5.2.2

Mthode de Mayer

Etape 1 : On commence par dcouper la srie statistique double en deux sous-sries bien distinctes, cest--dire que lon dcoupe le nuage de points Mi (x i , y i ) en deux sous-nuages distincts et de mme effectif (ou presque : si le nombre de points est pair, pas de souci. Sil est impair, on peut mettre le point surnumraire dans nimporte lequel des deux sous-nuages) Etape 2 : On calcule les coordonnes des deux points moyens G1 et G2 associs ces deux sousnuages, et on place ces deux points sur le graphique. Etape 3 : On trace la droite (G1 G2)? , appele droite de Mayer du nuage de points Mi (x i , y i ), qui doit passer par le point moyen G du nuage de points Mi (x i , y i ) .Cest cette droite qui constitue un ajustement affine tout fait acceptable pour la srie double (x i , y i )

5.2.3

Mthode des moindres carrs


5.2.3.1 Principe

On considre un nuage de points Mi (x i , y i ) et soit (D) une droite dquation y = ax + b que lon cherche dterminer. Dfinition 6 : On appelle somme des rsidus associe la droite (D), le nombre rel S dfini par :

Si Pi dsigne le point dabscisses x i sur la droite (D), on a :

Dfinition 7 : On appelle mthode des moindres carrs la mthode qui consiste rechercher les coefficients a et b tels que la somme S soit minimale. Remarquons que S est une fonction des deux variables a et b .

Page 4

Guesmi.B

5.2.3.2

Dtermination des coefficients

Thorme 1 : Le nombre S est minimum pour

Proposition 1 : La droite (D) dquation y = ax+b o a et b sont dtermins daprs le thorme 1, est appel droite de rgression de Y en X et on dit quon a obtenu cette quation par la mthode des moindres carrs. Proposition 2 : La droite (D) dquation : x=ay+b avec :

est appele droite de droite de rgression de X en Y et on dit quon a obtenu cette quation par la mthode des moindres carrs. Remarque : Les deux droites de rgression de Y en X et de X en Y passent toutes deux par le point moyen de coordonnes ( ; )

6 Coefficient de corrlation linaire


Dfinition 8 : On appelle coefficient de corrlation linaire du couple (X, Y), le nombre rel, not r(X, Y) tel que :

Remarques : -1 r(X,Y) 1 aa = (r(X,Y)) Lorsque la corrlation est forte (r ) les droites de rgression sont trs proches et le nuage peut tre approxim par une droite. Lorsque la corrlation est faible, le nuage de points ne peut pas tre ajust par une droite, mais il se peut quune autre courbe permette un bon ajustement.
2

Page 5

Guesmi.B