Vous êtes sur la page 1sur 6

STASTIQUES A DOUBLE ENTREES ET REGRESSION

LINEAIRE

1- Statistiques à double entrées


a- Tableauu de contingence
X etY deux variables statistiques définies comme suit
X =( x 1 , x 2 , … , x k ) et Y =( y 1 , y 2 , … , y p )

Y y1 y2 … yp ni .
X
x1 n11 n12 … n1 P n1.
x2 n21 n22 n2 P n2.
.
xk n k1 n k1 n kp n k.
n. j n.1 n.2 n. p n..

On a les expressions suivantes


b- Les fréquences absolues
p k p k p k
ni . =∑ n ij , n. j =∑ nij , n..=∑ n. j=∑ ni .=∑ ∑ nij
j=1 i=1 j=1 i=1 j=1 i=1
ni . et n. j sont appelées les fréquences absolues marginales de X et Y respectivement
et n.. est appelée fréquence totale

c- Les fréquences relatives


n
f ij = ij est appelée fréquence relative
n..
ni . n. j
f i .= et f . j= sont appelées les fréquences relatives marginales de X et Y
n.. n..
respectivement.
p k p k
f i .=∑ f ij , f . j=∑ f ij , ∑ ∑ f ij =1
j=1 i=1 j=1 i=1
k p

∑ f i .=∑ f . j =1
i=1 j=1

d- Les fréquences conditionnelles


j f ij i f ij
f i = et f j= sont les fréquences relatives conditionnelles de X / j et Y /i
f.j f i.
respectivement.
On a la relation suivante :
f ij f ij j i
f ij = f . j= f i . =f i f . j=f j f i .
f.j f i.

e- Les variables marginales

X x1 x2 x3 …. xk
ni . n1. n2. n3. …. n k.

Y y1 y2 y3 …. yp
n. j n.1 n.2 n.3 …. n. p

f- Les variables conditionnelles

X/j x1 x2 x3 …. xk
ni / j n1 j n2 j n3 j …. n kj

Y /i y1 y2 y3 …. yp
n j/ i ni 1 ni 2 ni 3 …. nip

g- La moyenne, la variance et l’écart-type


On appelle moyenne et variance de la variable statistique X , les expressions
suivantes
k k
1
X = ∑ ni . x i = ∑ f i . x i
n.. i=1 i=1
k k
1
V ( X )= ∑
n.. i=1
ni . x i2 −X 2=∑ f i . x i2−X 2
i=1

L’écart-type de X est
σ X = √V ( X )
Même chose pour la variable statistique Y
p p
1
Y = ∑ n. j y j=∑ f . j y j
n .. j=1 j=1
p p
1
V ( Y )= ∑
n.. j=1
n . j y j −Y =∑ f . j y j −Y
2 2 2 2

j=1

L’écart-type de X est
σ Y =√ V ( Y )

h- Proprietés de la moyenne et la variance


Théorème 
2
V ( aX +b )=a V ( X )
aX + b=a X +b

Preuve
k k k
aX + b=∑ f i . ( a x i +b ) =a ∑ f i . x i+ b ∑ f i . =a X + b
i=1 i=1 i=1

(∑
k k k
V ( aX +b )=∑ f i . ( a x i+ b )2−aX +b2 =∑ f i . ( a2 xi2 +2 ab x i+ b2 ) −( a2 X 2 +2 ab X +b 2 )=a 2 f i. x i2− X
i=1 i=1 i=1

i- Covariance et coefficient de corrélation


Définition
On appelle covariance du couple ( X , Y ), l’expression suivante
k p k p
Cov ( X , Y )=∑ ∑ f ij ( x i−X ) ( y j−Y ) =∑ ∑ f ij x i y j−X Y
i=1 j =1 i=1 j=1

Définition
On appelle coefficient de corélation du couple ( X , Y ), l’expression suivante
Cov ( X ,Y )
ρ( X ,Y )=
σXσY
Théorème
Cov ( X , Y )
−1 ≤ ρ ( X , Y )= ≤+1
σ X σY

Résultats
1- Si ρ ( X ,Y ) =0: On dit que les deux variables statistiques X etY sont indépendantes.
2- Si ρ ( X ,Y ) > 0 :On dit que les deux variables statistiques X etY sont positivement
corrélées, c'est-à-dire : si X augmente alors Y aussi augmente et vice versa
3- Si ρ( X ,Y ) < 0 :On dit que les deux variables statistiques X etY sont négativement
corrélées, c'est-à-dire : si X augmente alors Y diminue et vice versa

2- Regréssion linéaire
Dans cette partie on se propose de trouver unr relation linéaire entre les deux variables
statistiques X etY sous la forme Y =aX +b ou X =a' Y +b' . Ces deux relations vont
nous conduire à trouver les constantes a , b , a' et b '
On pose
k
S ( a , b ) =∑ f i . ( a xi +b− y i )2
i=1

En utilisant la méthode des moindres carés pour trouver les deux constantes a et b. On
suppose que Y =aX +b
k k k k
∂ S ( a ,b )
=2 ∑ f i . ( a x i +b− y i )=0 ⇔ a ∑ f i . xi +b ∑ f i . −∑ f i. y i=0 ⇔ a X +b−Y =0 ⇔ b=Y −a X
∂b i=1 i=1 i=1 i=1

D’autre part, on a
k
∂ S ( a ,b )
=2 ∑ f i . ( a x i +b− y i ) x i=0
∂a i=1
k k k k k
⇔ a ∑ f i. x i +b ∑ f i . xi −∑ f i . x i y i=0 ⇔ a ∑ f i . x i + ( Y −a X ) X−∑ f i . x i y i=0
2 2

i=1 i=1 i=1 i=1 i=1


k

∑ f i . x i y i− X Y
(∑ )
k k
COV ( X , Y )
⇔a f i . x i −X =∑ f i . x i y i− X Y ⇔ a= i=1k
2 2
=
V (X )
i=1 i=1
∑ f i . xi2− X 2
i=1

Alors, on a :

{
COV ( X , Y )
a=
V ( X)
b=Y −a X

Même chose si on suppose que X =a' Y +b' . On aura

{
' COV ( X , Y )
a=
V (Y )
b = X−a ' Y
'

Résultat

aa =
' COV ( X , Y ) COV ( X , Y ) COV ( X , Y ) 2
V (X) V (Y )
=
σ X σY (=ρ( X ,Y )
2
)

Exercice1
Soit la distribution statistique à doubles entrées qui montre les salaires des travailleurs (en
1000DA) avec le nombre de leurs enfants

Y 1 2 3 4 ni.
X
20,30 8 4 3 10
[30,40[ 8 3 9 11
[40,50[ 5 4 1 14
[50,60[ 2 6 3 9
n. j

1- calculer les distributions marginales des deux variables statistiques (salaires et nombre
d`enfants).
2- Trouver les distributions conditionnelles suivantes
Y /[ 40−50[ ; X/2
3- Calculer
X ;Y ;V ( X ) ;V ( Y ) ;σ X ;σ Y
4- Calculer la covariance et le coefficient de corrélation des deux variables statistiques
COV ( X ;Y ) ; ρ ( X ;Y )
Commentez les résultats.
5- Trouver les droites de regressions Y =aX +b et X =a' Y +b'

Réponse
1- Les distributions marginales
X ¿ ¿ ¿ ¿
ni . 25 31 24 20

Y 1 2 3 4
n. j 23 17 16 44

2- Les distributions conditionnelles


X /2 ¿ ¿ ¿ ¿
ni / j 4 3 4 6

Y /¿ 1 2 3 4
n j/ i 5 4 1 14

3-
k
1
X= ∑ n x = 1 ( 25.25+31.35+24.45+20.55 )=38,9
n.. i=1 i . i 100
p
1 1
Y= ∑
n .. i=1
n. j y j=
100
( 23.1+17.2+16.3+44.4 )=2,81
k
1 1
V ( X )= ∑ ni . x i2 −X 2= ( 25. 252 +31. 352+ 24. 452 +20.55 2) −38,92=113,79
n.. i=1 100
σ X = √ V ( X ) =10,66
p
1 1
V ( Y )= ∑
n.. j=1
n . j y j2 −Y 2=
100
( 23. 12+17. 22 +16.3 2+ 44. 4 2) −2,812=1,49
σ Y =√V ( Y )=1,22
4- Calcul de la covariance et le coefficient de corrélation
k p
1 1
Cov ( X , Y )= ∑ ∑ n x y − X Y = 100
n.. i =1 j=1 ij i j
[ 25 ( 8+8+9+ 40 ) +35 ( 8+6+ 27+55 ) + 45 ( 5+ 8+3+56 ) +55 ( 2+12+

Cov ( X ,Y ) 5,39
ρ( X ,Y )= = =0,41
σXσY 10,66.1,22
5- On va essayer de trouver les deux droites de regressions

{
COV ( X , Y ) 5,39
a= = =0,50
V (X) 10,66
b=Y −a X =2,89−0,50.38,9=−16,56
Alors ladroite de regression est
( ∆ ) : y =0,5 x−16,56

{
COV ( X , Y ) 5,39
a' = = =4,42
V (Y ) 1,22
' '
b = X−a Y =38,9−4,42.2,89=26,12

( ∆' ) : x=4,42 y+ 26,12⇔ y=0,27 x−5,90

Vous aimerez peut-être aussi