Vous êtes sur la page 1sur 6

Chapitre 3 

: Série statistique à deux caractères

Dans les deux premiers chapitres, les séries statistiques étudiées étaient des séries simples ; on
étudiait une population selon un seul caractère. Cependant, on peut trouver une série à deux
ou plusieurs caractères. Dans ce chapitre on va étudier une série à deux caractères.

L’objectif de ce chapitre est d’examiner les relations statistiques possibles

Définition

On appelle série statistique double de Ω pour les caractères X et Y l’application qui à chaque
élément de Ω associe le couple (x i , yi ) où les xi sont les valeurs du caractères X et les yi les
valeurs du caractère Y.

Les résultats de cette observation peuvent être présentés sous deux formes :

A/ Données non groupées

Ces données ponctuelles (ou non groupées) se présentent sous la forme suivante :

A.1/ Tableau de données ponctuelles

Individu 1 2 … n
Valeur de X X1 X2 … Xn
Valeur de Y Y1 Y2 … Yn
Exemple 1 :

Le tableau ci-dessous présente les poids (au kg près) X, les tailles (au cm près) Y, de 10 élèves
âgés de neuf ans.

Poids 20 21 22 22 25 26 27 28 29 30
X
Taille 115 120 117 123 130 123 132 132 128 135
Y

Pour établir la dépendance ou l’indépendance statistique entre deux variables différentes, nous
devons recourir à plusieurs outils de calculs :

Moyennes
n
1
X= ∑X
n i=1 i

n
1
Y= ∑ Yi
n i=1

Variances
n
1
Var ( X )= ∑ X 2− X 2
n i=1 i
n
1
Var ( Y )= ∑ Y 2 −Y 2
n i=1 i

Ecart-type
σ (X )=√ Var ( X )

σ (Y )=√ Var (Y )

Covariance

La covariance du couple (X,Y) est par définition le réel noté Cov (X,Y) qui vaut :

n
1
Cov ( X , Y )= ∑ ( X i−X )(Y i−Y )
n i=1

Par démonstration on aura :

n
1
Cov ( X , Y )= ∑ X Y −X Y
n i=1 i i

Coefficient de corrélation

Soientσ (X )et σ (Y ) les écart-types des deux caractères, Cov (X,Y) la covariance du couple (X,Y).
Le coefficient de corrélation linéaire noté r (X,Y) du couple (X,Y) est par définition le nombre
réel :

Cov( X ,Y )
r ( X ,Y )=
σ ( X ) σ (Y )

Le coefficient de corrélation linéaire mesure le degré d’association entre deux variables. Il peut
varier de −1 et1, en fonction du degré d’association. Un coefficient de corrélation linéaire égal
à zéro indique qu’il n’existe aucune association linéaire entre les deux variables.
Le tableau suivant donne une indication pour l’interprétation du coefficient de corrélation
linéaire :

Coefficient de corrélation Degré d’association


0,8 à 1 Important
0,5 à 0,8 Modéré
0,2 à 0,5 Faible
Les valeurs négatives du coefficient de
0 à 0,2 Négligeable
corrélation linéaire indique une
corrélation négative où Y varie en raison
inverse de X ( Exemple : Prix et Demande)

Résolution de l’exemple 1 :

Individu Poids Xi Taille Yi Xi Yi X 2i Y 2i


1 20 115 2300 400 13225
2 21 120 2520 441 14400
3 22 117 2574 484 13689
4 22 123 2706 484 15129
5 25 130 3250 625 16900
6 26 123 3198 676 15129
7 27 132 3564 729 17424
8 28 132 3696 784 17424
9 29 128 3712 841 16384
10 30 135 4050 900 18225
Total 250 1255 31570 6364 157929

Calcul des moyennes


10
1
X= ∑X
n i=1 i

250
X= =25 kg
10
10
1
Y= ∑ Yi
n i=1

1255
Y= =125,5 cm
10

Calcul des variances


10
1
Var ( X )= ∑ X 2− X 2
n i=1 i

6364
Var ( X )= −¿
10

10
1
Var ( Y )= ∑ Y 2i −Y 2
n i=1

157929
Var ( Y )= −¿
10

σ (X )=√ Var ( X )

σ ( X )=√ 11,4=3,376

σ ( Y )= √ Var ( Y )

σ ( Y )= √ 42,65=6,53

Calcul de la covariance
n
1
Cov ( X , Y )= ∑ X i Y i−X Y
n i=1

Cov( X , Y )=3157−( 25 ×125,5 )=19,5


Calcul du coefficient de corrélation linéaire

Cov ( X , Y ) 19,5
r ( X , Y )= = =0,884
σ ( X ) σ (Y ) 3,376 × 6,53

On a une forte corrélation entre les deux variables poids (X) et taille (Y)