Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 2

ÉTUDIANT : STATISTIQUE À DOUBLE

VARIABLES PROF : M. DEMBÉLÉ

Il arrive fréquemment que l'on observe simultanément deux caractères statistiques


pour déterminer s'il existe une corrélation entre les deux (âge et taille ; poids et taille ;
frais publicitaires et chiffre d’affaires, etc.)
1°) Définition :
Une série statistique à deux variables est une série pour laquelle deux caractères X et Y
mesurables sont relevés pour chaque individu. Cette série peut se présenter sous la
forme :
𝑥𝑖 𝑥1 𝑥2 … 𝑥𝑖 …… 𝑥𝑛
𝑦𝑖 𝑦1 𝑦2 ….. 𝑦𝑖 …… 𝑦𝑛
2°) Vocabulaire :
a) Nuage de points :
Soit X et Y deux variables statistiques numériques observées sur n individus.
Dans un repère orthogonal (o ; 𝑖⃗ ; 𝑗⃗), l’ensemble des n points de coordonnées (𝑥𝑖 ; 𝑦𝑖 )
forme le nuage de points associé à cette série statistique.
b) Le point moyen G :
Soit une série statistique à deux variables X et Y, dont les valeurs sont des
couples (𝑥𝑖 ; 𝑦𝑖 ). On appelle point moyen de la série, le point G de coordonnées :
𝒙𝟏 + 𝒙𝟐 … … . 𝒙𝒏 𝒚𝟏 + 𝒚𝟐 … … . 𝒚𝒏
̅𝑮 =
𝒙 ̅𝑮 =
𝒆𝒕 𝒚
𝒏 𝒏
c) La variance et l’écart type :
∑ 𝒙𝒊 𝟐
 La variance de 𝑥 est : 𝑽(𝒙) = ̅𝟐 et son écart type est : (𝒙) = √𝑽(𝒙)
−𝒙
𝒏
∑ 𝒚𝒊 𝟐
 La variance de 𝑦 est : 𝑽(𝒚) = ̅𝟐 et son écart type est : (𝒚) = √𝑽(𝒚)
−𝒚
𝒏
d) La covariance : On appelle covariance du couple (X ; Y) le réel noté cov (X ; Y) :
∑ 𝒙 𝒊 𝒚𝒊
𝒄𝒐𝒗(𝒙; 𝒚) = ̅𝒚
−𝒙 ̅
𝒏
e) Coefficient de corrélation linéaire : On appelle coefficient de corrélation linéaire
𝒄𝒐𝒗(𝒙 ; 𝒚)
de (X ; Y) le nombre réel noté r et égal à : 𝒓𝒙𝒚 = (𝒙)×(𝒚)
Propriétés : Ce coefficient sert à mesurer la qualité d’un ajustement affine.
On montre que : -1  𝒓𝒙𝒚  1. Si X et Y sont indépendants alors 𝒓𝒙𝒚 = 0.
Dans la pratique si |𝒓𝒙𝒚 | est proche de 1, c’est à dire 𝟎, 𝟖𝟕 ≤ 𝒓𝒙𝒚 < 𝟏 𝒐𝒖 − 𝟏 < 𝒓𝒙𝒚 ≤ −𝟎, 𝟖𝟕
on dit alors qu’il y a une bonne corrélation ou une forte corrélation linéaire entre X et Y .
Plus 𝒓𝒙𝒚 est proche de 0 la liaison entre X et Y est faible.
f) L’ajustement linéaire : Consiste à construire une droite qui soit situé le plus
proche possible des points réels. En d’autres mots, le problème de l’ajustement
linéaire consiste à étudier deux variables X et Y.
X est appelé variable expliquée et Y est appelée variable explicative. Les statisticiens
s’efforcent de trouver algébriquement et graphiquement s’il existe une relation entre X
et Y. L’équation de la droite d’ajustement linéaire ou de la droite de régression est de
la forme : (𝑫) ∶ 𝒚 = 𝒂𝒙 + 𝒃
3°) Estimation ou prévision :
 La droite d’ajustement tracée de points permet graphiquement une estimation de y
connaissant 𝑥 (resp. 𝑥 connaissant 𝑦).
 L’équation de la droite d’ajustement permet de calculer une estimation de 𝑦
connaissant 𝑥 (resp. 𝑥 connaissant 𝑦).
3°) Les méthodes d’ajustement linéaire :
a) Méthode des points extrêmes : La méthode consiste à calculer l'équation de la
droite d'ajustement qui passe par le premier point et le dernier point d'une série de
coordonnées (x, y).
Si 𝐴(𝑥𝐴 ; 𝑦𝐴 ) et 𝐵(𝑥𝐵 ; 𝑦𝐵 ) sont les coordonnées des deux points extrêmes, l’équation
de la droite d’ajustement (D) est obtenue par l’une des deux méthodes :
𝒂𝒙 + 𝒃 = 𝒚𝑨
 En résolvant le système suivant : { 𝑨
𝒂𝒙𝑩 + 𝒃 = 𝒚𝑩
𝒚𝑩 −𝒚𝑨
 En calculant 𝒂 = 𝒆𝒕 𝒃 = 𝒚𝑨 − 𝒂𝒙𝑨
𝒙𝑩 −𝒙𝑨

b) Méthode de MAYER ou Méthode des deux points moyens :


La méthode de Mayer consiste à découper la série de données en deux sous-séries, ce
qui permet de tenir compte de tous les points de la série.
 On calcule ensuite le point moyen de chaque sous-série avant de déterminer
l'équation de la droite d'ajustement qui passe par ces deux points moyens. Si la série
comporte un nombre de points impairs, il est préférable de prendre un point de plus
dans la deuxième sous-série pour augmenter son poids relatif, car elle est plus
récente, donc plus représentative. 𝑮𝟏 (𝒙 ̅𝟏 ) 𝒆𝒕 𝑮𝟐 (𝒙
̅𝟏 ; 𝒚 ̅𝟐 )
̅𝟐 ; 𝒚
̅ −𝒚
𝒚 ̅
 On peut déterminer l’équation de la droite (D) en calculant : 𝒂 = 𝒙̅𝟐 −𝒙̅𝟏 𝒆𝒕 𝒃 = 𝒚
̅𝟏 − 𝒂𝒙
̅𝟏
𝟐 𝟏

 La droite d’ajustement passe par les deux points moyens.


C) La méthode des moindres carrés ou la méthode des carrés ordinaires MCO : Elle
permet de déterminer l'équation de la droite d'ajustement qui passe le plus près possible
de l'ensemble des points de la série étudiée. C'est la méthode la plus précise. Elle est le
mieux appropriée lorsque les points sont peu alignés mais qu'une tendance se dégage.
Cette droite a pour équation : 𝑦 = 𝑎𝑥 + 𝑏
Le coefficient directeur "a" de la droite, se calcule de la façon suivante :
𝒄𝒐𝒗(𝒙; 𝒚) ∑ 𝒙𝒊 𝒚𝒊 − 𝒏𝒙̅𝒚
̅
𝒂= 𝒐𝒖 𝒂 = ̅ − 𝒂𝒙
𝒆𝒕 𝒃 = 𝒚 ̅
𝑽(𝒙) ∑ 𝒙𝟐𝒊 − 𝒏𝒙̅𝟐

Activité 1 : Les notes obtenues par dix candidats aux épreuves de Mathématiques et
d’économie dans d'un concours d’excellence sont indiquées dans le tableau suivant :
Mathématiques (X) 3 5 6 6 9 9 12 12 14 14
Économie (Y) 5 8 8 10 10 13 13 16 16 17
1) Représente le nuage de points associé à cette série statistique
2) On partage le nuage de points en deux parties d'effectifs égaux.
a) Calcule les coordonnées de G1 et G2, points moyens respectifs des nuages partiels
ainsi obtenus.
b) Place les points G1 et G2. Trace la droite (G1G2).
c) Détermine une équation de la droite (G1G2).
3) Estime, à l'aide de la droite (G1G2), la note de mathématiques qu'aura un candidat qui
avait 10,5 en économie.
Activité 2 : Le tableau suivant donne le nombre d’exploitations agricoles d’une zone de
l’office du Niger selon leur superficie en hectares.
Superficie X 2 2,5 3 4 5 6 7 7,5
Nombre d’exploitation Y 14 26 31 29 44 40 54 50
1°) Représente le nuage de points associé à cette série.
2°) Détermine les coordonnées du point moyen G de cette série et place ce point G.
3°) Calcule la variance et l’écart type de chacun des variables X et Y.
4°) Calcule la covariance de cette série.
5°) Calcule et interprète le coefficient de corrélation linéaire de cette série.
6°) Détermine une équation de la droite d’ajustement linéaire de Y en X par la méthode
des moindres carrés (on arrondira les résultats à deux chiffres après la virgule).
Trace cette droite dans le même repère que le nuage de points.
7°) En supposant que la tendance se poursuit ainsi, détermine le nombre de
d’exploitations agricoles pour une superficie de 9 ha.

Vous aimerez peut-être aussi