Vous êtes sur la page 1sur 7

Série statistique à deux variables(ou doubles):

I Introduction :
Souvent, nous serons amenés à observer et à étudier en même temps deux caractères des
éléments d’une série statistique et nous demander si ces caractères sont liés et comment ils le
sont.
Notion : on dit qu'il y a corrélation entre deux variables lorsqu'elles ont tendance à varier soit
toujours dans le même sens (par exemple, si X augmente, Y a tendance à augmenter aussi), soit
toujours en sens inverse (par exemple, si X augmente, Y a tendance à diminuer).
Questions mathématiques :
Peut-on quantifier cette liaison ?
Peut-on tester si cette liaison est statistiquement significative ?
Peut-on utiliser cette liaison à des fins prédictives ?
Par exemples le poids et la taille des élèves d’une classe, la durée moyenne de vie et le revenu
moyen.
➢ Soient 𝑥𝑖 et𝑦𝑖 les valeurs associées aux deux caractères 𝑥 et 𝑦
➢ Nous avons deux façons de présenter le tableau statistique :
- Premier cas :
Exemple : Soit la série statistique suivante

𝑥𝑖 35 45 55 65 75
𝑦𝑖 114 124 143 158 166
- Deuxième cas :
Posons 𝑥 = {𝑥1 ; 𝑥2 ; . . . ; 𝑥𝑝 }et 𝑦 = {𝑦1 ; 𝑦2 ; . . . ; 𝑦𝑞 } à chaque couple (𝑥𝑖 , 𝑦𝑖 ) de l’ensemble
𝑥 × 𝑦 on associe le nombre 𝑛𝑖𝑗 d’éléments présentant les caractères 𝑥𝑖 et 𝑦𝑗 . On obtient un
tableau de q colonnes et p lignes
Exemple : le poi46+ds et la taille de 10 élèves en kg et cm.
Poids 𝑦𝑗 62 65 68 71 74 Total
Tail6le 𝑥𝑖
165 4 15 10 7 0 36
168 7 0 1 20 6 34
171 0 5 2 1 8 16
174 12 1 0 0 1 14
Total 23 21 13 28 15 100
On définit ainsi une série statistique à deux (ou double) entrées de p colonnes et de q lignes.
𝑛𝑖∎ = ∑𝑞𝑗=1 𝑛𝑖𝑗 : est appelé effectif marginal de la valeur 𝑥𝑖 et
𝑛∎𝑗 = ∑𝑝𝑖=1 𝑛𝑖𝑗 : est appelé effectif marginal de la valeur 𝑦𝑗
L’effectif total 𝑁 = ∑𝑝𝑖=1 ∑𝑞𝑗=1 𝑛𝑖𝑗 = ∑𝑝𝑖=1 𝑛𝑖∎ = ∑𝑞𝑗=1 𝑛∎𝑗
II Caractéristiques :
A- moyennes arithmétiques :
La moyenne arithmétique de x est :
1
𝑥̅ = 𝑁 ∑ 𝑥𝑖 dans le premier cas
1
𝑥̅ = 𝑁 ∑𝑝1=𝑖 𝑛𝑖. 𝑥𝑖 dans le deuxième cas
1 1
De même pour la variable y on a 𝑦̅ = 𝑁 ∑ 𝑦𝑖 𝑜𝑢 𝑦̅ = 𝑁 ∑𝑞𝑗=1 𝑛.𝑗 𝑦𝑗
B- variances :
On appelle variance la moyenne des carrés des écarts à la moyenne
La variance de 𝑥 est mottée : 𝑉(𝑥) ou 𝜎𝑥2
1
𝑉(𝑥) = 𝑁 ∑ 𝑥𝑖2 − 𝑥̅ 2 Où
1 1
V(𝑥) = 𝜎𝑥2 = 𝑁 ∑𝑝𝑖=1 𝑛𝑖. (𝑥𝑖 − 𝑥̅ )2 = 𝑁 ∑𝑝𝑖=1 𝑛𝑖. 𝑥𝑖 2 − 𝑥̅ 2
La variance de 𝑦 est :
1
𝑉(𝑦) = 𝑁 ∑ 𝑦𝑖2 − 𝑦̅ 2 Où
1 2 1
𝑉(𝑦) = 𝜎𝑦2 = 𝑁 ∑𝑞𝑗=1 𝑛.𝑗 (𝑦𝑗 − 𝑦̅) = 𝑁 ∑𝑞𝑗=1 𝑛.𝑗 𝑦𝑗 2 − 𝑦̅ 2
C- Ecarts types 𝜎𝑥 = √𝑉(𝑥) et 𝜎𝑦 = √𝑉(𝑦)
D- La covariance :
On appelle covariance de (𝑥, 𝑦) le nombre réel noté 𝑐𝑜𝑣(𝑥, 𝑦) et elle reflète le degré auquel 2
variables varient ensemble et défini par :
1
𝑐𝑜𝑣(𝑥, 𝑦) = 𝑁 ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅ où
1 1
𝑐𝑜𝑣(𝑥, 𝑦) = ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̅ )(𝑦𝑗 − 𝑦̅) = ∑ 𝑛𝑖𝑗 𝑥𝑖 𝑦𝑗 − 𝑥̅ 𝑦̅
𝑁 𝑁
Cette formule consiste essentiellement à faire le produit des écarts à la moyenne de chacune des
variables. Dès lors, lorsque les écarts sont exactement les mêmes on aura la valeur la plus haute.
Plus la covariance est élevée, plus les variables réagiront de la même manière. S’il n’y a pas de
relation entre X et Y, une valeur positive de (X- 𝑋̅) sera parfois associée à une valeur positive
et parfois à une valeur négative de (Y −𝑌̅). Les produits des écarts seront donc parfois positifs
et parfois négatifs, ce qui donne une somme proche de 0.
La covariance a comme désavantage de ne pas être étalonnée. On peut se dire que plus elle est
grande en valeur absolue plus les variables sont associées mais on ne sait pas jusqu’à quelle
valeur elle peut monter.
E- Nuage de points (ou diagramme de dispersion) :
Chaque sujet inclus dans l’étude est représenté par un point 𝑀𝑖 (𝑥𝑖 , 𝑦𝑗 ) dans un espace
bidimensionnel. Les coordonnées de ce point (𝑥𝑖 𝑒𝑡 𝑦𝑗 ) sont les valeurs obtenues par l’individu
pour les variables X et Y respectivement. Généralement la variable indépendante (qui sert de
prédicteur ) est représentée en abscisse et la variable dépendante (critère) est représentée en
ordonnée. Par ex, incidence du cancer en fonction du nombre d’heures d’exposition au soleil :
incidence du cancer (= var dépendante) se situe en ordonnée et le nombre d’heures au soleil (=
var indépendante) en abscisse.
Le plan est muni d’un repère orthogonal. Construisons les points 𝑀(𝑥𝑖 , 𝑦𝑗 ) l’ensemble des
points ainsi obtenu est appelé nuage de points de la série.
Dans le deuxième cas à chaque modalité (𝑥𝑖 , 𝑦𝑗 ) est représenté par un disque dont la taille est
proportionnelle à l’effectif de(𝑥𝑖 , 𝑦𝑗 ). Les points d’effectif nuls ne sont pas représentés.
F- Point moyen :
On appelle point moyen de la série le point G de coordonnées les moyennes arithmétiques 𝑥̅ et𝑦̅.
𝐺(𝑥̅ , 𝑦̅)
G- Coefficients de corrélation linéaire (ou Coefficient de corrélation de Pearson) ::
La corrélation est une mesure statistique utilisée pour mesurer le degré de liaison entre 2
variables (taille et poids ; résultats à l’examen de français et nombre de livres lus/mois ; niveau
en compréhension d’anglais parlé et appréciation de la langue anglaise…). Dans les problèmes
de corrélation simple (par rapport aux corrélations multiples ou partielles), les données se
composent de 2 observations pour chacun des N sujets, une observation par variable considérée.
Le coefficient de corrélation linéaire la quantité
𝑐𝑜𝑣(𝑥, 𝑦)
𝑟=
𝜎𝑥 𝜎𝑦
Le coefficient de corrélation linéaire r mesure le dégrée d'association linéaire entre X et Y
Propriétés
P1. Le coefficient de corrélation est un nombre compris entre 1 et -1. On a −1 ≤ 𝑟 ≤ 1
P2. Le nombre r sert à quantifier l'intensité et le sens de la dépendance linéaire entre X et Y.
P3. Lorsque r > 0, cela signifie que lorsqu'une des variables a tendance à augmenter, l'autre
aussi.
P4. Lorsque r < 0, cela signifie que lorsqu'une des variables a tendance à augmenter, l'autre a
tendance à diminuer.
P5. Lorsque r = 0, on dit que X et Y sont non corrélées : il n'y a pas d'association linéaire entre
X et Y.
P6. Lorsque r = ± 1, l'une des variables est une fonction affine de l'autre, par exemple Y est une
fonction affine de X c’est à dire. Y = a X + b.
III Ajustement linéaire (ou affine) :
• Lorsque le nuage de points associé à une série double a une forme approximativement
rectiligne, on peut procéder à un ajustement affine en traçant une droite passant le plus près
possible de ces points.
• Dans la pratique, on considère qu'une corrélation est forte lorsque|𝑟| ≥ 0.95. Dans le cas
contraire un ajustement affine n'est pas conseillé.
• Il existe de nombreuses manières pour obtenir une droite d’ajustement (𝐷): 𝑦 = 𝑎𝑥 + 𝑏 :
nous admettrons que les meilleures solutions sont obtenues quand la droite d’ajustement (D)
passe par le point moyen du nuage.
• Ce type d’ajustement permet d’évaluer la valeur du caractère yi pour des valeurs de xi autres
que celles des points du nuage.
• On considère que la variable x est explicative et que la variable y est dépendante (expliquée).
• Le problème consiste à identifier une droite qui ajuste bien le nuage de points. Si les
coefficients a et b étaient connus, on pourrait calculer les résidus 𝑟𝑖 de la régression définis par :
𝑒𝑖 = 𝑦𝑖 − 𝑎𝑥𝑖 − 𝑏
Le résidu est l’erreur que l’on commet en utilisant la droite de régression pour prédire 𝑦𝑖 à
partir de 𝑥𝑖 Les résidus peuvent être positifs ou négatifs.
1 ajustement linéaire par la méthode de Mayer :
Divisons la série en deux groupes
-Si l’effectif total est pair c'est-à-dire égal à 2n, nous pourrons mettre dans le premier groupe la
première moitié de l’effectif et l’autre moitié dans le second groupe.
- Si l’effectif total est impair nous pourrons le diviser en deux parties égales à une unité près.
• Pour chaque groupe on détermine le point moyen. Soit A le point moyen du premier groupe
et B le point moyen du deuxième.
• La droite (D) passant par A et B est la droite d’ajustement. On dit que la série est ajustée
par la droite (D).
• La droite d’ajustement passe par le point moyen G.
2 Ajustement linéaire par la méthode des moindres carrés :
Supposons que les données nous aient conduits à n points: 𝑀1 ; 𝑀2 ; … ; 𝑀𝑛 Soit (D) la droite
d’équation 𝑦 = 𝑎𝑥 + 𝑏 (Nous cherchons à déterminer a et b). Nous pouvons chercher a et b de
façon que la somme les distances des points 𝑀𝑖 à la droite (D) soit la plus petite possible. Soit
𝑃𝑖 le point d’intersection de la droite parallèle à (𝑜𝑦) menée par 𝑀𝑖 avec (D).
- Nous allons chercher (D) de façon que la quantité
𝑆 = 𝑀1 𝑃1 2 + 𝑀2 𝑃2 2 + ⋯ + 𝑀𝑛 𝑃𝑛 2 soit la plus petite possible. (D’où le nom de méthode des
moindres carrés).
- Les distances étant parallèle à (𝑜𝑦) la droite sera dite « droite de régression de y en x » (ou
droite des moindres carrés).
S peut s’écrire alors 𝑆 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑎𝑥𝑖 − 𝑏)2 = ∑𝑛𝑖=1 𝑒𝑖2 (la somme des carrés des résidus)
on obtient un trinôme du second degré du type 𝛼𝑥 2 + 𝛽𝑥 + 𝛾 = 0 en b qui passe par un
minimum. D’où S passe par un minimum 𝑆0 pour 𝑏 = 𝑦̅ − 𝑎𝑥̅ .
- la droite (D) passe par le point 𝐺(𝑥̅ ; 𝑦̅)
On obtient un trinôme du second degré en a avec 𝑆0 qui passe par son minimum pour
𝑐𝑜𝑣(𝑥,𝑦)
𝑎 = 𝑣𝑎𝑟(𝑥) . D’où la droite (D) a pour équation 𝑦 = 𝑎𝑥 + 𝑏
𝑐𝑜𝑣(𝑥,𝑦)
Avec 𝑎 = 𝑒𝑡 𝑏 = 𝑦̅ − 𝑎𝑥̅ .
𝑣𝑎𝑟(𝑥)
- La droite (D) ainsi détermine est appelée droite de régression de y en x. On peut aussi
déterminer la droite de régression de x en y (𝐷′ ) en minimisant la somme des carrés des
distances 𝑀𝑖 𝑄𝑖 comptées parallèlement à (OX)
Soit 𝑥 = 𝛼𝑦 + 𝛽 la droite de régression de x en y cette droite passe par le point moyen G(𝑥̅ ,𝑦̅)
𝑐𝑜𝑣(𝑥,𝑦)
on a 𝛼 = et 𝛽 = 𝑥̅ − 𝛼𝑦̅
𝑣𝑎𝑟(𝑦)
1 𝛽 1 𝑣𝑎𝑟(𝑦)
(𝐷 ) Peut s’écrire aussi 𝑦 = 𝛼 𝑥 − 𝛼 son coefficient directeur est : 𝑎′ = 𝛼 = 𝑐𝑜𝑣(𝑥,𝑦)

Les droites de régressions de y en x et de x en y sont confondus si et seulement si les points 𝑀𝑖


sont alignés.
Pour caractériser l’écart à la dépendance linéaire c'est-à-dire l’écart de (D) et(𝐷′ ), on introduit
la notion de coefficient de corrélation linéaire.
NB :
P1 le coefficient de corrélation linéaire a le même signe que a et 𝛼 de plus
𝑎
𝑟 2 = 𝑎′ = 𝑎𝛼.
P2 Si r est proche de 1 ou -1 alors la somme des résidus
𝑆 = ∑(𝑦𝑖 − 𝑎𝑥𝑖 − 𝑏)2 Est proche de 0. On dit alors que la corrélation entre X et Y est forte.
3 Méthode des points extrêmes (ou droite des extrêmes) :
On détermine la droite (∆) d’équation 𝑦 = 𝑎𝑥 + 𝑏 passant par les oints extrêmes M1 et Mn
Exemple : dans le premier cas
Résidus et valeurs ajustées
Les valeurs ajustées sont obtenues au moyen de la droite d’ajustement.
𝑦𝑖∗ = 𝑎𝑥𝑖 + 𝑏
Les valeurs ajustées sont les prédictions des yi réalisées au moyen de la variable x et de la
droite d’ajustement.
Remarque :
La moyenne des valeurs ajustées est égale à la moyenne des valeurs observées 𝑦̅ .
Les résidus sont les différences entre les valeurs observées et les valeurs ajustées de la variable
dépendante. 𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖∗
Les résidus représentent la partie inexpliquée de 𝑦𝑖 par la droite d’ajustement.
Coefficient de détermination
La variabilité totale des données (correspondant à SCT) se décompose entre la variabilité
expliquée par le modèle de régression (correspondant à SCR) et la variabilité résiduelle ou
terme d'erreur (correspondant à SCE) de la façon suivante : SCT = SCR + SCE avec
𝑆𝐶𝑇 = ∑𝑁 𝑖=1(𝑦𝑖 − 𝑦̅)2 = ∑𝑁 2
𝑖=1 𝑦𝑖 − 𝑁𝑦̅ 2 Somme des carrés totale
𝑆𝐶𝐸 = ∑𝑁 ∗ 2
𝑖=1(𝑦𝑖 − 𝑦𝑖 ) = 𝑆 Somme des carrés d’erreur

𝑆𝐶𝑅 = ∑𝑁 1 (𝑦𝑖 − 𝑦̅)2 Somme des carrés de régression
Donc on a 𝑆𝑇𝐶 = ∑𝑁 𝑖=1(𝑦𝑖 − 𝑦 ̅)2 = ∑𝑁 ∗
1 (𝑦𝑖 − 𝑦 ̅)2 + ∑𝑁 ∗ 2
𝑖=1(𝑦𝑖 − 𝑦𝑖 )
Coefficient de détermination : le coefficient de détermination est le nombre 𝑅 2 défini par :

𝑆𝐶𝑅 ∑𝑁1 (𝑦𝑖 − 𝑦̅)2
𝑅2 = = 𝑁
𝑆𝐶𝑇 ∑𝑖=1(𝑦𝑖 − 𝑦̅)2
Ce coefficient est une mesure de la variabilité expliquée par le modèle de régression lin’eaire.
Il vérifie toujours 0 ≤ 𝑅 2 ≤ 1.
Autrement dit le coefficient de détermination 𝑅 2 représente la fraction de la variance de y «
expliquée » par la corrélation de y avec x.
Par exemple un coefficient de corrélation r = 0,9 correspond à un coefficient de détermination
𝑅 2 = 0,81. Cela signifie que 81% de la variance de y est expliquée par la corrélation : la
corrélation est bonne
Mais un coefficient de corrélation r = 0,5 correspond à un coefficient de détermination 𝑅 2 =
0,25. Cela signifie que seulement 25% de la variance de y est expliquée par la corrélation : la
corrélation est mauvaise
Plus 𝑅 2 est proche de 1, plus le modèle choisi semble pertinent.
NB : remarque très importante le carré du coefficient de corrélation linéaire est egal au
[𝑐𝑜𝑣(𝑥,𝑦)]2
coefficient de détermination. 𝑅 2 = 𝑟 2 = 𝑎𝛼 = 𝑉(𝑥)∗𝑉(𝑦)
Exemple dans le premier cas
1 Calculer la somme des résidus pour la droite de régression de y en x 𝑆1 = ∑(𝑦𝑖 − 𝑎𝑥𝑖 − 𝑏)2
2 Déterminer la droite de régression par la méthode des points extrêmes. Calculer la somme des
résidus pour cette droite. 𝑆2 = ∑(𝑦𝑖 − 𝑎𝑥𝑖 − 𝑏)2
3 En déduire le meilleur ajustement (le meilleur ajustement est celui pour lequel la somme des
résidus est minimale).
4. Calculer le coefficient de détermination
T.D
Exercice :
Les notes sur 20 𝑥𝑖 de mathématiques et 𝑦𝑗 de biologie sont données par le tableau suivant.
𝑥𝑖 [2,6[ [6, 10[ [10, 14[ [14, 18[
𝑦𝑗

[4, 8[ 12 25 10 0
[8, 12[ 8 38 14 1
[12, 16[ 0 6 14 2
1. Déterminer et construire les droites de régressions
2. Déterminer le coefficient de corrélation linéaire.
Exercice :
Le tableau suivant donne l’évolution du nombre de spectateurs y dans les salles de cinéma
dans un pays. Le nombre de spectateurs est exprimé en millions.

Année 1989 1993 1994 1995 1996


Rang 𝑥𝑖 0 4 5 6 7
Nombre de spectateurs 𝑦𝑖 120 133 125 130 137
1. Tracer le nuage de points associé à la série
2. Déterminer le point moyen G du nuage.
3. Donner une équation de la droite de régression ∆ de y en x les coefficients étant arrondis
à 10– 3 près.
4. Si l’évolution constatée s’est poursuivie jusqu’à la fin du XXe siècle, donner une
estimation du nombre de spectateurs dans les salles de cinéma en l’an 2000.
Exercice Considérons un échantillon de 10 fonctionnaires (ayant entre 40 et 50 ans) d’un
ministère. Soit X le nombre d’années de service et Y le nombre de jours d’absence pour raison
de maladie (au cours de l’année précédente) déterminé pour chaque personne appartenant à cet
échantillon.
𝑥𝑖 2 14 16 8 13 20 24 7 5 11
𝑦𝑖 3 13 17 12 10 8 20 7 2 8
1. Représentez le nuage de points.
2. Calculez le coefficient de corrélation entre X et Y.
3. Déterminez l’équation de la droite de régression de Y en fonction de X.
4. Etablissez, sur base de ce modèle, le nombre de jours d’absence pour un fonctionnaire ayant
22 ans de service.
Exercice
Lors d’une période de sécheresse, un agriculteur relève la quantité totale d’eau, exprimée en
m3, utilisée dans son exploitation depuis le premier jour. On obtient les résultats suivants :
Nombre de jours écoulés x et volume utilisé y
𝑥𝑖 1 3 5 8 10
𝑦𝑖 2,25 4,3 8 17,5 27
Le plan est muni d’un repère orthogonal. On prendra pour unités graphiques : sur l’axe des
abscisses 1 cm pour un jour et sur l’axe des ordonnées 0,5 cm pour 1 m3.
1. Représenter graphiquement la série statistique (xi ; yi).
2. L’équation de la droite de régression de y en x (∆) est y = 2,75x – 3,04.
Vérifier que ∆ passe par le point moyen du nuage et tracer ∆.
3. Le nuage de points permet d’envisager un ajustement par la parabole r; passant par les
points A (1 ; 2,25) ; B (10 ; 27) et d’équation 𝑦 = 𝑎𝑥 2 + 𝑏
a. Déterminer les deux réels a et b et donner l’équation de r.
b. Représenter la parabole r sur le graphique.
4. Estimer le volume d’eau utilisé le 12e jour de sécheresse en utilisant l’équation de la droite
∆ puis l’équation de la parabole r. Lequel des deux résultats paraît le plus vraisemblable ?
Pourquoi ?
Exercice
Une machine produit automatiquement des pièces cylindriques. Réglée initialement pour un
diamètre de 8 mm, elle se dérègle en cours d’utilisation. Le but de l’exercice est de déterminer
le nombre de pièces que l’on pourra produire avant que le diamètre n’atteigne 8,1 mm. Afin
de contrôler la fabrication et de procéder aux réglages éventuellement nécessaires, on mesure
le diamètre de la dernière pièce dans chaque série de dix pièces produites. Les résultats
obtenus sont les suivants:
Numéro de la pièce : 𝑥𝑖 10 20 30 40 50 60 70 80 90 100
Diamètre (mm) de la pièce : 8,03 8,00 8,01 8,01 8,02 8,03 8,03 8,04 8,05 8,06
𝑦𝑖
1. Représenter le nuage de points, associé à la série statistique précédente dans le plan muni d’un
repère orthogonal.
On prendra pour origine le point de coordonnées (0 ; 8), pour unité, 1 cm pour dix pièces en
abscisses et 1 cm pour 0,01 mm en ordonnées
2. Calculer les coordonnées du point moyen G du nuage. Placer le point G sur la figure.
3.
a. Calculer les coordonnées du point moyen G1 associé aux points du nuage ayant les cinq plus
petites abscisses et les coordonnées du point moyen G2 associé aux cinq autres points du nuage.
b. On prend la droite (G1G2) comme droite d’ajustement. La tracer.
c. Déterminer une équation de (G1G2).
4. Les pièces produites doivent avoir un diamètre de 8 mm, avec une tolérance de 0,1
mm. Déterminer le nombre de pièces que l’on pourra produire avant que le diamètre
n’atteigne 8,1 mm.

Vous aimerez peut-être aussi