Académique Documents
Professionnel Documents
Culture Documents
I Introduction :
Souvent, nous serons amenés à observer et à étudier en même temps deux caractères des
éléments d’une série statistique et nous demander si ces caractères sont liés et comment ils le
sont.
Notion : on dit qu'il y a corrélation entre deux variables lorsqu'elles ont tendance à varier soit
toujours dans le même sens (par exemple, si X augmente, Y a tendance à augmenter aussi), soit
toujours en sens inverse (par exemple, si X augmente, Y a tendance à diminuer).
Questions mathématiques :
Peut-on quantifier cette liaison ?
Peut-on tester si cette liaison est statistiquement significative ?
Peut-on utiliser cette liaison à des fins prédictives ?
Par exemples le poids et la taille des élèves d’une classe, la durée moyenne de vie et le revenu
moyen.
➢ Soient 𝑥𝑖 et𝑦𝑖 les valeurs associées aux deux caractères 𝑥 et 𝑦
➢ Nous avons deux façons de présenter le tableau statistique :
- Premier cas :
Exemple : Soit la série statistique suivante
𝑥𝑖 35 45 55 65 75
𝑦𝑖 114 124 143 158 166
- Deuxième cas :
Posons 𝑥 = {𝑥1 ; 𝑥2 ; . . . ; 𝑥𝑝 }et 𝑦 = {𝑦1 ; 𝑦2 ; . . . ; 𝑦𝑞 } à chaque couple (𝑥𝑖 , 𝑦𝑖 ) de l’ensemble
𝑥 × 𝑦 on associe le nombre 𝑛𝑖𝑗 d’éléments présentant les caractères 𝑥𝑖 et 𝑦𝑗 . On obtient un
tableau de q colonnes et p lignes
Exemple : le poi46+ds et la taille de 10 élèves en kg et cm.
Poids 𝑦𝑗 62 65 68 71 74 Total
Tail6le 𝑥𝑖
165 4 15 10 7 0 36
168 7 0 1 20 6 34
171 0 5 2 1 8 16
174 12 1 0 0 1 14
Total 23 21 13 28 15 100
On définit ainsi une série statistique à deux (ou double) entrées de p colonnes et de q lignes.
𝑛𝑖∎ = ∑𝑞𝑗=1 𝑛𝑖𝑗 : est appelé effectif marginal de la valeur 𝑥𝑖 et
𝑛∎𝑗 = ∑𝑝𝑖=1 𝑛𝑖𝑗 : est appelé effectif marginal de la valeur 𝑦𝑗
L’effectif total 𝑁 = ∑𝑝𝑖=1 ∑𝑞𝑗=1 𝑛𝑖𝑗 = ∑𝑝𝑖=1 𝑛𝑖∎ = ∑𝑞𝑗=1 𝑛∎𝑗
II Caractéristiques :
A- moyennes arithmétiques :
La moyenne arithmétique de x est :
1
𝑥̅ = 𝑁 ∑ 𝑥𝑖 dans le premier cas
1
𝑥̅ = 𝑁 ∑𝑝1=𝑖 𝑛𝑖. 𝑥𝑖 dans le deuxième cas
1 1
De même pour la variable y on a 𝑦̅ = 𝑁 ∑ 𝑦𝑖 𝑜𝑢 𝑦̅ = 𝑁 ∑𝑞𝑗=1 𝑛.𝑗 𝑦𝑗
B- variances :
On appelle variance la moyenne des carrés des écarts à la moyenne
La variance de 𝑥 est mottée : 𝑉(𝑥) ou 𝜎𝑥2
1
𝑉(𝑥) = 𝑁 ∑ 𝑥𝑖2 − 𝑥̅ 2 Où
1 1
V(𝑥) = 𝜎𝑥2 = 𝑁 ∑𝑝𝑖=1 𝑛𝑖. (𝑥𝑖 − 𝑥̅ )2 = 𝑁 ∑𝑝𝑖=1 𝑛𝑖. 𝑥𝑖 2 − 𝑥̅ 2
La variance de 𝑦 est :
1
𝑉(𝑦) = 𝑁 ∑ 𝑦𝑖2 − 𝑦̅ 2 Où
1 2 1
𝑉(𝑦) = 𝜎𝑦2 = 𝑁 ∑𝑞𝑗=1 𝑛.𝑗 (𝑦𝑗 − 𝑦̅) = 𝑁 ∑𝑞𝑗=1 𝑛.𝑗 𝑦𝑗 2 − 𝑦̅ 2
C- Ecarts types 𝜎𝑥 = √𝑉(𝑥) et 𝜎𝑦 = √𝑉(𝑦)
D- La covariance :
On appelle covariance de (𝑥, 𝑦) le nombre réel noté 𝑐𝑜𝑣(𝑥, 𝑦) et elle reflète le degré auquel 2
variables varient ensemble et défini par :
1
𝑐𝑜𝑣(𝑥, 𝑦) = 𝑁 ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅ où
1 1
𝑐𝑜𝑣(𝑥, 𝑦) = ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̅ )(𝑦𝑗 − 𝑦̅) = ∑ 𝑛𝑖𝑗 𝑥𝑖 𝑦𝑗 − 𝑥̅ 𝑦̅
𝑁 𝑁
Cette formule consiste essentiellement à faire le produit des écarts à la moyenne de chacune des
variables. Dès lors, lorsque les écarts sont exactement les mêmes on aura la valeur la plus haute.
Plus la covariance est élevée, plus les variables réagiront de la même manière. S’il n’y a pas de
relation entre X et Y, une valeur positive de (X- 𝑋̅) sera parfois associée à une valeur positive
et parfois à une valeur négative de (Y −𝑌̅). Les produits des écarts seront donc parfois positifs
et parfois négatifs, ce qui donne une somme proche de 0.
La covariance a comme désavantage de ne pas être étalonnée. On peut se dire que plus elle est
grande en valeur absolue plus les variables sont associées mais on ne sait pas jusqu’à quelle
valeur elle peut monter.
E- Nuage de points (ou diagramme de dispersion) :
Chaque sujet inclus dans l’étude est représenté par un point 𝑀𝑖 (𝑥𝑖 , 𝑦𝑗 ) dans un espace
bidimensionnel. Les coordonnées de ce point (𝑥𝑖 𝑒𝑡 𝑦𝑗 ) sont les valeurs obtenues par l’individu
pour les variables X et Y respectivement. Généralement la variable indépendante (qui sert de
prédicteur ) est représentée en abscisse et la variable dépendante (critère) est représentée en
ordonnée. Par ex, incidence du cancer en fonction du nombre d’heures d’exposition au soleil :
incidence du cancer (= var dépendante) se situe en ordonnée et le nombre d’heures au soleil (=
var indépendante) en abscisse.
Le plan est muni d’un repère orthogonal. Construisons les points 𝑀(𝑥𝑖 , 𝑦𝑗 ) l’ensemble des
points ainsi obtenu est appelé nuage de points de la série.
Dans le deuxième cas à chaque modalité (𝑥𝑖 , 𝑦𝑗 ) est représenté par un disque dont la taille est
proportionnelle à l’effectif de(𝑥𝑖 , 𝑦𝑗 ). Les points d’effectif nuls ne sont pas représentés.
F- Point moyen :
On appelle point moyen de la série le point G de coordonnées les moyennes arithmétiques 𝑥̅ et𝑦̅.
𝐺(𝑥̅ , 𝑦̅)
G- Coefficients de corrélation linéaire (ou Coefficient de corrélation de Pearson) ::
La corrélation est une mesure statistique utilisée pour mesurer le degré de liaison entre 2
variables (taille et poids ; résultats à l’examen de français et nombre de livres lus/mois ; niveau
en compréhension d’anglais parlé et appréciation de la langue anglaise…). Dans les problèmes
de corrélation simple (par rapport aux corrélations multiples ou partielles), les données se
composent de 2 observations pour chacun des N sujets, une observation par variable considérée.
Le coefficient de corrélation linéaire la quantité
𝑐𝑜𝑣(𝑥, 𝑦)
𝑟=
𝜎𝑥 𝜎𝑦
Le coefficient de corrélation linéaire r mesure le dégrée d'association linéaire entre X et Y
Propriétés
P1. Le coefficient de corrélation est un nombre compris entre 1 et -1. On a −1 ≤ 𝑟 ≤ 1
P2. Le nombre r sert à quantifier l'intensité et le sens de la dépendance linéaire entre X et Y.
P3. Lorsque r > 0, cela signifie que lorsqu'une des variables a tendance à augmenter, l'autre
aussi.
P4. Lorsque r < 0, cela signifie que lorsqu'une des variables a tendance à augmenter, l'autre a
tendance à diminuer.
P5. Lorsque r = 0, on dit que X et Y sont non corrélées : il n'y a pas d'association linéaire entre
X et Y.
P6. Lorsque r = ± 1, l'une des variables est une fonction affine de l'autre, par exemple Y est une
fonction affine de X c’est à dire. Y = a X + b.
III Ajustement linéaire (ou affine) :
• Lorsque le nuage de points associé à une série double a une forme approximativement
rectiligne, on peut procéder à un ajustement affine en traçant une droite passant le plus près
possible de ces points.
• Dans la pratique, on considère qu'une corrélation est forte lorsque|𝑟| ≥ 0.95. Dans le cas
contraire un ajustement affine n'est pas conseillé.
• Il existe de nombreuses manières pour obtenir une droite d’ajustement (𝐷): 𝑦 = 𝑎𝑥 + 𝑏 :
nous admettrons que les meilleures solutions sont obtenues quand la droite d’ajustement (D)
passe par le point moyen du nuage.
• Ce type d’ajustement permet d’évaluer la valeur du caractère yi pour des valeurs de xi autres
que celles des points du nuage.
• On considère que la variable x est explicative et que la variable y est dépendante (expliquée).
• Le problème consiste à identifier une droite qui ajuste bien le nuage de points. Si les
coefficients a et b étaient connus, on pourrait calculer les résidus 𝑟𝑖 de la régression définis par :
𝑒𝑖 = 𝑦𝑖 − 𝑎𝑥𝑖 − 𝑏
Le résidu est l’erreur que l’on commet en utilisant la droite de régression pour prédire 𝑦𝑖 à
partir de 𝑥𝑖 Les résidus peuvent être positifs ou négatifs.
1 ajustement linéaire par la méthode de Mayer :
Divisons la série en deux groupes
-Si l’effectif total est pair c'est-à-dire égal à 2n, nous pourrons mettre dans le premier groupe la
première moitié de l’effectif et l’autre moitié dans le second groupe.
- Si l’effectif total est impair nous pourrons le diviser en deux parties égales à une unité près.
• Pour chaque groupe on détermine le point moyen. Soit A le point moyen du premier groupe
et B le point moyen du deuxième.
• La droite (D) passant par A et B est la droite d’ajustement. On dit que la série est ajustée
par la droite (D).
• La droite d’ajustement passe par le point moyen G.
2 Ajustement linéaire par la méthode des moindres carrés :
Supposons que les données nous aient conduits à n points: 𝑀1 ; 𝑀2 ; … ; 𝑀𝑛 Soit (D) la droite
d’équation 𝑦 = 𝑎𝑥 + 𝑏 (Nous cherchons à déterminer a et b). Nous pouvons chercher a et b de
façon que la somme les distances des points 𝑀𝑖 à la droite (D) soit la plus petite possible. Soit
𝑃𝑖 le point d’intersection de la droite parallèle à (𝑜𝑦) menée par 𝑀𝑖 avec (D).
- Nous allons chercher (D) de façon que la quantité
𝑆 = 𝑀1 𝑃1 2 + 𝑀2 𝑃2 2 + ⋯ + 𝑀𝑛 𝑃𝑛 2 soit la plus petite possible. (D’où le nom de méthode des
moindres carrés).
- Les distances étant parallèle à (𝑜𝑦) la droite sera dite « droite de régression de y en x » (ou
droite des moindres carrés).
S peut s’écrire alors 𝑆 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑎𝑥𝑖 − 𝑏)2 = ∑𝑛𝑖=1 𝑒𝑖2 (la somme des carrés des résidus)
on obtient un trinôme du second degré du type 𝛼𝑥 2 + 𝛽𝑥 + 𝛾 = 0 en b qui passe par un
minimum. D’où S passe par un minimum 𝑆0 pour 𝑏 = 𝑦̅ − 𝑎𝑥̅ .
- la droite (D) passe par le point 𝐺(𝑥̅ ; 𝑦̅)
On obtient un trinôme du second degré en a avec 𝑆0 qui passe par son minimum pour
𝑐𝑜𝑣(𝑥,𝑦)
𝑎 = 𝑣𝑎𝑟(𝑥) . D’où la droite (D) a pour équation 𝑦 = 𝑎𝑥 + 𝑏
𝑐𝑜𝑣(𝑥,𝑦)
Avec 𝑎 = 𝑒𝑡 𝑏 = 𝑦̅ − 𝑎𝑥̅ .
𝑣𝑎𝑟(𝑥)
- La droite (D) ainsi détermine est appelée droite de régression de y en x. On peut aussi
déterminer la droite de régression de x en y (𝐷′ ) en minimisant la somme des carrés des
distances 𝑀𝑖 𝑄𝑖 comptées parallèlement à (OX)
Soit 𝑥 = 𝛼𝑦 + 𝛽 la droite de régression de x en y cette droite passe par le point moyen G(𝑥̅ ,𝑦̅)
𝑐𝑜𝑣(𝑥,𝑦)
on a 𝛼 = et 𝛽 = 𝑥̅ − 𝛼𝑦̅
𝑣𝑎𝑟(𝑦)
1 𝛽 1 𝑣𝑎𝑟(𝑦)
(𝐷 ) Peut s’écrire aussi 𝑦 = 𝛼 𝑥 − 𝛼 son coefficient directeur est : 𝑎′ = 𝛼 = 𝑐𝑜𝑣(𝑥,𝑦)
′
[4, 8[ 12 25 10 0
[8, 12[ 8 38 14 1
[12, 16[ 0 6 14 2
1. Déterminer et construire les droites de régressions
2. Déterminer le coefficient de corrélation linéaire.
Exercice :
Le tableau suivant donne l’évolution du nombre de spectateurs y dans les salles de cinéma
dans un pays. Le nombre de spectateurs est exprimé en millions.