Académique Documents
Professionnel Documents
Culture Documents
Statistiques descriptives
Master spécialisé
Ingénierie de formation et digital Learning
6. Conclusion
1
Année universitaire 2023/2024
II Statistique descriptive bivariée
etc.
ses cheveux.
en pratique.
4. Covariances entre deux variables
• Théorème de Huyghens-König :
4. Covariances entre deux variables
4.2.2. Cas de données groupées dans un tableau de contingence
• Mais elle peut être faible parce que le lien entre les
variables est non-linéaire. Il peut alors être très fort,
et pourtant conduire à une faible valeur de la
Covariance.
4. Covariances entre deux variables
[-1, +1].
Y = X ².
5. Ajustement affine
5.1. Principe
Soit (xi , yi ) une série statistique double, avec un nuage de points Mi (xi , yi )
associé.
Lorsque les points du nuage paraissent presque alignés, on peut chercher une
relation de la forme y = ax + b qui exprime de façon approchée les valeurs de
la série ( yi ) en fonction des valeurs de la série (xi ) , autrement dit, une
fonction affine f telle que l’égalité y = f(x) s’ajuste au mieux avec les données.
Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près
de tous les points du nuage. Une telle relation permettrait notamment de faire
des prévisions. Il existe de nombreuses manières d’obtenir un ajustement
affine satisfaisant.
5. Ajustement affine
5.2. Méthodes
A vous de tracer une droite qui passe le plus près possible de tous les points du
nuage, si possible en la faisant passer par le point moyen du nuage. C’est peu
Cette méthode n’est cependant pas très satisfaisante car elle ne tient compte que
des deux points extrêmes. Une meilleure méthode est celle dite des « moindres
carrés ordinaires » ou MCO en abrégé.
5. Ajustement affine
dans un cours de statistique descriptive, car l'essentiel est de savoir calculer les
coordonnées de la droite.
Définition 2 :
On appelle méthode des moindres carrés la méthode qui consiste à rechercher
les coefficients a et b tels que la somme S soit minimale. Remarquons que S est
une fonction des deux variables a et b.
5. Ajustement affine
avec :
5. Ajustement affine
Remarques :
coordonnées ( x ; y ).
• a = 0 pas de corrélation
5. Ajustement affine
Supposons que l'unité utilisée pour mesurer X soit divisée par 2 (et donc que les
valeurs de X soient multipliées par 2).
Alors la covariance Cov(X, Y) est également multipliée par 2.
5. Ajustement affine
2, et donc le rapport :
reste inchangé.
• Si les variables sont toutes deux de variance unité, leur Covariance et leur
5. Ajustement affine
5.2.8. Interprétation du Coefficient de Corrélation
Mais il est possible qu'un lien fort, mais non linéaire entre X et Y conduise à une
valeur faible du Coefficient de Corrélation, comme le montre l'image ci-dessous.
Deux variables dont le Coefficient de Corrélation a une valeur proche de 0 sont dites
non corrélées.
• Mais deux variables non corrélées peuvent ne pas du tout être indépendantes (voir
l'exemple ci-dessus, la relation est forte et r = 0,3). Ce n'est que dans le cas où les
Donc, dans le cas général, la notion d'indépendance est beaucoup plus forte que celle
5. Ajustement affine
5.3. Coefficient de corrélation et Régression Linéaire
de Corrélation.
• D'une variable Y,
de Corrélation Multiple
6. Conclusion