Académique Documents
Professionnel Documents
Culture Documents
Partie 3
1 Données et objectif
5 Analyse de la variance de Y
6 Coefficient de détermination R 2
1 Données et objectif
5 Analyse de la variance de Y
6 Coefficient de détermination R 2
Données
X : Variable quantitative d’observations : x1 , ..., xn
Y : Variable quantitative d’observations : y1 , ..., yn
Objectif
Expliquer Y en fonction de X .
Établir un indicateur de liaison entre X et Y
1 Données et objectif
5 Analyse de la variance de Y
6 Coefficient de détermination R 2
1 Données et objectif
5 Analyse de la variance de Y
6 Coefficient de détermination R 2
Cov(X , Y )
â =
Var(X )
b̂ = ȳ − âx̄
où
n
1X
Cov(X , Y ) = (xi − x̄)(yi − ȳ )
n i=1
n
1X
= xi yi − x̄ ȳ
n i=1
22.31 69.05
X Y XY X2 Y2 x̄ = ≈ 0.93 et ȳ = ≈ 2.88
1992 0.54 2.15 1.16 0.29 4.62 24 24
1993 0.56 2.23 1.25 0.31 4.97 n
1
1994 0.60 2.30 1.38 0.36 5.29
X
1995 0.59 2.34 1.38 0.35 5.48 Cov(X , Y ) = xi yi − x̄ ȳ
n
1996 0.66 2.39 1.58 0.44 5.71 i=1
1997 0.68 2.42 1.65 0.46 5.86
1998 0.64 2.45 1.57 0.41 6.00 67.15
= − 0.93 ∗ 2.88 ≈ 0.12
1999 0.69 2.50 1.72 0.48 6.25 24
2000 0.85 2.56 2.18 0.72 6.55 n
2001 0.80 2.63 2.10 0.64 6.92 1
X
2 2
2002 0.77 2.73 2.10 0.59 7.45 Var(X ) = xi − x̄
n
2003 0.80 2.84 2.27 0.64 8.07
i=1
2004 0.89 2.95 2.63 0.79 8.70
2005 1.03 3.00 3.09 1.06 9.00 22.63 2
= − 0.93 ≈ 0.08
2006 1.08 3.07 3.32 1.17 9.42 24
2007 1.10 3.18 3.50 1.21 10.11
Cov(X , Y )
2008 1.28 3.32 4.25 1.64 11.02 â =
2009 1.01 3.35 3.38 1.02 11.22 Var(X )
2010 1.16 3.35 3.89 1.35 11.22 0.12
2011 1.34 3.42 4.58 1.80 11.70 = = 1.5
2012 1.41 3.46 4.88 1.99 11.97 0.08
2013 1.36 3.47 4.72 1.85 12.04 b̂ = ȳ − âx̄
2014 1.30 3.48 4.52 1.69 12.11
= 2.88 − 1.5 × 0.93 = 1.485
2015 1.17 3.46 4.05 1.37 11.97
Total 22.31 69.05 67.15 22.63 203.65
Alors : ŷ = 1.5x + 1.485
1 Données et objectif
5 Analyse de la variance de Y
6 Coefficient de détermination R 2
Cov(X , Y )
r=
σX σY
Interprétation
r > 0 : Les deux variables ont tendance à varier dans le même sens
r < 0 : Les deux variables ont tendance à varier en sens opposé
r = 0 : Il n’y a pas de relation linéaire entre X et Y
plus |r | est proche de 1, plus la liaison linéaire est forte
plus |r | est proche de 0, plus la liaison linéaire est faible
|r | = 1 correspond à une liaison linéaire parfaite entre X et Y
K. EL WALED Deux variables quantitatives 16 / 22
Coefficient de corrélation linéaire - Propriétés
1 Données et objectif
5 Analyse de la variance de Y
6 Coefficient de détermination R 2
1 Données et objectif
5 Analyse de la variance de Y
6 Coefficient de détermination R 2
Interprétation
0 ≤ R2 ≤ 1
Plus R 2 tend vers 1, plus le nuage de points se rapproche de la droite
de régression
Au contraire, plus R 2 se rapproche de 0, plus le nuage de points est
diffus autour de la droite de régression.
R 2 = 1 : Le modèle est capable de déterminer 100% de la distribution
de points
K. EL WALED Deux variables quantitatives 21 / 22
Exemple