Académique Documents
Professionnel Documents
Culture Documents
Dumoulin
C’est la mise en évidence d’un lien, d’une liaison entre 2 ou plusieurs variables.
On utilise une droite de régression y = ax+b pour mettre en évidence une corrélation.
On va faire uniquement pour 2 variables. C’est une corrélation simple ou linéaire : lien entre
2 variables
Lorsqu’il y a plusieurs variables c’est une corrélation
multiple ou Analyse en composante principale.
La forme de la corrélation
Liaison linéaire y = ax+b : régularité, constance
Liaison exponentielle y = b eax y= eax+b : accélération
Liaison puissance x = ßxa : stagnation
L'importance de la corrélation
Elle va être défini par le coefficient linéaire r, permet
de résumer l’importance de leur corrélation. Si on a
un coefficient proche de r, à 1 c’est une corrélation
forte positive. Si on a un coefficient à -1 on a une corrélation forte négative. Si on est proche
de 0, on a une corrélation faible. A partir de 0,7 ou -0,7 : corrélation forte
n Σ xy− ( Σ x ) (Σ y )
R=
√ n ( Σ x )−( Σ x ) √ n ( Σ y ) −(Σ y)
2 2 2 2
Exemple :
Est-ce qu’il existe une corrélation entre la valeur de l’arbre et son âge ?
Age x Valeur y xy x2 y2
46 1778 81788 2116
36 2004 72144 1296
16 694 11104 256
43 2144 92192 1849
63 2094 131922 3969
51 2008 102408 2601
39 2264 88296 1521
59 2562 151158 3481
Analyse de données Mme. Dumoulin
10∗817802−422∗17811
R=
√10 ( 19554 )−( 422 ) √ 10 ( 35821837 )−( 17811)
2 2
= 0,266
donc corrélation linéaire positive faible donc pente faible
n ( ∑ xy ) −( ∑ x )( ∑ y )
a= 2
n ( ∑ x ² ) −( ∑ x )
b = y−a x
Se=
√ ∑ ( y− ^y )2
n−2
Aucun intérêt pour le calcul
Se=
√ ∑ y ²−b ∑ y−a ∑ xy
n−2
√
1 n ( x 0−x ) ²
E=t α × Se × 1+ +
n n ( ∑ x ² ) −( ∑ x ) 2
x 0 : Valeur étudiée
x : Moyenne de l’échantillon
La corrélation multiple :
ACP : Analyse en Composante Principale
AFC : Analyse Factorielle des Correspondances