Académique Documents
Professionnel Documents
Culture Documents
Objectifs :
I- CORRELATION LINEAIRE
B- Covariance
1. Objet et définition
L'objectif de la covariance est de quantifier la liaison entre deux variables 𝑋 et 𝑌, de manière à
mettre en évidence le sens de la liaison et son intensité. La covariance de 𝑋 et 𝑌 est définie par :
𝟏
𝑪𝒐𝒗(𝑿, 𝒀) = 𝑵 ∑𝒊 ∑𝒋 𝒏𝒊𝒋 [𝒙𝒊 − 𝑿][𝒚𝒋 − 𝒀], ou encore :
2. Propriétés
𝐶𝑜𝑣(𝑋, 𝑌) > 0 : lorsque 𝑋 est plus grand que son espérance, 𝑌 a tendance à l'être
également.
𝐶𝑜𝑣(𝑋, 𝑌) < 0 : lorsque X est plus grand que son espérance, Y a tendance à être plus
petit que sa propre espérance.
𝐶𝑜𝑣(𝑋, 𝑎) = 0.
1. Définition
Ce coefficient de corrélation constitue une mesure de l'intensité de liaison linéaire entre
variables. Il est défini par :
𝐶𝑜𝑣(𝑋, 𝑌)
𝑟 =
𝜎 .𝜎
2. Propriétés
𝑟 est du même signe que 𝐶𝑜𝑣 (𝑋, 𝑌 ).
Le modèle considéré permet est une relation dans laquelle une seule variable, appelée variable
exogène ou explicative, permet d’expliquer une autre variable, la variable endogène ou variable
à expliquer.
𝒚𝒕 = 𝒂𝟎 + 𝒂𝟏 𝒙𝒕 + 𝜺𝒕 , 𝑝𝑜𝑢𝑟 𝑡 = 1, 2, … , 𝑛.
𝒚𝒊 = 𝒂𝟎 + 𝒂𝟏 𝒙𝒊 + 𝜺𝒊 , 𝑝𝑜𝑢𝑟 𝑖 = 1, 2, … , 𝑛.
Dans la dernière spécification, les données sont observées au même instant et concernent les
valeurs prises par la variable pour un groupe d’individus spécifique.
Pour obtenir les estimateurs sans biais et convergents des paramètres du modèle, la méthode
utilisée lorsque certaines hypothèses sont vérifiées est celle des moindres carrés ordinaires
(MCO). Ces hypothèses sont les suivantes.
1. Hypothèses du modèle
∑( ̅ )( ) ∑ ̅
𝑎 = ∑( ̅)
= ∑ ̅
et 𝑎 = 𝑦 − 𝑎 𝑥̅ .
𝑦 = 𝑎 + 𝑎 𝑥 + 𝑒 , 𝑎𝑣𝑒𝑐 𝑒 = 𝑦 − 𝑦
2. Coefficient de détermination
𝑺𝑪𝑬 𝑺𝑪𝑹
𝒓𝟐 = 𝑺𝑪𝑻 = 𝟏 − 𝑺𝑪𝑻.
Remarque :𝑟 = ±√𝑟 est le coefficient de corrélation linéaire simple entre les deux variable en
présence ; il est du signe de 𝑎 , et l’ajustement considéré est d’autant meilleur que sa valeur
absolue est voisine de 1.
𝑆𝐶𝐸/1
𝐹 =
𝑆𝐶𝑅/(𝑛 − 2)
Modèle considéré :
𝒚𝒕 = 𝒂𝟎 + 𝒂𝟏 𝒙𝒕 + 𝜺𝒕 , 𝑝𝑜𝑢𝑟 𝑡 = 1, 2, … , 𝑛.
Prévision ponctuelle : 𝒚𝜽 = 𝒂𝟎 + 𝒂𝟏 𝒙𝜽
1 (𝑥 − 𝑥̅ )
𝜎 =𝜎 1+ +
𝑛 ∑(𝑥 − 𝑥̅ )
Exercice 1
On fait une étude statistique sur dix sites de commerce électronique, dans le but de sonder sur
une semaine le nombre de visiteurs et le nombre de commandes. On obtient le tableau suivant :
Site (𝑖) 1 2 3 4 5 6 7 8 9 10
Nombre de 80 100 115 110 70 125 105 93 110 95
connexions
(𝑥 )
Nombre de 32 50 62 56 8 80 62 53 62 38
commandes
(𝑦 )
1- Calculer le coefficient de corrélation linéaire entre les deux variables.
2- Tester la significativité de ce coefficient.
3- Spécifier le modèle linéaire de régression simple dans lequel le nombre de connexions
permettrait d’expliquer le nombre de commandes.
Exercice 2
L’entreprise OMEGA a relevé l’évolution de son chiffre d’affaires et de son effectif (salariés),
et a ainsi dressé le tableau suivant :
Exercice 3
On a relevé chaque année, pendant 7 ans, les frais d’assurance maladie dépensés par une
entreprise, ainsi que l’effectif des employés de cette entreprise. Les responsables de cette
entreprise pensent que les frais d’assurance maladie s’expliquent par l’effectif du personnel, et
estiment pouvoir justifier cela par une droite de régression où la variable endogène y représente
les frais annuels d’assurance maladie tandis que la variable exogène x est l’effectif du personnel
de chaque année.
On donne les informations suivantes (y est exprimé en millions d’unités monétaires):
∑ 𝑥 𝑦 = 184500 ; ∑ 𝑦 = 26350 ; ∑ 𝑥 = 1400000 ; 𝑌 = 60 ; 𝑋 = 400 ; 𝑛 = 7
1- Ecrire le modèle linéaire correspondant.
2- Estimer les coefficients du modèle.
3- Calculer le coefficient de corrélation linéaire entre le deux variables.