Vous êtes sur la page 1sur 5

Chapitre 3 : Régressions linéaires

La régression linéaire est une technique d'analyse statistique des données. Cette technique est utilisée
pour déterminer dans quelle mesure il existe une relation linéaire entre une variable d’intérêt et une
ou plusieurs variables explicatives. Par exemple, dans notre fichier Affiliates, le Revenu Total est une
variable d’intérêt naturelle puisque nous pouvons penser que c’est ce qui intéresse la direction de
l’entreprise. Les dépenses de publicité par canal (PPCC, PPCR, etc.) sont des variables explicatives
potentielles. Pour étudier l’impact des variables explicatives sur la variable d’intérêt, les statisticiens
inventent des modèles. L’objectif de ce chapitre est d’apprendre à évaluer de tels impacts en calculant
des paramètres. L’objectif de ce chapitre n’est pas d’apprendre à construire des modèles. Les étudiants
apprendront à construire leurs propres modèles avec un peu de pratique.

1. Estimation des paramètres

Supposons que le Revenu Total soit lié aux dépenses de publicité (PPCC, PPCR, AffC et AffR) par la
relation (1) ci-dessous :

𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙 = 𝑎 0 + 𝑎1 𝑃𝑃𝐶𝐶 + 𝑎 2 𝑃𝑃𝐶𝑅 + 𝑎 3 𝐴𝑓𝑓𝐶 + 𝑎 4 𝐴𝑓𝑓𝑅 (1)

La relation (1) est appelée un modèle en économie ou un modèle de régression linéaire en statistique.

Dans TOUS les modèles,

• la variable qui est à gauche de l’équation est appelée variable à expliquer ou variable
endogène. On la note par la lettre y.
• les variables qui sont à droite de l’équation sont appelées des variables explicatives ou des
variables exogènes.
• les coefficients 𝑎 0 ,𝑎1 , 𝑎 2 , 𝑎 3 ,𝑎 4 sont des nombres inconnus dont on cherche à calculer les
valeurs numériques. Ces nombres sont appelés des coefficients ou des paramètres.

Remarque :

Le paramètre 𝑎 0 est appelé la constante (constant or intercept en anglais) parce que le modèle (1)
peut s’écrire :

𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙 = 𝑎 0 × 𝟏 + 𝑎1 𝑃𝑃𝐶𝐶 + 𝑎 2 𝑃𝑃𝐶𝑅 + 𝑎 3 𝐴𝑓𝑓𝐶 + 𝑎 4𝐴𝑓𝑓𝑅


Les autres paramètres 𝑎1 , 𝑎 2 ,𝑎 3 et 𝑎 4 sont appelés des pentes (slopes en anglais).

Dans le modèle (1) ci-dessus,

• la variable endogène est le Revenu Total,


• les variables exogènes sont PPCC, PPCR, AffC et AffR et
• les paramètres sont 𝑎 0 , 𝑎1 , 𝑎 2 ,𝑎 3 et 𝑎 4 .

1
Voici quelques exemples supplémentaires de modèles :

Modèle 2

ln(𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙) = 𝑎 0 + 𝑎1 ln(𝑃𝑃𝐶𝐶 ) + 𝑎 2 ln(𝑃𝑃𝐶𝑅 ) + 𝑎 3 ln(𝐴𝑓𝑓𝐶 ) (2)

Ici,

• la variable endogène est le ln(𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙),


• les variables exogènes sont ln (𝑃𝑃𝐶𝐶 ) , ln(𝑃𝑃𝐶𝑅 ) et ln (𝐴𝑓𝑓𝐶) et
• les paramètres sont 𝑎 0 , 𝑎1 , 𝑎 2 , et 𝑎 3.

Modèle 3

√𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙 = 𝑎 0 + 𝑎1 ln(𝑃𝑃𝐶𝐶 ) + 𝑎 2 √𝐴𝑓𝑓𝐶 (3)

Ici,

• la variable endogène est le √𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙,


• les variables exogènes sont ln (𝑃𝑃𝐶𝐶 ) et √𝐴𝑓𝑓𝐶 et
• les paramètres sont 𝑎 0 , 𝑎1 et, 𝑎 2 .

Modèle 4
1
= 𝑎 0 + 𝑎1 𝑃𝑃𝐶𝐶 + 𝑎 2 𝑙𝑛√𝑃𝑃𝐶𝑅 + 𝑎 3 √𝐴𝑓𝑓𝐶 (4)
√(𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙)

Ici,
1
• la variable endogène est le ,
√𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙
• les variables exogènes sont 𝑃𝑃𝐶𝐶, 𝑙𝑛√𝑃𝑃𝐶𝐶𝑅 et √𝐴𝑓𝑓𝐶 et
• les paramètres sont 𝑎 0 , 𝑎1 , 𝑎 2 et, 𝑎 3 .

Afin de calculer les paramètres d’un modèle, on dit aussi estimer les paramètres d’un modèle ou
encore estimer le modèle, nous devons respecter les trois étapes suivantes.

Etape 1 : Il faut transformer les données originales conformément à la nature du modèle pour obtenir
une colonne que nous appellerons y et un tableau que nous appellerons la matrice X.

2
Etape 2 : Il faut écrire les paramètres sur une seule colonne que nous appellerons b.

La feuille intitulée « Modèles » du fichier Excel intitulé « chapitre 3.xlsx » vous guidera pas à pas pour
réaliser les deux premières étapes.

Etape 3 : Il suffit d’appliquer dans tous les cas, c’est-à-dire quel que soit le modèle, la formule suivante :

𝑏 = (𝑋′𝑋) −1 𝑋′𝑦

Cette formule est très simple à appliquer. Si vous avez examiné la feuille « Modèles », alors vous savez
construire y et X. Donc, il suffit de décomposer cette formule par petits bouts afin de trouver les
paramètres b. Pour ce faire, il suffit de suivre les étapes suivantes :

Etape 1 : Calculer 𝑋′ par la fonction TRANSPOSE (TRANSPOSE en anglais).

Etape 2 : Calculer (𝑋′𝑋) par la fonction PRODUITMAT (MMULT en anglais).

Etape 3 : Calculer (𝑋′𝑋) −1 par la fonction INVERSEMAT (MINVERSE en anglais).

Etape 4 : Calculer 𝑋′𝑦 par la fonction PRODUITMAT (MMULT en anglais).

Etape 5 : Calculer [(𝑋′𝑋)−1 ] [𝑋′𝑦] par la fonction PRODUITMAT (MMULT en anglais).

Les feuilles « Estimation 1» à « Estimation 4 » vous guideront pour réaliser l’estimation de ces
modèles.

2. Interprétation des paramètres.


Les paramètres n’ont pas toujours une interprétation évidente, mais il existe une classe de modèles
dont les paramètres peuvent être interprétés aisément. C’est le cas des modèles dits logarithmiques
comme le modèle (2) décrit plus haut. Un modèle est logarithmique lorsque nous prenons les
logarithmes des variables à gauche et à droite de l’équation. Dans de tels cas, les paramètres sont ce
qu’on appelle en économie des élasticités. Ainsi, dans le modèle (2) le paramètre

𝑎1 représente l’élasticité de PPCC par rapport au TotRev.

𝑎 2 représente l’élasticité de PPCR par rapport au TotRev.

𝑎 3 représente l’élasticité de AffC par rapport au TotRev.

Nous avons calculé ces paramètres dans la feuille « Modèle 2» et nous avons trouvé :

𝑎1 = 0.015. Nous dirons que si les dépenses de publicité dans le canal PPCC augmentaient de 1%, alors
le TotRev augmenterait de 0.015%.

𝑎 2 = 0.315. Nous dirons que si les dépenses de publicité dans le canal PPCR augmentaient de 1%, alors
le TotRev augmenterait de 0.315%.

𝑎 3 = 0.574. Nous dirons que si les dépenses de publicité dans le canal AffC augmentaient de 1%, alors
le TotRev augmenterait de 0.574%.

3
D’une manière générale, si notre modèle s’écrit sous la forme :

𝑙𝑛𝑌 = 𝑎 0 + 𝑎1 𝑙𝑛𝑥1 + 𝑎 2𝑙𝑛𝑥2 + 𝑎 3 𝑙𝑛𝑥3 + 𝑎 4 𝑙𝑛𝑥4

Alors,

si 𝑥1 augmentait de 1%, alors Y augmenterait de 𝑎1 %,

si 𝑥 2 augmentait de 1%, alors Y augmenterait de 𝑎 2 %,

si 𝑥 3 augmentait de 1%, alors Y augmenterait de 𝑎 3 %,

si 𝑥 4 augmentait de 1%, alors Y augmenterait de 𝑎 4 %.

3. Applications des modèles de régressions linéaires


Les applications des modèles de régressions linéaires sont très nombreuses. Nous en examinons ici
quelques-unes.

Première application : Les Prévisions

Cette application est illustrée dans la feuille « Estimation 1 » à partir de la ligne numéro 100.

Les modèles de régressions linéaires peuvent être employés pour réaliser des prévisions. Prenons
l’exemple du modèle (1). Supposons que la direction de cette entreprise souhaite faire une prévision
de son Revenu Total durant la semaine 33 si elle engageait est les dépenses de publicité données sur
la ligne numéro 131 du fichier Excel, c’est-à-dire :

𝑃𝑃𝐶𝐶 = 77322, 𝑃𝑃𝐶𝑅 = 464111, 𝐴𝑓𝑓𝐶 = 40757 et 𝐴𝑓𝑓𝑅 = 272204

Dans ce cas, le Revenu Total à la semaine 33 serait égal à :

𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙33 = 𝑎 0 + 𝑎1 𝑃𝑃𝐶𝐶33 + 𝑎 2 𝑃𝑃𝐶𝑅33 + 𝑎 3 𝐴𝑓𝑓𝐶33 + 𝑎 4 𝐴𝑓𝑓𝑅33


𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙33 = 𝑎 0 + 𝑎1 77322 + 𝑎 2 464111 + 𝑎 3 40757 + 𝑎 4 272204
𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙 33 = 456444 .677 − 5.552 × 77322 + 4.114 × 464111 + 42.464 × 40757
+ 2.499 × 272204

𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙33 = £4 347 302 .

4
Deuxième application : Détermination de l’allocation optimale d’un budget publicitaire

Cette application est illustrée dans la feuille « Estimation 2 » à partir de la ligne numéro 100.

Dans la deuxième section de ce cours qui est relative à l’interprétation des paramètres, nous avons vu
que lorsque le modèle est logarithmique, alors les paramètres sont des élasticités. Nous avons vu aussi
que ces élasticités nous donnent très précisément l’impact d’une hausse de 1% d’une variable
explicative sur la variable à expliquer. Donc, si notre objectif est celui de la recherche de l’allocation
optimale d’un budget publicitaire, alors nous avons intérêt à privilégier le recours aux modèles
logarithmiques.

Supposons que notre entreprise n’admet que trois canaux publicitaires : PPCC, PPCR et AffC. Donc,
dans cet exemple, il faut ignorer totalement l’existence des autres canaux publicitaires qui sont sur le
fichier Excel. Supposons aussi que le Revenu Total est lié aux dépenses de publicité selon la relatio n du
modèle 2 étudié dans la feuille « Estimation 2 ». Nous pouvons à présent aller légèrement plus loin
dans l’analyse de ce modèle pour en déduire l’allocation optimale du budget publicitaire. Pour ce faire,
il suffit de suivre les étapes suivantes :

1. Relever toutes les élasticités positives. Rappelez-vous qu’ici les paramètres 𝑎1 , 𝑎 2 , et 𝑎 3 sont
des élasticités. Dans cet exemple toutes les élasticités sont positives. Elles valent
respectivement en arrondissant à trois chiffres : 0.015, 0.315 et 0.575.
2. Faire la somme de toutes les élasticités positives.
élasticité du canal
3. La part optimale de chaque canal publicitaire est alors égale à .
somme de toutes les élasticités positives

Troisième application : Détermination des indices d’efficacité technique

Cette application est détaillée dans le fichier Excel « Ranking individuals given their inputs and
outputs.xlsx » qui vous a déjà été envoyé. Nous ne reviendrons pas dessus ici.

Vous aimerez peut-être aussi