Vous êtes sur la page 1sur 38

CHAPITRE II: Le modèle de

régression simple

Réalisé par : M. TCHAM Omar


Qu’est ce que l’analyse de régression ?

L’analyse de régression consiste à étudier la dépendance d’une variable


expliquée à une ou plusieurs variable(s) explicative(s).
Régression

Régression Simple: Régression Multiple:


Lorsqu’il n’y a Lorsqu’il existe
qu’une seule plusieurs variables
variable explicative. explicatives.
Qu’est ce qu’un modèle de régression
simple ?

Le modèle de régression simple est ainsi un modèle linéaire qui comprend


une équation unique reliant une variable expliquée à une variable
explicative.

C’est un modèle à deux variables.

Le modèle de régression simple est un modèle aléatoire.


Exemple:

La fonction de consommation keynésienne :


C = a 0 + a1 Y
Où:
C : consommation
Y: Revenu
a0: Consommation autonome ou incompressible
a1: Propension marginale à consommer
1. Vocabulaire:

C : Variable à expliquer / variable endogène.

Y : Variable explicative / variable exogène.

C’est le revenu qui explique la consommation.

a0 et a1: Paramètres du modèle / coefficients de régression


2. Spécification

Un modèle en série temporelle: Les variables représentent des phénomènes


observés à intervalles de temps réguliers

La consommation et le revenu annuel sur 20 ans pour un pays


donné

C t= a 0 + a 1 Y t t = 1, … , 20
Où:
Ct: Consommation au temps t

Yt: Revenu au temps t


Un modèle en coupe instantanée: Les variables représentent des
phénomènes observés au même instant mais concernant plusieurs
individus.

La consommation et le revenu observés sur un échantillon de 20 pays

C i= a 0 + a 1 Y i i = 1, … , 20
Où:
Ci: Consommation du pays i pour une année donnée.

Yi : Revenu du pays i pour une année donnée.


L’hypothèse de linéarité

Considérons deux variables X et Y. on distingue la linéarité dans les


variables et la linéarité dans les paramètres
1. Linéarité dans les variables:

Soit une fonction Ɐ telle que :

Y = Ɐ (X)

La fonction Ɐ est dite linéaire en X si la puissance de X est égale à l’unité et si X n’est


pas multiplié ou divisé par une autre variable.

Autrement dit, si la dérivée de Y par rapport à X est indépendante de X.


2. Linéarité dans les paramètres

Une fonction est dite linéaire dans les paramètres si ceux-ci:

1. Sont affectés d’une puissance égale à l’unité

2. Ne sont multipliés ou divisés par un ou plusieurs autres paramètres


Le modèle de régression simple est un
modèle linéaire ?

La linéarité dont il est question ici est la linéarité dans les paramètres.

Le modèle étudié peut également être linéaire dans les variables, mais
cela n’est pas nécessaire au sens où il suffit que le modèle puisse être
linéarisé.
Le modèle peut être linéaire en X ou en n’importe quelle transformation de
X.
Le rôle du terme aléatoire :

Le modèle de régression simple est un modèle aléatoire au sens où un


terme d’erreur figure dans l’équation reliant la variable endogène à la
variable exogène.

Ce terme d’erreur (ou perturbation) désigne l’ensemble des informations


non explicitées dans le modèle et permet de tenir compte des divergences
existant entre l’explication donnée par le modèle et la réalité.
Le terme d’erreur regroupe trois erreurs:

Une erreur de • Le fait que la seule variable explicative n’est


pas suffisante pour expliquer la totalité du
spécification phénomène étudié.

Une erreur de • Les données ne représentent pas exactement


mesure le phénomène.

Une erreur de
• D’un échantillon à l’autre, les observations et
fluctuation d’ les estimations sont légèrement différentes.
échantillonnage
Le modèle de régression simple s’écrit :
Y=α+βX+ε

Où :

Y: Variable expliquée
X: variable explicative
α et β : Paramètres (ou coefficients) du modèle
ε : terme d’erreur (ou perturbation)
On suppose que la variable X est observée sans erreur, c’est-à-dire que X
est une variable certaine; de ce fait la variable X est indépendante du
terme d’erreur ε
Propriétés du terme d’erreur:

1. La nullité de l’erreur moyenne:

Cette hypothèse revient à admettre qu’en moyenne le modèle est


correctement spécifié et donc qu’en moyenne, l’erreur est nulle

Il n’existe pas de biais en faveur des valeurs positives, ni en faveur des


valeurs négatives.

L’espérance mathématique de l’erreur est nulle:


E(εt) = 0 Ɐt
Estimation des paramètres
Les Moindres Carrés Ordinaires (MCO)

La méthode la plus fréquemment utilisée pour estimer les paramètres α et β


est la méthode des Moindres Carrés Ordinaires (MCO)

La mise en œuvre de la méthode des moindres carrés ordinaires nécessite


un certain nombre d’hypothèses.
Hypothèses
Formulation des estimateurs
Récapitulatif :
Propriétés des estimateurs des MCO:
Estimateur de la variance de l’erreur:
Estimation des variances des
estimateurs des MCO
Tests sur les paramètres de régression
Test de significativité du coefficient :

Calculer le t de Student :
Équation de l’analyse de la variance :
SCT = SCE + SCR

La somme des carrés des écarts de la variable expliquée à sa moyenne,


est appelée la somme des carrés totale, notée SCT (Variabilité totale).

La somme des carrés expliquée, notée SCE (Variabilité expliquée).

La somme des carrés des résidus, notée SCR (Variabilité résiduelle).


Tableau d’analyse de la variance

Le tableau ci-dessous présente l’analyse de la variance pour un modèle de


régression simple :

Source de Somme des Degré de liberté Carrés moyens


variation carrés
X SCE 1 SCE / 1
Résidu SCR T–2 SCR / T - 2
Total SCT T-1
Coefficient de Détermination

L’équation d’analyse de la variance nous permet de juger de la qualité


d’une régression,

Plus la variance expliquée est proche de la variance totale; c’est-à-dire


plus la variance résiduelle est faible, meilleure est la régression.

Afin de quantifier ceci, on calcule le rapport entre la variance expliquée et


la variance totale, ce que l’on appelle le coefficient de détermination R² :
Le coefficient de détermination via l’
équation d’analyse de la variance:
Analyse de la variance et test de
significativité du coefficient β
Prévision :

Vous aimerez peut-être aussi