Vous êtes sur la page 1sur 13

La Multicolinearite : est verifies,quand lune de variable

exogene explique lautre variable exogene ,dans la regression


multiple il ne faut quen aucun cas trouver une multicolinearite
entre les variables exogene
Les etapes de la modelesation : Est compose de 3 etape (la
specification ,lestimation ,validation)
-1-la specification : -la collecte des donnes, le nuage des points
(representation graphique)
2-lestimations des parametres :
parametres par la MCO

a^

et

^y = a^ x + b^

et on calcule ces

b^

3-Validation : elle permet de decider ,si les valeurs estimes des


parametres sont conomiquement pertients et statistiquement
valide
Exemple : le service administratif de FSJES vouloir determiner
le nombre des etudiants qui souhaitent acceder au cycle du
mastre pour se faire , ils vont commencer par une specification
de cette problematique pour ils vont collecter lensemble des
information necessaires utilise comme une base de donnee
Ensuite ,le service devra estimer le nombre des etudiants
souhaitant rejoindre le cycle du mastre
Donc va falloir ,determiner les signes et les grandeurs des
parametre theoriquement anticipe
Finalement ,il vient le tous de validation , celle-ci permet de
decider si le nombre des etudiants estimes est economiquement
pertinent et statistiquement valide.
^

est un meilleur estimateur ? (BLUE)

1-(B) best meilleur estimateur , la variance de


petite
2-(L) linaire , forme lineaire de
a^

somme (x x )( y y )
somme (xx )2

XY
X2

4-(E) on a

soit plus

a^

X2

donc

a^

sans biais si E(

soit =X/

3-(U) un baised sans biais ,

= XY
=

X
X
X
^
=(X 1 *XY =(X 1 *X(X+) = (X 1 *X+(X

X
1
*X

=+(X 1 X avec

^
E( =E()=

E ( ) =0
X
X

^
E( =E()+ (X 1 X E()

donc

est meilleur estimateur

Hypotheses du modele lineaire de regression simple :


H1 : specification correcte du modele
La variable exogene est suppose etre la meilleure sans omission
dautres variables potentielles
H2 : Nullit de leprance des erreurs ( Hypothese de
permanence structurelle)
Lesperance mathematique des erreurs est nulle on note
E()=0 , quelque soit i=1,..,n

les observations recueilles doivent etre donnees de manire


exacte, une erreur dans les observation ,risque de donner des
resultats biaises
H3 : Homoscedasticite
Les erreurs ne doivent pas etre lies la variable exogene
E()=0

quelque soit i=1,..,n

V()=E( (-E(

= E(

H4 : independance des erreurs


Cov( ;)= E( ;)=0

H5: Normalite
Les erreurs () sont distribuees selon une loi normale
H6 : Elle concerne la variable exogene
La moyenne des observations de la variable exogene ne doit pas
changer de manire significative si lon ajoute de nouvelle
observation
H7 : pas de restrictions sur les parametres :
Ils peuvent etres positifs,negatifs ou nuls
Les Hypotheses de base Multiple :
Pour pouvoir assumer que les coefficients de la MCO sont nonbiaises, c--d que la valeur predite par lestimateur converge

vers la valeur observee dans la population ,on doit faire


lhypothese que les conditions suivantes sont respectees :
1-la relation entre la variable endogene et les variables
exogenes est lineaire
2-les variables endogenes observees possedent un element
aleatoire cet element aleatoire peut etre explique par les
causes citee,dans le modele de regression lineaire , on suppose
aussi que :
-lesperance mathematique des elements aleatoires est nulle
E()=0
-la variance de lelement aleatoire est
constant( homoscedasticite )
-les elements aleatoires sont statistiquement independants
-les elements aleatoires sont distribues suivants une loi normale
3-les variables exogenes sont certaines ,elles ne comportent
donc pas delement aleatoire
4-les variables exogenes ne sont pas corrles entre elles (pas
de multicolinarit exacte)

Analyser et interpeter

^y = + x + x

Au niveau de cette exercice on essaie dexpliquer levolution de


(y) en fonction de (

et (

A partir des donnees fournit par le logiciel ,il ressaie que la


relation entre (y) variable endogene et (

et (

les

variables exogene peut etre presenter selon le modele


economique suivant :
^y = + x + x

On Consiste Que :
Coefficient a^
-si 0 et 0 : les deux coefficients des deux variable x et
x sont positif , ce qui implique que la variable y et les deux
variables exogene x et x variant dans le meme
sens,autrement dit si x et x augmentent le y va augment
-si 0 : cela signifie que x varie dans le sens inverse de la
variable y , donc si la variable x augment le variable
endogene y augmente
Ecart type estime S a^
Si le variable x est plus petite que celui de la variable x , S
S

a^

a^

en effet dans cette specification retenue la variable

exogene (le plus petit) explique bien la variable endogene y


mieux que la variable exogene ( la plus grand)
,avec respectivement une valeur de student x1 et de x2 , en
effet dans cette specification retenue la variable exogene (le

plus grand) explique bien la variable endogene y mieux que la


variable exogene ( la plus petit)

apres les donnees fournit par le logiciel, on peut tirer les


conclusions sur la validite du modele suivant :
R2

(R-squared): le modele explique (..%)de la variabilit du (y)

c--d la variable endogene, ce chiffre nous conduit dire que la


qualite de lajustement est : si
2

80 bonne ,

moins bonne ,

80 parfaite (robuste), 70

=50 acceptable (moyen) , 30

50

30 faible

Mais a verifier cela par les tests student et fisher


R2

corrige (adjusted R-squared):pour corrige le

R2

il prend

on compte les variables expliques, qui sont significative, si les


variables exogene augmentes alors le SCReg augment ce qui
implique augmentation de
c

R2

ette conclusion peut etre confirmer par la valeur du

coefficient de determination on qui sert verifier linformation


sur la qualite dajustement
s : erreur type de lestimation (std error of regression):

Cest la distance moyenne entre les variables observes et


variables estimes alors on Remarque aussi une faible valeur de
la distance moyenne (s=) entre les variables prevues et les
variables observes ,cest un indicateur de plus sur la robustesse
de la qualite de lajustement.
T-statistic (Test Student) : a travers le test de student on
Remarque que ona :
Si on a Prob (T-statistic) :on compare le seuil de risque avec
le resultat Prob
-Prob le module est significative parcequil ne depasse pas
le risque lies autrement dit la variable exogene x determiner
pertiment la variable endogene y ,donc la variable retenue est
significative
-Prob le module nest pas significative ,alors en rejette le
modele sinon on ajoute ou cherche dautre variable pour
augmenter la significativite
Si on a pas de Prob (T-statistic) : on va trouver la valeur
theorique de student
-

si t

tab

tab par le comparer avec le

cal on rejette H

risque (=) do H : a

cal

en faveur de H au seuil de

0 alors le y et x sont etroitement

lies autrement dit la variable exogene x determiner pertiment

la variable endogene y ,donc la variable retenue est


significative
si t

tab

cal: donc on accepte H en faveur de H au seuil

de risque (=..),donc la variable retenue nest pas significative il


faut ajoute ou cherche dautre variable pour augmenter la
significativite
F-statistic (Test Fisher) : a travers le test de Fisher on
Remarque que ona :
Si on a Prob (F-statistic) :on compare le seuil de risque
avec le resultat Prob
-

-Prob finalement lanalyse de la donne probabilite Fstatistic nous permet de valider le module parceque leProb
statistic ne depasse pas le risque le modele est bien specifie
a ainsi quil existe la relation entre les variables est
pertinent,et donc le modele est globalement significative

-Prob le module nest pas significative , ,dans ce cas on se


retrouver devant deux choix soit on va eliminer les variables non
significative retrouver selon le test student , ou ajouter dautre
variable explicative , et recalculer nouveau la statistique de
Fisher pour savoir si le modele est valide c--d devient
globalement significative

Si on a pas de Prob (F-statistic) : on va trouver la valeur


theorique de Fisher

tab par le comparer avec le

cal

Si Fcal F tab : donc on rejette H en faveur de H au seuil

de risque (=..), les resultats sont conformes ,avec le test de


student donc les deux variable , y et x sont lies et le modele
est bien specifie a ainsi quil existe la relation entre les
variables est pertinent,et donc le modele est globalement
significative
Si Fcal F tab : donc on accepte H en faveur de H au seuil
de risque (=..) , le modele nest pas globalement significative
selon le test Fisher , dans ce cas on se retrouver devant deux
choix soit on va eliminer les variables non significative
retrouver selon le test student , ou ajouter dautre variable
explicative , et recalculer nouveau la statistique de Fisher
pour savoir si le modele est valide c--d devient globalement
significative
Economiquement parlant la variable endogene y est
videment lie a la variable exogene x et x
En effet si x et x augmente le y augmente aussi.
Les relation
^y = a^ x + b^
La droite de regression ou parametre
a^ =

(xx )( y y )
= XY/
(x x )

b^

X2

= Cov(x,y)/V(x)

a^ x

Cov(x,y)= ( xx )( y y ) /n

Variance= ( xx ) /n

ecart type

(x x )2

= V ( x) =

R2 :coefficient de determination (qualite dajustement)


2

SCReg ( ^y y )
R=
=
SCT
( y y )2
2

R2=r 2 =

ou

Cov ( x , y )2
x2 y2

le modele explique (..%)de la variablilite du (y) c--d la variable


endogene, ce chiffre nous conduit dire que la qualite de
lajustement est : si
bonne ,

R2

bonne ,

R2

R2

80 parfaite (robuste), 70

=50 acceptable (moyen) , 30

R2

R2

80

50 moins

30 faible

si les variables augmentes le coefficient de determination


augmante psq le SCReg augment de plus en plus
r2 :

r=

coefficient de correlation
Cov ( x , y )
x y

ou r = R

nou remarquons que (r(x,y) soit 0r1 ; -1r0 ) donc il


sagit dune correlation (positif,negative)en dautres termes ,
la variable exogene (x) et la variable endogene (y) varient
dans (le meme sens, sens contraire)
de plus nous avons :
Si 0r1 {,0,7< r<1 donc il sagit dune forte relation }
{r=0,5relation moyenne}{0,3<r<0,5 faible relation}
do lapproximation dun nuage par les moindres carres est
de bonne qualite

Si r=1 ou -1 les points de nuage sont exactement alignees sur


la droite ,dans ce cas la correlation est parfaite ,bonne qualite
Si r0 la correlatio est negative c--d les variable x et y
varient dans sens contraire ,qualite mediocre
2
SCReg= ( ^y y ) =
2
SCRes= ( y ^y ) =

a^ 2

(x x )2 =

R2

*SCT

2
SCT= ( y y ) = SCRes + SCReg

Erreur type de lestimation (S.E.of regression) (s) s=

SCRes
n2

MCRes
Variance derreur type estime s =

SCRes
n2

Ecart type estime (std error ) S a^ =

La variance estime S a^

x
x

(x )
n

x
x

Moyenne des carrees (Mean Squared)


RLM : MCRes= SCRes / n-p-1 MCReg = SCReg / p
RLS : MCRes= SCRes / n-2
MCReg = SCReg / 1

Degre de liberte (DF)


RLS : ddl de resu=n-2 ; ddl de reg = 1
RLM : ddl de resu= n-p-1 ; ddl de reg = p ; ddl de total = n-1

Regression Lineaire Multiple : on va etudier plusieurs variables


et non pas seulement une seule variable
Y : la variable quantitative (expliquer, endogene,dependante)
x,x.Xp : la variable ( explicative ,exogene, independante)
Test Student (est ce que le modele est
significative)ou( test de la ponte a ou pertinance )
t
cal= a^ / S a^
Dans RLS t tab /2 (n-2) Dans RLM t tab /2 (n-p)
t
Si on a le nombre dobservation est inferieur 30
tab= 3
on va trouver la valeur theorique de student
comparer avec le
-

si t

tab

tab par le

cal

cal on rejette H

risque (=) do H : a

en faveur de H au seuil de

0 alors le y et x sont etroitement

lies autrement dit la variable exogene x determiner pertiment


la variable endogene y ,donc la variable retenue est
significative
si t
tab

cal: donc on accepte H en faveur de H au

seuil de risque (=..),donc la variable retenue nest pas


significative
Test Fisher ( significativite globale ou rebuste du
modele )
F cal = MCReg / MCRes =

R
1R 2
n2

dans la RLS ( F =

Dans RLS F tab (1 ; n-2) Dans RLM F tab (p ; n-p)


Si on a le nombre dobservation est inferieur 30 F tab= 2

on va trouver la valeur theorique de Fisher


comparer avec le
-

tab par le

cal

Si Fcal F tab : donc on rejette H en faveur de H au seuil


de risque (=..), les resultats sont conformes ,avec le test de
student donc les deux variable , y et x sont lies et le modele
est bien specifie a ainsi quil existe la relation entre les
variables est pertinent ,donc le modele est globalement

significative
Si Fcal F tab : donc on accepte H en faveur de H au
seuil de risque (=..) , le modele nest pas globalement
significative selon le test Fisher , dans ce cas on se retrouver
devant deux choix soit on va eliminer les variables non
significative retrouver selon le test student , ou ajouter dautre
variable explicative , et recalculer nouveau la statistique de
Fisher pour savoir si le modele est valide c--d devient
globalement significative