Econometrie

La Multicolinearite : est verifies,quand lune de variable
exogene explique lautre variable exogene ,dans la regression

multiple il ne faut quen aucun cas trouver une multicolinearite
entre les variables exogene
Les etapes de la modelesation : Est compose de 3 etape (la
specification ,lestimation ,validation)
-1-la specification : -la collecte des donnes, le nuage des points
(representation graphique)
2-lestimations des parametres :
parametres par la MCO
a^
et
^y = a^ x + b^
et on calcule ces
b^
3-Validation : elle permet de decider ,si les valeurs estimes des

parametres sont conomiquement pertients et statistiquement
valide
Exemple : le service administratif de FSJES vouloir determiner
le nombre des etudiants qui souhaitent acceder au cycle du
mastre pour se faire , ils vont commencer par une specification
de cette problematique pour ils vont collecter lensemble des
information necessaires utilise comme une base de donnee
Ensuite ,le service devra estimer le nombre des etudiants
souhaitant rejoindre le cycle du mastre
Donc va falloir ,determiner les signes et les grandeurs des
parametre theoriquement anticipe
Finalement ,il vient le tous de validation , celle-ci permet de
decider si le nombre des etudiants estimes est economiquement
pertinent et statistiquement valide.
^
est un meilleur estimateur ? (BLUE)
1-(B) best meilleur estimateur , la variance de

petite
2-(L) linaire , forme lineaire de
a^
somme (x x )( y y )
somme (xx )2
XY
X2
4-(E) on a
soit plus
a^
X2
donc
a^
sans biais si E(
soit =X/
3-(U) un baised sans biais ,
= XY
=
X
X
X
^
=(X 1 *XY =(X 1 *X(X+) = (X 1 *X+(X
X
1
*X
=+(X 1 X avec
^
E( =E()=
E ( ) =0
X
X
^
E( =E()+ (X 1 X E()
donc
est meilleur estimateur
Hypotheses du modele lineaire de regression simple :

H1 : specification correcte du modele
La variable exogene est suppose etre la meilleure sans omission
dautres variables potentielles
H2 : Nullit de leprance des erreurs ( Hypothese de
permanence structurelle)
Lesperance mathematique des erreurs est nulle on note
E()=0 , quelque soit i=1,..,n
les observations recueilles doivent etre donnees de manire

exacte, une erreur dans les observation ,risque de donner des
resultats biaises
H3 : Homoscedasticite
Les erreurs ne doivent pas etre lies la variable exogene
E()=0
quelque soit i=1,..,n
V()=E( (-E(
= E(
H4 : independance des erreurs

Cov( ;)= E( ;)=0
H5: Normalite
Les erreurs () sont distribuees selon une loi normale
H6 : Elle concerne la variable exogene
La moyenne des observations de la variable exogene ne doit pas
changer de manire significative si lon ajoute de nouvelle
observation
H7 : pas de restrictions sur les parametres :
Ils peuvent etres positifs,negatifs ou nuls
Les Hypotheses de base Multiple :
Pour pouvoir assumer que les coefficients de la MCO sont nonbiaises, c--d que la valeur predite par lestimateur converge
vers la valeur observee dans la population ,on doit faire

lhypothese que les conditions suivantes sont respectees :
1-la relation entre la variable endogene et les variables
exogenes est lineaire
2-les variables endogenes observees possedent un element
aleatoire cet element aleatoire peut etre explique par les
causes citee,dans le modele de regression lineaire , on suppose
aussi que :
-lesperance mathematique des elements aleatoires est nulle
E()=0
-la variance de lelement aleatoire est
constant( homoscedasticite )
-les elements aleatoires sont statistiquement independants
-les elements aleatoires sont distribues suivants une loi normale
3-les variables exogenes sont certaines ,elles ne comportent
donc pas delement aleatoire
4-les variables exogenes ne sont pas corrles entre elles (pas
de multicolinarit exacte)
Analyser et interpeter
^y = + x + x
Au niveau de cette exercice on essaie dexpliquer levolution de

(y) en fonction de (
et (
A partir des donnees fournit par le logiciel ,il ressaie que la

relation entre (y) variable endogene et (
et (
les
variables exogene peut etre presenter selon le modele

economique suivant :
^y = + x + x
On Consiste Que :
Coefficient a^
-si 0 et 0 : les deux coefficients des deux variable x et
x sont positif , ce qui implique que la variable y et les deux
variables exogene x et x variant dans le meme
sens,autrement dit si x et x augmentent le y va augment
-si 0 : cela signifie que x varie dans le sens inverse de la
variable y , donc si la variable x augment le variable
endogene y augmente
Ecart type estime S a^
Si le variable x est plus petite que celui de la variable x , S
S
a^
a^
en effet dans cette specification retenue la variable
exogene (le plus petit) explique bien la variable endogene y

mieux que la variable exogene ( la plus grand)
,avec respectivement une valeur de student x1 et de x2 , en
effet dans cette specification retenue la variable exogene (le
plus grand) explique bien la variable endogene y mieux que la

variable exogene ( la plus petit)
apres les donnees fournit par le logiciel, on peut tirer les

conclusions sur la validite du modele suivant :
R2
(R-squared): le modele explique (..%)de la variabilit du (y)
c--d la variable endogene, ce chiffre nous conduit dire que la

qualite de lajustement est : si
2
80 bonne ,
moins bonne ,
80 parfaite (robuste), 70
=50 acceptable (moyen) , 30
50
30 faible
Mais a verifier cela par les tests student et fisher

R2
corrige (adjusted R-squared):pour corrige le
R2
il prend
on compte les variables expliques, qui sont significative, si les

variables exogene augmentes alors le SCReg augment ce qui
implique augmentation de
c
R2
ette conclusion peut etre confirmer par la valeur du
coefficient de determination on qui sert verifier linformation

sur la qualite dajustement
s : erreur type de lestimation (std error of regression):
Cest la distance moyenne entre les variables observes et

variables estimes alors on Remarque aussi une faible valeur de
la distance moyenne (s=) entre les variables prevues et les
variables observes ,cest un indicateur de plus sur la robustesse
de la qualite de lajustement.
T-statistic (Test Student) : a travers le test de student on
Remarque que ona :
Si on a Prob (T-statistic) :on compare le seuil de risque avec
le resultat Prob
-Prob le module est significative parcequil ne depasse pas
le risque lies autrement dit la variable exogene x determiner
pertiment la variable endogene y ,donc la variable retenue est
significative
-Prob le module nest pas significative ,alors en rejette le
modele sinon on ajoute ou cherche dautre variable pour
augmenter la significativite
Si on a pas de Prob (T-statistic) : on va trouver la valeur
theorique de student
-
si t
tab
tab par le comparer avec le
cal on rejette H
risque (=) do H : a
cal
en faveur de H au seuil de
0 alors le y et x sont etroitement
lies autrement dit la variable exogene x determiner pertiment
la variable endogene y ,donc la variable retenue est

significative
si t
tab
cal: donc on accepte H en faveur de H au seuil
de risque (=..),donc la variable retenue nest pas significative il

faut ajoute ou cherche dautre variable pour augmenter la
significativite
F-statistic (Test Fisher) : a travers le test de Fisher on
Remarque que ona :
Si on a Prob (F-statistic) :on compare le seuil de risque
avec le resultat Prob
-
-Prob finalement lanalyse de la donne probabilite Fstatistic nous permet de valider le module parceque leProb
statistic ne depasse pas le risque le modele est bien specifie
a ainsi quil existe la relation entre les variables est
pertinent,et donc le modele est globalement significative
-Prob le module nest pas significative , ,dans ce cas on se

retrouver devant deux choix soit on va eliminer les variables non
significative retrouver selon le test student , ou ajouter dautre
variable explicative , et recalculer nouveau la statistique de
Fisher pour savoir si le modele est valide c--d devient
globalement significative
Si on a pas de Prob (F-statistic) : on va trouver la valeur

theorique de Fisher
tab par le comparer avec le
cal
Si Fcal F tab : donc on rejette H en faveur de H au seuil
de risque (=..), les resultats sont conformes ,avec le test de

student donc les deux variable , y et x sont lies et le modele
est bien specifie a ainsi quil existe la relation entre les
variables est pertinent,et donc le modele est globalement
significative
Si Fcal F tab : donc on accepte H en faveur de H au seuil
de risque (=..) , le modele nest pas globalement significative
selon le test Fisher , dans ce cas on se retrouver devant deux
choix soit on va eliminer les variables non significative
retrouver selon le test student , ou ajouter dautre variable
explicative , et recalculer nouveau la statistique de Fisher
pour savoir si le modele est valide c--d devient globalement
significative
Economiquement parlant la variable endogene y est
videment lie a la variable exogene x et x
En effet si x et x augmente le y augmente aussi.
Les relation
^y = a^ x + b^
La droite de regression ou parametre
a^ =
(xx )( y y )
= XY/
(x x )
b^
X2
= Cov(x,y)/V(x)
a^ x
Cov(x,y)= ( xx )( y y ) /n
Variance= ( xx ) /n
ecart type
(x x )2
= V ( x) =
R2 :coefficient de determination (qualite dajustement)

2
SCReg ( ^y y )
R=
=
SCT
( y y )2
2
R2=r 2 =
ou
Cov ( x , y )2
x2 y2
le modele explique (..%)de la variablilite du (y) c--d la variable

endogene, ce chiffre nous conduit dire que la qualite de
lajustement est : si
bonne ,
R2
bonne ,
R2
R2
80 parfaite (robuste), 70
=50 acceptable (moyen) , 30
R2
R2
80
50 moins
30 faible
si les variables augmentes le coefficient de determination

augmante psq le SCReg augment de plus en plus
r2 :
r=
coefficient de correlation
Cov ( x , y )
x y
ou r = R
nou remarquons que (r(x,y) soit 0r1 ; -1r0 ) donc il

sagit dune correlation (positif,negative)en dautres termes ,
la variable exogene (x) et la variable endogene (y) varient
dans (le meme sens, sens contraire)
de plus nous avons :
Si 0r1 {,0,7< r<1 donc il sagit dune forte relation }
{r=0,5relation moyenne}{0,3<r<0,5 faible relation}
do lapproximation dun nuage par les moindres carres est
de bonne qualite
Si r=1 ou -1 les points de nuage sont exactement alignees sur

la droite ,dans ce cas la correlation est parfaite ,bonne qualite
Si r0 la correlatio est negative c--d les variable x et y
varient dans sens contraire ,qualite mediocre
2
SCReg= ( ^y y ) =
2
SCRes= ( y ^y ) =
a^ 2
(x x )2 =
R2
*SCT
2
SCT= ( y y ) = SCRes + SCReg
Erreur type de lestimation (S.E.of regression) (s) s=
SCRes
n2
MCRes
Variance derreur type estime s =
SCRes
n2
Ecart type estime (std error ) S a^ =
La variance estime S a^
x
x
(x )
n
x
x
Moyenne des carrees (Mean Squared)

RLM : MCRes= SCRes / n-p-1 MCReg = SCReg / p
RLS : MCRes= SCRes / n-2
MCReg = SCReg / 1
Degre de liberte (DF)

RLS : ddl de resu=n-2 ; ddl de reg = 1
RLM : ddl de resu= n-p-1 ; ddl de reg = p ; ddl de total = n-1
Regression Lineaire Multiple : on va etudier plusieurs variables

et non pas seulement une seule variable
Y : la variable quantitative (expliquer, endogene,dependante)
x,x.Xp : la variable ( explicative ,exogene, independante)
Test Student (est ce que le modele est
significative)ou( test de la ponte a ou pertinance )
t
cal= a^ / S a^
Dans RLS t tab /2 (n-2) Dans RLM t tab /2 (n-p)
t
Si on a le nombre dobservation est inferieur 30
tab= 3
on va trouver la valeur theorique de student
comparer avec le
-
si t
tab
tab par le
cal
cal on rejette H
risque (=) do H : a
en faveur de H au seuil de
0 alors le y et x sont etroitement
lies autrement dit la variable exogene x determiner pertiment

la variable endogene y ,donc la variable retenue est
significative
si t
tab
cal: donc on accepte H en faveur de H au
seuil de risque (=..),donc la variable retenue nest pas

significative
Test Fisher ( significativite globale ou rebuste du
modele )
F cal = MCReg / MCRes =
R
1R 2
n2
dans la RLS ( F =
Dans RLS F tab (1 ; n-2) Dans RLM F tab (p ; n-p)

Si on a le nombre dobservation est inferieur 30 F tab= 2
on va trouver la valeur theorique de Fisher

comparer avec le
-
tab par le
cal
Si Fcal F tab : donc on rejette H en faveur de H au seuil

de risque (=..), les resultats sont conformes ,avec le test de
student donc les deux variable , y et x sont lies et le modele
est bien specifie a ainsi quil existe la relation entre les
variables est pertinent ,donc le modele est globalement
significative
Si Fcal F tab : donc on accepte H en faveur de H au
seuil de risque (=..) , le modele nest pas globalement
significative selon le test Fisher , dans ce cas on se retrouver
devant deux choix soit on va eliminer les variables non
significative retrouver selon le test student , ou ajouter dautre
variable explicative , et recalculer nouveau la statistique de
Fisher pour savoir si le modele est valide c--d devient
globalement significative

Econometrie

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Econometrie

Transféré par

Droits d'auteur :

Formats disponibles

La Multicolinearite : est verifies,quand lune de variable

exogene explique lautre variable exogene ,dans la regression

3-Validation : elle permet de decider ,si les valeurs estimes des

est un meilleur estimateur ? (BLUE)

1-(B) best meilleur estimateur , la variance de

3-(U) un baised sans biais ,

est meilleur estimateur

Hypotheses du modele lineaire de regression simple :

les observations recueilles doivent etre donnees de manire

quelque soit i=1,..,n

H4 : independance des erreurs

vers la valeur observee dans la population ,on doit faire

Au niveau de cette exercice on essaie dexpliquer levolution de

A partir des donnees fournit par le logiciel ,il ressaie que la

variables exogene peut etre presenter selon le modele

en effet dans cette specification retenue la variable

exogene (le plus petit) explique bien la variable endogene y

plus grand) explique bien la variable endogene y mieux que la

apres les donnees fournit par le logiciel, on peut tirer les

(R-squared): le modele explique (..%)de la variabilit du (y)

c--d la variable endogene, ce chiffre nous conduit dire que la

=50 acceptable (moyen) , 30

Mais a verifier cela par les tests student et fisher

corrige (adjusted R-squared):pour corrige le

on compte les variables expliques, qui sont significative, si les

ette conclusion peut etre confirmer par la valeur du

coefficient de determination on qui sert verifier linformation

Cest la distance moyenne entre les variables observes et

tab par le comparer avec le

0 alors le y et x sont etroitement

lies autrement dit la variable exogene x determiner pertiment

la variable endogene y ,donc la variable retenue est

cal: donc on accepte H en faveur de H au seuil

de risque (=..),donc la variable retenue nest pas significative il

-Prob le module nest pas significative , ,dans ce cas on se

Si on a pas de Prob (F-statistic) : on va trouver la valeur

tab par le comparer avec le

Si Fcal F tab : donc on rejette H en faveur de H au seuil

de risque (=..), les resultats sont conformes ,avec le test de

R2 :coefficient de determination (qualite dajustement)

le modele explique (..%)de la variablilite du (y) c--d la variable

=50 acceptable (moyen) , 30

si les variables augmentes le coefficient de determination

nou remarquons que (r(x,y) soit 0r1 ; -1r0 ) donc il

Si r=1 ou -1 les points de nuage sont exactement alignees sur

Erreur type de lestimation (S.E.of regression) (s) s=

Ecart type estime (std error ) S a^ =

Moyenne des carrees (Mean Squared)

Degre de liberte (DF)

Regression Lineaire Multiple : on va etudier plusieurs variables

0 alors le y et x sont etroitement

lies autrement dit la variable exogene x determiner pertiment

cal: donc on accepte H en faveur de H au

seuil de risque (=..),donc la variable retenue nest pas

Dans RLS F tab (1 ; n-2) Dans RLM F tab (p ; n-p)

on va trouver la valeur theorique de Fisher

Si Fcal F tab : donc on rejette H en faveur de H au seuil

Vous aimerez peut-être aussi