Académique Documents
Professionnel Documents
Culture Documents
Introduction lconomtrie
Philippe Polom, Prof. U. Lyon 2
www.gate.cnrs.fr/perso/polome
Acqurir un minimum de maniement de logiciels (au moins dans la comprhension des sorties logicielles)
Tableur (OO calc, MS excel) Gretl
Anne 2010
Organisation
Logiciels
Logiciels conomtriques installs en salle info :
Stata (le plus populaire actuellement ?) SAS (ne dveloppe plus gure lconomtrie, apparemment) Gretl
Cours magistraux
Pas de TD mais dmonstration de pratique en cours 2 ou 3 devoirs sur logiciel rendre dans la semaine (avant le cours suivant) via le FORUM Toutes les communications passent par le forum (voir ma page)
Avantages de Gretl
Gratuit et open source, peut tre tlcharg et install sur vos ordinateurs personnels Gretl @ gretl.sourceforge.net/ Sinstalle dans la langue de votre systme oprationnel (anglais, franais, italien, espagnol, polonais, allemand et portugais). Extras (= jeux de donnes) Maniement similaire Stata et sorties standards Bonne interface graphique Connecte avec divers autres logiciels pour analyse plus pousse ou sorties de prsentation
Evaluation
Les devoirs valent +/- 5 points
Les devoirs ne seront pas corrigs
Rfrences
Chapitre 1
Ce quon a et ce quon veut faire
Introductory econometrics for nance, Chris Brooks, Cambridge University Press, 2002-2005
Pas trop avanc, orient nance
Un exemple
On a des donnes
La variable Y dite endogne ou explique Une ou plusieurs variables X1 ...Xk explicatives
On veut
Quantier linuence de X surY Prdire Y conditionnellement certaines valeurs pour X
Comment faire ?
On cherche une estimation ! de ! telle que la droite 1 + !2 Xt + "t passe au mieux dans le nuage de points Yt = !
soit lerreur " = Y X ! On cherche le vecteur de nombres ! tel que la somme des carrs 2 Yy Xt ! soit minimale des erreurs #T
t=1
Rponse ! = X X
X Y
Compliqu calculer donc logiciel ! est un ESTIMATEUR, dit des moindres carrs
Linversion est une intuition dun autre estimateur, dit mthode des moments Soit A un estimateur de ! , alors on peut crire Y XA = " . On veut que A soit tel que X " 0 Alors A = (X X )1 X Y = ! :
X Y
Estimateur MM = estimateur MCO pour le modle linaire Y = X! +" Mais la mthode des moments sapplique pareillement des modles non linaires Y = g (X , ! ) + "
En gnral, X " = 0 mais si on peut supposer que X " 0 en un 1 sens stochastique, alors on peut crire ! = X X X Y dans le sens o ! est une approximation de !
La prdiction
Un objectif tait de prdire au mieux les ventes de crme glace en fonction de la temprature La prdiction se trouve sur la droite : Y = X !
Gretl contient de nombreuses bases de donnes relles, utilises dans des textes de rfrences (dont Verbeek)
Exemple consommation de crmes glaces icecream.gdt dans Verbeek dataset
Macroeconomics data, several decades, trimestriel, Australia, Europe, Danemark, UK... dont : prix, dateurs, emplois, population, croissance, investissement, ducation... Daily percentage nominal returns for the DM/British exchange rate 03/01/84 : 31/12/91 Monthly data on international airline passengers, 1949-1960 Daily/Weekly stock price data (closing value of the Dow-Jones or NYSE) for several periods Consumption and rate of return on portfolios, mensuel, 1959-97 ...
Strike duration data, in days Votes on ratication of Microsofts "Ofce Open XML" as an ISO standard, September 2007 Choix de plan de pension en fonction de caractristiques socio-conomiques Dgts des bateaux Nombre de visites chez le mdecin ...
140 U.K. manufacturing companies over the period 1976-1984 Employment and schooling history for a sample of men for the years 1981 to 1987 ...
Distribution dchantillonnage
Chaque chantillon est alatoire Exemple de la vente de crme glace sur la plage
Un autre vendeur sur autre plage aurait rcolt des donnes diffrentes La mthodologie prsente auparavant est applicable quand-mme Le modle est le mme ... mais les valeurs des coefcients seront diffrentes dans les deux cas ! !
Distribution dchantillonnage
Exemples dans OpenOfce / Excel : simulation de Monte-Carlo
Dans une simulation de Monte-Carlo, on gnre (cre) des donnes articielles an dillustrer certains outils thoriques dans un cadre contrl Fonction alea() (si vous avez une version anglaise : rand()) : cre une valeur tire dune variable alatoire de distribution uniforme entre 0 et 1 SQRT(-2*LN(alea()))*SIN(2*PI()*alea()) cre une valeur dune normale de moyenne 0 et dcart-type 1 Avec ces fonctions, on gnre X et le terme derreur Ce qui permet de calculer Y = 2-3X+erreur (ou tout autre choix de coefcient) On rpte lopration 10 lignes (par exemple) En utilisant Y et X on estime ! , on voit bien que ! = ! En recommencant lopration, on cre des vecteurs !i qui sont tous diffrents les uns des autres et tous diffrents de ! : les !i sont tous alatoires (alors que ! ne lest pas, mais lerreur et X le sont)
Distribution dchantillonnage
! alatoire : consquences
Il ny a pas de garantie dtre proche des vrais valeurs On caractrise un estimateur en fonction de ses proprits
Un estimateur sera jug meilleur quun autre si ses proprits sont meilleures
Biais Consistence (cohrence) Efcience
E !
=E =E
XX XX
1 1
XY X X!
=E +E X
XX XX
X (X ! + " ) X"
XX
E (" ) = !
X et " soient indpendants (alors lesprance de leur produit = le produit des esprances) E (" ) = 0 (on verra plus tard que cest toujours vrai)
Lefcience dun estimateur est sa prcision (linverse de sa variance) Plus la taille de lchantillon grandit, plus les coefcients estims tendent se rapprocher des vrais valeurs
Lestimateur moindres carrs est dit consistent Lorsque la taille de lchantillon tend vers linni, les coefcients estims convergent vers les vrais valeurs On crit : Plim ! = ! On verra la mesure prcise plus tard
Devoir #1
Raliser votre propre exemple de Monte Carlo dans Excel (ou OpenOfce ou NoOfce ou Gretl ou Stata)
Avec 2 rgresseurs, un distribu uniformment dans [0, 1] et lautre distribu normalement n(0, 1), une constante et un terme derreur distribu n(0, 1) Choisissez les valeurs des coefcients
Chapitre 2 :
Le modle classique de rgression linaire
Tout le monde devrait avoir des chiffres diffrents Calculez les coefcients avec les formules
X X sera 3x3 et ! sera 3x1
Poster le devoir sur le forum avant le prochain cours (jeudi au plus tard) sous forme dun seul chier Excel (ou OpenOfce ou NoOfce ou Gretl ou Stata) par personne
Je ne prends pas en compte les chiers envoys autrement
Ce nest pas la mme chose quune corrlation X corrl Y Y corrl X Dans lexemple des ventes de crme glace, la temprature cause les ventes
Un accroissement de temprature provoque un accroissement de demande videmment, ce nest pas parce que les gens mangent plus de glaces que la temprature va augmenter
Dans des modles plus sophistiqus, cette causalit est loin dtre vidente
En macro, le taux de change agit-il sur la balance commerciale ou est-ce linverse ? En marketing, au niveau de la rme, les ventes et les dpenses de publicit sont dites simultanes : chacune est cause de lautre La demande dun produit (quantit) dpend du prix, mais linverse est vrai aussi (simultanit)
Ce que a veut dire : une rgression ne dit elle seule rien dautre que des corrlations
Pour y voir des relations conomiques, il est ncessaire quelle soit accompagne dune thorie
Causalit : conclusion
Lconomtrie, les moyennes conditionnelles, les corrlations ne servent qu quantier, pas expliquer. De telles quantications peuvent conrmer ou inrmer une thorie (parfois)
Par exemple, si la thorie est les hommes sont meilleurs vendeurs que les femmes, on peut comparer les ventes des hommes et des femmes pour inrmer cette thorie
Il est possible de croire que les diffrences entre moyennes conditionnelles sont dues aux conditionneurs
Par exemple, les ventes de Smith sont plus leves que celles de Gonzlez parce que Smith est meilleur vendeur que Gonzlez
Mais il ne faut pas accepter nimporte quel rsultat juste parce quil a t obtenu par des mthodes sophistiques
La prdiction scrit Y = X !
Il y a bien sr toujours une erreur de prdiction
Chaque technique donne lieu une formule, quon appelle estimateur et quon note avec un chapeau
Par exemple Moindres carrs ordinaire ! = X X X 1 Y Il existe galement des estimateurs maximum de vraisemblance , mthode des moments , variables instrumentales , moindres carrs gnraliss ...
1
Ce rsidu scrit parfois e et peut se nommer erreur (mais a porte confusion) Exemple Excel
Le Modle Classique de Rgression Linaire (MCRL) est le modle quon a utilis jusqu prsent, soit, en notation matricielle Y = X! +" Les circonstances dans lesquelles MCO est un bonestimateur Ce modle saccompagne de 7 hypothses classiques
Lorsquelles sont vries, lestimateur MCO possde de trs bonnes proprits On va examiner ces hypothses
Voir dans quels cas elles ne sont pas satisfaites Voir si les consquences sur lestimateur sont graves Voir si on peut rparer
Cette proprit est toujours satisfaite pour autant quil y ait une constante !0 dans la rgression (commande MC dans excel)
2. var ("t ) = & 2 t : la variance de chaque erreur est la mme et est relle = Homoscdasticit 3. cov ("t , "s ) = 0 t = s : les erreurs sont indpendantes entre elles = Pas dauto-corrlation
1+2+3 = Sphricit des erreurs
4. E ("t xt ) = 0 t : il ny a pas de corrlation contemporaine (mme t) entre lerreur et chaque rgresseur = Exognit
Wooldridge
Consistent : A mesure que lchantillon grandit, lestimation MCO se rapproche de la vrai valeur des coefcients
En abrg Plim ! = !
Efcient (prcision)
Un estimateur linaire est dit efcient si sa variance est la plus petite de tous les estimateurs linaires Thorme de Gauss-Markov : cette variance est la plus petite de tous les estimateurs linaires non-biaiss : ! est BLUE est le plus efcient de tous les estimateurs consistents : De plus, ! ! est asymtotiquement efcient
Hypothses pas respectes => MCO perd certaines de ses proprits (Chap 4)
Dans beaucoup de situations conomiques, on souhaite expliquer une variable endogne dichotomique
Acheter ou non, tre employ, Voter Aller luniversit, quelle orientation...
Souvent il sagit de situations micro (individus, mnages, rmes) Le modle linaire nest pas appropri Yi = Xi ! + "i avec Yi {0, 1}
implique quil faudrait contraindre les ! de telle sorte ce que Yi {0, 1} i pas priori possible (trop de contraintes)
Modle de probabilit
Au lieu dexpliquer une variable endogne dichotomique, on propose un modle destimation de la probabilit que la variable endogne soit =1 en fonction de variables explicatives
Pr {Yi = 1|Xi } = F (Xi ! ) o
F est une fonction de distribution Xi ! est dit fonction index
Interprtation
Le signe du coefcient dun rgresseur xj indique le sens de la variation de Pr {Yi = 1} lorsque ce rgresseur saccrot.
Pour avoir une ide quantitative de cette variation, on doit avoir recours aux drives :
$ (Xi ! ) = ) (Xi ! ) !j o ) () est la fonction de densit $ xji normale standard (dans tous les tableurs) $ (Xi ! ) !j Logit = (Xi ! ) $ xij 1 + exp(Xi ! ) Attention : le modle est non-linaire, les effets sont individuels ! Gretl calcule les effets la moyenne des rgresseurs, ce nest pas la mme chose que leffet moyen !
Probit
exp (Xi ! ) 1 + exp(Xi ! ) Probit, bas sur la normale standard Xi ! 1 exp t 2 /2 dt F (Xi ! ) = (Xi ! ) = 2( ' Remarque : argument linaire des fonctions = Modle linaire gnral Logit F (Xi ! ) = (Xi ! ) =
Modle sous-jacent
Il est souvent utile, pour linterprtation et la comprhension, dobtenir le modle de choix dichotomique partir dhypothses comportementales Exemple de lachat dun bien
Soit lutilit individuelle Yi = Xi ! + "i de lachat de ce bien X reprsente des caractristiques observables individuelles ou bien des caractristiques observables du bien (selon les cas, pas les deux) " reprsente les caractristiques inobservables Y est dit variable latente car elle ne peut tre observe, on nobserve que la dcision Y {0, 1} On fait lhypothse que lindividu achte le bien si son utilit dpasse un certain seuil, normalis zro donc :
Estimation
Le modle est non-linaire en ! et la variable endogne nest pas continue
MCO nest pas appropri
Pr {Yi
* Pr {Yi = 0} * Pr {Yi = 1}
Yi =1
On rcrit souvent pour plus de simplicit * (Pr {Yi = 0})1yi (Pr {Yi = 1})yi
i
Maximum de vraisemblance
Gnralement on prend le ln car la forme est plus simple optimiser ln L (! ) = # (1 yi ) ln (1 F (Xi ! )) + yi ln (F (Xi ! ))
i
Proprits de MV
Si les hypothses du MRL sont satisfaites sauf pour la continuit de Y Si la fonction de distribution est correctement choisie
Hypothse pas ncessairement critique (pseudo-maximum de vraisemblance) Gnralement impossible vrier)
Dans la pratique, la seule diffrence substantielle entre Logit et Probit cest que Logit est plus facile calculer
Les coefcients sont diffrents mais pas les pentes
Exemple Gretl
Greene 19_1 : un certain programme denseignement de lconomie (PSI) est valu par laugmentation ou non des notes des tudiants
Grade = 1 si la note a augment, = 0 sinon GPA : Grade Point Average TUCE : score sur un test de connaissance de cette matire PSI = 1 si ltudiant a reu le programme spcial PSI
# exp (xi !j )
Si les variables introduites nexpliquent rien, L0 = L et Pseudo-R 2 = 0 Si le modle explique parfaitement L = 1 et Pseudo-R 2 = 1 Entre les 2, on interprte comme le R 2 du modle linaire
Les coefcients sont diffrents par alternative j ! Lorsque p 1 catgories nont pas t slectionnes, la catgorie p sera forcment choisie
cfr. p = 2 : dichotomique On doit donc normaliser, on va prendre habituellement quune des catgories est la rfrence Ses coefcients sont alors 0
Choix multinomial
Catgorie rfrence 0 : Pr {Yi = 0|xi } = 1
p
exp (xi !k )
p
1 + # exp (xi !j )
j=1
Il faut calculer les effets marginaux, de faon similaire aux modles dichotomiques