Vous êtes sur la page 1sur 138

Cours de Modles Macroconomiques

Professeur Jean-Christian Lambelet


__________________________________________________________________________________________
Recueil de Recherches des Annes Acadmiques 1999-2000 et 2000-2001
__________________________________________________________________________________________
Laure Dutoit: Analyse de la Discrimination Salariale l'Encontre des Femmes en Suisse
Federico Lucini: Fusions-Acquisitions - Analyse des Facteurs Influenant la Profitabilit des
Fusions-Acquisitions en Europe
Hansueli Bacher: Analyse des Rlections au Conseil Fdral de 1947 1999
Clarice Ferraz: Brazilian Rural Poverty - An Investigative Approach
Pascal Dubail: Taux de chmage par rgions en Europe
Jean Nabaa: La Concurrence Fiscale en Suisse
Marian Micu: A Model for Inflation Forecast in Romania - A VAR Approach
Fernando M. M. Ruiz: Observing the Causality Between US and Offshore Centres Interest Rates
Sbastien Lieblich: Liens de Causalit de Granger Entre Les Indices Boursiers et les Agrgats
Macroconomiques
Elena Tatti: Indice du Climat de Consommation et Situation Economique: le Cas de la Suisse
Anna Maria Fiori: Forecasting Financial Market Volatility - Moving Averages, GARCH & Co.
Universit de Lausanne
Ecole des HEC
DEEP Septembre 2001
COURS DE MODLE MACRO
LIENS DE CAUSALIT DE GRANGER ENTRE LES INDICES BOURSIERS
ET LES AGRGATS MACROCONOMIQUES
AVRIL 2001
Sbastien Lieblich
Table des Matires
1 INTRODUCTION.............................................................................................................. 4
2 VARIABLES UTILISES LORS DE LTUDE............................................................ 5
2.1 INDICES BOURSIERS ......................................................................................................... 5
2.2 LES AGRGATS MACROCONOMIQUES............................................................................. 5
3 PRSENTATION THORIQUE DES MTHODES UTILISES.............................. 6
3.1 TEST DE CAUSALIT DE GRANGER................................................................................... 6
3.2 AUTO-RGRESSION VECTORIELLE ET DCOMPOSITION DE LA VARIANCE ......................... 7
3.3 ESTIMATIONS RCURSIVES............................................................................................... 8
4 TEST DE CAUSALIT DE GRANGER : RSULTATS EMPIRIQUES ................. 10
4.1 LIEN DE CAUSALIT ENTRE LE DOW JONES 65 ET LINVESTISSEMENT ........................... 10
4.2 LIEN DE CAUSALIT ENTRE LE S&P 500 ET LINVESTISSEMENT .................................... 11
4.3 LIEN DE CAUSALIT ENTRE LINVESTISSEMENT ET LE NASDAQ 100............................... 11
4.4 LIEN DE CAUSALIT ENTRE LE S&P 500 ET LA CONSOMMATION ................................... 12
4.5 LIEN DE CAUSALIT ENTRE LA CONSOMMATION ET LE DOW JONES 65 .......................... 13
4.6 LIEN DE CAUSALIT ENTRE LE NASDAQ 100 ET LA CONSOMMATION ............................. 13
4.7 LIEN DE CAUSALIT ENTRE LE PIB ET LE DOW JONES 65 / NASDAQ 100....................... 14
4.8 LIEN DE CAUSALIT ENTRE LE S&P 500 / DOW JONES 65 ET LE NASDAQ 100............... 15
5 AUTO-RGRESSION VECTORIELLE ET DCOMPOSITION DE LA
VARIANCE : RSULTATS EMPIRIQUES................................................................. 16
6 ESTIMATIONS RCURSIVES : RSULTATS EMPIRIQUES ............................... 17
7 CONCLUSION................................................................................................................. 18
8 ANNEXES......................................................................................................................... 20
8.1 ANNEXE 1 : TEST DE CAUSALIT DE GRANGER.............................................................. 20
8.2 ANNEXE 2 : AUTO-RGRESSION VECTORIELLE ET DCOMPOSITION DE LA VARIANCE .... 24
8.3 ANNEXE 3 : ESTIMATION RCURSIVE............................................................................. 26
9 BIBLIOGRAPHIE ........................................................................................................... 34
1 Introduction
Le but de cette tude est de dterminer sil existe des liens de causalit dans le sens de
Granger entre les indices boursiers et les principaux agrgats macroconomiques. Si
ces liens existent, il est particulirement intressant de dterminer dans quel sens ils
vont ; est-ce les indices qui causent les agrgats ou est-ce le contraire ? La
direction du lien de causalit peut donner naissance de nouvelles implications dans le
monde de la finance par exemple. En effet, si nous russissons dmontrer que les
agrgats macroconomiques causent lvolution des indices boursiers, alors il est
vident que lanalyse de ces agrgats dans la dtermination dune politique
dinvestissement sur les marchs des produits drivs peut devenir utile.
Dans un autre ordre dide, il serait tout aussi intressant dobtenir le rsultat inverse,
savoir que ce soit les indices boursiers qui causent les principaux agrgats
macroconomiques. Dans ce cas de figure, il serait intressant de voir dans quelle
mesure les autorits centrales pourraient profiter des informations fournies par
lvolution des indices boursiers pour dterminer leurs propres politiques budgtaires
ou montaires.
Dans tous les cas, il est extrmement passionnant de se lancer dans ce type de lien de
causalit selon Granger sur de telles variables car daprs nos larges recherches, rien
na encore t publi ce sujet. La voie est donc encore probablement totalement
vierge et nous esprons pouvoir obtenir des rsultats concluants afin dtre digne de
notre rle de pionniers dans ce domaine.
2 Variables utilises lors de ltude
Toutes les variables utilises dans cette tude proviennent de la base de donnes Data
Stream. Nous utilisons des donnes trimestrielles et nous considrons un chantillon
qui dbute au premier trimestre de lanne 1965 et qui se termine au premier trimestre
2000, sauf pour lindice boursier Nasdaq 100 . En effet, cet indice tant plus rcent
que les autres, nous sommes obligs de prendre en compte un chantillon plus rduit,
savoir du premier trimestre de lanne 1983 au premier trimestre 2000.
2.1 Indices boursiers
Nous avons utilis trois des plus grands indices boursiers amricains, le S&P 500
composite , le Dow Jones composite 65 stock average et le Nasdaq 100 . Le
S&P 500 composite est un indice boursier incluant les 500 plus grandes entreprises
de 11 industries diffrentes aux Etats-Unis. La participation de chaque entreprise dans
la constitution effective de lindice est dtermine par rapport sa capitalisation
boursire
1
. Le Dow Jones composite 65 stock average regroupe trois indices
boursiers de la mme famille, savoir le Dow Jones Industrials (30 titres), le
Dow Jones Transportations (20 titres) et le Dow Jones Utilities (15 titres). La
part dun titre dans la composition de lindice est pondre par rapport son prix sur le
march
2
. Le Nasdaq 100 regroupe les 100 plus grandes compagnies cotes sur le
march du Nasdaq. Ces entreprises reprsentent des industries comme linformatique,
les tlcommunications, linternet ou encore la biotechnologie. Lindice est construit
selon la mme mthodologie que le S&P 500 composite .
2.2 Les agrgats macroconomiques
Nous avons dcid de nous concentrer simplement sur le niveau de consommation, de
linvestissement et, dune manire plus globale, du PIB aux Etats-Unis. Nous pensons
dtenir des informations fondamentales sur ltat de sant du pays grce ces trois
variables.

1
Capitalization-weighted index.
2
Price-weighted index.
3 Prsentation thorique des mthodes utilises
3.1 Test de causalit de Granger
Une question essentielle concernant la spcification de modle est de savoir, si une
variable possde un lien de causalit avec une autre ou non. Afin de fournir une
rponse cette question, Granger (1969) a dvelopp un nouveau concept de lien de
causalit qui est dsormais connu sous lappellation lien de causalit dans le sens de
Granger . Expliqu dune manire synthtique, il sagit simplement de dterminer si
une variable x cause selon Granger une variable y en observant tout dabord dans
quelle mesure les valeurs passes de y arrivent expliquer la valeur actuelle de y et de
voir par la suite lamlioration de lestimation grce la prise en compte de valeurs
retardes de la variable x. Y peut tre considre comme cause selon Granger si la
variable x est dterminante dans lestimation de y ou encore, dune manire
quivalente, si les coefficients des valeurs retardes de la variable x sont
significativement diffrents de zro. Il important de signaler quune double causalit
nest jamais exclure lors de ce test
3
. Il faut tout de mme prciser que la thorie de
Granger a subi un certain nombre de critiques de la part du monde acadmique. Il ne
serait, par exemple, pas possible de dterminer la direction du lien de causalit dgag
dun test (Jacobs, Leamer et Ward ; 1979). Ce problme serait principalement d au
fait que lhypothse nulle teste constitue une condition ncessaire mais non
suffisante, et que ces tests sont extrmement sensibles aux erreurs de spcification.
Cependant, dans notre tude, il nous parat valable dutiliser ces tests de causalit en
respectant naturellement les limites du modle lors de la phase dinterprtation des
rsultats.
Dune manire plus rigoureuse, nous pouvons donc crire la rgression (auto-
rgression bi-varie) suivante reprsentant le point de dpart du test :



+ + +
n
i
n
j
t j t j t i
X Y c Y
1 1
1
(1)
avec
t
un terme derreur alatoire.

3
Y est caus selon Granger par x et x est galement caus selon Granger par y.
Si les coefficients
j
sont significativement diffrents de zro, alors on peut dire que
la prise en compte des valeurs retardes de la variable X dans lquation (1) donne une
meilleure estimation des valeurs futures de Y. Comme il a t prcis plus haut, il va
de soit que lon peut refaire la mme rgression en inversant les variables.
Le modle bi-vari
4
complet devient sous forme matricielle :

,
_

,
_

,
_

,
_

,
_

x
y
t
t
x x
y y
x
y
t
t
x
y
c
c
x
y



1
1
1 1
1 1
(2)
Nous posons que

,
_

xl xl
yl yl
t


, l = 1,, n, et le modle pour n lags scrit :

,
_

,
_

+ +

,
_

,
_

,
_

,
_

x
y
n t
n t
n
t
t
t
t
x
y
t
t
x
y
x
y
x
y
c
c
x
y

...
2
2
2
1
1
1
(3)
Il est important de spcifier que ce test se fait selon lhypothse que les suivent
asymptotiquement une distribution du F. Cela peut tre le cas si les sont des bruits
blancs ; ceci revient donc dire que les sries considres doivent tre des sries
stationnaires. Le cas chant, il est ncessaire de transformer les sries considres en
des sries stationnaires propres tre soumises au test de causalit
5
.
3.2 Auto-rgression vectorielle et dcomposition de la variance
Lauto-rgression vectorielle (VAR) est une mthode qui permet de modliser les liens
dynamiques entre plusieurs variables observes. Cette mthode vite le recours des
modles structurels au sens strict, car il modlise chaque quation du systme en tant
que fonction des valeurs retardes de toutes les variables endognes du systme.

4
Modle bi-vari pour un seul lag.
5
Ce point a cr une grande controverse au sein des milieux acadmiques quant au type de transformation
appliquer et la sensibilit des estimations par rapport ces transformations (Kennedy, 1998).
La forme matricielle complte de lauto-rgression vectorielle est similaire celle du
modle de Granger
6
: (forme avec 3 variables)

,
_

,
_

+ +

,
_

,
_

,
_

,
_

z
x
y
n t
n t
n t
n
t
t
t
t
t
t
z
x
y
t
t
t
z
x
y
z
x
y
z
x
y
c
c
c
z
x
y

...
2
2
2
2
1
1
1
1
(4)
Il faut prciser quil ny a aucun risque de simultanit lors de lestimation, car du ct
droit de lquation (4), on ne trouve que des valeurs retardes. Il va donc de soit que
les moindres carrs ordinaires (MCO) reprsentent la mthode destimation la plus
approprie ; cependant, il faut tout de mme faire attention aux autocorrlations entre
les diffrentes variables.
Aprs avoir estim ces rgressions, nous pourrons utiliser les rsidus afin de procder
la dcomposition de la variance. Cela nous permettra de dterminer la contribution
des valeurs du pass de chaque variable du modle la prvision de la variance de
lune ou lautre des variables du modle dans lavenir.
3.3 Estimations rcursives
Lors destimations rcursives, lquation de base est estime de manire rpte en
utilisant un chantillon toujours grandissant de la srie de donnes initiales. Sil y a k
coefficients estimer dans le vecteur b, alors on utilise les premires k observations
pour estimer le vecteur b. Puis, la prochaine observation est ajoute au k premires afin
dobtenir k+1 observation et la seconde estimation de b. Ce processus est rpt
jusqu ce que les T observations aient t utilises, nous donnant T-k+1 estimation du
vecteur b. A chaque tape, la dernire estimation de b peut tre utilise pour prdire la
prochaine valeur de la variable dpendante. Lerreur de prdiction rsultant dune telle
prvision est appele le rsidu rcursif.
Dune manire plus formelle, dnotons
1 t
X la matrice de dimension ( ) [ ] k t 1
comprenant les rgresseurs de la priode 1 la priode t-1 et
1 t
y le vecteur des
observations de la variable dpendante correspondant. Ces donnes considres

6
Voir ci-dessus au point 3.1.
jusqu la priode t-1 nous permettent destimer le vecteur de coefficients
1 t
b . Ce
vecteur nous donne la possibilit de connatre la valeur de la variable dpendante au
temps t. La prvision est gale
1

t t
b x o
t
x correspond au vecteur ligne des
observations des diffrents rgresseurs au temps t. Lerreur de prvision est gale
:
1

t t t
b x y (5)
et la variance est gale :
( ) ( )
t t t t
x X X x
1
1 1
2
1


+ (6)
Le rsidu rcursif est dfini par lquation suivante :
( ) ( )
2 / 1
1
1 1
1
1
t t t t
t t t
t
x X X x
b x y
w

+

(7)
Ce rsidu peut tre calcul pour les priodes t=k+1,T. Il sera distribu de manire
indpendante et normale avec une moyenne de zro et une variance
2
constante.
Dans le contexte de ce papier, le but dentreprendre ce genre destimation est de
dterminer la stabilit des variables indpendantes travers le temps. Si les
coefficients estims montrent une plus grande volatilit au fur et mesure que lon
augmente la taille de lchantillon, cela prdit une instabilit des variables utilises
lors de lestimation. Ces variations peuvent tre illustres laide de graphiques en
ligne et peuvent aider dterminer dventuelles ruptures structurelles dans le temps.
4 Test de causalit de Granger : rsultats empiriques
A cette tape de ltude, il sagit dappliquer de manire empirique le test de causalit
de Granger
7
nos diffrentes variables et den analyser les rsultats. Le test a t
effectu sur toutes les variables et tous les croisements de couples de variables ont t
pris en considration. Les croisements de couples qui nont pas donn de rsultats
significatifs ne seront pas voqus dans ce papier.
Il nous est apparu opportun de considrer un nombre de lag lors de lexcution des
tests pouvant aller jusqu six. Aller au-del de six nous paraissait absurde car il est
peu probable quune variable puisse avoir une influence sur une autre plus de 18
mois dintervalle
8
. Il est cependant important de prciser quempiriquement, la limite
des six lags est tout fait raliste car dans la plupart des tests, la signification des
rsultats au-del de cette limite commenait devenir de plus en plus faible.
Les rsultats chiffrs des tests ainsi quun schma rcapitulatif des liens de causalit
peuvent tre trouvs lannexe 1 du papier.
4.1 Lien de causalit entre le Dow Jones 65 et linvestissement
Le test de causalit entre lindice boursier Dow Jones 65 et linvestissement aux
Etats-Unis nous permet de rejeter lhypothse nulle selon laquelle le Dow Jones 65
ne cause pas dans le sens de Granger linvestissement. Selon les rsultats empiriques,
nous pouvons dire que le lien de causalit entre ces deux variables est solide. La
causalit selon Granger est fortement significative sur les six lags considrs.
Il nest pas surprenant de voir que le niveau du Dow Jones 65 puisse influencer le
choix dinvestissement des agents conomiques aux Etats-Unis et sur le long terme. En
effet, les tests nous montrent que le niveau de lindice boursier un moment donn
dans le temps peut influencer linvestissement 18 mois.

7
Ce test a t explicit au point 3.1.
8
Nous rappelons que la frquence des sries de donnes observes est trimestrielle.
Cette causalit qui peut tre qualifie de puissante pourrait permettre de faire des
prvisions sur lvolution du niveau de linvestissement aux Etats-Unis apparaissant
raisonnables dans le cadre du modle. Cela donnerait la possibilit lautorit
gouvernementale daccommoder, le cas chant, sa politique en fonction des ces
prvisions. En effet, on peut trs bien imaginer que suite une prvision de hausse de
linvestissement, le gouvernement dcidera de mener une politique budgtaire
expansive ou encore, que lautorit montaire prendra la dcision de mener une
politique montaire restrictive.
4.2 Lien de causalit entre le S&P 500 et linvestissement
Ce test de causalit entre ce couple de variables nous a donn des rsultats similaires
au point 4.1 car ici aussi le test nous a permis de rejeter lhypothse nulle selon
laquelle le S&P500 ne cause pas selon Granger linvestissement. Les rsultats sont
aussi significatifs et puissants que ceux du point prcdent.
Il nest dailleurs pas tonnant de trouver cette similitude entre les indices car si le
Dow Jones 65 , qui comptabilise uniquement 65 entreprises dans sa composition,
cause selon Granger linvestissement, alors le S&P500 qui reprsente un panel de
500 entreprises, devrait afficher le mme lien de causalit envers linvestissement. Au-
del de cette remarque sur lenvergure de reprsentation de ces deux indices boursiers,
linterprtation que nous pouvons donner des rsultats est strictement la mme quau
point 4.1.
4.3 Lien de causalit entre linvestissement et le Nasdaq 100
Les rsultats de ce test sont intressants car ils nous montrent que dans ce cas de
figure, il nous est possible de rejeter lhypothse nulle selon laquelle linvestissement
ne cause pas dans le sens de Granger le Nasdaq 100 . Dailleurs, ce lien de
causalit est prsent dans tous les lags considrs et ceci de manire significative.
En effet, ces liens ne semblent pas reprsenter un cas limite car les estimations sont
explicites ; lhypothse peut tre clairement rejete en vue des des statistiques du F
leves et des probabilits y correspondant.
Ce lien qui pourrait sembler premire vue absurde ne lest cependant pas tant que
cela. Il ne faut pas omettre le fait que le Nasdaq 100 est compos dentreprises de
la nouvelle conomie
9
et que ces dernires ont des cours boursiers trs volatiles. En
comparaison, nos deux autres indices sont composs en majorit de blue chips
10
ayant des cours beaucoup plus stables. De ce fait, il nest pas impossible dimaginer
que les agents conomiques se laisseront guider dans leurs choix dinvestissement par
les indices reprsentatifs de lindustrie amricaine
11
et non par un indice reprsentant
un domaine de lindustrie qui est trs spculatif et instable. En effet, il nest pas
absurde de dire quavant de ddier une partie de son investissement au domaine des
nouvelles technologies, lagent conomique attend de voir comment volue la
croissance industrielle aux Etats-Unis
12
. Si cette dernire affiche de bons rsultats, la
rpercussion sur les indices est immdiate et le niveau dinvestissement global
augmente, ce qui fait galement augmenter le niveau dinvestissement dans le domaine
des nouvelles technologies et ceci peut se traduire par une hausse du niveau de lindice
Nasdaq 100 .
4.4 Lien de causalit entre le S&P 500 et la consommation
Les rsultats nous dmontrent que nous sommes dans ce cas de figure en prsence
dun lien de causalit significatif sur lensemble des lags considrs entre ces deux
variables. Comme au point 4.2 pour linvestissement, les agents semblent avoir la
mme attitude envers la consommation et le niveau du S&P500 peut galement
avoir un effet 18 mois sur cette dernire.
Il semble que dans ce modle, les agents conomiques attendent de voir lvolution du
niveau de lindice boursier pour dterminer leur niveau de consommation posteriori.
On peut donc trs bien imaginer que suite une augmentation du niveau du
S&P500 , les agents sattendent une augmentation du revenu et que cela modifie
leurs contraintes budgtaires et de ce fait, galement leur niveau de consommation
dans le futur.

9
Il sagit plus prcisment dentreprises actives dans le domaine des nouvelles technologies.
10
Le terme blue chips est utilis pour dsigner les grandes entreprises capitalisation boursire leve et
stable.
11
Dans notre cas il sagit du Dow Jones 65 et du S&P500 .
12
Croissance reprsente par lvolution des indices boursiers.
4.5 Lien de causalit entre la consommation et le Dow Jones 65
Dans ce cas, nous avons un lien de causalit dans le sens de Granger qui va de la
consommation vers le Dow Jones 65 et non le contraire. A premire vue, cela peut
sembler trange compte tenu du rsultat du test au point 4.4. Cependant, il est
important de prciser que le test nest significatif que pour les trois premiers lags et
que pour les trois derniers lhypothse nulle ne peut tre rejete.
Par rapport au S&P500 , la composition du Dow Jones 65 nest certainement
pas assez reprsentative de ltat de lconomie pour pouvoir causer la consommation
dans le sens de Granger. Nous avons vu au point 4.4 que la consommation pouvait tre
cause selon Granger par le niveau du S&P500 et ici nous voyons que la
consommation cause le Dow Jones 65 . Nous pouvons donc conclure que pour le
niveau futur du Dow Jones 65 , le niveau de consommation reflte la condition de
lconomie amricaine grce lvolution du S&P500 .
Dans ce contexte, ce lien de causalit pourrait savrer trs utile pour des spculateurs
sur les marchs de produits drivs par exemple, car en observant simplement
lvolution du niveau de consommation, ces derniers pourraient prdire lvolution de
lindice Dow et conclure des contrats terme sur celui-ci.
4.6 Lien de causalit entre le Nasdaq 100 et la consommation
Ce test reprsente un cas trs intressant de ltude car nous nous trouvons en prsence
dune double causalit. En effet, le test nous dmontre quil est possible de rejeter
lhypothse nulle selon laquelle le Nasdaq 100 ne cause pas dans le sens de
Granger la consommation et simultanment le test nous dmontre que lon peut rejeter
lhypothse nulle que la consommation ne cause pas selon Granger le Nasdaq 100 .
De plus, les deux liens de causalit sont significatifs sur les six lags considrs.
Nous pensons que cette double causalit est provoque dans les deux cas indirectement
par lindice S&P500 . En effet, le S&P500 cause selon Granger la fois la
consommation
13
et le Nasdaq 100
14
. Comme les deux variables refltent et sont

13
Voir point 4.4.
14
Voir point 4.6.
dtermines simultanment par lvolution du niveau de lindice S&P500 , elles
doivent forcment afficher un double lien de causalit entre elles. En dautres mots,
comme la consommation est cause selon Granger par le S&P500 , elle doit son
tour causer selon Granger le Nasdaq 100 qui dpend galement du S&P500 et
vice versa.
Dun point de vue pratique, la seule utilit du lien de causalit entre la consommation
et le Nasdaq 100 est de spculer comme dcrit au point 4.5.
4.7 Lien de causalit entre le PIB et le Dow Jones 65 / Nasdaq 100
Le test nous a dmontr que le PIB cause dans le sens de Granger la fois le Dow
Jones 65 et le Nasdaq 100 mais pas le S&P500 . En ce qui concerne le lien
avec le Nasdaq 100 , il est significatif sur les quatre premiers lags et pour le
Dow Jones 65 il est significatif uniquement au premier lag .
Il est tout fait sens dimaginer que le PIB cause selon Granger directement ces deux
indices car lvolution du PIB reflte ltat de sant de lconomie et de ce fait
indirectement ltat de sant des marchs financiers. Le fait que le lien soit plus
prononc avec le Nasdaq 100 est explicable par largument que les entreprises
composant lindice boursier dpendent plus fortement de la conjoncture
15
et que leurs
cours boursiers sont plus sensibles aux fluctuations que ceux des entreprises qui
composent le Dow Jones 65 . De plus, nous pensons que la raison pour laquelle il
ny a pas de lien avec le S&P500 est simplement que la composition de lindice est
trop vaste pour que le PIB puisse avoir un effet sur lindice en tant que tel.
A nouveau, ce lien de causalit dans le sens de Granger peut tre dune certaine utilit
dans la gestion dactifs boursiers.

15
De ce fait, directement du niveau de PIB.
4.8 Lien de causalit entre le S&P 500 / Dow Jones 65 et le Nasdaq 100
Les rsultats indiquent un lien de causalit entre les deux indices principaux, le Dow
Jones 65 et le S&P500 , et lindice des nouvelles technologies Nasdaq 100 .
En effet, le Nasdaq 100 est caus significativement sur les six lags par les deux
autres indices.
Cependant, ce cas de figure nest absolument pas tonnant car jusqu prsent le
Nasdaq 100 a toujours t prsent comme une variable fortement dpendante de
ltat de lconomie et ici les deux indices principaux refltent approximativement cet
tat. Dans tous les cas, nous pouvons affirmer que le Nasdaq 100 suit lvolution
de ses deux grands frres et ne dtermine pas encore lui-mme son chemin de
croissance.
5 Auto-rgression vectorielle et dcomposition de la variance :
rsultats empiriques
Afin de consolider nos rsultats, nous avons pouss notre analyse un peu plus loin en
estimant des VAR. Nous avons donc estim six VAR trois variables en respectant la
limite de six lags . Le but tait ensuite de procder la dcomposition de la
variance des variables causes selon Granger pour confirmer ou non les liens de
causalit. Il est cependant important de prciser que lordre dans lequel on place les
variables dans la VAR influe sur la dcomposition de la variance et cest pourquoi
nous avons considr plusieurs ordres diffrents. Les chiffres exacts de lanalyse
peuvent tre trouvs lannexe 2.
Dans toutes les dcompositions que nous avons effectues, nous avons remarqu la
forte capacit des variables causes dans le sens Granger prdire leur propre
variabilit. Au-del, lanalyse de la dcomposition de la variance na amen aucune
surprise et elle na pu que confirmer les rsultats obtenus lors des tests de causalit de
Granger. Dans toutes les dcompositions, les variables tant la base de tous liens de
causalit de Granger expliquent en moyenne entre 3% et 45% de la variance des
variables causes, ce qui conforte les liens dcrits au point 4. Les deux seules
exceptions que nous avons pu noter sont celles des liens de causalit dans le sens de
Granger entre linvestissement et le Nasdaq 100 ainsi quentre le PIB et le Dow
Jones 65 . En effet, les rsultats empiriques nous montrent dans le premier cas que
linvestissement ne contribue qu concurrence de 0.3% 3%
16
la variabilit du
Nasdaq 100 , ce qui ne nous permet pas de rejeter catgoriquement le lien de
causalit mais, il nous pousse cependant temprer nos affirmations du point 4.3. La
deuxime exception est malheureusement plus lourde de consquences car la
dcomposition de la variance du Dow Jones 65 nous montre que le PIB ne
contribue qu hauteur de 1% la variabilit de lindice boursier. Ce rsultat affaiblit
significativement notre analyse du point 4.7 et nous pousse mme envisager
labandon de ce lien de causalit.

16
Ceci sur les six lags considrs.
6 Estimations rcursives : rsultats empiriques
A cette tape de ltude, nous avons pouss lanalyse un peu plus loin afin de voir si
les liens de causalit dans le sens de Granger pouvaient fluctuer dans le temps ou si, en
revanche, ils taient valables uniquement sur une priode limite. Cest pour rpondre
cette interrogation que nous avons eu recours aux estimations rcursives. Tous les
rsultats graphiques de lanalyse peuvent tre trouvs lannexe 3.
Les rsultats sont frappants car les estimations nous montrent que les variables
considres sont instables dans le temps. Au contraire, si ces variables taient stables,
les graphiques des estimations lannexe 3 devraient prsenter des coefficients
quasiment stables et non volatiles
17
. Cela nous dmontre clairement que lon ne peut
pas prendre les liens de causalit selon Granger comme immuables, au contraire, ils
paraissent uniquement valables dans un contexte donn.
Notre analyse fait ressortir nettement deux ruptures de cycle dans la priode de temps
considre dans notre tude. La premire se situe au dbut des annes 80 et ceci
correspond exactement la priode Volcker aux Etats-Unis. En effet cette priode, le
prsident de la Rserve Fdrale des Etats-Unis, Paul Volcker, avait dcid de mener
une politique montaire restrictive. En parallle cette dcision, le Prsident de
lpoque, Ronald Reagan, avait dcid de mener une politique budgtaire expansive en
diminuant fortement la charge fiscale des contribuables. Il est donc facile imaginer
que les deux politiques allant sens contraire
18
, la rpercussion sur les marchs
financiers a t significative. La deuxime rupture se situe la fin de lanne 1998 et
correspond la crise financire gnralise de lpoque. Cette crise a fait suite au
prolongement de la crise asiatique de 1997 et surtout au dfaut de paiement de la
Russie au milieu de lanne 1998. A nouveau, il est clair que cette crise sest
rpercute de manire significative sur lvolution des indices boursiers.
Il est donc dangereux de considrer les liens de causalit analyss lors de cette tude
comme des certitudes et de les utiliser en tant quoutils de prvisions long terme. On
peut donc dire quil est discutable dutiliser ces rsultats statistiques en tant quoutils
de spculation comme nous avons pu le dcrire au point 4.

17
La ligne reprsente dans les diffrents graphiques devrait tre plate partir de la fin du premier tiers du
graphique en partant de la gauche.
18
Suivant la thorie du modle IS-LM.
7 Conclusion
Nous avons pu voir dans cette tude qua premire vue, les diffrents liens de causalit
analyss nous donnent de nouveaux outils de prvisions extrmement puissants. Que
ce soit pour les investisseurs sur les marchs financiers ou pour les politiciens, les
rsultats obtenus lors des tests de causalit de Granger peuvent sembler tre dune
certaine utilit. Cependant, en poussant notre analyse un peu plus loin, nous avons
ralis que nos rsultats ntaient pas aussi clairs quils en avaient lair. Les VAR puis
les dcompositions de variances nous ont bien dmont que dun du point de vue
gnral, elles confirmaient les conclusions des tests de causalit de Granger, mais qu
deux reprises, les rsultats pouvait-en tre contests. De plus, les estimations
rcursives effectues en fin dtude, nous ont clairement montr quil tait dangereux
de tirer des conclusions htives sur les liens potentiels qui lient les diffrentes
variables entre elles.
Que peut-on alors dire pratiquement sur ces liens de causalit entre nos variables ? Il
est vrai quils existent et que de ce point de vue les tests sont concluants. Ces tests ne
sont cependant pas assez affins pour en tirer des conclusions lourdes de
consquences. Il est donc tout fait judicieux de les rexaminer grce aux
dcompositions de variances pour les confirmer ou les affirmer. Ceci tant fait, les
liens valables peuvent tre considrs plus srieusement en tant quoutils de prvisions
mais, notre avis il serait faux de prendre des dcisions uniquement sur la base de ces
outils. Ces liens peuvent donc constituer une aide la dcision mais, ils ne devraient
en aucun cas reprsenter le facteur dterminant de la prise de dcision.
De plus, le fait que les liens ne soient pas immuables dans le temps corrobore
exactement la prudence qui doit tre de mise. En effet, les estimations rcursives nous
ont montr que les liens pouvaient voluer et il serait donc risqu de prtendre avoir
trouver loutil de prvision gnral et applicable toutes les situations. Il faut replacer
tous les liens de causalit dans leur contexte et tre bien conscient que les causalits en
vigueur un moment donn peuvent rapidement devenir obsoltes. Ces liens sont la
proie des tendances qui frappent les marchs financiers, ce qui rend lapplication
directe de ces derniers en tant quoutils de prvision encore plus difficile.
Il est donc possible dutiliser ces liens de causalit afin de dterminer une stratgie
dinvestissement ou une politique gouvernementale mais, il faut tre conscient que
cela reprsente des risques considrables et quil faut donc agir avec la plus grande
prudence.
8 Annexes
8.1 Annexe 1 : test de causalit de Granger
Figure A :Schma rcapitulatif des liens de causalit
Invest
Cons
GDP
SP500
Nas100 DJ65
*1)
*2)
*3)
*1) lag 1 - 3
*2) lag 1
*3) lag 1 - 4
Tableau A : Test de causalit entre le Dow Jones 65 et investissement
GRPRINV does not Granger Cause DJCO65SA DJCO65SA does not Granger Cause GRPRINV
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 4.15792 0.04336 140 1 6.98465 0.00918 140
2 2.03373 0.13487 139 2 5.99367 0.00321 139
3 1.73509 0.16295 138 3 4.13799 0.00771 138
4 0.89229 0.47067 137 4 5.38198 0.00049 137
5 0.88266 0.49489 136 5 4.32487 0.00116 136
6 1.4544 0.19956 135 6 3.16979 0.00634 135
GRPRINV : Gross Private Investment
DJCO65SA : Dow Jones Composite 65 Stock Average
Tableau B : Test de causalit entre le Dow Jones 65 et consommation
PRCON does not Granger Cause DJCO65SA DJCO65SA does not Granger Cause PRCON
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 4.43367 0.03706 140 1 1.9473 0.16514 140
2 3.47765 0.0337 139 2 2.67172 0.07282 139
3 3.08845 0.02947 138 3 2.29338 0.08099 138
4 1.71341 0.15097 137 4 1.7064 0.15254 137
5 1.40206 0.22804 136 5 1.51691 0.18921 136
6 1.20362 0.309 135 6 1.33749 0.24566 135
PRCON : Private Consumption
Tableau C : Test de causalit entre le Dow Jones 65 et PIB
GDP does not Granger Cause DJCO65SA DJCO65SA does not Granger Cause GDP
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 4.69321 0.03201 140 1 0.35943 0.54981 140
2 2.27816 0.10643 139 2 0.53921 0.58447 139
3 1.95994 0.12317 138 3 0.45635 0.71326 138
4 1.1337 0.34363 137 4 0.56002 0.69208 137
5 0.94727 0.45304 136 5 0.86121 0.5093 136
6 0.8422 0.53974 135 6 1.19777 0.31204 135
GDP: Gross Domestic Product
Tableau D: Test de causalit entre S&P 500 et linvestissement
GRPRINV does not Granger Cause SP500CO SP500CO does not Granger Cause GRPRINV
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 1.30388 0.2555 140 1 5.33216 0.02243 140
2 0.47942 0.6202 139 2 4.51723 0.01263 139
3 1.12488 0.34149 138 3 3.19259 0.02581 138
4 0.81187 0.5198 137 4 4.47413 0.00204 137
5 1.28492 0.27457 136 5 3.4852 0.00554 136
6 1.40296 0.21884 135 6 2.75005 0.01531 135
GRPRINV: Gross Private Investment
SP500CO: S&P 500 Composite
Tableau E : Test de causalit entre S&P 500 et la consommation
PRCON does not Granger Cause SP500CO SP500CO does not Granger Cause PRCON
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 0.51653 0.47355 140 1 6.0632 0.01504 140
2 2.75689 0.06709 139 2 3.01832 0.05222 139
3 2.22962 0.08777 138 3 3.69228 0.01363 138
4 2.2363 0.06868 137 4 2.73398 0.03178 137
5 1.87594 0.10316 136 5 3.0178 0.01318 136
6 1.54123 0.17033 135 6 2.60776 0.02058 135
PRCON: Private Consumption
Tableau F : Test de causalit entre Nasdaq 100 et linvestissement
GRPRINV does not Granger Cause NASDAQ100 NASDAQ100 does not Granger Cause GRPRINV
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 13.602 0.00046 68 1 3.06313 0.08481 68
2 5.94514 0.00434 67 2 2.74077 0.07234 67
3 8.30511 0.00011 66 3 1.79669 0.15766 66
4 8.7295 1.50E-05 65 4 1.12475 0.35414 65
5 4.14915 0.00297 64 5 0.79037 0.56135 64
6 3.70705 0.00399 63 6 0.62934 0.706 63
GRPRINV: Gross Private Investment
Tableau G : Test de causalit entre Nasdaq 100 et la consommation
PRCON does not Granger Cause NASDAQ100 NASDAQ100 does not Granger Cause PRCON
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 11.3326 0.00128 68 1 37.3218 6.30E-08 68
2 7.21427 0.00152 67 2 17.8325 7.60E-07 67
3 7.27112 0.00031 66 3 11.1854 6.50E-06 66
4 5.10956 0.0014 65 4 4.76759 0.00221 65
5 3.5193 0.00805 64 5 4.8822 0.00095 64
6 3.07989 0.01209 63 6 4.09308 0.00204 63
PRCON: Private Consumption
Tableau H : Test de causalit entre Nasdaq 100 et le PIB
GDP does not Granger Cause NASDAQ100 NASDAQ100 does not Granger Cause GDP
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 12.0308 0.00093 68 1 10.8015 0.00164 68
2 5.00568 0.00965 67 2 6.56382 0.0026 67
3 5.55247 0.002 66 3 4.49075 0.00662 66
4 5.34112 0.00103 65 4 2.73187 0.03787 65
5 2.00393 0.09308 64 5 2.00977 0.09221 64
6 1.82815 0.11249 63 6 1.59878 0.16711 63
Tableau I : Test de causalit entre Nasdaq 100 et le Dow Jones 65
NASDAQ100 does not Granger Cause DJCO65SA DJCO65SA does not Granger Cause NASDAQ100
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 0.93491 0.33717 68 1 34.5394 1.60E-07 68
2 2.78222 0.06964 67 2 18.9347 3.80E-07 67
3 1.99199 0.12498 66 3 23.5824 3.70E-10 66
4 1.12704 0.35309 65 4 19.5775 4.00E-10 65
5 1.72417 0.14512 64 5 9.90783 9.90E-07 64
6 1.60203 0.16619 63 6 9.09166 1.00E-06 63
Tableau J : Test de causalit entre Nasdaq 100 et le S&P 500
NASDAQ100 does not Granger Cause SP500CO SP500CO does not Granger Cause NASDAQ100
Lag(s) F-Statistic Probability Obs Lag(s) F-Statistic Probability Obs
1 1.02353 0.31543 68 1 34.2574 1.70E-07 68
2 1.08304 0.34488 67 2 16.3577 2.00E-06 67
3 1.04768 0.37828 66 3 25.5228 1.00E-10 66
4 1.51638 0.20985 65 4 20.3274 2.20E-10 65
5 3.47734 0.00861 64 5 9.31768 2.10E-06 64
6 2.79035 0.02028 63 6 8.59048 2.00E-06 63
8.2 Annexe 2 : auto-rgression vectorielle et dcomposition de la variance
Tableau A : Dcomposition de la variance du Nasdaq 100 grce aux deux
autres indices boursiers
Tableau B : Dcomposition de la variance de linvestissement grce au S&P
500 et au Dow Jones 65
Tableau C : Dcomposition de la variance du Nasdaq 100 grce au S&P
500 et linvestissement
Tableau D : Dcomposition de la variance de la consommation grce au S&P
500 et au Nasdaq 100
Variance Decomposition of NASDAQ100: Variance Decomposition of NASDAQ100:
Period S.E. NASDAQ100 DJCO65SA SP500CO Period S.E. NASDAQ100 SP500CO DJCO65SA
1 70.94016 100 0 0 1 70.94016 100 0 0
2 122.84 92.79644 5.972883 1.230681 2 122.84 92.79644 3.389167 3.814397
3 184.7135 90.31679 9.128784 0.554431 3 184.7135 90.31679 7.235226 2.447989
4 294.1183 88.63044 10.63322 0.736342 4 294.1183 88.63044 10.28874 1.080817
5 474.7919 86.33541 12.48594 1.17865 5 474.7919 86.33541 13.20005 0.46454
6 766.6641 84.21657 13.95277 1.83066 6 766.6641 84.21657 15.60153 0.181898
Variance Decomposition of GRPRINV: Variance Decomposition of GRPRINV:
Period S.E. GRPRINV DJCO65SA SP500CO Period S.E. GRPRINV SP500CO DJCO65SA
1 21.55596 100 0 0 1 21.55596 100 0 0
2 32.3815 96.25974 3.72532 0.014939 2 32.3815 96.25974 3.358554 0.381705
3 40.68135 92.38027 7.358573 0.261153 3 40.68135 92.38027 5.659202 1.960524
4 50.69484 87.76808 11.89867 0.333253 4 50.69484 87.76808 9.03902 3.192904
5 58.68214 83.31977 16.12937 0.550857 5 58.68214 83.31977 11.96137 4.718854
6 64.09283 79.9084 19.62893 0.462668 6 64.09283 79.9084 15.31082 4.78078
Variance Decomposition of NASDAQ100: Variance Decomposition of NASDAQ100:
Period S.E. NASDAQ100 SP500CO GRPRINV Period S.E. NASDAQ100 GRPRINV SP500CO
1 45.3007 100 0 0 1 45.3007 100 0 0
2 66.62418 90.41848 9.483671 0.097849 2 66.62418 90.41848 0.34035 9.24117
3 93.60922 63.14853 35.48062 1.370852 3 93.60922 63.14853 0.602917 36.24856
4 125.1976 49.71783 41.25093 9.031245 4 125.1976 49.71783 6.365059 43.91711
5 174.7084 53.99778 39.04975 6.952467 5 174.7084 53.99778 4.573705 41.42851
6 260.4984 49.13224 45.4097 5.458054 6 260.4984 49.13224 3.170284 47.69747
Variance Decomposition of PRCON: Variance Decomposition of PRCON:
Period S.E. PRCON SP500CO NASDAQ100 Period S.E. PRCON NASDAQ100 SP500CO
1 14.55489 100 0 0 1 14.55489 100 0 0
2 19.08932 99.78761 0.001472 0.210918 2 19.08932 99.78761 0.187487 0.024903
3 24.65253 94.84544 2.087921 3.066642 3 24.65253 94.84544 1.736419 3.418145
4 33.34689 83.84664 7.640073 8.513284 4 33.34689 83.84664 4.379879 11.77348
5 39.43602 72.73686 10.65621 16.60693 5 39.43602 72.73686 9.531843 17.7313
6 48.19226 58.05133 14.33393 27.61474 6 48.19226 58.05133 16.70411 25.24457
Tableau E : Dcomposition de la variance du Nasdaq 100 grce au S&P
500 et la consommation
Tableau F : Dcomposition de la variance du Dow Jones 65 grce au PIB et
la consommation
Variance Decomposition of NASDAQ100: Variance Decomposition of NASDAQ100:
Period S.E. NASDAQ100 PRCON SP500CO Period S.E. NASDAQ100 SP500CO PRCON
1 71.24804 100 0 0 1 71.24804 100 0 0
2 136.6202 91.05393 3.198293 5.747777 2 136.6202 91.05393 6.752335 2.193735
3 239.0337 84.89126 2.792707 12.31603 3 239.0337 84.89126 13.55263 1.556107
4 413.4109 79.16794 2.474069 18.35799 4 413.4109 79.16794 19.71989 1.112169
5 711.5048 74.82846 2.22527 22.94627 5 711.5048 74.82846 24.34901 0.822533
6 1221.007 71.83013 2.058088 26.11178 6 1221.007 71.83013 27.52069 0.649184
Variance Decomposition of DJCO65SA: Variance Decomposition of DJCO65SA:
Period S.E. DJCO65SA PRCON GDP Period S.E. DJCO65SA GDP PRCON
1 71.08342 100 0 0 1 71.08342 100 0 0
2 99.59849 97.62857 1.720627 0.650805 2 99.59849 97.62857 0.00186 2.369573
3 122.1468 97.02479 2.208645 0.766565 3 122.1468 97.02479 0.007866 2.967344
4 140.633 96.48788 2.539192 0.972927 4 140.633 96.48788 0.006133 3.505985
5 156.5051 96.09511 2.709679 1.195209 5 156.5051 96.09511 0.013226 3.891662
6 170.455 95.75046 2.804234 1.445305 6 170.455 95.75046 0.036381 4.213159
8.3 Annexe 3 : estimation rcursive
Graph. A : Estimation rcursive entre la consommation et le Nasdaq 100
-100
-50
0
50
100
150
200
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(1) Estimates 2 S.E.
-0.5
0.0
0.5
1.0
1.5
2.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(2) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(3) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(4) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(5) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(6) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(7) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(8) Estimates 2 S.E.
-0.8
-0.4
0.0
0.4
0.8
1.2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(9) Estimates 2 S.E.
-1.2
-0.8
-0.4
0.0
0.4
0.8
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(10) Estimates 2 S.E.
-0.8
-0.4
0.0
0.4
0.8
1.2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(11) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(12) Estimates 2 S.E.
-0.8
-0.4
0.0
0.4
0.8
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : consommation
C(8) C(13) : Nasdaq 100
Graph. B : Estimation rcursive entre la consommation et le S&P 500
-80
-40
0
40
80
75 80 85 90 95 00
Recursive C(1) Estimates 2 S.E.
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
75 80 85 90 95 00
Recursive C(2) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
75 80 85 90 95 00
Recursive C(3) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(4) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(5) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(6) Estimates 2 S.E.
-0.8
-0.4
0.0
0.4
0.8
1.2
75 80 85 90 95 00
Recursive C(7) Estimates 2 S.E.
-0.8
-0.4
0.0
0.4
0.8
75 80 85 90 95 00
Recursive C(8) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(9) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
75 80 85 90 95 00
Recursive C(10) Estimates 2 S.E.
-1.2
-0.8
-0.4
0.0
0.4
0.8
75 80 85 90 95 00
Recursive C(11) Estimates 2 S.E.
-1.2
-0.8
-0.4
0.0
0.4
0.8
75 80 85 90 95 00
Recursive C(12) Estimates 2 S.E.
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
75 80 85 90 95 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : consommation
C(8) C(13) : S&P 500
Graph. C : Estimation rcursive entre le PIB et le Nasdaq 100
-200
0
200
400
600
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(1) Estimates 2 S.E.
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(2) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(3) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(4) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(5) Estimates 2 S.E.
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(6) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(7) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(8) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(9) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(10) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(11) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(12) Estimates 2 S.E.
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : PIB
C(8) C(13) : Nasdaq 100
Graph. D : Estimation rcursive entre linvestissement et le Dow Jones 65
-150
-100
-50
0
50
100
150
75 80 85 90 95 00
Recursive C(1) Estimates 2 S.E.
-0.5
0.0
0.5
1.0
1.5
2.0
75 80 85 90 95 00
Recursive C(2) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(3) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(4) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(5) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
75 80 85 90 95 00
Recursive C(6) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(7) Estimates 2 S.E.
-0.2
0.0
0.2
0.4
0.6
75 80 85 90 95 00
Recursive C(8) Estimates 2 S.E.
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
75 80 85 90 95 00
Recursive C(9) Estimates 2 S.E.
-0.6
-0.4
-0.2
0.0
0.2
0.4
75 80 85 90 95 00
Recursive C(10) Estimates 2 S.E.
-0.4
-0.2
0.0
0.2
0.4
0.6
75 80 85 90 95 00
Recursive C(11) Estimates 2 S.E.
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
75 80 85 90 95 00
Recursive C(12) Estimates 2 S.E.
-0.4
-0.2
0.0
0.2
0.4
75 80 85 90 95 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : investissement
C(8) C(13) : Dow Jones 65
Graph. E : Estimation rcursive entre linvestissement et le S&P 500
-150
-100
-50
0
50
100
150
75 80 85 90 95 00
Recursive C(1) Estimates 2 S.E.
-0.5
0.0
0.5
1.0
1.5
2.0
75 80 85 90 95 00
Recursive C(2) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(3) Estimates 2 S.E.
-0.8
-0.4
0.0
0.4
0.8
1.2
75 80 85 90 95 00
Recursive C(4) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(5) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
75 80 85 90 95 00
Recursive C(6) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
75 80 85 90 95 00
Recursive C(7) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
75 80 85 90 95 00
Recursive C(8) Estimates 2 S.E.
-2
-1
0
1
2
75 80 85 90 95 00
Recursive C(9) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(10) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
75 80 85 90 95 00
Recursive C(11) Estimates 2 S.E.
-3
-2
-1
0
1
2
75 80 85 90 95 00
Recursive C(12) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
75 80 85 90 95 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : investissement
C(8) C(13) : S&P 500
Graph. F : Estimation rcursive entre le Nasdaq 100 et le Dow Jones 65
-100
-50
0
50
100
150
200
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(1) Estimates 2 S.E.
-4
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(2) Estimates 2 S.E.
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(3) Estimates 2 S.E.
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(4) Estimates 2 S.E.
-2
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(5) Estimates 2 S.E.
-2
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(6) Estimates 2 S.E.
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(7) Estimates 2 S.E.
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(8) Estimates 2 S.E.
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(9) Estimates 2 S.E.
-0.4
-0.2
0.0
0.2
0.4
0.6
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(10) Estimates 2 S.E.
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(11) Estimates 2 S.E.
-0.6
-0.4
-0.2
0.0
0.2
0.4
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(12) Estimates 2 S.E.
-0.4
-0.2
0.0
0.2
0.4
0.6
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : Nasdaq 100
C(8) C(13) : Dow Jones 65
Graph. G : Estimation rcursive entre le Nasdaq 100 et linvestissement
-800
-600
-400
-200
0
200
400
600
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(1) Estimates 2 S.E.
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(2) Estimates 2 S.E.
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(3) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(4) Estimates 2 S.E.
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(5) Estimates 2 S.E.
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(6) Estimates 2 S.E.
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(7) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(8) Estimates 2 S.E.
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(9) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(10) Estimates 2 S.E.
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(11) Estimates 2 S.E.
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(12) Estimates 2 S.E.
-1.5
-1.0
-0.5
0.0
0.5
1.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : Nasdaq 100
C(8) C(13) : investissement
Graph. H : Estimation rcursive entre le Nasdaq 100 et le S&P 500
-100
-50
0
50
100
150
200
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(1) Estimates 2 S.E.
-4
-2
0
2
4
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(2) Estimates 2 S.E.
-4
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(3) Estimates 2 S.E.
-4
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(4) Estimates 2 S.E.
-2
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(5) Estimates 2 S.E.
-2
-1
0
1
2
3
4
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(6) Estimates 2 S.E.
-3
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(7) Estimates 2 S.E.
-2
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(8) Estimates 2 S.E.
-2
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(9) Estimates 2 S.E.
-2
-1
0
1
2
3
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(10) Estimates 2 S.E.
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(11) Estimates 2 S.E.
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(12) Estimates 2 S.E.
-2
-1
0
1
2
89 90 91 92 93 94 95 96 97 98 99 00
Recursive C(13) Estimates 2 S.E.
C(1) : constante
C(2) C(7) : Nasdaq 100
C(8) C(13) : S&P 500
9 Bibliographie
Greene W. H. (2000), Econometric Analysis, 4
me
dition, Prentice-Hall
International, Upper Saddle River NJ
Griffiths W. E., Judge G. G. (1985), The theory and practice of econometrics,
2
me
dition, John Wiley & Sons, Chichester
Hamilton J. D. (1994), Time Series Analysis, Princeton University Press,
Princeton NJ
Jacobs R. L., Leamer E. E., Ward M. P. (1979), Difficulties with testing for
causation, Economic Inquiry, Vol. 17, juillet
Kennedy P. (1998), A Guide to Econometrics, 4
me
dition, The MIT Press,
Cambridge MA
Lettau M., Ludvigson S. (1999), Consumption, Aggregate Wealth and Expected
Stock Return, juin, Federal Reserve Bank of New York
Lucini F. (2000), Competitors Global & Regional Indices, MSCI Working-
paper, septembre, Genve
Ludvigson S., Steindel Ch. (1999), How Important Is the Stock Market Effect
on Consumption, FRBNY Economic Policy Review, juillet
Pindyck R. S., Rubinfeld D. L. (1991), Econometric models and economic
forecasts, McGraw-Hill, New York
Poterba J. M. (2000), Stock Marcket Wealth and Consumption, Journal of
Economic Perspectives, volume 14, printemps, p. 99 - 118
Souleles N. S. (1999), Household Securities Purchases, Transactions Costs and
Hedging Motives, The Wharton School, University of Pennsylvania
Cours "Modles macroconomiques"
Professeur Jean-Christian Lambelet
Jos Anson, assistant
Analyse de la discrimination salariale
l'encontre des femmes en Suisse
Laure Dutoit
Ecole des HEC, universit de Lausanne
Mai 2001
Table des matires
1. Introduction 3
2. Problmatique 3
3. Construction du modle 6
3.1. Le modle 6
3.2. Les variables explicatives 7
4. Mthode dite d'Oaxaca-Blinder 10
5. Rgression directe versus rgression inverse 11
5.1. Explication de la mthode 11
5.2. Justification de l'utilisation de la rgression inverse 12
5.3. Application 14
5.3.1. Rgression directe 14
5.3.2. Rgressions inverses 18
5.4. Conclusion sur la rgression inverse 30
6. La correction de Heckman 31
6.1. Explication de la mthode de Heckman 31
6.2. Application de la mthode de Heckman 32
6.3. Conclusion sur la correction de Heckman 39
7. Conclusion 39
8. Remerciements 39
9. Bibliographie 40
Annexe
1. Introduction
La loi fdrale sur l'galit entre les femmes et les hommes est entre en vigueur le 1
er
juillet 1996. Si cette loi a
t cre, c'est parce que des plaintes au sujet de traitements ingaux sur le march du travail entre les femmes et
les hommes se sont fait entendre de la part de la population. La discrimination est donc rellement ressentie par
la population se trouvant sur le march du travail.
En 1997, un an aprs l'entre en vigueur de la loi, comment la situation a-t-elle volu ? Cette loi est-elle assez
puissante pour liminer la discrimination ? Je ne le pense pas ; ou en tous cas pas en une anne. Selon toute
logique, on devrait encore trouver une discrimination sur le march du travail entre les hommes et les femmes.
Tel est le but de mon tude : dterminer s'il existe encore de telles ingalits sur le march du travail suisse.
Cependant, la discrimination laquelle je m'intresse est une des nombreuses sortes d'ingalits qu'on peut
trouver sur ce march du travail. En effet, la discrimination peut tre pratique par l'employeur par diffrents
biais, tels que lors de l'embauche, dans la rpartition des tches, dans la rmunration, dans la promotion Le
cas dont je me proccupe est la discrimination au niveau salarial.
Le but de ce papier est donc plus prcisment de mesurer objectivement (ce qui n'est pas toujours
facile) s'il existe une discrimination salariale l'encontre des femmes.
2. Problmatique
Les tudes concernant le march du travail (en Suisse et dans beaucoup d'autres pays) observent sans exception
que les femmes ont en moyenne des niveaux de salaire infrieurs ceux des hommes et cela, depuis bien
longtemps.
La question qui se pose est alors : "Comment cela se fait-il?". Le seul moyen existant afin de pouvoir rpondre
cette interrogation est de se glisser dans la peau d'un employeur et de comprendre comment il fixe les salaires de
ses employs.
Selon toute logique, une entreprise a pour but la maximisation de son revenu et pour ce faire, elle va payer ses
salaris proportionnellement ce qu'ils lui rapportent, c'est dire, en fonction de leur productivit propre. Ainsi,
quel que soit le sexe du travailleur, le salaire de ce dernier devrait tre dtermin uniquement par sa rentabilit.
Quelles sont alors les raisons qui justifient de telles diffrences de rmunration entre les femmes et les hommes
?
En ce qui concerne la productivit des hommes, les facteurs qui rentrent en jeu sont relativement simples
dterminer : ce sont le niveau de formation, l'ge, l'exprience acquise, son investissement dans l'entreprise
Pour une femme, ces critres sont complts par d'autres d'ordre familial. Par exemple, on considre que le jeune
ge ou le fait d'tre jeune marie peut entrer ngativement dans la dtermination du niveau de salaire. En effet,
tant donn que les jeunes femmes on en gnral le dsire d'avoir des enfants, l'employeur peut envisager de la
payer moins que leurs collgues masculins, en justifiant que ces femmes risquent de quitter l'entreprise assez
rapidement et donc, de moins s'investir dans l'entreprise que les autres employs.
L'employeur considrerait ainsi qu' moyen terme, la productivit de l'homme est suprieure celle de la femme
cause de son jeune ge, toutes choses tant gales par ailleurs.
Cela ne constitue pas en soi une discrimination, puisque l'employeur rflchit en termes de maximisation de
revenu, mais une forme d'injustice l'encontre des femmes, celles-ci n'ayant pas choisit leur sexe.
Une autre raison qui justifie le fait que les femmes aient en moyenne un salaire infrieur celui des hommes est
que leur niveau d'ducation est en moyenne aussi infrieur celui des hommes. La cause de cette diffrence
vient en partie du fait qu'au moment de choisir leur niveau de formation, les femmes savent qu'il existe une
discrimination envers leur genre et donc, elles ont moins d'incitants entreprendre une longue formation.
Je n'ai l mentionn que quelques raisons qui expliquent cette diffrence entre le niveau moyen de rmunration
des femmes et celui des hommes. Je laisse le lecteur se rfrer d'autres tudes de plus grande ampleur afin
d'approfondir le sujet
19
.
Le but de cette dmarche tait de montrer que le diffrentiel salarial entre les femmes et les hommes ne doit pas
tre confondu avec discrimination. Comme on vient de le voir, certaines diffrences attenantes au sexe justifient
en partie ces carts dans la rmunration, alors que certains jugements arbitraires qui ne correspondent pas
l'optique de productivit incarnent la discrimination.
Ainsi et c'est l tout le problme - il faut correctement distinguer les raisons objectives des justifications
subjectives qui font abaisser le salaire moyen des femmes par rapport celui des hommes.
Plus prcisment, on peut dfinir la discrimination salariale comme suit : il y a discrimination salariale
l'encontre des femmes lorsque productivit gale, les hommes obtiennent systmatiquement un salaire
suprieur celui des femmes.
Cela signifie que dans la dtermination du salaire de son employ, l'employeur ne tiendra pas uniquement
compte des caractristiques d'efficacit, mais aussi du sexe de l'employ.
Subsquemment, afin de pouvoir correctement distinguer la composante discriminante et la composante non
discriminante du diffrentiel salarial, il faut pouvoir connatre les caractristiques personnelles qui qualifient la
productivit d'un travailleur. C'est trs certainement ce "dtail" qui conditionne toute l'tude. Effectivement,
comme le salaire est dtermin, schmatiquement, par la productivit du travailleur et par son sexe, si on n'arrive
pas mesurer correctement la productivit, on ne peut pas dfinir de manire exacte la part du salaire qui est
fixe selon les caractristiques productives de l'employ et celle qui provient du genre de l'employ. De la sorte,
cause d'une faute dans la mesure de la productivit, on risque de tirer des conclusions compltement ct de
la ralit.
Hlas, il est trs difficile de savoir si l'valuation faite de la productivit est correcte, puisque celle-ci dpend de
certaines caractristiques non quantifiables telles que l'enthousiasme ou l'assiduit avec lesquels le salari
travaille, par exemple.
De plus, lors de la fixation des salaires, intervient une partie subjective venant de la perception qu' l'employeur
de la productivit de l'employ.
Ainsi, mme si toutes les tudes existantes prennent grand soin mesurer scrupuleusement la productivit des
travailleurs, il est impossible de capter entirement la ralit.
Afin de pallier ce problme, certains conomistes appliquent des tests qui permettent de remettre en cause les
conclusions obtenues.
Etant donn que je n'ai trs probablement pas pu mesurer la productivit exactement, je vais utiliser un de ces
tests et certes, celui de la rgression inverse. Puisque cette mthode demande une explication, elle fera l'objet
d'une partie
20
.

19
Je recommande plus particulirement celle de Flckiger et Ramirez.
20
Voir point 5.
Aprs avoir identifi ce problme de mesures, il faut en examiner un autre :
Lorsqu'on tudie la discrimination salariale, il faut se demander qui prendre en compte dans
l'chantillon. En effet, estimer la discrimination salariale implique de rgresser le salaire sur la
productivit et sur la partie refltant cette discrimination, c'est dire, le sexe. La question est de savoir
quel chantillon prendre. Les questionnaires sur le march du travail se font sur une population qu'on
peut sparer en quatre groupes. On distingue tout d'abord les hommes des femmes, puis les actifs des
personnes n'ayant pas de travail (chmeurs et inactifs). Avant de faire une rgression, il est ncessaire
de savoir quels groupes utiliser. Ce problme parat vident, mais selon le choix de l'chantillon
utilis, un fort biais peut tre introduit dans les rsultats.
En ralit, partir d'une rgression utilisant les hommes et les femmes actifs, c'est dire, la rgression qui parat
au dpart la plus logique
21
, il y a au moins deux amliorations possibles :
1) La mthode dite d'Oaxaca-Blinder : cette mthode part de l'ide que les femmes et les hommes n'ont
en fait pas les mmes coefficients estims et qu'une variable binaire reprsentant le sexe ne permet
pas de prendre en compte toute la discrimination. Oaxaca et Blinder proposent donc de faire une
rgression pour les hommes et une rgression pour les femmes, chmeurs et inactifs exclus, et de
comparer les rsultats obtenus. On verra cette mthode un peu plus loin
22
.
2) La correction de Heckman
23
: cette mthode permet d'liminer le biais de slection de l'chantillon qui
apparat lorsqu'on ne tient pas compte des chmeurs et des inactifs. Cette mthode fera l'objet d'une partie plus
loin, car ses implications sont importantes
24
.
Cette tude va donc partir d'une simple rgression comprenant les hommes et les femmes, mais excluant les
chmeurs et les inactifs pour ensuite essayer de l'amliorer avec les mthodes de rgression inverse, d'Oaxaca-
Blinder et de Heckman.

21
En ralit, qu'on prenne dans l'chantillon les actifs et les chmeurs ou inactifs ou les actifs uniquement ne
change rien. En effet, les chmeurs et inactifs n'ayant pas de salaire, ils seront automatiquement limins de
l'chantillon au moment d'estimation de l'quation.
22
Voir point 4.
23
Prix Nobel d'conomie 2000 pour ses travaux sur les chantillons slectifs (correction de Heckman).
24
Voir point 6.
3. Construction du modle
3.1. Le modle
Le modle se fait en coupe transversale, en considrant le march du travail en Suisse. Les donnes utilises
viennent de la banque de donnes de l'ESPA (Etude Suisse sur la Population Active) de 1997. L'avantage de
cette banque de donnes est que l'enqute porte sur environ 16'000 mnages. Ainsi, toutes les rgressions se font
avec un chantillon suffisamment grand
25
.
Le modle de base est le suivant :
"Salaire" = c + X +
o :
- "Salaire" reprsente d'une manire ou d'une autre le salaire obtenu
- c est la constante
- est le vecteur des coefficients des variables explicatives
- X est le vecteur des variables explicatives
- est le terme d'erreur.
Le salaire communiqu est le revenu annuel brut de la personne interroge.
Le premier problme rsoudre est de spcifier correctement le modle. Deux modles m'ont sembl possibles.
Le premier utilise comme variable explique le salaire annuel brut. On a donc la forme suivante :
Salaireb = c + X +
o Salaireb = Salaire annuel brut.
Cette forme est linaire et me parat assez plausible.
Le deuxime modle possible prend comme variable explique le log naturel du salaire annuel brut. Ainsi, le
modle est :
ln = c + X + (1)
o ln est ln(salaire annuel brut).
Etant donn que transformer des variables muettes en logs n'a aucun sens, les variables explicatives ne sont pas
transformes en log naturel (comme on le verra plus loin, presque toutes les variables explicatives sont des
variables muettes).
Cette forme n'est donc pas linaire. L'avantage de cette deuxime quation est que les coefficients peuvent
directement tre interprts en termes de taux de rendement de la variable explicative en pour cent du salaire.

25
La diffrence entre ces 16'000 observations et le nombre d'observations qu'on utilisera pour faire les
rgressions vient du fait que pour certains mnages, toutes les donnes n'taient pas communiques, ce qui
rend leur utilisation impossible. De plus, pour les rgressions n'utilisant pas les chmeurs ni les inactifs,
l'limination de ces derniers fait diminuer l'chantillon 9922 mnages.
La question qui se pose maintenant est "quel modle utiliser?".
Aprs avoir cherch en vain un test pouvant dterminer quelle structure est la meilleure, j'ai pris comme critres
le maximum de vraisemblance et le R
2
ajust. Etant donn que ces critres sont meilleurs dans les deux cas pour
le modle en log, j'ai dcid d'utiliser cette forme par la suite (voir annexe 1)
26
. De plus, tant donn que la
plupart des tudes utilisent cette mthode, ma dcision est en un certain sens confirme.
La mthode de rgression utilise est celle des moindres carrs ordinaires, puisque, premirement, aucune raison
ne me pousse en utiliser une autre et deuximement, car les caractristiques des estimateurs sont connues et
bien commodes.
3.2. Les variables explicatives
Les variables qui dterminent le salaire ou plus prcisment, la productivit, sont les suivantes :
1) La formation acquise (edu
27
)
Le niveau d'ducation de l'employ devrait, pour une bonne part, expliquer le niveau de salaire. En
effet, plus la personne a une formation pousse, plus elle aura une grande productivit dans son travail.
On considre implicitement ici que le travail de l'employ correspond son niveau d'ducation. En
effet, un diplm de l'universit n'aura certainement pas envie de travailler en tant que vendeur au
supermarch. Ainsi, le salaire est fonction positive du niveau de formation.
Cette variable est une variable muette code comme suit :
1 : cole obligatoire ou formation lmentaire
2 : apprentissage, cole professionnelle, cole de formation gnrale ou maturit
3 : matrise ou cole technique
4 : haute cole professionnelle, haute cole technique ou universit.
2) L'ge de l'employ (age)
L'ge influence par deux biais le salaire. Premirement, l'ge peut tre considr comme une mesure de
l'exprience (plus on est g, plus on a travaill, donc plus on a d'exprience). Deuximement, l'ge peut tre,
dans une certaine mesure, considr comme un proxy de la stabilit de la personne. En effet, les jeunes employs
auront plus tendance accepter une autre place de travail si elle leur procure une plus grande utilit (opportunits
de monter dans la hirarchie, dcouverte d'un nouveau domaine). De plus, comme je l'ai dj mentionn, les
jeunes femmes voudront fonder une famille, ce qui est un signe d'instabilit par rapport leur place de travail.
Par contre, les employs plus gs prfreront avoir l'assurance de leur place et ne voudront certainement pas
devoir se rhabituer un nouveau travail. Ainsi, plus on est g, plus on demande une certaine stabilit dans sa
vie professionnelle.
L'ge a donc un impact positif sur le salaire obtenu.

26
Les rsultats intermdiaires ou ne prsentant pas d'intrt majeur sont mis en annexe.
27
Les noms entre parenthses sont les abrviations utilises pour la variable explicative.
3) L'tat civil (marie)
Dans cette tude, l'tat civil a t rduit "mari" ou "non mari".
En quoi est-ce que l'tat civil peut avoir une influence sur la rmunration ?
Pour les hommes, le fait d'tre mari peut tre interprt par l'employeur comme une marque de stabilit
(l'homme ne va pas quitter son travail sans raison, car il a des bouches nourrir) ou de responsabilit (il est
responsable, puisqu'il arrive assumer sa famille).
Pour les femmes, le mariage peut avoir une influence ngative sur le salaire, car tre marie signifie avoir
beaucoup d'autres proccupations (s'occuper du mnage, des enfants ), ce qui diminue sa disponibilit (par
exemple, heures supplmentaires impossibles).
Il est intressant de noter que cette diffrence entre les hommes et les femmes pourrait diminuer avec la tendance
aujourd'hui des hommes participer plus aux charges familiales.
Marie est une variable binaire qui vaut 1 si la personne est marie et 0 sinon.
4) Le taux d'occupation (tauxoccup)
Le taux d'occupation est le rapport entre le temps travaill par l'employ et le temps de travail moyen considr
comme normal en Suisse (40 h). Le taux d'occupation est un lment dterminant du salaire, puisque plus cette
variable est grande, plus le salaire est haut.
Selon l'tude de Flckiger et Ramirez, "le temps partiel semble rduire les diffrences de salaires entre les
sexes"
28
. Il serait intressant de creuser plus le sujet, mais tel n'est pas le but de cette tude.
5) Le type de contrat (contrat)
Cette variable dtermine si le contrat est limit dans le temps (contrat = 1) ou non (contrat =2). Considrant le
critre de productivit, on peut penser que le fait d'avoir un contrat limit dans le temps peut rduire le niveau de
salaire. En effet, lorsque le contrat n'a pas de limite, le travailleur peut s'engager entirement dans l'entreprise,
puisqu'il sait qu'il va y rester un certain temps. Ainsi, connaissant ce fait, l'employeur prfrera payer plus un
employ qui s'engagera plus.
6) L'anciennet (oeta8)
L'anciennet est reprsente par la dure de l'occupation de l'employ dans l'entreprise. On peut considrer
qu'une meilleure connaissance de l'entreprise entrane une plus grande productivit. De cette manire,
l'anciennet influence positivement le salaire.
Etant donn qu'on peut considrer cette variable comme un facteur de production, elle est victime des
rendements dcroissants. Afin de rendre compte de ce phnomne, il faudrait introduire l'anciennet au carr.
Hlas, le codage de la variable oeta8 ne permet pas de faire cette transformation, puisque celle-ci n'aurait aucun
sens. La variable oeta8 est en effet une variable binaire qui prend la valeur 0 si l'employ est depuis moins de 8
ans dans l'entreprise et 1 sinon.
7) L'exprience (oinin8)
L'exprience se traduit par le nombre d'annes passes dans le march du travail sans longue interruption. Le
salaire est influenc positivement par cette variable, car une plus grande exprience dans un domaine permet
d'obtenir une plus grande productivit dans la branche.
Le point dplaisant de cette variable vient du fait qu'on ne tient pas compte des changements d'orientation qui
peuvent se produire durant la vie professionnelle.
Etant donn que la "loi" des rendements dcroissants peut aussi tre applique ici, il faudrait introduire
l'exprience au carr, mais l'instar de la variable anciennet, cela n'a aucun sens. En effet, oinin8 prend 0 si la
personne a moins de 8 ans d'exprience et 1 sinon.

28
Voir Flckiger et Ramirez
8) La taille de l'entreprise(tailleta)
Selon l'tude de Flckiger et Ramirez, la taille de l'entreprise a une influence positive sur les salaires. Il y a deux
raisons principales cela.
La premire vient du fait qu'une grande entreprise a en gnral une grande part de march et donc, plus de profit.
On suppose que la firme partagera dans une certaine mesure ces gains avec les employs.
La deuxime raison vient du fait que la grande taille de l'entreprise rend impossible tout contrle sur le travail
des employs. Un salaire suprieur celui sur le march permet d'inciter les employs bien travailler afin de
garder leur place.
9) La branche conomique de l'entreprise (div)
Par branche conomique, on considre le secteur primaire, le secteur secondaire ou le secteur tertiaire. Cette
variable a un impact sur le niveau de salaire, car certains secteurs sont plus rentables que d'autres. Il est clair, en
effet, que la rentabilit du secteur primaire est infrieure celle du secteur secondaire ou tertiaire. On ne peut
cependant pas pralablement dterminer s'il existe de telles diffrences entre le secteur secondaire et le secteur
tertiaire.
La variable div vaut 1 si l'entreprise est dans le secteur tertiaire et 0 sinon.
10) Le niveau hirarchique (hierar)
Logiquement, cette variable influence positivement le salaire. Elle est codifie de manire inversement
proportionnelle, ce qui signifie qu'elle va de 1 = cadres suprieurs 9 = ouvriers et emplois non qualifis.
11) Le secteur de l'entreprise (public)
Cette variable explicative permet de distinguer les emplois dans des entreprises prives des emplois dans des
entreprises publiques.
Selon les tudes existantes, il y a une diffrence dans le mode de formation des salaires entre ces deux secteurs.
De plus, certaines tudes ont remarqu que la discrimination salariale (si elle existe) tait diffrente selon le
secteur (elle serait moins forte dans le secteur public). Ainsi, mme si le secteur n'influence pas en soi le niveau
de salaire, il y une importance pour la discrimination.
Cette variable vaut 1 si l'entreprise est dans le secteur priv et 0 si elle est dans le secteur public.
12) La nationalit (nat)
En introduisant cette variable explicative, on rejoint une autre forme de discrimination. En effet, certains
employeurs dcident de payer moins les trangers que les Suisses, productivits gales. Dans cette tude, je
vais me limiter considrer cette variable uniquement en tant que variable explicative du niveau de salaire, sans
rechercher montrer qu'il existe une sgrgation ethnique. Pour cette variable, 0 = tranger, 1 = Suisse.
13) Le sexe de l'employ (sexe10)
Cette variable est introduite afin de capter la composante discriminante de la formation du salaire. Sexe10 prend
la valeur 1 si la personne interroge est une femme et 0 si c'est un homme.
Logiquement, si cette variable a un coefficient ngatif, cela signifie qu'il existe une discrimination l'encontre
des femmes.
En rsum, le signe des variables explicatives edu, age, nat, hierar, div, tauxoccup, contrat, oeta8, oinin8 et
tailleta devrait tre positif.
Pour les variables marie, sexe10 et public, on ne peut pas priori dterminer le signe de leur coefficient.
4. Mthode dite d'Oaxaca-Blinder
Comme je l'ai expliqu ci-dessus, j'utilise la variable sexe10 pour dterminer s'il existe une discrimination. Cela
implique qu'on suppose que les coefficients des variables explicatives sont les mmes pour les hommes et les
femmes. Cependant, cette hypothse ne parat pas trs plausible. En effet, vu le diffrentiel entre le salaire des
femmes et celui des hommes, il semble vident que la formation des salaires ne se fait pas de la mme manire
selon le sexe.
C'est pour cette raison que Oaxaca et Blinder ont propos une solution diffrente
29
.
Leur mthode consiste sparer les hommes et les femmes en deux chantillons et de faire une rgression pour
chaque groupe. De cette faon, on obtient des coefficients pour les hommes et d'autres pour les femmes,
coefficients qu'on pourra comparer. Cela permet donc de prendre en compte le fait que le mode de formation des
salaires est diffrent selon le sexe.
On peut reprsenter les deux rgressions comme suit :

+ m m m m X c ln quation de rgression pour les hommes (indice = m)

+ f f f f X c ln quation de rgression pour les femmes (indice = f)


o -
m
et
f
sont les deux vecteurs des coefficients des variables explicatives
- X
m
et X
f
sont les deux vecteurs des variables explicatives
30
.
- ln
m
et ln
f
sont les logs naturels du salaire annuel brut des hommes ou des femmes.
Comme la mthode des moindres carrs ordinaires fait passer la droite de rgression par la moyenne de la
variable explique, on peut crire la diffrence entre le salaire moyen des hommes et celui des femmes comme
suit :

+ f f m m f m f m X

ln ln (2)
o : - les variables marques d'un trait reprsentent les moyennes de ces variables
- les variables marques d'un chapeau reprsentent les coefficients estims des variables
explicatives.
En ajoutant

f m f m X

(2), on obtient :
( ) ( )

+ + f m m f m
f
f m f m X X

X c

ln ln (3)
En utilisant cette quation, on suppose que la norme est l'quation de salaire des hommes.
L'avantage de cette transformation est qu'on peut sparer la composante explique par les diffrences
dans les moyennes des variables explicatives et la composante discriminante du diffrentiel salarial.
Ainsi,
E
f
= ( )

f m m X X

est la partie du diffrentiel salarial qui est explique par des diffrences de
productivit moyenne

29
Explication tire de l'tude de Flckiger et Ramirez.
30
Les variables explicatives sont les mmes dans les deux rgressions.
D
f
= ( ) f m
f
f m

X c

+

est la partie du diffrentiel salarial qui est discriminatoire.
En calculant E
f
et D
f
, on peut exactement connatre quelle est la partie discriminante et la partie
explique dans la dtermination du salaire.
Tout au long de ce travail, je vais faire une rgression en utilisant l'chantillon incluant les hommes et
les femmes, puis deux rgressions selon le sexe, afin de pouvoir appliquer la mthode d'Oaxaca-
Blinder (ci-aprs MOB).
5. Rgression directe versus rgression inverse
5.1. Explication de la mthode
Le but de ce procd est de vrifier s'il existe vritablement une discrimination salariale envers les
femmes.
En effet, la rgression directe du salaire sur les variables explicatives (rgression (1)) conclut souvent
que les femmes sont dfavorises dans leur rmunration. Une rgression inverse permet de vrifier si
cette conclusion est juste.
La mthode utilise est la suivante :
Tout d'abord, il faut estimer la rgression directe, c'est dire qu'on rgresse le log naturel du salaire
sur les variables explicatives. On a donc la rgression suivante (rgression (1)) :
ln = c + X +
Si on pose X
1
: vecteur des variables explicatives sauf sexe10
Z : variable explicative sexe10,
on obtient, alors :
ln = c + X
1
+ Z + , (4)
changement qui ne modifie pas la signification de la rgression.
Aprs avoir estim cette rgression, on en tire des conclusions :
- si < 0, on dduit qu'il y a de la discrimination envers les femmes
- si > 0, on dduit qu'il y a de la discrimination envers les hommes.
La deuxime tape consiste vrifier ces conclusions en appliquant une rgression inverse.
Le principe de la rgression inverse est de rgresser une variable explicative sur les autres variables
explicatives (dont la variable scxe10) et sur le log naturel du salaire. On aura donc, par exemple, pour
l'ducation :
Edu = c* + * X* + * Z + ln + * (5)
o : - X* est le vecteur des variables explicatives sauf les variables edu et sexe10
- Z est la variable sexe10
Ce faisant, on pose la question : "Pour le mme salaire, les hommes sont-ils plus qualifis que les
femmes ?" Si oui, cela signifie que pour le mme salaire, on demande un plus haut niveau de
formation aux hommes qu'aux femmes, et donc, qu'il y a une discrimination envers les hommes.
Ainsi :
- si * < 0, on dduit qu'il y a de la discrimination envers les hommes
- si * > 0, on dduit qu'il y a de la discrimination envers les femmes.
Il y a deux manires diffrentes d'appliquer la rgression inverse :
La premire consiste faire une rgression inverse pour chaque variable explicative, en suivant
l'exemple de l'quation (5).
La deuxime faon est caractrise par la rgression inverse de toutes les variables explicatives en
un bloc. Il faut alors construire une variable reprsentant toutes les variables explicatives :
En utilisant l'quation (1), on calcule :
X

+ Q , o Q est un indice des qualifications.


Puis, on rgresse :
Q = c* + * Z + ln + *
Le signe du coefficient * permet de conclure s'il y a une discrimination, et si oui, envers quel
sexe.
Dans ce rapport, je vais utiliser ces deux mthodes afin de m'assurer des rsultats obtenus.
5.2. Justification de l'utilisation de la rgression inverse
Comme je l'ai expliqu plus haut, lorsque l'employeur fixe le salaire de l'employ, il est possible qu'il
ait accs un plus grand nombre d'informations sur la productivit que les conomistes faisant une
tude sur la discrimination. Ainsi, dans ces tudes, il manque de l'information.
Un problme peut paratre si cette information manquante est corrle avec le sexe. En effet, si tel est
le cas, la dummy pour le sexe peut prendre la signification de la variable manquante.
Ainsi, le coefficient estim de la dummy pour le sexe risque d'tre biais
31
.
Comme pour chaque rgression directe, il existe une rgression inverse, on peut avoir deux vues
diffrentes sur les donnes. Ainsi, l'utilisation d'une rgression inverse est utile pour vrifier nos
rsultats.
Voici un bon exemple donn par Conway et Roberts pour justifier l'emploi des rgressions inverses
32
:
Dans cet exemple, on compare la distribution des hommes et des femmes sur le march du travail, en
fonction de leur niveau d'ducation. On a le tableau suivant :

31
Pour plus de prcisions, voir l'article de Goldberger.
32
Exemple tir de Conway et Roberts.
Hommes Femmes
Education Employ Directeur Total Employe Directeur Total
Maturit 40 0 40 80 0 80
Universit 23 17 40 16 4 20
Master 1 19 20 0 0 0
Total 64 36 100 96 4 100
La seule hypothse importante est que la position de directeur est prfre celle d'employ(e).
On voit que 80% des femmes ont une maturit, alors que seulement 40% chez les hommes Ainsi, dans
ce cas, les femmes ont un moins haut niveau d'ducation.
Regardons maintenant ce tableau dans l'optique de la rgression directe et de la rgression inverse.
Rgression directe : on regarde le travail selon le niveau d'ducation.
Hommes Femmes
Education Employ Directeur Total Employe Directeur Total
Maturit 100% 0 100% 100% 0 100%
Universit 57.5% 42.5% 100% 80% 20% 100%
Master 5% 95% 100% 0 0 0
Total 64% 36% 100% 96% 4% 100%
Si on regarde la place de travail selon le niveau d'ducation, on voit que pour le niveau de la maturit,
les hommes et les femmes sont traits galement. Par contre, pour le niveau universitaire, on voit que
42.5% des hommes qui ont ce niveau deviennent directeurs alors que seulement 20% des femmes qui
ont ce niveau le deviennent. Il y a donc une ingalit envers les femmes.
Rgression inverse : on regarde le niveau d'ducation selon le travail.
Hommes Femmes
Education Employ Directeur Total Employe Directeur Total
Maturit 62.5% 0 40% 83.3% 0 80%
Universit 35.9% 47.2% 40% 16.7% 100% 20%
Master 1.6% 52.8% 20% 0 0 0
Total 100% 100% 100% 100% 100% 100%
Ici, on voit que pour le travail d'employ, seulement 62.5% des hommes ont une maturit, alors que ce
taux est de 83.3% pour les femmes. De plus, 1.6% des employs ont un master, alors qu'aucune
employe n'en a. On voit encore que pour le travail de directeur, toutes les femmes ont une formation
universitaire, alors que 52.8% des hommes ont un master. Il y a donc clairement une discrimination
envers les hommes.
On voit donc que selon le point de dpart, on trouve des conclusions contradictoires. La rgression
inverse prend ainsi tout son sens.
Malgr cet exemple trs convaincant, cette mthode est largement controverse parmi les conomistes
et par rapport l'argument de Conway et Roberts, deux conomistes, Weisberg et Tomberlin ont un
contre-argument intressant.
Selon eux, il n'y a pas de discrimination contre les hommes : leurs meilleures qualifications pour un
mme travail viennent du fait que la distribution du niveau de formation est diffrente selon le sexe :
" suppose a company wishes to select six individuals for a particular position. There are ten males
and ten females available. They are all scored on a test that has been validated as a perfect predictor
of future productivity, with the following results:
Males : 40, 50, 60, 60, 70, 75, 80, 90, 95, 95
Females : 30, 35, 55, 60, 60, 75, 75, 75, 85, 90
Then, if the employer selects on the basis of this index, he will choose the top four men and the top two
women to obtain
Selected Group : 80(M), 85(F), 90(M), 90(F), 95(M), 95(M)
Note that although the requirements for men and women are identical, the distribution of
qualifications will differ between the males and females selected. In particular, the average level of Q
[productivity] for males selected is 90.0, while that for women is 87.5.
Does this represent discrimination against males, who seem after the fact to have had the more
significant standards applied ? Clearly not. It simply represents the application of a non-
discriminatory rule where the marginal distributions of the two groups differ. The conditional
probability of Q given S [salary] is determined not only by the employer's requirements, but also by
the pre-existing population distribution for the groups."
33
Mme si l'argument de Weisberg et Tomberlin me semble lui aussi convainquant, je vais appliquer la
rgression indirecte mon tude.
5.3. Application
La premire rgression faire est la rgression directe. La variable dpendante est donc ln.
Dans toute cette partie, je n'utilise que les personnes actives.
Aprs avoir estim la rgression directe, j'ai dtect de l'htroscdasticit (voir annexe 2). J'ai donc
limin ce problme pour les rgressions suivantes
34
.
Quant aux rsidus, j'ai test s'ils taient autocorrls en classant les donnes par ordre croissant du
salaire. Si on regarde le graphique des rsidus, il ne semble pas y avoir de corrlation (cf annexe3).
5.3.1. Rgression directe
La rgression de dpart est donc l'estimation de l'quation (1) en corrigeant l'htroscdasticit.
Afin de pouvoir immdiatement assurer ces rsultats, j'ai appliqu la MOB. Les rsultats sont dons les
suivants
35
:

33
Lu dans Conway et Roberts ; on peut le trouver dans Weisberg, H, Tomberliin, T, (1982), "Statistical evidence
in employment discrimination cases", Sociological methods and research, in press.
34
Si on compare la premire rgression et la rgression corrige de l'htroscdasticit, on voit que les
changements n'ont lieu que dans la valeur des t-stat. Aucune variable explicative ne devient non significative
ou devient significative aprs avoir trait l'htroscdasticit. Ce problme ne semble donc pas important.
35
Aprs chaque rgression, et ceci pour toute la partie 5, j'ai fait un test d'htroscdasticit et dans le cas o
celui-ci tait positif, j'ai refait la rgression en liminant l'htroscdasticit. Je ne montrerai dans ce cas que
cette dernire rgression.
Rgression ! : rgression du log naturel du salaire, en utilisant l'chantillon complet (hommes et
femmes).
Dependent Variable: LN
Method: Least Squares
Date: 05/16/01 Time: 13:22
Sample(adjusted): 2 9922
Included observations: 3666
Excluded observations: 6255 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 7.799246 0.134261 58.09008 0.0000
AGE 0.004054 0.001589 2.552216 0.0107
EDU 0.195326 0.013499 14.47012 0.0000
SEXE10 -0.160109 0.028694 -5.579929 0.0000
MARIE 0.033908 0.022410 1.513059 0.1304
NAT 0.097632 0.022044 4.429009 0.0000
TAUXOCCUP 0.021859 0.000900 24.28785 0.0000
CONTRAT 0.198110 0.055731 3.554735 0.0004
OETA8 0.035037 0.021665 1.617195 0.1059
TAILETA 0.001836 0.000260 7.063615 0.0000
DIV 0.067074 0.015155 4.425766 0.0000
OININ8 0.152846 0.029252 5.225083 0.0000
HIERAR 0.004115 0.003614 1.138779 0.2549
SECTEUR 0.025269 0.026890 0.939711 0.3474
R-squared 0.532374 Mean dependent var 10.84725
Adjusted R-squared 0.530709 S.D. dependent var 0.815780
S.E. of regression 0.558849 Akaike info criterion 1.677936
Sum squared resid 1140.563 Schwarz criterion 1.701639
Log likelihood -3061.656 F-statistic 319.8197
Durbin-Watson stat 1.761657 Prob(F-statistic) 0.000000
Rgression " : rgression du log naturel du salaire, en n'utilisant que les femmes.
Dependent Variable: LN
Method: Least Squares
Date: 05/16/01 Time: 14:07
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 7.746146 0.229245 33.78983 0.0000
AGE 0.001778 0.002982 0.596227 0.5511
EDU 0.217566 0.030681 7.091236 0.0000
MARIE -0.061106 0.053846 -1.134822 0.2566
NAT 0.060438 0.035781 1.689087 0.0914
TAUXOCCUP 0.020406 0.001360 15.00795 0.0000
CONTRAT 0.270187 0.095929 2.816522 0.0049
OETA8 0.062448 0.044346 1.408190 0.1593
TAILETA 0.002643 0.000521 5.074853 0.0000
DIV 0.053658 0.031271 1.715887 0.0864
OININ8 0.129164 0.050360 2.564803 0.0104
HIERAR 0.010482 0.006884 1.522661 0.1280
SECTEUR 0.070606 0.054191 1.302900 0.1928
R-squared 0.424940 Mean dependent var 10.47905
Adjusted R-squared 0.420773 S.D. dependent var 0.956391
S.E. of regression 0.727881 Akaike info criterion 2.210399
Sum squared resid 877.3656 Schwarz criterion 2.252616
Log likelihood -1831.578 F-statistic 101.9749
Durbin-Watson stat 2.416487 Prob(F-statistic) 0.000000
Rgression # : rgression du log naturel du salaire, en n'utilisant que les hommes.
Dependent Variable: LN
Method: Least Squares
Date: 05/16/01 Time: 14:22
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 7.790125 0.163186 47.73783 0.0000
AGE 0.005833 0.001116 5.225840 0.0000
EDU 0.177932 0.010352 17.18855 0.0000
MARIE 0.087847 0.017266 5.087885 0.0000
NAT 0.128070 0.028123 4.553935 0.0000
TAUXOCCUP 0.022352 0.001570 14.23952 0.0000
CONTRAT 0.130086 0.057524 2.261439 0.0238
OETA8 0.012899 0.018940 0.681045 0.4959
TAILETA 0.001189 0.000203 5.854848 0.0000
DIV 0.072414 0.016655 4.348006 0.0000
OININ8 0.160160 0.024100 6.645770 0.0000
HIERAR -0.001002 0.003477 -0.288004 0.7734
SECTEUR -0.011374 0.018958 -0.599963 0.5486
R-squared 0.497843 Mean dependent var 11.15498
Adjusted R-squared 0.494805 S.D. dependent var 0.499489
S.E. of regression 0.355022 Akaike info criterion 0.773213
Sum squared resid 250.0644 Schwarz criterion 0.809664
Log likelihood -759.0537 F-statistic 163.9127
Durbin-Watson stat 1.834203 Prob(F-statistic) 0.000000
Analysons d'abord la rgression ! :
On voit que seules les variables explicatives marie, hierar et secteur ne sont pas significatives. La
variable oeta8 est significative au seuil de 10%, alors que toutes les autres le sont au seuil de 1%.
Cette rgression parat ainsi assez robuste, puisqu'en plus, son R
2
ajust (0.53) est relativement haut
pour une rgression en coupe transversale.
Toutes les variables explicatives sur lesquelles on avait pu mettre une hypothse sur le signe du
coefficient
36
confirment ces hypothses. On peut donc considrer que ces dernires taient justes.
Quant aux variables sexe10, marie et secteur, on peut tirer des conclusions (avec prudence) des signes
de leur coefficient.
Si on procde par limination, il est inutile de chercher une explication pour la variable secteur,
puisqu'elle n'entre pas significativement dans l'explication du salaire.
Par contre, le coefficient de la variable marie montre que le fait d'tre mari (marie = 1) a un impact
positif sur le salaire. Cette conclusion changera peut-tre lorsqu'on aura spar les hommes des
femmes.
Finalement, et c'est le plus intressant, le coefficient de sexe10 montre qu'il existe une discrimination
l'encontre des femmes. Je prfre cependant, ce stade de l'tude, ne pas tirer de conclusions partir
de ce rsultat.
Il faut prsent analyser les rgressions " et #.
Rgression " :
En regardant cette rgression faite avec les femmes, on voit que les variables explicatives age, marie,
oeta8, hierar et secteur ne sont pas significatives. Les autres le sont toutes au seuil de 10%.
Le signe des coefficients correspond nouveau aux hypothses mises.
Rgression # :
Dans cette rgression, tous les coefficients entrent significativement dans l'explication du salaire, avec
un seuil de 5%, sauf pour les trois variables explicatives habituellement non significatives (oeta8,
hierar, secteur) et leur signe suit les hypothses mises.
En comparant les rgressions " et #, il est intressant de remarquer que le signe de la variable marie
est diffrent. Cela pourrait justifier l'hypothse faite dans la partie 3.2. si seulement le coefficient de
cette variable tait significatif dans la rgression ".
Finalement, on peut remarquer que la rgression des hommes est meilleure que celles des femmes,
puisque sont R
2
ajust est meilleur. Cela vient certainement d'un problme de biais de slection,
problme qu'on tudiera dans la partie suivante.
Il est temps de regarder les rsultats de la MOB
37
:
Df %Df Ef %Ef
Diffrence totale 0.223 0.291 0.544 0.709 1.000
constante 0.044
age 0.199 0.906 -0.021 0.094 1.00
edu -0.073 0.469 0.082 0.531 1.00
marie 0.074 0.900 0.008 0.100 1.00
nat 0.129 0.966 -0.004 0.034 1.00
tauxoccu 0.139 0.235 0.453 0.765 1.00
contrat -0.133 0.991 0.001 0.009 1.00
oeta8 -0.018 0.909 0.002 0.091 1.00
taileta -0.063 0.913 0.006 0.087 1.00
div 0.016 0.550 -0.013 0.450 1.00
oinin8 0.019 0.390 0.030 0.610 1.00
hierar -0.049 0.998 0.000 0.002 1.00
secteur -0.062 0.999 0.000 0.001 1.00
L'interprtation des % est la suivante : le chiffre 0.291 signifie qu'environ 29% de la diffrence totale
entre le salaire des hommes et celui des femmes ne sont pas expliqu par des diffrences de
productivits moyennes. L'explication restante peut donc tre attribue une discrimination salariale
envers les femmes.
Le fait de considrer les variables explicatives individuellement permet de voir celles qui sont
discriminantes. Par exemple, les 90.6% de la variable age signifient que moins de 10% des diffrences
d'ge moyen expliquent le diffrentiel salarial moyen. Ainsi cette variable est trs discriminante envers
les femmes. Par contre, la variable tailleta est discriminante envers les hommes, puisque le signe de
son D
f
est ngatif.

36
Voir point 3.2. ; ces variables sont : edu, age, nat, hierar, div, tauxoccup, contrat, oeta8, oinin8 et tailleta.
37
D
f
et E
f
sont calculs comme je l'ai expliqu dans la section 4. Les pourcentages trouvs sont calculs comme
suit : %
Df
= D
f
/ (D
f
+E
f
), le pourcentage de E
f
tant calcul symtriquement.
L'avantage de la MOB est qu'elle nous montre l'explication apporte par les diffrences dans les
moyennes des variables explicatives pour l'estimation du diffrentiel salarial moyen.
Mme si certaines variables sont aussi discriminantes pour l'homme, c'est le total (voir ligne
"Diffrence totale") qui permettra de dire si la discrimination totale va en dfaveur de la femme ou de
l'homme.
Afin de contrler (mais cela n'est pas vraiment utile) que la MOB calcule correctement la
discrimination, il suffit de comparer la grandeur des coefficients des rgressions " et #. En effet, si
on prend comme exemple la variable edu, on voit que le coefficient est plus grand pour les femmes
que pour les hommes. Cela signifie qu'une augmentation du niveau de formation fait plus augmenter le
salaire des femmes que celui des hommes. Cette conclusion se retrouve dans la MOB, puisque le signe
du D
f
de la variable edu est ngatif.
En conclusion, la rgression directe et la MOB nous permet de conclure qu'il existe une discrimination
salariale envers les femmes.
Cependant, cette analyse n'est pas termine. C'est en effet le moment d'introduire les rgressions
inverses afin de contrle cette conclusion.
5.3.2. Rgressions inverses
Les variables auxquelles il faut appliquer la rgression inverse sont les suivantes : age, edu, tauxoccup,
contrat, oeta8, oinin8 et hierar. Ces variables ont t choisies car leur rgression inverse a un sens. En
effet, la question "A salaire gal, demande-t-on aux hommes d'tre plus g" ou "d'avoir plus
d'exprience" est comprhensible. Par contre l'interrogation "A salaire gal, demande-t-on aux
hommes d'tre plus Suisse" ou "de travailler plutt dans le secteur priv" ne me semble pas justifie,
car ces variables ne reprsentent pas la productivit du travailleur.
Un dernier mot avant de se lancer dans les rgressions inverses : pour chaque rgression inverse, j'ai
d'abord considr l'chantillon comprenant les hommes et les femmes, puis j'ai fait deux rgressions
distinctes selon le sexe de la personne afin de pouvoir appliquer la MOB. Pour ces deux rgressions
sparant le sexe, je ne montrerai que les rsultats calculs avec la MOB, les rgressions tant
disponibles en annexe.
1) Rgression inverse de Q
La premire rgression inverse estime est celle qui prend en compte toutes les variables auxquelles la
rgression inverse est applicable. J'ai donc construit la variable Q, l'index des qualifications, en
incluant les variables dfinissant le capital humain (c'est dire, age, edu, tauxoccup, contrat, oeta8,
oinin8 et hierar) et en utilisant la constante estime et les coefficients estims de la rgression !.
Il faut ensuite rgresser Q sur les variables explicatives restantes (marie, nat, tailleta, div, secteur),
ainsi que sur le sexe et le log naturel du salaire.
Les rsultats obtenus sont les suivants :

Rgression $ : rgression inverse de Q en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: Q
Method: Least Squares
Date: 05/16/01 Time: 13:43
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 6.397181 0.095854 66.73903 0.0000
LN 0.407211 0.008123 50.12877 0.0000
SEXE10 -0.243822 0.013446 -18.13361 0.0000
MARIE -0.111145 0.011973 -9.283292 0.0000
NAT -0.044194 0.018010 -2.453815 0.0142
TAILETA 0.000330 0.000151 2.188617 0.0287
DIV -0.052827 0.013888 -3.803782 0.0001
SECTEUR 0.010200 0.013831 0.737465 0.4609
R-squared 0.566898 Mean dependent var 10.55032
Adjusted R-squared 0.566070 S.D. dependent var 0.540921
S.E. of regression 0.356323 Akaike info criterion 0.776223
Sum squared resid 464.4425 Schwarz criterion 0.789767
Log likelihood -1414.816 F-statistic 684.0078
Durbin-Watson stat 1.131727 Prob(F-statistic) 0.000000
Rsultats % : rsultats de la MOB dans le cas de la rgression de Q (rgressions intermdiaires
disponibles dans l'annexe 4).
Df % Ef %
Diffrence totale 0.268 0.369 0.458 0.631 1.000
constante -1.194
LN
1.122 0.715 0.448 0.285 1.00
MARIE
0.171 0.883 -0.023 0.117 1.00
NAT
0.188 0.996 0.001 0.004 1.00
TAILETA
-0.044 0.879 0.006 0.121 1.00
DIV
0.023 0.393 0.036 0.607 1.00
SECTEUR
0.001 0.105 -0.011 0.895 1.00
Selon la thorie de la rgression inverse, la question pose ici est "Est-ce qu' salaire gal, les qualifications
exiges sont-elles les mmes pour les deux sexes?".
La rponse cette question se trouve dans le tableau de la rgression $ et certes, en observant le signe du
coefficient de la variable sexe10. Etant donn que celui-ci est ngatif et que son coefficient est significatif, cela
veut dire qu' salaire gal, on demande aux hommes d'avoir des qualifications suprieures celles des femmes,
ce qui reprsente une discrimination contre les hommes. Cette conclusion est renforce par les rsultats de la
MOB, puisque 36.9%
38
de la diffrence des qualifications moyennes ne sont pas expliqus par les diffrences
dans les moyennes des variables explicatives entre les femmes et les hommes. Il y a donc bien une
discrimination contre les hommes.

38
Le signe de D
f
est positif, ce qui signifie qu'il y a une discrimination contre les hommes, car dans le cas de la
rgression inverse, plus le coefficient est grand, plus on demande de qualifications. Par exemple, si on prend les
coefficients de ln des deux rgressions en annexe 4, celui des femmes vaut 0.33, alors que celui des hommes
vaut 0.44. Cela signifie qu'une augmentation de salaire fera plus augmenter les qualifications des hommes que
celles des femmes.
Afin d'examiner cette discrimination l'encontre des hommes dans les dtails, on va faire une rgression inverse
pour chaque variable explicative pour laquelle cette opration a un sens.
2) Rgression inverse de la variable age
Les rsultats sont les suivants :
Rgression % : rgression inverse de age en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: AGE
Method: Least Squares
Date: 05/16/01 Time: 13:38
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 25.40352 5.148750 4.933920 0.0000
LN 1.177941 0.610379 1.929852 0.0537
EDU 0.067691 0.220038 0.307635 0.7584
SEXE10 0.561075 0.411242 1.364343 0.1725
MARIE 3.154007 0.352833 8.939103 0.0000
NAT 0.270180 0.509049 0.530754 0.5956
TAUXOCCUP -0.119577 0.017473 -6.843561 0.0000
CONTRAT 1.164112 0.759440 1.532854 0.1254
OETA8 6.873887 0.372509 18.45294 0.0000
TAILETA -0.003110 0.004030 -0.771649 0.4404
DIV 0.442381 0.373266 1.185161 0.2360
OININ8 6.486706 0.398786 16.26614 0.0000
HIERAR -0.004540 0.071605 -0.063408 0.9494
SECTEUR -0.008830 0.374889 -0.023554 0.9812
R-squared 0.301225 Mean dependent var 39.27550
Adjusted R-squared 0.298738 S.D. dependent var 11.37511
S.E. of regression 9.525675 Akaike info criterion 7.349670
Sum squared resid 331377.0 Schwarz criterion 7.373373
Log likelihood -13457.95 F-statistic 121.0993
Durbin-Watson stat 1.866224 Prob(F-statistic) 0.000000
Rgression &: rgression inverse de age avec l'chantillon des femmes
Dependent Variable: AGE
Method: Least Squares
Date: 05/16/01 Time: 14:13
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 33.57829 5.181648 6.480234 0.0000
LN 0.322957 0.589193 0.548134 0.5837
EDU -0.521227 0.328267 -1.587815 0.1125
MARIE 1.369206 0.581061 2.356391 0.0186
NAT 0.756869 0.753840 1.004017 0.3155
TAUXOCCUP -0.102429 0.017467 -5.863997 0.0000
CONTRAT 1.776364 1.140646 1.557332 0.1196
OETA8 6.698233 0.586908 11.41276 0.0000
TAILETA -0.010139 0.006094 -1.663748 0.0964
DIV 0.926896 0.657768 1.409153 0.1590
OININ8 6.211096 0.556613 11.15874 0.0000
HIERAR 0.087894 0.113087 0.777221 0.4371
SECTEUR 0.448636 0.578014 0.776168 0.4378
R-squared 0.279349 Mean dependent var 39.02876
Adjusted R-squared 0.274127 S.D. dependent var 11.51359
S.E. of regression 9.809366 Akaike info criterion 7.412311
Sum squared resid 159346.4 Schwarz criterion 7.454528
Log likelihood -6172.573 F-statistic 53.49365
Durbin-Watson stat 1.827705 Prob(F-statistic) 0.000000
Rgression ': rgression inverse de age avec l'chantillon des hommes
Dependent Variable: AGE
Method: Least Squares
Date: 05/16/01 Time: 14:26
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 7.621508 7.864154 0.969145 0.3326
LN 3.849329 0.783431 4.913425 0.0000
EDU 0.034920 0.271279 0.128723 0.8976
MARIE 4.163169 0.453772 9.174579 0.0000
NAT -0.442528 0.689728 -0.641598 0.5212
TAUXOCCUP -0.223220 0.032426 -6.883921 0.0000
CONTRAT 0.089285 0.992500 0.089959 0.9283
OETA8 6.941659 0.470598 14.75072 0.0000
TAILETA 0.002446 0.005214 0.469182 0.6390
DIV 0.000472 0.444772 0.001062 0.9992
OININ8 6.301519 0.571178 11.03249 0.0000
HIERAR -0.076976 0.090042 -0.854886 0.3927
SECTEUR -0.274231 0.482894 -0.567890 0.5702
R-squared 0.347575 Mean dependent var 39.48172
Adjusted R-squared 0.343629 S.D. dependent var 11.25681
S.E. of regression 9.119898 Akaike info criterion 7.265283
Sum squared resid 165014.3 Schwarz criterion 7.301734
Log likelihood -7241.385 F-statistic 88.08022
Durbin-Watson stat 1.989547 Prob(F-statistic) 0.000000
En observant la rgression %, on voit que peu de coefficients sont significatifs. On pourrait supposer une
discrimination envers les femmes vu le signe du coefficient de sexe10, mais tant donn que cette variable n'est
pas significative, cette conclusion ne serait pas probante.
Quant aux rgressions & et ', on voit que la plupart des coefficients ne prennent pas significativement part
l'explication du salaire.
Etant donn que ces rgressions ne font pas suffisamment preuve de justesse, je prfre ne pas
interprter leurs rsultats.
Ces mauvaises estimations ne sont en ralit pas surprenantes, car il est trs peu probable qu' salaire gal, on
demande aux hommes ou aux femmes d'tre plus g.
3) Rgression inverse de la variable edu
Voici les rsultats recueillis :
Rgression ( : rgression inverse de edu en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: EDU
Method: Least Squares
Date: 05/16/01 Time: 13:45
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -1.662102 0.674546 -2.464030 0.0138
LN 0.373522 0.084161 4.438180 0.0000
AGE 0.000446 0.001450 0.307322 0.7586
SEXE10 -0.247713 0.031784 -7.793690 0.0000
MARIE 0.051172 0.029456 1.737227 0.0824
NAT 0.270842 0.045949 5.894388 0.0000
TAUXOCCUP -0.004685 0.002160 -2.169042 0.0301
CONTRAT -0.206608 0.074065 -2.789565 0.0053
OETA8 -0.107586 0.030712 -3.503053 0.0005
TAILETA 0.001027 0.000341 3.013306 0.0026
DIV 0.169788 0.031465 5.396142 0.0000
OININ8 -0.152023 0.037018 -4.106716 0.0000
HIERAR -0.014737 0.005685 -2.592164 0.0096
SECTEUR 0.020562 0.030497 0.674227 0.5002
R-squared 0.156291 Mean dependent var 2.223950
Adjusted R-squared 0.153288 S.D. dependent var 0.839856
S.E. of regression 0.772810 Akaike info criterion 2.326244
Sum squared resid 2181.103 Schwarz criterion 2.349947
Log likelihood -4250.006 F-statistic 52.03908
Durbin-Watson stat 1.686293 Prob(F-statistic) 0.000000
Rsultats ) : rsultats de la MOB dans le cas de la rgression de edu (rgressions intermdiaires
disponibles dans l'annexe 5).
Df % Ef %
Diffrence totale 25.081 0.878 -3.491 0.122 1.000
constante -5.502
LN
31.802 0.912 -3.068 0.088 1.00
AGE
0.006 0.980 0.000 0.020 1.00
MARIE
-0.010 0.920 0.001 0.080 1.00
NAT
0.007 0.458 -0.008 0.542 1.00
TAUXOCCUP
-1.032 0.760 -0.326 0.240 1.00
CONTRAT
0.072 0.978 -0.002 0.022 1.00
OETA8
-0.032 0.623 -0.019 0.377 1.00
TAILETA
-0.019 0.873 0.003 0.127 1.00
DIV
-0.136 0.894 -0.016 0.106 1.00
OININ8
-0.132 0.708 -0.054 0.292 1.00
HIERAR
0.056 0.987 -0.001 0.013 1.00
SECTEUR
0.002 0.961 0.000 0.039 1.00
Selon la rgression (, il existe une discrimination contre les hommes. Cela veut dire que pour le mme salaire,
on demande aux hommes d'avoir un niveau de formation suprieur celui des femmes.
Il faut cependant relativiser cette dduction, puisque le R
2
ajust ne vaut que 0.154, ce qui est vraiment faible.
Le rsultat de la MOB permet cependant d'affirmer la conclusion de discrimination contre les hommes : selon la
MOB, seuls 12.2% du diffrentiel des qualifications moyennes sont expliqus par les diffrences dans les
moyennes des variables explicatives. Cependant, les R
2
ajusts des deux rgressions en annexe sont aussi trs
bas.
3) Rgression inverse de la variable tauxoccup
Les estimations sont les suivantes :
Rgression * : rgression inverse de tauxoccup en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: TAUXOCCUP
Method: Least Squares
Date: 05/16/01 Time: 13:47
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -47.78728 23.94435 -1.995765 0.0460
LN 15.00157 2.392012 6.271526 0.0000
AGE -0.282451 0.032827 -8.604167 0.0000
EDU -1.681386 0.669821 -2.510201 0.0121
SEXE10 -8.988013 1.177608 -7.632430 0.0000
MARIE -7.020130 0.634624 -11.06188 0.0000
NAT -4.777592 0.684397 -6.980736 0.0000
CONTRAT -1.000263 1.685109 -0.593590 0.5528
OETA8 0.685276 0.599206 1.143639 0.2528
TAILETA 0.006623 0.007038 0.941059 0.3467
DIV -2.810947 0.459725 -6.114405 0.0000
OININ8 3.707312 1.051612 3.525361 0.0004
HIERAR -0.025415 0.100081 -0.253948 0.7996
SECTEUR 0.091704 0.611675 0.149922 0.8808
R-squared 0.538107 Mean dependent var 83.65125
Adjusted R-squared 0.536463 S.D. dependent var 21.50310
S.E. of regression 14.64008 Akaike info criterion 8.209214
Sum squared resid 782739.9 Schwarz criterion 8.232917
Log likelihood -15033.49 F-statistic 327.2765
Durbin-Watson stat 1.138316 Prob(F-statistic) 0.000000
Rsultats 11 : rsultats de la MOB dans le cas de la rgression de tauxoccup (rgressions
intermdiaires disponibles dans l'annexe 6).
Df % Ef %
Diffrence totale 444.360 0.829 -91.734 0.171 1.000
constante -23.373
LN
58.677 0.535 -51.069 0.465 1.00
AGE
0.268 0.728 -0.100 0.272 1.00
EDU
-0.515 0.722 -0.199 0.278 1.00
MARIE
28.534 1.000 0.007 0.000 1.00
NAT
380.404 0.903 -41.034 0.097 1.00
CONTRAT
0.725 0.997 -0.002 0.003 1.00
OETA8
0.358 0.718 0.140 0.282 1.00
TAILETA
-1.470 0.972 -0.043 0.028 1.00
DIV
1.705 0.814 0.388 0.186 1.00
OININ8
-2.347 0.934 0.166 0.066 1.00
HIERAR
1.310 0.991 0.011 0.009 1.00
SECTEUR
0.084 0.990 0.001 0.010 1.00
En regardant la rgression *, on voit que les hommes sont discrimins, tant donn que le coefficient de sexe10
est significatif et que la rgression est bonne (R
2
ajust de 0.54). Ainsi, pour un mme salaire, on demande aux
hommes de plus travailler. Cette conclusion est appuye par les rsultats de la MOB, puisque ceux-ci montre
qu'il y a une forte discrimination envers les hommes (82.9% non expliqus).
Je trouve ce rsultat trs tonnant. Cela ne pourrait-il pas venir du fait que beaucoup de femmes travaillent
temps partiel ? Ainsi, une femme ayant un niveau hirarchique haut, mais travaillant temps partiel aurait le
mme salaire qu'un homme bas niveau hirarchique et travaillant plein temps, ce qui fausserait compltement
ces conclusions.
4) Rgression inverse de la variable contrat
On obtient les rsultats suivants :
Rgression 12 : rgression inverse de contrat en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: CONTRAT
Method: Least Squares
Date: 05/16/01 Time: 13:49
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 0.658536 0.085627 7.690794 0.0000
LN 0.026128 0.009542 2.738235 0.0062
AGE 0.000528 0.000345 1.531314 0.1258
EDU -0.014249 0.005237 -2.720959 0.0065
SEXE10 0.016507 0.009033 1.827496 0.0677
MARIE 0.018732 0.007566 2.475933 0.0133
NAT 0.000517 0.010406 0.049678 0.9604
TAUXOCCUP -0.000192 0.000330 -0.581830 0.5607
OETA8 0.018822 0.006604 2.850273 0.0044
TAILETA -0.000211 8.92E-05 -2.366016 0.0180
DIV -0.006412 0.007220 -0.888114 0.3745
OININ8 0.047910 0.010550 4.541245 0.0000
HIERAR -0.001333 0.001569 -0.849357 0.3957
SECTEUR 0.003672 0.008268 0.444060 0.6570
R-squared 0.039841 Mean dependent var 0.955265
Adjusted R-squared 0.036423 S.D. dependent var 0.206751
S.E. of regression 0.202950 Akaike info criterion -0.347898
Sum squared resid 150.4218 Schwarz criterion -0.324195
Log likelihood 651.6977 F-statistic 11.65662
Durbin-Watson stat 1.784252 Prob(F-statistic) 0.000000
Rsultats 13 : rsultats de la MOB dans le cas de la rgression de contrat (rgressions intermdiaires
disponibles dans l'annexe 7).
Df % Ef %
Diffrence totale 0.124 0.343 -0.238 0.657 1.000
constante -0.198
LN
0.793 0.851 -0.139 0.149 1.00
AGE
-0.001 0.987 0.000 0.013 1.00
EDU
0.005 0.841 -0.001 0.159 1.00
MARIE
-0.005 0.921 0.000 0.079 1.00
NAT
-0.487 0.811 -0.114 0.189 1.00
TAUXOCCUP
0.000 0.916 0.000 0.084 1.00
OETA8
0.002 0.348 0.003 0.652 1.00
TAILETA
0.011 0.961 0.000 0.039 1.00
DIV
-0.001 0.355 0.001 0.645 1.00
OININ8
0.023 0.640 0.013 0.360 1.00
HIERAR
-0.018 0.982 0.000 0.018 1.00
SECTEUR
0.001 0.987 0.000 0.013 1.00
A nouveau, la rgression 12 n'a l'air absolument pas robuste : le R
2
ajust ne vaut que 0.036. Nanmoins, tant
donn que la variable sexe10 a un coefficient significatif au seuil de 7% et que son signe est positif, on peut
dduire qu'il y a une discrimination l'encontre des femmes cette fois-ci. Etant donn que la variable contrat
vaut 1 si l'emploi est limit dans le temps et 2 sinon, cela signifie qu' salaire gal, les femmes ont plus de contrat
sans limite de temps que les hommes. Ainsi, pour avoir le mme salaire qu'un homme, une femme doit tre prte
s'engager plus que l'homme. Cette exigence de la part de l'employeur existe certainement dans le but de
compenser le fait que les femmes risquent d'avoir des enfants et donc, risquent de devoir sortir de l'entreprise. Si
une femme prend un emploi limit dans le temps, il est probable que ce soit afin d'tre libre d'avoir des enfants.
Ainsi, une femme s'engageant avec un contrat non limit donnerait un signe montrant qu'elle ne veut pas fonder
une famille, d'o l'intrt pour l'employeur d'engager cette femme-ci.
Cette hypothse n'est raliste que si la femme est encore en ge d'avoir des enfants. Elle n'est donc pas applicable
toute la population de l'chantillon et comme l'ge moyen des femmes de l'chantillon est de 49 ans, cette
hypothse doit tre considre avec prudence.
De plus, il serait dangereux de tirer une conclusion de cette rgression, puisque la MOB rejette ce rsultat. En
effet, selon cette mthode, la discrimination va l'encontre des hommes.
5) Rgression inverse de la variable oeta8
On obtient les rsultats suivants :
Rgression 14 : rgression inverse de oeta8 en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: OETA8
Method: Least Squares
Date: 05/16/01 Time: 13:50
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -0.697174 0.114178 -6.106024 0.0000
LN 0.018641 0.012128 1.537014 0.1244
AGE 0.012588 0.000695 18.10318 0.0000
EDU -0.029933 0.008519 -3.513546 0.0004
SEXE10 -0.027125 0.015896 -1.706427 0.0880
MARIE 0.040407 0.015085 2.678646 0.0074
NAT 0.022937 0.020503 1.118694 0.2633
TAUXOCCUP 0.000531 0.000453 1.173619 0.2406
CONTRAT 0.075931 0.025938 2.927371 0.0034
TAILETA 0.001063 0.000174 6.108402 0.0000
DIV -0.031005 0.016799 -1.845670 0.0650
OININ8 0.334853 0.015269 21.93063 0.0000
HIERAR 0.001648 0.003100 0.531488 0.5951
SECTEUR 0.023006 0.015735 1.462080 0.1438
R-squared 0.309119 Mean dependent var 0.397981
Adjusted R-squared 0.306659 S.D. dependent var 0.489548
S.E. of regression 0.407633 Akaike info criterion 1.046911
Sum squared resid 606.8321 Schwarz criterion 1.070614
Log likelihood -1904.987 F-statistic 125.6925
Durbin-Watson stat 2.033516 Prob(F-statistic) 0.000000
Rsultats 15 : rsultats de la MOB dans le cas de la rgression de oeta8 (rgressions intermdiaires
disponibles dans l'annexe 8).
Df % Ef %
Diffrence totale 3.455 0.787 0.933 0.213 1.000
constante -0.437
LN
0.005 0.076 -0.064 0.924 1.00
AGE
0.008 0.526 0.007 0.474 1.00
EDU
-0.013 0.770 -0.004 0.230 1.00
MARIE
-0.082 0.995 0.000 0.005 1.00
NAT
3.910 0.811 0.912 0.189 1.00
TAUXOCCUP
0.002 0.990 0.000 0.010 1.00
CONTRAT
0.015 0.524 0.014 0.476 1.00
TAILETA
-0.006 0.532 0.005 0.468 1.00
DIV
0.016 0.780 0.005 0.220 1.00
OININ8
-0.025 0.294 0.060 0.706 1.00
HIERAR
0.048 0.985 0.001 0.015 1.00
SECTEUR
0.014 0.994 0.000 0.006 1.00
La rgression 14 va dans le sens d'une discrimination envers les hommes. Ainsi, pour avoir le mme salaire que
les femmes, on demande aux hommes d'avoir pass plus de temps dans l'entreprise.
Ce rsultat est confirm par la MOB, puisque 78.7% des diffrences d'anciennet moyenne ne sont pas expliqus
par les diffrences dans les valeurs moyennes des variables explicatives.
6) Rgression inverse de la variable oinin8
Les estimations sont :
Rgression 16 : rgression inverse de oinin8 en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: OININ8
Method: Least Squares
Date: 05/16/01 Time: 13:52
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -0.862413 0.145004 -5.947505 0.0000
LN 0.067693 0.017280 3.917361 0.0001
AGE 0.009888 0.000610 16.21275 0.0000
EDU -0.035208 0.008744 -4.026466 0.0001
SEXE10 -0.055187 0.015278 -3.612280 0.0003
MARIE 0.054387 0.013449 4.043809 0.0001
NAT 0.058610 0.019413 3.019101 0.0026
TAUXOCCUP 0.002392 0.000547 4.370270 0.0000
CONTRAT 0.160887 0.033790 4.761310 0.0000
OETA8 0.278736 0.013095 21.28639 0.0000
TAILETA -0.000178 0.000158 -1.126627 0.2600
DIV -0.042447 0.013795 -3.076882 0.0021
HIERAR -0.002988 0.002814 -1.061709 0.2884
SECTEUR 0.003907 0.014746 0.264956 0.7911
R-squared 0.332963 Mean dependent var 0.708402
Adjusted R-squared 0.330588 S.D. dependent var 0.454560
S.E. of regression 0.371910 Akaike info criterion 0.863484
Sum squared resid 505.1349 Schwarz criterion 0.887187
Log likelihood -1568.766 F-statistic 140.2274
Durbin-Watson stat 1.959696 Prob(F-statistic) 0.000000
Rsultats 17 : rsultats de la MOB dans le cas de la rgression de oinin8 (rgressions intermdiaires
disponibles dans l'annexe 9).
Df % Ef %
Diffrence totale -19.205 0.813 -4.423 0.187 1.000
constante -0.825
LN
-1.081 0.550 -0.886 0.450 1.00
AGE
0.008 0.220 -0.027 0.780 1.00
EDU
-0.008 0.273 0.022 0.727 1.00
MARIE
0.044 0.671 -0.021 0.329 1.00
NAT
-1.245 0.279 -3.213 0.721 1.00
TAUXOCCUP
0.000 0.010 -0.002 0.990 1.00
CONTRAT
-0.006 0.279 -0.015 0.721 1.00
OETA8
-16.368 0.997 -0.042 0.003 1.00
TAILETA
-0.021 0.503 0.021 0.497 1.00
DIV
0.243 0.541 -0.206 0.459 1.00
HIERAR
0.030 0.511 -0.029 0.489 1.00
SECTEUR
0.025 0.511 -0.024 0.489 1.00
Au premier abord, la rgression 16 a l'air acceptable, puisque le R
2
ajust vaut 0.33 et que tous les coefficients
sauf trois sont significatifs au seuil de 1%. A nouveaux, il y a une discrimination envers les hommes selon cette
rgression. Hlas, ce rsultat n'est pas affirm par la MOB. Il est donc impossible de trier une conclusion
concernant cette variable.
7) Rgression inverse de la variable hierar
Les estimations obtenues sont les suivantes :
Rgression 18 : rgression inverse de hierar en utilisant l'chantillon comprenant les femmes et les
hommes.
Dependent Variable: HIERAR
Method: Least Squares
Date: 05/16/01 Time: 13:54
Sample(adjusted): 1377 9918
Included observations: 3666
Excluded observations: 4876 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 3.999407 0.571846 6.993850 0.0000
LN 0.064361 0.052413 1.227963 0.2195
AGE -0.000244 0.003854 -0.063417 0.9494
EDU -0.120528 0.046469 -2.593743 0.0095
SEXE10 -0.224445 0.086638 -2.590612 0.0096
MARIE 0.061261 0.078995 0.775508 0.4381
NAT -0.201849 0.116506 -1.732525 0.0833
TAUXOCCUP -0.000579 0.002274 -0.254705 0.7990
CONTRAT -0.158034 0.185689 -0.851072 0.3948
OETA8 0.048431 0.091123 0.531485 0.5951
TAILETA -0.001557 0.000948 -1.643360 0.1004
DIV 0.210460 0.084885 2.479372 0.0132
OININ8 -0.105519 0.099382 -1.061754 0.2884
SECTEUR 0.597435 0.084905 7.036522 0.0000
R-squared 0.020126 Mean dependent var 4.241315
Adjusted R-squared 0.016638 S.D. dependent var 2.228708
S.E. of regression 2.210089 Akaike info criterion 4.427754
Sum squared resid 17838.17 Schwarz criterion 4.451457
Log likelihood -8102.074 F-statistic 5.770045
Durbin-Watson stat 2.032854 Prob(F-statistic) 0.000000
Rsultats 19 : rsultats de la MOB dans le cas de la rgression de hierar (rgressions intermdiaires
disponibles dans l'annexe 10).
Df % Ef %
Diffrence totale 1.462 0.113 11.425 0.887 1.000
constante 1.655
LN
-6.559 0.771 1.950 0.229 1.00
AGE
-0.016 0.660 0.008 0.340 1.00
EDU
0.061 0.657 0.032 0.343 1.00
MARIE
0.273 0.541 -0.232 0.459 1.00
NAT
-7.110 0.288 17.607 0.712 1.00
TAUXOCCUP
0.009 0.584 -0.006 0.416 1.00
CONTRAT
-0.187 0.741 0.065 0.259 1.00
OETA8
14.226 0.632 -8.295 0.368 1.00
TAILETA
0.000 0.144 0.001 0.856 1.00
DIV
0.027 0.149 -0.153 0.851 1.00
OININ8
-0.794 0.487 0.835 0.513 1.00
SECTEUR
-0.122 0.239 -0.389 0.761 1.00
Bien que la rgression et la MOB montrent une discrimination contre les hommes, le R
2
ajust de la rgression
18 et ceux des rgressions en annexe sont trop faibles pour pouvoir tirer des conclusions de ces rgressions. De
plus, la plupart des coefficients ne sont pas significatifs dans les trois rgressions.
5.4. Conclusion sur la rgression inverse
Rappelons tout d'abord les rsultats obtenus :
Avec la rgression directe, on trouve une discrimination contre les femmes.
Les rgressions inverses sur les variables Q, edu, tauxoccup et oeta8 montrent que ce sont les hommes
qui sont victimes d'ingalits.
Pour les autres variables auxquelles on a appliqu la rgression inverse (age, contrat, oinin8 et hierar),
aucun rsultat ne peut tre dduit des estimations.
Ces diffrents rsultats permettent de montrer l'importance de l'utilisation de la rgression inverse. En
effet, si je m'tais contente d'une rgression directe, j'en aurais conclu en faveur d'une discrimination
contre les femmes. En appliquant des rgressions inverses, on se rend compte qu' salaire gal, on
demande de meilleures qualifications aux hommes qu'aux femmes.
Cette contradiction m'empche donc de tirer une conclusion de ces rsultats. On ne peut donc pas
objectivement affirmer que les femmes souffrent de discrimination salariale. C'est en fait un peu
dommage, car cela signifie que si toutes les tudes font des rgressions inverses et trouvent les mmes
incompatibilits que moi, on ne pourra jamais savoir s'il y a une discrimination contre les hommes ou
contre les femmes.
Avant de passer un autre problme, il me parat encore important de rappeler la critique de Weisberg
et Tomberlin
39
au sujet de la justification de l'utilisation des rgressions inverses, critique qui me parat
assez pertinente.
En conclusion, les tudes sur la discrimination salariale ne devraient pas se limiter une rgression
directe, et auraient avantage tester leurs rsultats l'aide de rgressions inverses si leur auteur dsire
ne pas en tirer de fausses dductions.

39
Voir point 5.2., p.9
6. La correction de Heckman
6.1. Explication de la mthode de Heckman
Lorsqu'on rgresse le salaire sur les variables explicatives, on ne peut pas tenir compte des chmeurs
et des inactifs. Il y a donc un biais de slection de l'chantillon. Ce biais de slection est introduit par
les inactifs et les chmeurs eux-mmes (auto-slection), puisqu'ils ne travaillent pas parce que le
salaire qu'ils demandent est suprieur au salaire offert par les entreprises.
Ainsi, l'chantillon utilis ne reprsente pas toute la population.
Ce biais de slection ne permet pas de savoir quel serait le salaire de la personne interroge si elle
avait dcid de travailler et c'est cela qui risque de fausser les rsultats.
Ce problme peut tre reprsent comme suit :
Les points blancs sont les salaires non observables, alors que les noirs sont ceux qu'on observe. Si tous
les points taient connus, la droite de rgression correspondrait la ligne pleine sur le graphique. Mais
tant donn qu'on n'a qu'un nombre limit d'observations, la droite rgresse est la droite en pointills
sur le graphique. Il y a donc nettement un biais d'chantillonnage.
Plus prcisment, l'explication de la correction de Heckman est la suivante :
Comme on l'a vu, la particularit de la variable explique, ln, est qu'elle est latente. En effet, on ne
l'observe que si la personne interroge travaille, c'est dire, si le salaire qu'elle exige est infrieur ou
gal au salaire propos par l'entreprise.
On peut dfinir le salaire offert par y
*
n1
et le salaire demand par y
*
n2
.
La personne ne travaille donc que si y
*
n1
> y
*
n2
.
Pour y
*
n1
et y
*
n2
, on a les quations suivantes :
+ n1 1 n1 n1 u a ' x * y (1)
+ n2 2 n2 n2 u a ' x * y (2)
avec cov( n1 u , n2 u ) =
On dfinit y
n1
comme tant la variable observe (ici, le salaire). On a donc :
y
*
n1
si y
*
n1
y
*
n2
Salaire
Variable explicative
y
n1
=
0 sinon
Cela signifie qu'on observe le salaire que si le salaire offert est suprieur ou gal celui demand.
La probabilit d'observer y
*
n1
correspond la probabilit de la personne participer au march du
travail.
y
*
n1
est partiellement observ et y
*
n2
ne l'est pas du tout. Cependant l'quation (2) permet d'estimer
y
*
n2
, puisque x'
n2
est observable.
Etant donn que x'
n1
et y
n1
sont observables et que y
*
n1
l'est partiellement, on peut sans problme
estimer l'quation (1). C'est ce que j'ai fait jusqu' prsent.
Comme on peut estimer les quations (1) et (2), on gagne une de l'information si on le fait. C'est le but
de la correction de Heckman..
En effet, Heckman propose la mthode suivante : premirement, il faut estimer la probabilit qu'une
personne interroge a de participer au march du travail (cela correspond la probabilit d'observer
y
*
n1
), que celle-ci soit active, chmeuse ou inactive. Deuximement, il faut introduire cette probabilit
en tant que variable explicative dans la rgression de y
*
n1
. En procdant de cette faon, on utilise toute
l'information disposition.
6.2. Application de la mthode de Heckman
La premire chose faire est, selon la mthode de Heckman, de dfinir la probabilit de participer au
march du travail.
Les variables explicatives de cette probabilit sont les suivantes :
1) L'tat civil (marie)
Cette variable est la mme que celle utilise jusqu' prsent.
Pour les femmes, le fait d'tre marie devrait diminuer la probabilit de travailler. En effet et hlas - ,
il y a encore une certaine tradition en Suisse qui entrane que dans beaucoup de foyers, ce soit
principalement l'homme qui fait vivre le mnage.
Logiquement, l'effet du mariage sur la probabilit qu'un homme prenne part au march du travail est
positif. En effet, pour un homme, le fait d'tre mari est en quelque sorte une responsabilit en plus
assumer, la femme tant d'une certaine manire une bouche en plus nourrir (hlas encore).
2) La formation acquise (edu)
A l'instar de la variable marie, la variable edu a la mme codification que prcdemment.
En gnral, le niveau de formation devrait avoir un impact positif sur la probabilit de travailler. En
effet, aprs avoir entrepris des tudes, ces personnes dsirent obtenir des rendements sur cet
investissement et donc, veulent travailler.
Cette variable a particulirement du poids pour dterminer la probabilit des femmes travailler.
Effectivement, comme un homme a une probabilit de participer au march du travail de presque 1, la
variable edu a moins d'impact que pour les femmes. Cette importance vient du fait qu'une femme
n'ayant pas fait d'tudes n'aura aucun investissement rentabiliser et donc, aura plus tendance rester
femme au foyer. Par contre, et cela mme si le revenu de son mari suffit au mnage, une femme ayant
fait des tudes voudra mettre en pratique ses connaissances.
3) La taille du mnage (taillemen)
Cette nouvelle variable explicative reprsente le nombre de personnes dans le mnage de la personne interroge
(on a donc une mesure du nombre d'enfants dans un mnage).
Pour les hommes, cette variable a le mme effet que la variable marie : plus il y a de bouches nourrir, plus
l'homme est pouss travailler.
Du ct de la femme, c'est le contraire : s'il y a des enfants dans le mnage, la femme aura tendance rester la
maison pour s'en occuper.
4) L'ge de la personne interroge (age)
Encore une fois, on retrouve une variable explicative qu'on avait dj utilise.
L'impact de l'ge sur la probabilit de travailler d'un homme ne devrait pas tre significatif.
Par contre, pour la femme, il devrait y avoir un effet, mais celui-ci est ambigu :
Au dbut de sa vie active (20 ans en moyenne), une femme a envie de fonder une famille. Sa
probabilit de participation au march du travail devrait donc tre plus faible que lorsque la femme a
plus de 35 ans environ. A partir ce cet ge-ci, la femme a envie de participer nouveau la vie active
et donc, la probabilit devrait augmenter. Finalement, il est possible que vers la fin de sa vie active,
elle n'ait plus envie de travailler, ce qui fait diminuer la probabilit.
Il aurait encore t intressant de connatre les autres revenus dans le mnage afin d'en faire une
variable explicative, mais une telle variable n'tait pas disponible.
Les deux quations du modle de Heckman sont donc les suivantes :
Prob = d +
1
marie +
2
edu +
3
taillemen +
4
ge + u : quation dterminant la probabilit de participer au
march du travail
ln = c + X + : quation de salaire habituelle
On peut remarquer que les variables explicatives marie, edu et age se retrouvent dans X. Cela ne pose
nanmoins pas de problme, puisque aucune de ces variables n'est endognise dans la deuxime
quation.
Dans cette partie, je vais estimer ces deux quations et les comparer avec les quations prcdemment
trouves.
Il faut noter qu'ici, on inclut dans les chantillons les chmeurs et les inactifs, puisqu'ils seront
ncessaires l'estimation de l'quation de probabilit.
Pour chaque estimation, j'ai utilis l'chantillon comprenant les hommes et les femmes, puis ceux
sparant le sexe, afin de pouvoir utiliser la MOB.
Le point ngatif de la dmarche est que le programme que j'ai utilis pour appliquer la mthode de
Heckman ne permet pas de faire de rgressions inverses, ni de tester l'hteroscdasticit (mais le biais
attenant l'htroscdasticit ne devrait pas tre grand, puisqu'on a vu dans la partie 5 (voir 5.3. p.9)
qu'aucune variable ne devenait significative ou non significative aprs avoir enlev
l'htroscdasticit) . Il faudra donc tre prudent lors de l'interprtation des rsultats.
Les rsultats sont les suivants :
Rgression A : correction de Heckman, en utilisant l'chantillon comprenant les femmes et les
hommes
Iteration 0: log likelihood = -8549.7593 (not concave)
Iteration 1: log likelihood = -8387.5794
Iteration 2: log likelihood = -8192.8131
Iteration 3: log likelihood = -8055.1253
Iteration 4: log likelihood = -8053.4427
Iteration 5: log likelihood = -8053.4408
Iteration 6: log likelihood = -8053.4408
Heckman selection model Number of obs = 10868
(regression model with sample selection) Censored obs = 7202
Uncensored obs = 3666
Wald chi2(13) = 3888.55
Log likelihood = -8053.441 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
| Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------------------
ln |
age | .0216782 .0009396 23.071 0.000 .0198366 .0235199
edu | .0717652 .0127826 5.614 0.000 .0467118 .0968187
sexe10 | -.039079 .0229921 -1.700 0.089 -.0841427 .0059846
marie | .0148621 .0216003 0.688 0.491 -.0274738 .0571979
nat | .0906323 .0226314 4.005 0.000 .0462757 .134989
tauxoccu | .0190225 .0004293 44.314 0.000 .0181811 .0198638
contrat | .0791611 .0372692 2.124 0.034 .0061148 .1522074
oeta8 | .0401526 .0176502 2.275 0.023 .0055589 .0747463
taileta | .0014172 .0001884 7.521 0.000 .0010479 .0017865
div | .0964811 .0176072 5.480 0.000 .0619717 .1309905
oinin8 | .1316505 .0198415 6.635 0.000 .0927618 .1705392
hierar | .0001835 .0033395 0.055 0.956 -.0063619 .0067289
secteur | .010714 .0173287 0.618 0.536 -.0232496 .0446776
_cons | 8.333609 .0848404 98.227 0.000 8.167325 8.499894
---------+--------------------------------------------------------------------
select |
age | -.0327449 .0008932 -36.659 0.000 -.0344956 -.0309942
edu | .2457291 .0160654 15.296 0.000 .2142416 .2772167
sexe10 | -.2682985 .0272349 -9.851 0.000 -.3216778 -.2149191
marie | .1797319 .0302479 5.942 0.000 .120447 .2390168
tailleme | -.0892972 .0095386 -9.362 0.000 -.1079926 -.0706019
_cons | .8462159 .065494 12.921 0.000 .71785 .9745817
---------+--------------------------------------------------------------------
/athrho | -1.725285 .0326692 -52.811 0.000 -1.789316 -1.661255
/lnsigma | -.2724426 .0151321 -18.004 0.000 -.302101 -.2427843
---------+---------------------------------------------------------------------
rho | -.9384963 .003895 -.9456883 -.930386
sigma | .7615171 .0115233 .7392634 .7844407
lambda | -.714681 .0128293 -.739826 -.689536
-------------------------------------------------------------------------------
LR test of indep. eqns. (rho = 0): chi2(1) = 1057.80 Prob > chi2 = 0.0000
-------------------------------------------------------------------------------
Rgression B : correction de Heckman, en utilisant l'chantillon ne comprenant que les femmes.
Iteration 0: log likelihood = -4637.6244 (not concave)
Iteration 1: log likelihood = -4550.338
Iteration 2: log likelihood = -4410.4649
Iteration 3: log likelihood = -4358.7061
Iteration 4: log likelihood = -4356.0136
Iteration 5: log likelihood = -4356.0072
Iteration 6: log likelihood = -4356.0072
Heckman selection model Number of obs = 6387
(regression model with sample selection) Censored obs = 4718
Uncensored obs = 1669
Wald chi2(12) = 1267.50
Log likelihood = -4356.007 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
| Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------------------
ln |
age | .0266914 .0016476 16.200 0.000 .0234621 .0299206
edu | .0201462 .0259591 0.776 0.438 -.0307327 .0710251
marie | .0902037 .0404671 2.229 0.026 .0108897 .1695178
nat | .0976858 .0405789 2.407 0.016 .0181526 .1772189
tauxoccu | .0171085 .0006471 26.439 0.000 .0158402 .0183767
contrat | .0994264 .0626743 1.586 0.113 -.023413 .2222659
oeta8 | .0842868 .0315347 2.673 0.008 .02248 .1460937
taileta | .0016343 .000328 4.982 0.000 .0009914 .0022772
div | .1083586 .0354576 3.056 0.002 .038863 .1778542
oinin8 | .0868003 .0316013 2.747 0.006 .0248628 .1487377
hierar | .0035372 .0058156 0.608 0.543 -.0078611 .0149356
secteur | .0156386 .0299094 0.523 0.601 -.0429826 .0742599
_cons | 8.444945 .1469852 57.454 0.000 8.15686 8.733031
---------+--------------------------------------------------------------------
select |
age | -.0341343 .0012107 -28.194 0.000 -.0365073 -.0317614
edu | .2547743 .0242678 10.498 0.000 .2072103 .3023384
marie | -.005278 .0395656 -0.133 0.894 -.082825 .0722691
tailleme | -.1290482 .0130911 -9.858 0.000 -.1547063 -.1033901
_cons | .7777544 .0902577 8.617 0.000 .6008526 .9546562
---------+--------------------------------------------------------------------
/athrho | -1.928523 .0483399 -39.895 0.000 -2.023267 -1.833778
/lnsigma | .0041482 .0220051 0.189 0.850 -.0389809 .0472773
---------+---------------------------------------------------------------------
rho | -.9586138 .0039184 -.9656351 -.9501944
sigma | 1.004157 .0220965 .9617691 1.048413
lambda | -.9625986 .0236744 -1.009 -.9161976
-------------------------------------------------------------------------------
LR test of indep. eqns. (rho = 0): chi2(1) = 671.01 Prob > chi2 = 0.0000
-------------------------------------------------------------------------------
Rgression C : correction de Heckman, en utilisant l'chantillon ne comprenant que les hommes.
Iteration 0: log likelihood = -3315.5958
Iteration 1: log likelihood = -3315.4756
Iteration 2: log likelihood = -3315.4739
Iteration 3: log likelihood = -3315.4739
Heckman selection model Number of obs = 4481
(regression model with sample selection) Censored obs = 2484
Uncensored obs = 1997
Wald chi2(12) = 1968.93
Log likelihood = -3315.474 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
| Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------------------
ln |
age | .0056488 .0013032 4.334 0.000 .0030945 .0082031
edu | .1790267 .0110064 16.266 0.000 .1574545 .200599
marie | .089765 .0202032 4.443 0.000 .0501675 .1293625
nat | .128117 .0237173 5.402 0.000 .081632 .174602
tauxoccu | .0223555 .0007282 30.698 0.000 .0209282 .0237828
contrat | .1300956 .040714 3.195 0.001 .0502976 .2098936
oeta8 | .0129186 .0188997 0.684 0.494 -.0241241 .0499613
taileta | .0011891 .0002028 5.864 0.000 .0007917 .0015865
div | .0724873 .0169397 4.279 0.000 .0392862 .1056884
oinin8 | .1603505 .023627 6.787 0.000 .1140425 .2066585
hierar | -.0010016 .0035497 -0.282 0.778 -.0079588 .0059556
secteur | -.0114251 .0187885 -0.608 0.543 -.04825 .0253997
_cons | 7.787376 .0972907 80.042 0.000 7.59669 7.978062
---------+--------------------------------------------------------------------
select |
age | -.0420396 .0015727 -26.730 0.000 -.0451221 -.0389571
edu | .2316969 .0228172 10.154 0.000 .186976 .2764179
marie | .6818658 .0558275 12.214 0.000 .572446 .7912857
tailleme | -.1536963 .0202147 -7.603 0.000 -.1933163 -.1140762
_cons | 1.271893 .1034309 12.297 0.000 1.069173 1.474614
---------+--------------------------------------------------------------------
/athrho | .0223344 .1181773 0.189 0.850 -.2092888 .2539576
/lnsigma | -1.038697 .0159017 -65.320 0.000 -1.069863 -1.00753
---------+---------------------------------------------------------------------
rho | .0223307 .1181183 -.2062857 .2486352
sigma | .3539157 .0056279 .3430554 .3651198
lambda | .0079032 .0418166 -.0740558 .0898622
-------------------------------------------------------------------------------
LR test of indep. eqns. (rho = 0): chi2(1) = 0.03 Prob > chi2 = 0.8553
-------------------------------------------------------------------------------
Rsultats D : mthode d'Oaxaca-Blinder partir des rgressions B et C.
Df % Ef %
Diffrence totale -1.008 0.264 -2.810 0.736 1.000
constante -0.658
age -1.034 0.789 -0.277 0.211 1.00
edu 0.291 0.471 -0.326 0.529 1.00
marie 0.000 0.004 -0.049 0.996 1.00
nat 0.058 0.200 -0.231 0.800 1.00
tauxoccu 0.375 0.190 -1.596 0.810 1.00
contrat 0.029 0.191 -0.123 0.809 1.00
oeta8 -0.025 0.927 -0.002 0.073 1.00
taileta -0.019 0.273 -0.051 0.727 1.00
div -0.031 0.331 -0.062 0.669 1.00
oinin8 0.046 0.304 -0.105 0.696 1.00
hierar -0.019 0.819 0.004 0.181 1.00
secteur -0.021 0.706 0.009 0.294 1.00
Avant de regarder les rsultats de ces estimations, il faut prciser quelques points par rapport aux tableaux de
rgression de Heckman :
Le tableau de Heckman se divise en deux parties : la premire partie est l'estimation de l'quation du salaire. La
deuxime partie donne les rsultats pour l'quation de la probabilit de travailler.
Pour savoir si la correction de Heckman est justifie, il faut regarder la mesure "/arthrho" et le test "Lr test of
independant equations". Ces mesures permettent de calculer (cov( n1 u , n2 u ) = ) et de voir s'il est significatif
ou non. Si ces rsultats montrent qu'on rejette l'hypothse nulle que = 0, cela signifie qu'il y a effectivement un
lien entre les deux quations et que la correction de Heckman est ncessaire sous peine de biais.
Analysons maintenant rgression par rgression :
Rgression A :
Pour la premire partie de cette rgression (estimation du salaire), on voit que seules les variables marie, hierar
et secteur ne sont pas significatives (ce qui n'est pas tonnant pour ces deux dernires vu les rgressions
prcdentes). La variable sexe10 est significative au seuil de 10% et toutes les autres le sont au seuil de 5%.
Pour la deuxime partie, tout est significatif, ce qui confirme l'ide que rgresser les deux quations n'est pas
inutile.
En utilisant la mthode de Heckman, les hypothses concernant les signes des coefficients ne changent pas
40
. On
voit ainsi que pour les neuf variables pour lesquelles ont avait suppos que le coefficient aurait un signe positif
41
,
les hypothses sont vrifies.
Si on compare cette rgression avec celle obtenue sans prendre en compte la correction de Heckman (voir
rgression !, p.15), on voit que la variable marie n'est plus significative alors qu'elle l'tait dans la rgression !.
Etant donn qu'elle est significative dans la rgression de la probabilit, cela signifie que le fait d'tre mari
dtermine plutt la probabilit de travailler plutt que le salaire lui-mme, ce qui n'est finalement pas tonnant.
Confrontons prsent les rsultats de l'quation de probabilit avec les hypothses mises :
En ce qui concerne l'ge, les hypothses faites n'taient pas tellement liantes. Dans la rgression, l'impact de l'ge
sur la probabilit est ngatif, mais avant de tirer des conclusions de ce rsultat, je prfre attendre les rsultats
des rgressions B et C.
L'influence positive de l'ducation sur la probabilit de travailler est confirme dans la rgression. Mes
hypothses taient donc justes.
Le signe ngatif du coefficient de sexe10 montre que les hommes ont une probabilit plus grande de faire partie
du march du travail que les femmes. Cela n'est pas du tout tonnant, puisque comme je l'ai dj dit, la
probabilit des hommes travailler est proche de 1.
En ce qui concerne les variables marie et taillemen, je prfre tenir compte des rsultats des rgressions B et C,
puisque les hypothses sont contraires selon le sexe.
Finalement, cette rgression montre qu'il y a une discrimination envers les femmes, puisque le signe du
coefficient de sexe10 est ngatif dans la premire quation.
Rgression B :

40
Voir section 3.2., p.5.
41
ces variables sont age, edu, nat, tauxoccup, contrat, oeta8, tailleta, div, oinin8 et hierar.
La premire chose vrifier est que la rgression a raison d'tre. Etant donn qu'on rejette l'hypothse
disant que = 0, l'utilisation de la correction de Heckman est justifie.
Il faut comparer cette rgression avec la rgression correspondante lorsqu'on n'utilise pas Heckman (rgression
" p. 15). Cette comparaison permet de voir que l'utilisation de la mthode de Heckman fait considrablement
changer les rsultats. En effet, les variables age, edu, marie, nat, contra, oeat8, div et secteur voient leur
coefficient et leur t-stat changer de manire significative. En fait, on peut dire que ces deux rgressions sont
compltement diffrentes. Etant donn que la mthode de Heckman est celle qui est la plus juste
conomtriquement, c'est celle-ci qu'il faut considrer. Ainsi, toute conclusion faite partir de la rgression "
n'est pas valable.
Il est intressant de voir quel point le biais d'chantillonnage fausse les rsultats de la rgression des femmes.
Si on regarde plus prcisment la rgression B, on voit que les variables edu, hierar et secteur ne sont pas
significatives. Ce constat est trs tonnant en ce qui concerne la variable edu. En effet, selon cette rgression, le
niveau de formation d'une femme n'est pas dterminant pour le salaire.
Par contre, cette variable est significative dans l'quation de la probabilit, ce qui confirme l'hypothse mise
ce sujet.
On peut essayer de trouver une raison ce phnomne : si on analyse le droulement de la vie d'une femme, on
peut dire qu'en gnral une femme s'arrte au moins une fois dans sa vie professionnelle pour s'occuper de ses
enfants. Le temps pass lever ceux-ci, la femme ne peut pas travailler et donc, elle perd une partie des
connaissances acquises. Le rsultat est qu'au moment o elle veut retrouver une place de travail, elle n'a plus le
mme niveau de formation que celui qu'elle avait aprs avoir fini sa formation. Ainsi, elle ne peut trouver un
travail que dans un domaine exigeant moins de qualifications.
Selon cette rgression, le fait d'tre ge augmente le salaire mais fait diminuer la probabilit de travailler. Cela
correspond aux deux hypothses faites sur cette variable.
Pour la variable marie, on ne peut interprter que le coefficient de la premire rgression, puisque celui de la
deuxime rgression n'est pas significatif. Ainsi, le fait d'tre marie fait augmenter le salaire. C'est assez
tonnant ; je pensais que l'hypothse mise tait assez raliste.
Les autres variables de la premire rgression suivent les hypothses mises.
Finalement, la variable taillemen confirme ce qu'on avait suppos : le fait d'avoir des enfants pousse les femmes
rester la maison et donc, avoir une moins grande probabilit de travailler.
Rgression C :
Le premier point remarquer est que la mthode de Heckman n'est ici pas justifie : l'hypothse nulle supposant
que = 0 ne peut pas tre rejete. Ainsi, il est inutile de faire cette rgression. D'ailleurs, si on compare cette
rgression avec la rgression # (voir p. 16), on voit que les coefficients estims ne changent presque pas.
Ce rsultat n'est en ralit pas tonnant. En effet, tant donn que la probabilit des hommes de travailler sur le
march tend vers 1, il n'y a pas de biais de slection.
Il est tout de mme intressant d'analyser les rsultats obtenus avec la MOB (rsultats D) :
Cette mthode montre qu'il y a une discrimination contre les hommes, bien qu'il y en ait une autre envers les
femmes sur le plan de l'ducation (D
f
de edu vaut 0.291).
Si on compare ce rsultat avec celui obtenu lorsqu'on n'utilise pas Heckman (voir "Rsultat de la MOB", p.11),
on voit que les conclusions sont contradictoires.
Il est donc nouveau difficile de tirer des conclusions correctes. Cependant, considrant que la
mthode de Heckman est la plus propre, la balance pencherait plutt vers une discrimination salariale
envers les hommes.
6.3. Conclusion sur la correction de Heckman
Il est intressant de voir quel point le biais de slection fausse les rsultats si on n'applique pas la correction de
Heckman. Ce biais est si fort qu'il permet de tirer des conclusions opposes selon qu'on utilise la mthode de
Heckman ou qu'on ne l'utilise pas.
En conclusion, il faut dire que pour que les tudes sur la discrimination salariale soient crdibles, il faudrait
appliquer la correction de Heckman, chose qui n'est malheureusement que rarement faite dans la littrature
existante.
7. Conclusion
En parcourant cette tude, un fait est frappant : on n'arrive pas dterminer, premirement, s'il existe une
discrimination salariale et deuximement, si elle existe, contre qui. Cela prouve que l'utilisation des trois
amliorations possibles la rgression inverse, la mthode d'Oaxaca-Blinder et la correction de Heckman est
justifie.
Le point dcevant est qu'on n'arrive pas combiner la mthode de la rgression inverse avec la mthode de
Heckman. Si on pouvait le faire, peut-tre obtiendrait-on des conclusions claires sur la prsence ou l'absence de
discrimination et sur sa direction (contre les femmes ou contre les hommes).
Le sujet de la discrimination salariale est passionnant. Il ne faudrait cependant pas qu'en faisant une telle tude,
l'auteur ait envie de prouver soit qu'il y a de la discrimination l'encontre des hommes, soit qu'il y en a contre les
femmes. En effet, parmi tous les rsultats contradictoires qu'on a trouvs, il serait simple d'en choisir un
arrangeant et de conclure l'tude en ne tenant compte que de celui-ci. Ainsi, il est plus sage d'utiliser plusieurs
mthodes de rgression diffrentes afin de s'assurer de ses rsultats, mme si finalement, aucune conclusion
dfinitive peut tre dtermine.
8. Remerciements
Quelques mots afin de remercier les personnes qui ont rendu cette tude possible : J'exprime toute ma gratitude
M. Jean-Chrisian, professeur du cours dans le cadre duquel ce travail a t fait et M. Jos Anson, assistant de
ce mme cours, qui m'ont aid du dbut la fin dans l'laboration de ce papier. Je tiens aussi exprimer mes vifs
remerciements M. Enrico Bolzani, M. Jacques Huguenin et M. Christophe Kolodziejczyk pour leurs prcieux
conseils.
9. Bibliographie
Bourbonnais, R, "Economtrie", 3
me
dition, ditions Dunod, Paris, 2000.
Conway, D ; Roberts, H, "Reverse regression, fairness, and employment discrimination", Journal of business
and economic statitics, vol. 1, n1, 1983, pp. 75-85
Diekmann, A ; Engelhardt, H, "Einkommensungleichheit zwischen Frauen und Mnnern. Eine konometrische
Analyse der Schweizer Arbeitskrfteerhebung", Schweizeriche Zeitschrift fr Volkswirtschaft und Statistik, 131
(1), 1994, pp. 57-83
Flckiger, Y ; Ramirez, J, "Analyse comparative des salaires entre les hommes et les femmes sur la base de la
LSE 1994 et 1996", Observatoire universitaire de l'emploi, Genve, mai 2000.
Goldberger, A.S., "Reverse regression and salary discrimination", The journal of human resources, XIX, 3,
1984, pp.291 318
Heckman, J, "Sample selection bias as a specification error", Econometrica, 47 (1), 1979, pp. 153-161
Hungerbhler, M, "La discrimination salariale des femmes en Suisse", Universit de Lausanne, 1999
Maddala, G.S., "Introduction to econometrics", 2
me
dition.
Revue "Problmes conomiques", nov. 2000, n 2.687, pp 1-2.
OFS, Etude suisse sur la population active 1997, Office fdral de la statistique, Berne.
ANNEXES
Annexe 1
Rgression dont la variable explique est le salaire annuel brut
Dependent Variable: SALAIREB
Method: Least Squares
Date: 05/16/01 Time: 13:15
Sample(adjusted): 2 9922
Included observations: 3666
Excluded observations: 6255 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -69836.36 4347.239 -16.06453 0.0000
AGE 381.5227 42.69961 8.935040 0.0000
EDU 12835.12 507.9677 25.26759 0.0000
SEXE10 -12423.00 968.2122 -12.83087 0.0000
MARIE 4687.279 886.1871 5.289266 0.0000
NAT 5804.680 1263.454 4.594296 0.0000
TAUXOCCUP 719.0812 22.83098 31.49585 0.0000
CONTRAT 7286.580 2003.744 3.636482 0.0003
OETA8 2216.564 999.8813 2.216827 0.0267
TAILETA 83.43059 10.42206 8.005189 0.0000
DIV 6422.130 972.1228 6.606295 0.0000
OININ8 7157.634 1090.593 6.563069 0.0000
HIERAR -206.5398 184.4556 -1.119726 0.2629
SECTEUR 98.62610 963.0246 0.102413 0.9184
R-squared 0.519683 Mean dependent var 62903.57
Adjusted R-squared 0.517973 S.D. dependent var 35488.62
S.E. of regression 24639.09 Akaike info criterion 23.06587
Sum squared resid 2.22E+12 Schwarz criterion 23.08957
Log likelihood -42265.73 F-statistic 303.9473
Durbin-Watson stat 1.477487 Prob(F-statistic) 0.000000
Rgression dont la variable explique est le log naturel du salaire annuel brut
Dependent Variable: LN
Method: Least Squares
Date: 05/16/01 Time: 13:16
Sample(adjusted): 2 9922
Included observations: 3666
Excluded observations: 6255 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 7.799246 0.098601 79.09871 0.0000
AGE 0.004054 0.000968 4.186266 0.0000
EDU 0.195326 0.011521 16.95329 0.0000
SEXE10 -0.160109 0.021960 -7.290812 0.0000
MARIE 0.033908 0.020100 1.686945 0.0917
NAT 0.097632 0.028657 3.406938 0.0007
TAUXOCCUP 0.021859 0.000518 42.21281 0.0000
CONTRAT 0.198110 0.045448 4.359077 0.0000
OETA8 0.035037 0.022679 1.544919 0.1225
TAILETA 0.001836 0.000236 7.765800 0.0000
DIV 0.067074 0.022049 3.042031 0.0024
OININ8 0.152846 0.024736 6.179039 0.0000
HIERAR 0.004115 0.004184 0.983627 0.3254
SECTEUR 0.025269 0.021843 1.156847 0.2474
R-squared 0.532374 Mean dependent var 10.84725
Adjusted R-squared 0.530709 S.D. dependent var 0.815780
S.E. of regression 0.558849 Akaike info criterion 1.677936
Sum squared resid 1140.563 Schwarz criterion 1.701639
Log likelihood -3061.656 F-statistic 319.8197
Durbin-Watson stat 1.761657 Prob(F-statistic) 0.000000
Annexe 2
Rgression de l'quation (1)
Dependent Variable: LN
Method: Least Squares
Date: 05/16/01 Time: 13:16
Sample(adjusted): 2 9922
Included observations: 3666
Excluded observations: 6255 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 7.799246 0.098601 79.09871 0.0000
AGE 0.004054 0.000968 4.186266 0.0000
EDU 0.195326 0.011521 16.95329 0.0000
SEXE10 -0.160109 0.021960 -7.290812 0.0000
MARIE 0.033908 0.020100 1.686945 0.0917
NAT 0.097632 0.028657 3.406938 0.0007
TAUXOCCUP 0.021859 0.000518 42.21281 0.0000
CONTRAT 0.198110 0.045448 4.359077 0.0000
OETA8 0.035037 0.022679 1.544919 0.1225
TAILETA 0.001836 0.000236 7.765800 0.0000
DIV 0.067074 0.022049 3.042031 0.0024
OININ8 0.152846 0.024736 6.179039 0.0000
HIERAR 0.004115 0.004184 0.983627 0.3254
SECTEUR 0.025269 0.021843 1.156847 0.2474
R-squared 0.532374 Mean dependent var 10.84725
Adjusted R-squared 0.530709 S.D. dependent var 0.815780
S.E. of regression 0.558849 Akaike info criterion 1.677936
Sum squared resid 1140.563 Schwarz criterion 1.701639
Log likelihood -3061.656 F-statistic 319.8197
Durbin-Watson stat 1.761657 Prob(F-statistic) 0.000000
Test d'htroscdasticit
White Heteroskedasticity Test:
F-statistic 2.501852 Probability 0.000435
Obs*R-squared 44.71579 Probability 0.000455
Rgression de l'quation (1) en enlevant l'htroscdasticit
Dependent Variable: LN
Method: Least Squares
Date: 05/16/01 Time: 13:22
Sample(adjusted): 2 9922
Included observations: 3666
Excluded observations: 6255 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 7.799246 0.134261 58.09008 0.0000
AGE 0.004054 0.001589 2.552216 0.0107
EDU 0.195326 0.013499 14.47012 0.0000
SEXE10 -0.160109 0.028694 -5.579929 0.0000
MARIE 0.033908 0.022410 1.513059 0.1304
NAT 0.097632 0.022044 4.429009 0.0000
TAUXOCCUP 0.021859 0.000900 24.28785 0.0000
CONTRAT 0.198110 0.055731 3.554735 0.0004
OETA8 0.035037 0.021665 1.617195 0.1059
TAILETA 0.001836 0.000260 7.063615 0.0000
DIV 0.067074 0.015155 4.425766 0.0000
OININ8 0.152846 0.029252 5.225083 0.0000
HIERAR 0.004115 0.003614 1.138779 0.2549
SECTEUR 0.025269 0.026890 0.939711 0.3474
R-squared 0.532374 Mean dependent var 10.84725
Adjusted R-squared 0.530709 S.D. dependent var 0.815780
S.E. of regression 0.558849 Akaike info criterion 1.677936
Sum squared resid 1140.563 Schwarz criterion 1.701639
Log likelihood -3061.656 F-statistic 319.8197
Durbin-Watson stat 1.761657 Prob(F-statistic) 0.000000
Annexe 3
Rsidus de l'estimation de l'quation (1)
Rsidus de l'quation (1), aprs correction de l'htroscdasticit
-15
-10
-5
0
5
0
5
10
15
2000 3000 4000 5000 6000 7000 8000 9000
Residual Actual Fitted
-15
-10
-5
0
5
0
5
10
15
2000 3000 4000 5000 6000 7000 8000 9000
Residual Actual Fitted
Annexe 4
Rgression inverse de Q avec l'chantillon des femmes
Dependent Variable: Q
Method: Least Squares
Date: 05/16/01 Time: 14:12
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 7.008740 0.710676 9.862075 0.0000
LN 0.331037 0.067239 4.923318 0.0000
MARIE -0.304571 0.036616 -8.317911 0.0000
NAT -0.099385 0.027558 -3.606346 0.0003
TAILETA 0.000887 0.000323 2.747705 0.0061
DIV -0.068805 0.022538 -3.052776 0.0023
SECTEUR 0.012470 0.025444 0.490109 0.6241
R-squared 0.480917 Mean dependent var 10.15565
Adjusted R-squared 0.479043 S.D. dependent var 0.579183
S.E. of regression 0.418039 Akaike info criterion 1.097699
Sum squared resid 290.4450 Schwarz criterion 1.120432
Log likelihood -909.0302 F-statistic 256.6337
Durbin-Watson stat 2.237939 Prob(F-statistic) 0.000000
Rgression inverse de Q avec l'chantillon des hommes
Dependent Variable: Q
Method: Least Squares
Date: 05/16/01 Time: 14:25
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 5.815106 0.276991 20.99382 0.0000
LN 0.443319 0.025597 17.31897 0.0000
MARIE 0.041521 0.011543 3.597187 0.0003
NAT -0.000395 0.019200 -0.020565 0.9836
TAILETA -0.000143 0.000143 -0.997464 0.3187
DIV -0.041734 0.010789 -3.868174 0.0001
SECTEUR 0.014111 0.012928 1.091451 0.2752
R-squared 0.479203 Mean dependent var 10.75899
Adjusted R-squared 0.477633 S.D. dependent var 0.326563
S.E. of regression 0.236023 Akaike info criterion -0.046276
Sum squared resid 110.8566 Schwarz criterion -0.026649
Log likelihood 53.20696 F-statistic 305.1783
Durbin-Watson stat 1.956712 Prob(F-statistic) 0.000000
Annexe 5
Rgression inverse de edu avec l'chantillon des femmes
Dependent Variable: EDU
Method: Least Squares
Date: 05/16/01 Time: 14:14
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -0.309930 0.571850 -0.541977 0.5879
LN 0.214798 0.069873 3.074114 0.0021
AGE -0.002833 0.001776 -1.595611 0.1108
MARIE 0.030859 0.042777 0.721389 0.4708
NAT 0.221608 0.063417 3.494485 0.0005
TAUXOCCUP -0.001669 0.001834 -0.910095 0.3629
CONTRAT -0.248971 0.104508 -2.382319 0.0173
OETA8 -0.051884 0.045176 -1.148488 0.2509
TAILETA 0.001017 0.000465 2.188616 0.0288
DIV 0.246054 0.050463 4.875899 0.0000
OININ8 -0.076176 0.046694 -1.631363 0.1030
HIERAR -0.020247 0.008092 -2.502260 0.0124
SECTEUR 0.029376 0.042550 0.690383 0.4901
R-squared 0.099013 Mean dependent var 2.039545
Adjusted R-squared 0.092484 S.D. dependent var 0.759192
S.E. of regression 0.723234 Akaike info criterion 2.197591
Sum squared resid 866.2002 Schwarz criterion 2.239808
Log likelihood -1820.890 F-statistic 15.16532
Durbin-Watson stat 2.096098 Prob(F-statistic) 0.000000
Rgression inverse de edu avec l'chantillon des hommes
Dependent Variable: EDU
Method: Least Squares
Date: 05/16/01 Time: 14:27
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -5.811878 0.609047 -9.542581 0.0000
LN 0.861902 0.068281 12.62293 0.0000
AGE 0.000256 0.001991 0.128765 0.8976
MARIE 0.009769 0.039120 0.249723 0.8028
NAT 0.225100 0.060789 3.702997 0.0002
TAUXOCCUP -0.016103 0.002433 -6.617913 0.0000
CONTRAT -0.173047 0.102308 -1.691431 0.0909
OETA8 -0.141473 0.040926 -3.456796 0.0006
TAILETA 0.000566 0.000454 1.247375 0.2124
DIV 0.088487 0.036924 2.396466 0.0166
OININ8 -0.286990 0.055196 -5.199436 0.0000
HIERAR -0.007156 0.007711 -0.927937 0.3536
SECTEUR 0.032276 0.041052 0.786222 0.4318
R-squared 0.202853 Mean dependent var 2.378067
Adjusted R-squared 0.198031 S.D. dependent var 0.872526
S.E. of regression 0.781371 Akaike info criterion 2.350955
Sum squared resid 1211.313 Schwarz criterion 2.387406
Log likelihood -2334.429 F-statistic 42.07290
Durbin-Watson stat 1.864008 Prob(F-statistic) 0.000000
Annexe 6
Rgression inverse de tauxoccup avec l'chantillon des femmes
Dependent Variable: TAUXOCCUP
Method: Least Squares
Date: 05/16/01 Time: 14:16
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -26.61177 29.74174 -0.894762 0.3710
LN 13.15193 3.022217 4.351749 0.0000
AGE -0.363496 0.056294 -6.457106 0.0000
EDU -1.089486 1.122376 -0.970696 0.3318
MARIE -15.19515 1.687078 -9.006784 0.0000
NAT -7.347637 1.397507 -5.257676 0.0000
CONTRAT -1.026370 2.804814 -0.365932 0.7145
OETA8 0.023338 1.181039 0.019760 0.9842
TAILETA 0.025522 0.013039 1.957429 0.0505
DIV -4.110205 1.086107 -3.784345 0.0002
OININ8 4.620275 1.454114 3.177383 0.0015
HIERAR -0.197109 0.189199 -1.041806 0.2977
SECTEUR 0.196675 1.124133 0.174957 0.8611
R-squared 0.494508 Mean dependent var 73.36189
Adjusted R-squared 0.490845 S.D. dependent var 25.89731
S.E. of regression 18.47905 Akaike info criterion 8.678911
Sum squared resid 565483.0 Schwarz criterion 8.721128
Log likelihood -7229.551 F-statistic 135.0013
Durbin-Watson stat 2.122942 Prob(F-statistic) 0.000000
Rgression inverse de tauxoccup avec l'chantillon des hommes
Dependent Variable: TAUXOCCUP
Method: Least Squares
Date: 05/16/01 Time: 14:28
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -49.98453 12.68005 -3.941982 0.0001
LN 14.34590 1.246264 11.51112 0.0000
AGE -0.217103 0.030510 -7.115721 0.0000
EDU -2.133612 0.311401 -6.851662 0.0000
MARIE -0.202882 0.457488 -0.443470 0.6575
NAT -2.024697 0.703979 -2.876075 0.0041
CONTRAT -0.260528 1.699257 -0.153319 0.8782
OETA8 1.028698 0.479408 2.145766 0.0320
TAILETA -0.008586 0.005400 -1.590071 0.1120
DIV -2.128047 0.405834 -5.243644 0.0000
OININ8 0.872945 0.700171 1.246759 0.2126
HIERAR 0.109912 0.087805 1.251786 0.2108
SECTEUR 0.306975 0.495591 0.619413 0.5357
R-squared 0.362065 Mean dependent var 92.25063
Adjusted R-squared 0.358207 S.D. dependent var 11.22688
S.E. of regression 8.994076 Akaike info criterion 7.237498
Sum squared resid 160492.5 Schwarz criterion 7.273949
Log likelihood -7213.642 F-statistic 93.83624
Durbin-Watson stat 2.010420 Prob(F-statistic) 0.000000
Annexe 7
Rgression inverse de contrat avec l'chantillon des femmes
Dependent Variable: CONTRAT
Method: Least Squares
Date: 05/16/01 Time: 14:17
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 0.714147 0.106544 6.702850 0.0000
LN 0.022964 0.010703 2.145466 0.0321
AGE 0.000831 0.000537 1.546614 0.1221
EDU -0.021434 0.009260 -2.314527 0.0208
MARIE 0.016073 0.013253 1.212766 0.2254
NAT 0.001200 0.016522 0.072638 0.9421
TAUXOCCUP -0.000135 0.000375 -0.360746 0.7183
OETA8 0.016986 0.010981 1.546833 0.1221
TAILETA -0.000336 0.000141 -2.391286 0.0169
DIV -0.005998 0.013102 -0.457806 0.6472
OININ8 0.031854 0.013229 2.407827 0.0162
HIERAR 0.000966 0.002407 0.401243 0.6883
SECTEUR 0.002951 0.012728 0.231844 0.8167
R-squared 0.032429 Mean dependent var 0.951468
Adjusted R-squared 0.025418 S.D. dependent var 0.214952
S.E. of regression 0.212203 Akaike info criterion -0.254791
Sum squared resid 74.56964 Schwarz criterion -0.212575
Log likelihood 225.6234 F-statistic 4.625190
Durbin-Watson stat 1.547529 Prob(F-statistic) 0.000000
Rgression inverse de contrat avec l'chantillon des hommes
Dependent Variable: CONTRAT
Method: Least Squares
Date: 05/16/01 Time: 14:29
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 0.515865 0.145085 3.555594 0.0004
LN 0.039098 0.017550 2.227761 0.0260
AGE 4.07E-05 0.000452 0.089987 0.9283
EDU -0.010737 0.006393 -1.679517 0.0932
MARIE 0.013244 0.009390 1.410359 0.1586
NAT -0.005611 0.013547 -0.414193 0.6788
TAUXOCCUP -0.000122 0.000796 -0.153347 0.8781
OETA8 0.021351 0.008084 2.641049 0.0083
TAILETA -8.68E-05 0.000116 -0.751195 0.4526
DIV -0.006789 0.008631 -0.786508 0.4317
OININ8 0.068933 0.017325 3.978789 0.0001
HIERAR -0.003202 0.002088 -1.533529 0.1253
SECTEUR 0.004146 0.010754 0.385532 0.6999
R-squared 0.055209 Mean dependent var 0.958438
Adjusted R-squared 0.049495 S.D. dependent var 0.199637
S.E. of regression 0.194634 Akaike info criterion -0.428907
Sum squared resid 75.15839 Schwarz criterion -0.392456
Log likelihood 441.2636 F-statistic 9.661366
Durbin-Watson stat 1.926491 Prob(F-statistic) 0.000000
Annexe 8
Rgression inverse de oeta8 avec l'chantillon des femmes
Dependent Variable: OETA8
Method: Least Squares
Date: 05/16/01 Time: 14:17
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -0.530653 0.138838 -3.822105 0.0001
LN 0.017972 0.013672 1.314495 0.1889
AGE 0.010614 0.000949 11.18336 0.0000
EDU -0.015124 0.013071 -1.157096 0.2474
MARIE 0.054948 0.022683 2.422379 0.0155
NAT -0.009714 0.030491 -0.318593 0.7501
TAUXOCCUP 1.04E-05 0.000527 0.019770 0.9842
CONTRAT 0.057516 0.036631 1.570146 0.1166
TAILETA 0.001110 0.000251 4.413845 0.0000
DIV -0.043203 0.029182 -1.480488 0.1389
OININ8 0.353343 0.020899 16.90723 0.0000
HIERAR -0.004405 0.004534 -0.971682 0.3314
SECTEUR 0.014097 0.021978 0.641440 0.5213
R-squared 0.314635 Mean dependent var 0.328939
Adjusted R-squared 0.309669 S.D. dependent var 0.469969
S.E. of regression 0.390479 Akaike info criterion 0.964873
Sum squared resid 252.4967 Schwarz criterion 1.007090
Log likelihood -792.1868 F-statistic 63.35271
Durbin-Watson stat 2.014317 Prob(F-statistic) 0.000000
Rgression inverse de oeta8 avec l'chantillon des hommes
Dependent Variable: OETA8
Method: Least Squares
Date: 05/16/01 Time: 14:30
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -0.967745 0.235537 -4.108672 0.0000
LN 0.018079 0.026670 0.677882 0.4979
AGE 0.014744 0.001029 14.32476 0.0000
EDU -0.040935 0.011963 -3.421893 0.0006
MARIE 0.011900 0.021539 0.552497 0.5807
NAT 0.044994 0.027855 1.615277 0.1064
TAUXOCCUP 0.002247 0.001018 2.205764 0.0275
CONTRAT 0.099566 0.035985 2.766862 0.0057
TAILETA 0.000981 0.000243 4.039792 0.0001
DIV -0.024669 0.020554 -1.200193 0.2302
OININ8 0.313809 0.022397 14.01103 0.0000
HIERAR 0.006821 0.004228 1.613266 0.1068
SECTEUR 0.032498 0.022211 1.463149 0.1436
R-squared 0.292405 Mean dependent var 0.455684
Adjusted R-squared 0.288125 S.D. dependent var 0.498157
S.E. of regression 0.420308 Akaike info criterion 1.110832
Sum squared resid 350.4915 Schwarz criterion 1.147282
Log likelihood -1096.165 F-statistic 68.32205
Durbin-Watson stat 2.013429 Prob(F-statistic) 0.000000
Annexe 9
Rgression inverse de oinin8 avec l'chantillon des femmes
Dependent Variable: OININ8
Method: Least Squares
Date: 05/16/01 Time: 14:18
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -0.642215 0.159121 -4.036018 0.0001
LN 0.040070 0.017534 2.285327 0.0224
AGE 0.010609 0.000960 11.05526 0.0000
EDU -0.023936 0.014770 -1.620638 0.1053
MARIE -0.011053 0.022734 -0.486191 0.6269
NAT 0.062420 0.031867 1.958771 0.0503
TAUXOCCUP 0.002224 0.000586 3.794938 0.0002
CONTRAT 0.116269 0.047082 2.469509 0.0136
OETA8 0.380889 0.021803 17.46994 0.0000
TAILETA 0.000292 0.000259 1.126380 0.2602
DIV -0.073667 0.026634 -2.765913 0.0057
HIERAR -0.000326 0.004712 -0.069222 0.9448
SECTEUR -0.001015 0.023381 -0.043431 0.9654
R-squared 0.317131 Mean dependent var 0.605752
Adjusted R-squared 0.312183 S.D. dependent var 0.488835
S.E. of regression 0.405414 Akaike info criterion 1.039943
Sum squared resid 272.1812 Schwarz criterion 1.082160
Log likelihood -854.8326 F-statistic 64.08854
Durbin-Watson stat 1.949454 Prob(F-statistic) 0.000000
Rgression inverse de oinin8 avec l'chantillon des hommes
Dependent Variable: OININ8
Method: Least Squares
Date: 05/16/01 Time: 14:30
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C -1.466939 0.185797 -7.895388 0.0000
LN 0.140700 0.021533 6.534090 0.0000
AGE 0.008389 0.000746 11.23861 0.0000
EDU -0.052048 0.010123 -5.141776 0.0000
MARIE 0.100076 0.016630 6.017881 0.0000
NAT 0.053355 0.023781 2.243600 0.0250
TAUXOCCUP 0.001195 0.000966 1.237389 0.2161
CONTRAT 0.201483 0.046741 4.310615 0.0000
OETA8 0.196688 0.015153 12.98036 0.0000
TAILETA -0.000618 0.000190 -3.245959 0.0012
DIV -0.030433 0.015691 -1.939504 0.0526
HIERAR -0.004322 0.003393 -1.273718 0.2029
SECTEUR 0.010199 0.018224 0.559650 0.5758
R-squared 0.326987 Mean dependent var 0.794191
Adjusted R-squared 0.322916 S.D. dependent var 0.404393
S.E. of regression 0.332755 Akaike info criterion 0.643667
Sum squared resid 219.6799 Schwarz criterion 0.680118
Log likelihood -629.7013 F-statistic 80.32811
Durbin-Watson stat 1.888227 Prob(F-statistic) 0.000000
Annexe 10
Rgression inverse de hierar avec l'chantillon des femmes
Dependent Variable: HIERAR
Method: Least Squares
Date: 05/16/01 Time: 14:19
Sample(adjusted): 2 4610
Included observations: 1669
Excluded observations: 2940 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 3.201557 0.789704 4.054126 0.0001
LN 0.093664 0.073421 1.275711 0.2022
AGE 0.004324 0.005450 0.793514 0.4276
EDU -0.183256 0.073792 -2.483421 0.0131
MARIE -0.015124 0.122918 -0.123046 0.9021
NAT -0.147076 0.174315 -0.843739 0.3989
TAUXOCCUP -0.002733 0.002893 -0.944707 0.3449
CONTRAT 0.101518 0.251954 0.402921 0.6871
OETA8 -0.136781 0.136888 -0.999218 0.3178
TAILETA -0.001291 0.001387 -0.930795 0.3521
DIV 0.190108 0.152111 1.249796 0.2116
OININ8 -0.009394 0.131885 -0.071232 0.9432
SECTEUR 0.679805 0.124800 5.447172 0.0000
R-squared 0.025144 Mean dependent var 4.149111
Adjusted R-squared 0.018080 S.D. dependent var 2.195765
S.E. of regression 2.175825 Akaike info criterion 4.400451
Sum squared resid 7839.857 Schwarz criterion 4.442668
Log likelihood -3659.177 F-statistic 3.559428
Durbin-Watson stat 2.051334 Prob(F-statistic) 0.000030
Rgression inverse de hierar avec l'chantillon des hommes
Dependent Variable: HIERAR
Method: Least Squares
Date: 05/16/01 Time: 14:31
Sample(adjusted): 2 5312
Included observations: 1997
Excluded observations: 3314 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 4.856074 1.254513 3.870884 0.0001
LN -0.039800 0.141526 -0.281220 0.7786
AGE -0.004636 0.005508 -0.841557 0.4001
EDU -0.058704 0.064291 -0.913103 0.3613
MARIE 0.128431 0.111150 1.155474 0.2480
NAT -0.246560 0.150984 -1.633020 0.1026
TAUXOCCUP 0.006806 0.005584 1.218689 0.2231
CONTRAT -0.423336 0.257980 -1.640966 0.1010
OETA8 0.193406 0.119466 1.618922 0.1056
TAILETA -0.001553 0.001293 -1.201004 0.2299
DIV 0.232657 0.107471 2.164835 0.0305
OININ8 -0.195520 0.150935 -1.295390 0.1953
SECTEUR 0.518826 0.118256 4.387329 0.0000
R-squared 0.019620 Mean dependent var 4.318375
Adjusted R-squared 0.013690 S.D. dependent var 2.253526
S.E. of regression 2.238047 Akaike info criterion 4.455573
Sum squared resid 9937.570 Schwarz criterion 4.492024
Log likelihood -4435.890 F-statistic 3.308691
Durbin-Watson stat 1.912677 Prob(F-statistic) 0.000090
A study of offshore centres
Observing the causality between US and offshore
centres interest rates
Fernando M. M. Ruiz
Macroeconomic Modelling
Professor: J. C. Lambelet
Assistant: J. Anson
Table of Contents
Introduction. The last chance to observe offshore centres? . 2
Objectives and methodology
4
Part 1. Bahamas
4
1.1. Summary statistics
4
1.2. Test for stationarity ...
5
1.3. Cointegration tests
7
1.4. Causality test ....
11
1.5. Volatility spillover ...
13
Part 2. Panama 16
2.1. Summary statistics .. 16
2.2. Test for stationarity .
17
2.3. Cointegration tests ..
17
2.4. Causality test ..
18
2.5. Volatility spillover . 18
3. Conclusion 19
4. References
21
Introduction. The last chance to observe offshore centres?
Before to start with the model it is important to
introduce the reader in the international context
that the offshore centres are facing nowadays
(although the objective of this paper is not that
one).
The first problem that arises when one starts to
study offshore centre is the definition. In the
literature there is no wholly consistent definition of
what constitutes an offshore centre. I have found a
definition which states that offshore centers are defined as cities, areas or
countries which have made a conscious effort to attract offshore banking business, by allowing relatively free
entry and by adopting a flexible attitude where taxes, levies and regulation are concerned
42
.
The OECD states four points for identifying these
centres a) no or only nominal effective tax rates; b)
lack of effective exchange of information; c) lack
of transparency; and d) absence of a requirement of
substantial activities
43
.

42
Ian McCarthy Hosting Offshore Banks: Benefits and Costs .
43
OECD, Report on Harmful Tax Competition.
After the definition, one begins to ask why they are
important, why they are in the news, why the
governments are worried about them. Then one
tries to obtain data, and after hours, days, weeks of
looking for it one realises that there is nothing. It
seems that the offshore centres are ghosts that
some people have seen but the majority has not.
But why have they frightened several countries?
And with this answer, one starts to understand,
looking at the few figures available. The most
comprehensive data from the US shows that the
US FDI in low or no tax jurisdictions has grown
significantly over the last 15 years. The OECD
reports that: In 1985, US FDI in low or no tax jurisdictions stood at US$ 12.5 billion, an already
large figure, equalling roughly 5 percent of the total stock of US FDI abroad in that year of $ 240 billion. By
1990 the figure had grown to $ 47.2 billion, 11 percent of FDI. Interest in financial structuring through low no
tax jurisdictions continues to increase, with now in excess of $ 137 billion or 14 percent of the US FDI being
structured in this wayoffshore investment funds now manage in excess of an estimated US$ 1 trillion in tax-
free environments
44
.
For this reason three international groups have been working on offshore centres for
approximately 3 years. These are the Financial Stability Forum (FSF), the Forum on
Harmful Tax Practices and the Financial Action Task Force on Money Laundering
(FATF).
Financial Stability Forum
The FSF was set up by initiative of the finance ministers and the central bank governors of the
G7 countries in April 1999. A sub-working group was constituted in this forum to analyse
whether the offshore centres can threaten the financial stability.
On 15 March 2000, this group elaborated a report with a proposition to evaluate the offshore
centres, to be done by the IMF with the supervision of the FSF. The report does not
demonstrate that the offshore financial centres (OFC) accentuate the financial crises. With
respect to the banking secrecy, the report condemns it, although it is accepted when it tries to
protect the private sphere of the client.
On 25 May 2000, the FSF issued a list with 3 categories of OFC: Jurisdictions considered to have
significant offshore activities were grouped into three categories reflecting their perceived quality of supervision
and perceived degree of co-operation
45
.

44
Select Figures on Offshore Investment Activities , OECD.
45
Financial stability forum releases grouping of offshore financial centres (OFCs) to assist in setting priorities
for assessment , 25 May 2000.
The main critic to this report is that it has not been based in scientific or technical
arguments
46
.
Group I includes the jurisdictions perceived as with the highest regulation, infrastructure and
resources in supervision and co-operation. In this group we have Hongkong, Luxembourg,
Singapore, Switzerland, Dublin and the islands Guernsey, Man and Jersey. Group II has
countries with an intermediate regulation: Andorra, Bahrain, Barbados, Bermudas, Gibraltar,
Malaysia, Macao, Malta and Monaco. Group III includes jurisdictions with a lack in
regulation. Here we have Anguilla, Antigua and Barbuda, Aruba, Belize, British Virgin
Islands, Cayman Islands, Cook Islands, Costa Rica, Chypre, Lebanon, Liechtenstein, Marshall
Islands, Maurice, Nauru, Netherlands Antilles, Niue, Panama, St. Kitts and Nevis, St. Lucia,
St. Vincent and the Grenadines, Samoa, Seychelles, The Bahamas, Turks and Caicos and
Vanuatu.
Forum on Harmful Tax Practices
The OECD approved in April 1998 a report on Harmful Tax Competition
47
. The Report
created the Forum on Harmful Tax Practices.
The Forum is responsible for undertaking an ongoing evaluation of existing and proposed
preferential tax regimes in Member and non-member countries, analysing the effectiveness of
counteracting measures, including non-tax measures, and examining whether particular
jurisdictions constitute tax havens.
The main argument against the tax havens is that they erode the tax bases of other countries and
distort the location of capital and services. Such practices can also cause undesired shifts of part of the tax
burden to less mobile tax bases, such as labour, property, and consumption, and increase administrative costs and
compliance burdens on tax authorities and tax payers
48
.
The OECD assumes that if nothing is done, governments may increasingly be forced to
engage in competitive tax bidding to attract or retain mobile activities. That race to the
bottom, where location and financing decisions become primarily tax driven, will mean that
capital and financial flows will be distorted and it will become more difficult to achieve fair
competition for real economic activities.
On 26 June 2000 the OECD presented its Report on Progress in Identifying and Eliminating
Harmful Tax Practices. The Report includes a controversial list
49
of jurisdictions that are tax
havens under the criteria of the 1998 Report (a further list will be completed by the 31 July
2001 and the jurisdictions on it can be punished with possible co-ordinated defensive
measures). The 35 territories in the list are the following: Andorra, Anguila, Antigua and
Barbuda, Aruba, Bahamas, Bahrain, Barbados, Belize, British Virgin Islands, Cook Islands,
Dominica, Gibraltar, Grenada, Guernsey/Sark/Alderney, Isle of Man, Jersey, Liberia,
Liechtenstein, Maldives, Marshall Islands, Monaco, Montserrat, Nauru, Netherlands Antilles,
Niue, Panama, Samoa, Seychelles, St. Lucia, St. Christopher and Nevis, St. Vincent and the
Grenadines, Tonga, Turks and Caicos, US Virgin Islands, Vanuatu.
50
Financial Action Task Force on Money Laundering
Since the end of 1998, the FATF has been engaged in an initiative to identify key anti-money
laundering weaknesses in jurisdictions inside and outside its membership.
The FATF has a basic framework for the anti-money laundering efforts 40 Recommendations
which were originally drawn up in 1990 and in 1996 were revised.

46
See La Vie conomique 2 2001 page 41.
47
Luxembourg and Switzerland abstained.
48
The Report on Progress and Identifying and Eliminating Harmful Tax Practices page 5.
49
See Who are the real tax havens by Marshall Langer (www.freedomandprosterity.org)
50
Six jurisdictions made commitments in advance to the Report and were not included in the list: Bermuda,
Cayman Islands, Cyprus, Malta, Mauritius, San Marino.
On February 2000, the FATF published an initial report on the issue of non-cooperative
countries in the fight against money laundering. The report set out twenty-five criteria
(consistent with the forty Recommendations) to identify detrimental rules and practices which
protect money laundering.
Based on these criteria, on 22 June 2000 the FATF identified 15 territories with serious
systemic problems as non-cooperative. The list is the following: Bahamas, Cayman Islands,
Cook Islands, Dominica, Israel, Lebanon, Liechtenstein, Marshall Islands, Nauru, Niue,
Panama, Philippines, Russia, St. Kitts and Nevis, St. Vincent and the Grenadines.
If these jurisdictions do not improve their rules and
practices, the FATF members have threatened to
adopt counter-measures.
As this short introduction has shown, the offshore centres are the focus of pressures from the
international community. Maybe now it is the last chance to observe and to analyse the small
ghostly species before their extinction.
Objectives and methodology
The literature about offshore centres usually highlights that a successful offshore centre is a
relatively small, open and stable economy
51
.
The general hypothesis to be tested in this paper is whether the offshore centres are open and
stable economies, using as a proxy variable the interest rate.
If it is an open economy the interest rate in the offshore centre should be cointegrated with the
interest rate in a big leading country (the US) and the causality flow should be bi-directional
or at least from the big to the small country.
The stability of the economy will be measure by an analysis of the interest rate volatility
transmission.
Since this paper has several econometric steps, I have chosen to explain the methodology use
in each estimation followed by the result in the first part, and only the results for a second
country in the second part.
The sources for the variables are The Central Bank of The Bahamas and Datastream for
Panama and the U.S.
I use monthly observations corresponding to 3-month average deposit interest rate for the first
part (155 observations: 1/1988 - 11/2000) and 6-month average deposit interest rate for the
second part (133 observations: 12/1989 - 12/2000).

51
See Ian McCarthy Hosting Offshore Centers: Benefits and Costs ; Jeannette Hagen The rationale for the
existence of an Off-Shore Center. The case of the Netherlands Antilles ; Sara Perez Gonzalez Banca
Offshore .
Part 1. Bahamas
1.1. Summary statistics
An a priori approach can be constructed observing the following table
Table 1.
BAHAMAS USA3MONTH
Mean 5.459935 5.717548
Std. Dev. 0.920929 1.506406
Skewness -0.057741 0.008774
Kurtosis 2.111862 2.644288
Observations 155 155
The distributional properties of the two rates are not similar. The US rate is about 26 basis
points higher than The Bahamas. However, this result can be attributed mainly to the
differences in the regulatory framework of the two markets.
The other three properties are rather more different and it shows two dissimilar series.
1.2. Test for stationarity
Something that often characterises the economic series is their non-stationarity. A series is
said to be weakly stationary if the mean and autocovariances of the series do not depend on
time.
The canonical example of a nonstationary series is the random walk:
Yt = Yt-1 + t (1)
where t is a stationary random disturbance term. The random walk is a difference stationary
series since the first difference of Y is stationary:
Yt - Yt-1 = t (2)
A difference stationary series is said to be integrated and is denoted as I(d) where d is the
order of integration. The order of integration is the number of unit roots contained in the
series, or the number of differencing operations it takes to make the series stationary. For the
random walk above, there is one unit root, so it is an I(1) series.
Before any results can be obtained, the data series must be examined for their order of
integration. I will use the augmented Dickey-Fuller (ADF) unit root test with and without
trend component to check the stationarity of the series
52
. Table 2 and Table 3 shows the
results

52
Eviews gives a very clear explanation of the test:
consider first an AR(1) process:
Yt = + Yt-1 + t (3)
where and are parameters and t is assumed to be white noise. Y is a stationary series if -1<<1. If =1, Y
is a nonstationary series. ... Therefore, the hypothesis of a stationary series can be evaluated by testing whether
the absolute value of is strictly less than one. The DF test takes the unit root as the null hypothesis H0: =1.
Since explosive series do not make much economic sense, this null hypothesis is tested against the one-sided
alternative H1: <1.
The test is carried out by estimating an equation with subtracted from both sides of the equation:
Yt = + Yt-1 + t (4)
Table 2.
Results of augmented Dickey-Fuller (ADF) unit root tests (without trend) (H0: = 0)
Variable Y
Coefficient
Level First difference
USA 3 months -0.017153 (-1.838232) -0.378838 (-3.785618)*
Bahamas 3 months -0.015650 (-0.977886) -0.924022 (-5.479000)*
* Significant at 1% level (critical value = -3.475). ADF t-values are in parentheses.
These results indicate that both the domestic and offshore rates are not stationary but are
integrated of order one.
The number of lags used when running ADF tests correspond to 4. Because I am using in fact
monthly average interest rates, it is felt that these lag lengths are sufficient to minimise serial
correlations such that the residuals become a white noise process. (The problem of
determining the lag length is the most serious in using this kind of models).
Table 3.
Results of augmented Dickey-Fuller (ADF) unit root test with trend (H0: = 0)
Variable Y
Coefficient
Level First difference
USA 3 months -0.016211 (-1.647696) -0.389660 (-3.861692)**
Bahamas 3 months -0.057898 (-2.421099) -0.947980 (-5.542219)*
* Significant at 1% level (critical value = -4.02). ADF t-values are in parentheses.
** Significant at 5% level (critical value = -3.44).
These results can be seen graphically as follow:

where = - 1 and the null and alternative hypotheses are
H0: = 0 H1: <0

The ADF approach controls for higher-order correlation by adding lagged difference terms of the dependent
variable Y to the right-hand side of the regression:
Yt = + Yt-1 + 1Yt-1 + 2Yt-2 + + p-1Yt-p+1 + t (5)
This augmented specification is then used to test:
H0: = 0 H1: <0
See also Greene, Chapter 18.
Figure 1. Bahamas Interest rate
Figure 2. First difference Bahamas interest rate
3
4
5
6
7
8
88 89 90 91 92 93 94 95 96 97 98 99 00
BAHAMAS
-1.2
-0.8
-0.4
0.0
0.4
0.8
88 89 90 91 92 93 94 95 96 97 98 99 00
DELTABA
Figure 3. US interest rate
2
4
6
8
10
88 89 90 91 92 93 94 95 96 97 98 99 00
USA3MONTH
Figure 4. First difference US interest rate
1.3. Cointegration tests
As the Bahamas rate and the US rate are both interest rate in an equivalent currency (given
that the Bahamian dollar is peg at the US dollar one to one) for the same duration, and
assuming the hypothesis of an open economy, one would expect the two series are
cointegrated
53
.
The Engle-Granger test states that if two series with the same order of integration are
cointegrated, there will be a constant A, such that:

53
a linear combination of integrated variables that is stationary; such variables are said to be cointegrated
Enders, Chapter 6.
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
88 89 90 91 92 93 94 95 96 97 98 99 00
DELTAUSA
Zt = Yt AXt (6)
is stationary. The parameter A is the cointegrating parameter or vector that links the two
series together. This implies that Yt=AXt is an equilibrium relationship, and Z the equilibrium
error, measures the extend to which Yt and Xt are out of equilibrium. The co-integrating
vector can be estimated by regressing
Yt = c + Xt + Zt (7)
The equilibrium error Zt is then checked for stationarity by applying the augmented Engle-
Granger test (which is in fact an ADF test).
Stationarity of the equilibrium error series Zt, indicates that the two series Xt, Yt are
cointegrated. Checking for cointegration of the two series is important as it will allow for the
construction of an error correction model.
54
The result obtained using the interest rate in Bahamas and US is the following:
Table 4.
Coefficient Engle-Granger test
Variable Z -0.018494 (-1.681306)
Given that the critical values reported by Eviews are valid for unit root tests of a data series,
and are invalid if the series is based on estimated values, the critical value for this case is
taken from Davidson and MacKinnon (1993) Table 20.2, which is 3.90. Then I cannot reject
the null hypothesis that both series are not cointegrated.
As can be seen in the following graphic the residual is not stationary.
Figure 5. Residual US Bahamas
Walter Enders describes the main critic to the Engle-Granger test: "Although the Engle and
Granger (1987) procedure is easily implemented, it does have several important defects. The estimation of the
long-run equilibrium regressions requires that the researcher place one variable on the left-hand side and use the
others as regressors. For example, in the case of two variables, it is possible to run the Engle-Granger test for
cointegration using the residuals from either of the following two "equilibrium" regressions:
Yt = c + Xt + Zt1
Or
Xt = c + Yt + Zt2

54
" estimating Yt as a VAR in first differences is inappropriate if Yt has an error correction representation.
The omission of the expression Zt-1 entails a misspecification error if Yt has an error correction representation"
Walter Enders, page 365-366.
-4
-2
0
2
4
88 89 90 91 92 93 94 95 96 97 98 99 00
RESUSABAHAMAS
As the sample size grows infinitely large, asymptotic theory indicates that the test for a unit root in the {Zt1}
sequence becomes equivalent to the test for a unit root in the {Zt2} sequence. Unfortunately, the large sample
properties on which this result is derived may not be applicable to the sample sizes usually available to
economists. In practice, it is possible to find that one regression indicates the variables are cointegrated, whereas
reversing the order indicates no cointegration. This is a very undesirable feature of the procedure since the test
for cointegration should be invariant to the choice of the variable selected for normalization"
55
.
There is a more sophisticated test for testing for cointegration. This is the one which is
directly ran by Eviews and is called the Johansen Test
56
. The Johansen procedure is nothing
more than a multivariate generalization of the Dickey-Fuller test. The intuition is the
following:
For the case I have
Yt = 11 12 Yt-1 + Z1
Xt 21 22 Xt-1 Z2
Xt A Xt-1 t
Xt - Xt-1 = A Xt-1 - Xt-1 + t
Xt = (A - I) Xt-1 + t
Xt = Xt-1 + t (8)
If the rank() = 2 both sequences are jointly stationary. The Johansen procedure evaluates the
rank looking for the characteristic roots and tests if they are significant.
The result of this test on my two series is the following
57
:
Table 5. Results of the Johansen test
Included observations: 150
Series: BAHAMAS USA 3 MONTH
Lags interval: 1 to 4
Likelihood 5 Percent 1 Percent Hypothesized
Eigenvalue Ratio Critical Value Critical Value No. of CE(s)
0.050071 12.38909 15.41 20.04 None
0.030743 4.683820 3.76 6.65 At most 1 *
*(**) denotes rejection of the hypothesis at 5%(1%) significance level
L.R. rejects any cointegration at 5% significance level
As it was expected the result of this test confirms the obtained before (the characteristic roots
are not significant, then there is not full rank and there is not cointegration).
In fact, this is not a surprising result. The figure below shows both series together.

55
Walter Enders, "Applied Econometric Time Series", page 385.
56
For a description of the test, see Greene Chapter 18 or Enders Chapter 6.
57
The test was run using only intercepts for the cointegration equations. This choice is based on the assumption
that long-run equilibrium conditions such as the relation between both interest rates do not have trends.
Figure 6.
This suggests that there are different hidden factors in the series. I would have expected
nearly identical series reflecting arbitrage trading. However, there are several factors which
prevent this condition being met.
The first one might be differences in the way in which the data is collected in US and
Bahamas. It is worthy note that until the pressure from the FATF, Bahamas should not have
had the correct incentives to collect accurate data from the financial system.
Other factor is that I do not know exactly which country is the open one and which one is
introducing noise. For example, the US citizens or residents receiving interest from a US bank
deposit must pay federal income tax of up to 39,6 percent on that income and in most cases
they must also pay state income taxes. This cause distortions in the market, affecting the
interest rate.
The regulatory of the financial systems are completely different.
And finally, although the Bahamian dollar is peg to the US dollar one to one, there are
exchange costs. These exchange costs not only represent the effective charge of the exchange
office, but also it must include the risk factors of the countries. This reason drove me to
introduce a transformation in the series. I found as the best transformation the difference
between the T-bill interest rate in Bahamas and US. This difference, as a measure of the
country risk in Bahamas, was added to the Bahamas original series, giving as result a
Bahamas adjusted series which followed the movements of the USA 3-month series.
T-bill US T-bill Bahamas =
Bahamas + = Bahamas adjusted
The introduction of this new series does not rule out the hypothesis of an open economy
because the financial markets should take into account all the information available in the
market and I am using an approximation of that information for low frequency interest rate.
Again, an a priori approach is shown in the table below:
0.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00
9.00
10.00
j
a
n
v
.
8
8
j
a
n
v
.
8
9
j
a
n
v
.
9
0
j
a
n
v
.
9
1
j
a
n
v
.
9
2
j
a
n
v
.
9
3
j
a
n
v
.
9
4
j
a
n
v
.
9
5
j
a
n
v
.
9
6
j
a
n
v
.
9
7
j
a
n
v
.
9
8
j
a
n
v
.
9
9
j
a
n
v
.
0
0
%
Bahamas
US
Table 6.
BAHAMASAJUSTED USA3MONTH
Mean 6.923355 5.717548
Std. Dev. 1.740858 1.506406
Skewness 0.017965 0.008774
Kurtosis 2.121738 2.644288
Observations 155 155
Although the mean difference has increased significantly, the standard error is much closer
showing much similar distributions.
Taking my series Bahamas adjusted with USA 3 months, and testing for cointegration using
the Johansen method, with the same assumptions than before, the result is the following:
Table 7. Results of the Johansen test
Included observations: 150
Series: BAHAMAS AJUSTADA USA 3 MONTH
Lags interval: 1 to 4
Likelihood 5 Percent 1 Percent Hypothesized
Eigenvalue Ratio Critical Value Critical Value No. of CE(s)
0.077999 19.55565 15.41 20.04 None *
0.047973 7.374349 3.76 6.65 At most 1 **
*(**) denotes rejection of the hypothesis at 5%(1%) significance level
L.R. test indicates 2 cointegrating equation(s) at 5% significance
level
This shows that both series are cointegrated and supports the idea of an open economy with
financial markets full informed in the long-run.
1.4. Causality test
As the two interest rates are I(1) and are cointegrated, and error correction model such as the
following, can be used to estimate the relationship between the US and offshore interest rate.
Yt = Zt-1 + i Yt-1 + i Xt-1 + et (9)
where Yt, dependent variable, USA 3 month or Bahamas adjusted; Xt, the cross-market
variable (i.e. if Y is USA 3 month, X is Bahamas adjusted, and vice-versa); Zt-1 lagged
equilibrium error or error correction term. has the interpretation of speed of adjustment
parameter. The larger is, the greater the response of Y to the previous period's deviation
from long-run equilibrium. At the opposite extreme, very small values of imply that the
interest rate is unresponsive to last period's equilibrium error.
The causality of the cross-market variables on the dependent variable is examined by testing
whether and all i are equal to zero using the Wald test. For the {Yt} sequence to be
unaffected by the long-term interest rate sequence, and all coefficients must be equal to
zero. Thus, the absence of Granger causality for cointegrated variables requires the additional
condition that the speed of adjustment coefficient be equal to zero. Or course, at least one of
the speed of adjustment terms must be nonzero. If both are equal to zero, the long-run
equilibrium relationship does not appear and the model is not one of error correction or
cointegration.
The results from the equation (9) provide a test of the relationship between changes in the
interest rate in US (Yt) and lagged changes in the offshore rate (Xt). Similarly, reversing the
roles of X and Y, the impact of lagged values of the US rate on changes in the offshore centre
rate can be tested.
The optimal number of lags is obtained from running the Akaike information criterion
58
. With
this I found that the model is optimal at 3 and 6 lags.
The results of these causality tests are presented in the table below.
Table 8.
Test of interest rate transmission (H0: and i = 0)
Dependent Causal Lags F-statistic
Probability
Bahamas adjusted USA 3 month 3 3.031356 0.019544
USA 3 month Bahamas adjusted 3 5.685251 0.000281
Bahamas adjusted USA 3 month 6 2.811718 0.009154
USA 3 month Bahamas adjusted 6 3.250009 0.003213
The results show that the causality flow in the interest rate transmission is bi-directional. The
causality of the US interest rate on the offshore rate is found to be significant at the 1% level
with similar results in the opposite direction for 6 lags; being significant at 5% and 1%
respectively for 3 lags. This can be interpreted as the Bahamas market is integrated in the
international markets.
If we observe carefully the results, we can clearly see that magnitude of the causality flow
from Bahamas to USA is stronger than in the reverse direction. This result is totally
inconsistent and absurd. However, this can be explained from the way in which the data was
constructed. If I adjust the interest rate in the United States instead of the interest rate in
Bahamas the result of the F-statistic is higher for Bahamas as dependent variable, showing
that the causality flow from US to Bahamas. The results are the following:
Table 9.
Test of interest rate transmission (H0: and i = 0)
Dependent Causal Lags F-statistic
Probability
Bahamas USA 3 month adjusted 3 2.375870 0.054775
USA 3 month adjusted Bahamas 3 2.338443 0.058052
Bahamas USA 3 month adjusted 6 1.976986 0.062614
USA 3 month adjusted Bahamas 6 1.568894 0.149828
In this case the causality flow is again bi-directional at 10% level with 3 lags. But now the
magnitude of the causality flow from US to Bahamas is stronger than in the reverse direction.
With 6 lags I found no significant influence of the offshore rate on US.
A similar model using the original data can be constructed to check the former result. The
model is the following:

58
The optimal lag length is the one that minimises the following function over different choices of lag length:
f(k) = T log (RSS) + 2M
where, T, number of observation, M, number of regressors, and RSS, residual sum of squares from Eq. (7).
Yt = c + i Yt-1 + i Xt-1 + et
where there is not an error correction term because the series where found to be not
cointegrated. The model is tested directly running the Granger Causality test, which evaluate
as H0: i = 0.
Table 10.
Test of interest rate transmission
Dependent Causal Lags F-statistic
Probability
Bahamas USA 3 month 4 1.98013 0.09077
USA 3 month Bahamas 4 0.19854 0.93878
With the original data the causality flow is uni-directional, from US to Bahamas, being
significant at 10% level. Nevertheless, the hypothesis of Bahamas having a world-integrated
market cannot be ruled out, given that there are more than 400 banks in the island.
These results have also shown that I cannot reject the hypothesis of The Bahamas as an open
economy. However, this result is not a surprising one. A more interesting question to observe
is if these small open economies with thousands of millions routed through them can have a
macroeconomic stability.
1.5. Volatility spillover
"What is volatility? Volatility is a measure of the intensity of random or unpredictable changes in an asset
return"
59
.
Because I am working with low frequency data I can only detect macroeconomic volatility
movements. However, this restriction is exactly what my hypothesis tries to test.
A GARCH (1,1) model is adapted to model the same month volatility spillover relationship
between the US and Bahamas interest rates.
GARCH means Generalized Autoregressive Conditional Heteroscedasticity. "Heteroscedasticity
means that variance is changing over time, so "conditional heteroscedasticity" means "time-varying conditional
variance". A time series displays conditional heteroscedasticity if it has highly volatile periods interspersed with
tranquil periods, so there are periodic "burst" of volatility"
60
(volatility clustering).
The model is the following:
Xt = 0 + 1Xt-1 + 2Xt-2 + 3Xt-3 + 4Xt-4 + 5Zt-1 + t (10)
t = 0 + 1t-1 + 2t-1 + 3t (11)
where Xt, USA 3 month or Bahamas adjusted, t, the squared residual from regressing the
cross market interest rate (i.e. if Xt is USA 3 month, then Bahamas adjusted will be the cross
market interest rate). Then the conditional variance equation specified in (11) is a function of
four terms:
- The mean 0

59
Ana Maria Fiori, "Forecasting Financial Market Volatility".
60
Ana Maria Fiori, "Forecasting Financial Market Volatility".
- News about volatility from the previous period, measured as the lag of the squared
residual from the mean equation: t-1 (the ARCH term).
- Last period's forecast variance: t-1 (the GARCH term).
- News about volatility in the cross-market: t.
The above results showed that USA 3 month and Bahamas adjusted rates are cointegrated.
Then I incorporate the cointegrating relationship in the mean equation of the GARCH model
(I include the lagged cointegrating error Zt-1).
Once the GARCH model is estimated, the significance of the volatility spillover from cross-
market variable is determined by 3.
Table 11.
Volatility spillover effects (H0: 3 = 0)
USA 3 month Bahamas adjusted
Variable Coefficient
Probability
Coefficient Probability
0
0.011762 0.3583 0.006922 0.8262
1
0.330054 0.0002 -0.072460 0.4762
2
-0.008075 0.9350 0.006889 0.9447
3
0.206502 0.0372 0.220655 0.0143
4
-0.066628 0.4247 0.042205 0.6481
5
-0.075913 0.0000 -0.034319 0.5423
0
0.002769 0.2327 0.004071 0.6876
1
0.076998 0.3721 0.033238 0.5090
2
0.652567 0.0000 0.795177 0.0000
3
0.026784 0.0995 0.960035 0.0283
The table above shows that the volatility spillover from the cross-market interest rate has a
significant effect on the market that is being examined.
Looking at 3, it can be seen that the effect of volatility from Bahamas on US is significant at
10% level, while the effect of US on Bahamas is significant at 5%. Another characteristic is
the coefficient, being higher for Bahamas than for the US. This is consistent with the notion
of Bahamas being a smaller market than the US.
A similar model with one lag in the squared residuals can be constructed:
Xt = 0 + 1Xt-1 + 2Xt-2 + 3Xt-3 + 4Xt-4 + 5Zt-1 + t (12)
t = 0 + 1t-1 + 2t-1 + 3t-1 (13)
The result is the following:
Table 12.
Volatility spillover effects with 1 lag (H0: 3 = 0)
USA 3 month Bahamas adjusted
Variable Coefficient
Probability
Coefficient Probability
0
0.008816 0.5092 0.007344 0.8125
1
0.289883 0.0009 -0.038074 0.7286
2
0.020500 0.8249 0.017061 0.8669
3
0.179735 0.0569 0.251939 0.0046
4
-0.026915 0.7482 0.012587 0.8860
5
-0.080544 0.0000 -0.040168 0.4900
0
0.003222 0.2246 0.007259 0.5402
1
0.051903 0.5289 0.053396 0.4085
2
0.661116 0.0003 0.731482 0.0000
3
0.025883 0.1925 1.119997 0.0401
In this case only the volatility generated in US has impact on the offshore market.
Also, in principle, we can see the result rules out the hypothesis of the offshore centre as a
stable financial place. In both models the fact that 1+2 is higher in Bahamas than in US
indicate that volatility shocks are more persistent in the offshore centre. Although the
coefficient of sensitivity of the conditional volatility to the arrival of new information 1 is
not significant. Only 2 the coefficient which captures the persistence of shocks to volatility is
significant.
Again this result is probably due to the transformation I introduced in the data.
A simplest model without the cointegrating error can be constructed to observe the
volatility spillover. The model is the following:
Xt = 0 + 1Xt-1 + 2Xt-2 + 3Xt-3 + 4Xt-4 + t (14)
t = 0 + 1t-1 + 2t-1 + 3t (15)
In this case the variables which I will use are the real ones, having as t the residual from
regressing the cross-market interest rate. The results are shown in the table below.
Table 13.
Volatility spillover effects
USA 3 month Bahamas
Variable Coefficient
Probability
Coefficient Probability
0
-0.010196 0.4602 0.003259 0.8047
1
0.398774 0.0000 0.032702 0.7294
2
-0.012231 0.9012 -0.061786 0.4842
3
0.256227 0.0093 0.127368 0.1929
4
-0.050150 0.5631 0.072389 0.4634
0
0.004425 0.1799 0.014670 0.0048
1
0.150004 0.1742 0.017558 0.6185
2
0.698653 0.0000 0.481343 0.0161
3
-0.019206 0.1099 0.053301 0.0000
Here only the volatility in US has a significant level on Bahamas, which is consistent with the
idea of a small market. However, in this case the sum of the ARCH and GARCH coefficients
are higher for US, showing that the volatility shocks are less persistent in Bahamas, which
support the hypothesis of an offshore centre as a more stable market.
Taking the model with one lag in the residual
Xt = 0 + 1Xt-1 + 2Xt-2 + 3Xt-3 + 4Xt-4 + t (16)
t = 0 + 1t-1 + 2t-1 + 3t-1 (17)
the result is the following:
Table 14.
Volatility spillover effects with 1 lag
USA 3 month Bahamas
Variable Coefficient
Probability
Coefficient Probability
0
-0.004610 0.7515 -0.013698 0.3641
1
0.402717 0.0000 -0.013935 0.8935
2
-0.006630 0.9461 -0.025985 0.7782
3
0.262083 0.0087 0.082852 0.4078
4
-0.060461 0.4989 -0.014680 0.8849
0
0.005137 0.2448 0.015828 0.0000
1
0.144273 0.2134 0.097158 0.3643
2
0.673189 0.0028 0.358341 0.0032
3
-0.009374 0.2038 0.050820 0.0000
The results are pretty similar to the ones in Table 13.
As it can be seen The Bahamas is been influenced by the volatility shocks in the US, although
the hypothesis of the offshore centre as a stable market cannot be rejected because the
persistence of the volatility is smaller than for the US when I work with the original data.
Part 2. Panama
In this second part I do the same analysis for Panama and the US. Here I use 6-month average
deposit interest rate.
2.1. Summary statistics
I begin with an a priori presentation of the series.
Table 15.
USA6MONTH PANAMA
Mean 5.540977 6.914962
Std. Dev. 1.340673 0.809787
Skewness 0.086718 0.433485
Kurtosis 2.840670 3.079570
Observations 133 133
Again, the distributional properties of the two rates are not similar. In this case the Panama
rate is about 137 basis points higher than The Bahamas. This suggest differences in the
regulatory framework, but more probably an important country risk for Panama, which can be
confirmed looking the Figure 7 where the interest rate in Panama is constantly above the
interest rate in the US (the mean for Bahamas was smaller than for the US).
2.2. Test for stationarity
As in Part 1 the ADF test is run with 4 lags, with and without trend.
Table 16.
Results of augmented Dickey-Fuller (ADF) unit root tests (without trend) (H0: = 0)
Variable Y
Coefficient
Level First difference
USA 6 months -0.035723 (-2.693990) -0.461216 (-3.761188)*
Panama 6 months -0.029704 (-2.310839) -0.399693 (-3.603007)*
* Significant at 1% level (critical value = -3.48). ADF t-values are in parentheses.
The results show that both series are integrated of order one.
Table 17.
Results of augmented Dickey-Fuller (ADF) unit root test with trend (H0: = 0)
Variable Y
Coefficient
Level First difference
USA 6 months -0.037461 (-2.848060) -0.538881 (-4.036235)*
Panama 6 months -0.028082 (-2.168706) -0.431051 (-3.810775)**
* Significant at 1% level (critical value = -4.03). ADF t-values are in parentheses.
** Significant at 5% level (critical value = -3.45).
2.3. Cointegration tests
Directly running the Johansen Test because both series are I(1) and in the same currency I
obtained the following result:
Table 18.
Included observations: 128
Series: USA6MONTH PANAMA
Lags interval: 1 to 4
Likelihood 5 Percent 1 Percent Hypothesized
Eigenvalue Ratio Critical Value Critical Value No. of CE(s)
0.094005 23.31367 15.41 20.04 None **
0.080032 10.67736 3.76 6.65 At most 1 **
*(**) denotes rejection of the hypothesis at 5%(1%) significance level
L.R. test indicates 2 cointegrating equation(s) at 5% significance
level
This presents that the series are cointegrated and support the idea of Panama as an open
economy.
The result can be guess looking at Figure 7.
Figure 7.
Here both series move together with a gap between them. Although the gap is not as constant
as I would have expected.
Given that the series are cointegrated I have chosen not to introduce any change and to work
with the raw data.
2.4. Causality test
Again, Equation (9) is used to examine the causality between Panama and the US. As in the
first part, the optimal number of lags is obtained running the Akaike information criterion.
Table 19.
Test of interest rate transmission (H0: and i = 0)
Dependent Causal Lags F-statistic
Probability
Panama USA 6 month 1 11.40989 0.000028
USA 6 month Panama 1 0.641046 0.528424
Panama USA 6 month 9 2.590664 0.007608
USA 6 month Panama 9 2.990818 0.002362
The result is found to be uni-directional for 1 lag, from US to Panama, and bi-directional for 9
lags. The result for 1 lag is easily explained because of the fact that Panama is a small
economy, which receive the influence from the US.
However, I cannot find an explanation for the bi-directional transmission for 9 lags, and I
assume that I obtained that result by chance.
0
2
4
6
8
10
d

c
.
8
9
d

c
.
9
1
d

c
.
9
3
d

c
.
9
5
d

c
.
9
7
d

c
.
9
9
%
Panama
USA
This shows the hypothesis of Panama as an open economy cannot be rejected.
2.5. Volatility spillover
Using the model of equations (10) and (11) the results are:
Table 20.
Volatility spillover effects (H0: 3 = 0)
USA 6 month Panama
Variable Coefficient
Probability
Coefficient Probability
0
-0.018559 0.1797 0.012497 0.0195
1
0.459809 0.0001 0.167888 0.0551
2
-0.011780 0.9263 0.030742 0.6722
3
0.156737 0.2423 -0.078716 0.1012
4
0.009708 0.8953 0.059616 0.3767
5
-0.075620 0.0036 0.031890 0.0013
0
0.008140 0.0489 0.001949 0.0034
1
0.485379 0.0160 0.949595 0.0005
2
0.383289 0.0148 0.002284 0.9615
3
-0.103490 0.4378 0.023331 0.0859
In this case only the volatility in the US is significant at 10 % level, while the volatility of
Panama does not have impact in the US.
For Panama only the ARCH coefficient is significant, showing an economy which react to
news in volatility of the last period. For the US the ARCH and GARCH coefficient are
significant and their sum is smaller than for Panama. This presents a more stable economy
and rejects the hypothesis of a stable economy for the offshore centre.
Using equations (12) and (13) the results are:
Table 21.
Volatility spillover effects with 1 lag (H0: 3 = 0)
USA 6 month Panama
Variable Coefficient
Probability
Coefficient Probability
0
-0.018120 0.2233 0.014143 0.0104
1
0.453396 0.0001 0.184985 0.0540
2
-0.005828 0.9624 0.083650 0.2064
3
0.151723 0.2449 -0.056602 0.3290
4
0.008219 0.9191 0.101735 0.1163
5
-0.073207 0.0057 0.034868 0.0002
0
0.006271 0.1139 0.003054 0.0003
1
0.365882 0.0331 0.898850 0.0030
2
0.452360 0.0039 -0.021793 0.4140
3
0.122371 0.6009 -0.001602 0.9262
Here neither the US nor Panama have significant values for the cross-market volatility.
The values for 1 and 2 are similar than in Table 20 and reject the hypothesis of Panama as a
stable market.
3. Conclusion
The results presented in this work are not strong enough to support or reject the general
hypothesis stated in page 4 for the offshore centres.
The countries were chosen regarding the data available and not for their success as offshore
centres. Although both countries have been included in the lists of the international groups,
only The Bahamas can be seen as a successful offshore centre. On the other hand, Panama has
always been observed as a not very clean market. It is known that General Noriega was
washing money from drug dealing during the 80s. Also Panama has been subjected to
pressures and controls from the US, given the strategic use of the Panama's channel.
A more interesting work could be done using countries like the Cayman Islands and
Liechtenstein. That could give a better understanding of the development of the economy
when the markets tend to be free of controls.
Finally, as it was highlighted in the beginning, more research is necessary on this topic before
the "small ghostly species" arrive to their end.
4. References
Davidson, Russell and James G. MacKinnon, Estimation and Inference in Econometrics,
Oxford University Press, 1993.
Enders Walter, Applied Econometric time series, 1995, John Wiley & Sons.
Gourieroux and Monfort, Time series and Dynamic Model, Cambridge University Press,
1997.
Greene William, Anlisis Economtrico, Tercera edicin, Prentice Hall, 1999.
Fiori Anna Maria, Forecasting Financial Market Volatility: Moving Averages, GARCH &
Co, Macroeconomic Modelling, 2000.
Hagen Jeannette, The rationale for existence of an Off-Shore Center. The case of the
Netherlands Antilles, 1985.
McCarthy Ian, Seminar on Central Banking, IMF, 1982.
Perez Gonzalez Sara, Banca Offshore, Biblioteca FELABAN.
Roberts Richard, Offshore Financial Centres, An Elgar Reference Collection, 1994.
Sansonetti Riccardo, La problmatique des places financires offshore et la position de la
Suisse, La Vie conomique Revue de politique conomique, 2-2001
Tan Hock Ann Albert, Lakshman Alles, "An examination of causality and predictibilidad
between Australian domestic and offshore interest rates", Journal of International
Financial Markets, Institutions & Money, 10 - 2000 (pages 83-106).
Bahamas Financial Services Board (www.bfsb-bahamas.com)
Center for Freedom and Prosperity (www.freedomandprosperity.org)
Financial Action Task Force (www.oecd.org/fatf)
The forty Recommendations
Review to Identify Non-Cooperative Countries or Territories
Financial Stability Forum (www.fsforum.org)
Report of the Working Group on Offshore Centres
Financial Times (www.ft.com)
OECD (www.oecd.org)
Report on Harmful Tax Competition
Report on Progress in Identifying and Eliminating Harmful Tax Practices
Tax-News (www.tax-news.com)
The Central Bank of The Bahamas (Elsa Rocker: ELRoker@CentralBankBahamas.com)
The economist (www.economist.com)
Modles Macro-conomiques
Fusions-Acquisitions
Analyse des facteurs influenant la profitabilit des fusions-acquisitions en Europe
Professeur: J.C. Lambelet Assistant: Jos Anson
crit par:
Federico Lucini
Juin 2001
Table de Matires
1 INTRODUCTION.......................................................................................................... 118
2 LA PROBLMATIQUE DES FUSION-ACQUISITIONS (F&A)............................ 119
3 LA CONSTRUCTION DU MODLE ......................................................................... 120
3.1 INTRODUCTION........................................................................................................... 120
3.2 LA BASE DE DONNES ................................................................................................. 121
3.3 LA VARIABLE DPENDANT ......................................................................................... 122
3.3.1 Indices sectoriels............................................................................................................................... 123
3.4 LES VARIABLES EXPLICATIVES ................................................................................... 123
3.4.1 Expansion gographique................................................................................................................... 123
3.4.2 Augmentation de la part du march.................................................................................................. 124
3.4.3 Intgration verticale.......................................................................................................................... 124
3.4.4 Conglomrat ..................................................................................................................................... 125
3.4.5 Plus de produits similaires................................................................................................................ 125
3.4.6 Complmentarit............................................................................................................................... 126
3.4.7 Capitalisation du March ................................................................................................................. 126
4 LE MODLE.................................................................................................................. 127
4.1 LES MOINDRES CARRS ORDINAIRES......................................................................... 127
4.1.1 Rsultats de lestimation ................................................................................................................... 127
4.2 MODIFICATION DE LCHANTILLON............................................................................ 128
4.2.1 Rsultats de lestimation ................................................................................................................... 129
4.2.2 Multi-collinarit .............................................................................................................................. 131
4.2.3 Test de heteroscdasticit ................................................................................................................. 131
4.2.4 Test de variable omise....................................................................................................................... 131
4.3 UNE AUTRE MTHODE DESTIMATION : PROBIT...................................................... 132
4.3.1 Rsultat de lestimation..................................................................................................................... 132
5 CONCLUSION............................................................................................................... 133
6 BIBLIOGRAPHIE ......................................................................................................... 134
7 ANNEXES....................................................................................................................... 135
7.1 ANNEXE 1................................................................................................................... 135
7.2 ANNEXE 2................................................................................................................... 137
Introduction
Les fusions et les acquisitions sont la une de lactualit financire depuis prs de 20
ans. On se laisse rapidement impressionner par les chiffres de ces oprations et par la
terminologie employe par la presse spcialise. On entend souvent parler
indiffremment de Mga-fusion ou de Naissance dun monstre de lconomie
globale. Mais que se cache-t-il derrire ces oprations ? En 1990, on estimait que le
montant des fusions atteignait dans le monde 500 milliards de dollars. En 1999,
daprs KPMG Corporate Finance ce chiffre tait de 3'400 milliards de dollars
61
. En
juillet 2000, The Economist
62
soulignait que les checs dans les F&A taient trs
nombreux. Selon KPMG, la progression de la quantit des F&A est en nette
acclration (progression de 47% en 1999 par rapport 1998) et en mme temps on
entend dire que ces nouvelles entreprises ne vont pas aussi bien quon lescomptait au
moment de lunion.
Les analystes financiers disent que le cycle de progression de F&A est arriv sa fin
en 2000. Ils argumentent que la drgulation du march, si importante la fin des
annes 90 en Europe, est arriv une limite. Ils mettent en vidence le fait que lUnion
Europenne rcemment interdit la fusion, dans le march de laluminium, entre
Pechiney, Alcan et Algroup. Un autre argument est plutt financier. Il semblerait que
les marchs financiers, cause de la chute du cours, nacceptent plus quune
acquisition soit rgle en actions (mthode largement utilise). Les acqureurs doivent
de plus en plus payer comptant, chose qui nincite prcisment pas les achats
dentreprises.
Ce papier a pour but dintroduire le lecteur au sujet des F&A. Un de ses objectifs est
danalyser les rsultats obtenus dans ce type doprations par les entreprises
europennes. Dans un premier temps, on introduira la problmatique de ces oprations
pour donner une vision densemble. Par la suite, on va modliser les arguments qui
peuvent avoir une influence sur leur succs ou chec. On conclura avec lanalyse des
rsultats obtenus et une conclusion.

61
Revue franaise de Gestion, Novembre-Decembre 2000.
62
How mergers go wrong, The Economist, 22 juillet 2000.
La problmatique des Fusion-Acquisitions (F&A)
Les F&A peuvent tre subies ou voulues, nanmoins, elles reprsentent lesprit
dadaptation des entreprises un nouveau environnement. Les entreprises fusionnent
principalement car elles escomptent des gains futurs suite ces oprations.
Lenvironnement change, donc il faut sadapter. Ces derniers temps, la mondialisation
a t le changement denvironnement, et elle a provoqu cette adaptation. Cette
adaptation a-t-elle valu la peine ? Cest une des questions laquelle on va essayer de
rpondre.
Le principal objectif dune F&A est les synergies effectues par cette transaction.
Pendant nos recherches, on a constat que dans les rapports annuels de toutes les
nouvelles entits cres, les dirigeants estimaient que des synergies plus ou moins
importantes avaient t ralises. Cet argument ne semble pas tre suffisant pour les
marchs. En effet, comme on le verra par la suite, le rendement des actions est loin
dtre si encourageant pour les actionnaires de ces nouveaux groupes.
Les manuvres de rapprochement peuvent prendre des formes varies, allant des
accords purement contractuels lintgration totale des associes. Comprendre les
F&A implique quon dresse pralablement la typologie des F&A. Elles peuvent tre
horizontales, verticales ou des conglomrats. Lors dune fusion horizontale, deux
entreprises concurrentes sunissent pour nen faire quune. Une fusion verticale
signifie lintgration de deux entreprises qui se trouvent des endroits diffrents du
processus de production dun produit. Lacquisition dune agence de voyage par une
compagnie daviation est une acquisition verticale. Enfin, lorsque deux entreprises
fusionnent alors quelles fournissent des biens diffrents, il sagit de la formation dun
conglomrat.
Lors dune F&A, les entreprises peuvent chercher diffrents objectifs : expansion
gographique, augmentation de la part du march, accroissement de loffre des
produits ou encore la recherche de synergies dans le processus de production ou de
distribution des produits. Cependant, il ne faut pas oublier que des F&A peuvent tre
cause par des motifs contraires aux intrts de lactionnariat de ces entreprises. Des
dirigeants peuvent raliser ces oprations pour des motifs lis principalement leur
prestige personnel.
La construction du modle
Introduction
Le but de ce papier est dessayer de trouver une relation entre, dune part lvolution
du prix laction (On prend en considration une priode dune anne) des entreprises
europennes cres suite des F&A, et dautre part les diffrentes variables qui
peuvent expliquer la russite ou lchec de ces oprations.
Dans un premier temps, on va raliser une rgression multiple selon la mthode des
MCO (moindres carrs ordinaires). De cette faon nous chercherons vrifier
lexistence dune relation linaire entre le rendement de laction (la variable
explique), face aux variables explicatives : expansion gographique, augmentation de
la part du march, intgration vertical, cration dun conglomrat, augmentation de
loffre des produits similaires, complmentarit des produits et la capitalisation du
march.
En principe, on cherche obtenir la fonction suivant :
7 6 5 4 3 2 1 X X X X X X X c Y + + + + + + + (1)
O :
du March. tion Capitalisa X
arit. Complmnt X
s. similaire produits de Plus X
t. Conglomra X
Verticale. n Intgratio X
march. du part la de on Augmentati X
ue. Gographiq Expansion X
indice. l' rapport par action l' de prix du e performanc - e/Sous performanc - Sr Y

7
6
5
4
3
2
1
La base de donnes
Au moment daborder ce papier le premier problme auquel on sest vu confront a t
de trouver une base de donnes sur les cas de F&A en Europe. Cette information,
ayant une valeur importante pour les banques dinvestissement qui soccupent de ces
oprations, nest pas facilement accessible. Il existe plusieurs socits qui soccupent
de vendre ce type dinformation, mais malheureusement les prix proposs par celles-ci
rendent l'accs de telles donnes impossible. Trouver cette base de donnes sest
avr un exercice difficile, dautant plus que pour le dveloppement du modle on
sest aussi intress au montant de la transaction, la date, et la taille des entreprises.
Dans un premier temps, on sest pench sur la Commission de la Concurrence de
lUnion Europenne. Ce choix ntait pas judicieux car seulement les F&A qui
pouvaient entraner une atteinte la concurrence taient pris en compte. Ceci enlevait
dun coup toutes les informations concernant les conglomrats.
Finalement on a utilis une base de donnes trouve sur Zephus, site Internet ddi
aux informations financires concernant les F&A. Dans un premier moment on a pris
en compte toutes les F&A en Europe
63
de plus de 300 millions de Euros compltes
pendant la priode allant du 1
er
janvier 1999 jusquau 30 avril 2000. Dans un deuxime
temps, on a enlev toutes les acquisitions qui ne reprsentaient pas plus du 20% de la
valeur de lentreprise acqureuse. Cette mesure savre logique dans la mesure o on
cherche analyser linfluence des acquisitions dans les performances de lentreprise
acqureuse. Il est vident quune acquisition qui ne compte pas dune faon
significative dans la nouvelle entreprise ne prsente pas dintrt pour le papier en
cours. De cette faon, par exemple, on na pas retenu lacquisition de la Banca del
Gottardo par Swiss Life. Enfin on a aussi retir de lchantillon toutes les acquisitions
qui ciblaient lachat dune partie minoritaire dans une autre entreprise.
Aprs cette premire puration, on a continu enlever les entreprises qui, suite au
premier rapprochement, avaient t absorbes par un autre groupe (ex : Fusion entre
Total et Petrofina en aot 1999 suivie par la fusion entre TotalFina et Elf Acquitaine
en mars 2000) par la suite. La dernire opration a t denlever les entreprises qui
ntaient pas cotes en bourse. Dans cette catgorie, on trouve des entits prives mais
aussi des entreprises qui, en tant des filiales des groupes internationaux, achtent des
autres socits. Lchantillon final inclut 39 entreprises (voir Annexe1).

63
Pays pris en considration : Autriche, Belgique, Danemark, Finlande, France, Allemagne, Grce, Irlande,
Italie, Luxembourg, Hollande, Norvge, Portugal, Espagne, Sude, Suisse, Royaume Uni.
La Variable dpendant
La variable dpendante est le rendement de laction de chaque entreprise pour la
priode allant de 1 mois aprs la date de lopration jusqu' une anne et un mois
aprs. On a choisi une priode dune anne suite des entretiens avec des
professionnels de la finance dentreprise qui estiment que cest un lapsus de temps
suffisant pour lintgration de deux entits. Le choix dun mois aprs la date de
lopration est seulement pour viter dinclure dans le modle la spculation qui
gnre ce type dvnement sur la valeur de laction pendant la priode qui suit
immdiatement lachvement de la F&A. En outre, ne pas inclure cette priode dun
mois naffecte en rien lobjectif du papier qui est danalyser de plus prs les causes de
la russite ou de lchec des F&A.
Pour rendre lanalyse plus exacte, on a compar lvolution du prix de laction avec
des indices sectoriels qui correspondent au mme secteur dactivit que les entreprises
de lchantillon. De cette faon, on a obtenu comme rsultat la sur-performance/sous-
performance de lentreprise par rapport son secteur dactivit. Y (voir quation 2)
reprsente cette sur-performance/sous-performance des entreprise et sera notre
variable dpendante.
( ) ( )
1
]
1

1
]
1

+
+ +
+
+ +
) 1 (
) 1 ( ) 1 1 (
) 1 (
) 1 ( ) 1 1 (
mois t
mois t mois an t
mois t
mois t mois an t
i
I
I I
P
P P
y
(2)
P
64
: Prix de laction
I : Indice sectoriel
Dj, dans cette tape du papier, on trouve un rsultat intressant. Le 65 % des
entreprises ont eu un rendement infrieur lindice du mme secteur dactivit (voir
annexe 1). Cette constatation va dans le mme sens que les propos de The Economist
qui se trouvent dans lintroduction. Ce rsultat nous permet de dire que du point de vue
des actionnaires la plupart des F&A, contrairement aux affirmations des dirigeants au
moment de lopration, nont pas eu le succs escompt.

64
Les prix des actions correspondent au prix de clture. En ce qui concerne les prix des actions des pays qui ne
font pas partie de la zone Euro, le prix a t converti en Euros au dernier taux de change de la mme journe.
Indices sectoriels
Comme indices sectoriels, on a utilis les Indices FTSE European 300. Ces indices
mesurent la performance des 300 plus larges entreprises en Europe (Les pays pris en
considration pour la fabrication de lindice sont les mmes que ceux utiliss pour la
construction de lchantillon) par capitalisation du march. Ils couvrent 70% de la
capitalisation du march en Europe et ils sont calculs en Euros. Les indices sectoriels
utiliss sont : Banks, Basic Industries, General Industries, Resources, Pharma, Real
State, Cyclical
65
Consumer Goods, Non-Cyclical
66
Consumers Goods, Software and
Computer Services, Media, Telecomm. Services, Support Services et Leisure
Les variables explicatives
Chaque entreprise a t analyse individuellement pour pouvoir crer les variables
indpendantes. Les informations proviennent en majorit des rapports annuels et des
diffrents organismes dinformation financire. Toutes les variables indpendantes
sauf la capitalisation du march
67
sont des variables binaires { }. 1 , 0 xi La cause
principale de ce choix est, comme on le verra ci-dessous, que la plupart des variables
explicatives du modle se prtent exclusivement cet exercice.
Expansion gographique
La globalisation est la mode et nombreux sont les analystes financiers qui prtendent que les
entreprises doivent se dvelopper au-del de ses frontires pour survivre. Plusieurs entreprises
ont choisi la voie de F&A pour gagner de cette faon des nouveaux marchs. Cette alternative
nest pas tonnante, car elle permet dacqurir des parts de march et du savoir-faire dans une
priode de temps minimale. Pour justifier ce raisonnement les dirigeants mettent en avant le fait
quune implantation ltranger peut savrer trs difficile selon les pays et le type dactivit.
Lachat par une socit trangre dune socit nationale prendra une valeur de 1. Par contre, si la F&A est entre
deux entreprises du mme pays la variable prendra une valeur de 0. Cette expansion devrait avoir un effet positif
pour les rsultats de lentreprise (donc pour le prix de laction) car ses produits pourront tre couls dans des
rgions diffrentes. Par le mme biais, en diversifiant, la socit diminue le risque pays attach ses activits.
Les entreprises peuvent aussi chercher faire des conomies dchelle en se dveloppant gographiquement.
Dans le cas de deux entreprises multinationales, le pays du march historique fera foi de pays de rsidence. Par

65
Cyclical Consumer Goods : Automobiles & Equipementiers et Equipement Menager & Textiles.
66
Non Cyclical Consumer Good : Boissons, Agro-Alimentaire, Sante, Emballage, Hygiene, Cosmetique &
Produits Menagers, Tabac.
67
Capitalisation du March : Nombre des actions en circulation * Prix de laction
exemple, une entreprise comme Nestl sera considre comme suisse mme si la plupart de son chiffre daffaire
est gnr ltranger.
Augmentation de la part du march
Laugmentation de la part du march pourrait aussi tre appele intgration
Horizontale. Lentreprise acqureuse achte ou fusionne avec un de ces concurrents.
Si, suite la F&A, la part du march de la nouvelle entit augmente dans le pays
dorigine de lentreprise la variable prendra une valeur de 1, et 0 sinon. Une
augmentation de la position de lentreprise sur le march devrait provoquer des
bnfices pour cette socit et influencer positivement lvolution du prix de laction.
On prend seulement en considration le pays dorigine (pays o se trouve le march
historique), car trouver la part de march mondial pour une entreprise multinationale
est impossible. La mesure binaire sest avre invitable dans la mesure o, trouver
des donns fiables sur la part du march de la plupart des entreprises dans lchantillon
est trs difficile. En outre, la majorit des entreprises prise en compte, produisent
plusieurs produits. Donc, mme si on pouvait trouver la part de march dun seul
produit, voire dun segment de produits, on narriverait jamais trouver des donnes
quantitatives pour la part de march des activits de toute lentreprise au niveau
mondial.
Intgration verticale
Selon la thorie financire, lintgration verticale est une des principales causes de
F&A. Les entreprises cherchent sassurer ses fournisseurs ou ses distributeurs pour
contrler les diffrentes tapes du processus de production des produits. Dhabitude,
ils cherchent, de cette manire, obtenir des gains defficience ou des rductions des
cots. Selon les cas, ils peuvent aussi cibler les marges, non-ngligables, de ces
fournisseurs/distributeurs. Une intgration verticale devrait avoir un effet positif sur le
rendement de laction. Pour cette raison, si la F&A dune entreprise par une autre
entit donne comme rsultat une intgration verticale, la variable indpendante prendra
une valeur gale 1, et 0 sinon.
Conglomrat
Souvent les entreprises cherchent diversifier ses activits soit par souci de diminuer
ses risques ou pour se dplacer dune activit en ralentissement vers un autre secteur,
qui est en pleine expansion. Si on tient compte de cette hypothse, un conglomrat
devrait avoir un effet positif sur le rendement de laction. Si la F&A dune entreprise
par une autre entit donne comme rsultat un conglomrat, la variable prendra une
valeur gale 1, et 0 sinon.
Plus de produits similaires
Si la F&A dune entreprise par une autre entit largie la gamme de produits de la
socit dernirement cre, la variable explicative prendra une valeur de 1, et 0 sinon.
De cette faon, par le biais des conomies dchelle cres par llargissement de la
production, la nouvelle entit cherche faire des gains dans la distribution, la
commercialisation ou dans la production. Les produits doivent tre similaires comme,
par exemple, la fusion entre deux laboratoires pharmaceutiques qui se sont spcialiss
dans des mdicaments diffrents. Si la nouvelle entreprise est le produit dun fabricant
de mdicaments cardio-vasculaires et dun producteur de mdicaments pour des
maladies respiratoires, la variable prendra une valeur gale 1. Mme si les produits
sont diffrents le secteur dactivit reste le mme.
Complmentarit
Si la F&A dune entreprise par une autre cre des synergies grce la combinaison des
produits compltement diffrents des deux entits, la variable explicative prendra la
valeur 1, et 0 sinon. Comme exemple on peut prendre le Groupe SSL International n
de lacquisition du London International Group (fabricant de prservatifs) par Seton
Scholl Healthcare (Produits pour le soin des pieds). Mme si ces deux types de
produits sont compltement diffrents, des synergies importantes ont t ralises dans
leur distribution car ils ont les mmes canaux de vente.
Capitalisation du March
Cette variable cherche expliquer les conomies dchelle qui peuvent tre ralises grce
la taille de la nouvelle entit. Une augmentation de la taille de lentreprise devrait permettre
de faire plus dconomies, ce qui devrait tre pris en compte positivement dans le prix de
laction. Cest la seule variable explicative qui soit quantifiable. Cette variable a t obtenue
de la multiplication du prix de laction en Euros et du nombre des actions en circulation.
Le Modle
Les Moindres Carrs Ordinaires
Avec la mthode des MCO, on obtient une relation linaire en posant deux exigences strictes :
premirement, la somme des carrs des carts doit tre minimale, et deuximement, la somme
algbrique des carts entre les points obtenus et la droite de rgression doit tre nulle. Le problme
est pos de la manire suivante.
i i i i i i i i i i x x x x x x x c y + + + + + + + + 7 6 5 4 3 2 1 (3)
i= 1 39 entreprises
On a ralis des coupes transversales pour tenir compte des entreprises qui forment
lchantillon.
Rsultats de lestimation
Dans cette partie, on va sintresser aux rsultats du modle prcdemment dcrit. En
outre, on va vrifier si les hypothses poses pour les variables explicatives sont
vrifies. On va raliser la rgression avec laide du logiciel Stata et on va procder
lanalyse des rsultats obtenus.
Comme on peut le voir dans le tableau des rsultats 1 de la page suivant, aucun des
paramtres des variables explicatives est significatif. Ceci signifie quon ne peut pas
dire que les variables indpendantes apportent une explication lvolution du prix de
laction.
Tableau de Rsultats 1
Source | SS df MS Number of obs = 39
---------+------------------------------ F( 7, 31) = 0.46
Model | .413274484 7 .059039212 Prob > F = 0.8567
Residual | 3.9924092 31 .128787394 R-squared = 0.0938
---------+------------------------------ Adj R-squared = -0.1108
Total | 4.40568369 38 .115939044 Root MSE = .35887
------------------------------------------------------------------------------
rend | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
mktcap | 2.01e-06 2.46e-06 0.818 0.419 -3.00e-06 7.02e-06
compl | -.1009762 .1979965 -0.510 0.614 -.5047928 .3028404
partmkt | -.0363694 .166767 -0.218 0.829 -.3764929 .3037541
vert | .1367249 .1675923 0.816 0.421 -.2050818 .4785316
congl | -.0743843 .2175127 -0.342 0.735 -.5180043 .3692357
sprod | .0426119 .1260207 0.338 0.738 -.214409 .2996327
geogr | .0920452 .1253583 0.734 0.468 -.1636248 .3477151
_cons | -.1396707 .2023163 -0.690 0.495 -.5522975 .2729561
Modification de lchantillon
Les rsultats obtenus ont t une dception, mais en regardant lchantillon de plus prs, on se
rend vite compte quil y a plusieurs entreprises qui ont eu une volution du prix de laction
trs importante, voire trop important. En me basant sur louvrage de Fumi Hayashi,
Econometrics
68
, jai dcid denlever les entreprises qui ont montr une variation de plus de
50% du prix de leurs actions pendant la priode de 1 anne prise en considration pour la
construction du modle. On considre que ces sur-performances/sous-performances par
rapport lindice ne peuvent pas tre la consquence des variables explicatives du modle.
Elles sont probablement consquence dautres facteurs comme par exemple : la spculation
sur le prix de laction, la qualit de la gestion des dirigeants ou des vnements exceptionnels
qui ont touch lentreprise.
En regardant les rsidus obtenus dans la premire estimation, on se rend compte que les
entreprises au plus grands rsidus sont les mmes qui ont les sur-performances/sous-
performances les plus importantes. Ceci va dans le mme sens que lide denlever ces
entreprises de lchantillon.

68
Fumio Hayashi, Econometrics, Princeton University Press, page 23.
If the influential observations satisfy the regression model, they provide valuable information about the
regression fonction unavailable from the rest of the sample and should be definetely kept in the sample. But
more probable is that the influential observations are atypical of the rest of the sample because they do not
satisfy the model. In this case they should definetely be dropped from the sample.
En tenant compte de ce critre, on a enlev 5 socits de lchantillon initial (voir tableau ci-
dessous), et on a procd une deuxime rgression. Cette deuxime rgression (Voir tableau
des rsultats 2) a donn des rsultats plus intressants que les prcdants.
Tableau 1 : Entreprises enleves de lchantillon
Nom de lentreprise Performance par rapport lindice
Obrascon-Huarte-Lain SA -74.49%
Royal Bank of Scotland Group 93.44%
TietoEnator -55.44%
EM.TV & Merchandising -69.40%
TrinityMirror Group -77.00%
Rsultats de lestimation
En regardant le tableau de rsultats 2 on peut dire que les coefficients des variables
complmentarit, Verticalit et produits similaires sont diffrents de 0. Tous les autres
coefficients ne sont pas significatifs. A continuation on va procder liminer les variables
explicatives non-significatives du modle, une une, pour trouver un rsultat final (voir
annexe 2) qui soit reprsent dans le troisime tableau de rsultats.
Tableau de Rsultats 2
Source | SS df MS Number of obs = 34
---------+------------------------------ F( 7, 26) = 1.45
Model | .518471581 7 .074067369 Prob > F = 0.2295
Residual | 1.33046703 26 .051171809 R-squared = 0.2804
---------+------------------------------ Adj R-squared = 0.0867
Total | 1.84893861 33 .056028443 Root MSE = .22621
------------------------------------------------------------------------------
rend | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
compl | -.2203325 .1280381 -1.721 0.097 -.4835186 .0428536
vert | .219911 .1207203 1.822 0.080 -.0282332 .4680552
geogr | .1054949 .0852455 1.238 0.227 -.0697297 .2807195
sprod | .1395121 .0857679 1.627 0.116 -.0367865 .3158106
mktcap | 6.18e-08 1.60e-06 0.039 0.969 -3.23e-06 3.35e-06
partmkt | -.0011035 .1109614 -0.010 0.992 -.2291878 .2269809
congl | .0609007 .1433262 0.425 0.674 -.2337106 .355512
_cons | -.129112 .1344921 -0.960 0.346 -.4055644 .1473403
Tableau de Rsultats 3
Source | SS df MS Number of obs = 34
---------+------------------------------ F( 3, 30) = 3.04
Model | .430645882 3 .143548627 Prob > F = 0.0443
Residual | 1.41829273 30 .047276424 R-squared = 0.2329
---------+------------------------------ Adj R-squared = 0.1562
Total | 1.84893861 33 .056028443 Root MSE = .21743
------------------------------------------------------------------------------
rend | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
sprod | .1498096 .0799003 1.875 0.071 -.0133687 .3129878
compl | -.1973104 .092441 -2.134 0.041 -.3861001 -.0085208
vert | .1999351 .1019621 1.961 0.059 -.0082993 .4081695
_cons | -.088621 .0520567 -1.702 0.099 -.194935 .017693
Le troisime tableau des rsultats montre les rsultats finaux obtenus. La verticalit et
laugmentation de produits similaires lors dune F&A expliquent positivement lvolution du
prix de laction. Ces rsultats vont dans le mme sens que nos hypothses de base. Par contre,
le signe ngatif de la variable complmentarit montre que les marchs financiers pnalisent
ce type dopration. Cette constatation nous a intrigus, et on a essay de trouver une
explication. Malheureusement on na rien trouv dans les ouvrages de rfrence qui
pourraient expliquer convenablement ce fait.
Un autre point intressant est davoir un R carr (coefficient de corrlation) de 0.2329. Ce
rsultat normalement trs pauvre nest pas si mauvaise si on tient compte quil sagit des
coupes transversales.
Multi-collinarit
Linterdpendance des variables explicatives peut affecter les estimations du modle.
Pour cette raison il est prfrable de regarder la matrice de corrlations pour sen
assurer. Dans notre cas la corrlation entre les variables peut tre considre comme
faible.
Matrice de Corrlations
mktcap geogr compl partmkt vert congl sprod

---------+----------------------------------------------------------------
mktcap | 1.0000
geogr | -0.0626 1.0000
compl | -0.3590 -0.1161 1.0000
partmkt | 0.2371 -0.0636 -0.5195 1.0000
vert | -0.2843 -0.1195 0.5057 -0.5550 1.0000
congl | -0.2308 -0.1329 0.6004 -0.2787 0.1612 1.0000
sprod | -0.0989 0.1470 0.0593 -0.1055 0.0610 -0.1096 1.0000
Test de heteroscdasticit
Ce test a pour but de contrler que la variance soit constante, si ce ntait pas le cas les
estimations pourraient tre affectes. Ce rsultat nous indique quon ne peut pas rejeter
lhypothse nulle qui indique la variance comme constante.
Cook-Weisberg test for heteroscedasticity using fitted values
of rend
Ho: Constant variance
chi2(1) = 0.05
Prob > chi2 = 0.8160
Test de variable omise
Ce test nous renseigne sur lexistence des variables omises dans lexplication de la
variable dpendante. Dans notre cas, Il nous dit quon peut rejeter lhypothse nulle
qui nous indique linexistence de variables omises.
Ramsey RESET test using powers of the fitted values of rend
Ho: model has no omitted variables
F(3, 27) = 3.09
Prob > F = 0.0436
Lexistence des variables omises ne nous surprend pas dans la mesure o les prix des
actions peuvent tre influencs par dautres facteurs. On pourrait prendre comme
exemple la spculation financire, lhabilit des dirigeants, la situation politique, etc.
Hlas, ces variables sont, la plupart du temps, difficilement quantifiables.
Une Autre Mthode dEstimation : PROBIT
Dans un modle Probit, le scalaire de la variable dpendante Y est une variable binaire
{ }. 1 , 0 yi Dans notre cas, si lvolution du prix de laction est suprieure lvolution de
lindice sectoriel qui lui correspond, yi prendra une valeur gale 1. Par contre, si lvolution
est ngative, yi prendra une valeur gale 0.
Rsultat de lestimation
Le tableau de la page suivante donne les rsultats obtenus avec le systme Probit. La seule
variable explicative significative est lexpansion gographique. Il est important de souligner
que cette variable tait absente dans les rsultats antrieurs. Ceci voudrait dire quune
volution positive du prix des actions pourrait tre explique par lexpansion gographique
acheve par la nouvelle socit. Mme si ce rsultat est en contradiction avec les antrieures il
est important de le prendre en considration pour la conclusion de ce papier.
Tableau de Rsultats 4
Probit estimates Number of obs = 34
LR chi2(7) = 11.52
Prob > chi2 = 0.1176
Log likelihood = -16.858302 Pseudo R2 = 0.2546
------------------------------------------------------------------------------
rendbin | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------------------
mktcap | -.0000103 .000014 -0.739 0.460 -.0000378 .0000171
geogr | 1.466268 .582817 2.516 0.012 .3239678 2.608568
sprod | .6761539 .5478919 1.234 0.217 -.3976945 1.750002
congl | .8778728 .8634201 1.017 0.309 -.8143995 2.570145
vert | 1.296285 .8862949 1.463 0.144 -.4408215 3.033391
partmkt | .5211368 .6744864 0.773 0.440 -.8008322 1.843106
compl | -.910076 .8423974 -1.080 0.280 -2.561145 .7409925
_cons | -1.395823 .8179749 -1.706 0.088 -2.999024 .2073784
Conclusion
Tout au long de ce papier on a voulu claircir le sujet des F&A. Le premier rsultat
intressant a t de constater que 65% des entreprises de lchantillon nont pas sur-
perform lindice. Ce rsultat confirme lhypothse que les checs dans les F&A ont
t trs nombreux.
En ce qui concerne les variables explicatives, on a pu montrer que la verticalit et les synergies dgages par la
production des produits similaires peuvent expliquer un rendement des actions au-dessus de lvolution de
lindice. Par contre, la complmentarit, en exerant une influence sur lvolution du prix des actions, contredit
nos hypothses, car elle exerce une influence ngative. Pour toutes les autres variables explicatives on na pas
trouv des coefficients significatifs. La capitalisation du march, lachat dun concurrent, la formation dun
conglomrat narrivent pas prdire lvolution de la valeur de lentreprise. Il faut faire une exception en ce qui
concerne lexpansion gographique. Mme si son coefficient nest pas significatif avec la mthode des MCO,
cette variable est la seule tre retenue quand on a utilis la mthode Probit.
Ce modle prsente le problme des variables omises. Tout au long du papier on a mentionn que le
comportement des dirigeants et la spculation lie aux entreprises devraient tre introduits dans le modle.
Malheureusement on na pas pu trouver un moyen de quantifier ces variables. Une amlioration qui pourrait tre
apporte au modle serait de parvenir lestimer.
On pense que ce papier pourrait tre aussi perfectionn en ce qui concerne lanalyse de lchantillon. Une faon
serait daccder des informations et des analyses sur les entreprises ralises par des professionnels. Mme si
on a essay danalyser ces socits avec attention, on ne prtend pas se comparer des experts qui se spcialisent
sur un petit nombre dentreprises.
Bibliographie
+ Robert S. Pindiyck, Daniel L. Rubinfeld, Econometrics Models and Econometrics Forecasts, McGraw-
Hill International Editions, Third Edition, 1981.
+ Peter Kennedy, A guide to Econometrics, Blackwell Publishers, Fourth Edition, 1998.
+ Fumio Hayashi, Econometrics, Princeton University Press, 2000.
+ Richard A. Brealey, Stewart C. Myers, Principles of Corporate Finance, McGraw-Hill International
Editions, Fifth Edition, 1996.
+ Ross, Westerfield, Jaffe, Corporate Finance, McGraw-Hill International Editions, Fifth Edition, 1999.
+ Zuhayr Mikdashi, Les Banques lEre de la Mondialisation, Economica, 1998.
+ Nils S. Tuschmid, Cour de principe de finance, Ecole des HEC, Universit de Lausanne, 1998.
+ Marc Walker, Corporate Takeovers, Strategic Objectives, and Acquiring-Firm Shareholder Wealth,
Financial Management, Spring 2000, page 53-66.
+ Revue Franaise de Gestion, Novembre-Dcembre 2000
Annexes
Annexe 1
Annexe 2
Tableau de Rsultats 5
Source | SS df MS Number of obs = 34
---------+------------------------------ F( 6, 27) = 1.75
Model | .51846652 6 .086411087 Prob > F = 0.1469
Residual | 1.33047209 27 .049276744 R-squared = 0.2804
---------+------------------------------ Adj R-squared = 0.1205
Total | 1.84893861 33 .056028443 Root MSE = .22198
------------------------------------------------------------------------------
rend | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
mktcap | 6.21e-08 1.57e-06 0.040 0.969 -3.16e-06 3.28e-06
compl | -.2200239 .1218972 -1.805 0.082 -.4701363 .0300886
vert | .2204063 .1079132 2.042 0.051 -.0010133 .4418258
congl | .0609968 .1403276 0.435 0.667 -.2269316 .3489251
sprod | .1395657 .0839984 1.662 0.108 -.0327847 .3119161
geogr | .1056521 .0822015 1.285 0.210 -.0630114 .2743157
_cons | -.1301996 .0768285 -1.695 0.102 -.2878386 .0274395
------------------------------------------------------------------------------
Tableau de Rsultats 6
Source | SS df MS Number of obs = 34
---------+------------------------------ F( 5, 28) = 2.13
Model | .509156096 5 .101831219 Prob > F = 0.0914
Residual | 1.33978251 28 .047849375 R-squared = 0.2754
---------+------------------------------ Adj R-squared = 0.1460
Total | 1.84893861 33 .056028443 Root MSE = .21875
------------------------------------------------------------------------------
rend | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
mktcap | 1.29e-08 1.54e-06 0.008 0.993 -3.15e-06 3.17e-06
compl | -.188613 .0967359 -1.950 0.061 -.3867676 .0095416
vert | .2102686 .1038256 2.025 0.052 -.0024085 .4229456
sprod | .1333443 .0815624 1.635 0.113 -.0337287 .3004174
geogr | .1028637 .0807552 1.274 0.213 -.0625558 .2682832
_cons | -.1250857 .0748147 -1.672 0.106 -.2783366 .0281653
------------------------------------------------------------------------------
Tableau de Rsultats 7
Source | SS df MS Number of obs = 34
---------+------------------------------ F( 4, 29) = 2.21
Model | .431520695 4 .107880174 Prob > F = 0.0929
Residual | 1.41741791 29 .04887648 R-squared = 0.2334
---------+------------------------------ Adj R-squared = 0.1276
Total | 1.84893861 33 .056028443 Root MSE = .22108
------------------------------------------------------------------------------
rend | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
mktcap | -2.07e-07 1.55e-06 -0.134 0.894 -3.38e-06 2.96e-06
compl | -.2006752 .0972991 -2.062 0.048 -.3996742 -.0016762
vert | .1981852 .1044951 1.897 0.068 -.0155312 .4119016
sprod | .1489436 .0814986 1.828 0.078 -.0177398 .315627
_cons | -.0829482 .06782 -1.223 0.231 -.2216557 .0557592
------------------------------------------------------------------------------