Vous êtes sur la page 1sur 25

lOMoARcPSD|8154023

Econometrie TP Accidents de la route

Economie (Université Grenoble-Alpes)

StuDocu is not sponsored or endorsed by any college or university


Downloaded by Pierrot Kadanga (pikadanga@gmail.com)
lOMoARcPSD|8154023

Econométrie TP

Les accidents de la route en France :


Etude en coupe départementale.
(Données de 2004)

Sommaire :

Introduction.
Construction du modèle.
Schématisation.
Nos données.
Le modèle de régression linéaire multiple (RLM)
A. Hypothèses du modèle de RLM
B. Terme d’erreur
C. Propriétés des estimateurs
Estimation de notre modèle
A. Modèles théoriques
B. 1ère estimation par la méthode des moindres carrés ordinaires (MCO).
1. Théorie de la décision:
2. Test F :
3. Test t (test bilatéral)
4. Matrice de corrélation :
C. 2ème estimation par la méthode des moindres carrés ordinaires (MCO) :
1. Théorie de la décision:
2. Test F
3. Test t (test bilatéral)
4. Comparaison des deux estimations :
D. 3ème estimation avec transformation logarithmique.
1. Test F
2. Test t (test bilatéral)
3. Comparaison entre les 3 estimations.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

E. Prévisions
2. Estimation par MCO
3. Estimation ponctuelle
Conclusion.
Bibliographie.

Introduction.

Alors que la lutte contre la violence routière est une des priorités actuelles du
gouvernement, nous nous sommes donc interrogés sur les facteurs explicatifs du nombre
d’accident corporel observer sur les routes des départements français. Plusieurs phénomènes
nous paraissaient à priori intéressant à étudier comme la mise en place des radars
automatiques ou encore le renforcement des contrôles effectués ces derniers temps.
Malheureusement nous n’avons pas pu trouver suffisamment de données sur ces dernières
années pour construire un modèle significatif. C’est pourquoi nous nous sommes rabattus sur
une analyse en coupe transversale sur un échantillon de 50 départements français. Les donnés
datent de l’année 2004.
Ainsi, nous allons construire un modèle de régression linéaire multiple à 4 variables
explicatives sur le nombre d accidents constatés dans les différents départements. Différents
tests sur notre modèle vont nous permettre de conclure à la significativité ou non des variable
explicative et de quantifier ces éventuelles relations.

Construction du modèle.

Notre modèle va tenter d’expliquer les accidents de la route par :

 La population générale du département. Intuitivement nous allons supposer que


plus la population est importante, plus la fréquence des accidents sera grande. Pour
que cette variable ne soit pas biaisée nous avons constitué l’échantillon de manière
aléatoire. Il contient donc des départements de différentes tailles tant au niveau de
la surface que de la population. Cette variable endogène sera notée X2i.

 La part de la population urbaine dans le département. Ici, il faut comprendre que


nous supposons que la densité de véhicules est bien plus forte en ville. Ainsi le but
de l introduction de cette variable va permettre de savoir si la densité de véhicule a
un quelconque effet sur la fréquence des accidents. Il faut tout de même distinguer
les accidents de la route des morts constatés comme nous le verrons plus tard.
Cette variable est notée X3i.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

 La part du trafic sur route nationale 2*2 voies dans le département. Cette variable
est définie comme le poids du parcours (véhicules * kilomètre) qu elle représente
en 2004. Lors de nos recherche documentaire, nous avons constaté que :
1. Les routes nationales sont très accidentogènes
2. Les autoroutes présentent une bonne sécurité.
Ainsi grâce à cette variable nous allons pouvoir mesuré l’éventuelle impacte du
doublement de la chaussée des routes nationales sur les accident. Nous avons
supposé que la présence d’un terre plein central et d équipement adapté à ce type
de voie a un impact négatif sur les accidents. Cette variable est notée X4i.
 La part des 15-24 ans dans la population du département. Les tests effectués sur
cette variable vont tenter de cerner l’impact du manque d’expérience de la route
des jeunes utilisateurs pour les 18-24, et dans une moindre mesure l’utilisation des
véhicules 2 roues avant l’age de 18 ans. La variable X5i devrait avoir un impact
positif sur notre variable expliquée.

Les cinq variables citées devraient selon nous expliquer les variations du nombre constaté
d’accident dans chaque département.

Schématisation.

Nous devons rappeler que le phénomène que nous allons expliquer ne peut pas se
résumer à nos seules variables et est bien sur bien plus complexe. Voici une vue d’ensemble
des facteurs qui probablement ont un impact significatif.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

Au vues de ce schéma, on aperçoit la grande diversité des éléments expliquant les


accidents de la route. A la première approche de notre problématique nous avions penser
-Budgets
MORT
-Efficacité – rapidité des secours
-Infrastructures et éléments de sécurité
-Sécurité passive du véhicule.

-R & D

-Etat du véhicule
-Eléments de sécurité a bord
Véhicule

ACCIDENT -Alcoolémie
-Vitesse
-fatigue
Conducteur -Expérience

Infrastructures -réseaux type


Population et densité Autoroutier.

-Signalisation
déterminer les facteurs emmenant au décès, mais les facteurs étaient difficilement quantifiables
et les données très peu accessibles. Cependant intuitivement, on devine une relation très forte
entre le nombre d’accidents et le nombre de tués sur les routes. Ainsi nous avons opté pour une
étude portant sur les accidents plutôt que sur le nombre de tués. Apres une rapide analyse nous
avons pu constater que cette corrélation est globalement vérifiée, a l’exception des grandes
Evenement Il parait probable que la vitesse
agglomérations. - Facteurs potentiellement
de circulation dans le centre des grandes villes
explicatifs
est trop faible pour provoquer des accidents mortels. Prenons l’exemple de Paris ou le nombre
de tués pour un million d’habitants est de 24, ce qui est le taux le plus faible de France, mais
dansGroupe
le même -Facteurs
temps Paris est une des villes
de facteurs les plusétudiés
accidentogène (7000 accidents corporels
pour 2 million d’habitants). Les deux événements doivent donc être dissociés.

Avant de passer a l analyse des données statistique, il parait judicieux de rappeler que
notre travail a pour but d’appliquer un cours théorique, le rapport souligne dons l’intérêt de
l’approche économétrique sur un phénomène comme celui étudié, mais ne pourra pas se
conclure par des recommandations car les variables utilisées ne se prêtent pas à d’éventuels
ajustements.

Nos données.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

Part de la Part des 2*2 Part des


Accidents Population
DEPARTEMENT pop urbaine ds les Rn homme 15-
corporels (en millier)
(%) (%) 24 ans (%)
Ain 615,00 515,00 60,00 0 12,9174
Aisne 544,00 535,00 57,00 19,9 13,7958
Allier 459,00 345,00 60,00 11 11,1563
Alpe de H P 221,00 140,00 52,00 0 11,0855
Hautes alpes 214,00 121,00 52,90 0 11,9282
Alpes maritimes 3 454,00 1 011,00 95,40 37,4 12,2464
Ardèche 313,00 286,00 52,10 0,8 11,4884
Ardennes 253,00 290,00 61,40 27,7 13,5099
Ariège 173,00 137,00 48,20 34 10,7718
Aube 320,00 292,00 60,60 8,5 13,4786
Aude 276,00 310,00 54,80 8,7 11,6914
Aveyron 214,00 264,00 45,50 14 10,9236
Bouches du Rhône 5 449,00 1 836,000 98,80 21,3 13,9068
Calvados 704,00 648,00 62,30 73 14,6446
Cantal 99,00 151,00 36,40 0 11,116
Charente 332,00 340,00 46,80 54 12,0913
Charente maritime 889,00 557,00 55,30 32 11,9023
Cher 376,00 314,00 57,30 4 11,7563
Corrèze 366,00 233,00 49,40 0 11,1902
Corse du sud 408,00 119,00 61,30 6,5 12,0378
Haute corse 408,00 142,00 63,40 72 12,806
Cote d Or 838,00 507,00 64,90 58,8 14,4896
Cote d’Armor 377,00 542,00 53,90 4 12,0797
Creuse 117,00 124,00 24,20 29,3 10,0574
Dordogne 453,00 388,00 47,90 25 10,6177
Doux 630,00 499,00 66,90 28 14,764
Drome 615,00 438,00 69,60 35 12,8412
Eure 621,00 541,00 54,70 84,3 13,3004
Eure et loir 460,00 408,00 62,30 4,3 12,7625
Finistère 721,00 852,00 72,80 19,7 13,1927
Gard 1 190,00 623,00 76,40 12 12,8815
Haute-Garonne 1 680,00 1 046,00 82,20 5,3 14,7968
Gers 234,00 172,00 36,60 7,1 10,0966
Gironde 2 135,00 1 287,00 79,60 41 14,1076
Hérault 1 095,00 896,00 82,80 19 14,409
Ile et vilaine 1 023,00 868,00 65,40 96,5 14,6914
Indre 323,00 231,00 55,00 1,5 10,7375
Indre et Loire 549,00 554,00 75,10 11 13,6894
Isère 1 262,00 1 094,00 76,40 8,1 14,5211
Jura 164,00 251,00 44,60 9,3 12,1403
Landes 454,00 327,00 53,50 73 11,0521
Loire et cher 446,00 315,00 54,60 9,6 11,5617
Loire 985,00 729,00 79,60 16,6 13,7011
Haute et Loire 244,00 209,00 53,60 42,7 11,6422
Loire atlantique 1 405,00 1 134,00 76,70 82 14,2435
Loiret 795,00 618,00 74,30 25,1 13,5312
Lot 239,00 160,00 36,30 10,6 10,3147
Lot-et-Garonne 510,00 305,00 62,60 0 11,7026
Lozère 105,00 74,00 35,10 0 11,6759
Maine et Loire 1 009,00 733,00 64,90 58,8 14,6238

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

Sources :
◦ http://www.securiteroutiere.gouv.fr/IMG/pdf/comparaisons_interdepartementales-2.pdf
◦ http://www.insee.fr/fr/ffc/docs_ffc/ElpDep_5trages90-04[1].xls

Le modèle de régression linéaire multiple (RLM)

A. Hypothèses du modèle de RLM

◘ La variable dépendante Yi , dans notre modèle , peut être calculée par une relation
linéaire des variables indépendantes et du terme d’erreur. Cette relation linéaire
impose:
→ Yi = α+∑Ni=1 β j X ji+ εi i ε [1,N] j ε [2,k]

Où: - Yi…variable dépendante, endogène ou à expliquer


- X ji …variables indépendantes, exogènes ou explicatives
- α …paramètre du modèle
- β j …paramètre du modèle
- εi …variable aléatoire, terme d’erreur, élément perturbateur

◘ Hypothèse fondamentale :
→ L’espérance mathématique conditionnelle est supposée être nulle.
E[εi/ X ji ] = 0 pour tout i ε [1,N] et j ε [2,k]

◘ Hypothèse d’homoscédasticité :
La variance de cette variable aléatoire, le terme d’erreur, est une variance identique. Les
termes d’erreur ne sont pas corrélés entre eux.
→ V[εi/ X ji ] = E[εi ²] = σ² pour tout i ε [1,N] et j ε [2,k]
→ Cov[εi εi’] = E[εi εi’] = 0 pour tout i ε [1,N] et i ≠ i’

◘ Les variables explicatives et les termes d’erreur sont supposés indépendants et non
corrélés :
→ Cov[εi X ji ] = E[(εi - E[εi ]) (X ji - E[X ji])] = 0

◘ La variable aléatoire εi évolue selon le loi normale. On suppose que les perturbations
sont normales, indépendantes et identiquement distribuées :
→ εi ~ N (0, σ²)

◘ Hypothèse de multicolinéarité :
→ On suppose qu’il n’existe pas de relation linéaire parfaite entre les variables explicatives.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

B. Terme d’erreur

On considère que les variables explicatives du modèle ne sont pas les seules variables
à pouvoir expliquer la variable endogène Yi .
La présence d’εi s’explique à cause de l’erreur de spécification. Il existe beaucoup de
variables qui ne sont pas observables et entrent ainsi dans la partie „erreur“. Cette variable
„erreur“ va représenter l’effet net d’un grand nombre de variables non présentes dans le
modèle. On suppose que l’effet net en terme d’erreur est relativement faible.

Nous introduisons εi pour les erreurs de mesure sur la variable dépendante Yi. Les erreurs de
mesure ne correspondent pas aux erreurs réelles postulées par la théorie.

Les individus effectuent des choix différents dans des conditions totalement identiques. Il
s’agit de la notion du hasard.

C. Propriétés des estimateurs

Pour qu’un estimateur ponctuel soit un bon estimateur il doit avoir les propriétés
suivantes:
◘ L’estimateur doit être sans biais, c’est-à-dire que le coefficient de régression b doit avoir
comme espérance mathématique le paramètre de la relation théorique:
E(b) = β
◘ L’estimateur b doit être efficace. Un estimateur sans biais est un estimateur efficace si sa
distribution d’échantillonnage possède la plus petite variance parmi tous les estimateurs sans
biais:
V(b) = σ²b
◘ L’estimateur doit converger vers la vraie valeur du paramètre β.

Estimation de notre modèle

A. Modèles théoriques

RLM:
Yi = α+∑Ni=1 β j X ji+ εi i ε [1,N] j ε [2,k]

Yi = α+∑50i=1 β j X ji+ εi i ε [1,50] j ε [2,6]

Où: - Yi …variable dépendante, nombre d’accidents,


- X ji …variables indépendantes,
- X 2i …population du département (en millier),
- X 3i …part d’urbanisation du département,

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

- X 4i …part de 2x2 voies dans le département,


- X 5i …part des hommes de 15-24 dans la population totale du département,
- α …paramètre du modèle,
- β j …paramètre du modèle,
- εi …variable aléatoire, terme d’erreur, élément perturbateur,
▪ E[εi/ X ji ] = 0 pour tout i ε [1,50] et j ε [2,5]
▪ V[εi/ X ji ] = E[εi ²] = σ² pour tout i ε [1,50] et j ε [2,5]
▪ Cov[εi εi’] = E[εi εi’] = 0 pour tout i ε [1,50] et i ≠ i‘
▪ Cov[εi X ji ] = E[(εi - E[εi ]) (X ji - E[X ji])] = 0 pour tout i ε [1,50] et j ε [2,5]
▪ εi ~ N (0, σ²)

B. 1ère estimation par la méthode des moindres carrés ordinaires


(MCO).

Dependent Variable: Y
Method: Least Squares
Date: 01/13/06 Time: 14:01
Sample: 1 50
Included observations: 50
Variable Coefficient Std. Error t-Statistic Prob.
C 1900.406 625.5454 3.037999 0.0040
X2 2.170576 0.276186 7.859108 0.0000
X3 20.55132 7.051298 2.914544 0.0055
X4 1.174395 2.359868 0.497653 0.6212
X5 -278.9953 62.02830 -4.497870 0.0000
R-squared 0.831343 Mean dependent var 735.3200
Adjusted R-squared 0.816351 S.D. dependent var 897.4098
S.E. of regression 384.5786 Akaike info criterion 14.83681
Sum squared resid 6655532. Schwarz criterion 15.02802
Log likelihood -365.9203 F-statistic 55.45332
Durbin-Watson stat 1.871092 Prob(F-statistic) 0.000000

Ŷi = a + b2 X 2i + b3 X 3i + b4 X 4i + b5 X 5i i ε [1,50]
[t] [ta = 3.038] [tb2 =7,859] [tb3 = 2,915] [tb4 = 0,498] [tb5 = 4,498]

a…estimateur de α
bj …estimateur de β j j ε [2,5]

Où: - Yi …variable dépendante, nombre d’accidents,


- X ji …variables indépendantes,
- X 2i …population du département,
- X 3i …part d’urbanisation du département,
- X 4i …part de 2x2 voies dans le département,
- X 5i …part des hommes de 15-24 dans la population totale

N.B. Les résultats sont obtenus par EViews.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

1. Théorie de la décision:

Nous allons prendre en compte le risque de première espèce (qui correspond à la


situation où l‘on rejette l’hypothèse alors qu’en réalité elle est vérifiée). On va imposer ce
risque à une valeur relativement faible, seuil limite s = 5% = 0,05.

2. Test F :

Hypothèse jointe: H0 : β2 = β3 = β4 = β5 = 0

Fstat = 55,45332
Fthéorique = F 1-s (k ; N-(k+1))
= F 1-0,05 (4 ; 50-(4+1))
= F0,95 (4 ; 45) = 2,61

où: k…nombre de variables explicatives


N…nombre d’observations
(k+1)…nombre de variables explicatives + la constante

Fstat > F0,95 (5 ; 45) H0 : β2 = β3 = β4 = β5 = 0


H0 va être rejetée
Si H0 est rejetée, alors on peut trouver dans le modèle testé au moins une variable explicative
significative statistiquement.

3. Test t (test bilatéral)

► β 2 ~ N (E(b2 ), σb2)
E(b2 ) = β2
(b2 - β2) / σb2 ~ N (0, 1)
(b2 - β2) / ^σb2 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β2 = 0.

H0 : β2 = 0 contre H1 : β2 ≠ 0

tstat = | b2 / ^σb2 | = 7,859108


tthéorique = ts (N-(k+1))
= t0,05 (50-(4+1))
= t0,05 (45) = 2,042

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

tstat > t0,05 (45) H0 : β2 = 0


H0 va être rejetée
Si H0 est rejetée, la variable explicative X2 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

► β 3 ~ N (E(b3), σb3)
E(b3 ) = β3
(b3 – β3) / σb3 ~ N (0, 1)
(b3 – β3) / ^σb3 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β3 = 0.

H0 : β3 = 0 contre H1 : β3 ≠ 0

tstat = | b3 / ^σb3 | = 2,914544


tthéorique = ts (N-(k+1))
= t0,05 (50-(4+1))
= t0,05 (45) = 2,042

tstat > t0,05 (45) H0 : β3 = 0


H0 va être rejetée
Si H0 est rejetée, la variable explicative X3 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

► β 4 ~ N (E(b4 ), σb4)
E(b4 ) = β4
(b4 – β4) / σb4 ~ N (0, 1)
(b4 – β4) / ^σb4 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β4 = 0.

H0 : β4 = 0 contre H1 : β4 ≠ 0

tstat = | b4 / ^σb4 | = 0,497653


tthéorique = ts (N-(k+1))
= t0,05 (50-(4+1))
= t0,05 (45) = 2,042

tstat < t0,05 (45) H0 : β4 = 0


H0 va être accepté
Si H0 est acceptée, la variable explicative X4 n’est pas considérée comme statistiquement
significative. Elle ne peut donc expliquer les comportements de la variable dépendante Yi .

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

► β 5 ~ N (E(b5 ), σb5)
E(b5 ) = β5
(b5 – β5) / σb5 ~ N (0, 1)
(b5 – β5) / ^σb5 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β5 = 0.

H0 : β5 = 0 contre H1 : β5 ≠ 0

tstat = | b5 / ^σb5 | = 4,497870


tthéorique = ts (N-(k+1))
= t0,05 (50-(4+1))
= t0,05 (45) = 2,042

tstat > t0,05 (45) H0 : β5 = 0


H0 va être rejetée.
Si H0 est rejetée, la variable explicative X5 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

Après avoir effectué le test t sur chaque variable explicative dans notre modèle, on
constate, qu’il y a trois variables explicatives significatives statistiquement, X2 et X3 et X5

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

6000

4000

2000

1500 0
1000
-2000
500

-500

-1000
5 10 15 20 25 30 35 40 45 50

Residual Actual Fitted

4. Matrice de corrélation :

Pour pouvoir définir la variable explicative à supprimer de notre modèle, on va


effectuer la matrice de corrélation.

X2 X3 X4 X5
X2 1 0.818578 0.276888 0.686188
X3 0.818578 1 0.181700 0.723525
X4 0.276888 0.181700 1 0.394526
X5 0.686188 0.723525 0.394526 1

On observe la plus forte corrélation entre X2 et X3. Cependant ces deux variables sont
statistiquement significative. Il n’est donc pas judicieux de supprimer l’une des deux.
X4 étant la seul variable non significative, on va alors la supprimer pour tester de nouveau le
modèle.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

C. 2ème estimation par la méthode des moindres carrés ordinaires


(MCO) :

Dependent Variable: Y
Method: Least Squares
Date: 01/13/06 Time: 14:58
Sample: 1 50
Included observations: 50
Variable Coefficient Std. Error t-Statistic Prob.
C 1829.473 604.0885 3.028485 0.0040
X2 2.191306 0.270785 8.092432 0.0000
X3 19.77604 6.820581 2.899465 0.0057
X5 -268.1058 57.56398 -4.657528 0.0000
R-squared 0.830415 Mean dependent var 735.3200
Adjusted R-squared 0.819355 S.D. dependent var 897.4098
S.E. of regression 381.4207 Akaike info criterion 14.80230
Sum squared resid 6692161. Schwarz criterion 14.95526
Log likelihood -366.0575 F-statistic 75.08321
Durbin-Watson stat 1.844189 Prob(F-statistic) 0.000000

Ŷi = a + b2 X 2i + b3 X 3i + b5 X 5i i ε [1,50]
[t] [ta = 3,028] [tb2 =8,092] [tb3 = 2,899] [tb5 = 4,658]

a…estimateur de α
bj …estimateur de β j j ε [2,5]

Où: - Yi …variable dépendante, nombre d’accidents,


- X ji …variables indépendantes,
- X 2i …population du département,
- X 3i …part d’urbanisation du département,
- X 5i …part des hommes de 15-24 dans la population totale

N.B. Les résultats sont obtenus par EViews.

1. Théorie de la décision:

Nous allons prendre en compte le risque de première espèce (qui correspond à la situation où
l‘on rejette l’hypothèse alors qu’en réalité elle est vérifiée). On va imposer ce risque à une
valeur relativement faible, seuil limite s = 5% = 0,05.

2. Test F

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

Hypothèse jointe: H0 : β2 = β3 = β5 = 0

Fstat = 75,08321
Fthéorique = F 1-s (k ; N-(k+1))
= F 1-0,05 (3 ; 50-(3+1))
= F0,95 (3 ; 46) = 2,76

où: k…nombre de variables explicatives


N…nombre d’observations
(k+1)…nombre de variables explicatives + la constante

Fstat > F0,95 (3 ; 45) H0 : β2 = β3 = β5 = 0


H0 va être rejetée
Si H0 est rejetée, alors on peut trouver dans le modèle testé au moins une variable explicative
significative statistiquement.

3. Test t (test bilatéral)

► β 2 ~ N (E(b2 ), σb2)
E(b2 ) = β2
(b2 - β2) / σb2 ~ N (0, 1)
(b2 - β2) / ^σb2 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β2 = 0.

H0 : β2 = 0 contre H1 : β2 ≠ 0

tstat = | b2 / ^σb2 | = 8,092


tthéorique = ts (N-(k+1))
= t0,05 (50-(3+1))
= t0,05 (46) = 2,042

tstat > t0,05 (46) H0 : β2 = 0


H0 va être rejetée
Si H0 est rejetée, la variable explicative X2 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

► β 3 ~ N (E(b3), σb3)
E(b3 ) = β3
(b3 – β3) / σb3 ~ N (0, 1)
(b3 – β3) / ^σb3 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β3 = 0.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

H0 : β3 = 0 contre H1 : β3 ≠ 0

tstat = | b3 / ^σb3 | = 2,899


tthéorique = ts (N-(k+1))
= t0,05 (50-(3+1))
= t0,05 (46) = 2,042

tstat > t0,05 (46) H0 : β3 = 0


H0 va être rejetée
Si H0 est rejetée, la variable explicative X3 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

► β 5 ~ N (E(b5 ), σb5)
E(b5 ) = β5
(b5 – β5) / σb5 ~ N (0, 1)
(b5 – β5) / ^σb5 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β5 = 0.

H0 : β5 = 0 contre H1 : β5 ≠ 0

tstat = | b5 / ^σb5 | = 4,658


tthéorique = ts (N-(k+1))
= t0,05 (50-(3+1))
= t0,05 (46) = 2,042

tstat > t0,05 (46) H0 : β5 = 0


H0 va être rejetée.
Si H0 est rejetée, la variable explicative X5 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

Après avoir effectué le test t sur chaque variable explicative dans notre modèle, on
constate, que les trois variables explicatives sont significatives statistiquement, X2, X3 et X5 .

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

6000

4000

2000

1500 0
1000
-2000
500

-500

-1000
5 10 15 20 25 30 35 40 45 50

Residual Actual Fitted

4. Comparaison des deux estimations :

On observe dans les deux modèles testé un coefficient de détermination R² quasiment


identique. Le graphique indiquant les résidus est lui aussi presque similaire entre les deux
estimations. Il est alors préférable de conserver la variable X4 .

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

D. 3ème estimation avec transformation logarithmique.

Dependent Variable: LY
Method: Least Squares
Date: 01/14/06 Time: 12:03
Sample(adjusted): 2 50
Included observations: 43
Excluded observations: 6 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -0.789204 1.126020 -0.700879 0.4876
LX2 0.752757 0.114155 6.594147 0.0000
LX3 1.569797 0.306569 5.120526 0.0000
LX4 0.092691 0.044582 2.079108 0.0444
LX5 -1.637755 0.665013 -2.462741 0.0184
R-squared 0.880222 Mean dependent var 6.321732
Adjusted R-squared 0.867614 S.D. dependent var 0.805067
S.E. of regression 0.292923 Akaike info criterion 0.491129
Sum squared resid 3.260543 Schwarz criterion 0.695920
Log likelihood -5.559271 F-statistic 69.81357
Durbin-Watson stat 1.771178 Prob(F-statistic) 0.000000

LŶi = a + b2 LX 2i + b3 LX 3i + b4 LX 4i + b5 LX 5i i ε [1,43]
[t] [ta = 0,7009] [tb2 = 5,5941] [tb3 = 5,1205] [tb4 = 2,0791] [tb5 = 2,4627]

a…estimateur de α
bj …estimateur de β j j ε [2,5]

Où: - Yi …variable dépendante, nombre d’accidents,


- X ji …variables indépendantes,
- X 2i …population du département,
- X 3i …part d’urbanisation du département,
- X 4i …part de 2x2 voies dans le département,
- X 5i …part des hommes de 15-24 dans la population totale

N.B. Les résultats sont obtenus par EViews.

1. Test F

Hypothèse jointe: H0 : β2 = β3 = β4 = β5 = 0

Fstat = 69,81357
Fthéorique = F 1-s (k ; N-(k+1))

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

= F 1-0,05 (4 ; 43-(4+1))
= F0,95 (4 ; 38) = 2,61

où: k…nombre de variables explicatives


N…nombre d’observations
(k+1)…nombre de variables explicatives + la constante

Fstat > F0,95 (5 ; 38) H0 : β2 = β3 = β4 = β5 = 0


H0 va être rejetée
Si H0 est rejetée, alors on peut trouver dans le modèle testé au moins une variable explicative
statistiquement significative.

2. Test t (test bilatéral)

► β 2 ~ N (E(b2 ), σb2)
E(b2 ) = β2
(b2 - β2) / σb2 ~ N (0, 1)
(b2 - β2) / ^σb2 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β2 = 0.

H0 : β2 = 0 contre H1 : β2 ≠ 0

tstat = | b2 / ^σb2 | = 6,5941


tthéorique = ts (N-(k+1))
= t0,05 (43-(4+1))
= t0,05 (38) = 2,042

tstat > t0,05 (38) H0 : β2 = 0


H0 va être rejetée
Si H0 est rejetée, la variable explicative X2 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

► β 3 ~ N (E(b3), σb3)
E(b3 ) = β3
(b3 – β3) / σb3 ~ N (0, 1)
(b3 – β3) / ^σb3 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β3 = 0.

H0 : β3 = 0 contre H1 : β3 ≠ 0

tstat = | b3 / ^σb3 | = 5,1605

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

tthéorique = ts (N-(k+1))
= t0,05 (43-(4+1))
= t0,05 (38) = 2,042

tstat > t0,05 (38) H0 : β3 = 0


H0 va être rejetée
Si H0 est rejetée, la variable explicative X3 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

► β 4 ~ N (E(b4 ), σb4)
E(b4 ) = β4
(b4 – β4) / σb4 ~ N (0, 1)
(b4 – β4) / ^σb4 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β4 = 0.

H0 : β4 = 0 contre H1 : β4 ≠ 0

tstat = | b4 / ^σb4 | = 2,0791


tthéorique = ts (N-(k+1))
= t0,05 (43-(4+1))
= t0,05 (45) = 2,042

tstat > t0,05 (45) H0 : β4 = 0


H0 va être rejetée
Si H0 est rejetée, la variable explicative X4 est considérée comme statistiquement
significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

► β 5 ~ N (E(b5 ), σb5)
E(b5 ) = β5
(b5 – β5) / σb5 ~ N (0, 1)
(b5 – β5) / ^σb5 ~ t (N-k+1)

On teste l’hypothèse H0 selon laquelle β5 = 0.

H0 : β5 = 0 contre H1 : β5 ≠ 0

tstat = | b5 / ^σb5 | = 2,4627


tthéorique = ts (N-(k+1))
= t0,05 (43-(4+1))
= t0,05 (38) = 2,042

tstat > t0,05 (45) H0 : β5 = 0


H0 va être rejetée.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

Si H0 est rejetée, la variable explicative X5 est considérée comme statistiquement


significative. Elle peut donc expliquer les comportements de la variable dépendante Yi .

Après avoir effectué le test t sur chaque variable explicative dans notre modèle, on constate,
que les quatre variables sont statistiquement significative. Cependant, il faut noter que la
transformation logarithmique a écarté 6 observations du fait qu’elles ont un X4 égal à zéro.

6
1.0
5
0.5
4
0.0

-0.5

-1.0
5 10 15 20 25 30 35 40 45 50

Residual Actual Fitted

3. Comparaison entre les 3 estimations.

Après avoir « fait tourné » le modèle trois fois, on peut supposer qu’il peut être utiliser
avec les quatre variables explicatives pour faire des prévisions puisque le R-squared est a
chaque fois compris entre 0,83 et 0,88 et qu’au moins trois variable sur quatre sont
significative tout le temps.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

E. Prévisions

Nous effectuons la prévisions pour la variable explicative X2 , la population du


département, et concernant le département de la Manche (51ème observation).

1. Modèle théorique.

Yi = α + β2 X 2i + εi i ε [1,N]
Yi = α + β2 X 2i + εi i ε [1,50]

Où: - Yi…variable dépendante, nombre d’accidents corporels


X 2i …variable indépendante, population du département
α …paramètre du modèle
β2 …paramètre du modèle
εi …variable aléatoire, terme d’erreur, élément perturbateur
▪ E[εi / X ji ] = 0 pour tout i ε [1,48] et j ε [2,6]
▪ V[εi / X ji ] = E[εi ²] = σ² pour tout i ε [1,48] et j ε [2,6]
▪ Cov[ εi εi‘] = E[ εi εi‘] = 0 pour tout i ε [1,48] et i≠ i‘
▪ Cov[ εi X ji ] = E[(εi - E[εi]) (X ji - E[X ji])] = 0 pour tout i ε [1,48] et j ε [2,6]
▪ εi~ N (0, σ²)

2. Estimation par MCO

Ŷi = a + b2 X 2i i ε [1,50]
ei = Yi - ^ Yi

a……estimateur de α
b2 ….estimateur de β2
ei……estimateur d’εi

Où: - X 2i … la population du département (en millier).

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

Dependent Variable: Y
Method: Least Squares
Date: 01/14/06 Time: 12:48
Sample: 1 50
Included observations: 50
Variable Coefficient Std. Error t-Statistic Prob.
C -317.8957 109.9507 -2.891258 0.0057
X2 2.148455 0.181313 11.84945 0.0000
R-squared 0.745236 Mean dependent var 735.3200
Adjusted R-squared 0.739928 S.D. dependent var 897.4098
S.E. of regression 457.6542 Akaike info criterion 15.12928
Sum squared resid 10053474 Schwarz criterion 15.20576
Log likelihood -376.2321 F-statistic 140.4095
Durbin-Watson stat 1.910418 Prob(F-statistic) 0.000000

3. Estimation ponctuelle

Erreur de prévision:

Ŷθ - Yθ = (a - α ) + (b2 - β2) Xθ - εθ
E[(Ŷθ - Yθ)] = 0
V[[(Ŷθ - Yθ)] = σ² (1 + 1/N + (Xθ - X¯)² / Sxx)

▪ a = -317,8957
▪ b2 = 2,148455
▪ Xθ = 481
▪ X¯= 490,22
▪ σ² = 457,6542
▪ N = 50
▪ Sxx = ∑Ni=1 (Xi - X¯)² = 6 371 164,58

Application numérique :

V[(Ŷθ - Yθ)] = 457,6542 (1 + 1/50 + (481 - 490,22)² / 6371164,58)


V[(Ŷθ - Yθ)] = 466,81

σ(^yθ – yθ) = 21,61

Ŷθ = a + b2 Xθ
Ŷθ = -317,8957 + 2,148455 * 481 = 715,51

Région d’acceptation:[Ŷθ ± ts ^σ(^yθ – yθ)]

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

Avec : tthéorique = ts (N-(k+1)) = 2,042

Intervalle de confiance :

Prob [715,51 + 2,042 * 21,61 ; 715,51 - 2,042 * 21,61] = 0,95

[715,51 ± 44,12]
[671.39 ; 759.63]

On constate que le département de la Manche a connu 697 accidents corporels en


2004. Ce nombre appartient à l’intervalle de confiance. La relation théorique peut donc être
considérée comme valide pour la période de θ.

Conclusion.

Notre modèle parait à priori bien expliquer les variation de notre variable expliquée,
mais les types de corrélation vont a l encontre de nos premières intuitions. En effet, la part des
15-24 ans dans la population et le poids des 2*2 voies dans les parcours de chaque
département sont significatifs mais corrélés négativement avec le nombre d’accidents
corporels. Nous devons alors remettre en cause soit nos données, soit les spécifications du
modèle. On peut schématiser le principe :

Phénomène méritant une étude

Echantillonage

Statistiques
-Nouvelles
spécifications

-Nouvelles
Infirmation données

-Redéfinition
Méthode
des variables
économétrique

Confirmation
Les variables plus générales relatives à la population et au taux d’urbanisation sont
elles aussi significatives mais corrélées comme nous l’avions supposé.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)


lOMoARcPSD|8154023

On peut dons conclure que l’approche d’une étude des accidents de la route n’est pas
aisée car le nombres de déterminants de l’accident est très élevé et très souvent ces variable
sont corrélées entre elles, d’où la difficulté à résumer le phénomène a seulement quatre
variables explicative. A posteriori une étude du type suivant aurai été intéressante a mener :

Liste de facteurs (non exhaustif) jouant sur la fréquence des accidents

 indépendants du temps
o utiliser un véhicule qui peut rouler beaucoup plus vite que les vitesses
autorisées
o circuler sur une route peu lisible dont l'aspect incite à rouler à une vitesse
supérieure à celle pour laquelle elle a été conçue
o transgresser facilement les règles de la circulation
 intervenant à l'échelle de l'année
o l'ancienneté du permis de conduire récent
o parcourir peu de kilomètres chaque année
 intervenant à l'échelle du trajet (heures)
o ne pas avoir suffisamment dormi
o avoir consommé une quantité d'alcool excessive
o avoir consommé des produits psycho-actifs (certains médicaments, drogues)
o ne pas avoir attaché sa ceinture ou mis son casque
 intervenant à l'échelle de la minute (pré-accident)
o être en excès de vitesse par rapport à la limite légale du lieu
o ne pas avoir identifié un facteur de risque routier (virage serré, sol glissant,
chaussée altérée)
o faire une manoeuvre qui réduit les capacités de conduite (téléphoner)
 intervenant à l'échelle de la seconde
o quitter trop longtemps du regard la voiture qui vous précède ou la chaussée (se
tourner pour regarder des enfants à l'arrière du véhicule, se laisser distraire par
un événement, par exemple un accident dans l'autre sens sur une autoroute, un
animal, etc.)
o effectuer une manoeuvre sans s'être assuré de pouvoir l'effectuer sans risque
(changer de file pour un dépassement ou un changement de direction)

http://www.securite-routiere.org/Connaitre/accidentologie.htm

Ce genre d’étude oblige à utiliser des donnés en panel voir en cohorte et est bien sur
bien plus compliqué à mener.

Bibliographie.

http://www.securite-routiere.org/Connaitre/accidentologie.htm
http://www.securitéroutière.gouv.fr
http://www.insee.fr.

Downloaded by Pierrot Kadanga (pikadanga@gmail.com)

Vous aimerez peut-être aussi