Vous êtes sur la page 1sur 13

On suppose que les données sont relatives à une population dont on extrait deux échantillons:

1) Estimer la droite de régression des deux échantillons

2) Estimer la droite de régression de la population

3) Commenter les résultats des estimations et notamment les notions de résidus et d'aléas
Isabelle Cadoret : Echantillon et population

Source: Gujarati "Basic Econometrics" 1988, p27

Revenus des ménages (REV) et dépenses de consommations (DEP)

Ensemble des données

REV 80 100 120 140 160 180 200 220 240

55 65 79 80 102 110 120 135 137


D 60 70 84 93 107 115 136 137 145
E 65 74 90 95 110 120 140 140 155
P 70 80 94 103 116 130 144 152 165
75 85 98 108 118 135 145 157 175
88 113 125 140 160 189
115 162
total
DEP 325 462 445 707 678 750 685 1043 966

Calcul des probabilités conditionnelles et de l'espérance mathématique de la varaible DEP

0.2 0.167 0.2 0.143 0.167 0.167 0.2 0.143 0.167


0.2 0.167 0.2 0.143 0.167 0.167 0.2 0.143 0.167
0.2 0.167 0.2 0.143 0.167 0.167 0.2 0.143 0.167
0.2 0.167 0.2 0.143 0.167 0.167 0.2 0.143 0.167
0.2 0.167 0.2 0.143 0.167 0.167 0.2 0.143 0.167
0.167 0.143 0.167 0.167 0.143 0.167
0.143 0.143
E(DEP/REV) 65 77 89 101 113 125 137 149 161
REV 80 100 120 140 160 180 200 220 240

Commentaires sur le calcul des probabilités conditionnelles :


Pour REV=80 chaque observation de DEP apparaît 1 fois sur 5, la probabilité conditionnelle est donc ég
Pour REV=100 chaque observation de DEP apparaît 1 fois sur 6, la probabilité conditionnelle est donc é
Pour REV=120 chaque observation de DEP apparaît 1 fois sur 5, la probabilité conditionnelle est donc é
Pour REV=140 chaque observation de DEP apparaît 1 fois sur 7, la probabilité conditionnelle est donc é
Pour REV=160 chaque observation de DEP apparaît 1 fois sur 6, la probabilité conditionnelle est donc é
Pour REV=180 chaque observation de DEP apparaît 1 fois sur 6, la probabilité conditionnelle est donc é
Pour REV=200 chaque observation de DEP apparaît 1 fois sur 5, la probabilité conditionnelle est donc é
Pour REV=220 chaque observation de DEP apparaît 1 fois sur 7, la probabilité conditionnelle est donc é
Pour REV=240 chaque observation de DEP apparaît 1 fois sur 6, la probabilité conditionnelle est donc é
Pour REV=260 chaque observation de DEP apparaît 1 fois sur 7, la probabilité conditionnelle est donc é

1er sous-échantillon tiré de manière aléatoire

DEP 55 88 90 80 118 120 145 135 145


REV 80 100 120 140 160 180 200 220 240
2ème sous-échantillon tiré de manière aléatoire

DEP 70 65 90 95 110 115 120 140 155


REV 80 100 120 140 160 180 200 220 240
260

150
152
175
178
180
185
191

1211

0.143
0.143
0.143
0.143
0.143
0.143
0.143
173
260

bilité conditionnelle est donc égale à 1/5=0,2


abilité conditionnelle est donc égale à 1/6=0,167
abilité conditionnelle est donc égale à 1/5=0,2
abilité conditionnelle est donc égale à 1/7=0,143
abilité conditionnelle est donc égale à 1/6=0,167
abilité conditionnelle est donc égale à 1/6=0,167
abilité conditionnelle est donc égale à 1/5=0,2
abilité conditionnelle est donc égale à 1/7=0,143
abilité conditionnelle est donc égale à 1/6=0,167
abilité conditionnelle est donc égale à 1/7=0,143

175 moyenne 115.1


260 moyenne 170
160 moyenne 112
260 moyenne 170
1) Droites de régression des deux échantillons

Commentaires :
graphique 1 - droite de
Pour tracer le graphique 1 dans Insertion sélectionner Graphiques puis
Nuages de Points cliquer sur suivant dans Plage de données sélectionner la zone A16..B26 dans la feuille 200
cliquer sur suivant puis dans Titre du graphique mettre Graphique 1 - droite de régression de l'échantillon 1
dans Axe des ordonnés (X) mettre REV et dans Axe des ordonnées (Y) mettre DEP 180
cliquer sur suivant dans Insérer le graphique cocher En tant qu'objet dans regression cliquer sur FIN
Pour obtenir l'équation cliquer sur les points du graphique , une fenêtre s'ouvre dans laquelle vous 160 f(x) = 0.5760606061x + 17.1
choissisez Ajouter une courbe de tendance dans l'onglet Type choisir la première forme de représentation proposée R² = 0.9115960444
et dans l'onglet Option sélectionner Afficher l'équation sur le graphique et Afficher le coefficient de détermination dans 140
le graphique
A vous de faire les graphiques 2 et 3 120

100

DEP
Droite de régression de l'échantillon 1
REV DEP
80 55 80
100 88
120 90 60
140 80
40
160 118
180 120
20
200 145
220 135
0
240 145
50 100 150
260 175
REV

Droite de régression de l'échantillon 2 Graphique 2 180


REV DEP 160
80 70 f(x) = 0.5363636364x + 20.8181818182
140 R² = 0.9727086438
100 65
120
120 90
100
140 95
80
60
40
20
0
50 100 150 200 250
180
160
f(x) = 0.5363636364x + 20.8181818182
140 R² = 0.9727086438
120
100
80
160 110
180 115 60
200 120 40
220 140 20
240 155 0
260 160 50 100 150 200 250

2) Droite de régression de la population


200
REV E(DEP/REV) Graphique 3 180
80 65 160 f(x) = 0.6x + 17
100 77 140 R² = 1
120 89 120
140 101 100
160 113 80
180 125 60
200 137 40
220 149 20
240 161 0
260 173 50 100 150 200 250

3) Commentaires des résultats

Les droites de régression des échantillons 1 et 2 sont différentes car les observations de la variables DEP sont différentes, la valeur des paramètres correspond
à la valeur estimée avec la méthode des Moindres Carrés Ordinaires

Les coefficients obtenus avec l'échantillon 1 sont calculés de la manière suivante :

0,5761 = rapport de la covariance entre DEP et REV et la variance de REV


covariance entre DEP et REV = 1901 Dans Insertion choisir Fonctions puis Statistiques puis covariances dans matrice 1 sélectionner la p
variance de REV = 3300 Dans Insertion choisir Fonctions puis Statistiques puis VAR;P dans Nombre1 sélectionner la plage
coefficient de pente = 0.5761 =1901/3300
17,17 = la valeur moyenne de DEP - 0,5761*la valeur moyenne de REV
la valeur moyenne de DEP = 115.1 Dans Insertion choisir Fonctions puis Statistiques puis MOYENNE dans Nombre1 sélectionner la pl
la valeur moyenne de REV = 170 Dans Insertion choisir Fonctions puis Statistiques puis MOYENNE dans Nombre1 sélectionner la pl
coefficient de la constante = 17.170 =115,1-0,5761*170

Calcul du coefficient de détermination R2 - échantillon 1


Le coefficient de détermination mesure la qualité de l'ajustement il est égal au rapport entre la variance expliquée par le modèle et la variance totale des observations de la variab
il est aussi égal à 1 - le rapport entre la variance des résidus et la variance totale des observations de la variable endogène

La valeur estimée de la variable DEP = 0,5761*REV+17,17

REV DEP DEP_estimé Résidus = DEP - DEP_estimé


80 55 63.25 =0,5761*80+17,17 -8.25 = 55 - 63,25
100 88 74.78 =0,5761*100+17,17 13.22 = 88 - 74,78
120 90 86.30 =0,5761*120+17,17 3.70
140 80 97.82 =0,5761*140+17,17 -17.82
160 118 109.34 =0,5761*160+17,17 8.66
180 120 120.86 =0,5761*180+17,17 -0.86
200 145 132.38 =0,5761*200+17,17 12.62
220 135 143.90 =0,5761*220+17,17 -8.90
240 145 155.42 =0,5761*240+17,17 -10.42
260 175 166.95 =0,5761*260+17,17 8.05
Variances 1201 1095 106

Calcul des variances


Dans Insertion choisir Fonctions puis Statistiques puis VAR;P dans Nombre1 sélectionner la plage de données faire OK.

Vérification de l'équation d'anlyse de la varaince : 1201 = 1095 + 106


la variance de la variable DEP est égale à la variance de la variable DEP_estimé + la variance des résidus

Calcul du coefficient de détermination 0.9116 =1095/1201


0.9116 =1 - 106/1201
Dans un modèle de régression simple le coefficient de détermination est égal au carré du coefficient de corrélation simple entre les deux variables
Dans Insertion choisir Fonctions puis Statistiques puis Coefficient.Correlation dans Matrice 1 indiquer B85:B94 et dans Matrice 2 C85:C94 puis faire OK.
Le coefficient de détermination est égal à = 0,9548^2 0.9116

A vous de faire les mêmes calculs avec les données de l'échantillon2 et les données de la population
On note que le coefficient de détermination calculé avec les données de la population est égal à 1 car la valeur estimée des paramètres est égal à la vraie valeur des paramètres,
graphique 1 - droite de régression de l'échantillon 1

f(x) = 0.5760606061x + 17.1696969697


R² = 0.9115960444

DEP
Linear (DEP)

100 150 200 250 300

REV

5363636364x + 20.8181818182
9727086438

150 200 250 300


5363636364x + 20.8181818182
9727086438

150 200 250 300

.6x + 17

150 200 250 300

correspond

ns matrice 1 sélectionner la plage B17..B26 et dans matrice 2 A17..A26 faire OK.


mbre1 sélectionner la plage A17..A26 faire OK.
ns Nombre1 sélectionner la plage B17..B26 faire OK.
ns Nombre1 sélectionner la plage A17..A26 faire OK.

des observations de la variable endogène


0.9548

vraie valeur des paramètres, l'ajustement est donc parfait.