Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Chapitre 1 : L’ÉCHANTILLONNAGE
1.1 Introduction
1.2 L’échantillonnage aléatoire
1.3 Estimation ponctuelle
1.4 Distributions d’échantillonnage
1.5 Intervalles de probabilité
Chapitre 1
L’échantillonnage 1 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1 : L’ÉCHANTILLONNAGE
1.1 Introduction
1.2 L’échantillonnage aléatoire
1.3 Estimation ponctuelle
1.4 Distributions d’échantillonnage
1.5 Intervalles de probabilité
Chapitre 1
L’échantillonnage 2 / 41
Statistique II
1e année bachelor, 2010-11
Définitions
En général, l’inférence est définie comme une opération
mentale qui consiste à tirer une conclusion d’une série de
propositions reconnues pour vraies. Ces conclusions sont tirées
à partir de règles de base.
L’inférence statistique est définie comme le processus
d’utilisation des données d’un échantillon pour estimer ou tester
des hypothèses sur les caractéristiques numériques
(« paramètres ») d’une population.
Une population (ou « population mère ») est définie comme
l’ensemble de tous les éléments d’intérêt dans une étude
particulière.
Un échantillon est défini comme un sous-ensemble de la
population.
Chapitre 1
L’échantillonnage 3 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1 : L’ÉCHANTILLONNAGE
1.1 Introduction
1.2 L’échantillonnage aléatoire
1.3 Estimation ponctuelle
1.4 Distributions d’échantillonnage
1.5 Intervalles de probabilité
Chapitre 1
L’échantillonnage 6 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1 : L’ÉCHANTILLONNAGE
1.1 Introduction
1.2 L’échantillonnage aléatoire
1.3 Estimation ponctuelle
1.4 Distributions d’échantillonnage
1.5 Intervalles de probabilité
Chapitre 1
L’échantillonnage 10 / 41
Statistique II
1e année bachelor, 2010-11
Bases
Chapitre 1
L’échantillonnage 11 / 41
Statistique II
1e année bachelor, 2010-11
ind. revenu participation revenu participation
1 49094.3 1 Somme 1554420 19
Exemple 2
3
53263.9
49643.5
1
1
Moyenne
Ecart type
51814
3347.7
0.63
0.49
4 49894.9 1
Statville (1) 5
6
47621.6
55924.0
0
1
7 49092.3 1
8 51404.4 1
Échantillon aléatoire 9 50957.7 1
10 55109.7 1
de 30 individus 11 45922.6 1
12 57268.4 0
13 55688.8 1
14 51564.7 0
15 56188.2 0
16 51766.0 1
17 52541.3 0
18 44980.0 1
19 51932.6 1
20 52973.0 1
21 45120.9 1
22 51753.0 1
23 54391.8 0
24 50164.2 0
25 52973.6 0
26 50241.3 0
27 52793.9 0
28 50979.4 1
29 55860.9 1
30 57309.1 0
Chapitre 1
L’échantillonnage 12 / 41
Statistique II
1e année bachelor, 2010-11
x revenui 1554420
51814 51800
n 30
Revenu : écart type de l’échantillon
s ( revenu i -x )2
325009260
3348 4000
n -1 29
Participation : moyenne de l’échantillon
p participationi 19
0.63 p 0.60
n 30
Les estimations ponctuelles ne correspondent pas exactement
aux paramètres de la population que faire ?
Chapitre 1
L’échantillonnage 13 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1 : L’ÉCHANTILLONNAGE
1.1 Introduction
1.2 L’échantillonnage aléatoire
1.3 Estimation ponctuelle
1.4 Distributions d’échantillonnage
1.5 Intervalles de probabilité
Chapitre 1
L’échantillonnage 14 / 41
Statistique II
1e année bachelor, 2010-11
Bases
Idée de départ : répéter la sélection d’un échantillon multiples
fois et étudier comment se comportent les statistiques de
l’échantillon par rapport aux paramètres correspondants de la
population
→ En moyenne, la statistique de l’échantillon a-t-elle tendance
à être proche du paramètre « vrai » correspondant, ou y a-t-
il une divergence systématique (c.à.d. un « biais ») ?
Distribution d’échantillonnage = distribution de probabilité de
toutes les valeurs possibles d’une statistique de l’échantillon
→ Puisque la sélection d’échantillons suit un processus
aléatoire, les statistiques de l’échantillon sont elles-aussi
des variables aléatoires et suivent donc un distribution de
probabilité
Chapitre 1
L’échantillonnage 15 / 41
Statistique II
1e année bachelor, 2010-11
fréquence relative
0.25
des valeurs de x
obtenues à partir 0.2
fréquence relative
des 500
échantillons 0.15
Approximation 0.1
empirique de la
distribution 0.05
d’échantillonnage
de x ! 0
49500- 50000- 50500- 51000- 51500- 52000- 52500- 53000- 53500-
49999 50499 50999 51499 51999 52499 52999 53499 53999
Chapitre 1
L’échantillonnage 19 / 41
Statistique II
1e année bachelor, 2010-11
L’espérance
Chapitre 1
L’échantillonnage 20 / 41
Statistique II
1e année bachelor, 2010-11
L’erreur type
Soit x l’écart type de la distribution d’échantillonnage de x ,
désormais dénommé « erreur type ».
N n
On peut montrer que x .
n N 1
Pour une population infinie (N ), on a x = ( n) .
N n
= « facteur de correction pour une population finie »
N 1
Règle pratique : ( n ) est une approximation satisfaisante si la
population est finie et nN 0.05.
N n
→ Statville : nN = 302500 = 0.012 0.994 1
N 1
Chapitre 1
L’échantillonnage 21 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1
L’échantillonnage 23 / 41
Statistique II
1e année bachelor, 2010-11
x
x N ( , x ) , z N (0,1) ,
x
2
x
0.5
1
où x N ( , x ) f x e x
,
x 2
1 0.5 z 2
et z N (0,1) f z e .
2
Illustration
du théorème
centrale limite (1)
Chapitre 1
L’échantillonnage 25 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1
L’échantillonnage 26 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1
L’échantillonnage 27 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1
L’échantillonnage 28 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1
L’échantillonnage 29 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1
L’échantillonnage 30 / 41
Statistique II
1e année bachelor, 2010-11
Le cas de p
Continuons à supposer qu’on ait un échantillon aléatoire simple.
L’espérance mathématique de la variable aléatoire p (moyenne
dans l’échantillon de la mesure de proportion p) est donnée par :
E( p ) = p p est un estimateur non-biaisé de p
p(1 p ) N n
L’erreur type de p est donné par : p ;
n N 1
p(1 p )
et, pour une population infinie, par : p .
n
La distribution d’échantillonnage toute entière peut être
approchée par une distribution de probabilité normale lorsque
np 5 et n(1 p ) 5 (règle pratique approximative ; basée sur la
convergenence de la loi binomiale avec la loi normale).
Chapitre 1
L’échantillonnage 31 / 41
Statistique II
1e année bachelor, 2010-11
Exemple Statville :
distribution d’échantillonnage de la moyenne
Chapitre 1
L’échantillonnage 32 / 41
Statistique II
1e année bachelor, 2010-11
Exemple Statville :
distribution d’échantillonnage d’une proportion
Chapitre 1
L’échantillonnage 33 / 41
Statistique II
1e année bachelor, 2010-11
Exemple Statville :
erreur type et taille de l’échantillon
Chapitre 1
L’échantillonnage 34 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1 : L’ÉCHANTILLONNAGE
1.1 Introduction
1.2 L’échantillonnage aléatoire
1.3 Estimation ponctuelle
1.4 Distributions d’échantillonnage
1.5 Intervalles de probabilité
Chapitre 1
L’échantillonnage 35 / 41
Statistique II
1e année bachelor, 2010-11
Base
Lorsqu’on a un échantillon, il est hautement improbable que les
statistiques de l’échantillon ( x , p ) correspondent exactement aux
paramètres de la population (, p)
Que peut-on dire sur la probabilité que la valeur d’une statistique
particulière soit « proche » du paramètre de la population, ou
« proche » signifie un écart maximum de M ?
Les distributions d’échantillonnage contiennent la réponse !
Statville :
o Quelle est la probabilité que le revenu moyen de
l’échantillon, x , soit à 500 francs près du revenu moyen de la
commune, ? (M = 500)
o Quelle est la probabilité que la proportion des participants de
l’échantillon, p , soit à 5 points de pourcentage près de la
proportion totale, p ? (M = 0.05)
Chapitre 1
L’échantillonnage 36 / 41
Statistique II
1e année bachelor, 2010-11
500 500
P ( 500 x 500 n 30) P Z P Z
730.3 730.3
Chapitre 1
L’échantillonnage 37 / 41
Statistique II
1e année bachelor, 2010-11
Moyenne : M 500, n 30
P ( 500 x 500 n 30) P ( 0.68 Z 0.68) 0.50
* *
Chapitre 1
L’échantillonnage 38 / 41
Statistique II
1e année bachelor, 2010-11
* *
Chapitre 1
L’échantillonnage 39 / 41
Statistique II
1e année bachelor, 2010-11
Proportion : M 0.05, n 30
P ( p 0.05 p p 0.05 n 30) ( 0.56 Z 0.56) 0.42
* *
Chapitre 1
L’échantillonnage 40 / 41
Statistique II
1e année bachelor, 2010-11
Chapitre 1
L’échantillonnage 41 / 41