Académique Documents
Professionnel Documents
Culture Documents
Distribution D’Echantillonnage
Introduction
L'inférence statistique consiste à porter les
conclusions sur l’ensemble d’une population à
partir d’observations réalisées sur un échantillon
unique tiré de celle-ci.
Les caractéristiques de l'échantillon, reflètent
avec une certaine marge d’erreur possible les
paramètres de la population.
Pour pouvoir estimer ces paramètres on doit
d’abord comprendre la distribution
d’échantillonnage
1
Inférence statistique
2
Un paramètre de la population est un nombre calculé à
partir de la population entière.
Processus d’échantillonnage
Définir l’univers
Cadre d’échantillonnage
Méthodes d’échantillonnage
Procédure de sélection
Taille de l’échantillon
Travail de terrain
3
Echantillonnage aléatoire simple
Chaque individu de la population a la même
probabilité d’être inclus dans l’échantillon
Base d’échantillonnage : liste pré-établie des
individus
– Liste des conducteurs
– Liste des foyers
– Liste des abonnés au téléphone …
Procéder à un tirage au sort des individus dans la
base :
Programme informatique
Tables de nombre au hasard
DISTRIBUTION D’ECHANTILLONNAGE
D’UNE PROPORTION
4
Si, sur une population (finie ou infinie), une
proportion p d'individus possède une certaine
propriété, le tirage au hasard d'un individu i de cette
population permet de définir une variable aléatoire
de Bernoulli Xi .
Si on refait le tirage n fois, on observe la
réalisation de X1 , X2 , ... , Xn, variables aléatoires
indépendantes.
Étudier le tirage de n individus avec cette
propriété revient à étudier X1 + X2 + ... + Xn
Qui suit la loi binomiale B(n, p).
Nous en fait, on s’intéresse à La proportion
d’individus avec cette propriété et c’est la variable
aléatoire : X 1 X 2 ....... X n
F
n
5
Si n est grand, F suit à peu près une loi normale
p (1 p )
N p,
n
Dans la pratique, l'approximation de la loi de F par
une loi normale est correcte dès que
n p≥10, n(1-p) ≥ 10 et n>30.
Si le tirage est exhaustif (sans remise) dans une
population de N individus, les formules de E ( F ) est la
mêmes mais la variance change car les variables
X1 , X2 , ... , Xn ne sont plus indépendantes:
N n p(1 p)
V (F ) .
N 1 n
N n
ce coefficient est appelé coefficient correcteur.
N 1
En résumé:
E (F ) p pour une population finie ou infinie.
6
Exemple :
Selon une étude sur le comportement du
consommateur, 25 consommateurs sur 100 sont
influencés par la marque de commerce lors de
l’achat d’un bien. Si le responsable du service de
promotion d’un grand magasin dans une région
interroge 100 consommateurs choisis au hasard afin
de connaitre leur comportement sur ce sujet, quelle
est la probabilité pour qu’au moins 35 d’entre eux
se déclarent influencés par la marque de commerce?
Exemple:
7
DISTRIBUTION D’ÉCHANTILLONNAGE
D’UNE MOYENNE
Soit une population donnée de taille N de caractère donné
X qui possède une distribution qui lui est propre, une
moyenne µ et une variance σ² .
Un échantillon prélevé dans cette population peut
apparaître de différentes façons.
On choisit au hasard un échantillon de taille n on notera ses
valeurs (x1, x2,……, xn), sont des valeurs prises au hasard
par la variable X.
L’ensemble des différents échantillons possibles de taille n
est dit « échantillon aléatoire » et noté (X1, X2,…..Xn).
X1: la variable représentant toutes les valeurs prises par la 1ère
unité statistique de chaque échantillon, à savoir toutes les
valeurs possibles pour x1 ……
Xn: la variable représentant toutes les valeurs prises par la
nème unité statistique de chaque échantillon, à savoir toutes
les valeurs possibles pour xn
On constate que X1, X2,…..Xn sont en fait des copies de X.
2
normale de paramètres ( , )
n
8
Etude de la moyenne d’échantillonnage
X1, X2,…..Xn sont identiquement distribuées puisqu’elles
sont des répliques de la variable X.
X1, X2,…..Xn sont indépendantes puisque les échantillons
sont formés avec remise.
Si X suit une loi normale alors ∑Xi est normalement
X i
distribuée et de même pour X i .
n
Si X suit une loi quelconque et n assez grand (n≥30), en
vertu du théorème centrale limite la variable ∑Xi suit
approximativement la loi normale et de même pour
X
i
i
X
n
9
Applications
La consommation d’essence (en l/100km) d’un certain
modèle d’automobile obéit à la loi N(9, 0,5625). Quelle est
la probabilité lorsqu’on tire un échantillon de 20 voitures
de ce type d’obtenir une consommation moyenne
inférieure à 8,5 l/100 km?
Pour un autre type d’automobiles, la consommation
d’essence en moyenne est de 10 l/100 km et d’écart type
égale à 0,7. Quelle est la probabilité lorsqu’on tire un
échantillon de 35 voitures de ce type d’obtenir une
consommation moyenne inférieure à 9 l/100 km?
2 1 n 2
E (S ) E X i2 X
n i1
1 n 2
E ( X i2 ) E (X )
n i 1
Or Var ( X ) E ( X ²) ( E ( X ))²
10
Donc 1 ²
n( ² ²) ( ²)
E ( S ²)
n n
n 1
²
n
n 1
1 donc E (S ²) ²
n
C'est-à-dire qu'en moyenne, la variance dans l'échantillon est
plus faible que dans la population-mère.
Si X suit une loi normale
on montre que (nS ²) / ² , suit la même loi de probabilité
que la somme des carrés de ( n - 1 ) variables aléatoires
indépendantes de loi N ( 0 ; 1 ).
V ( S 2 ) dépend de n au dénominateur.
11
Exemple
• Le poids des produits d’une marque d’ électroménager
suit une loi normale N (75 ; 5 ).
La charge maximale permise pour une commande est
400 kg. On veut transporter 5 unités des produits de
cette marque, quelle est la probabilité que la variance
dépasse 55?
12