Vous êtes sur la page 1sur 41

Fluctuations de l’échantillonnage

L’échantillonnage
&
Ses Fluctuations

Pr. A. SOULAYMANI Cours Statistique 2007 1


Fluctuations de l’échantillonnage

Généralités
Supposons une population infiniment grande sur
laquelle on veut évaluer la fréquence ou la
proportion d’un caractère.
Recensement Echantillonnage

Une partie
Tous les sujets des sujets de
de la la population
population sont sont «
« examinés » examinés »
Population
Pr. A. SOULAYMANI Cours Statistique 2007 2
Fluctuations de l’échantillonnage

• Recensement = vérité
• l’information que l’on désire est
disponible pour tous les individus de la
population étudiée.

• Échantillon = estimation de la vérité


• l’information n’est disponible que pour
un sous-ensemble des individus de la
population étudiée.

Pr. A. SOULAYMANI Cours Statistique 2007 3


Fluctuations de l’échantillonnage

I- L’échantillon

Pr. A. SOULAYMANI Cours Statistique 2007 4


Fluctuations de l’échantillonnage
En général,
on procède à ce qu’on appelle échantillonnage.
L’échantillon est donc un groupe restreint de la
population dont il est issu.
Pop Plusieurs échantillons peuvent
être constitués

L’échantillon en lui-même
n’est pas intéressant,

ce sont les conclusions sur la population que l’on peut


tirer de son observation qui en font l’intérêt : Inférence.
Pr. A. SOULAYMANI Cours Statistique 2007 5
Fluctuations de l’échantillonnage

Cet échantillon est dit non représentatif si au cours


du tirage, on procède à un choix préalable ou à une
sélection.
Pop

Echantillon non représentatif

Il s’agit là, d’un tirage non


aléatoire ou biaisé.
Les conclusions sur la population ne peuvent pas être
tirer de l’observation de tels échantillons.
Pr. A. SOULAYMANI Cours Statistique 2007 6
Fluctuations de l’échantillonnage

Pour que l’échantillon soit représentatif, il faut que


tous les individus de la population aient la même
chance d’être tirés.
Ceci peut être obtenu par un
brassage adéquat et
convenable des individus et
permet de tirer véritablement
au hasard un échantillon
représentatif.

Tirage Aléatoire

Pr. A. SOULAYMANI Cours Statistique 2007 7


Fluctuations de l’échantillonnage

En définitif, un échantillon représentatif est un


échantillon issu de façon
parfaitement aléatoire, non conditionné par un
choix préalable ou sélection.
Tirage parfaitement
au hasard

Pr. A. SOULAYMANI Cours Statistique 2007 8


Fluctuations de l’échantillonnage

• Un échantillon a pour but de représenter


la population, donc être représentatif.

• En quelque sorte, l’échantillon est un


modèle pour la population.
• Il n’est pas possible de déterminer si un
échantillon est représentatif ou non.
• Un bon plan d’échantillonnage peut
cependant contribuer à éliminer des
échantillons non représentatifs.
Pr. A. SOULAYMANI Cours Statistique 2007 9
Fluctuations de l’échantillonnage

Étapes à suivre
Plans d’échantillonnage statistique
• Déterminer l’objectif de l’échantillonnage
• Déterminer la condition recherchée
• Définir la population à vérifier
• Déterminer la taille de l’échantillonnage
• Sélectionner les échantillons
• Effectuer les tests et évaluer les résultats
• Analyser les erreurs projetées

Pr. A. SOULAYMANI Cours Statistique 2007 10


Fluctuations de l’échantillonnage

II- Le Pari

Pr. A. SOULAYMANI Cours Statistique 2007 11


Fluctuations de l’échantillonnage

Considérons une population où la proportion théorique


d’un caractère donné est pth (p théorique).

Population Échantillon

Tirage parfaitement
au hasard

Pobservée.
Pthéorique

Pr. A. SOULAYMANI Cours Statistique 2007 12


Fluctuations de l’échantillonnage

La proportion observée du caractère (sa fréquence) au


niveau de l’échantillon Pobs n’est pas obligatoirement
identique à la proportion théorique au niveau de la
population dont il est issu, même si l’échantillon est
représentatif.
Population
Échantillon
Tirage parfaitement
Elle peut prendre toutes
les valeurs possibles
au hasard comprise entre 0 et 1.
Pobservée.
Pthéorique
C’est les fluctuations de l’échantillonnage
Pr. A. SOULAYMANI Cours Statistique 2007 13
Fluctuations de l’échantillonnage
Exemple de Pari
Considérons une population où la proportion théorique
d’un caractère donné est pth = 0,50 (p théorique).
Tirage parfaitement au hasard

Population

p théorique = 050 Échantillon

p observée

En générale pobs fluctue autour de pth et on peut


calculer la probabilité pour que pobs sorte d’une
certaine marge entourant pth.
Pr. A. SOULAYMANI Cours Statistique 2007 14
Fluctuations de l’échantillonnage

on peut parier que la fréquence au niveau d’un


échantillon tiré au hasard de cette population sera
comprise entre 40% et 60% (0.40 ≤ pobs .≤ 0.60).
Une question s’impose à ce niveau et peut être poser
de deux façons différentes mais complémentaires:
- Qu’elle est la probabilité pour que notre pari
soit juste ? (p ?)
- Quel est le risque qu’on a pris en choisissant
cet intervalle [0.40-0.60] ? (a ?)

a et p présente la relation a = 1 – p et p = 1 - a.
Pr. A. SOULAYMANI Cours Statistique 2007 15
Fluctuations de l’échantillonnage
Intervalle de pari
L’intervalle de pari est défini par un écart e autour de
pth.. Ainsi, l’intervalle 40 à 60% autour de 50% est
défini par e = 10%.
Pth.

0 0,40 0,50 0,60 1

La table de l’écart réduit ( loi normale) ne peut être


utilisée directement pour évaluer le risque du pari ; de
ce fait, l’écart e est transformé en écart réduit e appelé
écart réduit observé ou calculé tel que :
Pr. A. SOULAYMANI Cours Statistique 2007 16
Fluctuations de l’échantillonnage

e e pObs.  pTh.
e Obs.   
 pth(1  pth) pth(1  pth)
N N

Dans l’exemple précédant, en supposant que l’effectif


de l’échantillon est de 100, on aura :

e 0.10 0.10
  2
 0.50 x0.50 0.05
100
Pr. A. SOULAYMANI Cours Statistique 2007 17
Fluctuations de l’échantillonnage

La table de l’écart réduit donne pour tout écart observé


le risque a qui lui est associé.
Pour la valeur de 2 de notre exemple, il n’y a pas de
correspondance directe mais on peut remarquer que
notre valeur est comprise entre deux risque :
eth = 1,96 < eos. = 2 < eth = 2,054

Pr. A. SOULAYMANI Cours Statistique 2007 18


Fluctuations de l’échantillonnage

Sans chercher à
eth=1,96 < eobs.=2 < eth=2,054 interpoler,on
prendra toujours la
valeur la
plus proche de 2 qui
correspond
dans ce cas à a =
5% et p = 95%.
Donc, lorsqu’on a parié sur l’intervalle 40%-60%
sur un échantillon de 100 tiré d’une population
pour laquelle la fréquence théorique est de 50%,
on a 5% de chance de se tromper contre une
probabilité de 95% de tomber sur cet intervalle par
Pr. A. SOULAYMANI Cours Statistique 2007 19
tirage au hasard.
Fluctuations de l’échantillonnage

En conclusion, lorsqu’on a parié sur l’intervalle 40%-


60% sur un échantillon de 100 tiré d’une population
pour laquelle la fréquence théorique est de 50%, on
a 5% de chance de se tromper contre une probabilité
de 95% de tomber sur cet intervalle par tirage au
hasard.

Remarque : La table de l’écart réduit ne peut être


utilisée que si l’échantillon est « grand ». Pour le
calcul; on considère que l’échantillon est
« grand » si et seulement si Np ≥ 5 et N(1-p) ≥ 5.

Pr. A. SOULAYMANI Cours Statistique 2007 20


Fluctuations de l’échantillonnage

III- Loi des Grands


Nombres

Pr. A. SOULAYMANI Cours Statistique 2007 21


Fluctuations de l’échantillonnage

Avec une urne présentant une fréquence pth.= 50% ;


on se propose d’estimer le risque d’erreur pour un
même intervalle de pari [0.40-0.60] mais pour des
effectifs différents (N1=16 ; N2=100 et N3=400).
pth.(1  pth.) p p
N  e e 
obs
obs

p (1  p )
th
a
N th th

16 0,125 0,10 0,80 0,47

100 0,05 0,10 2 0,05

400 0,025 0,10 4 <0,001


Pr. A. SOULAYMANI Cours Statistique 2007 22
Fluctuations de l’échantillonnage

Ainsi, pour le même écart absolu (10%), on prend


beaucoup plus de risques avec des petits
échantillons.

Donc, l’écart entre la composition de


l’échantillon et celle de la population a d’autant
moins de chance d’être dépassé lorsque la taille
de l’échantillon est grande.

c’est la loi des grands nombre

Pr. A. SOULAYMANI Cours Statistique 2007 23


Fluctuations de l’échantillonnage

IV- Manipulation sur


les fréquences

Pr. A. SOULAYMANI Cours Statistique 2007 24


Fluctuations de l’échantillonnage

1- Position du problème :

Soit P une population d’effectif infini pour laquelle la


fréquence d’un caractère est p théorique (fréquence des
boules noires à titre d’exemple). Cette fréquence peut
être connue ou non.

On dispose d’un échantillon E1 d’effectif N1, où la


fréquence du même caractère est Pobs1 ,d’un second
E2 d’effectif N2 où la fréquence observée est pobs2 et
d’un troisième échantillon E3 d’effectif N3 où la
fréquence observée est pobs3.

Pr. A. SOULAYMANI Cours Statistique 2007 25


Fluctuations de l’échantillonnage

Pop
Tirage aléatoire ou non

E1 E3
E2

N1 N2 N3

Pth. Po1 Po2 Po3


Inconnue Connue

Pr. A. SOULAYMANI Cours Statistique 2007 26


Premier sous problème : Fluctuations de l’échantillonnage
Il s’agit là de la comparaison d’une fréquence
observée à une fréquence théorique.
Pop Tirage aléatoire ou non

Ne

Pth. ??????? Po
Pr. A. SOULAYMANI
Connue Cours Statistique 2007 27
Fluctuations de l’échantillonnage

Deuxième sous problème


Il s’agit là de l’estimation d’une fréquence
théorique à partir d’une fréquence observée.

Pop Tirage aléatoire

E3

Ne

Po
Pth. Inconnue Estimation

Pr. A. SOULAYMANI Cours Statistique 2007 28


Fluctuations de l’échantillonnage
Troisième sous problème
Il s’agit là de la comparaison de deux fréquences
observées.
Pop Tirage aléatoire ou non

E1 E2

N1 N2

Po1 Po2
Pth.
Inconnue Connue
Pr. A. SOULAYMANI Cours Statistique 2007 29
Fluctuations de l’échantillonnage
2-Comparaison d’une fréquence observée à une
fréquence théorique : Test de conformité
Pop Tirage aléatoire L’écart absolu
ou non E entre la fréquence
observée
Ne et la fréquence
théorique est :
Pth.
Connue
??????? Po e Pth.Pobs.
Hypothèse nulle H0, l’écart n’est pas significatif
(pth. pobs.).
Hypothèse alternative H1, l’écart est significatif
Pr. A. SOULAYMANI
(pCours pobs.2007).
th.#Statistique 30
Fluctuations de l’échantillonnage

En pratique

on calcul l’écart réduit


pth.  Pobs e
e  a
pth.(1  pth.) 
N
La valeur de l’écart réduit calculé eobs est
confrontée à La valeur de l’écart réduit
théorique la table théorique au seuil de 5% (a)
Pr. A. SOULAYMANI Cours Statistique 2007 31
Fluctuations de l’échantillonnage

pth.  Pobs e
e  a
pth.(1  pth.) 
N
- Si l’écart réduit calculé est inférieur ou égal à 1.96 : la
différence n’est pas significative (H0).
- Si l’écart réduit calculé est supérieur à 1.96 mais reste
inférieur ou égal à 2.58 :la différence est significative (H1).
- Si l’écart réduit calculé est supérieur à 2.58 mais reste
inférieur ou égal à 3.29 :la différence est très significative (H1

- Si l’écart réduit calculé est supérieur à 3.29: la différence


estPr.hautement
A. SOULAYMANI
significative (H1). 2007
Cours Statistique 32
Fluctuations de l’échantillonnage

3. Estimation de la fréquence théorique :


Intervalle de confiance d’une fréquence :
Pop Tirage aléatoire
E3

Ne

Po
Estimation
Pth. Inconnue
On suppose que pobs. est la fréquence d’un caractère
déterminé dans un Échantillon d’effectif N issu d’une
population de manière parfaitement au hasard d’une
population d’effectif infini, et où la fréquence du même
caractère n’est pas connue.
Pr. A. SOULAYMANI Cours Statistique 2007 33
Fluctuations de l’échantillonnage

Afin de pouvoir estimer l’intervalle de confiance de


la fréquence du caractère
au niveau de la population, on pose

P . P
e  obs th .

obs
p (1  p )
obs obs .

N
Pr. A. SOULAYMANI Cours Statistique 2007 34
P . P
Fluctuations de l’échantillonnage

e  obs th .

obs
p (1  p )
obs obs .

N
Si l’hypothèse nulle est retenue, ceci signifie
qu’avec une probabilité p = 95% (a = 5%), on a :

P P obs
 1,96
th

p (1  p )
obs obs

N
p (1  p ) p (1  p )
Pobs.  1,96 obs
 pth  pobs.  1,96
obs obs obs

Pr. A. SOULAYMANI N Cours Statistique 2007 N 35


Fluctuations de l’échantillonnage

p (1  p ) p (1  p )
Pobs.  1,96  pth  pobs.  1,96
obs obs obs obs

N N

0 1
pobs

p (1  p ) p (1  p )
P  1,96
obs
obs obs
P  1,96 obs obs

N obs
N
Pr. A. SOULAYMANI Cours Statistique 2007 36
Fluctuations de l’échantillonnage
4- Comparaison de 2 fréquences observées :
Test d’homogénéité :

Tirage aléatoire ou non

E1 E2

N1 N2

Po1 Po2
Pth.
Inconnue Connue

Pr. A. SOULAYMANI Cours Statistique 2007 37


Fluctuations de l’échantillonnage

- H0 : ou hypothèse nulle selon laquelle les


fréquences observées au niveau de 2 ou plusieurs
échantillons sont identiques.

- H1 : ou hypothèse alternative selon laquelle


au moins deux des fréquences observées au
niveaux des échantillons différents
significativement. Dans ce cas, au moins un des
échantillons est biaisé si les échantillons sont
issus de la même population ou encore les
différents échantillons confrontés sont issus de
populations différentes.

Pr. A. SOULAYMANI Cours Statistique 2007 38


Fluctuations de l’échantillonnage

En pratique, pour tester l’Hypothèse nulle, on


calcul l’écart réduit de la différence :
pp
e  1 2

1 1
obs

p (1  p )   
N N 
th th

1 2

Si pth n’est pas connue au niveau de la population;


on l’estime à partir des deux fréquences observées
de sorte que :
N p N p
p  1 1 2 2

N N
théorique

1 2

Pr. A. SOULAYMANI Cours Statistique 2007 39


Fluctuations de l’échantillonnage

pp
e  1 2

1 1
obs

p (1  p )   
N N 
th th

1 2

- Si l’écart réduit calculé est inférieur ou égal à 1.96 : la


différence n’est pas significative (H0).
- Si l’écart réduit calculé est supérieur à 1.96 mais reste
inférieur ou égal à 2.58 :la différence est significative (H1).
- Si l’écart réduit calculé est supérieur à 2.58 mais reste
inférieur ou égal à 3.29 :la différence est très significative (H1

- Si l’écart réduit calculé est supérieur à 3.29: la différence


estPr.hautement
A. SOULAYMANI
significative (H1). 2007
Cours Statistique 40
Fluctuations de l’échantillonnage

Pr. A. SOULAYMANI Cours Statistique 2007 41

Vous aimerez peut-être aussi