Echantillonage - Chapitre I-1

Master Spécialisé Procédés d’Analyse et Contrôle Qualité (PACQ)
CHAPITRE I-1
M04 : TECHNIQUES D’ECHANTILLONNAGES ET OUTILS

STATISTIQUES
Introduction
"L’échantillonnage, c’est regarder attentivement une partie d’une chose afin d’en apprendre plus sur
la chose dans son entier." Feuerstein (1969, 1983)
"L’échantillonnage est une action ou étape d’une enquête quantitative qui consiste à sélectionner les
individus que l’on souhaite interroger au sein de la population de base." J. Giannelloni, E. Vernette,
Etudes de marché.
C’est donc l’étude d’une partie de la population concernée.
-L’échantillonnage a pour but d’extrapoler les résultats obtenus sur une petite partie à la population
parente.
-Il permet de former des conclusions au sujet d’un tout en y examinant une partie et de présumer les
caractéristiques d’une population après avoir observé une partie de l’ensemble de cette dernière. Ce
processus nécessite donc d’étudier trois éléments essentiels: la population mère, la base de sondage
et l’échantillon.
Pr. A. EL Hammadi 2020-2021

CHAPITRE I-1
1. Terminologie statistique
1.1. Population statistique
Figure 1 : Extraction d’un échantillon de n unités à partir d’une population de

N individus.
 On appelle population statistique l'ensemble des individus sur lesquels porte l'étude
statistique.
 Le mot population désigne l’ensemble des unités parmi lesquelles l’échantillon est prélevé. Sa taille,
habituellement désignée par N, est grande, ou même infinie.
1.2. Unités d’échantillonnage
L’unité d’échantillonnage est l’élément (de l’objet étudié) sur lequel vont se porter les mesures des
variables.
Cet élément doit être défini a priori pour être identifié sans ambiguïté. La population est donc
subdivisée en unités appropriées à l’objet de l’enquête, appelées unités d’échantillonnage.

CHAPITRE I-1
Figure 2 : Préparation des échantillons biologiques pour l’analyse
1.3. Variable ou caractère statistique
Une variable est une information dont on recueille ou on observe ou on mesure la valeur sur chaque
individu. On parle de variable parce que la valeur de l’information n’est pas la même d’un individu
à l’autre.
Exemple : Une classe de 40 étudiants (40 Unités)

Supposons qu’on souhaite étudier la taille moyenne de la classe de 40 étudiants, on pourrait
observer :
? ? ? ? 1.84 ? ? ?
? 1.89 ? ? ? ? ? 1.74
? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ?
? 1.74 1.68 ? ? ? ? ?
Dans cet exemple, l’échantillon correspond au jeu de données restreint :
1.89 1.74 1.68 1.74 1.84
L’inférence statistique consiste, à partir de l’observation d’un échantillon d’une population, à en
déduire certaines propriétés de la population toute entière.
1.4. Échantillonnage
Un échantillonnage est un tirage d’un certain nombre d’individus (ou unités) dans une population.
 Échantillonnage systématique
Un échantillonnage est systématique si les individus sont sélectionnés à intervalles réguliers (ex :
une mesure journalière tous les six jours).
CHAPITRE I-1
Temps
pas de mesure
mesure
Figure 1 - Illustration d’un échantillonnage systématique.
 Échantillonnage aléatoire
Un échantillonnage est aléatoire si les individus sont sélectionnés au hasard et de façon

indépendante (ex. : tirage au sort d’un certain nombre d’heures de mesure dans l’année).
Temps
pas de mesure
mesure
Figure 2 - Illustration d’un échantillonnage aléatoire simple.
1.5. Fréquence (ou proportion)
Rapport d’un effectif particulier d’individus à la taille de la population.

1.6. Recensement
Recueil des valeurs de la totalité des individus de la population. Les valeurs recueillies sont les
données.
1.7. Sondage, n-échantillon, base de sondage, taux de sondage
Un sondage est le recueil des valeurs d’une partie (l’échantillon) d’effectif n (d’où l’expression n-
échantillon) de la population (dite base de sondage).
Le taux de sondage est le rapport n/N.
1.8. Variables Statistiques
Qu’est ce qu’une variables ?
On appelle variable une caractéristique commune à l'ensemble des individus d'une étude.
La valeur de cette caractéristique varie entre les individus. C'est pour cela que nous parlons de
variables.
On distingue les variables qualitatives, quantitatives et temporelles.

CHAPITRE I-1
1.8.1. Variables quantitatives  Discrètes ou continues
Elles s’expriment par un nombre et peuvent être exploitées mathématiquement (addition,

soustraction, …..)
Les particularités des variables quantitatives

Variables quantitatives continues Variables quantitatives discrètes
 Elles peuvent prendre n'importe quelle  Elles ne peuvent prendre que des
valeur numérique entière ou décimale. valeurs numériques entières.
 Elles peuvent avoir une infinité de  Elles se distinguent par le fait que le
décimales. passage d'une valeur à une autre est
discontinu.
La seule limite à ce continuum est la précision
de la mesure Exemple :
Exemple : Poids (kg) de cinq individus :
- La pointure des chaussures : 40, 37
55.5 ; 60.8 ; 75..8 ; 50.4 ; 45.7 - Nombre de frères et sœurs : 3 ou 4
1.8.2. Variables qualitatives  nominales, ordinales et binaires
- Elles ne s'expriment pas par une valeur numérique

CHAPITRE I-1
- Elles s'expriment par une qualité
- Il est possible de les répartir en classes ou catégories
- On ne peut pas les exploiter mathématiquement. Il est par exemple impossible d'additionner
la valeur "marié" et la valeur "divorcé".
- Si on ne peut pas faire de calcul, on peut cependant les dénombrer, c'est-à-dire compter
combien de fois une valeur apparaît. Par exemple, comptez combien de personnes sont
"Mariées".
Les particularités des variables qualitatives

Nominales Ordinales Binaires
 Elles ne peuvent pas être  Elles peuvent être classées  Elles ne
hiérarchisées. Aucune les unes par rapport aux peuvent pas être
valeur n'est supérieure à autres. Il existe un hiérarchisées
une autre. gradient qui permet de les  Elles ne possèdent
classer dans un ordre que deux modalités
Ces variables peuvent également logique selon une échelle (deux classes)
être appelées variables de valeur. possibles.
catégorielles. Exemple :
- Faible On les appelle également :
Exemple : situation familiale : variables dichotomiques.
- Normale
- célibataire
- Marié - Fort Exemple : Sexe
- Divorcé - Très fort - Homme
- femme
1.9. Moyenne de la population
Supposons une population finie composée d’unités U1, U2, …, UN. Notons yi la valeur de la
caractéristique de la i-ème unité. La moyenne arithmétique est :
1 N
Y pop   yi
N i 1
1.10. Variance de la population et écart-type
La variance de la population est une mesure de la variation entre les unités de la population :
SY2 
1
 yi  Y 2  1  yi2  Y 2
N i 1 N i 1
La racine carrée de la variance est connue sous le nom d’écart-type :
SY 
1
 yi  Y 2  1
 yi2  Y 2
N i 1 N i 1
L’écart-type de population est un indicateur de l’amplitude des variations des valeurs de la

population autour de leur moyenne. Ainsi, deux populations qui ont la même moyenne mais des

CHAPITRE I-1
écarts-type différents n’ont pas la même variabilité (un écart-type élevé correspond à une grande
variabilité).
On décrit en figure ci-dessous, deux exemples de populations de moyennes égales, mais d’écarts-
types différents.
Question : laquelle correspond à l’écart-type le plus grand ?
Population n°1 Population n°2
Figure 3 : Exemples de deux populations de moyennes égales ( X = 10), mais d’écarts-types

différents (σ = 1 ou 3).
1.11. Variance corrigée et écart-type corrigé de la population

On définit la variance corrigée  Y2 et l’écart-type corrigé  Y par :
 yi  Y   yi2  Y 2
1 2 1
 Y2  
N 1 N 1
i 1 i 1
 y i  Y   yi2  Y 2
1 2 1
Y  
N 1 N 1
i 1 i 1
1.12. Coefficient de variation
Le coefficient de variation est le rapport, généralement exprimé en pourcentage, de l’écart type à la

valeur de la moyenne arithmétique :
Sy
C.V . 
Y pop
Du fait qu’il est adimensionnel, le coefficient de variation est un instrument précieux pour comparer
les variations de deux ou plusieurs populations ou ensembles d’observations.
1.13. Médiane de population

CHAPITRE I-1
La médiane de population partage l’ensemble de toutes les valeurs de la population en deux groupes
d’effectifs égaux : au moins 50% des valeurs sont inférieures ou égales, et au moins 50% des
valeurs sont supérieures ou égales.
1er cas : Prenons un exemple de population, avec 5 individus, et dont les valeurs ordonnées sont :
1.05 1.4 2.8 3.1 6
Dans ce cas, la médiane de population est égale à 2.8. Cet exemple est facile car le nombre
d’individus dans la population est impair, si bien qu’il existe une valeur ”au milieu” des autres.
2ème cas : Dans le cas où l’effectif de la population est pair, il y a plutôt deux valeurs ”au milieu”
des autres, et il est d’usage de retenir la moyenne des deux.
Exemple : 1.05 1.4 6 7.4
Ici, la médiane de population vaut (1.4+6)/2 = 3.7
Différence entre moyenne et médiane
Fait important : la moyenne est plus sensible aux valeurs extrêmes que la médiane.
Prenons l’exemple d’une petite entreprise de 9 personnes, dont les salaires nets mensuels (en
dirhams) sont donnés par :
11600 11600 11600 11600 11600 15000 15000 17000 35000
Dans cet exemple, la médiane de population vaut 11600 Dh, alors que la moyenne de population
vaut environ 15555.6 Dh.
Si le salaire du patron était encore plus élevé, par ex de 85000 Dh au lieu de 35000, alors la
moyenne passerait à 21111 Dh environ, mais la médiane resterait inchangée.
La médiane est donc moins sensible aux valeurs extrêmes.
1.14. Écart interquartile de population
L’écart-type n’est pas la seule mesure de dispersion. En effet, deux populations de moyennes et
d’écarts-types égaux peuvent malgré tout avoir des histogrammes de formes différentes.
De même que nous avons défini la médiane d’une population, on peut définir le premier quartile Q1
et le troisième quartile Q3 de la façon suivante :
- au moins 25% des individus


-
 
au moins 25% des individus
x1 x2 x3 x 4 Q1 ........... x i ............ x N 2 x N 1 xN
  
aumoins 75% des individus
 
au moins75% des individus
x1 x2 x3 x 4 ........... x i ..........Q3 .. x N 2 x N 1 xN

CHAPITRE I-1
La médiane correspond quant à elle au second quartile Q2.
On appelle écart interquartile d’une population la différence Q3-Q1. Cette différence est la largeur
d’un intervalle qui contient au moins 50% de la population. Plus cette différence est élevée, et plus
les valeurs de la population sont dispersées.
Récapitulatif graphique : le boxplot
Le boxplot, ou boite à moustaches, est un outil graphique pour représenter simplement la

médiane et la dispersion des valeurs d’une population. Typiquement, un boxplot ressemble
à la figure suivante
Figure 4 : Exemple d’une boite à moustaches (Boxplot).
Il est défini de la façon suivante :
Le rectangle du milieu s’étend du premier quartile Q1 au troisième quartile Q3, et le trait vertical du
milieu correspond à la médiane.
Les traits horizontaux, qu’on appelle les moustaches, englobent encore davantage de valeurs de la
population. Pour simplifier, la convention que nous utiliserons est de placer les extrémités des
moustaches au premier décile (10% des valeurs en dessous) et au neuvième décile (10% des valeurs
au-dessus). Attention néanmoins : en biologie, la convention est souvent un peu différente
(longueur des moustaches égale à 1.5 fois l’écart interquartile).
Si quelques valeurs de la population ne sont pas comprises entre les extrémités des moustaches,
celles-ci sont figurées par des points à part ; on parle de valeurs extrêmes ou « «outliers = valeurs
aberrantes».
1.15. Estimateur, estimation
Notons x1, x2, …, xn les observations d’un échantillon de taille n.

 Toute fonction des observations effectuées sur un échantillon est une statistique.
 Une statistique utilisée pour estimer un paramètre de la population est un estimateur.
Par exemple, la moyenne d’un échantillon est un estimateur de la moyenne de la population.

On appelle estimation toute valeur spécifique d’un estimateur calculée à partir d’un échantillon
observé.
CHAPITRE I-1
1.16. Variable aléatoire et loi de probabilité

1.16.1. Variable aléatoire
Exemple : Soit l'expérience aléatoire : "On lance un dé à six faces et on regarde le résultat."
L'ensemble de toutes les issues possibles  = {1 ; 2 ; 3 ; 4 ; 5 ; 6} s'appelle l'univers des possibles.
On considère l'événement A : "On obtient un résultat pair."
On a donc : A = {2 ; 4 ; 6}.
On considère l'événement élémentaire E : "On obtient un 3".
On a donc : E = {3}.
Définitions :
- Chaque résultat d'une expérience aléatoire s'appelle une issue.
- L'univers des possibles est l'ensemble des issues d'une expérience aléatoire.
- Un événement est un sous-ensemble de l'univers des possibles.
- Un événement élémentaire est un événement contenant une seule issue.
Exemple : Dans l'expérience précédente, on considère le jeu suivant :

- Si le résultat est pair, on gagne 2dh.
- Si le résultat est 1, on gagne 3dh.
- Si le résultat est 3 ou 5, on perd 4dh.
On a défini ainsi une variable aléatoire X sur  = {1 ; 2 ; 3 ; 4 ; 5 ; 6} qui peut prendre les valeurs
2, 3 ou –4.
On a donc : X(1) = 3, X(2) = 2, X(3) = –4, X(4) = 2, X(5) = –4, X(6) = 2
Définition : Une variable aléatoire X est une fonction définie sur un univers  et à valeur dans ℝ.
1.16.2. Loi de probabilité
Exemple : On considère la variable aléatoire X définie dans l'exemple précédent.

Chaque issue du lancer de dé est équiprobable et égale à 1/6.
La probabilité que la variable aléatoire prenne la valeur 2 est égale à 3/6=1/2.
On note : P(X = 2) = 1/2.
De même : P(X = 3) = 1/6 et P(X = –4) = 2/6.
On peut résumer les résultats dans un tableau :
xi -4 2 3
P(X=xi) 1/3 1/2 1/6
Ce tableau résume la loi de probabilité de la variable aléatoire X.
Définition : Soit une variable aléatoire X définie sur un univers  et prenant les valeurs x1, x2, ...,
xn. La loi de probabilité de X associe à toute valeur xi la probabilité P(X = xi).

CHAPITRE I-1
Remarques :
- P(X = xi) peut se noter pi.
- p1 + p2 + … + pn = 1
Exemple : Dans l'exemple traité plus haut : p1 + p2 + p3 = 1/3+1/2+1/6= 1.
Exemple 2 (Sondage d’un individu dans la classe d’étudiants).

Dans l’exemple de la classe d’étudiants, si on choisit une personne complètement aléatoirement
parmi les 40 étudiants et qu’on note X1 sa taille, alors X1 est une variable aléatoire (sa valeur
dépend du tirage). Pour obtenir la loi de X1, il suffit de remarquer que puisque la personne est
choisie complètement aléatoirement, la probabilité que X1 soit égal à une taille ‘’a’’ donnée
vaut :
P(X1= a) = Na/40,
où Na est le nombre d’individus de taille ‘’a’’ dans la classe 0  N a  40 .
En utilisant les données du tableau suivant, on peut calculer tous les nombres Na et on obtient :
Taille (m) Na P(X=a)=Na/40 Taille (m) Na P(X=a)=Na/40

1,59 1 0,025 1,82 1 0,025
1,64 1 0,025 1,83 2 0,05
1,66 1 0,025 1,84 3 0,075
1,68 1 0,025 1,85 1 0,025
1,71 1 0,025 1,88 1 0,025
1,72 1 0,025 1,89 2 0,05
1,73 1 0,025 1,9 3 0,075
1,74 4 0,1 1,92 1 0,025
1,75 3 0,075 1,93 1 0,025
1,76 2 0,05 1,94 1 0,025
1,78 1 0,025 1,95 2 0,05
1,79 3 0,075 1,96 1 0,025
1,81 1 0,025

CHAPITRE I-1
(a) Diagramme en bâtons (b) Histogramme
1.16.3. Espérance, variance, écart-type
Définitions : Soit une variable aléatoire X définie sur un univers  et prenant les valeurs x1, x2, ...,
xn. La loi de probabilité de X associe à toute valeur xi la probabilité pi = P(X = xi).
a. L'espérance mathématique de la loi de probabilité de X est :
n
E ( X )  p1 x1  p 2 x 2  p3 x3 ....... p n x n   p i xi
i 1
L'espérance est donc la moyenne que l'on peut espérer si l'on répète l'expérience un grand
nombre de fois.
b. La variance de la loi de probabilité de X est :

n
V ( X )  p1 ( x1  E ( X )) 2  p 2 ( x 2  E ( X )) 2  ......  p n ( x n  E ( X )) 2   pi ( xi  E ( X )) 2
i 1
La variance (respectivement l'écart-type) est la variance (respectivement l'écart-type) de

la série des xi pondérés par les probabilités pi.
c. L'écart-type de la loi de probabilité de X est :

 (X )  V (X )
-. L'écart-type est donc une caractéristique de dispersion "espérée" pour la loi de probabilité
de la variable aléatoire.
1.17. Biais statistique = Erreur provenant de l’estimation
Définition : Formellement, le biais de l'estimateur d'un paramètre est la différence entre la valeur de
l'espérance de cet estimateur (qui est une variable aléatoire) et la valeur qu'il est censé estimer
(définie et fixe =q).
Si X̂ est l'estimateur de X, Biais( Xˆ )  E( Xˆ )  q )
X̂ est appelée estimateur non biaisé d’un paramètre q de la population si son espérance
mathématique (ou valeur probable), notée E ( Xˆ ) , est égale à q.
E( Xˆ )  q
Avec une procédure d’échantillonnage de type probabiliste, on obtient, par répétition, un certain
nombre d’échantillons possibles.
Si les valeurs de X̂ sont calculées pour chaque échantillon possible et si la moyenne des valeurs est
égale à la valeur q associée à la population, on dit que X̂ est un estimateur non biaisé de q, basé sur
la procédure d’échantillonnage.

CHAPITRE I-1
Si X̂ n’est pas égal à q , X̂ est un estimateur biaisé de q et le biais est donné par :
Biais( Xˆ )  E( Xˆ )  q
L’introduction d’un processus réellement aléatoire pour la sélection d’un échantillon est un pas
important pour éviter les biais.
1.18. Variance d’échantillonnage
La différence entre une estimation d’un échantillon et la valeur de la population est appelée erreur
d’échantillonnage de l’estimation; on ne connaît évidemment pas l’amplitude de cette erreur
puisqu’on ne connaît pas la valeur de la population.
Exemple : Soit un échantillon de n individus et soit Xéch la valeur moyenne des xi (i=1,2,….n) :
n
 xi
1
X éch 
n
i 1
X éch  X pop = Erreur d’échantillonnage
1.19. Exactitude et précision

L’écart-type d’une estimation, obtenue à partir d’un échantillon, ne tient pas compte du biais. On
peut donc dire que l’écart-type ou la variance d’échantillonnage de l’estimation mesure à l’échelle
inverse la précision de l’estimation, plutôt que son exactitude.
L’exactitude se réfère habituellement à l’ampleur des écarts entre l’estimation d’un échantillon et la
moyenne m = E (X) qui serait obtenue en appliquant plusieurs fois le procédé expérimental, le biais
étant ainsi mesuré par m - q .
Le point le plus important, c’est l’exactitude de l’estimation d’un échantillon, la précision avec
laquelle nous sommes capables de mesurer, dans la majorité des cas. Nous nous efforçons de
concevoir l’enquête et d’analyser les données en utilisant des méthodes statistiques propres à
maximiser la précision et à minimiser le biais.
1.20. Estimation par intervalle

1.20.1. Définitions
1) Loi de distribution normale :

La Loi Normale est une variable continue (on l'appelle aussi loi de Gauss, loi de Laplace-Gauss,
2ème Loi de Gauss).
 Une variable suivra une loi normale si : elle dépend d'un grand nombre de causes,
indépendantes, dont aucune n'est prépondérante et dont les effets s'additionnent (ces
conditions définissant la loi normale sont appelées conditions de Borel).
 Une Loi normale possède deux paramètres : le premier correspond à son espérance (sa
"moyenne") et sera donc noté :  ; le second correspond à son écart-type (à la racine carrée
de sa Variance) et sera donc noté σ.
 Une loi normale de paramètres  et σ sera notée : N (,σ).
Comme c'est une variable aléatoire continue, les probabilités ponctuelles sont nulles et l'on définit
une densité de probabilité :
CHAPITRE I-1
Quand on aura à manipuler une loi normale, on utilisera la propriété suivante :
Si X→N(m,σ), en posant t  X   , on aura T→N(0,1)


Ainsi, par un changement de variable, on peut ramener une loi normale quelconque à une loi
normale de paramètres 0 et 1 (appelée loi normale centrée réduite).
Si l'on trace la courbe représentative de la densité de probabilité, on obtient une courbe en forme de
cloche symétrique par rapport à l'axe des ordonnées :
2) L’estimation par intervalle associe à un échantillon aléatoire, un intervalle X1, X 2  qui

ˆ ˆ
recouvre X avec une certaine probabilité.
Cet intervalle est appelé l’intervalle de confiance du paramètre X car la probabilité que X dont la
ˆ ˆ
valeur est inconnue se trouve compris entre X 1 et X 2 est égale à 1- le coefficient
de confiance P( Xˆ 1  X  Xˆ 2 )  1  

CHAPITRE I-1
Son complément correspond au coefficient de risque.
  
P X  Xˆ 1 , Xˆ 2  
Un intervalle de confiance indique la précision d’une estimation car pour un risque donné,
l’intervalle est d’autant plus grand que la précision est faible comme l’indiquent les graphes ci-
dessous. Pour chaque graphe, l’aire hachurée en vert correspond au coefficient de
risque Ainsi de part et d’autre de la distribution, la valeur de l’aire hachurée vaut α/2 .
α= 0,01
99 chances sur 100 que la valeur du paramètre

recherché se trouve dans l’intervalle de
confiance mais la précision autour de la valeur
prédite est faible.
α = 0,05

confiance et la précision autour de la valeur
prédite est correcte.
α = 0,10

confiance mais la précision autour de la valeur
prédite est élevée.
3) Intervalle de confiance d’une moyenne

CHAPITRE I-1
En fonction de la nature de la variable aléatoire continue X, de la taille de l’échantillon n et de la
connaissance que nous avons sur le paramètre , l’établissement de l’intervalle de confiance autour
de  sera différent.
 Quelque soit la valeur de n, si X  N() et la variance est connue
Etablir l’intervalle de confiance autour de la moyenne  revient à établir la valeur de z pour une
valeur du coefficient de confiance 1 – α donnée par l’expérimentateur.
En effet :
Si P( X  z    X  z )  1   alors P(   z  X    z )  1  
Connaissant la loi suivie par la v. a. X et d’après le théorème central limite, nous pouvons établir
 z X  z  X 
P     1

sachant que 
 N (0,1) (conditions)
   
 n n n  n
z
par conséquent 
correspond à la valeur de la variable normale réduite pour la
n
probabilité  donnée notée εα ou écart réduit.
z 
Ainsi    z   
 n
n
L’intervalle de confiance de la moyenne pour un coefficient de risque est donc
quelque soit la valeur de n si X N( ) et la variance est connue

CHAPITRE I-1
Exemple : Pour des masses comprises entre 50g et 200g, une balance donne une pesée avec une
variance de 0,0015. Les résultats des trois pesées d’un même corps sont : 64,32 ; 64,27 ; 64 ,39.
On veut connaître le poids moyen de ce corps dans la population avec un coefficient de confiance
de 99%. avec = 64,33g et    2.576
 0.039 
alors z      2.576 *  0.058 et donc   X     64 .33  0.058 g
n 1.732 n
d’où le poids moyen de ce corps est compris dans l’intervalle [64,27 ; 64,39] avec une probabilité
de 0,99 (soit 99%).
La valeur de est donnée par la table de l’écart-réduit pour une valeur  donnée
Coefficient de risque écart - réduit
= 0,01  = 2,576
= 0,05  = 1,960
= 0,10  = 1,645
Quelque soit la valeur de n, si X  N() et la variance est inconnue,
Le raisonnement reste le même mais la variance de la population doit être estimée par
n
ˆ 2  S2
n 1
Si P( X  z    X  z )  1   alors P(   z  X    z )  1  
Connaissant la loi suivie par la v. a. et celle suivie par la variable centrée réduite, on peut établir
 z X   z 
P ˆ  ˆ  ˆ   1  
  
 n n n 
X 
sachant que  T (n  1 d .d .l.) (conditions)

n
z
par conséquent ˆ
correspond à la valeur de la variable de student pour une valeur de
n
probabilité α donnée notée tα pour n -1 degrés de liberté (d.d.l.).
z ˆ
Ainsi  t  z  t 
 n
n

CHAPITRE I-1
L’intervalle de confiance de l’espérance pour un coefficient de risque est donc
quelque soit la valeur de n si X  N() et la variance est inconnue
1.21. Espérance mathématique
 Définition : Si Y est une variable aléatoire prenant les valeurs y1,...,yn avec les
probabilités p1,...,pn. L'espérance mathématique de X est le réel :
N
E (Y )   yi pi
i 1
La variance de Y vaut, si on a posé μ=E(Y) :
N
V (Y )   pi ( xi   ) 2  E (Y   ) 2
i 1
et l'écart-type est défini par :
 (Y )  V (Y )
 Propriétés de l'espérance mathématique
- Pour toute constante λ, E(λ)=λ ,
- Pour toute constante λ, E(λX)=λE(X)
- E(X+Y)=E(X)+E(Y)
- E(λX+Y)=λE(X)+E(y)
- Lorsque X et Y sont indépendantes, on a : E(XY)=E(X)E(Y).
Exemple : On lance un dé. On perd 2 dirhams si on tire 1 ou 2, on gagne 0,5 dirhams si on tire
3 et enfin on gagne 1dirham si on tire 4, 5 ou 6.
On appelle X la variable aléatoire qui donne le gain associé à un tirage.
On a ainsi
 X(1)=X(2)=−2
 X(3)=0,5
 X(4)=X(5)=X(6)=1
La loi de probabilité de la variable aléatoire X est donc donnée par le tableau :

CHAPITRE I-1
xi -2 0.5 1
P(X=xi) 1/3 1/6 1/2
L'espérance se calcule alors ainsi :
E(X)=(1/3)x(-2)+(05)x((1/6)+(1/2)x(1)=(-0.5/6)=(-1/12)
Concrètement, elle signifie que si on joue un très grand nombre de fois à ce jeu, en moyenne,
on perd 1/12 dirhams par partie.

Echantillonage - Chapitre I-1

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Echantillonage - Chapitre I-1

Transféré par

Droits d'auteur :

Formats disponibles

Master Spécialisé Procédés d’Analyse et Contrôle Qualité (PACQ)

M04 : TECHNIQUES D’ECHANTILLONNAGES ET OUTILS

C’est donc l’étude d’une partie de la population concernée.

Pr. A. EL Hammadi 2020-2021

Figure 1 : Extraction d’un échantillon de n unités à partir d’une population de

1.2. Unités d’échantillonnage

Pr. A. EL Hammadi 2020-2021

Figure 2 : Préparation des échantillons biologiques pour l’analyse

1.3. Variable ou caractère statistique

Exemple : Une classe de 40 étudiants (40 Unités)

Un échantillonnage est aléatoire si les individus sont sélectionnés au hasard et de façon

1.5. Fréquence (ou proportion)

Rapport d’un effectif particulier d’individus à la taille de la population.

1.7. Sondage, n-échantillon, base de sondage, taux de sondage

1.8. Variables Statistiques

Qu’est ce qu’une variables ?

Pr. A. EL Hammadi 2020-2021

1.8.1. Variables quantitatives  Discrètes ou continues

Elles s’expriment par un nombre et peuvent être exploitées mathématiquement (addition,

Les particularités des variables quantitatives

1.8.2. Variables qualitatives  nominales, ordinales et binaires

- Elles ne s'expriment pas par une valeur numérique

Les particularités des variables qualitatives

1.9. Moyenne de la population

1.10. Variance de la population et écart-type

La racine carrée de la variance est connue sous le nom d’écart-type :

L’écart-type de population est un indicateur de l’amplitude des variations des valeurs de la

Pr. A. EL Hammadi 2020-2021

Question : laquelle correspond à l’écart-type le plus grand ?

Population n°1 Population n°2

Figure 3 : Exemples de deux populations de moyennes égales ( X = 10), mais d’écarts-types

1.11. Variance corrigée et écart-type corrigé de la population

1.12. Coefficient de variation

Le coefficient de variation est le rapport, généralement exprimé en pourcentage, de l’écart type à la

1.13. Médiane de population

Pr. A. EL Hammadi 2020-2021

1.05 1.4 2.8 3.1 6

Exemple : 1.05 1.4 6 7.4

Ici, la médiane de population vaut (1.4+6)/2 = 3.7

Différence entre moyenne et médiane

11600 11600 11600 11600 11600 15000 15000 17000 35000

La médiane est donc moins sensible aux valeurs extrêmes.

1.14. Écart interquartile de population

- au moins 25% des individus

Pr. A. EL Hammadi 2020-2021

Récapitulatif graphique : le boxplot

Le boxplot, ou boite à moustaches, est un outil graphique pour représenter simplement la

Figure 4 : Exemple d’une boite à moustaches (Boxplot).

Il est défini de la façon suivante :

1.15. Estimateur, estimation

Notons x1, x2, …, xn les observations d’un échantillon de taille n.

Par exemple, la moyenne d’un échantillon est un estimateur de la moyenne de la population.

1.16. Variable aléatoire et loi de probabilité

Exemple : Dans l'expérience précédente, on considère le jeu suivant :

1.16.2. Loi de probabilité

Exemple : On considère la variable aléatoire X définie dans l'exemple précédent.

Ce tableau résume la loi de probabilité de la variable aléatoire X.

Pr. A. EL Hammadi 2020-2021

Exemple 2 (Sondage d’un individu dans la classe d’étudiants).

Taille (m) Na P(X=a)=Na/40 Taille (m) Na P(X=a)=Na/40

Pr. A. EL Hammadi 2020-2021

1.16.3. Espérance, variance, écart-type

b. La variance de la loi de probabilité de X est :