Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Les premiers problèmes d’inférence statistique auxquels s’applique la théorie des distributions
d’échantillonnage sont les problèmes d’estimations. Le but poursuivi est d’estimer, à partir
d’un échantillon, la ou les valeurs numériques d’un ou de plusieurs paramètres de la
population considérée et de déterminer la précision de cette ou de ces estimations.
La meilleure estimation de la moyenne m d’une population, qui puisse être déduite d’un
échantillon aléatoire et simple, est la moyenne de l’échantillon : m x
La dispersion des différentes estimations possibles autour de cette moyenne générale, est
σ
mesurée par l’erreur standard de la moyenne : σx
n
1.2 Estimation par intervalle de confiance
1/8
Comme, pour une population normale, la variable X est elle-même normale de moyenne m et
d’écart type X
, on peut écrire :
n
x m d1 mx d2
p(Z1 d1 ) p(Z 2 d2 )
=
p( ) p( )
= = =
2 2
n n n n n n
p(Z1 d1 ) p(Z 2 d2 ) ( d1 ) ( d2 )
= = 1 - = =1
2
n n n n
-
2
Si on désigne par Z1 la valeur de la variable normale réduite lue dans la table :
2
d1 d2
= = Z1 d1 = d2 = Z12
2
n n
Les limites de confiances sont donc :
X1 = X - Z1 et X 2 = X + Z1
2 n 2 n
On notera l’intervalle de confiance :
σ
X Z1 α2
n
C’est un intervalle symétrique par rapport à la moyenne.
Exemple :
Dans une station service, on suppose que le montant des chèques essence suit une loi normale
de paramètres m et σ. On considère un échantillon de taille n = 50 et on obtient une moyenne
de 130 dh et un écart-type de 28 dh.
Donner une estimation de m par intervalle de confiance au niveau de confiance de 95%.
Pour une population de distribution de probabilité inconnue (écart type inconnu), on utilise
n
la quasi-variance comme estimation de la variance de la population à savoir ˆ V ( x) .
n 1
L’intervalle de confiance de la moyenne sera défini selon les cas.
Dans ce cas, la moyenne d’un échantillon peut toujours être considérée comme une variable T
T
de Student à (n-1) degré de liberté. La valeur Z1 sera remplacée par la valeur 1 à (n-
2 2
σ̂
1) degré de liberté. L’intervalle de confiance est alors : X T1 α2
n
2/8
Exemple :
Dans une entreprise produisant un article déterminé on veut estimer sa durée de vie en heures.
À cette fin on a observé un échantillon aléatoire et simple de 16 unités dont les résultats sont
(en 1000 heures) :
1,10 1,05 1,25 1,08 1,35 1,15 1,30 1,25
1,30 1,35 1,15 1,32 1,05 1,25 1,10 1,15
Déterminer :
1) L’estimation ponctuelle de la moyenne de la population.
2) L’estimation ponctuelle de l’écart type de la population.
3) L’intervalle de confiance de la moyenne à un niveau de confiance de 95 % (=5%).
4) L’intervalle de confiance de la moyenne à un niveau de confiance de 90 % (=10%).
5) Discuter la sensibilité de l’intervalle de confiance par rapport à une variation du risque
d’erreur.
Dans ce cas, la moyenne d’un échantillon peut toujours être considérée comme une variable
σ̂
approximativement normale. L’intervalle de confiance est alors : X Z1 α2
n
Exemple :
La population objet d’étude peut être subdivisée en plusieurs strates dans lesquelles on choisit
des échantillons indépendants.
Désignons par :
N : Taille de la population ; Ni : Taille de la strate i ; n : Taille de l’échantillon global
ni : Taille de l’échantillon prélevée dans la strate i.
3/8
2.1 Estimation ponctuelle
En considérant l’échantillon comme aléatoire et simple la moyenne globale est donnée par :
xi _
N n
n
m et l’erreur standard est donnée par : x avec V ( x)
n n N 1 n 1
ˆ i xi i N i ni
m Avec une erreur standard xi
ni Ni 1
Où i est l’écart type de la strate i.
En considérant l’échantillon stratifié, la moyenne globale de la population est estimée par :
N i xi
m̂ x
Ni
2 i N i ni
2
1
La variance de x est : V (x) 2 (N i )
N ni N i 1
1 i2 N i ni
x
2
L’erreur standard est : (N i )
N ni N i 1
Exemple :
Dans une population de 579 individus, divisée en 4 strates comprenant respectivement 53;
190; 231 et 105 individus, on a prélevé un échantillon de 58 individus, dont 10 dans la 1 ère
strate, 14 dans la 2ème, 21 dans la 3ème et 13 dans la 4ème. En fonction des résultats suivants :
Estimer la moyenne de la population globale et l’erreur standard de cette moyenne, en
considérant l’échantillon comme :
1) Aléatoire et simple ;
2) Stratifié.
4/8
II- Estimation de la variance d’une population
1- Estimation de la variance
L’erreur standard de cette estimation est, dans le cas d’une population normale :
2
n 2
v (ˆ ²) v( ²) = 2( n 1) = ²
n 1 n n 1
Exemple :
Dans une entreprise produisant un article déterminé on veut estimer sa durée de vie en heures.
À cette fin on a observé un échantillon aléatoire et simple de 16 unités dont les résultats sont
(en 1000 heures) :
1,10 1,05 1,25 1,08 1,35 1,15 1,30 1,25
1,30 1,35 1,15 1,32 1,05 1,25 1,10 1,15
6/8
La population objet d’étude peut être subdivisée en plusieurs strates dans lesquelles on choisit
des échantillons indépendants.
Désignons par :
N : Taille de la population ; Ni : Taille de la strate i ; n : Taille de l’échantillon global
ni : Taille de l’échantillon prélevée dans la strate i.
Dans une population de 579 individus, divisée en 4 strates comprenant respectivement 53;
190; 231 et 105 individus, on a prélevé un échantillon de 58 individus, dont 10 dans la 1 ère
strate, 14 dans la 2ème, 21 dans la 3ème et 13 dans la 4ème. En fonction des résultats suivants :
Estimer la variance de la population globale, en considérant l’échantillon comme :
1) Aléatoire et simple ;
2) Stratifié.
La meilleure estimation de la proportion p d’une population, qui puisse être déduite d’un
échantillon aléatoire et simple, est la fréquence de l’échantillon fn.
p̂ f n
La dispersion des différentes estimations possibles autour de cette proportion générale, est
mesurée par l’erreur standard de la proportion :
f n (1 f n )
fn n
Exemple :
Exemple :
On étudie le pourcentage d'utilisation d'une machine. 400 observations ont été effectuées qui
ont donné le résultat suivant :
Machine marche : 320 observations.
8/8
Machine arrêtée : 80 observations.
1) Déterminer l’estimation ponctuelle de la proportion d’utilisation de la machine.
2) Entre quelles limites peut-on fixer le taux d’utilisation de la machine avec un degré de
confiance ?
3) Combien doit-on faire d’observations pour obtenir le même pourcentage d’utilisation tout
en ayant, avec un risque d’erreur de 6%, l’intervalle de confiance [78,4% ; 81,6%] ?
9/8