Académique Documents
Professionnel Documents
Culture Documents
Or on ne connait pas , on va donc l’estimer par l’écart type de l’échantillon et par conséquent,
Si on la standardise, on obtient:
1
Lorsque n
dépasse 30 la loi
Student épouse la
forme d’une loi
normale centrée
et réduite
2
On va donc se baser sur cette variable pour
trouver un intervalle de confiance pour la
moyenne de la variable.
On se fixe alors un seuil de signification et on va chercher un intervalle de confiance de niveau
Comme la variable de Student est symétrique par rapport à zéro, on va donc suivre la même méthode utilisée dans le cas 1:
)
Le point critique se trouve en utilisant la table de Student qui est à la fin de votre livre ou bien en utilisant le Logiciel R.
3
Utilisation de R pour déterminer les points
critiques.
1. Trouver
1,795885
2. Trouver
3. Trouver
4. Trouver
4
Exemple 1: Soit X : le taux de cholestérol (en mg/dL) chez des adultes d’un certain groupe d’âge d’une population. En
supposant cette variable normalement distribuée avec une variance inconnue, on a prélevé un échantillon aléatoire de cinq adultes dans
ce groupe, sur lesquels on a mesuré cette variable X et obtenu les résultats suivants :
On doit déterminer un intervalle de confiance de niveau 95 % pour le taux de cholestérol moyen de ce groupe d’âge.
Réponse:
Méthode 1:
Méthode 2: Utilisation de R.
On met les données dans un vecteur x et on tape:
t.test(x) et on obtient le même intervalle de confiance.
5
Exemple 2: La concentration de mercure dans un lac est supposée normalement distribuée. On
a prélevé un échantillon aléatoire de 10 mesures dans ce lac et obtenu les résultats suivants (en nanogrammes
par litre) Déterminer un intervalle de confiance de niveau 99% de la moyenne de cette variable
5,67 4,78 6,56 4,23 3,17 3,89 4,78 4,67 5,17 6,34
Réponse:
On met ces données dans un vecteur y et on tape:
t.test(y,conf.level=0.99) et on obtient:
t = 14.755, df = 9, p-value = 1.302e-07
alternative hypothesis: true mean is not equal to 0
99 percent confidence interval:
3.840998 6.011002
sample estimates:
mean of x
4.926
Réponse:
On met ces données dans un vecteur x et on tape:
t.test(x,conf.level=0.97) et on obtient:
Donc un intervalle de confiance de niveau 97% pour le taux de cacium moyen chez les femmes qui fument est :
7
Cas 3: X est quelconque et la taille de
l’échantillon est supérieure à 30.
Puisque X n’est pas nécessairement normale, mais que n a dépassé 30; on sait que d’après le théorème
central limite (TCL) que:
va être normalement normale avec une moyenne donc en standardisant cette variable on obtient:
Ce qui fait que pour un donné; la marge d’erreur est : et un intervalle de confiance de niveau .
Remarque: En utilisant le logiciel R, on fait comme le cas 2. ce logiciel est majeur et vacciné, il va
reconnaître dans quel cas on est.
8
Taille échantillonnale minimum pour estimer
une moyenne.
On sait que la marge d’erreur pour estimer une moyenne dans le cas 1 est:
Donc si on veut estimer une moyenne avec une marge d’erreur E et un seuil fixés, le nombre d’observations
minimal est:
Exemple: Si on veut estimer une moyenne avec une marge d’erreur qui ne dépasse pas 2 et un niveau de
confiance de 95% et en supposant que l’écart type de la variable est égal à 6. Alors on sait que
Par conséquent
9
Estimation d’une proportion par intervalle
de confiance
Lorsqu’on s’intéresse à une proportion p (inconnue) dans une population, on a vu que si on prend un
échantillon aléatoire de taille n et qu’on calcule la proportion de l’échantillon et que si:
Alors est un estimateur sans biais de p et en plus elle est normalement distribuée avec une moyenne p
et un écart type et alors si on la standardise on obtient:
Cette variable est symétrique par rapport à zéro, Donc si on se fixe un seuil de signification . On peut
démontrer qu’un intervalle de confiance de niveau est:
avec
10
Exemple 1: Quelques jours avant les élections fédérales de mai 2011, un sondage a été mené
auprès de 1 120 électeurs québécois ; parmi eux, 404 ont déclaré qu’ils allaient voter pour le Nouveau Parti
démocratique (NPD). On doit déterminer un intervalle de confiance de niveau 95 % de la proportion des
Québécois qui ont l’intention de voter pour ce parti (si la tendance se maintient).
Par conséquent un intervalle de confiance de niveau 95% pour la proportion des électeurs qui vont voter pour
le NPD est: .
Conclusion: Sur la base de cet échantillon, le pourcentage des électeurs qui vont voter pour le NPD est
36,07% avec une marge d’erreur de 2,81% et cela 19 fois sur 20.
11
Utilisation du logiciel R
On doit taper:
prop.test(404,1120,conf.level=0.95) et on obtient:
Remarque: Il y a une petite différence lorsqu’on utilise le logiciel, cela est dû aux arrondis
12
Exemple 2: Une maison de sondage a mené une étude sur le pourcentage des canadiens qui reçoivent des messages
de publicité non sollicités sur leur téléphone cellulaire. Elle a trouvé un intervalle de confiance de 95% pour cette proportion qui
est égal à 17% plus ou moins 3%. Que signifie cet intervalle de confiance ?
(a)Dans l’échantillon utilisé par cette maison de sondage, entre 14% et 20% des répondants ont reçu des messages de publicité non
(b) On peut être confiant que 17% des Canadiens ont reçu des messages de publicité non sollicités sur leur téléphone cellulaire.
(c) On peut être confiant qu’entre 14% et 20% de tous les Canadiens qui ont un cellulaire, ont reçu des messages de publicité non
(d) 95% de de tous les Canadiens qui ont un cellulaire, ont reçu des messages de publicité non sollicités sur leur téléphone
cellulaire.
Réponse : La bonne réponse est c. C’est cela la signification d’un tel intervalle de confiance.
13
Taille échantillonnale minimale pour
estimer une proportion
On a vu que la marge d’erreur est
1er Cas: On a une certaine expérience et on sait que la proportion qui nous intéresse est autour d’une
certaine valeur . Dans ce cas, on remplace p par cette valeur et on isole n et on trouve que:
Exemple: Quelle est la taille minimale de l’échantillon nécessaire pour estimer une proportion avec une
marge d’erreur qui ne dépasse pas 2% avec un intervalle de confiance de 90% si on sait que cette
proportion est voisine de 35%?
Réponse:
14
2Siième cas:
on revient Onde ne
à la formule connait rien sur p
on pose
Est une fonction qui atteint son maximum lorsque:
Exemple: Un sociologue veut estimer le pourcentage d’une population qui soufre d’un certain type de
dépression avec une marge d’erreur qui ne dépasse pas 1,5% et un seuil de signification de 3%. Quelle est la
taille de l’échantillon nécessaire?
15