Académique Documents
Professionnel Documents
Culture Documents
Dumoulin
Il s’agit de l’utilisation des données d’échantillons pour faire des inférences sur les
paramètres de la population.
IC= intervalle de confiance Pour estimer la vraie valeur d’un paramètre d’une population
La valeur limite z = limite du risque donc juste après ou juste avant cette limite de risque on
est à 2,5% car loi symétrique.
On utilise des paramètres qui nous permettront à partir d’un échantillon on puisse calculer
proportion, moyenne écart type variance et faire une inférence vers la population.
Echantillon : ^p q^
Population : p q
P = ^p +/- E ESTIMATION
E : marge d’erreur = différence maximale probable entre ^p et la vraie valeur p de la
population.
La marge d’erreur sera utilisée pour soit décrire une estimation, soit pour définir un
intervalle de confiance de p : avec ^p - E < p < ^p + E donc [ ^p - E ; ^p + E]
2
z α p^ q^
Soit on aura ^p connu donc bases biblio : n = 2
E
z α2 0,25
Soit on aura : ^p inconnu donc : n =
E2
Exercice 1 :
Analyse des données Mme. Dumoulin
E=z α
n√
^p q^
=1,96
√
0,262× 0,738
152
=0,069
Si on veut estimer p :
P = ^p +/- E
P = 0,26 +/- 0,069
Exercice 2 :
On s’intéresse au pourcentage de foyer avec système de purification d’eau.
*Combien de foyer faut-il enquêter de façon à être certain à 95% que le pourcentage
d’échantillon aura une erreur de moins de 4 points ?
Sachant que :
En 1997, on avait 16,9% qui utilise un système de purification.
2
1,96 × 0,169× 0,831
n=¿ 2
=337,19=338
0,04
σ
E=z α
√n
Pour déterminer n on aura :
zασ 2
N= 2
E
- Si σ est inconnu
S
E=t α
√n
Avec t α dans la table de student : estimation de z
S écart type de l’échantillon
N effectif de l’échantillon
Exercice 1 :
N= 106 températures relevées
N (36,75°C ; 0,34°C)
Exercice 2 :
Un staff médical fait des statistiques sur le taux de cholestérol des employer.
On a 100 employer donc n = 100
56,058
Donc E = 1,984 x =11, 225 cg
√ 100
Donc µ = 213,6 ± 11,225
IC µ= [ x−E
;
x+E
202,375 224,825 ]
4) Déterminer la taille minimum d’échantillon pour que l’amplitude de l’intervalle de
confiance soit inférieure à 10.
S
E=t α
√n
Si on a amplitude < 10 donc la marge d’erreur < 5
n> (
Zα × t 2
E )
( )
2
T ×S
n>
E
Analyse des données Mme. Dumoulin
avec E = 5
(1,984 x 56,058)2
n > (1,984 x 56,058)2 / 25
25
n > 494,78
La loi de χ 2 n’est pas symétrique donc impossible de définir +/- à partir d’une valeur.
Analyse des données Mme. Dumoulin
H1 = hypothèse alternative
La valeur est différente de H0
Valeur < ou > ou ≠
- Notion de valeur critique : valeur qui sépare la région critique des autres, valeurs de la
statistique de test
On va travailler en valeur absolue, car on travaille sur une loi normale centrée réduite donc
ce qui est bon pour VC est bon pour –VC
4. Décisions et conclusions
Dans les tests statistiques on utilise différentes méthodes :
- Méthode traditionnelle
Rejet de H0 = statistique de test dans région critique
Tester l’hypothèse
a.À l’aide de la méthode traditionnelle
b.À l’aide de la méthode de la p-value
c.À l’aide de l’intervalle de confiance
p1= p2 µ1=µ2
1 seul p 1 seule population
Tester avec notre hypothèse H 0 ici
H 0 : p 1= p2
Comparaison de 2 proportions :
Echantillonage aléatoire
Comapraison de 2 moyennes :
Test t de student
Comparaison de 2 variance :
Test de Fisher-Scedecor
Dans une ANOVA a un facteur, on a des données séparées en groupe selon une seule
caractéristique.
On va travailler avec la variance intra-groupe (VA), la variante inter-groupe (VE).
On va donc appliquer le test F à VA et VE.
Les hypothèses :
H0 : µ1 = µ2 = µ3 = µ4
Pour calculer VE :
N=5
S on l’obtient en rentrant les valeurs des moyennes sur la calculatrice pour obtenir l’écart
type des moyennes.
= 1,56
Pour calculer VA :
On calcule la moyenne des variances
= 0,27
F= VE / VA = 5,78