Académique Documents
Professionnel Documents
Culture Documents
Statistiques Inférentielles
Echantillonnage et estimation
Echantillonnage
A- Distribution d’échantillonnage de la moyenne
Intervalle de confiance
• Quelque soit la valeur de n, si X → N (µ, σ) et σ est inconnue,
L’intervalle de confiance de l’espérance µ pour un coefficient de risque α est donc
(
𝑃 𝑥 − 𝑡𝛼
𝜎^
√𝑛
≤ 𝜇 ≤ 𝑥 +𝑡 𝛼
𝜎^
√𝑛
=1 − 𝛼
)
quelque soit la valeur de n si X → N (µ, σ) et σ est inconnue.
Remarque : La valeur est donnée par la Table de Student pour un seuil de risque α et
n-1 degré de liberté.
Exemple : Dans un échantillon de 20 étudiants de
même classe d’âge et de même sexe, la taille
moyenne observée est de 1,73m et l’écart-type de
l’échantillon est de 10 cm.
Donner l’intervalle de la taille moyenne des
étudiants dans la population avec un coefficient de
confiance de 95%.
Table de Student
Exemple :
Un laboratoire d’agronomie a effectué une étude sur le maintien du pouvoir germinatif des graines
d’une plante donnée après une conservation de 3 ans.
Sur un lot de 80 graines, 47 ont germé.
Déterminer l’intervalle de confiance germination des graines de la plante après trois ans de
conservation avec un coefficient de risque de 5% :
𝑃 (
47
80
− 1, 96
√ 𝑓 ( 1− 𝑓 )
79
≤𝜋≤
47
80
+1 , 96
√ 𝑓 (1 − 𝑓 )
79 )
= 0 , 95
𝑃 ( 0,446 ≤ 𝜋 ≤ 0,729 ) =0 , 95
Tests statistiques
Permettent d’accepter / rejeter une hypothèse
bien précise (en assumant des risques d’erreur)
Test Statistique : Démarche
Formulation de la Question (réponse oui / non) ou la problématique
Exécution du test
Réponse à la question : si p-value < seuil α, alors on rejette H0 avec un risque proportionnel à p-value de se tromper
Etape 1 : Formulation de la question
A: Comparaison de 2 moyennes appartenant à 2 échantillons indépendants
Hypothèse alternative
H1 En générale existence de différence ou de relation.
H1 : moyenne de sucre bananes A ≠ moyenne de sucre bananes B
Etape 3 a : Choix du test statistique approprié
Que cherche-t-on ?
Es qu’on cherche à faire :
Comparaison des moyennes ?
Si oui, Combien ?
Plus on veut limiter les risques de prendre une mauvaise décision, plus on doit diminuer α.
Mais ce n’est pas une raison pour faire une règle systématique
%Sucre 1,17 1,63 1,77 1,95 1,96 1,99 2,11 2,23 2,25 2,61 2,71 2,84 2,85 2,96 2,98 3,08 3,19 3,22 3,32 3,43 3,47 3,53 3,64 3,83 3,85 3,94 4,09
2: Calculer la moyenne
4: A chacune de ces différences, on affecte les coefficients a, donnés par la table, avec n nombre de différences
1- Table de Shapiro des
coefficients « a »
2- Table de Shapiro des
valeurs
Limites de W (W critique)
5: Calculer la valeur:
6: Calculer le rapport:
Test de Shapiro
A-2 Equivariance (ou homoscédasticité) des échantillons
Si les échantillons sont issus de populations normales (conditions de normalité), le rapport de leur variances
Test de Fischer
B: Exécution du test de Student (conditions d’application sont vérifiées)
C: Calcul de tc
E: Conclusion
D: Décision Statistique
Décomposition de la variance
Hypothèse nulle H0 : les moyennes sont égales dans tous les groupes
Hypothèse alternative H1 : au mois un groupe possède une moyenne différente des autres
1) Normalité : Les échantillons sont issus de populations normalement distribuées. Test de Shapiro peut être utilisé
pour vérifier cette condition
2) Homoscédasticité : Les échantillons sont issus de populations de même variances. Le test de Bartlett peut être
utilisé pour vérifier cette seconde condition.
La statistique du test
Source de
Variation S.C.E d.d.l Variances Fc F th
𝑃 𝑝
´
𝑆𝐶𝐸𝐹 = ∑ 𝑛𝑖 ( 𝑥 𝑖 − 𝑋 )
2
𝑆𝐶𝐸𝑅= ∑ ( 𝑛𝑖 − 1 ) 𝑆2𝑥 𝑖
𝑖=1 𝑖 =1
Comparaison de plusieurs moyennes : Analyse de variance = ANOVA
Exemple : Comparaison de l’effet de 4 traitements contre l’hypertension
Mesure de la pression artérielle systolique (en mm Hg) sur 4 échantillons de 8 patients chacun
hypertendus, un mois après le début du traitement.
Ces 4 traitements ont-ils le même effet sur la pression artérielle, au seuil de risque α = 0.05 ?
2-Test statistiques
Test F: Fc = Variance Fact./Variance Rés.
Conditions d’application du test
a) Normalité
Traitement Wc Pvalue Conclusion
Tr1 0,9419 0,6302 Normale
Tr2 0,9581 0,7926 Normale
Tr3 0,9832 0,9772 Normale
Tr4 0,9373 0,5848 Normale
Principe du test
Considérons p échantillons indépendants dont le ième a une variance si2 et un effectif égal à ni. Soit S2pd la variance
pondérée des p échantillons, c'est-à-dire la valeur de la meilleure estimation de la variance σ 2sous l’hypothèse H0 d’
équivariance :
𝑝
∑ ( 𝑛𝑖 − 1 ) 𝑆2
𝑖
𝑖 =1
𝑆2
𝑝𝑑 = 𝑝
∑ ( 𝑛𝑖 − 1)
𝑖 =1
Bartlett a montré que si les populations d’origine sont normales et possèdent la même variance σ 2 et si Spd2
et Si2 sont les variables aléatoires associées de s pd2 et si2, la variable B :
[ ]
𝑝 𝑝
𝑝𝑑 ∑ (
𝐵 = 𝑙𝑛 𝑆2 ∑( 𝑖 2
𝑛𝑖 − 1 ) − 𝑛 − 1 ) 𝑙𝑛 𝑆 𝑖
𝑖= 1 𝑖 =1
[ ]
𝑝
1 1 1
𝑐 =1 + ∑ − 𝑝
3 ( 𝑝 −1) ( 𝑛𝑖 − 1 )
∑ ( 𝑛𝑖 − 1 )
𝑖= 1
𝑖= 1
Le test de comparaison consiste maintenant à soumettre à une épreuve de vérité l’hypothèse principale
Si les populations d’origine sont normales et si H0 est vraie, la variable Bc obéit à une loi de .
Règle de décision : On rejette H0 si
4- Calcul du test:
𝑝
´ )
∑ 𝑛𝑖 ( 𝑥 𝑖 − 𝑋
2
/𝑝 −1
𝑖=1
𝐹 𝑐= 𝑝
=7 , 08
∑ ( 𝑛𝑖 − 1 ) 𝑆
2
𝑥𝑖 /𝑛 − 𝑝
𝑖 =1
5- Décision statistique : On rejette l’hypothèse H0 au seuil α = 0,05