CM de Chloé

CM1 – Statistiques inférentielles
Jeudi 12 janvier 2023
Programme :
- Inférence
o Moyenne (quanti)
▪ Sur une moyenne
▪ Sur 2 moyennes aux groupes de mesures indépendants
▪ Sur 2 moyennes aux groupes de mesures appariés/répétés
o Fréquence (quali)
▪ Sur des fréquences aux groupes de mesure indépendants
▪ Test d’indépendance de deux variables catégorisées
▪ Sur 2 fréquences aux groupes de mesure répétés
PARTIE I : MOYENNE
I. Introduction
A. Population parente // Echantillon
Population parente Echantillon

Effectif N n
Moyenne µ 𝑥̅
Ecart-type σ S
Variance σ2 S2
B. Théorie du test d’hypothèse
Exemple : Le fait d’avoir un chien augmente-t-il l’empathie chez les personnes ?
Principe : La différence obtenue est-elle trop grande pour qu’on puisse l’attribuer à la chance ?
Nous nous questionnons sur le rôle de la chance dans les résultats obtenus.
Objectif : trouver un moyen de déterminer si les différences observées dans le cas d’un échantillon sont :
- Peu importante → dû au hasard
- Si elles sont suffisamment importantes → on peut rejeter le rôle de la chance → cela nous incite à
croire que notre hypothèse est vraie (mais ce n’est pas forcément le cas)
Pour cela : nous utilisons les distributions d’échantillonnage d’une statistique : elles nous indiquent à quel degré
de variabilité due au hasard nous pouvons nous attendre d’un échantillon à l’autre sur la base d’une erreur
d’échantillonnage
➔ Elles évaluent la probabilité de voir si ces conditions prédéfinies existent réellement
2 types d’hypothèses :
- Hypothèse de recherche (H1) : les échantillons sont issus de deux populations différentes µ1 et µ2
- Hypothèse nulle (H0) : les échantillons sont issus de la même population parente µ
➔ Nous traçons la distribution d’échantillonnage de la statistique en question en supposant que H0 soit

vraie pour comparer la statistique de l’échantillon (données recueillies) à cette distribution
En fonction de la probabilité, selon H0, nous rejetons ou conservons H0 d’arriver à une statistique d’échantillon
aussi extrême que celle que nous avons obtenue.
C. Tests unilatéraux (UL) // Tests bilatéraux (BL)

2 possibilités pour H1 :
- Test unilatéral : H1 UL = nous précisons la direction dans laquelle l’individu s’écarte de la moyenne et
que notre surface de rejet se situe dans une seule partie de la distribution (gauche ou droite). Exemple :
les personnes qui ont un chien sont plus empathiques que celles qui n’en ont pas.
- Test bilatéral : H1 BL = nous précisons la direction dans laquelle l’individu s’écarte de la moyenne et
notre surface de rejet se situe dans les deux parties de la distribution (gauche ET droite). Exemple : les
personnes qui ont un chien n’ont pas le même niveau d’empathie que celles qui n’en ont pas.
D. Erreurs de type I et de type II
Lorsque nous prenons une décision dans le cadre d’un test statistique, il y a toujours un risque que notre
décision soit la mauvaise.
- Erreur de type I : α = rejeter H0 alors qu’elle est vraie → affirmer H1 alors qu’on n’aurait pas dû !
- Erreur de type II : β = ne pas rejeter H0 alors qu’elle était fausse → ne pas affirmer H1 alors qu’on aurait
dû !
Erreur de type I :
= Affirmer H1 alors qu’on n’aurait pas dû
En choisissant la plus grande valeur (table t), j’augmente la VC → je diminue la RC → je diminue les chances
d’affirmer H1.
Erreur de type II :
= Ne pas affirmer H1 alors qu’on aurait dû
NRH0 alors qu’il fallait RH0
En augmentant α → j’augmente la RC → j’augmente les chances d’affirmer H1 → je diminue le risque d’erreur
de type 2.
Partie A : Inférence sur une / des moyennes

I. Inférence sur une moyenne
A. Introduction
1 moyenne
Exercice type :
Un échantillon de 60 étudiants pris au hasard ont un QI moyen de 110 (s = 1,9). Peut-on revendiquer que les
étudiants ont un QI supérieur à la norme en France (100) ?
Il y a 7 étapes.
B. Etape 1 : identification de la problématique
Nous allons procéder à une inférence sur une moyenne.
Nous allons comparer la moyenne µ de la population parente d’où est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à « moyenne dans l’énoncé ».
On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé ».

NB : Si α=.05, cela signifie que nous prenons 5% de marge d’erreur.
C. Etape 2 : Hypothèses
H0 : µ=µ0
La moyenne µ de la population parente, d’où est extrait l’échantillon, est égale à µ0.
H1 : µ≠µ0 / µ<µ0 / µ>µ0
La moyenne µ de la population parente, d’où est extrait l’échantillon, est différente / inférieure / supérieure à
µ0.
D. Etape 3 : Statistique de décision et loi sous H0
Si n ≥ 60 :
𝑥̅ −µ0
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1
( )
√𝑛
Si n < 60 :
𝑥̅ −µ0
𝑇= 𝑠 Sous H0 de loi Student à n-1 ddl (ddl = degré de liberté = effectif – 1)
( )
√𝑛
A CONDITION que la population parente de l’échantillon suive la loi normale.
E. Etape 4 : Statistique observée
Si n ≥ 60 :
Calcul du Z
Si n < 60 :
Calcul du T
F. Etape 5 : Valeur(s) critique(s) et région critique
Si n ≥ 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Z) = Z1- α /2
- Gauche : VC α /2(Z) = Z α /2 = - Z1- α /2
➔ RC(Z)1- α /2 = ]-∞ ; Z α /2[𝑈] Z1- α /2 ; + ∞[
Si H1 UL à droite : 1 VC :
VC1- α (Z) = Z1- α
➔ RC(Z)1- α = ] Z1- α ; + ∞[
Si H1 UL à gauche : 1 VC :
VCa(Z) = Z α = - Z1- α
➔ RC(Z)1- α = ] -∞ ; Z α [
Si n < 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Tn-1) = Tn-1 ;1- α /2
- Gauche : VC α /2(Tn-1) = Tn-1 ; α /2 = -Tn-1 ;1- α /2
➔ RC(Tn-1)1-α/2 = ]-∞ ; Tn-1 ;α/2 [𝑈] Tn-1 ;1- α /2 ; + ∞[
VC1- α (Tn-1) = Tn-1 ;1- α
➔ RC(Tn-1)1- α = ] Tn-1 ;1- α ; + ∞[
VC α (Tn-1) = Tn-1 ; α = - Tn-1 ;1- α
➔ RC(T)n-1 ;1- α = ] -∞ ; Tn-1 ; α [
NB : SI T(n-1) ne figure pas dans la table, choisir la plus grande valeur pour éviter l’erreur de type 1.
G. Etape 6 : décision statistique
Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil a = « seuil »

NB : j’ai eu tord de partir d’H0 → je rejette H0
Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil a= « seuil »
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant
H. Etape 7 : Conclusion
Si RH0 : on peut affirmer avec moins d’ α *100% de risque de se tromper que H1 « … » → H1 est affirmé
Si NRH0 : on ne peut pas affirmer avec moins d’ α *100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmé
ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.
I. Exercice
Enoncé : 60 étudiants de psychologie pris au hasard ont un QI de 110 (s=1,9). Peut-on revendiquer que les
étudiants ont un QI supérieur à la norme (100) ? Seuil .05
Ψ Traduction de l’énoncé
𝑥̅ = 110
𝑠 = 1,9
α = .05
µ0 = 100
𝑛 = 60
Ψ Etape 1 : identification de la problématique
Nous allons comparer la moyenne µ de la population parente d’où elle est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à 100.
On prendre le seuil α = .05
Ψ Etape 2 : hypothèses
H0 : µ = µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est égale à µ0.
H1 : µ>µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est supérieure à µ0.
Ψ Etape 3 : statistique de décision et loi sous H0
n ≥ 60 :
𝑥̅ − µ0
𝑍= 𝑠
( )
√𝑛
Sous H0 de loi normale centrée réduite
Ψ Etape 4 : statistique observée
𝑥̅ − µ0
𝑍= 𝑠
√𝑛
110 − 100
𝑍= ≈ 40,768
1,9
√60
Ψ Etape 5 : valeur(s) critique(s) et région critique
n ≥ 60 :
H1 UL à droite : 1 VC :
VC1- α (Z) = Z1- α
= Z.95
= 1,645
➔ RC(Z)1-a = ]1,645 ; +∞[
Ψ Etape 6 : décision statistique
La statistique observée 40,768 est dans la RC : RH0 au seuil α = .05
Ψ Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la moyenne µ de la population parente
d’où est extrait l’échantillon est supérieure à µ0.
ATTENTION on conclut par rapport à H1 ! PAS par rapport à H0.

Jeudi 26 janvier 2023
II. Inférence sur deux moyennes aux groupes de mesure appariés/répétés

A. Introduction
2 moyennes aux groupes de mesure appariés/répétés : si le sujet est passé par toutes les modalités de la
variable.
Exercice type :
10 athlètes améliorent en moyenne leur score de 103,2 ms (s=45,2) suite à un entraînement. Ils sont plus
rapides. L’entrainement est-il efficace ?
7 étapes

Nous allons procéder à une inférence sur deux moyennes µ1 et µ2, aux groupes de mesure appariés/répétés.
Autre formulation : nous allons procéder à une inférence sur une moyenne de différence µd à la norme µ0 (=0)
Plan d’expérience : Snb sujet*Cnb modalités
On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé ».

NB : Si α =.05, cela signifie que nous prenons 5% de marge d’erreur.
C. Etape 2 : hypothèses
H0 : µ1=µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est égale à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n2.
H0 : µd=µ0
La moyenne µd de la population parente des différences est égale à la moyenne µ0 égale à 0.
H1 : µ1≠µ2 / µ1<µ2 / µ1>µ2

La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente/inférieure/supérieure à
la moyenne µ2 de la population parente d’où est extrait l’échantillon n2.
H1 : µd≠µ0 / µd<µ0 / µd>µ0

La moyenne µd de la population parente des différences est différente/inférieure/supérieure à la moyenne µ0
égale à 0.
D. Etape 3 : statistique de décision et loi sous H0
Si n ≥ 60 :
̅̅̅̅
𝑥𝑑
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1.
( 𝑑)
√𝑛
Si n < 60 :
̅̅̅̅
𝑥𝑑
𝑇= 𝑠 Sous H0 de loi Student à n-1 ddl. (ddl = degré de liberté = effectif – 1)
( 𝑑)
√𝑛
A CONDITION que les populations parentes des échantillons soient normales.
E. Etape 4 : statistique observée
Si n ≥ 60 :
Calcul du Z
Si n < 60 :
Calcul du T
F. Etape 5 : valeur(s) critique(s) et région critique
Si n≥ 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Z) = Z1- α /2
- Gauche : VC α /2(Z) = Z α /2 = - Z1- α /2
➔ RC(Z)1- α /2 = ]-∞ ; Z α /2[𝑈] Z1- α /2 ; + ∞[
VC1-α (Z) = Z1-α
➔ RC(Z)1-α = ] Z1-α ; + ∞[
VCα (Z) = Zα = - Z1-α
➔ RC(Z)1-α = ] -∞ ; Zα [
Si n < 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1-α/2(Tn-1) = Tn-1 ;1-α/2
- Gauche : VCα/2(Tn-1) = Tn-1 ; α/2 = -Tn-1 ;1-α/2
➔ RC(Tn-1)1-α/2 = ]-∞ ; Tn-1 ; α/2 [𝑈] Tn-1 ;1-α/2 ; + ∞[
VC1-α (Tn-1) = Tn-1 ;1-α
➔ RC(Tn-1)1-α = ] Tn-1 ;1-α ; + ∞[
VCα (Tn-1) = Tn-1 ; α = - Tn-1 ;1-α
➔ RC(T)n-1 ;1-α = ] -∞ ; Tn-1 ; α [
Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil »

NB : j’ai eu tord de partir de H0 → je rejette H0.
Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α= « seuil »
NB : je ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.
H. Etape 7 : conclusion
Si RH0 : On peut affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 est affirmée
Si NRH0 : On ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est
pas affirmée
I. Exercice
Enoncé : 10 athlètes améliorent en moyenne leur score de 103,2 ms (sd = 45,2) suite à un entraînement. Ils sont
plus rapides. L’entraînement est-il efficace ? α=.05
Marge d’erreur = 5%
N = 10
Sd = 45,2
xd = 103,2
µ0 = 0

Nous allons procéder à une inférence sur une moyenne des différences µd comparée à la norme µ0 =0.
VI : score
S1 : avant
S2 : après
VD : temps en ms
Plan d’expérience : S10*S2
On prendra le seuil α = .05
H0 : µd=µ0
H1 : µd>µ0
La Moyenne µd de la population parente des différences est supérieure à la moyenne µ0 égale à 0.
Si n < 60 :
̅̅̅̅
𝑥𝑑
𝑇= 𝑠
( 𝑑)
√𝑛
Sous H0 de loi Student à n-1 ddl. (ddl = degré de liberté = 10 – 1 = 9)
A condition que les populations parentes des échantillons soient normales.
𝑥
̅̅̅
𝑑 103,2
𝑇= = = 7,22
𝑠 45,2
( 𝑑) ( )
√𝑛 √10
VC.95(T9) = T9;.95 = 1,833
➔ RC(Tn-1)1-α = ] 1,833 ; + ∞[
Si la statistique observée 7,22 est dans la RC : RH0 au seuil α = .05
Si RH0 : On peut affirmer avec moins de 5% de risque de se tromper que la moyenne µd de la population
parente des différences est supérieure à la moyenne µ0 égale à 0.
→ H1 est affirmée

Jeudi 02 février 2023
III. Inférence sur deux moyennes aux groupes de mesure indépendants
A. Introduction
2 moyennes aux groupes de mesure indépendants = le sujet passe par une seule modalité de la variable.
Exercice type :
Lors d’un test d’attention, les sujets sont répartis en deux groupes : les – de 50 ans et les + de 50 ans.
La moyenne du premier groupe (- de 50 ans) de 42 personnes est de 25 (s = 4,6).
La moyenne du second groupe (+ de 50 ans) est de 48 personnes est de 27 (s = 5,1).
Peut-on revendiquer que l’âge a un impact sur l’attention ?
7 étapes AVEC dans certains cas un test d’homogénéité des variances.
Nous allons procéder à une inférence sur deux moyenne µ1 et µ2, aux groupes de mesure indépendants.
Nous allons comparer la moyenne µ1 de la population parente d’où est extrait l’échantillon n1 à la moyenne µ2
de la population parente d’où est extrait l’échantillon n2.
Plan d’expérience : Snb de sujets par modalité < Gnb modalités >
On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé »

NB : Si α = .05, cela signifie que nous prenons 5% de marge d’erreur
H0 : µ1 = µ2
population parente d’où est extrait l’échantillon n 2.
➔ Les échantillons sont extraits de la même population parente dont la moyenne est µ.
H1 : µ1 ≠ µ2 / µ1 < µ2 / µ1 > µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente / supérieure / inférieure
à la moyenne µ2 de la population parente d’où est extrait l’échantillon n2.
➔ Les deux échantillons sont extraits de deux populations parentes µ1 et µ2 différentes.
Si n1 ET n2 ≥ 60 :
𝑥̅ 1−𝑥̅ 2
𝑧= Sous H0 de loi normale centrée sur 0 et de variance 1.
𝑠 2𝑠 2
√( 1 − 2 )
𝑛1 𝑛2
Si n1 OU n2 < 60 (ou les deux) :
𝑥̅ 1−𝑥̅ 2
𝑇= 1 1
Sous H0 de loi Student à n-2 ddl (ddl = degré de liberté = effectif – 2)
∗2
√𝑆 ×(𝑛 +𝑛 )
1 2
(𝑛1 −1)×𝑆12+(𝑛2 −1)×𝑆22
Variance pondérée : 𝑆 ∗2 = 𝑛1 +𝑛2 −2
2 CONDITIONS :
- Que les populations parentes de l’échantillon soient normales
- Que les variances de populations parentes soient homogènes
o A VERIFIER UNIQUEMENT SI T de Student : Test d’homogénéité des variances
▪ Si ok : on continue la suite des étapes
▪ Sinon : on arrête le test d’inférence
Si n1 ET n2 ≥ 60 :
Calcul du Z

Calcul du T
Si n1 ET n2 ≥ 60 :
Si H1 BL : 2VC :
Droite : VC1-α/2(Z) = Z1-α/2
Gauche : VCα/2(Z) = Zα/2 = - Z1-α/2
➔ RC(Z)1-α/2 = ] - ∞ ; Zα/2 [𝑈] Z1-α/2 ; + ∞ [
VC1-α (Z) = Z1-α
➔ RC(Z)1-α = ] Z1-α ; + ∞ [
VCα (Z) = Zα = - Z1-α
➔ RC(Z)1-α = ] - ∞ ; Zα [
Si H1 BL : 2VC :
Droite : VC(T(n1+n2-2))1-α/2 = T(n1+n2-2)1-α/2
Gauche : VC(T(n1+n2-2)) α/2 = T(n1+n2-2) α/2 = - T(n1+n2-2)1-α/2
➔ RC(T(n1+n2-2))1-α/2 = ] - ∞ ; T(n1+n2-2) α/2 [𝑈] T(n1+n2-2)1-α/2 ; + ∞ [
VC(T(n1+n2-2))1-α = T(n1+n2-2)1-α
➔ RC(Tn1+n2-2)1-α = ] Tn-1 ;1-α ; + ∞ [
VC(T(n1+n2-2)) α = T(n1+n2-2) α = - T(n1+n2-2)1-α
➔ RC(T)n1+n2-2 ; 1-α = ] - ∞ ; T(n1+n2-2) α [
NB : SI T(n1+n2-2) ne figure pas dans la table, choisir la plus grande valeur pour éviter l’erreur de type 1.
Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil ».

NB : J’ai eu tord de partir d’H0 → je rejette H0
Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α = « seuil ».
NB : On ne rejette pas H0 mais on ne peut pas l’affirmer pour autant
Si RH0 :
On peut affirmer avec moins d’α*100% de risque de se tromper que H1 « … ».
➔ H1 est affirmée
Si NRH0 :
On ne peut pas affirmer avec moins d’α*100% de risque de se tromper que H1 « … ».
➔ H1 n’est pas affirmée
I. Exercice
Enoncé : Nous cherchons à mesurer l’efficacité d’un traitement contre la maladie d’Alzheimer. Nous comptons
le nombre d’items bien reportés auprès d’un groupe de personnes.
La moyenne d’un premier groupe constitué de 42 adultes malades est de 25,5 (s = 4,6).
La moyenne d’un second groupe de 48 malades mais traités avec ce traitement est de 27,9 (s = 5,1).
Existe-t-il une différence entre les personnes malades qui prennent le traitement et celles qui ne le prennent
pas ?
ATTENTION : nous partons du principe que les variances sont homogènes α = .05
Marge d’erreur = 5%
N1 = 42
S1 = 4,6
X1 = 25,5
N2 = 48
S2 = 5,1
X2 = 27,9
Nous allons procéder à une inférence sur deux moyenne µ1 et µ2, aux groupes de mesure indépendants.
Nous allons comparer la moyenne µ1 de la population parente d’où est extrait l’échantillon n1 à la moyenne µ2
de la population parente d’où est extrait l’échantillon n2.
VI : groupe
1 : groupe 1
2 : groupe 2
VD : nombre d’items bien reportés
Plan d’expérience : S90/2 < G2 >
H0 : µ1 = µ2
H1 : µ1 ≠ µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente à la moyenne µ2 de la
𝑥̅1 − 𝑥̅ 2
𝑇88 =
1 1
√𝑆 ∗2 × (𝑛 + 𝑛 )
1 2
(𝑛1 −1)×𝑆12+(𝑛2 −1)×𝑆22 (42−1)×21,16+(48−1)×26,01 2090,03

Variance pondérée : 𝑆 ∗2 = = = = 23,75
𝑛1 +𝑛2 −2 42+48−2 88
Sous H0 de loi Student à n-1 ddl (ddl = degré de liberté = effectif – 1)
2 CONDITIONS :
- Que les populations parentes de l’échantillon soient normales
- Que les variances de populations parentes soient homogènes
o SI t de Student : Vérifier ; Test d’homogénéité des variances
𝑥̅1 − 𝑥̅2 25,5 − 27,9

𝑇88 = = = −2,331
1 1
√𝑆 ∗2 ×( + ) √23,75 × ( 1 + 1 )
𝑛1 𝑛2 42 48
Si H1 BL : 2VC :
Droite : VC(T88).975 = T88 ; .975 = 1,99
Gauche : VC(T88).025 = T88 ; .025= - T88 ; .975 = -1,99
➔ RC(T88).975 = ] - ∞ ; -1,99 [𝑈] 1,99 ; + ∞ [
Si la statistique observée -2,331 est dans la RC : RH0 au seuil α = .05.
On peut affirmer avec moins d’α*100% de risque de se tromper que La moyenne µ1 de la population parente
d’où est extrait l’échantillon n1 est différente à la moyenne µ2 de la population parente d’où est extrait
l’échantillon n2.
➔ H1 est affirmée
Donc il y a une différence entre les patients traités et non traités.

Jeudi 9 février 2023
IV. Test d’homogénéité des variances

A. Introduction
Après l’étape 3 de l’inférence sur deux moyennes aux groupes de mesure indépendants.
S’il y a utilisation du T de Student.
7 étapes
Si c’est homogène : on peut continuer le test d’inférence sur deux moyennes aux groupes de mesure
indépendants.
Nous allons procéder à une inférence sur deux variances σ12 et σ22.
On prendra le seuil α = .10 !

➔ 10% de risque d’erreur
NB : α = .10 pour éviter l’erreur de type 2 !
H0 : σ12 = σ22
Les variances σ12 et σ22 sont homogènes.
H1 : σ12 ≠ σ22
Les variances σ12 et σ22 ne sont pas homogènes.

𝑠2
𝐹(𝑛1 − 1; 𝑛2 − 1) = 𝑠12 Sous H0 de loi F-S (Fischer-Snedecor) à (n1-1 ; n2-1) ddls.
2
➔ PAS de loi normale (>0)
E. Etape 4 : F observé
Calcul du F.
2 VC :
1 VC à droite :
VCα=.10 : F(n1-1 ; n2-1) ; 1-α/2 = F(n1-1 ; n2-1).95
1 VC à gauche :
VCα=.10 : - F(n1-1 ; n2-1) ; 1-α/2 = F(n1-1 ; n2-1) α/2
1
𝐹(𝑛1 − 1; 𝑛2 − 1)𝛼∕2 =
𝐹(𝑛2 − 1; 𝑛1 − 1)1−𝛼⁄2
➔ RCα=.10 F(n1-1;n2-1) = ] 0 ; F(n1-1 ; n2-1) α/2 [𝑈] F(n1-1 ; n2-1)1-α/2 ; +∞ [
NB: SI F(n1-1;n2-1) ne figure pas dans la table, choisir la valeur voisine la plus petite pour éviter l’erreur de type
2.
Si le F observé « valeur observée en 4 » est dans la RC : RH0 au seuil α = .10.

NB : J’ai eu tord de partir d’H0 → je rejette H0.
Si le F observé « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α = .10.
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.
Si RH0 : On peut affirmer avec moins de 10% de risque de se tromper que H1 « … »

➔ H1 est affirmé
Si NRH0 : On ne peut pas affirmer avec moins de 10% de risque de se tromper que H1 « … ».
➔ H1 n’est pas affirmé
➔ On considère les variances comme homogènes
➔ On continue le test d’inférence sur 2 moyennes aux groupes de mesure indépendants.
I. Exercice
Enoncé : Nous cherchons à mesurer l’efficacité d’un traitement contre la maladie d’Alzheimer. Nous comptons
le nombre d’items bien reportés auprès d’un groupe de personnes.
La moyenne d’un premier groupe constitué de 42 adultes malades est de 25,5 (s = 4,6).
La moyenne d’un second groupe de 48 malades mais traités avec ce traitement est de 27,9 (s = 5,1).
Les variances sont-elles homogènes ?
σ1 = 4,6
σ2 = 5,1
n1 = 42
n2 = 48
Nous allons procéder à une inférence sur deux variances σ12 et σ22.
H0 : σ12 = σ22
Les variances σ12 et σ22 sont homogènes.
H1 : σ12 ≠ σ22
Les variances σ12 et σ22 ne sont pas homogènes.
𝑠2
𝐹(𝑛1 − 1; 𝑛2 − 1) = 𝑠12 Sous H0 de loi F-S (Fischer-Snedecor) à (𝑛1 − 1; 𝑛2 − 1) ddls.
2
Ψ Etape 4 : F observé
𝑠12
𝐹(𝑛1 − 1; 𝑛2 − 1) =
𝑠22
4,62
𝐹(41; 47) = = 0,814
5,12
1 VC à droite :
VCα=.10 F(n1-1 ; n2-1)1-α/2 = F(41 ; 47).95 ≈ F(45 ; 48).95 ≈ 1,62
1 VC à gauche :
VCα=.10 : - F(n1-1 ; n2-1) ; 1-α/2 = F(41 ; 47).05
On choisit la plus petite valeur F(50 ; 42).95 ≈ 1,65
1 1 1
𝐹(𝑛1 − 1; 𝑛2 − 1)𝛼∕2 = = = = 0,61
𝐹(𝑛2 − 1; 𝑛1 − 1)1−𝛼⁄2 𝐹(47 ; 41).95 1,65
➔ RCα=.10 F(n1-1;n2-1) = ] 0 ; F(n1-1 ; n2-1) α/2 [𝑈] F(n1-1 ; n2-1)1-α/2 ; +∞ [
➔ RCα=.10 F(41;47) = ] 0 ; 0,61 [𝑈] 1,62 ; +∞ [
Ψ Etape 6: decision statistique
Si le F observé 0,814 n’est PAS dans la RC : NRH0 au seuil α = .10.

On ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.
Si NRH0 : on ne peut pas affirmer avec moins de 10% de risque de se tromper que les variances σ12 et σ22 ne
sont pas homogènes.
➔ H1 n’est pas affirmé
➔ On considère les variances comme homogènes
➔ On continue le test d’inférence sur 2 moyennes aux groupes de mesure indépendants.

Jeudi 9 mars 2023
V. Révisions
A. Exercice 1
1. Enoncé
Si un échantillon est tiré aléatoirement d’une population parente normale, quelle est la probabilité que sa note
z soit comprise entre 0 et 0,8 ?
2. Réponse
Toujours faire un schéma pour essayer de comprendre ce qu’on cherche.

p(A) = p(Z<0,8) – p(Z<0)
p(Z≤0) = 0,5000
p(Z<0,8) = 0,7881
p(A) = 0,7881 – 0,5000
p(A) = 0,2881
La probabilité que Z soit compris entre 0 et 0,8 est de 0,2881, soit 28,81%.
B. Exercice 2
1. Enoncé
Nous souhaitons mieux comprendre le trouble du spectre de l’autisme. Nous mesurons la durée du sommeil de
80 enfants atteints de TSA. La moyenne est de 8h, l’écart-type est de 2,5. La durée moyenne du sommeil chez
les enfants en France est de 10h. Pouvons-nous affirmer de manière significative qu’ils dorment moins que les
enfants en générale ? α =.01
2. Réponse
𝑥̅ = 8
𝑠 = 2,5
α = .01
µ0 = 10
𝑛 = 80
Nous allons comparer la moyenne µ de la population parente d’où elle est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à 10.
On prendra le seuil α = .01.
H0 : µ=µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est égal à µ0.
H1 : µ<µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est inférieur à µ0.
𝑥̅ −µ0
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1.
( )
√𝑛
𝑥̅ − µ0
𝑍= 𝑠
( )
√𝑛
8 − 10 −2
𝑍= = = −7,155
2,5
( ) √5
√80 8
VCα(Z) = Zα = Z.01 = - Z1-α = - Z.99 = - 2,325

➔ RC(Z)1-α = ] -∞ ; Zα [ = ] -∞ ; - 2,325 [
La statistique observée – 7,155 est dans la RC : RH0 au seuil a = .01.
Si RH0 : on peut affirmer avec moins de 1% de risque de se tromper que la moyenne µ de la population parente
d’où est extrait l’échantillon est inférieur à µ0.
Les enfants atteints de TSA dorment moins de manière générale que la norme.

Jeudi 16 mars 2023
PARTIE II : FREQUENCE
I. Inférence sur deux fréquences à mesures indépendantes
A. Introduction
1 VI aux groupes de mesure indépendants.

1 VD/VC (données catégorielles = données qualitatives)
Effectifs implique fréquences
Le χ 2 de Pearson / test d’ajustement

Exercice type : un échantillon de 1 000 personnes (600 Lillois et 400 Parisiens), pris au hasard ont répondu à la
question : « allez-vous voter pour ce candidat ? ». Pouvons-nous affirmer que les Lillois voteront plus pour le
candidat en question que les Parisiens ?
7 étapes
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2 aux groupes de mesure indépendants.
Plan expérimental :
Il y a une VI : « … », avec 2 modalités (« … » ; « … »)
Il y a une VD : « … », à n modalités (« … ») ; («… »)
➔ S<V>

NB : si α =.05, cela signifie que nous prenons 5% de marge d’erreur
H0 : ф1 = ф2
La fréquence (ou proportion) de Lillois votant ce candidat ф1 est égale à la fréquence (ou proportion) de
Parisiens votant ce candidat ф2 de la population parente.
H1 : ф1 ≠ ф2
La fréquence (ou proportion) de Lillois votant ce candidat ф1 n’est pas égale à la fréquence (ou proportion) de
Parisiens votant ce candidat ф2 de la population parente.

𝑙
𝑐 2
∗
(𝑛𝑖𝑗 −𝑛𝑖𝑗 )
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à (l-1)(c-1) ddl = 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
i : ligne
j : colonne
nij : effectif observé
nij* : effectif théorique : référence → si H0 est vraie
NB : l = nombre de modalité VI ; c = nombre de modalité VD
2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5
Table de contingence :
VI modalité 1 VI modalité 2 Total marginal

Ex : Lillois Ex : Parisiens
VD catégorie 1 250 350 600
Ex : oui 300* 300
Ex : non 200 200
Total marginal 500 500 1000
Légende : effectifs observés ; effectifs théoriques
* : 300 = 500 x (600/1000)
Calcul du χ2.
F. Etape 5 : valeur critique et région critique
1 VC extrême droite (carré toujours positif) :

χ 2(l-1)(c-1) ; 1- α
➔ RC = ] VC ; + ∞ [

NB : j’ai eu tord de partir de H0 → je rejette H0
Si la statistique observée « valeur observée en 4 » n’est pas dans la RC : NRH0 au seuil α = « seuil ».
Si RH0 : on peut affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 est affirmée
Si NRH0 : on ne peut pas affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 n’est
pas affirmée
I. Exercice
1. Enoncé
Nous interrogeons 145 sénateurs / sénatrices sur leur positionnement face à la réforme des retraites. Pouvons-
nous affirmer que le positionnement face à cette loi dépend du parti politique de l’individu ?
Gauche Droite
Pour 35 9
Contre 60 41
2. Etape 1 : identification de la problématique
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2 aux groupes de mesure indépendants.
Il y a une VI : Bord politique, avec 2 modalités (Droite ; Gauche)
Il y a une VD : Position, à 2 modalités (Pour) ; (Contre)
➔ S<V>
3. Etape 2 : hypothèses
H0 : ф1 = ф2
La fréquence (ou proportion) de sénateurs de gauches pour la réforme ф1 est égale à la fréquence (ou
proportion) de sénateurs de droites pour la réforme ф2 de la population parente.
H1 : ф1 ≠ ф2
La fréquence (ou proportion) de sénateurs de gauches pour la réforme ф1 n’est pas égale à la fréquence (ou
proportion) de sénateurs de droites pour la réforme ф2 de la population parente.
4. Etape 3 : statistique de décision et loi sous H0
𝑙
𝑐 2
∗)
(𝑛𝑖𝑗 −𝑛𝑖𝑗
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à (1)(1) ddl = 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
2 CONDITIONS :
VI modalité 1 VI modalité 2 Total marginal

Ex : Droite Ex : Gauche
Ex : pour 15,172 28,828
Ex : contre 34,828 66,172
5. Etape 4 : statistique observée
𝑙 𝑐
∗ 2
2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 )
𝜒 =∑ ∑ ∗
𝑛𝑖𝑗
𝑖=1 𝑗=1
(9 − 15,172)2 (35 − 28,828)2 (41 − 34,828)2 (60 − 66,172)2
= + + +
15,172 28,828 34,828 66,172
= 2,511 + 1,321 + 1,094 + 0,576 = 5,502
6. Etape 5 : valeur critique et région critique

χ 2(l-1)(c-1) ; 1- α = χ 2(1)(1) ; .95 = 3,841
➔ RC = ] 3,841 ; + ∞ [
7. Etape 6 : décision statistique
5,5 est dans la RC : RH0 au seuil α =.05
8. Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la fréquence (ou proportion) de
sénateurs de gauches pour la réforme ф1 n’est pas égale à la fréquence (ou proportion) de sénateurs de droites
pour la réforme ф2 de la population parente.

Jeudi 23 mars 2023
J. Exercice
Les lycéens passent le Baccalauréat chaque année, la moyenne est de 12,4 et l’écart-type de 4,3.
Quel pourcentage de lycéens devrait obtenir une note de 13,75 ou moins au Baccalauréat ?
µ = 12,4
x = 13,75
σ = 4,3
𝑥 − µ 13,75 − 12,40 1,35

𝑧= = = = 0,314
𝜎 4,3 4,3
P(Z≤0,314) = 0,6217
Le pourcentage de lycéens ayant obtenu 13,75 ou moins est de 62,17%.
K. Exercice
Trouver la probabilité que Z ≥ à 2,84.
P(Z≤2,84) = 0,9977
P(Z>2,84) = 1 – 0,9977 = 0 ,0023
II. Test d’indépendance de deux variables catégorisées

A. Introduction
On étudie s’il existe un lien.

2 VD/VC (données catégorielles = données qualitatives)
Le χ2 de Pearson/Test d’ajustement
Exercice type :
Le sentiment d’être en forme est-il lié à la pratique d’un sport ?
7 étapes
Nous allons procéder à un test d’indépendance de 2 VC.
Il y a deux VC : les nommer ainsi que leurs modalités + plan

NB : Si α=.05, cela signifie que nous prenons 5% de marge d’erreur
H0 :
Les deux VC ne sont pas liées.
Autre formulation : la VC 1 est indépendante de la VC 2.
H1 :
Les deux VC sont liées
Autre formulation : la VC 1 est dépendante de la VC 2.
‼️ H1 n’est jamais orientée car il n’y a pas de VI ‼️
D. Etape 3 : Statistique de décision et loi sous H0

𝑙
𝑐 2
∗
(𝑛𝑖𝑗 −𝑛𝑖𝑗 )
𝜒2 = ∑ ∑ ∗ Sous H0 de loi χ2 à (l-1)(c-1) ddl = 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
i : ligne
j : colonne
NB : l = nombre de modalité VC 1 ; c = nombre de modalité VC 2
2 CONDITIONS :
VC modalité 1 VC modalité 2 Total marginal

Ex : Majeur Ex : Mineur
VC catégorie 1 250 350 600
Ex : oui 300* 300
VC catégorie 2 250 150 400
Ex : non 200 200
* : 300 = 500 x (600/1000)
Calcul du χ2.
F. Etape 5 : valeur critique et région critique

χ 2(l-1)(c-1) ; 1- α
➔ RC = ] VC ; + ∞ [

Si NRH0 : on ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmée
I. Exercice
1. Enoncé
Nous étudions le temps passé derrière un écran des sujets de différentes filières. Existe-t-il un lien entre le
temps d’écran et la filière des sujets ?
Sachant qu’il y a :
- 500 sujets en tout
- 100 étudiants en économie regardent moins d’une heure par jour leur écran
- 200 étudiants en psychologie regardent plus d’une heure par jour leur écran
- 150 étudiants en économie
Nous allons procéder à un test d’indépendance de 2 VC.
Il y a deux VC :
VC 1 : filière, (économie ; psychologie)
VC 2 : temps d’écran (- 1h ; + 1h)
H0 :
La VC 1 filière est indépendante de la VC 2 temps d’écran.
H1 :
La VC 1 filière est dépendante de la VC 2 temps d’écran.
𝑙
𝑐 2
∗)
𝜒2 = ∑ ∑ ∗ Sous H0 de loi χ2 à 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
NB : l = nombre de modalité VC 1 ; c = nombre de modalité VC 2
2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1 → validée
- Qu’au maximum 20% d’entre eux ≤ 5 → validée
Filière psychologie Filière économie Total marginal

Temps < 1 heure 150 100 250
175 75
Temps > 1 heure 200 50 250
175 75
250
350 × = 175
500
250
150 × = 75
500
𝑙 𝑐
∗ 2
2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 ) (150 − 175)2 (100 − 75)2 (200 − 175)2 (50 − 75)2
𝜒 =∑ ∑ ∗ = + + +
𝑛𝑖𝑗 175 75 175 75
𝑖=1 𝑗=1
25 25 25 25 500
= + + + = = 23,81
7 3 7 3 21

χ 2(l-1)(c-1) ; 1- α = χ 2(1)(1) ; 1-0,05 = χ 21 ; 0,95 = 3,841
➔ RC = ] 3,841 ; + ∞ [
23,81 est dans la RC : RH0 au seuil α = .05.
Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la VC 1 filière est dépendante de la VC
2 temps d’écran.

Jeudi 30 mars 2023
III. Inférence sur des fréquences aux groupes de mesure appariés/répétés

A. Introduction
1 VI aux groupes de mesure appariés/répétés à 2 modalités
1 VD/VC à 2 modalités (données catégorielles = données qualitatives)
➔ χ2 de Max Nemar
Exercice type :
Un échantillon de 1000 personnes pris au hasard ont répondu à la question : « êtes-vous favorable à la
légalisation du cannabis ? ». Nous les interrogeons avant et après un discours favorable à sa légalisation. Parmi
les favorables avant le discours ; 200 sont devenus défavorables et 300 sont restés favorables après. Pouvons-
nous affirmer que le discours est efficace ?
7 étapes
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2, aux groupes de mesure appariés/répétés.
Il y a une VI : « … » avec 2 modalités (« … » ; « … »)
Il y a une VC : « … » avec 2 modalités (« … » ; « … »)

NB : Si α=.05, cela signifie que nous prenons 5% de marge d’erreur
H0 : ф1 = ф2
La fréquence ф1 de gens favorables avant le discours est égale à la fréquence ф2 de gens favorables après le
discours.
H1 : ф1 ≠ ф2 / ф1 < ф2 / ф1 > ф2
La fréquence ф1 de gens favorables avant le discours n’est pas égale / est supérieure / est inférieure à la
fréquence ф2 de gens favorables après le discours.
Avant
Après VC : Catégorie 1 VC : Catégorie 2
Ex : oui Ex : Non
VC : catégorie 1 200 nD1
Ex : oui 300
VC : catégorie 2 Nd2 300
Ex : non 200
Valeur : cases discordantes
Si H1 BL :
(𝑛𝑑1−𝑛𝑑2)2
𝜒2 = (𝑛𝑑1+𝑛𝑑2)
Sous H0 de loi χ2
Si H1 UL :
(𝑛𝑑1−𝑛𝑑2)
𝑧= Sous H0 de loi normale
√(𝑛𝑑1+𝑛𝑑2)
1 CONDITION : nD1 + nD2 ≥ 20

Calcul du χ2 ou Z
F. Etape 5 : Valeur(s) critique(s) et région critique
Si H1 BL :
1 VC : χ 2(l-1)(c-1) ; 1- α
➔ RC = ]VC ; + ∞[
Si H1 UL à droite :
VC1-α(Z) = Z1-α
➔ RC (Z)1-α = ]VC ; +∞[
Si H1 UL à gauche :
1 VC : Zα = - Z1-α
➔ RC (Z)1-α = ]-∞ ; VC[

Si NRH0 : on ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmée
I. Exercice
1. Enoncé
Un échantillon de 1000 personnes avant un discours favorable sur la peine de mort puis après le discours.
Parmi les favorables avant, 200 sont devenus défavorables.
Parmi les défavorables avant, 300 sont devenus favorables.
Il y avait 400 personnes favorables au début.
Pouvons-nous affirmer que le discours est efficace ?
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2, aux groupes de mesure appariés.
Il y a une VI : Phase, avec 2 modalités (Avant ; Après)
Il y a une VD : Favorabilité, avec 2 modalités (Favorable ; Défavorable)
S1000*P2

H0 : ф1 = ф2
La fréquence ф1 de gens défavorables à la peine de mort avant le discours est égale à la fréquence ф2 de gens
défavorables à la peine de mort après le discours.
H1 : ф1 > ф2
La fréquence ф1 de gens défavorables à la peine de mort avant le discours est supérieure à la fréquence ф2 de
gens défavorables à la peine de mort après le discours.
4. Etape 3 : Statistiques de décisions et loi sous H0
Avant
Après Favorable Défavorable
Favorable 200 nD1
300
Défavorable Nd2 300
200
Valeur : cases discordantes
(𝑛𝑑1−𝑛𝑑2)
𝑧= Sous H0 de loi normale
√(𝑛𝑑1+𝑛𝑑2)
1 CONDITION : nD1 + nD2 ≥ 20
(𝑛𝑑1 − 𝑛𝑑2) 300 − 200

𝑧= = = 4,472
√(𝑛𝑑1 + 𝑛𝑑2) √(300 + 200)
VC1-α(Z) = Z1-α = Z.95 = 1,645

➔ RC (Z)1-α = ]1,645 ; +∞[
4,472 est dans la RC : RH0 au seuil α = .05
On peut affirmer avec moins de 5% de risque de se tromper que la fréquence ф1 de gens défavorables avant le
discours est supérieure à la fréquence ф2 de gens défavorables après le discours. → H1 est affirmée
Le discours est donc bien efficace.
J. Exercice
P(0 < Z < 1,84) = ?
P(Z<1,84) = 0,9671
P(Z<0) = 0,5
P(Z<1,84) – P(Z<0) = 0,9671 – 0,5 = 0,4671
P(0<Z<1,84) = 0,4671
Jeudi 06 avril 2023
IV. Révisions
A. Exercice 1
1. Enoncé
Des chercheurs se sont penchés sur la thérapie familiale dans le traitement de l’anorexie. L’expérience porte
sur 17 jeunes filles qui ont été pesées avant et après le traitement (poids en livres).
Le poids moyen avant le traitement est de 83,23, tandis que celui après traitement est de 90,49 (écart-type des
différences : 7,16).
Le traitement par thérapie familiale est-il un moyen efficace ?
2. Traduction de l’énoncé
Marge d’erreur : 5%
N = 17
Sd = 7,16
Xd = x2 – x1 = 90,49 – 83,23 = 7,26
µ0 = 0
Nous allons procéder à une inférence sur une moyenne des différences µd comparée à la norme µ0 égale à 0.
VI : poids (avant ; après)
S17*P2
On prendra le seuil = .05
H0 : µd=µ0
H1 : µd>µ0
La moyenne µd de la population parente des différences est supérieure à la moyenne µ0 égale à 0.
̅̅̅̅
𝑥𝑑
𝑇= 𝑠 Sous H0 de loi Student à 16 ddl
( 𝑑)
√𝑛
A CONDITION que les populations parentes des échantillons soient normales.
𝑥
̅̅̅
𝑑 7,26
𝑇= = = 4,181
𝑠𝑑 7,16
( ) ( )
√𝑛 √17
7. Etape 5 : valeur(s) critique(s) et région critique
VC1-α (Tn-1) = Tn-1 ;1-α = T16 ; .95 = 1,746

➔ RC(T16).95 = ] 1,746 ; + ∞[
4,181 est dans la RC : RH0 au seuil α = .05
On peut affirmer avec moins de 5% de risque de se tromper que la moyenne µd de la population parente des
différences est supérieure à la moyenne µ0 égale à 0.
Le traitement par thérapie familiale est donc un moyen efficace.
B. Exercice 2
1. Enoncé
Des chercheurs souhaitent étudier l’impact d’un message pro-environnement sur le comportement des
individus.
Ils créent 2 groupes : un groupe contrôle qui reçoit un message neutre (les promotions du jour) et un autre
groupe reçoit un message « ne pas jeter sur la voie publique, utiliser les poubelles ».
Ils comptent le nombre de papiers mis dans la poubelle, ceux jetés par terre et ceux non retrouvés (enlevés).
Voici les résultats :
ENDROIT
GROUPE CONTROLE MESSAGE
POUBELLE 41 80
JETES 385 290
ENLEVES 477 499
Pouvons-nous affirmer que le message pro-environnement a un impact sur le devenir du papier ?
Nous allons procéder à une inférence sur deux fréquence ф1 et ф2 aux groupes de mesure indépendants.
Il y a une VI : Groupe, avec 2 modalités (Contrôle ; Message)

Il y a une VD : Endroit, à 3 modalités (Poubelle ; Jetés ; Enlevés)
H0 : ф1 = ф2
La fréquence de papiers jetés du groupe contrôle ф1 est égale à la fréquence de papiers jetés du groupe
message ф2 de la population parente.
H1 : ф1 ≠ ф2
La fréquence de papiers jetés du groupe contrôle ф1 n’est pas égale à la fréquence de papiers jetés du groupe
message ф2 de la population parente.
𝑙
𝑐 2
∗)
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à 2 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
i : ligne
j : colonne
NB : l = nombre de modalité VI ; c = nombre de modalité VD
2 CONDITIONS :
ENDROIT Total
GROUPE CONTROLE MESSAGE
POUBELLE 41 80 121
61,661 59,339
JETES 385 290 675
343,976 331,024
ENLEVES 477 499 976
497,363 478,637
Total 903 869 1772
𝑙 𝑐
∗ 2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 )
𝜒22 =∑ ∑ ∗
𝑛𝑖𝑗
𝑖=1 𝑗=1
(41 − 61,661)2 (80 − 59,339)2 (385 − 343,976)2 (290 − 331,024)2
= + + +
61,661 59,339 343,976 331,024
(477 − 497,363)2 (499 − 478,637)2
+ +
497,363 478,637
= 6,923 + 7,194 + 4,893 + 5,084 + 0,834 + 0,866 = 25,794
χ 2(l-1)(c-1) ; 1- α = χ 22 ; .95 = 5,991

➔ RC = ] 5,991 ; + ∞ [
25,794 est dans la RC : RH0 au seuil α =.05

On peut affirmer avec moins de 5% de risque de se tromper que la fréquence de papiers jetés du groupe
contrôle ф1 n’est pas égale à la fréquence de papiers jetés du groupe message ф2 de la population parente.
Le message pro-environnement a donc un impact sur le devenir du papier.

CM de Chloé

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

CM de Chloé

Transféré par

Droits d'auteur :

Formats disponibles

CM1 – Statistiques inférentielles

Jeudi 12 janvier 2023

Population parente Echantillon

B. Théorie du test d’hypothèse

Exemple : Le fait d’avoir un chien augmente-t-il l’empathie chez les personnes ?

➔ Nous traçons la distribution d’échantillonnage de la statistique en question en supposant que H0 soit

C. Tests unilatéraux (UL) // Tests bilatéraux (BL)

D. Erreurs de type I et de type II

Partie A : Inférence sur une / des moyennes

B. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur une moyenne.

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé ».

D. Etape 3 : Statistique de décision et loi sous H0

A CONDITION que la population parente de l’échantillon suive la loi normale.

E. Etape 4 : Statistique observée

F. Etape 5 : Valeur(s) critique(s) et région critique

G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil a = « seuil »

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

Ψ Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur une moyenne.

On prendre le seuil α = .05

Ψ Etape 3 : statistique de décision et loi sous H0

A CONDITION que la population parente de l’échantillon suive la loi normale.

Ψ Etape 4 : statistique observée

Ψ Etape 5 : valeur(s) critique(s) et région critique

Ψ Etape 6 : décision statistique

La statistique observée 40,768 est dans la RC : RH0 au seuil α = .05

ATTENTION on conclut par rapport à H1 ! PAS par rapport à H0.

CM2 – Statistiques inférentielles

II. Inférence sur deux moyennes aux groupes de mesure appariés/répétés

B. Etape 1 : identification de la problématique

Plan d’expérience : Snb sujet*Cnb modalités

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé ».

H1 : µ1≠µ2 / µ1<µ2 / µ1>µ2

H1 : µd≠µ0 / µd<µ0 / µd>µ0

D. Etape 3 : statistique de décision et loi sous H0

A CONDITION que les populations parentes des échantillons soient normales.

E. Etape 4 : statistique observée

F. Etape 5 : valeur(s) critique(s) et région critique

G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil »

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

Ψ Etape 1 : identification de la problématique

Plan d’expérience : S10*S2

On prendra le seuil α = .05

Ψ Etape 3 : statistique de décision et loi sous H0

Sous H0 de loi Student à n-1 ddl. (ddl = degré de liberté = 10 – 1 = 9)

A condition que les populations parentes des échantillons soient normales.

Ψ Etape 4 : statistique observée

Ψ Etape 5 : valeur(s) critique(s) et région critique

Ψ Etape 6 : décision statistique

Si la statistique observée 7,22 est dans la RC : RH0 au seuil α = .05

CM3 – Statistiques inférentielles

7 étapes AVEC dans certains cas un test d’homogénéité des variances.

B. Etape 1 : identification de la problématique

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé »

D. Etape 3 : statistique de décision et loi sous H0

Si n1 OU n2 < 60 (ou les deux) :

E. Etape 4 : statistique observée

Si n1 OU n2 < 60 (ou les deux) :

F. Etape 5 : valeur(s) critique(s) et région critique

Si n1 OU n2 < 60 (ou les deux) :

G. Etape 6 : décision statistique