Vous êtes sur la page 1sur 31

CM1 – Statistiques inférentielles

Jeudi 12 janvier 2023

Programme :
- Inférence
o Moyenne (quanti)
▪ Sur une moyenne
▪ Sur 2 moyennes aux groupes de mesures indépendants
▪ Sur 2 moyennes aux groupes de mesures appariés/répétés
o Fréquence (quali)
▪ Sur des fréquences aux groupes de mesure indépendants
▪ Test d’indépendance de deux variables catégorisées
▪ Sur 2 fréquences aux groupes de mesure répétés

PARTIE I : MOYENNE
I. Introduction
A. Population parente // Echantillon

Population parente Echantillon


Effectif N n
Moyenne µ 𝑥̅
Ecart-type σ S
Variance σ2 S2

B. Théorie du test d’hypothèse

Exemple : Le fait d’avoir un chien augmente-t-il l’empathie chez les personnes ?

Principe : La différence obtenue est-elle trop grande pour qu’on puisse l’attribuer à la chance ?

Nous nous questionnons sur le rôle de la chance dans les résultats obtenus.
Objectif : trouver un moyen de déterminer si les différences observées dans le cas d’un échantillon sont :
- Peu importante → dû au hasard
- Si elles sont suffisamment importantes → on peut rejeter le rôle de la chance → cela nous incite à
croire que notre hypothèse est vraie (mais ce n’est pas forcément le cas)

Pour cela : nous utilisons les distributions d’échantillonnage d’une statistique : elles nous indiquent à quel degré
de variabilité due au hasard nous pouvons nous attendre d’un échantillon à l’autre sur la base d’une erreur
d’échantillonnage
➔ Elles évaluent la probabilité de voir si ces conditions prédéfinies existent réellement

2 types d’hypothèses :
- Hypothèse de recherche (H1) : les échantillons sont issus de deux populations différentes µ1 et µ2
- Hypothèse nulle (H0) : les échantillons sont issus de la même population parente µ

➔ Nous traçons la distribution d’échantillonnage de la statistique en question en supposant que H0 soit


vraie pour comparer la statistique de l’échantillon (données recueillies) à cette distribution

En fonction de la probabilité, selon H0, nous rejetons ou conservons H0 d’arriver à une statistique d’échantillon
aussi extrême que celle que nous avons obtenue.

C. Tests unilatéraux (UL) // Tests bilatéraux (BL)


2 possibilités pour H1 :
- Test unilatéral : H1 UL = nous précisons la direction dans laquelle l’individu s’écarte de la moyenne et
que notre surface de rejet se situe dans une seule partie de la distribution (gauche ou droite). Exemple :
les personnes qui ont un chien sont plus empathiques que celles qui n’en ont pas.
- Test bilatéral : H1 BL = nous précisons la direction dans laquelle l’individu s’écarte de la moyenne et
notre surface de rejet se situe dans les deux parties de la distribution (gauche ET droite). Exemple : les
personnes qui ont un chien n’ont pas le même niveau d’empathie que celles qui n’en ont pas.

D. Erreurs de type I et de type II

Lorsque nous prenons une décision dans le cadre d’un test statistique, il y a toujours un risque que notre
décision soit la mauvaise.

- Erreur de type I : α = rejeter H0 alors qu’elle est vraie → affirmer H1 alors qu’on n’aurait pas dû !
- Erreur de type II : β = ne pas rejeter H0 alors qu’elle était fausse → ne pas affirmer H1 alors qu’on aurait
dû !

Erreur de type I :
= Affirmer H1 alors qu’on n’aurait pas dû
En choisissant la plus grande valeur (table t), j’augmente la VC → je diminue la RC → je diminue les chances
d’affirmer H1.

Erreur de type II :
= Ne pas affirmer H1 alors qu’on aurait dû
NRH0 alors qu’il fallait RH0
En augmentant α → j’augmente la RC → j’augmente les chances d’affirmer H1 → je diminue le risque d’erreur
de type 2.

Partie A : Inférence sur une / des moyennes


I. Inférence sur une moyenne
A. Introduction

1 moyenne

Exercice type :
Un échantillon de 60 étudiants pris au hasard ont un QI moyen de 110 (s = 1,9). Peut-on revendiquer que les
étudiants ont un QI supérieur à la norme en France (100) ?

Il y a 7 étapes.

B. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur une moyenne.

Nous allons comparer la moyenne µ de la population parente d’où est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à « moyenne dans l’énoncé ».

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé ».


NB : Si α=.05, cela signifie que nous prenons 5% de marge d’erreur.

C. Etape 2 : Hypothèses

H0 : µ=µ0
La moyenne µ de la population parente, d’où est extrait l’échantillon, est égale à µ0.
H1 : µ≠µ0 / µ<µ0 / µ>µ0
La moyenne µ de la population parente, d’où est extrait l’échantillon, est différente / inférieure / supérieure à
µ0.

D. Etape 3 : Statistique de décision et loi sous H0

Si n ≥ 60 :

𝑥̅ −µ0
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1
( )
√𝑛

Si n < 60 :

𝑥̅ −µ0
𝑇= 𝑠 Sous H0 de loi Student à n-1 ddl (ddl = degré de liberté = effectif – 1)
( )
√𝑛

A CONDITION que la population parente de l’échantillon suive la loi normale.

E. Etape 4 : Statistique observée

Si n ≥ 60 :
Calcul du Z

Si n < 60 :
Calcul du T

F. Etape 5 : Valeur(s) critique(s) et région critique

Si n ≥ 60 :

Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Z) = Z1- α /2
- Gauche : VC α /2(Z) = Z α /2 = - Z1- α /2
➔ RC(Z)1- α /2 = ]-∞ ; Z α /2[𝑈] Z1- α /2 ; + ∞[

Si H1 UL à droite : 1 VC :
VC1- α (Z) = Z1- α
➔ RC(Z)1- α = ] Z1- α ; + ∞[

Si H1 UL à gauche : 1 VC :
VCa(Z) = Z α = - Z1- α
➔ RC(Z)1- α = ] -∞ ; Z α [

Si n < 60 :

Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Tn-1) = Tn-1 ;1- α /2
- Gauche : VC α /2(Tn-1) = Tn-1 ; α /2 = -Tn-1 ;1- α /2
➔ RC(Tn-1)1-α/2 = ]-∞ ; Tn-1 ;α/2 [𝑈] Tn-1 ;1- α /2 ; + ∞[

Si H1 UL à droite : 1 VC :
VC1- α (Tn-1) = Tn-1 ;1- α
➔ RC(Tn-1)1- α = ] Tn-1 ;1- α ; + ∞[
Si H1 UL à gauche : 1 VC :
VC α (Tn-1) = Tn-1 ; α = - Tn-1 ;1- α
➔ RC(T)n-1 ;1- α = ] -∞ ; Tn-1 ; α [

NB : SI T(n-1) ne figure pas dans la table, choisir la plus grande valeur pour éviter l’erreur de type 1.

G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil a = « seuil »


NB : j’ai eu tord de partir d’H0 → je rejette H0

Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil a= « seuil »
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant

H. Etape 7 : Conclusion

Si RH0 : on peut affirmer avec moins d’ α *100% de risque de se tromper que H1 « … » → H1 est affirmé

Si NRH0 : on ne peut pas affirmer avec moins d’ α *100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmé

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

I. Exercice

Enoncé : 60 étudiants de psychologie pris au hasard ont un QI de 110 (s=1,9). Peut-on revendiquer que les
étudiants ont un QI supérieur à la norme (100) ? Seuil .05

Ψ Traduction de l’énoncé

𝑥̅ = 110
𝑠 = 1,9
α = .05
µ0 = 100
𝑛 = 60

Ψ Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur une moyenne.

Nous allons comparer la moyenne µ de la population parente d’où elle est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à 100.

On prendre le seuil α = .05

Ψ Etape 2 : hypothèses

H0 : µ = µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est égale à µ0.

H1 : µ>µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est supérieure à µ0.

Ψ Etape 3 : statistique de décision et loi sous H0

n ≥ 60 :
𝑥̅ − µ0
𝑍= 𝑠
( )
√𝑛
Sous H0 de loi normale centrée réduite

A CONDITION que la population parente de l’échantillon suive la loi normale.

Ψ Etape 4 : statistique observée

𝑥̅ − µ0
𝑍= 𝑠
√𝑛

110 − 100
𝑍= ≈ 40,768
1,9
√60

Ψ Etape 5 : valeur(s) critique(s) et région critique

n ≥ 60 :
H1 UL à droite : 1 VC :
VC1- α (Z) = Z1- α
= Z.95
= 1,645
➔ RC(Z)1-a = ]1,645 ; +∞[

Ψ Etape 6 : décision statistique

La statistique observée 40,768 est dans la RC : RH0 au seuil α = .05

Ψ Etape 7 : conclusion

Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la moyenne µ de la population parente
d’où est extrait l’échantillon est supérieure à µ0.

ATTENTION on conclut par rapport à H1 ! PAS par rapport à H0.

CM2 – Statistiques inférentielles


Jeudi 26 janvier 2023

II. Inférence sur deux moyennes aux groupes de mesure appariés/répétés


A. Introduction

2 moyennes aux groupes de mesure appariés/répétés : si le sujet est passé par toutes les modalités de la
variable.

Exercice type :
10 athlètes améliorent en moyenne leur score de 103,2 ms (s=45,2) suite à un entraînement. Ils sont plus
rapides. L’entrainement est-il efficace ?

7 étapes

B. Etape 1 : identification de la problématique


Nous allons procéder à une inférence sur deux moyennes µ1 et µ2, aux groupes de mesure appariés/répétés.

Autre formulation : nous allons procéder à une inférence sur une moyenne de différence µd à la norme µ0 (=0)

Plan d’expérience : Snb sujet*Cnb modalités

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé ».


NB : Si α =.05, cela signifie que nous prenons 5% de marge d’erreur.

C. Etape 2 : hypothèses

H0 : µ1=µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est égale à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n2.

H0 : µd=µ0
La moyenne µd de la population parente des différences est égale à la moyenne µ0 égale à 0.

H1 : µ1≠µ2 / µ1<µ2 / µ1>µ2


La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente/inférieure/supérieure à
la moyenne µ2 de la population parente d’où est extrait l’échantillon n2.

H1 : µd≠µ0 / µd<µ0 / µd>µ0


La moyenne µd de la population parente des différences est différente/inférieure/supérieure à la moyenne µ0
égale à 0.

D. Etape 3 : statistique de décision et loi sous H0

Si n ≥ 60 :

̅̅̅̅
𝑥𝑑
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1.
( 𝑑)
√𝑛

Si n < 60 :

̅̅̅̅
𝑥𝑑
𝑇= 𝑠 Sous H0 de loi Student à n-1 ddl. (ddl = degré de liberté = effectif – 1)
( 𝑑)
√𝑛

A CONDITION que les populations parentes des échantillons soient normales.

E. Etape 4 : statistique observée

Si n ≥ 60 :
Calcul du Z

Si n < 60 :
Calcul du T

F. Etape 5 : valeur(s) critique(s) et région critique

Si n≥ 60 :

Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Z) = Z1- α /2
- Gauche : VC α /2(Z) = Z α /2 = - Z1- α /2
➔ RC(Z)1- α /2 = ]-∞ ; Z α /2[𝑈] Z1- α /2 ; + ∞[
Si H1 UL à droite : 1 VC :
VC1-α (Z) = Z1-α
➔ RC(Z)1-α = ] Z1-α ; + ∞[

Si H1 UL à gauche : 1 VC :
VCα (Z) = Zα = - Z1-α
➔ RC(Z)1-α = ] -∞ ; Zα [

Si n < 60 :

Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1-α/2(Tn-1) = Tn-1 ;1-α/2
- Gauche : VCα/2(Tn-1) = Tn-1 ; α/2 = -Tn-1 ;1-α/2
➔ RC(Tn-1)1-α/2 = ]-∞ ; Tn-1 ; α/2 [𝑈] Tn-1 ;1-α/2 ; + ∞[

Si H1 UL à droite : 1 VC :
VC1-α (Tn-1) = Tn-1 ;1-α
➔ RC(Tn-1)1-α = ] Tn-1 ;1-α ; + ∞[

Si H1 UL à gauche : 1 VC :
VCα (Tn-1) = Tn-1 ; α = - Tn-1 ;1-α
➔ RC(T)n-1 ;1-α = ] -∞ ; Tn-1 ; α [

G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil »


NB : j’ai eu tord de partir de H0 → je rejette H0.

Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α= « seuil »
NB : je ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.

H. Etape 7 : conclusion

Si RH0 : On peut affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 est affirmée

Si NRH0 : On ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est
pas affirmée

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

I. Exercice

Enoncé : 10 athlètes améliorent en moyenne leur score de 103,2 ms (sd = 45,2) suite à un entraînement. Ils sont
plus rapides. L’entraînement est-il efficace ? α=.05

Ψ Traduction de l’énoncé

Marge d’erreur = 5%
N = 10
Sd = 45,2
xd = 103,2
µ0 = 0

Ψ Etape 1 : identification de la problématique


Nous allons procéder à une inférence sur une moyenne des différences µd comparée à la norme µ0 =0.

VI : score
S1 : avant
S2 : après

VD : temps en ms

Plan d’expérience : S10*S2

On prendra le seuil α = .05

Ψ Etape 2 : hypothèses

H0 : µd=µ0
La moyenne µd de la population parente des différences est égale à la moyenne µ0 égale à 0.

H1 : µd>µ0
La Moyenne µd de la population parente des différences est supérieure à la moyenne µ0 égale à 0.

Ψ Etape 3 : statistique de décision et loi sous H0

Si n < 60 :

̅̅̅̅
𝑥𝑑
𝑇= 𝑠
( 𝑑)
√𝑛

Sous H0 de loi Student à n-1 ddl. (ddl = degré de liberté = 10 – 1 = 9)

A condition que les populations parentes des échantillons soient normales.

Ψ Etape 4 : statistique observée

𝑥
̅̅̅
𝑑 103,2
𝑇= = = 7,22
𝑠 45,2
( 𝑑) ( )
√𝑛 √10

Ψ Etape 5 : valeur(s) critique(s) et région critique

Si H1 UL à droite : 1 VC :
VC.95(T9) = T9;.95 = 1,833
➔ RC(Tn-1)1-α = ] 1,833 ; + ∞[

Ψ Etape 6 : décision statistique

Si la statistique observée 7,22 est dans la RC : RH0 au seuil α = .05

Ψ Etape 7 : conclusion

Si RH0 : On peut affirmer avec moins de 5% de risque de se tromper que la moyenne µd de la population
parente des différences est supérieure à la moyenne µ0 égale à 0.
→ H1 est affirmée

CM3 – Statistiques inférentielles


Jeudi 02 février 2023
III. Inférence sur deux moyennes aux groupes de mesure indépendants
A. Introduction

2 moyennes aux groupes de mesure indépendants = le sujet passe par une seule modalité de la variable.

Exercice type :
Lors d’un test d’attention, les sujets sont répartis en deux groupes : les – de 50 ans et les + de 50 ans.
La moyenne du premier groupe (- de 50 ans) de 42 personnes est de 25 (s = 4,6).
La moyenne du second groupe (+ de 50 ans) est de 48 personnes est de 27 (s = 5,1).
Peut-on revendiquer que l’âge a un impact sur l’attention ?

7 étapes AVEC dans certains cas un test d’homogénéité des variances.

B. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux moyenne µ1 et µ2, aux groupes de mesure indépendants.

Nous allons comparer la moyenne µ1 de la population parente d’où est extrait l’échantillon n1 à la moyenne µ2
de la population parente d’où est extrait l’échantillon n2.

Plan d’expérience : Snb de sujets par modalité < Gnb modalités >

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé »


NB : Si α = .05, cela signifie que nous prenons 5% de marge d’erreur

C. Etape 2 : hypothèses

H0 : µ1 = µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est égale à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n 2.
➔ Les échantillons sont extraits de la même population parente dont la moyenne est µ.

H1 : µ1 ≠ µ2 / µ1 < µ2 / µ1 > µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente / supérieure / inférieure
à la moyenne µ2 de la population parente d’où est extrait l’échantillon n2.
➔ Les deux échantillons sont extraits de deux populations parentes µ1 et µ2 différentes.

D. Etape 3 : statistique de décision et loi sous H0

Si n1 ET n2 ≥ 60 :

𝑥̅ 1−𝑥̅ 2
𝑧= Sous H0 de loi normale centrée sur 0 et de variance 1.
𝑠 2𝑠 2
√( 1 − 2 )
𝑛1 𝑛2

Si n1 OU n2 < 60 (ou les deux) :

𝑥̅ 1−𝑥̅ 2
𝑇= 1 1
Sous H0 de loi Student à n-2 ddl (ddl = degré de liberté = effectif – 2)
∗2
√𝑆 ×(𝑛 +𝑛 )
1 2
(𝑛1 −1)×𝑆12+(𝑛2 −1)×𝑆22
Variance pondérée : 𝑆 ∗2 = 𝑛1 +𝑛2 −2

2 CONDITIONS :
- Que les populations parentes de l’échantillon soient normales
- Que les variances de populations parentes soient homogènes
o A VERIFIER UNIQUEMENT SI T de Student : Test d’homogénéité des variances
▪ Si ok : on continue la suite des étapes
▪ Sinon : on arrête le test d’inférence

E. Etape 4 : statistique observée

Si n1 ET n2 ≥ 60 :
Calcul du Z

Si n1 OU n2 < 60 (ou les deux) :


Calcul du T

F. Etape 5 : valeur(s) critique(s) et région critique

Si n1 ET n2 ≥ 60 :

Si H1 BL : 2VC :
Droite : VC1-α/2(Z) = Z1-α/2
Gauche : VCα/2(Z) = Zα/2 = - Z1-α/2
➔ RC(Z)1-α/2 = ] - ∞ ; Zα/2 [𝑈] Z1-α/2 ; + ∞ [

Si H1 UL à droite : 1 VC :
VC1-α (Z) = Z1-α
➔ RC(Z)1-α = ] Z1-α ; + ∞ [

Si H1 UL à gauche : 1 VC :
VCα (Z) = Zα = - Z1-α
➔ RC(Z)1-α = ] - ∞ ; Zα [

Si n1 OU n2 < 60 (ou les deux) :

Si H1 BL : 2VC :
Droite : VC(T(n1+n2-2))1-α/2 = T(n1+n2-2)1-α/2
Gauche : VC(T(n1+n2-2)) α/2 = T(n1+n2-2) α/2 = - T(n1+n2-2)1-α/2
➔ RC(T(n1+n2-2))1-α/2 = ] - ∞ ; T(n1+n2-2) α/2 [𝑈] T(n1+n2-2)1-α/2 ; + ∞ [

Si H1 UL à droite : 1 VC :
VC(T(n1+n2-2))1-α = T(n1+n2-2)1-α
➔ RC(Tn1+n2-2)1-α = ] Tn-1 ;1-α ; + ∞ [

Si H1 UL à gauche : 1 VC :
VC(T(n1+n2-2)) α = T(n1+n2-2) α = - T(n1+n2-2)1-α
➔ RC(T)n1+n2-2 ; 1-α = ] - ∞ ; T(n1+n2-2) α [

NB : SI T(n1+n2-2) ne figure pas dans la table, choisir la plus grande valeur pour éviter l’erreur de type 1.

G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil ».


NB : J’ai eu tord de partir d’H0 → je rejette H0

Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α = « seuil ».
NB : On ne rejette pas H0 mais on ne peut pas l’affirmer pour autant

H. Etape 7 : conclusion
Si RH0 :
On peut affirmer avec moins d’α*100% de risque de se tromper que H1 « … ».
➔ H1 est affirmée

Si NRH0 :
On ne peut pas affirmer avec moins d’α*100% de risque de se tromper que H1 « … ».
➔ H1 n’est pas affirmée

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

I. Exercice

Enoncé : Nous cherchons à mesurer l’efficacité d’un traitement contre la maladie d’Alzheimer. Nous comptons
le nombre d’items bien reportés auprès d’un groupe de personnes.
La moyenne d’un premier groupe constitué de 42 adultes malades est de 25,5 (s = 4,6).
La moyenne d’un second groupe de 48 malades mais traités avec ce traitement est de 27,9 (s = 5,1).
Existe-t-il une différence entre les personnes malades qui prennent le traitement et celles qui ne le prennent
pas ?

ATTENTION : nous partons du principe que les variances sont homogènes α = .05

Ψ Traduction de l’énoncé

Marge d’erreur = 5%
N1 = 42
S1 = 4,6
X1 = 25,5
N2 = 48
S2 = 5,1
X2 = 27,9

Ψ Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux moyenne µ1 et µ2, aux groupes de mesure indépendants.

Nous allons comparer la moyenne µ1 de la population parente d’où est extrait l’échantillon n1 à la moyenne µ2
de la population parente d’où est extrait l’échantillon n2.

VI : groupe
1 : groupe 1
2 : groupe 2

VD : nombre d’items bien reportés

Plan d’expérience : S90/2 < G2 >

On prendra le seuil α = .05

Ψ Etape 2 : hypothèses

H0 : µ1 = µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est égale à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n 2.

H1 : µ1 ≠ µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n 2.

Ψ Etape 3 : statistique de décision et loi sous H0

Si n1 OU n2 < 60 (ou les deux) :

𝑥̅1 − 𝑥̅ 2
𝑇88 =
1 1
√𝑆 ∗2 × (𝑛 + 𝑛 )
1 2

(𝑛1 −1)×𝑆12+(𝑛2 −1)×𝑆22 (42−1)×21,16+(48−1)×26,01 2090,03


Variance pondérée : 𝑆 ∗2 = = = = 23,75
𝑛1 +𝑛2 −2 42+48−2 88

Sous H0 de loi Student à n-1 ddl (ddl = degré de liberté = effectif – 1)

2 CONDITIONS :
- Que les populations parentes de l’échantillon soient normales
- Que les variances de populations parentes soient homogènes
o SI t de Student : Vérifier ; Test d’homogénéité des variances

Ψ Etape 4 : statistique observée

𝑥̅1 − 𝑥̅2 25,5 − 27,9


𝑇88 = = = −2,331
1 1
√𝑆 ∗2 ×( + ) √23,75 × ( 1 + 1 )
𝑛1 𝑛2 42 48

Ψ Etape 5 : valeur(s) critique(s) et région critique

Si H1 BL : 2VC :
Droite : VC(T88).975 = T88 ; .975 = 1,99
Gauche : VC(T88).025 = T88 ; .025= - T88 ; .975 = -1,99
➔ RC(T88).975 = ] - ∞ ; -1,99 [𝑈] 1,99 ; + ∞ [

Ψ Etape 6 : décision statistique

Si la statistique observée -2,331 est dans la RC : RH0 au seuil α = .05.

Ψ Etape 7 : conclusion

On peut affirmer avec moins d’α*100% de risque de se tromper que La moyenne µ1 de la population parente
d’où est extrait l’échantillon n1 est différente à la moyenne µ2 de la population parente d’où est extrait
l’échantillon n2.
➔ H1 est affirmée

Donc il y a une différence entre les patients traités et non traités.

CM4 – Statistiques inférentielles


Jeudi 9 février 2023

IV. Test d’homogénéité des variances


A. Introduction

Après l’étape 3 de l’inférence sur deux moyennes aux groupes de mesure indépendants.
S’il y a utilisation du T de Student.

7 étapes

Si c’est homogène : on peut continuer le test d’inférence sur deux moyennes aux groupes de mesure
indépendants.

B. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux variances σ12 et σ22.

On prendra le seuil α = .10 !


➔ 10% de risque d’erreur

NB : α = .10 pour éviter l’erreur de type 2 !

C. Etape 2 : hypothèses

H0 : σ12 = σ22
Les variances σ12 et σ22 sont homogènes.

H1 : σ12 ≠ σ22
Les variances σ12 et σ22 ne sont pas homogènes.

D. Etape 3 : statistique de décision et loi sous H0


𝑠2
𝐹(𝑛1 − 1; 𝑛2 − 1) = 𝑠12 Sous H0 de loi F-S (Fischer-Snedecor) à (n1-1 ; n2-1) ddls.
2
➔ PAS de loi normale (>0)

E. Etape 4 : F observé

Calcul du F.

F. Etape 5 : valeur(s) critique(s) et région critique

2 VC :

1 VC à droite :
VCα=.10 : F(n1-1 ; n2-1) ; 1-α/2 = F(n1-1 ; n2-1).95

1 VC à gauche :
VCα=.10 : - F(n1-1 ; n2-1) ; 1-α/2 = F(n1-1 ; n2-1) α/2
1
𝐹(𝑛1 − 1; 𝑛2 − 1)𝛼∕2 =
𝐹(𝑛2 − 1; 𝑛1 − 1)1−𝛼⁄2
➔ RCα=.10 F(n1-1;n2-1) = ] 0 ; F(n1-1 ; n2-1) α/2 [𝑈] F(n1-1 ; n2-1)1-α/2 ; +∞ [

NB: SI F(n1-1;n2-1) ne figure pas dans la table, choisir la valeur voisine la plus petite pour éviter l’erreur de type
2.

G. Etape 6 : décision statistique

Si le F observé « valeur observée en 4 » est dans la RC : RH0 au seuil α = .10.


NB : J’ai eu tord de partir d’H0 → je rejette H0.
Si le F observé « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α = .10.
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.

H. Etape 7 : conclusion

Si RH0 : On peut affirmer avec moins de 10% de risque de se tromper que H1 « … »


➔ H1 est affirmé

Si NRH0 : On ne peut pas affirmer avec moins de 10% de risque de se tromper que H1 « … ».
➔ H1 n’est pas affirmé
➔ On considère les variances comme homogènes
➔ On continue le test d’inférence sur 2 moyennes aux groupes de mesure indépendants.

I. Exercice

Enoncé : Nous cherchons à mesurer l’efficacité d’un traitement contre la maladie d’Alzheimer. Nous comptons
le nombre d’items bien reportés auprès d’un groupe de personnes.
La moyenne d’un premier groupe constitué de 42 adultes malades est de 25,5 (s = 4,6).
La moyenne d’un second groupe de 48 malades mais traités avec ce traitement est de 27,9 (s = 5,1).

Les variances sont-elles homogènes ?

Ψ Traduction de l’énoncé

σ1 = 4,6
σ2 = 5,1
n1 = 42
n2 = 48

Ψ Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux variances σ12 et σ22.

On prendra le seuil α = .10

Ψ Etape 2 : hypothèses

H0 : σ12 = σ22
Les variances σ12 et σ22 sont homogènes.

H1 : σ12 ≠ σ22
Les variances σ12 et σ22 ne sont pas homogènes.

Ψ Etape 3 : statistique de décision et loi sous H0

𝑠2
𝐹(𝑛1 − 1; 𝑛2 − 1) = 𝑠12 Sous H0 de loi F-S (Fischer-Snedecor) à (𝑛1 − 1; 𝑛2 − 1) ddls.
2

Ψ Etape 4 : F observé

𝑠12
𝐹(𝑛1 − 1; 𝑛2 − 1) =
𝑠22
4,62
𝐹(41; 47) = = 0,814
5,12
Ψ Etape 5 : valeur(s) critique(s) et région critique

1 VC à droite :
VCα=.10 F(n1-1 ; n2-1)1-α/2 = F(41 ; 47).95 ≈ F(45 ; 48).95 ≈ 1,62

1 VC à gauche :
VCα=.10 : - F(n1-1 ; n2-1) ; 1-α/2 = F(41 ; 47).05
On choisit la plus petite valeur F(50 ; 42).95 ≈ 1,65
1 1 1
𝐹(𝑛1 − 1; 𝑛2 − 1)𝛼∕2 = = = = 0,61
𝐹(𝑛2 − 1; 𝑛1 − 1)1−𝛼⁄2 𝐹(47 ; 41).95 1,65
➔ RCα=.10 F(n1-1;n2-1) = ] 0 ; F(n1-1 ; n2-1) α/2 [𝑈] F(n1-1 ; n2-1)1-α/2 ; +∞ [
➔ RCα=.10 F(41;47) = ] 0 ; 0,61 [𝑈] 1,62 ; +∞ [

Ψ Etape 6: decision statistique

Si le F observé 0,814 n’est PAS dans la RC : NRH0 au seuil α = .10.


On ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.

Ψ Etape 7 : conclusion

Si NRH0 : on ne peut pas affirmer avec moins de 10% de risque de se tromper que les variances σ12 et σ22 ne
sont pas homogènes.
➔ H1 n’est pas affirmé
➔ On considère les variances comme homogènes
➔ On continue le test d’inférence sur 2 moyennes aux groupes de mesure indépendants.

CM5 – Statistiques inférentielles


Jeudi 9 mars 2023

V. Révisions
A. Exercice 1
1. Enoncé

Si un échantillon est tiré aléatoirement d’une population parente normale, quelle est la probabilité que sa note
z soit comprise entre 0 et 0,8 ?

2. Réponse

Toujours faire un schéma pour essayer de comprendre ce qu’on cherche.


p(A) = p(Z<0,8) – p(Z<0)
p(Z≤0) = 0,5000
p(Z<0,8) = 0,7881
p(A) = 0,7881 – 0,5000
p(A) = 0,2881

La probabilité que Z soit compris entre 0 et 0,8 est de 0,2881, soit 28,81%.

B. Exercice 2
1. Enoncé

Nous souhaitons mieux comprendre le trouble du spectre de l’autisme. Nous mesurons la durée du sommeil de
80 enfants atteints de TSA. La moyenne est de 8h, l’écart-type est de 2,5. La durée moyenne du sommeil chez
les enfants en France est de 10h. Pouvons-nous affirmer de manière significative qu’ils dorment moins que les
enfants en générale ? α =.01

2. Réponse
Ψ Traduction de l’énoncé

𝑥̅ = 8
𝑠 = 2,5
α = .01
µ0 = 10
𝑛 = 80

Ψ Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur une moyenne.

Nous allons comparer la moyenne µ de la population parente d’où elle est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à 10.

On prendra le seuil α = .01.

Ψ Etape 2 : hypothèses

H0 : µ=µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est égal à µ0.

H1 : µ<µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est inférieur à µ0.

Ψ Etape 3 : statistique de décision et loi sous H0

𝑥̅ −µ0
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1.
( )
√𝑛

A CONDITION que la population parente de l’échantillon suive la loi normale.

Ψ Etape 4 : statistique observée

𝑥̅ − µ0
𝑍= 𝑠
( )
√𝑛

8 − 10 −2
𝑍= = = −7,155
2,5
( ) √5
√80 8

Ψ Etape 5 : valeur(s) critique(s) et région critique

Si H1 UL à gauche : 1 VC :

VCα(Z) = Zα = Z.01 = - Z1-α = - Z.99 = - 2,325


➔ RC(Z)1-α = ] -∞ ; Zα [ = ] -∞ ; - 2,325 [

Ψ Etape 6 : décision statistique

La statistique observée – 7,155 est dans la RC : RH0 au seuil a = .01.

Ψ Etape 7 : conclusion

Si RH0 : on peut affirmer avec moins de 1% de risque de se tromper que la moyenne µ de la population parente
d’où est extrait l’échantillon est inférieur à µ0.

Les enfants atteints de TSA dorment moins de manière générale que la norme.

CM6 – Statistiques inférentielles


Jeudi 16 mars 2023

PARTIE II : FREQUENCE
I. Inférence sur deux fréquences à mesures indépendantes
A. Introduction

1 VI aux groupes de mesure indépendants.


1 VD/VC (données catégorielles = données qualitatives)

Effectifs implique fréquences

Le χ 2 de Pearson / test d’ajustement


Exercice type : un échantillon de 1 000 personnes (600 Lillois et 400 Parisiens), pris au hasard ont répondu à la
question : « allez-vous voter pour ce candidat ? ». Pouvons-nous affirmer que les Lillois voteront plus pour le
candidat en question que les Parisiens ?

7 étapes

B. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux fréquences ф1 et ф2 aux groupes de mesure indépendants.

Plan expérimental :
Il y a une VI : « … », avec 2 modalités (« … » ; « … »)
Il y a une VD : « … », à n modalités (« … ») ; («… »)
➔ S<V>

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé »


NB : si α =.05, cela signifie que nous prenons 5% de marge d’erreur

C. Etape 2 : hypothèses

H0 : ф1 = ф2
La fréquence (ou proportion) de Lillois votant ce candidat ф1 est égale à la fréquence (ou proportion) de
Parisiens votant ce candidat ф2 de la population parente.

H1 : ф1 ≠ ф2
La fréquence (ou proportion) de Lillois votant ce candidat ф1 n’est pas égale à la fréquence (ou proportion) de
Parisiens votant ce candidat ф2 de la population parente.

D. Etape 3 : statistique de décision et loi sous H0


𝑙
𝑐 2

(𝑛𝑖𝑗 −𝑛𝑖𝑗 )
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à (l-1)(c-1) ddl = 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1

i : ligne
j : colonne
nij : effectif observé
nij* : effectif théorique : référence → si H0 est vraie

NB : l = nombre de modalité VI ; c = nombre de modalité VD

2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5

Table de contingence :

VI modalité 1 VI modalité 2 Total marginal


Ex : Lillois Ex : Parisiens
VD catégorie 1 250 350 600
Ex : oui 300* 300
VD catégorie 2 250 150 400
Ex : non 200 200
Total marginal 500 500 1000
Légende : effectifs observés ; effectifs théoriques

* : 300 = 500 x (600/1000)

E. Etape 4 : statistique observée

Calcul du χ2.

F. Etape 5 : valeur critique et région critique

1 VC extrême droite (carré toujours positif) :


χ 2(l-1)(c-1) ; 1- α
➔ RC = ] VC ; + ∞ [

G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil ».


NB : j’ai eu tord de partir de H0 → je rejette H0

Si la statistique observée « valeur observée en 4 » n’est pas dans la RC : NRH0 au seuil α = « seuil ».
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.

H. Etape 7 : conclusion

Si RH0 : on peut affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 est affirmée

Si NRH0 : on ne peut pas affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 n’est
pas affirmée

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

I. Exercice
1. Enoncé

Nous interrogeons 145 sénateurs / sénatrices sur leur positionnement face à la réforme des retraites. Pouvons-
nous affirmer que le positionnement face à cette loi dépend du parti politique de l’individu ?

Gauche Droite
Pour 35 9
Contre 60 41

2. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux fréquences ф1 et ф2 aux groupes de mesure indépendants.

Plan expérimental :
Il y a une VI : Bord politique, avec 2 modalités (Droite ; Gauche)
Il y a une VD : Position, à 2 modalités (Pour) ; (Contre)
➔ S<V>

On prendra le seuil α = .05

3. Etape 2 : hypothèses

H0 : ф1 = ф2
La fréquence (ou proportion) de sénateurs de gauches pour la réforme ф1 est égale à la fréquence (ou
proportion) de sénateurs de droites pour la réforme ф2 de la population parente.

H1 : ф1 ≠ ф2
La fréquence (ou proportion) de sénateurs de gauches pour la réforme ф1 n’est pas égale à la fréquence (ou
proportion) de sénateurs de droites pour la réforme ф2 de la population parente.

4. Etape 3 : statistique de décision et loi sous H0

𝑙
𝑐 2
∗)
(𝑛𝑖𝑗 −𝑛𝑖𝑗
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à (1)(1) ddl = 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1

2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5

Table de contingence :

VI modalité 1 VI modalité 2 Total marginal


Ex : Droite Ex : Gauche
VD catégorie 1 9 35 44
Ex : pour 15,172 28,828
VD catégorie 2 41 60 101
Ex : contre 34,828 66,172
Total marginal 50 95 145

Légende : effectifs observés ; effectifs théoriques

5. Etape 4 : statistique observée

𝑙 𝑐
∗ 2
2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 )
𝜒 =∑ ∑ ∗
𝑛𝑖𝑗
𝑖=1 𝑗=1
(9 − 15,172)2 (35 − 28,828)2 (41 − 34,828)2 (60 − 66,172)2
= + + +
15,172 28,828 34,828 66,172
= 2,511 + 1,321 + 1,094 + 0,576 = 5,502

6. Etape 5 : valeur critique et région critique

1 VC extrême droite (carré toujours positif) :


χ 2(l-1)(c-1) ; 1- α = χ 2(1)(1) ; .95 = 3,841
➔ RC = ] 3,841 ; + ∞ [

7. Etape 6 : décision statistique

5,5 est dans la RC : RH0 au seuil α =.05

8. Etape 7 : conclusion

Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la fréquence (ou proportion) de
sénateurs de gauches pour la réforme ф1 n’est pas égale à la fréquence (ou proportion) de sénateurs de droites
pour la réforme ф2 de la population parente.
→ H1 est affirmée

CM7 – Statistiques inférentielles


Jeudi 23 mars 2023

J. Exercice

Les lycéens passent le Baccalauréat chaque année, la moyenne est de 12,4 et l’écart-type de 4,3.
Quel pourcentage de lycéens devrait obtenir une note de 13,75 ou moins au Baccalauréat ?

µ = 12,4
x = 13,75
σ = 4,3

𝑥 − µ 13,75 − 12,40 1,35


𝑧= = = = 0,314
𝜎 4,3 4,3

P(Z≤0,314) = 0,6217

Le pourcentage de lycéens ayant obtenu 13,75 ou moins est de 62,17%.

K. Exercice

Trouver la probabilité que Z ≥ à 2,84.

P(Z≤2,84) = 0,9977
P(Z>2,84) = 1 – 0,9977 = 0 ,0023

II. Test d’indépendance de deux variables catégorisées


A. Introduction

On étudie s’il existe un lien.


2 VD/VC (données catégorielles = données qualitatives)

Effectifs implique fréquences

Le χ2 de Pearson/Test d’ajustement

Exercice type :
Le sentiment d’être en forme est-il lié à la pratique d’un sport ?

7 étapes

B. Etape 1 : identification de la problématique

Nous allons procéder à un test d’indépendance de 2 VC.

Plan expérimental :
Il y a deux VC : les nommer ainsi que leurs modalités + plan

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé »


NB : Si α=.05, cela signifie que nous prenons 5% de marge d’erreur
C. Etape 2 : hypothèses

H0 :
Les deux VC ne sont pas liées.
Autre formulation : la VC 1 est indépendante de la VC 2.

H1 :
Les deux VC sont liées
Autre formulation : la VC 1 est dépendante de la VC 2.

‼️ H1 n’est jamais orientée car il n’y a pas de VI ‼️

D. Etape 3 : Statistique de décision et loi sous H0


𝑙
𝑐 2

(𝑛𝑖𝑗 −𝑛𝑖𝑗 )
𝜒2 = ∑ ∑ ∗ Sous H0 de loi χ2 à (l-1)(c-1) ddl = 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1

i : ligne
j : colonne
nij : effectif observé
nij* : effectif théorique : référence → si H0 est vraie

NB : l = nombre de modalité VC 1 ; c = nombre de modalité VC 2

2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5

Table de contingence :

VC modalité 1 VC modalité 2 Total marginal


Ex : Majeur Ex : Mineur
VC catégorie 1 250 350 600
Ex : oui 300* 300
VC catégorie 2 250 150 400
Ex : non 200 200
Total marginal 500 500 1000

Légende : effectifs observés ; effectifs théoriques

* : 300 = 500 x (600/1000)

E. Etape 4 : statistique observée

Calcul du χ2.

F. Etape 5 : valeur critique et région critique

1 VC extrême droite (carré toujours positif) :


χ 2(l-1)(c-1) ; 1- α
➔ RC = ] VC ; + ∞ [
G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil ».


NB : j’ai eu tord de partir de H0 → je rejette H0

Si la statistique observée « valeur observée en 4 » n’est pas dans la RC : NRH0 au seuil α = « seuil ».
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.

H. Etape 7 : conclusion

Si RH0 : on peut affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 est affirmée

Si NRH0 : on ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmée

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

I. Exercice
1. Enoncé

Nous étudions le temps passé derrière un écran des sujets de différentes filières. Existe-t-il un lien entre le
temps d’écran et la filière des sujets ?

Sachant qu’il y a :
- 500 sujets en tout
- 100 étudiants en économie regardent moins d’une heure par jour leur écran
- 200 étudiants en psychologie regardent plus d’une heure par jour leur écran
- 150 étudiants en économie

2. Etape 1 : identification de la problématique

Nous allons procéder à un test d’indépendance de 2 VC.

Plan expérimental :
Il y a deux VC :
VC 1 : filière, (économie ; psychologie)
VC 2 : temps d’écran (- 1h ; + 1h)

On prendra le seuil α = .05

3. Etape 2 : hypothèses

H0 :
La VC 1 filière est indépendante de la VC 2 temps d’écran.

H1 :
La VC 1 filière est dépendante de la VC 2 temps d’écran.

4. Etape 3 : statistique de décision et loi sous H0

𝑙
𝑐 2
∗)
(𝑛𝑖𝑗 −𝑛𝑖𝑗
𝜒2 = ∑ ∑ ∗ Sous H0 de loi χ2 à 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
NB : l = nombre de modalité VC 1 ; c = nombre de modalité VC 2

2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1 → validée
- Qu’au maximum 20% d’entre eux ≤ 5 → validée

Table de contingence :

Filière psychologie Filière économie Total marginal


Temps < 1 heure 150 100 250
175 75
Temps > 1 heure 200 50 250
175 75
Total marginal 350 150 500

Légende : effectifs observés ; effectifs théoriques

250
350 × = 175
500
250
150 × = 75
500

5. Etape 4 : statistique observée

𝑙 𝑐
∗ 2
2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 ) (150 − 175)2 (100 − 75)2 (200 − 175)2 (50 − 75)2
𝜒 =∑ ∑ ∗ = + + +
𝑛𝑖𝑗 175 75 175 75
𝑖=1 𝑗=1
25 25 25 25 500
= + + + = = 23,81
7 3 7 3 21

6. Etape 5 : valeur critique et région critique

1 VC extrême droite (carré toujours positif) :


χ 2(l-1)(c-1) ; 1- α = χ 2(1)(1) ; 1-0,05 = χ 21 ; 0,95 = 3,841
➔ RC = ] 3,841 ; + ∞ [

7. Etape 6 : décision statistique

23,81 est dans la RC : RH0 au seuil α = .05.

8. Etape 7 : conclusion

Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la VC 1 filière est dépendante de la VC
2 temps d’écran.
→ H1 est affirmée

CM8 – Statistiques inférentielles


Jeudi 30 mars 2023

III. Inférence sur des fréquences aux groupes de mesure appariés/répétés


A. Introduction
1 VI aux groupes de mesure appariés/répétés à 2 modalités
1 VD/VC à 2 modalités (données catégorielles = données qualitatives)
➔ χ2 de Max Nemar

Effectifs implique fréquences

Exercice type :
Un échantillon de 1000 personnes pris au hasard ont répondu à la question : « êtes-vous favorable à la
légalisation du cannabis ? ». Nous les interrogeons avant et après un discours favorable à sa légalisation. Parmi
les favorables avant le discours ; 200 sont devenus défavorables et 300 sont restés favorables après. Pouvons-
nous affirmer que le discours est efficace ?

7 étapes

B. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux fréquences ф1 et ф2, aux groupes de mesure appariés/répétés.

Plan expérimental :
Il y a une VI : « … » avec 2 modalités (« … » ; « … »)
Il y a une VC : « … » avec 2 modalités (« … » ; « … »)

On prendra le seuil α = « marge d’erreur indiquée dans l’énoncé »


NB : Si α=.05, cela signifie que nous prenons 5% de marge d’erreur

C. Etape 2 : hypothèses

H0 : ф1 = ф2
La fréquence ф1 de gens favorables avant le discours est égale à la fréquence ф2 de gens favorables après le
discours.

H1 : ф1 ≠ ф2 / ф1 < ф2 / ф1 > ф2
La fréquence ф1 de gens favorables avant le discours n’est pas égale / est supérieure / est inférieure à la
fréquence ф2 de gens favorables après le discours.

D. Etape 3 : statistique de décision et loi sous H0

Avant
Après VC : Catégorie 1 VC : Catégorie 2
Ex : oui Ex : Non
VC : catégorie 1 200 nD1
Ex : oui 300
VC : catégorie 2 Nd2 300
Ex : non 200

Valeur : cases discordantes

Si H1 BL :
(𝑛𝑑1−𝑛𝑑2)2
𝜒2 = (𝑛𝑑1+𝑛𝑑2)
Sous H0 de loi χ2

Si H1 UL :
(𝑛𝑑1−𝑛𝑑2)
𝑧= Sous H0 de loi normale
√(𝑛𝑑1+𝑛𝑑2)

1 CONDITION : nD1 + nD2 ≥ 20


E. Etape 4 : statistique observée

Calcul du χ2 ou Z

F. Etape 5 : Valeur(s) critique(s) et région critique

Si H1 BL :
1 VC : χ 2(l-1)(c-1) ; 1- α
➔ RC = ]VC ; + ∞[

Si H1 UL à droite :
VC1-α(Z) = Z1-α
➔ RC (Z)1-α = ]VC ; +∞[

Si H1 UL à gauche :
1 VC : Zα = - Z1-α
➔ RC (Z)1-α = ]-∞ ; VC[

G. Etape 6 : décision statistique

Si la statistique observée « valeur observée en 4 » est dans la RC : RH0 au seuil α = « seuil ».


NB : j’ai eu tord de partir de H0 → je rejette H0

Si la statistique observée « valeur observée en 4 » n’est pas dans la RC : NRH0 au seuil α = « seuil ».
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.

H. Etape 7 : conclusion

Si RH0 : on peut affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 est affirmée

Si NRH0 : on ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmée

ATTENTION : on conclut par rapport à H1 ! PAS par rapport à H0.

I. Exercice
1. Enoncé

Un échantillon de 1000 personnes avant un discours favorable sur la peine de mort puis après le discours.
Parmi les favorables avant, 200 sont devenus défavorables.
Parmi les défavorables avant, 300 sont devenus favorables.
Il y avait 400 personnes favorables au début.
Pouvons-nous affirmer que le discours est efficace ?

2. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux fréquences ф1 et ф2, aux groupes de mesure appariés.

Plan expérimental :
Il y a une VI : Phase, avec 2 modalités (Avant ; Après)
Il y a une VD : Favorabilité, avec 2 modalités (Favorable ; Défavorable)
S1000*P2

On prendra le seuil α = .05


3. Etape 2 : hypothèses

H0 : ф1 = ф2
La fréquence ф1 de gens défavorables à la peine de mort avant le discours est égale à la fréquence ф2 de gens
défavorables à la peine de mort après le discours.

H1 : ф1 > ф2
La fréquence ф1 de gens défavorables à la peine de mort avant le discours est supérieure à la fréquence ф2 de
gens défavorables à la peine de mort après le discours.

4. Etape 3 : Statistiques de décisions et loi sous H0

Avant
Après Favorable Défavorable
Favorable 200 nD1
300
Défavorable Nd2 300
200

Valeur : cases discordantes

(𝑛𝑑1−𝑛𝑑2)
𝑧= Sous H0 de loi normale
√(𝑛𝑑1+𝑛𝑑2)

1 CONDITION : nD1 + nD2 ≥ 20

5. Etape 4 : statistique observée

(𝑛𝑑1 − 𝑛𝑑2) 300 − 200


𝑧= = = 4,472
√(𝑛𝑑1 + 𝑛𝑑2) √(300 + 200)
6. Etape 5 : valeur critique et région critique

VC1-α(Z) = Z1-α = Z.95 = 1,645


➔ RC (Z)1-α = ]1,645 ; +∞[

7. Etape 6 : décision statistique

4,472 est dans la RC : RH0 au seuil α = .05

8. Etape 7 : conclusion

On peut affirmer avec moins de 5% de risque de se tromper que la fréquence ф1 de gens défavorables avant le
discours est supérieure à la fréquence ф2 de gens défavorables après le discours. → H1 est affirmée

Le discours est donc bien efficace.

J. Exercice

P(0 < Z < 1,84) = ?

P(Z<1,84) = 0,9671
P(Z<0) = 0,5
P(Z<1,84) – P(Z<0) = 0,9671 – 0,5 = 0,4671

P(0<Z<1,84) = 0,4671
CM9 – Statistiques inférentielles
Jeudi 06 avril 2023

IV. Révisions
A. Exercice 1
1. Enoncé

Des chercheurs se sont penchés sur la thérapie familiale dans le traitement de l’anorexie. L’expérience porte
sur 17 jeunes filles qui ont été pesées avant et après le traitement (poids en livres).
Le poids moyen avant le traitement est de 83,23, tandis que celui après traitement est de 90,49 (écart-type des
différences : 7,16).

Le traitement par thérapie familiale est-il un moyen efficace ?

2. Traduction de l’énoncé

Marge d’erreur : 5%
N = 17
Sd = 7,16
Xd = x2 – x1 = 90,49 – 83,23 = 7,26
µ0 = 0

3. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur une moyenne des différences µd comparée à la norme µ0 égale à 0.

VI : poids (avant ; après)

S17*P2

On prendra le seuil = .05

4. Etape 2 : hypothèses

H0 : µd=µ0
La moyenne µd de la population parente des différences est égale à la moyenne µ0 égale à 0.

H1 : µd>µ0
La moyenne µd de la population parente des différences est supérieure à la moyenne µ0 égale à 0.

5. Etape 3 : statistique de décision et loi sous H0

̅̅̅̅
𝑥𝑑
𝑇= 𝑠 Sous H0 de loi Student à 16 ddl
( 𝑑)
√𝑛

A CONDITION que les populations parentes des échantillons soient normales.

6. Etape 4 : statistique observée

𝑥
̅̅̅
𝑑 7,26
𝑇= = = 4,181
𝑠𝑑 7,16
( ) ( )
√𝑛 √17
7. Etape 5 : valeur(s) critique(s) et région critique

VC1-α (Tn-1) = Tn-1 ;1-α = T16 ; .95 = 1,746


➔ RC(T16).95 = ] 1,746 ; + ∞[

8. Etape 6 : décision statistique

4,181 est dans la RC : RH0 au seuil α = .05

9. Etape 7 : conclusion

On peut affirmer avec moins de 5% de risque de se tromper que la moyenne µd de la population parente des
différences est supérieure à la moyenne µ0 égale à 0.

Le traitement par thérapie familiale est donc un moyen efficace.

B. Exercice 2
1. Enoncé

Des chercheurs souhaitent étudier l’impact d’un message pro-environnement sur le comportement des
individus.
Ils créent 2 groupes : un groupe contrôle qui reçoit un message neutre (les promotions du jour) et un autre
groupe reçoit un message « ne pas jeter sur la voie publique, utiliser les poubelles ».
Ils comptent le nombre de papiers mis dans la poubelle, ceux jetés par terre et ceux non retrouvés (enlevés).

Voici les résultats :

ENDROIT
GROUPE CONTROLE MESSAGE
POUBELLE 41 80
JETES 385 290
ENLEVES 477 499

Pouvons-nous affirmer que le message pro-environnement a un impact sur le devenir du papier ?

2. Etape 1 : identification de la problématique

Nous allons procéder à une inférence sur deux fréquence ф1 et ф2 aux groupes de mesure indépendants.

Il y a une VI : Groupe, avec 2 modalités (Contrôle ; Message)


Il y a une VD : Endroit, à 3 modalités (Poubelle ; Jetés ; Enlevés)

On prendra le seuil α = .05

3. Etape 2 : hypothèses

H0 : ф1 = ф2
La fréquence de papiers jetés du groupe contrôle ф1 est égale à la fréquence de papiers jetés du groupe
message ф2 de la population parente.

H1 : ф1 ≠ ф2
La fréquence de papiers jetés du groupe contrôle ф1 n’est pas égale à la fréquence de papiers jetés du groupe
message ф2 de la population parente.

4. Etape 3 : statistique de décision et loi sous H0

𝑙
𝑐 2
∗)
(𝑛𝑖𝑗 −𝑛𝑖𝑗
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à 2 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1

i : ligne
j : colonne
nij : effectif observé
nij* : effectif théorique : référence → si H0 est vraie

NB : l = nombre de modalité VI ; c = nombre de modalité VD

2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5

Table de contingence :

ENDROIT Total
GROUPE CONTROLE MESSAGE
POUBELLE 41 80 121
61,661 59,339
JETES 385 290 675
343,976 331,024
ENLEVES 477 499 976
497,363 478,637
Total 903 869 1772

Légende : effectifs observés ; effectifs théoriques

5. Etape 4 : statistique observée

𝑙 𝑐
∗ 2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 )
𝜒22 =∑ ∑ ∗
𝑛𝑖𝑗
𝑖=1 𝑗=1
(41 − 61,661)2 (80 − 59,339)2 (385 − 343,976)2 (290 − 331,024)2
= + + +
61,661 59,339 343,976 331,024
(477 − 497,363)2 (499 − 478,637)2
+ +
497,363 478,637
= 6,923 + 7,194 + 4,893 + 5,084 + 0,834 + 0,866 = 25,794

6. Etape 5 : valeur critique et région critique

χ 2(l-1)(c-1) ; 1- α = χ 22 ; .95 = 5,991


➔ RC = ] 5,991 ; + ∞ [

7. Etape 6 : décision statistique

25,794 est dans la RC : RH0 au seuil α =.05


8. Etape 7 : conclusion

On peut affirmer avec moins de 5% de risque de se tromper que la fréquence de papiers jetés du groupe
contrôle ф1 n’est pas égale à la fréquence de papiers jetés du groupe message ф2 de la population parente.

Le message pro-environnement a donc un impact sur le devenir du papier.

Vous aimerez peut-être aussi