Académique Documents
Professionnel Documents
Culture Documents
Programme :
- Inférence
o Moyenne (quanti)
▪ Sur une moyenne
▪ Sur 2 moyennes aux groupes de mesures indépendants
▪ Sur 2 moyennes aux groupes de mesures appariés/répétés
o Fréquence (quali)
▪ Sur des fréquences aux groupes de mesure indépendants
▪ Test d’indépendance de deux variables catégorisées
▪ Sur 2 fréquences aux groupes de mesure répétés
PARTIE I : MOYENNE
I. Introduction
A. Population parente // Echantillon
Principe : La différence obtenue est-elle trop grande pour qu’on puisse l’attribuer à la chance ?
Nous nous questionnons sur le rôle de la chance dans les résultats obtenus.
Objectif : trouver un moyen de déterminer si les différences observées dans le cas d’un échantillon sont :
- Peu importante → dû au hasard
- Si elles sont suffisamment importantes → on peut rejeter le rôle de la chance → cela nous incite à
croire que notre hypothèse est vraie (mais ce n’est pas forcément le cas)
Pour cela : nous utilisons les distributions d’échantillonnage d’une statistique : elles nous indiquent à quel degré
de variabilité due au hasard nous pouvons nous attendre d’un échantillon à l’autre sur la base d’une erreur
d’échantillonnage
➔ Elles évaluent la probabilité de voir si ces conditions prédéfinies existent réellement
2 types d’hypothèses :
- Hypothèse de recherche (H1) : les échantillons sont issus de deux populations différentes µ1 et µ2
- Hypothèse nulle (H0) : les échantillons sont issus de la même population parente µ
En fonction de la probabilité, selon H0, nous rejetons ou conservons H0 d’arriver à une statistique d’échantillon
aussi extrême que celle que nous avons obtenue.
Lorsque nous prenons une décision dans le cadre d’un test statistique, il y a toujours un risque que notre
décision soit la mauvaise.
- Erreur de type I : α = rejeter H0 alors qu’elle est vraie → affirmer H1 alors qu’on n’aurait pas dû !
- Erreur de type II : β = ne pas rejeter H0 alors qu’elle était fausse → ne pas affirmer H1 alors qu’on aurait
dû !
Erreur de type I :
= Affirmer H1 alors qu’on n’aurait pas dû
En choisissant la plus grande valeur (table t), j’augmente la VC → je diminue la RC → je diminue les chances
d’affirmer H1.
Erreur de type II :
= Ne pas affirmer H1 alors qu’on aurait dû
NRH0 alors qu’il fallait RH0
En augmentant α → j’augmente la RC → j’augmente les chances d’affirmer H1 → je diminue le risque d’erreur
de type 2.
1 moyenne
Exercice type :
Un échantillon de 60 étudiants pris au hasard ont un QI moyen de 110 (s = 1,9). Peut-on revendiquer que les
étudiants ont un QI supérieur à la norme en France (100) ?
Il y a 7 étapes.
Nous allons comparer la moyenne µ de la population parente d’où est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à « moyenne dans l’énoncé ».
C. Etape 2 : Hypothèses
H0 : µ=µ0
La moyenne µ de la population parente, d’où est extrait l’échantillon, est égale à µ0.
H1 : µ≠µ0 / µ<µ0 / µ>µ0
La moyenne µ de la population parente, d’où est extrait l’échantillon, est différente / inférieure / supérieure à
µ0.
Si n ≥ 60 :
𝑥̅ −µ0
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1
( )
√𝑛
Si n < 60 :
𝑥̅ −µ0
𝑇= 𝑠 Sous H0 de loi Student à n-1 ddl (ddl = degré de liberté = effectif – 1)
( )
√𝑛
Si n ≥ 60 :
Calcul du Z
Si n < 60 :
Calcul du T
Si n ≥ 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Z) = Z1- α /2
- Gauche : VC α /2(Z) = Z α /2 = - Z1- α /2
➔ RC(Z)1- α /2 = ]-∞ ; Z α /2[𝑈] Z1- α /2 ; + ∞[
Si H1 UL à droite : 1 VC :
VC1- α (Z) = Z1- α
➔ RC(Z)1- α = ] Z1- α ; + ∞[
Si H1 UL à gauche : 1 VC :
VCa(Z) = Z α = - Z1- α
➔ RC(Z)1- α = ] -∞ ; Z α [
Si n < 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Tn-1) = Tn-1 ;1- α /2
- Gauche : VC α /2(Tn-1) = Tn-1 ; α /2 = -Tn-1 ;1- α /2
➔ RC(Tn-1)1-α/2 = ]-∞ ; Tn-1 ;α/2 [𝑈] Tn-1 ;1- α /2 ; + ∞[
Si H1 UL à droite : 1 VC :
VC1- α (Tn-1) = Tn-1 ;1- α
➔ RC(Tn-1)1- α = ] Tn-1 ;1- α ; + ∞[
Si H1 UL à gauche : 1 VC :
VC α (Tn-1) = Tn-1 ; α = - Tn-1 ;1- α
➔ RC(T)n-1 ;1- α = ] -∞ ; Tn-1 ; α [
NB : SI T(n-1) ne figure pas dans la table, choisir la plus grande valeur pour éviter l’erreur de type 1.
Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil a= « seuil »
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant
H. Etape 7 : Conclusion
Si RH0 : on peut affirmer avec moins d’ α *100% de risque de se tromper que H1 « … » → H1 est affirmé
Si NRH0 : on ne peut pas affirmer avec moins d’ α *100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmé
I. Exercice
Enoncé : 60 étudiants de psychologie pris au hasard ont un QI de 110 (s=1,9). Peut-on revendiquer que les
étudiants ont un QI supérieur à la norme (100) ? Seuil .05
Ψ Traduction de l’énoncé
𝑥̅ = 110
𝑠 = 1,9
α = .05
µ0 = 100
𝑛 = 60
Nous allons comparer la moyenne µ de la population parente d’où elle est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à 100.
Ψ Etape 2 : hypothèses
H0 : µ = µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est égale à µ0.
H1 : µ>µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est supérieure à µ0.
n ≥ 60 :
𝑥̅ − µ0
𝑍= 𝑠
( )
√𝑛
Sous H0 de loi normale centrée réduite
𝑥̅ − µ0
𝑍= 𝑠
√𝑛
110 − 100
𝑍= ≈ 40,768
1,9
√60
n ≥ 60 :
H1 UL à droite : 1 VC :
VC1- α (Z) = Z1- α
= Z.95
= 1,645
➔ RC(Z)1-a = ]1,645 ; +∞[
Ψ Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la moyenne µ de la population parente
d’où est extrait l’échantillon est supérieure à µ0.
2 moyennes aux groupes de mesure appariés/répétés : si le sujet est passé par toutes les modalités de la
variable.
Exercice type :
10 athlètes améliorent en moyenne leur score de 103,2 ms (s=45,2) suite à un entraînement. Ils sont plus
rapides. L’entrainement est-il efficace ?
7 étapes
Autre formulation : nous allons procéder à une inférence sur une moyenne de différence µd à la norme µ0 (=0)
C. Etape 2 : hypothèses
H0 : µ1=µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est égale à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n2.
H0 : µd=µ0
La moyenne µd de la population parente des différences est égale à la moyenne µ0 égale à 0.
Si n ≥ 60 :
̅̅̅̅
𝑥𝑑
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1.
( 𝑑)
√𝑛
Si n < 60 :
̅̅̅̅
𝑥𝑑
𝑇= 𝑠 Sous H0 de loi Student à n-1 ddl. (ddl = degré de liberté = effectif – 1)
( 𝑑)
√𝑛
Si n ≥ 60 :
Calcul du Z
Si n < 60 :
Calcul du T
Si n≥ 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1- α /2(Z) = Z1- α /2
- Gauche : VC α /2(Z) = Z α /2 = - Z1- α /2
➔ RC(Z)1- α /2 = ]-∞ ; Z α /2[𝑈] Z1- α /2 ; + ∞[
Si H1 UL à droite : 1 VC :
VC1-α (Z) = Z1-α
➔ RC(Z)1-α = ] Z1-α ; + ∞[
Si H1 UL à gauche : 1 VC :
VCα (Z) = Zα = - Z1-α
➔ RC(Z)1-α = ] -∞ ; Zα [
Si n < 60 :
Si H1 BL (H1 : µ ≠ µ0) : 2 VC :
- Droite : VC1-α/2(Tn-1) = Tn-1 ;1-α/2
- Gauche : VCα/2(Tn-1) = Tn-1 ; α/2 = -Tn-1 ;1-α/2
➔ RC(Tn-1)1-α/2 = ]-∞ ; Tn-1 ; α/2 [𝑈] Tn-1 ;1-α/2 ; + ∞[
Si H1 UL à droite : 1 VC :
VC1-α (Tn-1) = Tn-1 ;1-α
➔ RC(Tn-1)1-α = ] Tn-1 ;1-α ; + ∞[
Si H1 UL à gauche : 1 VC :
VCα (Tn-1) = Tn-1 ; α = - Tn-1 ;1-α
➔ RC(T)n-1 ;1-α = ] -∞ ; Tn-1 ; α [
Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α= « seuil »
NB : je ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.
H. Etape 7 : conclusion
Si RH0 : On peut affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 est affirmée
Si NRH0 : On ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est
pas affirmée
I. Exercice
Enoncé : 10 athlètes améliorent en moyenne leur score de 103,2 ms (sd = 45,2) suite à un entraînement. Ils sont
plus rapides. L’entraînement est-il efficace ? α=.05
Ψ Traduction de l’énoncé
Marge d’erreur = 5%
N = 10
Sd = 45,2
xd = 103,2
µ0 = 0
VI : score
S1 : avant
S2 : après
VD : temps en ms
Ψ Etape 2 : hypothèses
H0 : µd=µ0
La moyenne µd de la population parente des différences est égale à la moyenne µ0 égale à 0.
H1 : µd>µ0
La Moyenne µd de la population parente des différences est supérieure à la moyenne µ0 égale à 0.
Si n < 60 :
̅̅̅̅
𝑥𝑑
𝑇= 𝑠
( 𝑑)
√𝑛
𝑥
̅̅̅
𝑑 103,2
𝑇= = = 7,22
𝑠 45,2
( 𝑑) ( )
√𝑛 √10
Si H1 UL à droite : 1 VC :
VC.95(T9) = T9;.95 = 1,833
➔ RC(Tn-1)1-α = ] 1,833 ; + ∞[
Ψ Etape 7 : conclusion
Si RH0 : On peut affirmer avec moins de 5% de risque de se tromper que la moyenne µd de la population
parente des différences est supérieure à la moyenne µ0 égale à 0.
→ H1 est affirmée
2 moyennes aux groupes de mesure indépendants = le sujet passe par une seule modalité de la variable.
Exercice type :
Lors d’un test d’attention, les sujets sont répartis en deux groupes : les – de 50 ans et les + de 50 ans.
La moyenne du premier groupe (- de 50 ans) de 42 personnes est de 25 (s = 4,6).
La moyenne du second groupe (+ de 50 ans) est de 48 personnes est de 27 (s = 5,1).
Peut-on revendiquer que l’âge a un impact sur l’attention ?
Nous allons procéder à une inférence sur deux moyenne µ1 et µ2, aux groupes de mesure indépendants.
Nous allons comparer la moyenne µ1 de la population parente d’où est extrait l’échantillon n1 à la moyenne µ2
de la population parente d’où est extrait l’échantillon n2.
Plan d’expérience : Snb de sujets par modalité < Gnb modalités >
C. Etape 2 : hypothèses
H0 : µ1 = µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est égale à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n 2.
➔ Les échantillons sont extraits de la même population parente dont la moyenne est µ.
H1 : µ1 ≠ µ2 / µ1 < µ2 / µ1 > µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente / supérieure / inférieure
à la moyenne µ2 de la population parente d’où est extrait l’échantillon n2.
➔ Les deux échantillons sont extraits de deux populations parentes µ1 et µ2 différentes.
Si n1 ET n2 ≥ 60 :
𝑥̅ 1−𝑥̅ 2
𝑧= Sous H0 de loi normale centrée sur 0 et de variance 1.
𝑠 2𝑠 2
√( 1 − 2 )
𝑛1 𝑛2
𝑥̅ 1−𝑥̅ 2
𝑇= 1 1
Sous H0 de loi Student à n-2 ddl (ddl = degré de liberté = effectif – 2)
∗2
√𝑆 ×(𝑛 +𝑛 )
1 2
(𝑛1 −1)×𝑆12+(𝑛2 −1)×𝑆22
Variance pondérée : 𝑆 ∗2 = 𝑛1 +𝑛2 −2
2 CONDITIONS :
- Que les populations parentes de l’échantillon soient normales
- Que les variances de populations parentes soient homogènes
o A VERIFIER UNIQUEMENT SI T de Student : Test d’homogénéité des variances
▪ Si ok : on continue la suite des étapes
▪ Sinon : on arrête le test d’inférence
Si n1 ET n2 ≥ 60 :
Calcul du Z
Si n1 ET n2 ≥ 60 :
Si H1 BL : 2VC :
Droite : VC1-α/2(Z) = Z1-α/2
Gauche : VCα/2(Z) = Zα/2 = - Z1-α/2
➔ RC(Z)1-α/2 = ] - ∞ ; Zα/2 [𝑈] Z1-α/2 ; + ∞ [
Si H1 UL à droite : 1 VC :
VC1-α (Z) = Z1-α
➔ RC(Z)1-α = ] Z1-α ; + ∞ [
Si H1 UL à gauche : 1 VC :
VCα (Z) = Zα = - Z1-α
➔ RC(Z)1-α = ] - ∞ ; Zα [
Si H1 BL : 2VC :
Droite : VC(T(n1+n2-2))1-α/2 = T(n1+n2-2)1-α/2
Gauche : VC(T(n1+n2-2)) α/2 = T(n1+n2-2) α/2 = - T(n1+n2-2)1-α/2
➔ RC(T(n1+n2-2))1-α/2 = ] - ∞ ; T(n1+n2-2) α/2 [𝑈] T(n1+n2-2)1-α/2 ; + ∞ [
Si H1 UL à droite : 1 VC :
VC(T(n1+n2-2))1-α = T(n1+n2-2)1-α
➔ RC(Tn1+n2-2)1-α = ] Tn-1 ;1-α ; + ∞ [
Si H1 UL à gauche : 1 VC :
VC(T(n1+n2-2)) α = T(n1+n2-2) α = - T(n1+n2-2)1-α
➔ RC(T)n1+n2-2 ; 1-α = ] - ∞ ; T(n1+n2-2) α [
NB : SI T(n1+n2-2) ne figure pas dans la table, choisir la plus grande valeur pour éviter l’erreur de type 1.
Si la statistique observée « valeur observée en 4 » n’est PAS dans la RC : NRH0 au seuil α = « seuil ».
NB : On ne rejette pas H0 mais on ne peut pas l’affirmer pour autant
H. Etape 7 : conclusion
Si RH0 :
On peut affirmer avec moins d’α*100% de risque de se tromper que H1 « … ».
➔ H1 est affirmée
Si NRH0 :
On ne peut pas affirmer avec moins d’α*100% de risque de se tromper que H1 « … ».
➔ H1 n’est pas affirmée
I. Exercice
Enoncé : Nous cherchons à mesurer l’efficacité d’un traitement contre la maladie d’Alzheimer. Nous comptons
le nombre d’items bien reportés auprès d’un groupe de personnes.
La moyenne d’un premier groupe constitué de 42 adultes malades est de 25,5 (s = 4,6).
La moyenne d’un second groupe de 48 malades mais traités avec ce traitement est de 27,9 (s = 5,1).
Existe-t-il une différence entre les personnes malades qui prennent le traitement et celles qui ne le prennent
pas ?
ATTENTION : nous partons du principe que les variances sont homogènes α = .05
Ψ Traduction de l’énoncé
Marge d’erreur = 5%
N1 = 42
S1 = 4,6
X1 = 25,5
N2 = 48
S2 = 5,1
X2 = 27,9
Nous allons procéder à une inférence sur deux moyenne µ1 et µ2, aux groupes de mesure indépendants.
Nous allons comparer la moyenne µ1 de la population parente d’où est extrait l’échantillon n1 à la moyenne µ2
de la population parente d’où est extrait l’échantillon n2.
VI : groupe
1 : groupe 1
2 : groupe 2
Ψ Etape 2 : hypothèses
H0 : µ1 = µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est égale à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n 2.
H1 : µ1 ≠ µ2
La moyenne µ1 de la population parente d’où est extrait l’échantillon n1 est différente à la moyenne µ2 de la
population parente d’où est extrait l’échantillon n 2.
𝑥̅1 − 𝑥̅ 2
𝑇88 =
1 1
√𝑆 ∗2 × (𝑛 + 𝑛 )
1 2
2 CONDITIONS :
- Que les populations parentes de l’échantillon soient normales
- Que les variances de populations parentes soient homogènes
o SI t de Student : Vérifier ; Test d’homogénéité des variances
Si H1 BL : 2VC :
Droite : VC(T88).975 = T88 ; .975 = 1,99
Gauche : VC(T88).025 = T88 ; .025= - T88 ; .975 = -1,99
➔ RC(T88).975 = ] - ∞ ; -1,99 [𝑈] 1,99 ; + ∞ [
Ψ Etape 7 : conclusion
On peut affirmer avec moins d’α*100% de risque de se tromper que La moyenne µ1 de la population parente
d’où est extrait l’échantillon n1 est différente à la moyenne µ2 de la population parente d’où est extrait
l’échantillon n2.
➔ H1 est affirmée
Après l’étape 3 de l’inférence sur deux moyennes aux groupes de mesure indépendants.
S’il y a utilisation du T de Student.
7 étapes
Si c’est homogène : on peut continuer le test d’inférence sur deux moyennes aux groupes de mesure
indépendants.
Nous allons procéder à une inférence sur deux variances σ12 et σ22.
C. Etape 2 : hypothèses
H0 : σ12 = σ22
Les variances σ12 et σ22 sont homogènes.
H1 : σ12 ≠ σ22
Les variances σ12 et σ22 ne sont pas homogènes.
E. Etape 4 : F observé
Calcul du F.
2 VC :
1 VC à droite :
VCα=.10 : F(n1-1 ; n2-1) ; 1-α/2 = F(n1-1 ; n2-1).95
1 VC à gauche :
VCα=.10 : - F(n1-1 ; n2-1) ; 1-α/2 = F(n1-1 ; n2-1) α/2
1
𝐹(𝑛1 − 1; 𝑛2 − 1)𝛼∕2 =
𝐹(𝑛2 − 1; 𝑛1 − 1)1−𝛼⁄2
➔ RCα=.10 F(n1-1;n2-1) = ] 0 ; F(n1-1 ; n2-1) α/2 [𝑈] F(n1-1 ; n2-1)1-α/2 ; +∞ [
NB: SI F(n1-1;n2-1) ne figure pas dans la table, choisir la valeur voisine la plus petite pour éviter l’erreur de type
2.
H. Etape 7 : conclusion
Si NRH0 : On ne peut pas affirmer avec moins de 10% de risque de se tromper que H1 « … ».
➔ H1 n’est pas affirmé
➔ On considère les variances comme homogènes
➔ On continue le test d’inférence sur 2 moyennes aux groupes de mesure indépendants.
I. Exercice
Enoncé : Nous cherchons à mesurer l’efficacité d’un traitement contre la maladie d’Alzheimer. Nous comptons
le nombre d’items bien reportés auprès d’un groupe de personnes.
La moyenne d’un premier groupe constitué de 42 adultes malades est de 25,5 (s = 4,6).
La moyenne d’un second groupe de 48 malades mais traités avec ce traitement est de 27,9 (s = 5,1).
Ψ Traduction de l’énoncé
σ1 = 4,6
σ2 = 5,1
n1 = 42
n2 = 48
Nous allons procéder à une inférence sur deux variances σ12 et σ22.
Ψ Etape 2 : hypothèses
H0 : σ12 = σ22
Les variances σ12 et σ22 sont homogènes.
H1 : σ12 ≠ σ22
Les variances σ12 et σ22 ne sont pas homogènes.
𝑠2
𝐹(𝑛1 − 1; 𝑛2 − 1) = 𝑠12 Sous H0 de loi F-S (Fischer-Snedecor) à (𝑛1 − 1; 𝑛2 − 1) ddls.
2
Ψ Etape 4 : F observé
𝑠12
𝐹(𝑛1 − 1; 𝑛2 − 1) =
𝑠22
4,62
𝐹(41; 47) = = 0,814
5,12
Ψ Etape 5 : valeur(s) critique(s) et région critique
1 VC à droite :
VCα=.10 F(n1-1 ; n2-1)1-α/2 = F(41 ; 47).95 ≈ F(45 ; 48).95 ≈ 1,62
1 VC à gauche :
VCα=.10 : - F(n1-1 ; n2-1) ; 1-α/2 = F(41 ; 47).05
On choisit la plus petite valeur F(50 ; 42).95 ≈ 1,65
1 1 1
𝐹(𝑛1 − 1; 𝑛2 − 1)𝛼∕2 = = = = 0,61
𝐹(𝑛2 − 1; 𝑛1 − 1)1−𝛼⁄2 𝐹(47 ; 41).95 1,65
➔ RCα=.10 F(n1-1;n2-1) = ] 0 ; F(n1-1 ; n2-1) α/2 [𝑈] F(n1-1 ; n2-1)1-α/2 ; +∞ [
➔ RCα=.10 F(41;47) = ] 0 ; 0,61 [𝑈] 1,62 ; +∞ [
Ψ Etape 7 : conclusion
Si NRH0 : on ne peut pas affirmer avec moins de 10% de risque de se tromper que les variances σ12 et σ22 ne
sont pas homogènes.
➔ H1 n’est pas affirmé
➔ On considère les variances comme homogènes
➔ On continue le test d’inférence sur 2 moyennes aux groupes de mesure indépendants.
V. Révisions
A. Exercice 1
1. Enoncé
Si un échantillon est tiré aléatoirement d’une population parente normale, quelle est la probabilité que sa note
z soit comprise entre 0 et 0,8 ?
2. Réponse
La probabilité que Z soit compris entre 0 et 0,8 est de 0,2881, soit 28,81%.
B. Exercice 2
1. Enoncé
Nous souhaitons mieux comprendre le trouble du spectre de l’autisme. Nous mesurons la durée du sommeil de
80 enfants atteints de TSA. La moyenne est de 8h, l’écart-type est de 2,5. La durée moyenne du sommeil chez
les enfants en France est de 10h. Pouvons-nous affirmer de manière significative qu’ils dorment moins que les
enfants en générale ? α =.01
2. Réponse
Ψ Traduction de l’énoncé
𝑥̅ = 8
𝑠 = 2,5
α = .01
µ0 = 10
𝑛 = 80
Nous allons comparer la moyenne µ de la population parente d’où elle est réellement extrait l’échantillon à la
moyenne µ0 qui est égale à 10.
Ψ Etape 2 : hypothèses
H0 : µ=µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est égal à µ0.
H1 : µ<µ0
La moyenne µ de la population parente d’où est extrait l’échantillon est inférieur à µ0.
𝑥̅ −µ0
𝑍= 𝑠 Sous H0 de loi normale centrée sur 0 et de variance 1.
( )
√𝑛
𝑥̅ − µ0
𝑍= 𝑠
( )
√𝑛
8 − 10 −2
𝑍= = = −7,155
2,5
( ) √5
√80 8
Si H1 UL à gauche : 1 VC :
Ψ Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de 1% de risque de se tromper que la moyenne µ de la population parente
d’où est extrait l’échantillon est inférieur à µ0.
Les enfants atteints de TSA dorment moins de manière générale que la norme.
PARTIE II : FREQUENCE
I. Inférence sur deux fréquences à mesures indépendantes
A. Introduction
7 étapes
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2 aux groupes de mesure indépendants.
Plan expérimental :
Il y a une VI : « … », avec 2 modalités (« … » ; « … »)
Il y a une VD : « … », à n modalités (« … ») ; («… »)
➔ S<V>
C. Etape 2 : hypothèses
H0 : ф1 = ф2
La fréquence (ou proportion) de Lillois votant ce candidat ф1 est égale à la fréquence (ou proportion) de
Parisiens votant ce candidat ф2 de la population parente.
H1 : ф1 ≠ ф2
La fréquence (ou proportion) de Lillois votant ce candidat ф1 n’est pas égale à la fréquence (ou proportion) de
Parisiens votant ce candidat ф2 de la population parente.
i : ligne
j : colonne
nij : effectif observé
nij* : effectif théorique : référence → si H0 est vraie
2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5
Table de contingence :
Calcul du χ2.
Si la statistique observée « valeur observée en 4 » n’est pas dans la RC : NRH0 au seuil α = « seuil ».
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.
H. Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 est affirmée
Si NRH0 : on ne peut pas affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 n’est
pas affirmée
I. Exercice
1. Enoncé
Nous interrogeons 145 sénateurs / sénatrices sur leur positionnement face à la réforme des retraites. Pouvons-
nous affirmer que le positionnement face à cette loi dépend du parti politique de l’individu ?
Gauche Droite
Pour 35 9
Contre 60 41
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2 aux groupes de mesure indépendants.
Plan expérimental :
Il y a une VI : Bord politique, avec 2 modalités (Droite ; Gauche)
Il y a une VD : Position, à 2 modalités (Pour) ; (Contre)
➔ S<V>
3. Etape 2 : hypothèses
H0 : ф1 = ф2
La fréquence (ou proportion) de sénateurs de gauches pour la réforme ф1 est égale à la fréquence (ou
proportion) de sénateurs de droites pour la réforme ф2 de la population parente.
H1 : ф1 ≠ ф2
La fréquence (ou proportion) de sénateurs de gauches pour la réforme ф1 n’est pas égale à la fréquence (ou
proportion) de sénateurs de droites pour la réforme ф2 de la population parente.
𝑙
𝑐 2
∗)
(𝑛𝑖𝑗 −𝑛𝑖𝑗
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à (1)(1) ddl = 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5
Table de contingence :
𝑙 𝑐
∗ 2
2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 )
𝜒 =∑ ∑ ∗
𝑛𝑖𝑗
𝑖=1 𝑗=1
(9 − 15,172)2 (35 − 28,828)2 (41 − 34,828)2 (60 − 66,172)2
= + + +
15,172 28,828 34,828 66,172
= 2,511 + 1,321 + 1,094 + 0,576 = 5,502
8. Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la fréquence (ou proportion) de
sénateurs de gauches pour la réforme ф1 n’est pas égale à la fréquence (ou proportion) de sénateurs de droites
pour la réforme ф2 de la population parente.
→ H1 est affirmée
J. Exercice
Les lycéens passent le Baccalauréat chaque année, la moyenne est de 12,4 et l’écart-type de 4,3.
Quel pourcentage de lycéens devrait obtenir une note de 13,75 ou moins au Baccalauréat ?
µ = 12,4
x = 13,75
σ = 4,3
P(Z≤0,314) = 0,6217
K. Exercice
P(Z≤2,84) = 0,9977
P(Z>2,84) = 1 – 0,9977 = 0 ,0023
Le χ2 de Pearson/Test d’ajustement
Exercice type :
Le sentiment d’être en forme est-il lié à la pratique d’un sport ?
7 étapes
Plan expérimental :
Il y a deux VC : les nommer ainsi que leurs modalités + plan
H0 :
Les deux VC ne sont pas liées.
Autre formulation : la VC 1 est indépendante de la VC 2.
H1 :
Les deux VC sont liées
Autre formulation : la VC 1 est dépendante de la VC 2.
i : ligne
j : colonne
nij : effectif observé
nij* : effectif théorique : référence → si H0 est vraie
2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5
Table de contingence :
Calcul du χ2.
Si la statistique observée « valeur observée en 4 » n’est pas dans la RC : NRH0 au seuil α = « seuil ».
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.
H. Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 est affirmée
Si NRH0 : on ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmée
I. Exercice
1. Enoncé
Nous étudions le temps passé derrière un écran des sujets de différentes filières. Existe-t-il un lien entre le
temps d’écran et la filière des sujets ?
Sachant qu’il y a :
- 500 sujets en tout
- 100 étudiants en économie regardent moins d’une heure par jour leur écran
- 200 étudiants en psychologie regardent plus d’une heure par jour leur écran
- 150 étudiants en économie
Plan expérimental :
Il y a deux VC :
VC 1 : filière, (économie ; psychologie)
VC 2 : temps d’écran (- 1h ; + 1h)
3. Etape 2 : hypothèses
H0 :
La VC 1 filière est indépendante de la VC 2 temps d’écran.
H1 :
La VC 1 filière est dépendante de la VC 2 temps d’écran.
𝑙
𝑐 2
∗)
(𝑛𝑖𝑗 −𝑛𝑖𝑗
𝜒2 = ∑ ∑ ∗ Sous H0 de loi χ2 à 1 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
NB : l = nombre de modalité VC 1 ; c = nombre de modalité VC 2
2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1 → validée
- Qu’au maximum 20% d’entre eux ≤ 5 → validée
Table de contingence :
250
350 × = 175
500
250
150 × = 75
500
𝑙 𝑐
∗ 2
2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 ) (150 − 175)2 (100 − 75)2 (200 − 175)2 (50 − 75)2
𝜒 =∑ ∑ ∗ = + + +
𝑛𝑖𝑗 175 75 175 75
𝑖=1 𝑗=1
25 25 25 25 500
= + + + = = 23,81
7 3 7 3 21
8. Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de 5% de risque de se tromper que la VC 1 filière est dépendante de la VC
2 temps d’écran.
→ H1 est affirmée
Exercice type :
Un échantillon de 1000 personnes pris au hasard ont répondu à la question : « êtes-vous favorable à la
légalisation du cannabis ? ». Nous les interrogeons avant et après un discours favorable à sa légalisation. Parmi
les favorables avant le discours ; 200 sont devenus défavorables et 300 sont restés favorables après. Pouvons-
nous affirmer que le discours est efficace ?
7 étapes
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2, aux groupes de mesure appariés/répétés.
Plan expérimental :
Il y a une VI : « … » avec 2 modalités (« … » ; « … »)
Il y a une VC : « … » avec 2 modalités (« … » ; « … »)
C. Etape 2 : hypothèses
H0 : ф1 = ф2
La fréquence ф1 de gens favorables avant le discours est égale à la fréquence ф2 de gens favorables après le
discours.
H1 : ф1 ≠ ф2 / ф1 < ф2 / ф1 > ф2
La fréquence ф1 de gens favorables avant le discours n’est pas égale / est supérieure / est inférieure à la
fréquence ф2 de gens favorables après le discours.
Avant
Après VC : Catégorie 1 VC : Catégorie 2
Ex : oui Ex : Non
VC : catégorie 1 200 nD1
Ex : oui 300
VC : catégorie 2 Nd2 300
Ex : non 200
Si H1 BL :
(𝑛𝑑1−𝑛𝑑2)2
𝜒2 = (𝑛𝑑1+𝑛𝑑2)
Sous H0 de loi χ2
Si H1 UL :
(𝑛𝑑1−𝑛𝑑2)
𝑧= Sous H0 de loi normale
√(𝑛𝑑1+𝑛𝑑2)
Calcul du χ2 ou Z
Si H1 BL :
1 VC : χ 2(l-1)(c-1) ; 1- α
➔ RC = ]VC ; + ∞[
Si H1 UL à droite :
VC1-α(Z) = Z1-α
➔ RC (Z)1-α = ]VC ; +∞[
Si H1 UL à gauche :
1 VC : Zα = - Z1-α
➔ RC (Z)1-α = ]-∞ ; VC[
Si la statistique observée « valeur observée en 4 » n’est pas dans la RC : NRH0 au seuil α = « seuil ».
NB : on ne rejette pas H0 mais on ne peut pas l’affirmer pour autant.
H. Etape 7 : conclusion
Si RH0 : on peut affirmer avec moins de α *100% de risque de se tromper que H1 « … » → H1 est affirmée
Si NRH0 : on ne peut pas affirmer avec moins de α*100% de risque de se tromper que H1 « … » → H1 n’est pas
affirmée
I. Exercice
1. Enoncé
Un échantillon de 1000 personnes avant un discours favorable sur la peine de mort puis après le discours.
Parmi les favorables avant, 200 sont devenus défavorables.
Parmi les défavorables avant, 300 sont devenus favorables.
Il y avait 400 personnes favorables au début.
Pouvons-nous affirmer que le discours est efficace ?
Nous allons procéder à une inférence sur deux fréquences ф1 et ф2, aux groupes de mesure appariés.
Plan expérimental :
Il y a une VI : Phase, avec 2 modalités (Avant ; Après)
Il y a une VD : Favorabilité, avec 2 modalités (Favorable ; Défavorable)
S1000*P2
H0 : ф1 = ф2
La fréquence ф1 de gens défavorables à la peine de mort avant le discours est égale à la fréquence ф2 de gens
défavorables à la peine de mort après le discours.
H1 : ф1 > ф2
La fréquence ф1 de gens défavorables à la peine de mort avant le discours est supérieure à la fréquence ф2 de
gens défavorables à la peine de mort après le discours.
Avant
Après Favorable Défavorable
Favorable 200 nD1
300
Défavorable Nd2 300
200
(𝑛𝑑1−𝑛𝑑2)
𝑧= Sous H0 de loi normale
√(𝑛𝑑1+𝑛𝑑2)
8. Etape 7 : conclusion
On peut affirmer avec moins de 5% de risque de se tromper que la fréquence ф1 de gens défavorables avant le
discours est supérieure à la fréquence ф2 de gens défavorables après le discours. → H1 est affirmée
J. Exercice
P(Z<1,84) = 0,9671
P(Z<0) = 0,5
P(Z<1,84) – P(Z<0) = 0,9671 – 0,5 = 0,4671
P(0<Z<1,84) = 0,4671
CM9 – Statistiques inférentielles
Jeudi 06 avril 2023
IV. Révisions
A. Exercice 1
1. Enoncé
Des chercheurs se sont penchés sur la thérapie familiale dans le traitement de l’anorexie. L’expérience porte
sur 17 jeunes filles qui ont été pesées avant et après le traitement (poids en livres).
Le poids moyen avant le traitement est de 83,23, tandis que celui après traitement est de 90,49 (écart-type des
différences : 7,16).
2. Traduction de l’énoncé
Marge d’erreur : 5%
N = 17
Sd = 7,16
Xd = x2 – x1 = 90,49 – 83,23 = 7,26
µ0 = 0
Nous allons procéder à une inférence sur une moyenne des différences µd comparée à la norme µ0 égale à 0.
S17*P2
4. Etape 2 : hypothèses
H0 : µd=µ0
La moyenne µd de la population parente des différences est égale à la moyenne µ0 égale à 0.
H1 : µd>µ0
La moyenne µd de la population parente des différences est supérieure à la moyenne µ0 égale à 0.
̅̅̅̅
𝑥𝑑
𝑇= 𝑠 Sous H0 de loi Student à 16 ddl
( 𝑑)
√𝑛
𝑥
̅̅̅
𝑑 7,26
𝑇= = = 4,181
𝑠𝑑 7,16
( ) ( )
√𝑛 √17
7. Etape 5 : valeur(s) critique(s) et région critique
9. Etape 7 : conclusion
On peut affirmer avec moins de 5% de risque de se tromper que la moyenne µd de la population parente des
différences est supérieure à la moyenne µ0 égale à 0.
B. Exercice 2
1. Enoncé
Des chercheurs souhaitent étudier l’impact d’un message pro-environnement sur le comportement des
individus.
Ils créent 2 groupes : un groupe contrôle qui reçoit un message neutre (les promotions du jour) et un autre
groupe reçoit un message « ne pas jeter sur la voie publique, utiliser les poubelles ».
Ils comptent le nombre de papiers mis dans la poubelle, ceux jetés par terre et ceux non retrouvés (enlevés).
ENDROIT
GROUPE CONTROLE MESSAGE
POUBELLE 41 80
JETES 385 290
ENLEVES 477 499
Nous allons procéder à une inférence sur deux fréquence ф1 et ф2 aux groupes de mesure indépendants.
3. Etape 2 : hypothèses
H0 : ф1 = ф2
La fréquence de papiers jetés du groupe contrôle ф1 est égale à la fréquence de papiers jetés du groupe
message ф2 de la population parente.
H1 : ф1 ≠ ф2
La fréquence de papiers jetés du groupe contrôle ф1 n’est pas égale à la fréquence de papiers jetés du groupe
message ф2 de la population parente.
𝑙
𝑐 2
∗)
(𝑛𝑖𝑗 −𝑛𝑖𝑗
2
𝜒 =∑ ∑ ∗ Sous H0 de loi χ2 à 2 ddl
𝑛𝑖𝑗
𝑗=1
𝑖=1
i : ligne
j : colonne
nij : effectif observé
nij* : effectif théorique : référence → si H0 est vraie
2 CONDITIONS :
- Que tous les effectifs théoriques soient > 1
- Qu’au maximum 20% d’entre eux ≤ 5
Table de contingence :
ENDROIT Total
GROUPE CONTROLE MESSAGE
POUBELLE 41 80 121
61,661 59,339
JETES 385 290 675
343,976 331,024
ENLEVES 477 499 976
497,363 478,637
Total 903 869 1772
𝑙 𝑐
∗ 2
(𝑛𝑖𝑗 − 𝑛𝑖𝑗 )
𝜒22 =∑ ∑ ∗
𝑛𝑖𝑗
𝑖=1 𝑗=1
(41 − 61,661)2 (80 − 59,339)2 (385 − 343,976)2 (290 − 331,024)2
= + + +
61,661 59,339 343,976 331,024
(477 − 497,363)2 (499 − 478,637)2
+ +
497,363 478,637
= 6,923 + 7,194 + 4,893 + 5,084 + 0,834 + 0,866 = 25,794
On peut affirmer avec moins de 5% de risque de se tromper que la fréquence de papiers jetés du groupe
contrôle ф1 n’est pas égale à la fréquence de papiers jetés du groupe message ф2 de la population parente.