Vous êtes sur la page 1sur 9

République Tunisienne

Ministère de l’Enseignement Supérieur et


de la Recherche Scientifique Année universitaire : 2021/2022

Enseignante : Ahlem BENDAOUED


Université de Kairouan

[Titre du document]

Chapitre II : Rappels

Statistiques
I. Population
Soit un ensemble de résultats : y1, y2, y3…yN
Où N est très grand (∞)
Cette population est caractérisé par :
La moyenne :

𝑦1+𝑦2+𝑦3+⋯𝑦𝑁 ∑𝑁
𝑖=1 𝑦𝑖
µ= =
𝑁 𝑁
La variance qui est un indicateur de la dispersion :

2 (𝑦1−µ)2 +(𝑦2−µ)2 +(𝑦3−µ)2 +⋯(𝑦𝑁−µ)2


Var(y) = = =
𝑁
∑𝑁
𝑖=1(𝑦𝑖−µ)
2

𝑁
L’écart type :

=√𝑣𝑎𝑟

II. Echantillon
Malheureusement on ne dispose pas en général des résultats de l’étude d’une population

infiniment grande. On dispose d’un petit nombre d’individu appelé « échantillon ».

Population Echantillon

Taille N N

Moyenne µ 𝑦̅

2
Variance
Ѕ2
Ecart type
Ѕ
L’échantillon est caractérisé par :

La moyenne :

𝑦1 + 𝑦2 + 𝑦3 … 𝑦𝑛 ∑𝑛𝑖=1 𝑦𝑖
𝑦̅ = =
𝑛 𝑛

La variance qui est un indicateur de la dispersion :

2 (𝑦1−𝑦̅)2 +(𝑦2−𝑦̅)2 +(𝑦3−𝑦̅)2 +⋯(𝑦𝑛−𝑦̅)2


Var(y) = 𝑆 = =
𝑁
∑𝑛 ̅)2
𝑖=1(𝑦𝑖−𝑦 𝑆𝑆
= 𝑑𝑑𝑙
𝑛−1
𝑆𝑆 : Sum of squares : Somme des carrés

ddl : degrés de liberté= n-1

L’écart type :

𝑆 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒

Si on dispose de plusieurs échantillons d’une même population

L’estimation de la variance
𝑆2 SS=∑ 𝑆𝑆𝑖 = 𝑆𝑆1 + 𝑆𝑆2 + 𝑆𝑆3

ddl=∑ 𝑑𝑑𝑙𝑖 = 𝑑𝑑𝑙1 + 𝑑𝑑𝑙2 + 𝑑𝑑𝑙3

 Pour l’échantillon 1: la moyenne est ̅̅̅̅


𝑦1
 Pour l’échantillon 2 : la moyenne est ̅̅̅̅
𝑦2
 Pour l’échantillon M : la moyenne est ̅̅̅̅
𝑦𝑀

La moyenne de toutes les moyennes est :

∑𝑀
𝑖=1 𝑦
̅𝑖
𝑦̿ =
𝑀

III. Comparaison de deux séries de mesure

Afin de tester l’hypothèse que la consommation de caféine facilite l’apprentissage, deux

groupes d’étudiants se préparent à un examen. Le groupe 1 boit une tasse de café et le groupe

2 boit deux, les résultats obtenus sont :

Groupe 1 Groupe 2

y1 47 50

y2 53 54

y3 49 51

y4 50 51

y5 46 49
Moyenne 49 51

49+51
𝑦̿ = = 50
2

Question : Est-ce que réellement boire 2 tasses de café donne de meilleures notes qu’une seule

tasse ?

On utilise la statistique appliquée pour répondre à cette question

Question : Est-ce que la différence entre les 2 moyennes est statiquement significative ?

La réponse sera affirmée avec un certain niveau de confiance (95% ; 99% ; 99,9%)

IV. Introduction à l’analyse de variance ANOVA

 Lorsque nous avons à comparer les résultats pour un nombre de groupes >=2, nous

utilisons la technique d’analyse statistiques connue sous le nom d’analyse de la

variance.

 Hypothèse nulle H0 : cette hypothèse considère que les deux séries de mesure ont été

tirées d’une même population c-à-d que la différence entre les deux moyennes n’est due

qu’à l’erreur expérimentale.

Même population
1. Variation totale

SStot = (47-50)2 + (50-50)2 + (53-50)2 + (46-50)2 + (49-50)2 + (50-50)2 + (51-50)2 + (54-50)2 +

(49-50)2 + (51-50)2 = 54

ddltot = 10-1 =9

2. Variation due à l’erreur expérimentale

Elle ne peut être évaluée qu’à partir d’essais réalisés exactement dans les mêmes conditions

 Estimation de l’erreur à partir du premier échantillon (groupe) :

SSE1 = (47-49)2 + (50-49)2 + (53-49)2 + (46-49)2 + (49-49)2 = 30

ddlE1 = 5-1 = 4

 Estimation de l’erreur à partir du deuxième échantillon (groupe) :

SSE2 = (50-51)2 + (51-51)2 + (54-51)2 + (49-51)2 + (51-51)2 = 14

ddlE2 = 5-1 = 4

 Variance de l’erreur :

2
SSE = SSE1 + SSE2 = 44

ddlE = ddlE1 + ddlE2

3. Variation due à la différence entre les deux groupes


Variance due au nombre de cafés

SSx = 5(49-50)2 + 5(51-50)2 = 10

Ddlx = 2-1=1 ; 2 : nombre de groupe

Récapitulations

SSTot = 54 SSE = 44 SSx = 10

ddlTot = 9 ddlE = 8 ddlx = 1

Revenons à l’hypothèse nulle : la différence entre les deux moyennes n’est due qu’à l’erreur
expérimentale

𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑡𝑟𝑎𝑖𝑡𝑒𝑚𝑒𝑛𝑡 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑥


= ≈1
𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑒𝑟𝑟𝑒𝑢𝑟 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝐸

Si ce rapport est proche de 1 : H0 est vraie


 Pas de différence entre la variation due au traitement (nombre de cafés) et la variation
due à l’erreur.
Si ce rapport est très > 1 : H0 est fausse
 Il ya une différence entre les deux groupes liée au nombre de cafés
𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑡𝑟𝑎𝑖𝑡𝑒𝑚𝑒𝑛𝑡
 Dans la pratique on calcul F0 = Fexp = puis on compare
𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑒𝑟𝑟𝑒𝑢𝑟
cette valeur critique de Fisher
 Pour un niveau de confiance de 95% (α=0,05), on cherche Fcrit (1,8) = 5,32
F0 < Fcrit ce résultat confirme H0
 Il n’ya pas de différence entre les deux groupes
 Le nombre de café n’a pas d’effet sur les notes des étudiants
Si F0> Fcrit
 Hypothèse nulle infirmé
 Il ya une différence entre les deux groupes
 Le nombre de cafés a un effet sur les notes des étudiants

On trouve des table de Fisher avec différents niveaux de confiance 95%, 99% et 99,9%
correspondant respectivement à α=0,05 ; 0,01 et 0,001
F0 Test
F0<F0, 05 (V1, V2) N.S : Non significatif
F0>F0, 05 (V1, V2) « * » Significatif avec un niveau de
confiance de 95%
F0<F0, 01 (V1, V2) « ** » Significatif avec un niveau de
F0>F0, 01 (V1, V2) confiance de 99%

F0<F0, 001 (V1, V2) « *** » Significatif avec un niveau de


F0>F0, 001 (V1, V2) confiance de 99,9%

Tableau récapitulatif : ANOVA

Source de SS (Sum of ddl (degrés Ms (Mean F0=Fexp Test


variation squares) de liberté) square)
Variation due au
10/1⁄
traitement (nombre 10 1 10/1 44/8 N.S
de café)
Variation due à 44 8 44/8
l’erreur
Variation totale 54 9 54/9

Le nombre de café pas d’effet sur les notes des étudiants

F0,05 (1,8) =5,32

Vous aimerez peut-être aussi