Vous êtes sur la page 1sur 30

Michel Rioux, ing., Ph. D.

Directeur Génie des opérations et de la logistique


(514) 396-8617
michel.rioux @etsmtl.ca
GOL675
Planification et optimisation d’expériences
Chapitre 2
- Expériences comparatives simples -
Plan de la présentation

• Description des données


 Échantillon
 Moyenne, variance et écart type
 Populations versus échantillons
 Estimation de paramètres statistiques

• Comparaisons simples
 Cadre des tests d’hypothèses
 Test t à deux échantillons
 Conditions d’utilisation

GOL675
2
© Michel Rioux - ÉTS
Béton
Portland
modifié

Sont-ils vraiment
différents?

Sont-ils statistiquement
différents?

GOL675
3
© Michel Rioux - ÉTS
Concepts statistiques

GOL675
4
© Michel Rioux - ÉTS
Concepts statistiques

GOL675
5
© Michel Rioux - ÉTS
Concepts statistiques
• De l’échantillon à la distribution

GOL675
6
© Michel Rioux - ÉTS
Lois très importantes

Loi de Fisher

GOL675
7
© Michel Rioux - ÉTS
Cadre conceptuel des
tests d’hypothèses
• Les tests d’hypothèses offrent un cadre
conceptuel très utile en expérimentation
• Les origines viennent du début des
années 1900
• Après une synthèse de ces tests, nous
regardons plus en détail la procédure du
test t à deux échantillons

GOL675
8
© Michel Rioux - ÉTS
Synthèse – 1 échantillon

Variance

GOL675
9
© Michel Rioux - ÉTS
Synthèse – 2 échantillons

GOL675
10
© Michel Rioux - ÉTS
Cadre conceptuel des
tests d’hypothèses
• Exemple :
 Échantillonner une distribution normale
 Hypothèses statistiques :

GOL675
11
© Michel Rioux - ÉTS
Estimation des paramètres
Population Échantillon

Moyenne

Variance

Écart type

GOL675
12
© Michel Rioux - ÉTS
Estimation des paramètres
• Estimation de la moyenne
de la population, µ

• Estimation de la variance
de la population, σ2

GOL675
13
© Michel Rioux - ÉTS
Statistiques

Formulation 1 Formulation 2

« Nouvelle » « Originale »

GOL675
14
© Michel Rioux - ÉTS
Fonctionnement du test t à
deux échantillons

GOL675
15
© Michel Rioux - ÉTS
Fonctionnement du test t à
deux échantillons

GOL675
16
© Michel Rioux - ÉTS
Fonctionnement du test t à
deux échantillons

• Des valeurs près de zéro démontrent un accord avec


l’hypothèse nulle (pas de différence)
• Des valeurs très différentes de zéro démontrent un
accord avec l’hypothèse alternative (vraie différence)
• La statistique du test (Z ou t0 ) représente une mesure de
distance entre les moyennes qui est exprimée en
nombre d’écarts types
• Ce test peut s’interpréter comme un ratio signal/bruit
GOL675
17
© Michel Rioux - ÉTS
Fonctionnement du test t à
deux échantillons (agrégé)

GOL675
18
© Michel Rioux - ÉTS
William Sealy Gosset
(1876, 1937)
Gosset's interest in barley cultivation led
him to speculate that design of
experiments should aim, not only at
improving the average yield, but also at
breeding varieties whose yield was
insensitive (robust) to variation in soil and
climate.

Developed the t‐test (1908)

Gosset was a friend of both Karl Pearson


and R.A. Fisher, an achievement, for each
had a monumental ego and a loathing for
the other.

Gosset was a modest man who cut short


an admirer with the comment that “Fisher
would have discovered it all anyway.”
GOL675
19
© Michel Rioux - ÉTS
Fonctionnement du test t à
deux échantillons (agrégé)
• Nous avons besoin d’une méthode objective pour
décider si la différence est suffisante pour conclure qu’il
existe une vraie différence
• In 1908, W. S. Gosset a déterminé la distribution de
référence pour t0, appelée la loi t de Student

t0 = -2.20

GOL675
20
© Michel Rioux - ÉTS
Fonctionnement du test t à
deux échantillons (agrégé)
• Une valeur de t0 entre –2.101 et 2.101 est cohérente
avec l’hypothèse des moyennes égales
• Il est possible que des moyennes soient égales et que t0
excède 2.101 ou –2.101, mais ce serait un événement
rare et qui nous porterait à conclure qu’il y a vraiment
une différence
• On peut aussi utiliser l’approche du « p-value »

t0 = -2.20

GOL675
21
© Michel Rioux - ÉTS
Fonctionnement du test t à
deux échantillons (agrégé)

t0 = -2.20

• Le seuil (p-value) représente l’aire sous la courbe (probabilité)


d’être à l’extérieur de -2.20 ET d’être à l’extérieur de 2.20 (test
bilatéral)
• Le seuil (p-value) exprime la probabilité d’avoir un certain écart
observé même si l’hypothèse nulle est vraie
• Le seuil (p-value) représente le risque de conclure à une différence
alors qu’il y en a pas
• Dans notre cas, le seuil (p-value) vaut 0.042 22
Résultats informatiques

GOL675
23
© Michel Rioux - ÉTS
Vérifications des conditions –
Diagramme probabilités normales

GOL675
24
© Michel Rioux - ÉTS
Importance du test t
• Fournit un cadre objectif pour les
comparaisons simples
• Pourrait être utilisé pour tester plusieurs
conditions, mais … attention aux p-values
dans ce cas (théorie des comparaisons
multiples)

GOL675
25
© Michel Rioux - ÉTS
Intervalles de confiance
• Plutôt que de tester une hypothèse, on peut
aussi vérifier si les intervalles de confiance sont
communs
• Forme générale des intervalles de confiance

• L’intervalle de confiance à 100(1- α)% sur la


différence de deux moyennes est le suivant

GOL675
26
© Michel Rioux - ÉTS
Intervalles de confiance

GOL675
27
© Michel Rioux - ÉTS
I.C. pour le béton Portland

GOL675
28
© Michel Rioux - ÉTS
Autres sujets du chapitre
• Test d’hypothèses avec variances
connues
• Test à un échantillon
• Test d’hypothèses sur deux variances
• Comparaisons appariées

GOL675
29
© Michel Rioux - ÉTS
Statgraphics
• Le logiciel officiel utilisé dans ce cours est
Statgraphics Centurion
 Il est disponibles dans les laboratoires
 Il est possible de s’en procurer une version
académique pour étudiant à faible coût :
 http://www.statgraphics.com/pricing.htm#Acad
emic_Licenses0

GOL675
30
© Michel Rioux - ÉTS

Vous aimerez peut-être aussi