Vous êtes sur la page 1sur 82

Statistiques

Introduction
Ensemble des mthodes et procds partir desquelles
on recueille, organise, rsume et analyse des donnes, et
qui permettent den tirer des conclusions et de prendre
des dcision judicieuses.

Statistiques descriptives

Statistiques inductives

Dfinitions
Statistique descriptive
Cest la phase analytique qui consiste rduire les donnes un
nombre limit de paramtres caractristiques susceptibles de dcrire
la srie statistique.

Statistique inductive
Cest une phase qui permet de dduire des rsultats obtenus sur un
chantillon afin de prendre des conclusions relatives lensemble de
la population entire.

Quelques terminologies de la statistique

Population (univers):
Tout ensemble tudi en statistique sappelle population. Les lments sont
appels individus.

chantillon:
Cest un sous- ensemble dune population.

Effectif : ( ni )
Leffectif est associ une variable: cest le nombre de fois que cette
variable se rpte.

Frquence: ( fi )
Le rapport entre leffectif et le nombre deffectif total.

Modalit:

La valeur prise par une variable X.

Quelques terminologies de la statistique

Variable:
Elle est dfinie comme tant une quantit ou caractristique qui peut
varier dun individu un autre.
Ex: taille, poids, nationalit

Variable quantitative:

Variable qualitative:

Elle prend des valeurs numriques


et peut tre discrte ou continue

Elle ne prend ni valeur numrique et


ni un ordre naturel (ex: profession)
4

Les premiers traitement de linformation

Cest la phase initiale o il sagit de rassembler des donnes, de les


regrouper et les prsents sous forme de :
- Tableaux
Ou
- Graphiques
Le tableau tablit la correspondance entre deux sries de
nombres, lune est constitue par les valeurs de la variable
tudie ( Modalits ), lautre par les effectifs correspondants
( ou dautres : frquences,.)

Exemples:
5

Les premiers traitement de linformation

Exemple 1:
Dosage du phosphore par polarographie tension sinusodale surimpos::La mesure
de la hauteur dun pic de rduction dune solution phosphomolybdique talon donne
les rsultats suivants:

60, 59, 58, 58, 56, 57, 60, 59, 59, 59, 58, 59, 61, 60, 61
60, 58, 59, 60, 59, 59, 60, 59, 57, 60, 61, 59, 59, 56, 58.

Exemple 2:
On effectue lanalyse du sang de 20 personnes qui ont manipul un gaz
toxique. La mesure du taux de leucocytes ( globules blanc), par mm3, donne
les rsultats suivants :
3600
5100
6100
4600
5100
4800
3200
4700
5600
6900
5300
6100
3900
4200
3400
6300
5400
6200
3200
3700
6

Les premiers traitement de linformation


Exemple 3:
Lquipe de contrle de qualit dune maison dalimentation doit vrifier le poids dun produit
devant tre vendu en format de 20 g. Pour ce faire, on pse le contenu de 75 pots de ce produit,
slectionns au hasard. On obtient la distribution suivante :
-Cette distribution est-elle celle dune population ou celle dun chantillon?
- Quelle est le caractre tudi? Identifier le type.
Poids (en g)
19
- Complter le tableau.
Nbre de pots

20

21

22

23

24

31

24

11

Exemple 4:
On veut tudier la longueur des tiges dacier dun certaine production. Pour cela on a extrait
un lot dont les rsultats sont donns dans le tableau ci-dessous.
Faire une tude descriptive.
L(en mm)
Nbre de tiges

115-125

125-135

135-145

145-155

155-165

165-175

175-185

12

2
7

Prsentations graphiques

Diagramme en btons (variable discrte):


Lorsque la variable est discrte, on utilise le diagramme en btons, tel que les
modalits sont portes sur laxe des abscisses et les frquences (ou effectifs) sur
laxe des ordonnes.
Si lon joint les sommets des btons, on obtient le polygone des frquences
Histogramme (variable continue):
Histogramme est form de bandes rectangulaires ayant la largeur de chaque
classe et dont la hauteur est proportionnelle leffectif de la classe considre.
Le polygone des effectifs (frquences) sobtient en joignant les divers points
(ci, ni)
Diagramme circulaire (variable qualitative):

i = fi*360
8

Calcul des lments caractristiques dune srie statistique

Cest une phase analytique qui consiste rduire les donnes un nombre
limit de paramtres caractristiques.
Paramtres de position
(moyenne, mdiane)

Permettre de se rendre compte


sur lordre de grandeur de
lensemble des observations et
de localiser la zone des
frquences maximale

Paramtres de dispersion
(cart type, variance)

Prciser le degr de dispersion


des
diffrentes
observations
autour dune valeur centrale.
9

Paramtres de position
Mode:
La valeur de la variable correspondant leffectif le plus grand.
Lorsquil sagit de la classe on dit classe modale.

Mdiane:
la valeur de la variable statistique qui partage la population en deux effectifs
gaux.
Deux mthodes sont considrer selon quil sagit de variable statistiques
discrtes ou continues.

Variable discrte- variable continue


10

Paramtres de position
Variable discrte
Reprsentation graphique

point dintersection des courbes cumules


n/2

Me

Variable continue
On cherche la classe mdiane

11

Paramtres de position
Les moyennes:
i)

La moyenne arithmtique:

Soit une variable X

x 1, x2, xi, xn

On appelle moyenne arithmtique le rapport:


x = 1/n ni xi
ii)

La moyenne gomtrique:

Lorsquune variable croit suivant une progression gomtrique.


x1 = x0*r
x2 = x1*r

xn = xn-1*r

g = x0 r n/2
12

Paramtres de position
iii) Moyenne harmonique:
Soit x

(x1 xn)
H

(1/x1, 1/x2., 1/xn)


n
n

i 1 x i

iv) Moyenne quadratique:


x

( x1, x2xn)
q

1 n
2
xi
n
i 1

(x21, x22, x2n)

13

Paramtres de dispersion

Les paramtres de position sont insuffisants pour caractriser compltement


une srie
Ex :

m1= m2 de deux sries diffrentes


la rpartition

Dev. xi X

Paramtres de dispersion

Ecart |xi - X|
Etendue Xmax xmin

14

Paramtres de dispersion
Etendue :
W = X max X min

Ecart moyen arithmtique:


Cest la moyenne arithmtique des carts / la X (MA)

E = 1/n ni |xi - X|
Variance V :
Cest la moyenne arithmtique des carres des carts / X (MA)
cart- type :
Lcart type (ou cart quadratique moyen = rms) est la V

= V
15

Paramtres de dispersion
Covariance:

Cov(X,Y) = 1/n (xi X) (yi Y)


Coefficient de variation CV :
CV = s/X *100
-

CV donne une trs bonne ide sur le degr dhomognit dune


distribution statistique ( CV < 15%).

Comparaison de deux distribution.

16

Ajustement linaire & corrlation


Cas gnrale:
Lajustement du nuage obtenu consiste dterminer une fonction de liaison
entre X & Y.

y = ax + b ou y = a ebx
17

Ajustement linaire & corrlation

y= a log x + b

18

Ajustement linaire & corrlation

Y= a/x+ b

19

Ajustement linaire & corrlation


Dune manire gnrale, lajustement consiste rechercher une fonction
f(x) dont la graphe se rapproche le plus possible des points du
digramme.
On a toujours:

yi = f(xi) + i

i = yi- f(xi)

La mthode dajustement consiste dterminer les paramtres de f(x) qui


minimisent ces carts.
| i| ou bien

2
i

( y
i

f ( xi ))

Cest la mthode des moindres carres


20

Ajustement linaire & corrlation


Droite de rgression:

il sagit de dterminer a et b pour


minimale.

x y
i

x
i 1

2
i

nx y

nx

S a, b
i 1

y ax b

soit

x y nx y
x x
i

La droite de rgression passe par le point (x,y)

21

Ajustement linaire & corrlation


Cfficient de corrlation:
Le coefficient de corrlation permet de mesurer la prcision de lajustement

r X ,Y

Cov X , Y

Cas extrmes:
r= -1

il ya relation linaire parfaite y=ax+b avec a<0

r= 1

il ya relation linaire parfaite y=ax+b avce a>0

r0

il nexiste aucune relation linaire entre X&Y

22

Loi normale (loi de Laplace- Gauss)


Cette loi occupe une place privilgie en calcul statistique.
Soit X une variable alatoire continue. On dit que X suit une loi
normale (ou loi de Laplace- Gauss) si la densit de probabilit est :
f (x) = (1/ 2). e-1/2 ((x- m)/)2
Tracer f(x):

m
dfinit la largeur mi-hauteur de la courbe :
Plus est grand

plus le max est faible et plus la courbe est large

23

Loi normale (loi de Laplace- Gauss)


Calculer : Prob ( m x0 X m + x0 )
laire de la courbe de Gauss comprise entre m- x 0 et m+ x0

m x0

Changement de variable :

m + x0

t = (x-m)/ ( voir dmonstration )

La loi centre rduite de paramtre m = 0 & = 1


24

Loi normale (loi de Laplace- Gauss)


Utilisation de la table
Prob (m x0 X m + x0) = Prob (-t0 T t0)

0.01 0.02

0.06

0.09

0.0
0.1

t = 1.96
1.9

0.475

3.8
3.9

t
25

Loi normale (loi de Laplace- Gauss)


Calculer :

Prob (m X m + )
Prob (m 2 X m + 2 )
Prob (m 3 X m + 3 )

26

Loi Normale (Loi De Laplace- Gauss)


Exemple:
La taille des pices dune production suit une distribution N (150, 20).
N= 1000
1.

Quelle est le nombre de pices ayant une taille comprise entre 140 & 160 ?

2.

Quelle est le nombre de pices ayant une taille comprise entre 140 & 170 ?

3.

Quelle est le nombre de pices ayant une taille comprise entre 130 & 170 ?

4.

Quelle est le nombre de pices ayant une taille suprieure 170 ?

5.

Quelle est le nombre de pices ayant une taille infrieure 130 ?

6.

Quelle est le nombre de pices ayant une taille infrieure 175 ?

7.

Quelle est le nombre de pices ayant une taille suprieure 135 ?


27

Loi Binomiale
Dfinition
Soit une srie de n preuves successives et indpendantes ( preuve de
Bernoulli)dont lissue de chaque preuve est soit succs avec une
probabilit p, soit insuccs avec une probabilit q= 1-p, alors la
probabilit davoir x succs en n preuves est donne par lexpression:
Pr ob X x

C p q
x

n x

B (n,p)

Conditions dapplication:
Les rsultats de lexprience ne comporte que 2 rsultats possibles: succs ou insuccs
On rpte lexprience n fois
La probabilit de ralisation de lvnement succs est la mme chaque essai note p.
Les essais sont indpendantes et non exhaustifs ( ou n/N 0.10 ) .

28

Loi Binomiale
Proprits:
Les paramtres de la loi binomiale sont n et p ( n > 0 et 0 < p < 1)
La moyenne et la variance sont:

M=np

&

= n p(1-p)

Les valeurs tabules:


n

k
0
1
2

0.10
0.8100
0.1800
0.0100

0
1
2
3

0.7290
0.2430
0.0270
0.0010

0.20
0.6400
0.3200
0.0400

p
0.30
0.4900
0.4200
0.0900

0.40
0.3600
0.4800
0.1600

0.50
0.2500
0.5000
0.2500

29

Loi Binomiale
La loi binomiale permet dvaluer la probabilit de tirer x produits
dfectueux dans un chantillon de n produits provenant dun lot important
contenant p% de dfectueux.
Exemple:
Soit un lot contenant une proportion de 10% de produits dfectueux.
On prlve un chantillon de 8 produits sans remise. Calculer la probabilit de
tirer dans un chantillon:
un ou zro produit non- conforme
au moins deux produits non- conformes
Au plus un produit non- conforme
30

Loi de Poisson
Dfinition:
On dit quune variable alatoire X suit une loi de poisson, si elle est
successible de prendre toutes les valeurs entires 0, 1, 2, 3,..n,
la probabilit que X soit gale k tant:
Pr ob X k

e
k
k

Conditions dapplication:
La loi de poisson sappelle encore la loi des petites probabilits. Elle est
utilise pour prsenter des phnomnes rares:nombres daccidents,
nombre de dfauts, de dchets.
Proprits:
La moyenne et la variance sont:

E(X)=

&

=
31

Loi de Poisson
Les valeurs tabules:

0.1

0.2

0.3

0.4

0.5

0.6

Pr ob X k

0.7

0.8

0.9

1.0

1.7

1.8

1.9

2.0

1.1

1.2

1.3

1.4

1.5

1.6

0
1

32

Loi de Poisson
La loi de poisson est largement utilise pour dcrire les dfauts
compatibles par unit ( exemple, le nombre de ponts de soudure sur un
circuit imprim, pannes de machines, appels tlphoniques sur une ligne,
arrives de clients comptoir)
Exemple 1:
Supposons que les dfauts pont de soudure sur un circuit imprim soit
distribu selon une loi de poisson avec un paramtre = 2.
Calculer la probabilit quun circuit contienne un pont de soudure au moins.
Exemple 2:
Si la probabilit pour quun individu ait une mauvaise raction dun certain
srum est de 0.001, dterminer la probabilit pour que sur 2000 individus :
-3
- plus de 2
aient une raction dangereuse.
33

Echantionnage
&
Estimation
34

Echantillonnage
INTRODUCTION
Lchantillonnage a pour objectif dtudier le lien entre la distribution
statistique dune variable X dans une population P et les distributions de
cette variable dans diffrents chantillons.
Pop :
N, M,

Echantillons i : n, mi, i

Echantillonage alatoire = Les individus ont mme Probabilit

Exhaustif

Non-exhaustif
35

Echantillonnage
Distribution des moyennes dchantillons
Soit une Population P

soient tous les Echantillons i : n


1

( n, m1, 1)

( n, m2, 2)

( n, mi, i)

( n, mk, k)

N, M, : E(X) = M

& = (X)

( k chantillons )

Lensemble :
m (m1,m2,,mi,..mk) constitue une
srie statistique deffectif k appele
Distribution des Moyennes.

36

Echantillonnage
Distribution des moyennes dchantillons
Pop :

Echantillons i : n, mi, i

N, M,

Non-Exhaustif
E(X) = M

Exhaustif

E(X) = M

N n

N 1

37

Echantillonnage
Distribution des frquences dchantillons
1
Soit une Population P

0
p = proportions dlments ayant X = 1
On dsigne par
q = proportions dlments ayant X = 0
tq :

p+q=1 ,

0<p<1

&

0<q<1

La population P de taille est caractrise par :

E(X) = p
= p*q
38

Echantillonnage
Distribution des frquences dchantillons
X

N, F, F : E(F) = p

soient tous les Echantillons i : n

( k chantillons )

Soit une Population P

( n, f1, 1)

( n, f2, 2)

( n, fi, i)

( n, fk, k)

& F = p*q

Lensemble :
m (f1,f2,,fi,..fk) constitue une srie
statistique deffectif k appele
Distribution des Frquences.

39

Echantillonnage
Distribution des frquences dchantillons
Pop :

Echantillons i : n, fi, i

N, F, F

Non-Exhaustif
E(f) = p

m( f )

Exhaustif
E(f) = p

p*q
n

m( f )

p*q
n

N n
N 1
40

Echantillonnage
Autres distributions dchantillonnage
On peut dfinir dautres distributions pour toutes variables susceptibles
dtre variable dun chantillon lautre ( , Me, V,..).
Distributions
N, M,

t
n < 30

Ajustement dune distribution


thorique et exprimentale
41

Echantillonnage
Distribution t:
Distribution

N, M,
soit un chantillon de taille n

mi M
ti

Loi normale N (M, )

(n, m i, i)

Ecart Rduit
42

Echantillonnage
Distribution
Pop :
N, M,

Echantillons i : n, mi, i

( xij mi ) 2

2 j 1
i
2
La srie

(1, 2, i n) constitue une distribution de

43

Estimation
Introduction
Si lchantillonnage tudi les relations existants entre une population et tous les
chantillons de mme taille n, lestimation vise tudier la reprsentativit de la
population par un chantillon.

IL sagit dattribuer une valeur un paramtre inconnu de la population


partir de la connaissance dun chantillon extrait de cette population.

Il y a deux types destimation :


Estimation ponctuelle : Attribuer une valeur unique
Estimation par intervalle de confiance ( IC ) : Donner un
intervalle susceptible de recouvrir la valeur recherche
avec une probabilit donne.
44

Estimation
Estimation Ponctuelle
Echantillons i : n, mi, i

Pop : N, M,
( M, sont inconnus )

1.

Estimation Ponctuelle de la moyenne : M = E(X) = m

2.

Estimation Ponctuelle d une variance :

'

n
n 1

'

X n 1
3.

Estimation ponctuelle dune variance dun chantillon ( s ) :


2
2 1
s (n 1) ( xi X )
45

Estimation
Estimation par Intervalle de confiance ( IC )
Lestimation par IC dun paramtre consiste calculer, partir dun estimateur
choisi , un intervalle dans lequel il est vraisemblable que la valeur correspondante
du paramtre sy trouve.
LIC est dfini par deux limites auxquelles est associe une certaine probabilit, fixe
lavance et aussi leve quon dsire, de contenir la valeur vraie du paramtre
inconnu :

Prob ( LI LS ) = 1 -
Avec (1-) = Probabilit associe
lintervalle dencadrer la vraie valeur

/2

1-

/2
46

Estimation
Estimation par Intervalle de confiance ( IC )
On peut crire aussi :

Prob ( - k + k ) = 1 -
La quantit k dpend de la distribution dchantillonnage spcifie de lestimateur
et de la probabilit associe ( = risque derreur ) ( voir schma )

Applications :

Estimation par IC dune moyenne

Estimation par IC dune proportion


47

Estimation
Estimation par IC dune moyenne
Il y a 3 cas possibles :
1.

Si est connu :
Prob ( m - t m M m + t m ) = 1 -

2.

Si est inconnu et n 30 :
Prob ( m - t m M m + t m ) = 1 -

3.

Si est inconnu et n < 30 :


Prob ( m - t m M m + t m ) = 1 -

m est lcart type de la distribution chantillonnage


t valeur extrait de la table N(0,1)
t valeur extrait de la table de la loi de Student (,)

48

Estimation
Estimation par IC dune proportion
Dans le cas de lestimation dune proportion on a seul cas car est
connu et donn par :
2 = p*( 1- p )
Alors IC est donn par :
Prob ( m - t m M m + t m ) = 1 -

Avec m est lcart type de la distribution chantillonnage : m

49

Estimation
Remarques
1. Echantillonnage exhaustif :

N n
N 1

2. Encadrement de la moyenne de chantillon:


Prob ( M - t m m M + t m ) = 1 -

3. Utilisation de la table de Student :

0.9

0.5

0.4

0.01

0.001

2
3

1-

/2
-t

/2
t

50

TESTS STATISTIQUES

Objectifs
chantillonnage

Estimation

Tests statistiques
- Homognit, Reprsentativit
- Conformit, Validit, Comparaison

51

Dfinitions
Df 1: Hypothse statistiques
Une Hypothse Statistique est un nonc ( une affirmation )
concernant les caractristiques ( valeurs des paramtres,
forme de la distribution des observations ) dune population.

Df 2: Test statistique
Un test statistique ( ou test dhypothse ) est une dmarche
qui a pour but de fournir une rgle de dcision
permettant, sur la base de rsultats dchantillon, de faire
un choix entre deux hypothses statistiques.

52

Hypothses Nulle H0 et Alternative H1


Deux hypothses sont envisageables :

Hypothse selon laquelle on fixe a


priori un paramtre de la population
une valeur particulire sappelle :

Nimporte quelle autre hypothse


qui diffre de lhypothse H0
sappelle

Hypothse Nulle H0

Hypothse Alternative H1

N.B.
Cest lhypothse H0 qui est soumise au test et toute la dmarche
du test seffectue en considrant cette hypothse comme vraie.
53

Notion du Risques 1er et 2me espce


Test Statistique

?
Hypothse Nulle H0

Accepter
Rejeter

Hypothse Alternative H1

Lexprimentateur fait face un problme fondamental, celui de la variation


associe avec tout travail exprimental.
=== Une certaine incertitude sera associe au jugement que nous allons
porter; nous ne pouvons tre totalement confiant que ce jugement soit exacte.
Par contre, on peut limiter les risques derreurs et sassurer de bien comprendre
ces risques dans notre processus de dcision.
54

Dfinir les Risques 1er et 2me espce


Risque du 2me espce ( ) :

Risque du 1 espce ( ) :
er

= Prob( rejeter H0 / H0 est vraie )

H1

/2

H0

1-

= Prob( accepter H0 / H0 est fausse )

H1

/2

M0
Lorsquon prend une dcision sur un problme donn,
on aimerait bien minimiser les risques et .

55

Formulation des hypothses et Types de Tests


Pour formuler ces hypothses, on se base sur le test sur une moyenne :

H0 : M = M0

H0 : M = M0

H0 : M = M0

H1: M M0

H1: M M0

H1: M M0

Rej Ho

Acc Ho

Xc1

M0

Rej Ho

Xc2

Acc Ho

M0

Rej Ho

Xc

Rej Ho

Xc

Acc Ho

M0

Tests Unilatral

Tests Bilatral
M0 = valeur Hypothtique

56

Elaboration dun Test Statistique


Llaboration dun test statistique peut comprendre les tapes suivantes :
1.

Enoncer H0 et H1

2.

Enoncer les Hypothses de bases

3.

Choisir le risque derreur ( seuil de signification )

4.

Spcifier la statistique sur la quelle portera le test

5.

Dfinir la rgion critique

6.

Rsultats exprimentaux

7.

Consquences et Conclusions
57

Test sur une Moyenne


- Voir les tables test 1-6

-Applications : ( TD n4 )

Exemple 1:
Une entreprise achte dun fournisseur des cbles dacier dont la rsistance moyenne la rupture
doit tre suprieure ou gale 250 kg/cm. Entant que cette norme est respecte, l'entreprise est
satisfaite du produit. Toutefois une rsistance moyenne la rupture infrieure 250 kg/cm est
inadquate pour lentreprise. Lors de la rception dun lot, on veut sassurer de la qualit des
cbles sur la base dun chantillon. Formuler les hypothses statistiques pertinentes.

Exemple 2 :
Dans un atelier mcanique, on vrifi le diamtre de tiges tournes sur un tour
automatique. Le diamtre des tiges peut fluctuer selon le rglage du tour. 20 tiges prleves au
hasard, ont t mesures avec un micromtre de prcision. Les rsultats sont prsents dans le
tableau suivant ( en mm ) :
m = 39.96
s = 1.22
Si le diamtre moyen des tiges doit tre de 40 mm, doit-on envisager, selon les rsultats de cet
chantillon, de modifier le rglage du tour ?
58

Test sur une Proportion


Cest la mme dmarche que dans le cas dun test sur une moyenne M.
En effet, on se propose de tester si une proportion p (M) dans une population prsentant
u n certain caractre qualitatif peut tre considre ou non gale une valeur
hypothtique p0 (a).

- Condition dapplication : n p 5 &

n(1-p) 5

- Critre de test :

t 0

p p0
p0(1 p0)
n

qui suit la loi Normale N(0,1)

-Voir table test 19-21


- Applications : ( Voir exemple )

59

Test sur une Proportion


Exemple :
Une entreprise vient de recevoir un trs grand nombre de tubes de verres.
A la rception, on dsire vrifier si ces tubes respectent les normes du
dpartement du contrle de qualit. Un chantillon alatoire de 100 tubes
donne les rsultats suivants :
12 dfectueux
88 satisfaisants
1- Si la norme impose consiste accepter un lot dont la proportion
dfectueuse nexcde pas 10%, quelle dcision doit-on prendre ?
2- Supposons que la proportion de dfectueux est 0.08. On veut
dterminer la taille dchantillon ncessaire pour assurer que p soit
lintrieur de 0.02 de p avec une probabilit de gale 0.95.
60

Test sur une Variance

Objectif
Quand et Comment
Tout comme dans le cas de la moyenne, il est frquent de faire un test sur une
variance ( ) et de dterminer son IC avec un certain niveau de confiance.
Toutefois, peut tre en mesure deffectuer un test sur une variance, il faut
introduire une nouvelle loi de probabilit, soit la loi de 2 ( Khi-deux ).

La loi de 2

?
61

Test sur une Variance

Comment est forme 2: ( voir cours chantillonnage )


Proprits :
- 2 est une variable alatoire continue positive
- Densit de probabilit est complexe
- Elle ne dpend que de ( ddl )
- Lallure de la courbe est asymtrique
-Lorsque augmente la loi 2 la loi Normale

62

Test sur une Variance


Valeur tabules: ( Voir tableau )
Les valeurs de 2 dpendent de et . Elles sont donnes de faon que la
probabilit de soit suprieure une valeur fixe , est dfinie par :

Prob( ) =
f(
)

0.9

0.5

0.4

0.01

0.001

(1

2
3

63

Test sur une Variance


Distribution dchantillonnage de la variance dchantillon
On prlve au hasard un chantillon de taille n dune population dont les lments
prsentent un caractre mesurable, distribue normalement de paramtre M et . On
dmontre que la quantit (n-1)s2/ 2 suit une loi de 2 avec (n-1) ddl, o la variable s2
est la variance dchantillon.

Test sur une variance :


On procde de la mme manire que dans le cas du test sur une moyenne part que :

Le Critre de test est

: 0

(n1)s

La loi 2

Valeur Hypothtique

Application : ( voir le tableau )


64

Test sur une Variance


Intervalle de confiance pour une variance 2dune population Normale :
A partir dun chantillon alatoire de taille n dune population Normale de variance
inconnue 2, on dfinit, en prenant comme estimation ponctuelle de 2 la variance de
lchantillon s2, un IC ayant un niveau de confiance 100(1-)% de contenir la vrai
valeur 2 comme suit :

(n1)s

/2

(n 1)s

/2

( voir dmonstration )

65

Test sur une Variance


Applications : ( exemples 1&2)
Exemple 1:
La dure de vie dun composant lectronique est distribue selon la loi N( M ; 2 = 2500).
Dans un chantillon alatoire de 16 composants prlevs de cette population, quelle est la
probabilit pour que la variance de lchantillon soit comprise entre 1210 et 4166 ?

Exemple 2 :
Une ville veut acheter une certaine quantit de lampes fluorescentes pour lclairage
de son mtro. La ville est seulement intress une longue dure de vie des lampes
mais aussi une dispersion relativement faible. On dcida que lcart type de cette
caractristique ne devrait pas excder 100 heures. Le laboratoire de la ville a vrifi
20 lampes dun fournisseur local et a obtenu une variance s2 = 12500 h2. Est-ce que les
lampes du fournisseur semblent excder la variation permise ? ( utiliser = 5% )
66

Test sur deux Moyennes


Soient deux populations 1 & 2 :
Pop 1 : M1

m1

1 et 2 peuvent tre connus ou inconnus

Pop 2 : M2

m2

On veut comparer les moyennes M1 et M2 des deux populations 1 & 2. Cette


comparaison bases sur les moyennes m1 et m2 de 2 sries de mesures,
repose sur la connaissance de certaines caractristiques des populations
chantillonnes qui nous permet de dduire la distribution des fluctuations
dchantillonnage de la diffrences des moyennes ( m 1-m2). Cette
distribution sera ncessaire pour laborer la rgle de dcision du test.

67

Test sur deux Moyennes


Pour caractriser compltement la distribution de la diffrence ( m 1-m2),
il faut connatre :

- La forme de distribution.
- La moyenne.
- Lcart type.
3 cas peuvent se prsenter :
- Populations Normales de variances connues.
- Grands chantillons ( n1 30 , n2 30 ) et variances inconnues.
- Populations Normales de variances inconnues ( mais supposes gales
12 = 22 = 2 ) et lun des chantillons ou les deux ayant une taille
petite. .
68

Test sur deux Moyennes


Ca1 : Populations Normales de variances connues.
La distribution dchantillonnage

Pop 1 :
M1, 1

Pop 2 :
M2 , 2

m1

m2

prsente les proprits suivantes :


-La distribution ( m1-m2 ) est Normales
-La moyenne : E(m1-m2) = M1-M2
-Ecart type : m1-m2 =
Le critre de test est donn par :
69

Test sur deux Moyennes


Ca2 : Grands chantillons ( n1 30 , n2 30 ) et variances inconnues.
La distribution dchantillonnage

Pop 1 :
M1, 1

Pop 2 :
M2 , 2

m1

m2

prsente les proprits suivantes :


-La distribution ( m1-m2 ) est Normales
-La moyenne : E(m1-m2) = M1-M2
-Ecart type : m1-m2 =
Le critre de test est donn par :
70

Test sur deux Moyennes


Ca3 : Populations Normales de variances inconnues ( mais supposes
gales
12 = 22 = 2 ) et lun des chantillons ou les deux ayant une
taille petite.
Pop 1 :
Pop 2 :
La distribution dchantillonnage
M1, 1

M2 , 2

m1

m2

prsente les proprits suivantes :


-La distribution ( m1-m2 ) est Normales
-La moyenne : E(m1-m2) = M1-M2
-Ecart type : m1-m2 =
Le critre de test est donn par :
71

Test sur deux Moyennes


Exemple :
Un laboratoire indpendant a effectu, pour le compte dune revue sur la
protection du consommateur, un essai de dure de vie sur un type dampoules
lectriques dusage courant ( 60 watts, 120 volts ) fabriques par deux grandes
entreprises concurrentielles, dans le secteur de produits dclairage. Les essais
effectus dans les mme conditions sur un chantillon de 40 ampoules
provenant de chaque fabricant donnent les rsultats suivants :
F1 :
F2 :

n1 = 40
n2 = 40

X1 = 1025 h
X2 = 1070 h

s1 = 120 h
s2 = 140 h

La publicit affirme que ces ampoules ont une dure de vie moyenne de 1000h.
Est-ce que la revue peut affirmer, quen moyenne, les ampoules de F1 ont une
dure de vie infrieure celles du F2 ?
72

Test sur deux Proportions


Nous traitons uniquement le cas o nous sommes en prsence de grands chantillons

Soient deux populations 1 & 2 :


Pop 1 : P1

p1

P1 et P2 sont inconnues

Pop 2 : P2

p2

La diffrence ( p1 - p2 ), estimateur de ( P1 P2 ), est une variable alatoire dont la


distribution possde les proprits suivantes :
- la distribution ( p1 - p2 ) est approximativement Normales
- La moyenne : E(p1-p2) = P1-P2
- lcart type est :

73

Test sur deux Proportions


Comme tant P1 et P2 sont inconnues, on estime lcart type par :

Alors le critre de test est :

74

Test sur deux Proportions


Pour effectuer un test sur lgalit de 2 proportions, on procde comme
prcdemment , dans le cas de 2 moyennes. Sauf dans ce cas, nous utilisons, sous
lhypothse :
H0 : P1 = P2 = p
O p est lestimateur dfinie par : p =
Alors lcart type S scrit :

Donc le critre de test est :


-Voir table test 22-24
- Applications : ( Voir exemple )

75

Test sur deux Proportions


Exemple :
Deux types de publicit sont envisags par une entreprise pour lancer un nouveau
produit (ddorant). Aprs avoir visionn les deux types de publicit mis au point par
des spcialistes en communication, la direction met lhypothse selon laquelle la
publicit du type A sera efficace que celle du type B. Deux rgions, considres,
comme march test ( possdant sensiblement les mmes caractristiques de
consommation ) sont choisies pour valuer lefficacit des deux types de publicit.
La publicit de type A sera utilise dans une rgion et celle de type B dans lautre.
Un sondage auprs de 125 individus ayant vu la publicit de type A indique que 44
se sont procur le ddorant alors que sur 100 ayant vu la publicit B, 32 se sont
procur le nouveau ddorant.
Est-ce que les rsultats de ce sondage permettent de confirmer, au seuil de
significations 5%, lhypothse mise par la direction?

76

Test sur deux Variances


La comparaison de deux populations Normales peut porter non seulement sur
leur valeur centrale, leur moyenne, mais galement sur leur dispersion.
La caractristique de dispersion la plus utilise est la variance.
Rappelons quune des conditions dapplication du test de Student , dans le cas
de comparaison de deux moyennes, est que les chantillons proviennent de deux
populations Normales de variances identiques : = 22. Cette hypothse peut tre
vrifie laide dun test sur lgalit de deux variance.

Pour effectuer un tel test, il faut intervenir une nouvelle distribution


dchantillonnage soit celle du Quotient de deux variances dites
Distribution F ou Distribution de Fischer-Snedecor.
77

Test sur deux Variances


Distribution de Fischer
Fischer 1924

Tabule par Snedecor 1934

La distribution F possde les proprits suivantes :


La quantit F est une variable alatoire Continue :
Densit trs complexe
F 0
Dpend uniquement de 1 et 2
Lorsque 1 et 2 augmente la distribution F ------> Distribution Normale
78

Test sur deux Variances


Valeur tabules de la distribution F
( Voir tableau )
Les valeurs de F dpendent de etet . Elles sont donnes de faon que la
probabilit de F soit suprieure une valeur fixe F , est dfinie par :

Prob( F F ) =
f(F)

Pour un donn
1
3

(1-

2
3

79

Test sur deux Variances


Relation Complmentaire
Prob( F F ) =

Prob( F F ) = 1-

f(F)

f(F)

0
F=

(1-

(1-

0
ou

F=

F
80

Test sur deux Variances


Soient deux populations 1 & 2 :

On dmontre que la quantit :

s
s

2
2

Le critre de test est donc :


(Voir tableau)

Pop 2 : M2 , 2

m1,s1

m2,s2

Pop 1 : M1, 1

2
1

s
s
2

2
2

1
2

Loi Fischer

s
s

1
2
2

Loi Fischer
81

Test sur deux Variances


Exemple:
Un laboratoire, firme dexpertises en contrle de qualit de matriaux, a t
demand par une socit de grance de projets de construction pour valuer la
qualit dun mlange bitumineux provenant de 2 usines. Il a t convenu
deffectuer une vrification par 115 cm3 de bton et dvaluer la rsistance la
compression, lge de 3 jours, sur des cylindres standards. Les rsultats de la
rsistance la compression ( en kg/cm2 ) pour les 2 usines se rsume comme suit:

U1 :
U2 :

n1 = 25
n2 = 25

m1 = 90.6
m2 = 94.4

s1 = 65.42
s2 = 58.24

1. Peut-on considrer comme vraisemblable, au seuil de = 0.05, lhypothse


selon laquelle la variabilit de la rsistance la compression du bton provenant de
chaque usine est identique? On suppose que la rsistance la compression suit la
loi normale.
2. Donner l IC 5% du quotient des deux variances.
82