Vous êtes sur la page 1sur 62

C OURS DE STATISTIQUE INFÉRENTIELLE

1
1

E.N.A.C

Françoise SEYTE

Maître de Conférence Université Montpellier 1

2014 - 2015

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Maître de Conférence Université Montpellier 1 2014 - 2015 MCU F. Seyte, Université Montpellier 1- ENAC-
OBJECTIFS DU COURS Le cours a pour objectif d'acquérir et de maîtriser les outils de

OBJECTIFS DU COURS

Le cours a pour objectif d'acquérir et de maîtriser les outils de

la statistique mathématique nécessaires à la construction d'intervalles de confiance et de tests indispensables à la prise de décision pour un futur ingénieur.

à la prise de décision pour un futur ingénieur. MCU F. Seyte, Université Montpellier 1- ENAC-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

2
2

OBJECTIFS DU COURS

Le cours de statistique probabiliste donne les basesOBJECTIFS DU COURS nécessaires pour savoir prendre des décisions utiles dans le futur métier d'ingénieur. Il

nécessaires pour savoir prendre des décisions utiles

dans le futur métier d'ingénieur.

Il essaie de répondre aux questions suivantes : de répondre aux questions suivantes :

comment sont construits les échantillons?

Comment déterminer leurs tailles?

Les échantillons sont ils représentatifs de la population? Peut-on comparer par exemple les moyennes de ces deux échantillons?

sont ils représentatifs de la population? Peut-on comparer par exemple les moyennes de ces deux échantillons?

Peut-on faire des prévisions?

Autant de questions auxquelles doivent savoir répondre un futur ingénieur.

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

auxquelles doivent savoir répondre un futur ingénieur. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 3
auxquelles doivent savoir répondre un futur ingénieur. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 3
3
3

PROGRAMME

1 - Construction théorique des lois statistiques et lecture des tables statistiquesPROGRAMME - Echantillonnage - Estimation ponctuelle - Estimation par intervalles de confiance 5 - Tests non

- Echantillonnagedes lois statistiques et lecture des tables statistiques - Estimation ponctuelle - Estimation par intervalles de

- Estimation ponctuelleet lecture des tables statistiques - Echantillonnage - Estimation par intervalles de confiance 5 - Tests

- Estimation par intervalles de confiance de confiance

5 - Tests non paramétriques (test d'adéquation et testponctuelle - Estimation par intervalles de confiance d'indépendance) et paramétriques (tests de

d'indépendance) et paramétriques (tests de signification d'un paramètre et tests de comparaison de paramètres)

2

3

4

paramètre et tests de comparaison de paramètres) 2 3 4 MCU F. Seyte, Université Montpellier 1-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

4
4

CHAPITRE 1

ECHANTILLONNAGE

5
5

Les lois d’échantillonnage et les variables

d’échantillonnage définies dans ce chapitre vont nous

servir dans les chapitres 3 et 5 pour établir les intervalles de confiance (c’est à dire encadrer les paramètres inconnus d’une population : moyenne, variance,

proportion) et faire des tests d’hypothèse (c’est-à-dire

tester les paramètres d’une population à partir des données d’échantillonnage).

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

population à partir des données d’échantillonnage) . MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
Notion de base en statistique : celle de population  

Notion de base en statistique : celle de population

 
Population : ensemble d’individus (ou objets ou unités

Population : ensemble d’individus (ou objets ou unités

statistiques) pouvant être décrits par un ensemble de variables

(ou propriétés ou caractéristiques) communes.

 
Impossible d’étudier tous les individus d’une population

Impossible d’étudier tous les individus d’une population

d’étudier tous les individus d’une population un sondage un échantillon représentatif.   La
un sondage un échantillon représentatif.  

un sondage

un sondage

un échantillon représentatif.

 
La théorie de l’échantillonnage permet de passer des
La théorie de l’échantillonnage permet de passer des

La théorie de l’échantillonnage permet de passer des

caractéristiques

de

la

population

aux

caractéristiques

d’un

échantillon représentatif

caractéristiques d’un échantillon représentatif MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 6

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

6
6

La question essentielle que l’on peut se poser est lasuivante : Pourquoi s’intéresser à l’échantillon, pourquoi ne pas effectuer les calculs nécessaires directement

suivante :

Pourquoi s’intéresser à l’échantillon, pourquoi ne pasessentielle que l’on peut se poser est la suivante : effectuer les calculs nécessaires directement sur

effectuer les calculs nécessaires directement sur la

population ?

Pour deux raisons au moins : deux raisons au moins :

- il n’est pas certain que les statistiques désirées soient disponibles sur l’ensemble de la population,

- et d’autre part, il est beaucoup moins coûteux et aussi plus

rapide de rassembler des informations sur mille individus plutôt que sur un million.

informations sur mille individus plutôt que sur un million. MCU F. Seyte, Université Montpellier 1- ENAC-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

7
7

1. DÉFINITIONS

1.1 Echantillons?

Soit X, une variable aléatoire définie dans une1. D ÉFINITIONS 1.1 Echantillons? population : Caractérisée par sa densité de probabilité f(x), dans le

population :

X, une variable aléatoire définie dans une population : Caractérisée par sa densité de probabilité f(x),

Caractérisée par sa densité de probabilité f(x), dansX, une variable aléatoire définie dans une population : le cas d’une variable aléatoire continue, ou

le cas d’une variable aléatoire continue,

f(x), dans le cas d’une variable aléatoire continue, ou par sa probabilité élémentaire p(x), dans le

ou par sa probabilité élémentaire p(x), dans le cas d’une variable aléatoire discrète. d’une variable aléatoire discrète.

p(x), dans le cas d’une variable aléatoire discrète. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

8
8
échantillon théorique aléatoire probabilisé échantillon empirique ou observé MCU F. Seyte, Université Montpellier
échantillon théorique aléatoire probabilisé échantillon empirique ou observé MCU F. Seyte, Université Montpellier
échantillon théorique aléatoire probabilisé échantillon empirique ou observé MCU F. Seyte, Université Montpellier

échantillon théorique aléatoire probabilisé

échantillon empirique ou observé

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

9
9
Echantillon théorique aléatoire probabilisé : Echantillon de taille n issu de X, ou n-échantillon de

Echantillon théorique aléatoire probabilisé :

Echantillon de taille n issu de X, ou n-échantillon de X, le

vecteur aléatoire

X

1

, X ,

2

indépendants

i j

.

X , X

i

n

X

i

X

i

et

X

i

, X

j

L’échantillon est dit IID c'est-à-dire identiquement indépendamment distribué.

c'est-à-dire identiquement indépendamment distribué. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 10

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

10
10
Echantillon empirique ou observé : L’ ensemble des n valeurs images indépendantes de X est

Echantillon empirique ou observé :

L’ ensemble des n valeurs images indépendantes de X est constitué des n images de l’épreuve associée à X indépendantes

n images de l’épreuve associée à X indépendantes  x 1 ,x ,  ,x 2

x

1

,x ,,x

2

n

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

11
11

La dernière précision que nous devons apporter avant d’aborder les variables d’échantillonnage est de bien comprendre que les échantillons ne sont pas uniques d’aborder les variables d’échantillonnage est de bien comprendre que les échantillons ne sont pas uniques :

il est en effet possible de prendre plusieurs échantillons de la population mère.bien comprendre que les échantillons ne sont pas uniques : Par conséquent, il est toujours possible

Par conséquent, il est toujours possible de considérer que les échantillons sont choisis de manière aléatoire.de prendre plusieurs échantillons de la population mère. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

que les échantillons sont choisis de manière aléatoire. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

12
12

1. 2. Vraisemblance d’un échantillon

L x ,,x

1

n

X: variable aléatoire discrète caractérisée par :

son ensemble de définition

p(x) probabilités élémentaires

Lx ,

,x

1 n

p(x

1

)

p(x

n

)

X : variable aléatoire continue caractérisée par

;

;

p

f ( x )

( x )

son ensemble de définition f(x) densité de probabilité

son ensemble de définition f(x) densité de probabilité L  x ,  ,x 1 n

Lx , ,x

1

n

f(x

1

)

f(x

n

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

)

13
13

SYNTHESE

Caractéristiques de la population Caractéristiques Caractéristiques correspondantes correspondantes dans
Caractéristiques
de la population
Caractéristiques
Caractéristiques
correspondantes
correspondantes
dans l’échantillon
dans l’échantillon
théorique
empirique
La moyenne :
m
X
x
La variance :
2
 V[X]
S
2
S
ˆ
2
^
ou
s² ou
La proportion
p
F
f
1
1
2
X 
X
S 
(
X X
)
2
X
F 
n
i
n
i
n
m  E
X
xf x dx
m
E X
xpx
x
 
cas continu
cas discret
2
2
2
 V[X]  E X  E(X)
x  m
f(x)dx
 
2
V[X]
E X
E(X)
2
x
m
2
px
x

14
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

les échantillons ne sont pas uniques : il est en effet possible de prendre plusieurs échantillons de la population mère. de prendre plusieurs échantillons de la population mère.

Par conséquent, il est toujours possible de considérer que les échantillons sont choisis de manière aléatoire. de considérer que les échantillons sont choisis de manière aléatoire.

Ainsi, théoriquement on peut associer à chaque échantillon une statistique comme la moyenne et une probabilité d’occurrence associée à . une statistique comme la moyenne et une probabilité d’occurrence associée à .

x

x

La moyenne de l’échantillon est donc une variable aléatoire de l’échantillon est donc une variable aléatoire

que l’on notera

par l’ensemble des

X , celle-ci rassemble toutes les valeurs prises

x

mesurées sur chaque échantillon.

Il en va de même pour l’écart -type S , la variance S ², la proportion F , de même pour l’écart-type S, la variance S², la proportion F, la caractéristique de l’individu i,

F , la caractéristique de l’individu i , … MCU F. Seyte, Université Montpellier 1- ENAC-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

15
15

2 . VARIABLES DÉCHANTILLONNAGE

Objectifs : calculer pour chacune des variables d’échantillonnage précédentes leurs espérance et variance qui serviront dans la détermination de leurs lois de probabilités.

2.1. Etude de

Ex : un chef d’entreprise s’intéresse au diamètre moyen des pièces métalliques qu’il fabrique un chef d’entreprise s’intéresse au diamètre moyen des pièces métalliques qu’il fabrique

La population : ici : les pièces métalliquesdiamètre moyen des pièces métalliques qu’il fabrique La variable aléatoire X : « diamètre des pièces

La variable aléatoire X : « diamètre des pièces »fabrique La population : ici : les pièces métalliques Il prélève un échantillon de n pièces.

Il prélève un échantillon de n pièces. Il mesure le diamètre de ces pièces. Il peut calculer un échantillon de n pièces. Il mesure le diamètre de ces pièces. Il peut calculer le diamètre moyen de ces pièces.

C’est une statistique

x

Par contre la variable aléatoire X : « diamètre moyen des X : « diamètre moyen des

pièces ». celle-ci rassemble toutes les valeurs prises par

l’ensemble des

x mesurées sur chaque échantillon.

par l’ensemble des x mesurées sur chaque échantillon. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique
par l’ensemble des x mesurées sur chaque échantillon. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

16
16

X

1

n

n

i 1

X

i moyenne de l’échantillon théorique

n  i  1 X i moyenne de l’échantillon théorique Les aléatoire. X i sont

Les

aléatoire.

X

i sont des variables aléatoires

X est une variable

Calcul de l’espérance de la moyenne de l’échantillon théoriqueX i sont des variables aléatoires  X est une variable E  X  

E



X

E

1

n

n

i 1

X  

i

1

n

n

i

1

E X

i

EXiEXm

( X

i

X )

E X   m Xm

E X

1

n

n

i 1

m

Calcul de sa variance) E  X   m   E X  1 n n 

V

X

ind

1

n

²

 1 m Calcul de sa variance V  X  ind  1 n ²

n

i 1

V

X

i

1

n

²

n 1  ²  V X    n   ² n
n
1
²
V X
n
 
²
n ²
n
i  1
V X 

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

.

2

n

17
17

s

2.2. ETUDE DE

s 2.2. E TUDE DE S² Les variable aléatoire. X i sont des variables aléatoires, donc

Les

variable aléatoire.

X

i sont des variables aléatoires, donc S² est une

S

2

1

n

n

X

i 1

i

X

2

  2  E S    S ˆ On recherche 2 tel
2
E S
 
S
ˆ
On recherche
2 tel que

estimateur sans biais de

n 1

n

2

2

ˆ

2

E[ S

]

(Cf. chapitre 2).

2

ˆ

2

S

n

n

1

2

S

n

1

n

1

n

X

i

X

2

 1 2 S  n 1 n  1 n   X  i

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

2

X

i

X

n

1

18
18

2.3 ETUDE DE LA PROPORTION DÉCHANTILLON F

Soit Y une variable aléatoire définie dans une population.2.3 E TUDE DE LA PROPORTION D ’ ÉCHANTILLON F Y présente deux modalités : évènement

Y présente deux modalités : évènement A évènementSoit Y une variable aléatoire définie dans une population. La variable aléatoire Y est donc associée

La variable aléatoire Y est donc associée au tirage d’un individu. Y est une variable de variable aléatoire Y est donc associée au tirage d’un individu. Y est une variable de Bernoulli.

Maintenant, soit la variable X associée au tirage de n individus de manière indépendante (c’est -à-dire au nombre de fois où A (c’est-à-dire au nombre de fois où A

A

se produit).

X

n

Y

i 1

i X B(n,p)

Considérons F la proportion dans l’échantillon théorique issu l’échantillon théorique issu

X

de la population. obéit elle aussi à une loi binomiale :

F

n



E F

E

X

n

1

n

E X

np

n

p



V F

V

X

n

1

n

2

V X

npq

n

2

pq

n

 n    1 n 2  V X   npq n 2

EFp



V F

pq

n

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

19
19

POPULATION :

Moyenne : m= E[X] Ecart-type : σ Variance : σ ² =V[X] Proportion : p

Ecart-type : σ Variance : σ ² = V[X] Proportion : p ECHANTILLON : Ecart-type (empirique)

ECHANTILLON :

Ecart-type (empirique) : s [ S ] Variance (empirique) : s² [ S² ] Proportion : f [ F ] Taille : n Caractéristique de l’individu i : x i [X i ]

Moyenne :

x [

X ]

i : x i [ X i ] Moyenne : x [ X ] MCU F.
i : x i [ X i ] Moyenne : x [ X ] MCU F.

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

20
20

3 . LOIS DE PROBABILITÉS DES VARIABLES DÉCHANTILLONNAGE FONDÉES SUR LHYPOTHÈSE DE NORMALITÉ : CAS DUN ÉCHANTILLON TIRÉ DUNE POPULATION NORMALE.

3.1 Loi de

X

Quelle est l’utilité de cette loi?

Prenons un ex

Une étude statistique effectuée à l’Arena de Montpellier montre que l’affluence des spectateurs est une variable aléatoire X qui suit une loi normale de moyenne

13500.

Si on choisit aléatoirement un échantillon de 50 spectacles sur ces vingt dernières

années, quelle est la probabilité pour que l’affluence moyenne soit strictement supérieure à 13500 spectateurs sachant que l’écart-type de la population s’élève à 1000 ?

l’écart - type de la population s’élève à 1000 ? MCU F. Seyte, Université Montpellier 1-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

l’écart - type de la population s’élève à 1000 ? MCU F. Seyte, Université Montpellier 1-
21
21

La variable aléatoire X : « Affluence hebdomadaire des spectateurs ». Il est indiqué dans l’énoncé que X suit : « Affluence hebdomadaire des spectateurs ». Il est indiqué dans l’énoncé que X suit une loi normale de moyenne m = 13500 et d’écart-type σ = 1000 :

Epreuve aléatoire : « Choisir un échantillon au hasard de 50 : « Choisir un échantillon au hasard de 50

spectacles ».

Ensuite, essayons de bien distinguer les informations relatives: « Choisir un échantillon au hasard de 50 spectacles ». à l’échantillon de celles issues

à l’échantillon de celles issues de la population :

Taille de l’échantillon : n = 50 : n = 50

de la population : Taille de l’échantillon : n = 50 MCU F. Seyte, Université Montpellier

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

22
22

La question posée dans l’énoncé est relative à « l’affluence moyenne dans l’échantillon ». Il faut question posée dans l’énoncé est relative à « l’affluence moyenne dans l’échantillon ». Il faut donc définir une nouvelle variable aléatoire :

La variable aléatoire». Il faut donc définir une nouvelle variable aléatoire : : « Affluence moyenne des spectateurs

: « Affluence moyenne des

spectateurs dans l’échantillon ».

La question est précisément « quelle est la probabilité …

». Pour mesurer une probabilité, il nous faut connaître la

loi suivie par la variable aléatoire qui nous intéresse. Nous

devons donc déterminer X la loi suivie par

.

Nous devons donc déterminer X la loi suivie par . MCU F. Seyte, Université Montpellier 1-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

X

Nous devons donc déterminer X la loi suivie par . MCU F. Seyte, Université Montpellier 1-
23
23

3 . LOIS DE PROBABILITÉS DES VARIABLES DÉCHANTILLONNAGE FONDÉES SUR LHYPOTHÈSE DE NORMALITÉ : CAS DUN ÉCHANTILLON TIRÉ DUNE POPULATION NORMALE.

D ’ UN ÉCHANTILLON TIRÉ D ’ UNE POPULATION NORMALE . 3.1 Loi de X Hyp

3.1 Loi de

X

Hyp :

TIRÉ D ’ UNE POPULATION NORMALE . 3.1 Loi de X Hyp : X  N

X Nm,

NORMALE . 3.1 Loi de X Hyp : X  N  m,   Rappels

Rappels sur la loi normale

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

24
24

RAPPEL LOI NORMALE

La variable aléatoire normale X est une variable continue

pouvant prendre n’importe quelle valeur entre

densité de probabilité :

 1  x   m   1  2   
1  x
m 
1
2
f x
e
2

2



et



avec la

avec : m

l’espérance mathématique

l’écart-type de la distribution.

X Nm,

La variable normale centrée réduite :

u

2

1 f u    2  les tables
1
f u
2
les
tables

2 avec

X m

la

  2  les tables  2 avec X  m  la U 

U

e

2  les tables  2 avec X  m  la U  e Toutes

Toutes

centrée réduite

statistiques

utilisent

variable

normale

25
25
centrée réduite statistiques utilisent variable normale 25 MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Table de la densité de probabilité Cette table donne la densité de probabilité f(u) correspondant aux valeurs de la variable normale centrée réduite.

En raison de la symétrie de la courbe de densité, la table permet de déterminer les densités correspondantes à des valeurs négatives de u : f(-u)=f(u)

Ex

pour f(-2,8)=0,0079=f(2,8)

négatives de u : f(-u)=f(u) Ex pour f(-2,8)=0,0079=f(2,8) 26 MCU F. Seyte, Université Montpellier 1- ENAC-
26
26

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

négatives de u : f(-u)=f(u) Ex pour f(-2,8)=0,0079=f(2,8) 26 MCU F. Seyte, Université Montpellier 1- ENAC-

Le changement de variable permet de déterminer à l’aidede la table, la densité de probabilité correspondant à une valeur quelconque de la variable

de la table, la densité de probabilité correspondant à une valeur quelconque de la variable normale X de moyenne m

et d’écart type

.

Il existe donc entre les densités de probabilité de x et de u la relation :la variable normale X de moyenne m et d’écart type  . f(x)  f(u) 

f(x)

f(u)

Ex :

X N (5,2)

la densité de probabilité pour x=8 ?

U N0,1

 

x

m

8 5

u

2

15

,

La lecture de la table donne

u 15

,

f(u)

, La lecture de la table donne u  15 ,  f(u)  MCU F.

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

01295

,

2

01295 f(x)

,

0 06475

,

27
27
f(u)  MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 01295 , 2 01295  f(x)

Table de la fonction de répartition

Table de la fonction de répartition Cette table donne, pour toute valeur positive u 0 de

Cette table donne, pour toute valeur positive u 0 de la variable normale centrée réduite, la valeur correspondante de la fonction de répartition F(u 0 ) représentée par l’aire hachurée.

f(u) u 0 1 F u ( )  Pr ob u u  
f(u)
u
0
1
F u
(
)
Pr
ob u u
0
0
2

F(u 0 )
0
u 0
Pr obU
 u
  1 Pr obU 
0
u 0
  1 F(u
)
0
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

t

2

2

e dt

28
28

X Nm,

Supposons que

Déterminons la probabilité pour que X soit compris entre deux valeurs a et b :

Pr ob a

X

b

Pr ob a

X

 

a

m

X

m

Pr ob

 

a

m

b

Pr ob

b F

m

 

b

m

b

m


U

a m   F

U

X m

N (0,1)

Exemple :

Soit X une variable normale de moyenne 5 et d’écart type 2 :

Calculer la probabilité pour que X soit compris entre 1 et 7.

X N5,2

que X soit compris entre 1 et 7. X  N  5 , 2 

Pr ob

1

X

7

Pr ob

1

5

2

X 5

2

Pr

ob

2

U 1

F( )

1

F(

2 )

F( )

1

1

7

5

2

F(

2

)

0 8413

.

1

0 , 9772

0 8185

,

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

F( )

1

 

1

F(

2

)

 0 , 9772  0 8185 ,  MCU F. Seyte, Université Montpellier 1- ENAC-
29
29

Table de la loi normale centrée réduite

Cette table permet de trouver la valeur d’une variable normale

en fonction de la probabilité P de dépassement ou de la

probabilité Q complémentaire (Q=1-P). C'est-à-dire que dans ce

F u   cas, est connue et on cherche à déterminer 0 f(u) P
F u
cas, est connue et on cherche à déterminer
0
f(u)
P
Pr ob U
Q
P
Q
Pr ob U
0
u
u 0

u

0

u

u

0

0

F u

0

Si

u

Si

0 .

F u

F u

0

0

> 0,5 alors on lira directement dans la table la valeur de

< 0,5 alors on lira dans la table la valeur de -u 0 .

0,5 alors on lira dans la table la valeur de -u 0 . MCU F. Seyte,

MCU F. Seyte, Université Montpellier 1- EM Alès - Statistique 1A

30
30
Exemple : On cherche u 0 tel que Pr ob  U  u f(u)

Exemple : On cherche

u

0

tel que

Pr obU u

f(u) Q P 75% 0 u 0   1 Pr ob U  
f(u)
Q
P
75%
0
u
0
 
1
Pr ob U
u
0 
0 , 75
Pr ob U
u
0 
 0 25
,
F u
0 
0 5
,
 F u
0 
 0 25
,

u

0

0,75 P

on lira donc -u 0 La lecture de la table donne 0,6745 donc

u 0

 0 6745

,

lecture de la table donne 0,6745 donc u 0  0 6745 , MCU F. Seyte,

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

31
31
Pr obu  u   5% 0 Soit u 0 la valeur telle que
Pr obu
 u
  5%
0
Soit u 0 la valeur telle que
f(u)
P
95%
5%
0
u
u 0
Pr ob u
 u
  5 %
0
 1  Pr ob U
u
0 
 0 05
,
Pr ob U
 u
 0 95
,
0
u 0  u
F u
0 
 0 95
,
.95

u .95

remplace la valeur de la variable centrée réduite ayant

comme fonction de répartition 95% et/ou ayant comme probabilité de dépassement 5%

On lit cette valeur dans la table

P 5%

dépassement 5% On lit cette valeur dans la table P  5% MCU F. Seyte, Université

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Q 95%

1,6449

u

.95

32
32
dans la table P  5% MCU F. Seyte, Université Montpellier 1- ENAC- Statistique Q 

CONDITIONS DAPPLICATION

C ONDITIONS D ’ APPLICATION 1) Somme de variables normales indépendantes X X 1 2 

1) Somme de variables normales indépendantes

X

X

1

2

N m ,

1

N m

2

,

1

2

X

1

X

2

N

 2 2   m  m ,   1 2 1 2
2
2
m
m
,
 
1
2
1
2

Ce résultat s’étend à un nombre quelconque de variables normales indépendantes.

2) Le théorème central limitenombre quelconque de variables normales indépendantes. si les variables suivent des lois de même nature de

si les variables suivent des lois de même nature de moyenne m et

d’écart type

, si les

X

i sont indépendants

*

X i est asymptotiquement normale de moyenne mn et d’écart

type

*

n
n

X

i



n 

X

X i Nm,

n

n  X   X i  N  m,  n n  

n

  Nnm,  n
Nnm,  n

E X

V

X

1

n

E

1

n

2

X

i

V X

i

1

n

nm

n

2

n

2

m

2

n

 i  1 n  nm n   2 n 2 m  

3) Approximation de la loi binomiale par la loi normale

2 n 3) Approximation de la loi binomiale par la loi normale X   L

X

L

B n,p  N np,

 npq
npq

  n 50

np 18

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

33
33
Loi de X D’après le théorème central limite: X  N E  X 

Loi de

X

D’après le théorème central limite:

X N

de X D’après le théorème central limite: X  N E  X   m

EXm

  V X 
V X 

2

n

X  N E  X   m   V X   2
   N m ;   n   34
N m ;
n
 
34
X   2 n    N m ;   n  
X   2 n    N m ;   n  

X

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

SUITE EX DIAPO 22

X ~ N ( m,) N (13500;1000)

X ~

   N  m ;     n  X 
N  m
;
n 
X  m
U 
n

X

~ N (0;1)

P(

X

13500)

P

 X m      n
 X m
n
~ N 13500;1000/ X  13500 U  1000 50 13500  13500  
~ N 13500;1000/
X  13500
U 
1000 50
13500
13500 
P(U
1000
50
 13500     P(U   1000 50  0) 50  

0)

50

 

1

F

U

(0)

0,5.

  1000 50  0) 50    1 F U (0)  0,5.

Il y a donc une probabilité de 50% que l’affluence moyenne dans

l’échantillon soit supérieure à 13500 personnes.

dans l’échantillon soit supérieure à 13500 personnes. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 35

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

35
35

3.2 LOI DE LA VARIANCE

Quelle est l’utilité de cette loi? Prenons un ex Prenons un ex

La politique de cohésion sociale d’un pays a, selon le gouvernement en place, besoin de tenir compte de cohésion sociale d’un pays a, selon le gouvernement en place, besoin de tenir compte des inégalités de revenu entre les salariés du secteur privé. Afin d’y parvenir, le gouvernement prélève un échantillon de 30 salariés du secteur privé, la moyenne étant de 1700et la variance empirique de 1000(la variance de la population étant de 1517.47). Le gouvernement décidera de rehausser les bas salaires de 5% si la probabilité que la variance empirique dépassant 1000est au moins de 20%. Le

gouvernement interviendra-t-il en faveur des bas salaires ?

Afin de résoudre le problème, traduisons la question posée de résoudre le problème, traduisons la question posée

de résoudre le problème, traduisons la question posée en langage statistique : P  S² 

en langage statistique :

P1000 ?

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

statistique : P  S²  1 0 0 0   ? MCU F. Seyte,
36
36
Loi de la variance S² Théorème de Fisher Soit un échantillon IID issu de la
Loi de la variance S² Théorème de Fisher Soit un échantillon IID issu de la

Loi de la variance S²

Théorème de FisherLoi de la variance S² Soit un échantillon IID issu de la loi Normale de moyenne

Soit un échantillon IID issu de la loi Normale de moyenne m et

d’écart type

(notée : N(m,)), alors :

ˆ 2 S X  m  n  1  et 2  
ˆ
2
S
X
m
n
1
et
2
n
2
nS

2 (n
 1)
2

les grandeurs aléatoires et 2   n 2 nS  2 (n  1) 2  ˆ

ˆ

S

2

2 (n  1) 2  les grandeurs aléatoires ˆ S 2  n 1 

n

1

 2 (n 

2 (n

1)

ou

2

nS

2

2

(

n 1)

2

2 (n  1) ou   2 nS 2  2 ( n  1)

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

sont indépendantes.

car

ˆ

S

2

n

n 1

S

2

37
37
 2 L OI DU KHI DEUX 1) Définition Loi du à un degré de

2

LOI DU KHI DEUX

 2 L OI DU KHI DEUX 1) Définition Loi du à un degré de liberté

1) Définition

Loi du 2 L OI DU KHI DEUX 1) Définition à un degré de liberté X 

à un degré de liberté X  U 2 X  x  1 1
à un degré de liberté
X
U
2 X

x
1
1
f(x) 
e 2
2 
x

2

 U 2 X  x  1 1 f(x)  e 2 2  x

0

,



( )

1

X

U N0,1

2

2

1

( ) 1 X U  N  0 , 1     2

Loi du

2

à n degrés de liberté :

 2 2  1  Loi du  2 à n degrés de liberté :

2

n

Soient

U i N0,1

avec i=1, …n les U i sont indépendantes

a



e

0

sont indépendantes   a      e 0  t U 2

t

U

2

i

U

2

1

U

2

2

2

U

3

U

2

n



2

(n)

1  e n  2 n  2  2    1
1 
e
n
2
n
2
2
  1 
 2 
 

x

2

x

n

2

1

2

X ( n

)

X0,

f(x)

t

a

1

pour a >0

X   0 ,   f(x)  t a  1 pour a >0

dt

n 1n!

38
38

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

  f  2 n=2 E(X)  n V(x)  2 n n=4 n=15
f 
2
n=2
E(X)  n
V(x)  2 n
n=4
n=15
2

La distribution du

2

est dissymétrique avec étalement vers la droite

Elle se rapproche de la distribution normale à laquelle elle peut être assimilée lorsque n>30

à laquelle elle peut être assimilée lorsque n>30 MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

39
39

2 )TABLE STATISTIQUE

2 ne dépendant que d’un seul paramètre

La distribution du

n, le nombre de degrés de liberté, la table est à double entrée.

n  30  Elle donne pour  2  , la valeur de 2
n  30
Elle donne pour
2 
, la valeur de
2 ayant la probabilité P
f 
d’être dépassée.
P
1-P
2 n
 0
2
2
0
est tel que P  Pr ob 
2 
2 
n  
2
2
 
n
0
0
1  p
40
2  n   2 2   n 0 0 1  p 40

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

2  n   2 2   n 0 0 1  p 40

f

2  3) LECTURES DANS LA TABLE 5% 95%  2 n
2 
3) LECTURES DANS LA TABLE
5%
95%
2 n

2

.95

20

31.41

20 2   2   .95 f 2.5% 97.5%  2 n 15
20
2
 
2 
 .95
f
2.5%
97.5%
2 n
15
2
 .025
2  
2
2
n 
1
 N
lorsque n>30 on admet que :

2

.025

0 1

,

15

6.26

 2  50   (u .95  2*DDL-1)²/2  (1.6449 .95 MCU F.
2
50
 (u
.95
2*DDL-1)²/2
(1.6449
.95
MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

2*DDL-1)²/2  (1.6449 .95 MCU F. Seyte, Université Montpellier 1- ENAC- Statistique  2*50-1)² / 2

2*50-1)² / 2

2*DDL-1)²/2  (1.6449 .95 MCU F. Seyte, Université Montpellier 1- ENAC- Statistique  2*50-1)² / 2

67.22

41
41

4) SOMME DE VARIABLES DE

4) S OMME DE VARIABLES DE Théorème d’additivité de X 1 X 2   

Théorème d’additivité de

X 1 X 2
X
1
X
2

2

2

n

n

1

2

2

2

INDÉPENDANTES

indépendants

X

1 et

X

2 indépendantes

2

X X n n

1

2

1

2

2   X  X   n  n 1 2 1 2 

n

i 1

X

i

 X   n  n 1 2 1 2  n  i 

X

i





2

n

1

2

(n )

i



2

n

2

X

i indépendantes



2

n

i

2

n

n

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

 n  2     n i    i 
n
2

n
i
i  1
42

P S²

1000

Dans la table du

SUITE EX DIAPO 36

P   n

²

30

1000    PK 19.77.

1517.45

2 à la ligne v = 29, on constate que le

fractile 19.77 correspond à une probabilité de 0,9. D’où :

P10000,9.

Le gouvernement interviendra en faveur des bas salaires si

cette probabilité dépasse 20%, ce qui est le cas.

si cette probabilité dépasse 20%, ce qui est le cas. MCU F. Seyte, Université Montpellier 1-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

43
43

3.3 LOI DE

X INDÉPENDANTE DE

DE LA POPULATION)

2 (DE LA VARIANCE

Quelle est l’utilité de cette loi? Prenons un ex l’utilité de cette loi? Prenons un ex

A la suite d’une étude statistique effectuée par le CROUS sur ces 15 dernières années, on estime que d’une étude statistique effectuée par le CROUS sur ces 15 dernières années, on estime que l’affluence

hebdomadaire des étudiants au restaurant universitaire est

une variable aléatoire que nous noterons X qui suit une loi normale de moyenne 2000. On choisit aléatoirement un échantillon de 52 semaines sur ces 15 dernières années.

L’écart-type de l’affluence hebdomadaire mesurée sur

l’échantillon est de 500. Quelle est la probabilité pour que l’affluence moyenne hebdomadaire soit strictement supérieure à 2050 étudiants ?

soit strictement supérieure à 2050 étudiants ? MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 44

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

44
44
La variable aléatoire X : « Affluence hebdomadaire des

La variable aléatoire X : « Affluence hebdomadaire des

étudiants au restaurant universitaire »

 
 

X

~ N ( m,) N (2000;)

 
X « Affluence hebdomadaire moyenne des étudiants au

X

«

Affluence

hebdomadaire

moyenne

des

étudiants

au

restaurant universitaire issus de l’échantillon »

 
 

X

~ N ( m;/

n )

n )

L’épreuve aléatoire : « Choisir un échantillon au hasard de 52 semaines »

L’épreuve aléatoire : « Choisir un échantillon au hasard de 52 semaines »

: « Choisir un échantillon au hasard de 52 semaines » MCU F. Seyte, Université Montpellier

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

45
45

Distinguons les informations relatives à l’échantillon de celles issues l’échantillon de celles issues

de la population :

Taille de l’échantillon : n = 52 l’échantillon : n = 52

Ecart- type de l’échantillon : s = 500. Notons qu’il s’agit bien de s et -type de l’échantillon : s = 500. Notons qu’il s’agit bien de s et

non de S puisque nous prenons la mesure de l’écart-type sur un échantillon particulier.

L’écart-type de la population σ : inconnu -type de la population σ : inconnu

P(

X

2050)

P   X m  n  2050  2000    
P   X m
 n
2050
2000 
52

2050  2000        52  La technique consiste à

La

technique

consiste

à

faire

«

disparaître

technique de « Studentisation ».

à faire « disparaître technique de « Studentisation ». MCU F. Seyte, Université Montpellier 1- ENAC-
à faire « disparaître technique de « Studentisation ». MCU F. Seyte, Université Montpellier 1- ENAC-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

?

»

σ,

on

l’appellera

46
46
 X X X  1 i n un échantillon IID X i  N(m;
X X
X
1
i
n
un échantillon IID
X i 
N(m;
)
X
N  m;
n  
Ici  INCONNU
studentisation
La loi de Student est le rapport entre une variable

aléatoire obéissant à une loi normale centrée réduite et la racine carrée d’une variable aléatoire suivant une loi de rapporté à son degré

2

suivant une loi de rapporté à son degré  2 MCU F. Seyte, Université Montpellier 1-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

47
47
LOI DE STUDENT 1) DÉFINITION 2 variables aléatoires X et Y indépendantes X  N

LOI DE STUDENT

1)DÉFINITION

2 variables aléatoires X et Y indépendantes

DÉFINITION 2 variables aléatoires X et Y indépendantes X  N  0 , 1 

X N0,1

aléatoires X et Y indépendantes X  N  0 , 1  Y  2
aléatoires X et Y indépendantes X  N  0 , 1  Y  2
Y  2 n X Y n
Y 
2 n
X
Y
n
N  0 1 ,  2   n  n
N
0 1
,
2
n
n

T n

T n

si n   alors Tn N0,1

 alors T  n   N  0 , 1  En pratique, lorsque

En pratique, lorsque n

> à 30

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

48
48
2 )T ABLE STATISTIQUE donne la probabilité P d’être dépassée en valeur absolue f(t) P/2

2 )TABLE STATISTIQUE

donne la probabilité P d’être dépassée en valeur absolue

f(t) P/2 P/2 1-P -t 0 t t 0 0    P 
f(t)
P/2
P/2
1-P
-t
0
t
t 0
0
 
P
 Pr ob
T
Pr ob T
t 0
t
et Pr ob T

t
0
0

Notation : t 0 =t 1-p/2

-t 0 = t p/2 = - t 1-p/2

1 - p / 2 -t 0 = t p / 2 = - t 1

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

49
49

3 )LECTURES DANS LA TABLE

f(t) 5% 5% 1-P=90% -t t. t(20) 0= 05 0 t 0= t. 95 n
f(t)
5%
5%
1-P=90%
-t
t.
t(20)
0=
05 0
t 0= t. 95
n  20
p  10%
 t
0  1.725
T.90(20)   1.725
IBS

2 ème exemple

T.80(10)   1.372 IBS

IBS 2 è m e exemple T .80 (10)   1.372 IBS MCU F. Seyte,

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

50
50
P OUR TROUVER LA LOI DE X INDÉPENDANTE DE      n

POUR TROUVER LA LOI DE

X

INDÉPENDANTE DE

  n  
n  

N (0,1)

T n

(

)

DE      n   N (0,1) T n  ( )

X N m ;

 2 ( n )
2 (
n )
n
n

nS

2

   2 X  m  S n  1
 
2
X
 m
S n  1

2

( n 1)

2    2 X  m  S n  1 2 ( n
X  m  n 2 nS  2 (n  1)
X
 m
 n
2
nS
2
(n
1)

T(n

1)

 m  n 2 nS  2 (n  1) T(n 1)   

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

51
51

SUITE EX DIAPO 44

SUITE EX DIAPO 44 P( X  2050)  P  Convergence :  X 

P(

X

2050)

P

Convergence :

 X  m   S n  1 
X  m
S
n
 1

2050  2000     P    500 51  
2050
2000
P
500
51

P(T

0,71)

1

  F

T

(0,71)

T

2050  2000    500 51 
2050
2000
500
51

C

T N (0;1)

d’où F T = F U . On obtient :

P(T(51)

0,71)

1

  F

T

(0.71)

1

  F

U

(0,71)

 

1

0,7611

0,2389.

Il y a donc une probabilité de 23.89% que l’affluence moyenne dans l’échantillon soit supérieure à 2050 personnes.

dans l’échantillon soit supérieure à 2050 personnes. MCU F. Seyte, Université Montpellier 1- ENAC- Statistique 52

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

52
52

3.4 LOI DE F

Quelle est l’utilité de cette loi? Prenons un ex Prenons un ex

Deux usines A et B fabriquent des avions de même marque. de même marque.

L’usine A produit 4% d’avions ayant des problèmes la première

année. Une compagnie reçoit 600 avions en provenance de A.

Quelle est la probabilité pour que la compagnie trouve moins de 1% d’avions défectueux ? que la compagnie trouve moins de 1% d’avions défectueux ?

la compagnie trouve moins de 1% d’avions défectueux ? MCU F. Seyte, Université Montpellier 1- ENAC-

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

53
53

Soit X la variable aléatoire : « Nombre d’avions défectueux en X la variable aléatoire : « Nombre d’avions défectueux en

provenance de l’usine A »

Epreuves aléatoires : « Choisir un avion au hasard dans l’échantillon n A », : « Choisir un avion au hasard dans l’échantillon n A »,

F : « l’avion provenant de A est défectueux » avec p A = 4%. l’avion provenant de A est défectueux » avec p A = 4%.

F « l’avion provenant de A n’est pas défectueux » avec q A =

96%.

X A (  ) = {0,1,2, … , 600} et n A = 600 A () = {0,1,2,, 600} et n A = 600

Convergence : La loi binomiale converge vers la loi normale (les deux conditions n A p A La loi binomiale converge vers la loi normale (les deux conditions n A p A > 18 et n A > 50 D’où :

XA ~

B n p

A

,

(

A )

18 et n A > 50 D’où : X A ~ B n p A ,
C  X  N n p ; n p q A A A A
C
X  N n p ; n p q
A
A
A
A
A A
P(F
 0,01)  ?
A

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

X

A C N 24; 4,8

54
54

SupposonsL OI DE F X  B(n,p) n  ( en pratique n > 50)

LOI DE F

X B(n,p)

n 

( en pratique n > 50) et np > 18.

X

B(n,p)

L

Nnp,

n > 50) et np > 18. X  B(n,p) L  N  np, npq

npq

50) et np > 18. X  B(n,p) L  N  np, npq  Soit

Soit

F

X

n

F converge alors vers une loi normale. On a montré dans le18. X  B(n,p) L  N  np, npq  Soit F  X n

paragraphe 2.3

E F  (diapo 19) que p et L  pq  F  N
E F 
(diapo 19) que
p et
L
pq
F  N p ,
n
 pq  F  N p ,     n   MCU

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique



V F

pq

n

.

55
55

P(

F

A

F

A

P( F A F A   SUITE EX DIAPO 54  p q  X

SUITE EX DIAPO 54

 p q  X A  A A N p ;  F 
p q
X
A
A
A
N p