Vous êtes sur la page 1sur 160

Probabilits et Statistiques

S1-PRST

Jean-Marc Bourinet
E-mail : bourinet@sigma-clermont.fr
http://www.ifma.fr/FERUM/

Campus des Czeaux


63178 Aubire Cedex

Probabilits et statistiques J.-M. Bourinet 2007

Plan du cours (1)


Introduction
9 Objectifs pdagogiques
9 Organisation pratique ( CM, TD, TP, examens )
Cours 1 Premiers lments sur les probabilits
9 Exprience alatoire
9 vnements et oprations sur les vnements
9 Probabilit, probabilit conditionnelle
9 Notions dindpendance
9 Principaux thormes de probabilit
Cours 2 Variable alatoire et fonction dune variable alatoire
9 Variable alatoire discrte / continue
9 Loi de probabilit et fonction de rpartition
9 Fonction dune variable alatoire
Cours 3a Caractristiques dune variable alatoire
9 Moment dune v.a. : esprance et variance
Probabilits et statistiques J.-M. Bourinet 2016

Plan du cours (2)


Cours 3b Exemples de lois discrtes
9 Loi de Bernoulli, loi binomiale et lois associes
9 Loi de Poisson
Cours 4 Exemples de lois continues
9 Loi uniforme
9 Loi normale et lois associes ( loi lognormale )
9 Lois exponentielle et gamma ( issues de la loi de Poisson )
9 Dure de vie dun matriel et loi de Weibull
Cours 5 Vecteur alatoire
9 Loi conjointe, fonction de rpartition conjointe, lois marginales
9 Vecteurs alatoires conditionns, indpendance entre v.a.
9 Fonction et transformation dun vecteur de v.a.
9 Moments dun vecteur alatoire
9 Moment mixte, covariance, corrlation entre v.a.
9 Exemples

Probabilits et statistiques J.-M. Bourinet 2016

Plan du cours (3)


Cours 6 Introduction aux statistiques
9 Problmatique, objectifs des statistiques, vocabulaire
9 lments de statistique descriptive ( principales statistiques dun
chantillon )
9 Bases de la statistique infrentielle, dfinition dune statistique
Cours 7 Statistique infrentielle : Estimation
9 Suites de variables alatoire et convergence de ces suites
9 Principaux thormes ( TCL essentiellement )
9 tude des principales statistiques ( moyenne, variance )
9 Objet de lestimation, estimateur et qualits dun estimateur
9 Estimation ponctuelle
9 Estimation par le maximum de vraisemblance
9 Estimation par intervalles de confiance
Cours 8 Statistique infrentielle : Tests statistiques
9 Introduction et principes des tests dhypothses
9 Tests paramtriques
9 Tests dadquation ( test du F2 )
Probabilits et statistiques J.-M. Bourinet 2016

Liste de rfrences parmi de nombreuses !


Ouvrages
Probabilits, analyse des donnes & statistiques, Saporta G., Technip, 1990
Probability concepts in engineering planning and design Vol. I: Basic
Principles, Ang A. H-S. and Tang W. H., Wiley, 1975
Supports de cours
Probabilits et statistiques (MI2), Mazel C., IFMA, Clermont-Ferrand, 2004
X http://ifmanet.ifma.fr/cours/mohamed/MI2ProbaStat.pdf

Engineering risk analysis (CE193), Der Kiureghian A., UCB, Berkeley, 2000
Mthodes statistiques (SY02), UTC, Compigne
X http://www4.utc.fr/~sy02/doku.php

Cours internet
St@tNet ( CNAM, CRA Languedoc-Roussillon, AGRO Montpellier et
Universit Montpellier II)
X http://www.agro-montpellier.fr/cnam-lr/statnet/
Probabilits et statistiques J.-M. Bourinet 2016

Liste de logiciels
Logiciels spcifiques de calcul statistique
Lien vers logiciels gratuits de calcul statistique
X http://freestatistics.altervista.org/stat.php

Voir en particulier logiciel R 3.3 ( TRES rpandu LA rfrence )


X http://www.r-project.org/

Outils numriques, autorisant le calcul probabiliste et statistique


EXCEL
Matlab R2016a X http://www.mathworks.com/
+ Statistical Toolbox
Clones Matlab gratuits
9 SciLab 5.5 X http://www.scilab.org/
9 Octave 4.0 X http://www.gnu.org/software/octave/

Probabilits et statistiques J.-M. Bourinet 2016

Introduction aux probabilits

Probabilits et statistiques J.-M. Bourinet 2007

Exprience alatoire
Une exprience alatoire est une exprience dont on ne peut prvoir le
rsultat a priori. Rpte dans des conditions identiques, elle peut donner
lieu des rsultats diffrents
Exemples :
Si on lance un d, on ne peut prvoir quel numro apparatra sur la face
suprieure. Le lancer de d est une exprience alatoire
Si on fabrique une pice dans un atelier, on ne peut connatre lavance
les ctes exactes de cette pice. Cest une exprience alatoire
On appelle issue dune exprience alatoire lun des rsultats possibles de
cette exprience
Exemple :
Si on lance un pice de monnaie, cette exprience a 2 issues possibles :
9 la pice tombe sur face
9 la pice tombe sur pile
Probabilits et statistiques J.-M. Bourinet 2016

Univers des possibles


On appelle univers des possibles ( ou ensemble fondamental ou espace
fondamental ) dune exprience alatoire lensemble not : des issues de
cette exprience
Exemples :
Si on lance une pice de monnaie, lunivers des possibles a 2 lments :
P et F. Do : ^ P , F `
Remarques : Lensemble nest pas dduit de manire unique de lexprience
mais dpend de lusage qui en est fait
Exemples :

Pour le lancer conscutif de 2 ds, qui est une exprience


alatoire, on peut sintresser :
9 aux couples ( face du 1er d , face du 2nd )
: ^ 1,1 , 1,2 ,!, 1,6 , 2,1 , 2,2 ,!`
9 la somme des faces des 2 ds
: ^ 2,3,4,!,12 `
9

Probabilits et statistiques J.-M. Bourinet 2016

vnement
tant donn une exprience alatoire, on appelle vnement alatoire ( ou
gnralement simplement vnement ) toute assertion qui peut tre vraie
ou fausse suivant lissue de lexprience
Un vnement est un sous-ensemble de :
Exemples :
Lancer de d et on sintresse au numro sur la face suprieure
:
1

vnement : Le numro est pair

vnement : Le numro est d 3

Probabilits et statistiques J.-M. Bourinet 2016

10

Exemples dvnements (1)


Phnomne : les communications gres par un central tlphonique
Rsultat considr : le nombre dappels durant une priode donne
Univers des possibles : :

Un exemple dvnement : le nombre dappels nexcde pas 5


E ^ 0,1,2,3,4,5`
Rsultat considr : la dure dun appel
Univers des possibles : : \ 
Un exemple dvnement : la communication dure plus de 10 min
E @ 10,  f >

Probabilits et statistiques J.-M. Bourinet 2016

11

Exemples dvnements (2)


Phnomne : la fabrication de pices dans un atelier
Rsultat considr : une des ctes de la pice
Univers des possibles : : \ 
Un exemple dvnement : la cte respecte lintervalle 100.1

> 9.9,10.1 @

Phnomne : la dfaillance dun btiment dans une zone sismique


Rsultat considr : le dplacement maxi du btiment en son sommet
Univers des possibles : :

Un exemple dvnement : la valeur absolue du dplacement


excde 50 cm

@  f ,  50 > * @ 50,  f >

Probabilits et statistiques J.-M. Bourinet 2016

12

vnements particuliers
vnement certain

Cest lunivers des possibles :


Exemple pour le d : Le numro est d 7
E : ^ 1,2,3,4,5,6 `

vnement impossible Il est not


Exemple pour le d : Le numro est d 2 et t 4
E
vnement simple ( ou lmentaire )
Tout singleton de : est not vnement simple
Exemple pour le d : Le numro vaut 1
E ^1 `
vnement compos
Tout sous-ensemble de : de cardinalit strictement suprieure 1
Probabilits et statistiques J.-M. Bourinet 2016

13

Notations et opration sur les vnements

Remarque : Reprsentation ensembliste = Diagrammes de Venn


Probabilits et statistiques J.-M. Bourinet 2016

14

Union / intersection dvnements


:

A ou B peuvent tre raliss,


mais ils peuvent ltre lun et
lautre
A

Notation A * B

ou

A * B est un vnement
:

A et B doivent tre raliss


simultanment
A

Notation A  B ou AB

et

A  B est un vnement
15

Probabilits et statistiques J.-M. Bourinet 2016

Proprits de lunion et de lintersection


Commutativit
Associativit

A1 * A2

A2 * A1

A1 * A2 * A3 A1 * A2 * A3
3

A1 * A2 * A3

*A

i 1

Distributivit de
lintersection par
rapport lunion

A1  A2 * A3

A1  A2 * A1  A3
A1 A2 * A1 A3

{u

Probabilits et statistiques J.-M. Bourinet 2016

et

*{

16

vnements disjoints / partition de :


:

A et B sont dits disjoints ( point


de vue ensembliste ) ou
incompatibles ( point de vue
probabiliste ) si leur ralisation
simultane est impossible

A B

Bi  B j

*B

Les vnements Bi forment une


partition de : ( point de vue
ensembliste ) ou un systme
complet dvnements ( point
de vue probabiliste ) ssi :

i z j

B1

B2

B4

B5

B3

17

Probabilits et statistiques J.-M. Bourinet 2016

Complmentaire dun vnement


Lvnement complmentaire de A est dfini de manire ce que si A est
ralis, alors A ne lest pas, et rciproquement ( la ralisation de lun exclut
celle de lautre )
Notation A
:

Proprits :

A A
A* A :

A et A forment une partition de :


( ou systme complet dvnements )

Probabilits et statistiques J.-M. Bourinet 2016

18

Rgles de de Morgan
Rgles de de Morgan

A *A
i

*A A
i

A. de Morgan, 1806-1871

Probabilits et statistiques J.-M. Bourinet 2016

19

Objectif des probabilits


Objectif des probabilits
Donner une mesure la chance qua un vnement de se produire lors
de lexprience alatoire
On va dfinir une fonction P de lensemble des vnements vers lintervalle
> 0,1 @ , cette fonction vrifiant un certain nombre de proprits

Probabilits et statistiques J.-M. Bourinet 2016

20

Famille dvnements probabilisables ( ou tribu )


Pour quune famille dvnements T appartenant P : ( ensemble des
parties de : ) soit probabilisable, il est ncessaire que :
9 T

et

: T

9 Si Ai est une suite dans T, alors :


9 Si A T , alors A T

*A

A

{ conditions suffisantes

Remarque :

Une telle famille dvnements T est appele tribu


Si T est une tribu sur :, alors le couple ( : , T ) est un espace probabilisable

Probabilits et statistiques J.-M. Bourinet 2016

21

Choix des espaces probabilisables


Tribu engendre par une famille dvnements
La tribu T engendre par une famille dvnements Ai est lensemble des
parties de : obtenues en effectuant lunion de zro, un, deux, , n
vnement(s) Ai ( n reprsentant le cardinal de la famille dvnements )

^ 1,2,3,4,5,6 `
La tribu engendre par ^ ^1,3,5`,^2,4,6` ` est ^ ,^1,3,5`,^2,4,6`, : `
La tribu engendre par ^ ^1`,^2`,^3`,^4`,^5`,^6` ` est P :
Exemples : Cas :

Choix des espaces probabilisables


9 Pour : fini ou dnombrable ( : ` ) , on prendra P : engendre
par lensemble des singletons. P : est appele tribu discrte
9 Pour : \ , on utilisera la tribu borlienne, i.e. la tribu engendre
par les ouverts de \

Probabilits et statistiques J.-M. Bourinet 2016

22

Dfinition dune probabilit et espace probabilis


Axiomatique de Kolmogorov
A chaque vnement, on associe une probabilit qui
est une mesure associe cet vnement
Cette probabilit est un nombre positif compris entre 0 et 1
On appelle probabilit sur ( : , T ) une application P
de T dans > 0,1 @ telle que :
9  A T , 0 d P A d 1
9

A. Kolmogorov, 1903-1987

P : 1

9 Pour toute famille finie ou dnombrable


dvnements Ai disjoints

P * Ai
i

P A
i

Si P est une probabilit dfinie sur un espace probabilisable ( : , T ), alors


le triplet ( : , T , P ) est dit espace probabilis
23

Probabilits et statistiques J.-M. Bourinet 2016

Proprits des probabilits


9

P 0

P A 1  P A

P A \ B

9 P A * B

P A  P A  B
P A  P B  P A  B

9 Si A B , alors P A d P B
9 Pour toute famille finie ou dnombrable
dvnements Ai ( ! Ai quelconques )

Probabilits et statistiques J.-M. Bourinet 2016

P * Ai d P Ai
i

24

Formule de Poincar
Gnralisation de lexpression P A * B

P A1 * A2 * A3

P A  P B  P A  B

P A1  P A2  P A3
 P A1  A2  P A2  A3  P A3  A1
 P A1  A2  A3

P A

P A1 * A2 *!* An

 P Ai  Aj
i j

 P Ai  Aj  Ak
i jk

!
 1

n 1

P A1  A2 ! An

H. Poincar, 1854-1912

25

Probabilits et statistiques J.-M. Bourinet 2016

Probabilits conditionnelles
On distinguera les probabilits a priori et les probabilits conditionnelles
( ces dernires intgreront une information supplmentaire sous la forme de
lobservation de la ralisation dun vnement donn par exemple )
Soit B un vnement de probabilit non nulle

P A | B

P A  B
P B

On appelle probabilit conditionnelle


de A sachant B le rapport not ci-contre :
P A | B reprsente la probabilit que A se ralise sachant que B est ralis
:

sachant B { on se
limite au domaine B
Relation :

P A  B

P A | B P B
P B | A P A

Probabilits et statistiques J.-M. Bourinet 2016

26

Probabilits conditionnelles Exemple (1)


Une enqute montre que 4% des franais sont atteints du cancer du poumon,
que 75% des malades sont des fumeurs et galement que 60% des franais
sont des fumeurs
1) Quelle est la probabilit dtre atteint du cancer quand on est fumeur ?
vnement A { tre atteint du cancer

vnement B { tre fumeur

Daprs la lecture de lnonc, on a : P A 0.04


P B 0.6
1) On cherche P A | B
On a :

P A  B

Do P A | B

P A | B

P B | A 0.75

P A  B
P B

P B | A P A 0.75 u 0.04

0.03

probabilit dtre
malade et fumeur

0.03
0.05
0.6
27

Probabilits et statistiques J.-M. Bourinet 2016

Probabilits conditionnelles Exemple (2)


2) Quelle est la probabilit dtre atteint du cancer quand on est non fumeur ?
vnement A { tre atteint du cancer

vnement B { tre fumeur

Daprs la lecture de lnonc, on a : P A 0.04


P B 0.6
2) On cherche P A | B

P A | B

On a :

P B 1  P B 1  0.6 0.4

et :

P A  B

P A \ A  B

P A  B
P B

P A | B

probabilit dtre non-fumeur

P A  P A  B

0.04  0.03 0.01


Do

P B | A 0.75

probabilit dtre
malade et non-fumeur

0.01
0.025
0.4

Probabilits et statistiques J.-M. Bourinet 2016

28

Conditionnements successifs
Gnralisation de lexpression P A  B

P A1  A2 ! An

P A | B P B

A { A1 ! An 1 et B { An
P A1 ! An 1 | An P An
A { A1 ! An 2 | An 1 et

B { An 1 | An

P A1 ! An 2 | An 1  An P An 1 | An P An
sachant ces 2 vnements
!

P A1 | A2 ! An P A2 | A3 ! An ! P An 1 | An P An
P A1 | A2 ! An P A2 | A3 ! An ! P An 1 | An P An

29

Probabilits et statistiques J.-M. Bourinet 2016

Indpendance statistique entre 2 vnements


Un vnement A est indpendant dun autre B si :

P A | B

P A

Ce qui signifie que la connaissance de B ne modifie pas les chances de


ralisation de A
A indpendant de B B indpendant de A
On parlera dvnements indpendants, sans autre prcision
Si 2 vnements A et B sont indpendants, alors :
Dm. : On se sert de P A  B
!

P A  B

P A P B

P A | B P B

La notion dindpendance nest pas une notion purement


ensembliste comme lincompatibilit
2 vnements peuvent tre indpendants pour une loi de probabilit
et pas pour une autre
En toute rigueur, il faudrait dire indpendants pour la probabilit P
Probabilits et statistiques J.-M. Bourinet 2016

30

Exemple
Pour une entreprise de spectacle dans le dpartement A, la probabilit de
faire lobjet dun contrle de scurit est 0.25 tandis que dans le dpartement
B cette probabilit nest que de 0.2.
Un groupe financier possde 2 entreprises, lune dans le dpartement A,
lautre dans le dpartement B
1) En supposant que les vnements faire lobjet dun contrle dans le
dpartement A et faire lobjet dun contrle dans le dpartement B sont
indpendants, calculer la probabilit que les 2 entreprises de ce groupe
subissent un contrle
vnement A { lentreprise dans le dpartement A fait lobjet dun contrle
vnement B { lentreprise dans le dpartement B fait lobjet dun contrle
A et B
indpendants

P A  B

P A P B

Do

P A  B

1 1
u
4 5

1
20

et
31

Probabilits et statistiques J.-M. Bourinet 2016

Indpendance statistique mutuelle


Les vnements dune famille A1 , !, An sont dit mutuellement indpendants
si pour toute partie I de > 1 , n @ , on a :

P  Ai
iI

P A
iI

Remarque : Lindpendance mutuelle est plus forte que lindpendance 2 2


Indpendance mutuelle Indpendance 2 2
La rciproque est fausse

Probabilits et statistiques J.-M. Bourinet 2016

32

Thorme des probabilits totales


Soit Bi un systme complet dvnements ( les Bi forment une partition de : )

P A

Pour tout vnement A, on peut crire :

P A B
i

P A

ou encore sous une autre forme :

P A | B P B
i

Dm. :

P A

P A  :

P A  * Bi
i

P * A  Bi
i

P A B
i

B1

B2

B3

B4

B5
33

Probabilits et statistiques J.-M. Bourinet 2016

Thorme des probabilits totales Exemple (1)


Une grande marque de produits laitiers a trois usines o sont fabriqus les
yaourts quelle commercialise Arras, Brest et Caen.
Arras fournit 25% de la production, Brest 20% et Caen 55%.
Les yaourts aux fruits reprsentent 20 % des yaourts produits Arras, 30%
Brest et 15% Caen.
1) Quelle est la probabilit quun yaourt de cette marque soit aux fruits ?
vnement B1 { le yaourt est produit Arras
vnement B2 { le yaourt est produit Brest
vnement B3 { le yaourt est produit Caen
vnement A { le yaourt est aux fruits
Daprs la lecture
de lnonc, on a :
1) On cherche

P A

P B1 0.25
P A | B1 0.2
P A

P B2 0.2

P B3 0.55

P A | B2 0.3

P A | B3 0.15

P A | B P B
i

i 1

Probabilits et statistiques J.-M. Bourinet 2016

34

Thorme des probabilits totales Exemple (2)


1) Quelle est la probabilit quun yaourt de cette marque soit aux fruits ?
vnement B1 { le yaourt est produit Arras
vnement B2 { le yaourt est produit Brest
vnement B3 { le yaourt est produit Caen
vnement A { le yaourt est aux fruits

P B1 0.25

Daprs la lecture
de lnonc, on a :

P A

P A | B1 0.2

P A | B P B
i

Do

P B2 0.2

P B3 0.55

P A | B2 0.3

P A | B3 0.15

P A 0.2 u 0.25  0.3 u 0.2  0.15 u 0.55

i 1

0.1925

35

Probabilits et statistiques J.-M. Bourinet 2016

Formules de Bayes
Soit A et B deux vnements tels que P A z 0
On a : P B | A

P A | B P B
P A

1re formule de Bayes


T. Bayes, 1702-1761

Soit Bi un systme complet dvnements ( les Bi forment une partition de : )


P A | Bk P Bk
P Bk | A
On a :
P A
soit encore :

P Bk | A

P A | Bk P Bk
P A | Bi P Bi
i

2me formule de Bayes


Probabilits et statistiques J.-M. Bourinet 2016

36

Formule de Bayes Exemple 1 (1)


Une grande marque de produits laitiers a trois usines o sont fabriqus les
yaourts quelle commercialise Arras, Brest et Caen.
Arras fournit 25% de la production, Brest 20% et Caen 55%.
Les yaourts aux fruits reprsentent 20 % des yaourts produits Arras, 30%
Brest et 15% Caen.
1) Sachant que le yaourt est aux fruits, quelle est la probabilit quil soit
fabriqu Caen ?
vnement B1 { le yaourt est produit Arras P B1 0.25
vnement B2 { le yaourt est produit Brest P B2 0.2
vnement B3 { le yaourt est produit Caen P B3 0.55

P B3 | A

P A | B3 0.15

P A 0.1925

vnement A { le yaourt est aux fruits


1) On cherche P B3 | A

P A | B1 0.2
P A | B2 0.3

P A | B3 P B3
P A

P A | B3 P B3

P A | B P B
i

i 1

37

Probabilits et statistiques J.-M. Bourinet 2016

Formule de Bayes Exemple 1 (2)


1) Sachant que le yaourt est aux fruits, quelle est la probabilit quil soit
fabriqu Caen ?
vnement B1 { le yaourt est produit Arras P B1 0.25
vnement B2 { le yaourt est produit Brest P B2 0.2
vnement B3 { le yaourt est produit Caen P B3 0.55

P A | B3 P B3
P A

Do

P A | B3 0.15

P A 0.1925

vnement A { le yaourt est aux fruits

P B3 | A

P A | B1 0.2
P A | B2 0.3

P B3 | A

Probabilits et statistiques J.-M. Bourinet 2016

0.15 u 0.55
0.1925

0.4286

38

Formule de Bayes Exemple 2 (1)


Dans une usine, 3 machines M1, M2 et M3 fabriquent des boulons de mme
type. M1 sort en moyenne 0.3% de boulons dfectueux, M2 0.8 % et M3 1%.
On mlange 1000 boulons dans une caisse, 500 provenant de M1, 350 de M2
et 150 de M3.
On tire au hasard un boulon dans la caisse; il est dfectueux.
1) Quelle est la probabilit quil ait t fabriqu par M1 ?
vnement M1 { le boulon est fabriqu par la machine M1
vnement M2 { le boulon est fabriqu par la machine M2
vnement M3 { le boulon est fabriqu par la machine M3
vnement D { le boulon est dfectueux
Daprs la lecture de lnonc, on a :
500
350
P M1
0.5
P M2
0.35
1000
1000
P D | M 2 0.008
P D | M 1 0.003

150
0.15
1000
P D | M 3 0.01
P M3

39

Probabilits et statistiques J.-M. Bourinet 2016

Formule de Bayes Exemple 2 (2)


1) Quelle est la probabilit quil ait t fabriqu par M1 ?
vnement M1 { le boulon est fabriqu par la machine M1
vnement M2 { le boulon est fabriqu par la machine M2
vnement M3 { le boulon est fabriqu par la machine M3
vnement D { le boulon est dfectueux
Daprs la lecture de lnonc, on a :
P M 1 0.5
P M 2 0.35

P M 3 0.15
P D | M 3 0.01

P D | M 2 0.008

P D | M 1 0.003
1) On cherche P M 1 | D

P M1 | D

P D | M1 P M1

P D | M P M
i

i 1

Do

P M1 | D

0.003 u 0.5
0.003 u 0.5  0.008 u 0.35  0.01 u 0.15

Probabilits et statistiques J.-M. Bourinet 2016

0.2586
40

Formule de Bayes Remarques


Dans lexemple prcdent ( boulons ), on a calcul ce quon appelle une
probabilit a posteriori, cest--dire sachant une information supplmentaire
( le boulon est dfectueux )
On voit que la prise en compte de cette information supplmentaire modifie la
valeur de la probabilit associe lvnement M1
La thorie des probabilits au travers de lapproche Baysienne est
adapte pour prendre en compte toute information nouvelle
Quelques champs dapplication
9 En diagnostic mdical, la rvision des probabilits de telle ou telle
affection aprs obtention des rsultats de laboratoire
9 En mtorologie, la prvision des avalanches
9 En finances, la dtermination du risque de faillite des entreprises
aprs observation de certains indicateurs
9 En maintenance, lactualisation de la fiabilit dun systme en
fonction du rsultat des inspections et des mesures effectues
41

Probabilits et statistiques J.-M. Bourinet 2016

Actualisation baysienne
Fonction de vraisemblance

f4 T

E

i 1

dT

Coefficient normatif,
pas fonction de T

E

T  4 d T  dT

f T d T
4

i 1

 E
i

i 1

Densit a priori, i.e. sans avoir connaissance


que les vnements Ei se sont produits

Densit a posteriori, i.e. conditionne sur la


connaissance des vnements Ei qui se sont produits

f 4post T

c L T f 4prior T

avec

1
f

L T f

prior
4

T d T

f

Probabilits et statistiques J.-M. Bourinet 2016

42

Variable alatoire

43

Probabilits et statistiques J.-M. Bourinet 2007

Pile ou face Concept de variable alatoire


X

Soit un espace probabilis ( : , T , P )

:
avec T
avec P

^ P,F `

On considre ici la loi de probabilit P telle


que ( cas particulier de lquiprobabilit ) :
1
 Z : , P Z
2

On dfinit une application X de : vers un ensemble E ( on prendra E = \ )


Cest la dfinition dune variable alatoire ( v.a. ) que lon note X
Pour obtenir la probabilit dune valeur
quelconque image par X, il suffit de
dnombrer les Z qui ralisent cette valeur :

P X

P ^P`

1
2

On dit quon transporte la loi de probabilit de : sur E par lapplication X


Probabilits et statistiques J.-M. Bourinet 2016

44

Somme des faces de 2 ds Concept de variable alatoire


X

Soit un espace probabilis ( : , T , P )

^ 1,1 , 1,2 ,!, 1,6 , 2,1 , 2,2 ,!`

(1,1)

On considre ici la loi de probabilit P telle


que ( cas particulier de lquiprobabilit ) :
1
 Z : , P Z
36

(1,2)

(2,1)

P ^ 1,2 , 2,1 `

12

9 P X

2
36
9 P X

(6,6)
E
:
avec T
avec P

P ^ 1,4 , 4,1 , 2,3 , 3,2 `


4
36

X est bien une application


45

Probabilits et statistiques J.-M. Bourinet 2016

Pile ou face Variable alatoire mesurable


X

On dfinit sur E une tribu T


( E , T ) est un espace probabilisable

:
avec T
avec P

E
avec T

Tout lment B de T est un vnement


On note X 1 B lensemble dfini par :

X 1 B

^ Z : | X Z B `

Une variable alatoire X est dite


mesurable si et seulement si :

X 1 B T

 B T c ,

On ne considrera que des v.a. mesurables


Dans le cas trait,
on voit quon a :

X 1 1

^P`

Probabilits et statistiques J.-M. Bourinet 2016

P X

P X 1 1
P ^P`

1
2
46

Somme des faces de 2 ds Variable alatoire mesurable


9 X

1

3 ^ 1,2 , 2,1 `
P X

X 1 5

P X

1

2
36

P X 1 5

(1,2)

^ 1,4 , 4,1 , 2,3 , 3,2 `

P X

(1,1)

4
36

(2,1)

12

(6,6)
:
avec T
avec P

E
avec T

Probabilits et statistiques J.-M. Bourinet 2016

47

Dfinition dune variable alatoire Probabilit image


La notion de variable alatoire une formalisation de la notion de grandeur
variant selon le rsultat dune exprience alatoire
Une variable alatoire X est une application mesurable de ( : , T , P )
dans ( E , T )
Si E = `, on parlera de variable alatoire (relle) discrte
Si E = \, on parlera de variable alatoire (relle) continue
( Rq. : T est alors la tribu borlienne )
Si E = `n ou \n, on parlera de vecteur alatoire de dimension n
Pour une variable alatoire mesurable X, la probabilit image de P par X
( note PX ) est dfinie par la relation suivante :

 B T c , PX B

P ^ Z | X Z B `
P X 1 B

Probabilits et statistiques J.-M. Bourinet 2016

48

Variables alatoires En bref


Une variable alatoire X est une application dfinie sur : et valeur dans
E = ` ( v.a. discrte ) ou E = \ ( v.a. continue )
(1,1)

(1,2)

(1,6)

(2,1)

(2,2)

(2,6)

(6,1)

(6,2)

: o `
X
Z 6 X Z
`

#
(6,6)

x=3

9 A une issue possible Z de : correspond un point x de ` ou de \


9 Les probabilits associes chaque point x de ` ou \ sont le plus
souvent diffrentes. Ces probabilits seront caractrises par des lois
9 X ( lettre majuscule ) dsignera la variable alatoire, x ( lettre minuscule )
sera la valeur prise par cette v.a. ( appele aussi ralisation de cette v.a. )
9 Ex. dvnement : D ^a  X d b` { la v.a. X prend une valeur @a, b@
49

Probabilits et statistiques J.-M. Bourinet 2016

Loi de probabilit ( ou distribution ) de la variable alatoire X


(1,1)

(1,2)

(1,6)

(2,1)

(2,2)

(2,6)

(6,1)

(6,2)

PX B

(6,6)

p X 3

P X

2
36

x=3

6
5 36 5
Loi de X
36
36
4
4
3 36
36 3
36 2
2 36
36 1
1 36
36
36

P X 1 3

pX x

P X 1 B

^3`

P ^ Z | X Z B `

9 Cas B

Probabilits et statistiques J.-M. Bourinet 2016

9 10 11 12

x
50

Loi de probabilit dune variable alatoire X


Variable alatoire discrte X

pX x

P X

Variable alatoire continue X

fX x

x4

P x  X d x  d x
dx
x

x1
p X xi

pX

x2

P X

x3 x4

x xdx

x5

xi

P ^ Z | X Z

xi

fX x d x

fX

masse ponctuelle

Rq. : xi , 0 d p X xi d 1
Les xi forment un
systme complet
dvnements

x
P x  X d x  d x

dP

P ^ Z | x  X Z d x  d x `

densit de probabilit

Rq. : x , f X x t 0

p x
X

xi

Les f X x d x forment
un systme complet
dvnements

f x d x
X

Probabilits et statistiques J.-M. Bourinet 2016

51

Fonction de rpartition dune variable alatoire X


La fonction de rpartition dune variable alatoire X est lapplication FX
de \ dans > 0,1 @ telle que :
FX x P X d x
Proprits :
9 FX est une fonction monotone croissante, continue droite
9 lim FX x 0 et lim FX x 1
x o f

9 P a  X d b

x o f

FX b  FX a

Probabilits et statistiques J.-M. Bourinet 2016

52

Fonction de rpartition dune variable alatoire X


Variable alatoire discrte X

pX x

Variable alatoire continue X

fX x

3 10 3 10

P X d x

2 10
1 10

1 10

FX x

x
x1 x2 x x3 x4

x5

p x

FX x P X d x

xi d x

FX x P X d x

fX x d x

f

FX x
1

FX x

9 10
7 10

4 10

1 10

x1 x2 x x3 x4

x5

53

Probabilits et statistiques J.-M. Bourinet 2016

Proprits de la fonction de rpartition (1)

P a  X d b

FX b  FX a

P a  X d b

fX x d x 

f

fX x d x

f

f x d x

P a  X d b
fX x

fX x

=
a

fX x

FX b

FX a

^ X d x ` et ^ X ! x ` sont des vnements complmentaires


Rq. : idem pour les vnements ^ Z | X Z d x ` et ^ Z | X Z ! x `
P X ! x 1  P X d x 1  FX x
Probabilits et statistiques J.-M. Bourinet 2016

54

Proprits de la fonction de rpartition (2)


Variable alatoire discrte X

P X

x1

pX x

FX x1

 i !1, P X

FX xi  FX xi 1

FX x
1

3 10 3 10
2 10
1 10

xi

9 10
7 10

1 10

4 10

x
x1 x2 x x3 x4

x1 x2 x x3 x4

x5

Variable alatoire continue X

fX x

d FX x
dx

P X

1 10

x5

Dm. :

x 0

P X

lim P x  X d x  d x

d x o0

lim f X x d x

d x o0

0
Probabilits et statistiques J.-M. Bourinet 2016

55

Probabilits et statistiques J.-M. Bourinet 2016

56

Fonction dune variable alatoire

57

Probabilits et statistiques J.-M. Bourinet 2007

Introduction
:o\
On considre lapplication M telle que :
Z 6 M X Z

\ o \
On utilisera de manire quivalente la notation suivante :
X 6 M X
Y

M X est une variable alatoire de loi dfinie par :

Variable alatoire discrte X


Variable alatoire continue X

y , P M X

y , P M X d y

P X

fX x d x

xi | M xi y

xi

x | M x d y

Probabilits et statistiques J.-M. Bourinet 2016

58

Cas des variables alatoires continues


y
On se place ici dans le seul cas
dune variable alatoire continue X

fY y

Objectif :

y M x

dy
x

Connaissant la loi de X,
on va chercher
dterminer celle de Y
fY y ?

fX x

dx

59

Probabilits et statistiques J.-M. Bourinet 2016

Cas dtude n1 : M bijective et continment diffrentiable


Cas M croissante

y M x

A lvnement Y d y est associ celui X d x

P Y d y

P X d x

FY y

On drive et on obtient :
1
fY y f X M 1 y
M c x

FX x

y M x

FX M 1 y

Ydy
x

fY y

fX x

dx
dy

Xdx

Cas M dcroissante

A lvnement Y d y est associ celui X ! x

P Y d y

P X ! x

FY y 1  FX x

On drive et on obtient :
1
fY y  f X M 1 y
M c x

1  FX M

1

y M x

y M x

Ydy
x

fY y

 fX x

Probabilits et statistiques J.-M. Bourinet 2016

dx
dy

x X !x
60

Cas dtude n1 : M bijective et cont. diffrentiable En bref


fY y

On a :

fX x

y M x

dx
dy

o x est la solution de lquation : y M x


i.e. x M 1 y
y

y M x
Ydy
x

y M x

fY y

Xdx

y
y
dy
fY y d y
fX

y M x

y M x

Ydy

=x d x

fX x

dx

x
x X !x
61

Probabilits et statistiques J.-M. Bourinet 2016

Cas dtude n2 : M non-bijective mais cont. diffrentiable


fY y

On a :

dx
f x d y

o les xi sont les solutions de lquation : y M xi

y
fY y

yd y

dy!0

y M x

y
fY y d y x1  d x1 x1

x2  d x2

d x2 ! 0

d x1  0
f X x1 d x1

x2

fX x

f X x2 d x2

Probabilits et statistiques J.-M. Bourinet 2016

62

Caractristiques dune variable alatoire

Probabilits et statistiques J.-M. Bourinet 2007

63

Caractrisation dune variable alatoire X


Une loi de probabilit sera caractrise par un certain nombre de grandeurs :
9 sa valeur centrale
9 sa dispersion
9 sa forme
La valeur centrale sera caractrise par une proprit appele esprance
La dispersion sera caractrise par une proprit appele variance
De manire gnrale, on dfinira des moments statistiques qui permettront
de caractriser certaines proprits lies la forme de la loi de X

Probabilits et statistiques J.-M. Bourinet 2016

64

Esprance mathmatique dune variable alatoire X


E>X @

Variable alatoire discrte X

PX

x P X
i

xi

xi

On dfinit lesprance de la variable


alatoire X par la formule suivante :

p X xi

xi

E >x@ { Esprance de x

Si cette expression a un sens


( i.e. si la somme converge )

E>X @

Variable alatoire continue X

PX

x d P x

On dfinit lesprance de la variable


alatoire X par la formule suivante :

x fX x d x

Si cette expression a un sens


( i.e. si lintgrale converge )

E > X @ est la moyenne arithmtique ( note P X ) des diffrentes valeurs de X


pondre par leurs probabilits
65

Probabilits et statistiques J.-M. Bourinet 2016

Esprance mathmatique dune v.a. Exemples


Variable alatoire discrte X

E>X @

PX

p X xi

xi

1
1
1
1u  2 u  !  6 u
6
6
6
7
2
Variable alatoire continue X

E>X @

PX

x fX x d x

x
b

pX x

Face suprieure lors


du lancer de d

1
6
x
1

fX x

Variable alatoire
uniforme entre a et b

1
ba

1
dx
ba

ab
2
Probabilits et statistiques J.-M. Bourinet 2016

x
a

P X { abscisse du centre
de surface
66

Proprits de lesprance mathmatique


Des proprits lmentaires de loprateur esprance se dduisent de celles
du signe somme ( ) et intgrale ( )
Proprits :
9 E >a @ a
9 E > aX @ a E > X @
9 E > X  a@

Linarit

E>X @ a

o a dsigne un rel

67

Probabilits et statistiques J.-M. Bourinet 2016

Moment dune fonction dune variable alatoire


On considre lapplication M telle que : \ o \

X 6 Y

M X

M X est une variable alatoire

On dfinit le moment E >M X @ de la fonction M de la variable alatoire X


par lesprance suivante :
Variable alatoire discrte X

E >M X @

M x p x
i

xi

Variable alatoire continue X

E >M X @

M x f x d x
X

Probabilits et statistiques J.-M. Bourinet 2016

68

Moments dordre k dune variable alatoire X


On dfinit le moment dordre k de la variable alatoire X par lesprance
suivante :
Variable alatoire discrte X

Variable alatoire continue X

E X k

E X k

p X xi

k
i

xi

xk f X x d x

Rq. 1 : On prend M telle que : \ o \

X 6 Y

Xk

Rq. 2 : Lesprance E > X @ ( ou moyenne P X ) reprsente le moment dordre 1

69

Probabilits et statistiques J.-M. Bourinet 2016

Moments centrs dordre k dune variable alatoire X


On appelle moment centr dordre k la
quantit dfinie par lexpression suivante :

Variable alatoire discrte X

k
E X  E > X @

k
E X  E > X @

 E > X @ p X xi
k

xi

x  P
i

p X xi

fX x d x

xi

k
Variable alatoire continue X E X  E > X @

x  E > X @
x

x  P
X

fX x d x

Probabilits et statistiques J.-M. Bourinet 2016

70

Moment centr dordre 2 ( variance ) et cart-type


Le moment centr dordre 2 est
connu sous le nom de variance

2
E X  E > X @

Var > X @

2
E X  P X

Var >x@ { Variance de x

x  P

Var > X @

Variable alatoire discrte X

p X xi

xi

Var > X @

Variable alatoire continue X

x  P
X

fX x d x

Relation
importante :

Var > X @

2
Dm : E X  P X

2
E X  P X

E X 2  P X2

Formule de Knig

E X 2  2 P X E > X @  P X2

E X 2  2 P X X  P X2

On appelle cart-type de la variable alatoire X la


quantit V X lie la variance par la relation suivante :

Var > X @

V X2

71

Probabilits et statistiques J.-M. Bourinet 2016

Variance dune variable alatoire discrte Exemple


Variable alatoire discrte X

Var > X @ V X2

x  P
i

xi

p X xi

2
2
xi p X xi  P X
xi

1
1
1 7
1 u  22 u  !  62 u 
6
6
6 2
91 49

6 4

Do Var > X @

VX

35
12

2.9167

Var > X @ 1.7078

pX x

Face suprieure lors


du lancer de d

1
6
x
1

Probabilits et statistiques J.-M. Bourinet 2016

6
72

Variance dune variable alatoire continue Exemple


Variable alatoire continue X

Var > X @ V X2

x
b

1
a b
x
d x 

ba
2

1 b3  a 3 a  b


3 ba 2
Do Var > X @

x  P X 2 f X x d x x 2 f X x d x  P X2

b  a 2

fX x

12

Variable alatoire
uniforme entre a et b

1
Var > X @ { moment dinertie
de la surface / axe y b  a
Var > X @

VX

ba
12

b
y
73

Probabilits et statistiques J.-M. Bourinet 2016

Comparaison entre la loi uniforme discrte et continue


pX x
fX x

1
6

Var > X @
x

1
1
6 1 5
1
6
1
6.5  0.5

35
12

2.9167

Variances diffrentes

2
b  a
25

Var > X @
2.0833

x
1

1
6

E>X @

PX

ab
2

12

Variances diffrentes

x
0.5

12

6.5
1 6 7
2
2

Probabilits et statistiques J.-M. Bourinet 2016

2
b  a
36

Var > X @
3

12

12

Variances diffrentes

74

Proprits de la variance
Proprits :
9 Var > X @

E X 2  E > X @

Formule de Knig Dj vu

2
9 Var > aX @ a Var > X @

2
9 Var > aX  b@ a Var > X @

o a et b dsignent des rels


Autres proprits :
2
9 E X  a Var > X @  E > X @  a
Thorme de Huygens
9 Ingalit de Bienaym-Tchbicheff :
1
k ! 0 , P X  E > X @ t kV X d 2
k
2

Probabilits et statistiques J.-M. Bourinet 2016

75

Variables centres, rduite ( ou norme )


Variable alatoire centre
On dit que la variable alatoire X est centre si E > X @ 0
Variable alatoire rduite ( ou norme )
On dit que la variable alatoire X est rduite ( ou norme ) si Var > X @ 1

Probabilits et statistiques J.-M. Bourinet 2016

76

Mdiane, mode dune variable alatoire X


On appelle mdiane dune variable alatoire X la valeur x telle que :

P X d x0.5 t 0.5 et P X t x0.5 t 0.5

Variable alatoire discrte X


!

Pour une v.a. discrte, cette valeur nest pas ncessairement


unique ( pour le d, les valeurs 3 et 4 sont toutes 2 des mdianes )

FX x0.5 0.5

Variable alatoire continue X

On appelle mode de la variable alatoire X la valeur x telle que p X x soit


maximum ( pour une v.a. discrte ) ou telle que f X x soit maximum ( pour
une v.a. continue )
!

Pour une v.a. discrte, cette valeur nest pas ncessairement


unique ( pour le d, toutes les valeurs de 1 6 sont des modes )

Dfinition : Une loi est dite symtrique lorsque sa moyenne, sa mdiane


et son mode sont tous 3 confondus ( ex. : la loi normale )
77

Probabilits et statistiques J.-M. Bourinet 2016

Quantits associes aux moments centrs dordre 3 et 4

Coefficient dasymtrie

Coefficient daplatissement

J3

J4

3
E X  P X

V X3

4
E X  P X

Probabilits et statistiques J.-M. Bourinet 2016

V X4

78

Exemples de lois discrtes

79

Probabilits et statistiques J.-M. Bourinet 2007

Loi de Bernoulli ( dite aussi loi indicatrice )


Une variable alatoire X suit une loi de Bernoulli de paramtre p si elle
ne peut prendre que les valeurs 1 ou 0, avec les probabilits p ou 1  p
respectivement
1
p
E ^ 0,1 `
P X 1 p
PX E > X @
X

P X

0 1  p

1 p

0 u 1  p  1 u p

PX

Toute exprience alatoire dont le rsultat est


binaire ( russite ou chec ) est appel une
preuve de Bernoulli

p
0

p  p2

1 p

E X 2  E > X @
E>X @ E>X @

FX x

pX x
1

Var > X @

Var > X @

p 1  p

x
0

Probabilits et statistiques J.-M. Bourinet 2016

X2
80

Loi de Bernoulli
Toute exprience alatoire dont le rsultat est binaire ( russite ou chec ) est
appel une preuve de Bernoulli. On introduit la loi de Bernoulli de
paramtre p pour tudier la ralisation ou non dun vnement A de
probabilit p. La valeur 1 correspond alors la ralisation ( russite ) et 0
la non ralisation ( chec )
Une variable alatoire X suit une loi de Bernoulli de paramtre p si elle
ne peut prendre que les valeurs 1 ou 0, avec les probabilits p ou 1  p
respectivement
Loi : P X

pX x

1 p
p

si
si

pX x
1

x 0
x 1

Moyenne :

PX

Variance :

V X2

p 1  p

FX x
1

1 p
p
0

1
81

Probabilits et statistiques J.-M. Bourinet 2016

Lois bases sur une squence dpreuves de Bernoulli


On suppose quon rpte, dans des conditions identiques, une exprience
alatoire, dont lissue se traduit par lapparition ( ou la non apparition ) dun
vnement A de probabilit p, le rsultat dune exprience tant indpendant
des prcdents
Y
nbre dapparitions de A
Chaque exprience alatoire est
parmi n expriences
une preuve de Bernoulli
X Loi binomiale
Ni
nbre dexpriences entre les
W3
(i 1) et ime apparitions de A
W2
X Loi gomtrique

Wk

W1
N1 W1

N2

N3

nbre dexpriences avant la


kme apparition de A
X Loi pr-binomiale ngative

1
1 2 3 4 5 6 7 8 9 10
n
Exemple de ralisation dune squence de Bernoulli
Probabilits et statistiques J.-M. Bourinet 2016

k = numro de
lexprience alatoire
82

Loi binomiale
On suppose quon rpte n fois et dans des conditions identiques une
exprience alatoire, dont lissue se traduit par lapparition ( ou la non
apparition ) dun vnement A de probabilit p, le rsultat dune exprience
tant indpendant des prcdents ( preuve de Bernoulli )
On note X = Y le nombre dapparitions de lvnement A parmi ces n
expriences
On a bien videmment : 0 d x d n
On dfinit, pour chaque exprience i 1,!, n une variable de Bernoulli Xi
de paramtre p
n

On a ainsi : X

Bien voir que les Xi prennent les valeurs 0 ou 1

i 1

On dit que la variable alatoire X suit une loi binomiale de paramtres n et p


Notation : X  B n, p

Rq. : i 1,!, n ,

X i  B 1, p
83

Probabilits et statistiques J.-M. Bourinet 2016

Caractristiques de la loi binomiale


n

On a ainsi : X

i 1

E>X Y @

9 Proprit dadditiv de lesprance

E>X @

E>X @
i

n E> Xi @

E > X @  E >Y @

E > X @ np

i 1

Les Xi ont la mme esprance p

Var > X  Y @ Var > X @  Var >Y @  2Cov > X , Y @


Cas de 2 variables indpendantes : Var > X  Y @ Var > X @  Var >Y @

9 Variance de la somme de 2 v.a.

Var > X @

Var X i
i1

Var > X @
i

n Var > X i @

i 1

Les Xi sont indpendants

Les Xi ont la mme variance p 1  p

Var > X @ np 1  p
Probabilits et statistiques J.-M. Bourinet 2016

84

Dtermination de la loi binomiale (1)


E

^ 0, 1,!, n `

Avant de caractriser la loi de X en cherchant lexpression de P X k ,


on peut remarquer que toutes les configurations telles que k variables Xi
prennent la valeur 1 et telles que les n  k autres prennent la valeur 0
sont quiprobables et quil y a Cnk configurations de cette sorte ( nombre de
manire de choisir k variables Xi parmi n )
Les Xi sont indpendants
On a : P X 1

x1 ! X n

xn

P X

xi

Bien voir que les xi


valent 0 ou 1

i 1
n

p 1  p

1 xi

xi

i 1

p xi 1  p

n  xi

On cherche P X k , cest--dire la probabilit associe aux configurations


pour lesquelles k variables Xi prennent la valeur 1, c..d. telles que xi k
85

Probabilits et statistiques J.-M. Bourinet 2016

Dtermination de la loi binomiale (2)


Chaque configuration telle que xi

P X1

x1 ! X n

k a donc pour probabilit :


xn

p k 1  p

n k

Sachant quil y a Cnk configurations de ce type, on trouve :

pX k

P X

k Cnk p k 1  p

Probabilits et statistiques J.-M. Bourinet 2016

n k

86

Reprsentation de la loi binomiale en fonction de n et p

n, p 10,0.1

n, p 50,0.1

0.4

0.2

0.6

0.3

0.15

0.4

0.2
0.1

0.2

PX

0
0

10

0.3

0.3

pX(k)

0.4

0.2
0.1

10

n, p 10, 0.5
0.25
0.2

0.2

0.15
0.1
0.05

0
0

10

6
k

0.1

n, p 10, 0.2

0.4

PX

0
0

10

n, p 10, 0.1

0
0

0.1
0.05

pX(k)

0
0

pX(k)

pX(k)

0.8

pX(k)

pX(k)

n, p 5,0.1

0
0

10

10

87

Probabilits et statistiques J.-M. Bourinet 2016

Proprits de la loi binomiale

n, p 10,0.1

Quasi-symtrique
autour de la moyenne
pour n grand

Symtrique
autour de la moyenne
pour p = 0.5

0.4
0.3

pX(k)

n, p 50,0.1
0.2

n, p 10, 0.5

0.2
0.25
0.1

0.2

0
0

0.1

PX

6
k

0.05
0
0

10

pX(k)

pX(k)

0.15

0.15
0.1
0.05

10

0
0

10

Proprits :
9 Si X  B n, p , alors n  X  B n,1  p
9 Si X 1  B n1 , p et X 2  B n2 , p sont 2 v.a. binomiales indpendantes et
de mme paramtre p, alors X 1  X 2  B n1  n2 , p
Probabilits et statistiques J.-M. Bourinet 2016

88

Loi gomtrique (1)


On suppose quon rpte, dans des conditions identiques, une exprience
alatoire, dont lissue se traduit par lapparition ( ou la non apparition ) dun
vnement A de probabilit p, le rsultat dune exprience tant indpendant
des prcdents ( preuve de Bernoulli )
On ne fixe pas le nombre de rptitions a priori, on rpte autant de fois
que ncessaire lexprience
On note X = W1 le nombre de rptitions requis pour faire apparatre
lvnement A pour la 1re fois
On dit que la variable alatoire X suit la loi gomtrique de paramtre p
Loi :

P X

Moyenne :

PX

Variance :

2
X

pX k

1
p
1 p
p2

p 1  p

k 1

pour k

p 1  p

k 1

1, 2, !, f
1  p ! 1  p p


k  1 fois

89

Probabilits et statistiques J.-M. Bourinet 2016

Loi gomtrique (2)


Masse ponctuelle pX

Fonction de rpartition FX
1

0.1

0.8

pX(k)

FX(k)

0.1

0.05

0.1

0.6
0.4
0.2

0
0

10
k

15

20

0
0

10
k

15

20

X
X
Remarque :
9 La loi gomtrique nest pas seulement la loi dcrivant le nombre W1
dexpriences mener pour une 1re apparition de lvnement A
Elle dcrit aussi le nombre dexpriences Ni entre les (i 1)me et ime
apparitions de lvnement A

La loi peut tre dfinie comme qualifiant le nombre W1 dexpriences


mener pour une 1re apparition de A ( y compris celle o A apparat et
tel que prsent ici ) ou alors comme qualifiant le nombre Y W1  1
dexpriences menes avant lapparition de A
Probabilits et statistiques J.-M. Bourinet 2016

90

Prliminaire la loi binomiale ngative


On suppose quon rpte, dans des conditions identiques, une exprience
alatoire, dont lissue se traduit par lapparition ( ou la non apparition ) dun
vnement A de probabilit p, le rsultat dune exprience tant indpendant
des prcdents ( preuve de Bernoulli )
On ne fixe pas le nombre de rptitions a priori, on rpte autant de fois
que ncessaire lexprience
On note X = Wk le nombre de rptitions requis pour faire apparatre
lvnement A pour la kme fois
La variable alatoire X suit la loi suivante :
Loi :

P X

Moyenne :

PX

Variance :

2
X

p X n Cnk11 p k 1  p

k
p
k 1  p
p2

n k

pour n

k , k  1, !, f

Pour k = 1, cest la loi gomtrique

91

Probabilits et statistiques J.-M. Bourinet 2016

Loi binomiale ngative ( dite aussi loi de Pascal ) (1)


Toujours sous les mmes hypothses, on suppose :
9 quon a rpt lexprience alatoire m  k  1 fois
9 quon a eu k  1 apparitions de lvnement A et donc m non apparitions
On sintresse cette fois la probabilit quon ait la kme apparition de A
la n m  k me exprience
On note X Wk  k le nombre de rptitions excdant k requis pour faire
apparatre lvnement A pour la kme fois
La variable alatoire X suit la loi loi binomiale ngative de paramtres k et p
Loi :

P X

Moyenne :

PX

Variance :

V X2

m
1 p
p
1 p
k 2
p

p X m Cmk 1k 1 p k 1  p

pour m

0, 1, !, f

X Wk  k
Bien voir que
m nk

Probabilits et statistiques J.-M. Bourinet 2016

92

Loi binomiale ngative ( dite aussi loi de Pascal ) (2)

k , p 1,0.1

k , p 2,0.1

0.08

0.03

0.04

pX(k)

0.02

0.06

pX(k)

pX(k)

0.03

0.04

0.1

0.02

0.01
0.01

0.02
0
0

k , p 3,0.1

10
k
X

15

20

0
0

10
k

15

PX

20

0
0

10
k

15

20

93

Probabilits et statistiques J.-M. Bourinet 2016

Hypothses de la loi de Poisson


On considre un vnement A qui se produit compltement alatoirement
dans le temps ( ou dans lespace ), reprsents par les carrs bleus
Comme pour la loi binomiale,
on peut sintresser :

nbre dapparitions de A
dans lintervalle > 0,t @
X X est une v.a. discrte

T1

temps ( ou distance ) jusqu la


1re apparition de A

Ti

temps ( ou distance ) entre les


(i 1)me et ime apparitions de A

Wk

temps ( ou distance ) jusqu la


kme apparition de A

W3
W2
T1 W1

T2

T3
t

On va sintresser dans un
premier temps la loi de X

X T1 , Ti et Wk sont des v.a. continues


Probabilits et statistiques J.-M. Bourinet 2016

94

Dtermination de la loi de Poisson (1)


On suppose quon partitionne lintervalle > 0,t @ en n sous-intervalles de tailles
identiques 't de manire vrifier t n't
't
t 0
t
t

't 1 't 2
Notons p la probabilit davoir une apparition ou plus de lvnement A dans
chaque intervalle 't
Hypothse dhomognit
9 On suppose quil existe un nombre moyen dvnements par unit de
temps X p sera donc une constante pour chaque intervalle
On considre la squence de Bernoulli o chaque preuve correspond
lapparition dau moins un vnement A dans chacun des intervalles 't i
( ces preuves sont bien indpendantes ). La v.a. associe est note Xi
On note Yn , p

Cest le nombre dintervalles dans lesquels


au moins un vnement A se produit
95

Probabilits et statistiques J.-M. Bourinet 2016

Dtermination de la loi de Poisson (2)


Si n dsigne le nombre dintervalles, alors on a Yn , p  B n, p
!

Yn,p ne correspond pas ncessairement au nbre dvnements dans > 0,t @


Il peut tre plus petit ( si des 't i contiennent plus dun vnement A )
Sil y a plus dune valeur par intervalle 't i , il suffit de rduire la taille
de ces intervalles
't
t 0
t
t

Le nombre X dapparitions de A dans


lintervalle > 0,t @ est ainsi obtenu par :
Pour k 0, 1, !, f ,
on montre que :

P X

lim Yn , p

nof
po0
np Q

lim Cnk p k 1  p

nof
po0
np Q

k!

exp Q

Probabilits et statistiques J.-M. Bourinet 2016

nk

E>X @
nombre moyen
dvnements
dans > 0,t @

Loi de Poisson
Notation : X  P Q
96

Quelques remarques sur la loi de Poisson


Autre expression de la loi de Poisson
On prfre souvent faire apparatre le taux moyen
dvnements par unit de temps, not O

Q
t

k
Ot

P X k pX k
exp O t

La loi scrit alors :

k!

Rq. : Si O est suppos constant, alors la v.a. X reprsente le nombre


dvnements se produisant dans lintervalle > 0,t @
On parle alors de processus ( homogne ) de Poisson
Absence de mmoire du processus de Poisson
Si on sintresse lintervalle > t0 , t @ , il suffit de remplacer t par t  t0
dans lexpression de la loi

97

Probabilits et statistiques J.-M. Bourinet 2016

Loi de Poisson

Moyenne :

PX

Variance :

V X2

k!

exp Q

0, 1, !, f

pour k

0.2

pX(k)

0.2

pX(k)

0.2

Qk

0.1

0.1

0
0

PX

10
k

15

10

pX(k)

Loi :

pX k

0
0

0.1

PX

10
k

15

0
0

10

PX

15

Quasi-symtrique
autour de la moyenne
pour Q grand
Probabilits et statistiques J.-M. Bourinet 2016

98

Exemples dapplications de la loi de Poisson


Applications en ingnierie
9 Nombre de pices dfectueuses dans une livraison importante,
la production tant de bonne qualit
9 Nombre de dfauts le long dune soudure, dans un disque dur, etc
9 Dfaillances de machines sur un site de fabrication
Autres applications
9 Nombre de suicides par an dans un pays donn
9 Nombre dappels tlphoniques dans un intervalle de temps T donn
9 Positions des vhicules sur une autoroute un moment donn
9 Heure darrive de vhicules un endroit donn sur une autoroute

Probabilits et statistiques J.-M. Bourinet 2016

99

Probabilits et statistiques J.-M. Bourinet 2016

100

Exemples de lois continues

101

Probabilits et statistiques J.-M. Bourinet 2007

Loi uniforme
Densit :

1
ba
0

fX x

si a d x d b
sinon

Fonction de rpartition :
xa
F x
si a d x d b
ba
0
si x  a

si x ! b

PX

Moyenne :

ab
2

Variance :

Densit fX

12

0.8

a, b 0,1

0.6

FX(x)

fX(x)

b  a 2

Fonction de rpartition FX

0.8

0.4
0.2
0

2
X

0.6
0.4
0.2

0.5
x

Probabilits et statistiques J.-M. Bourinet 2016

0.5
x

102

Loi normale ( ou loi de Gauss )


Loi fondamentale en probabilits et statistiques
Une variable alatoire X suit une loi normale ( dite aussi
de Gauss ) si sa densit a pour expression :

fX x

VX

1 x  P 2
X
exp 

V
2
2S

X

pour x \
C.F. Gauss, 1777-1855

0.8

PX

VX = 0.5

VX = 1.0

0.6

PX

Var > X @ V

et

fX(x)

E>X @

On a :

2
X

Notation : X  N P X , V X

VX = 2.0

0.4
0.2
0
-5

0
x

5
103

Probabilits et statistiques J.-M. Bourinet 2016

Loi normale centre rduite


Si on effectue le changement de variable U

fU u
et on a :

E >U @ 0

et

M u

X  PX

VX

, la densit devient :

1
1
exp  u 2
2S
2

Var >U @ 1

U est une variable normale centre rduite ( ou centre norme )


Rq. :

x  P X centre la variable
x

VX

norme la variable

Probabilits et statistiques J.-M. Bourinet 2016

Il faut voir U comme


le nombre dcarts-types
sparant X de sa moyenne PX

104

Fonction de rpartition de la loi normale centre rduite


La fonction de rpartition de la loi normale centre rduite est note )
et est dfinie par lexpression suivante :

FU u

) u

f

1
1
exp  u 2 d u
2S
2

Cette intgrale na pas de solution analytique. Elle est tabule dans tous les
ouvrages de probabilits et statistiques
La fonction de rpartition inverse de la loi normale centre rduite est
note ) 1
Si on cherche u tel que ) u

) 1 P0

P0 , alors u

Cette fonction na galement pas de solution analytique et est elle aussi


tabule dans tous les ouvrages de probabilits et statistiques

105

Probabilits et statistiques J.-M. Bourinet 2016

Reprsentation de la loi normale centre rduite


Fonction de rpartition )
1

0.3

0.8

F)
(u)
U (u)

(u)
fMU(u)

Densit M
0.4

0.2
0.1

0.6

) 0 0.5

0.4
0.2

0
-5

Proprit :

0
u

M u M u

0
-5

Proprit :

0
u

) u 1  ) u

Dm. : ) u

P U d u 1  P U ! u
1  P U d u
U  N 0,1
1  ) u

Probabilits et statistiques J.-M. Bourinet 2016

106

Fonction de rpartition et son inverse


Fonction de rpartition )

Fonction de rpartition inverse )1

0.6

)1(P)

F)
(u)
U (u)

0.8

) 0 0.5

0.4

) 1 0.5 0

0.2
0
-5

0
u

5
P

) u 1  ) u

Proprit :

Proprit :

ou ) u 1  ) u

) 1 P

) 1 1  P

Dm. : ) 1 x o ) u 1  ) u
u ) 1 1  ) u
u ) 1 1  ) u
Do : ) 1 P ) 1 1  P
107

Probabilits et statistiques J.-M. Bourinet 2016

Quelques valeurs utiles pour la loi normale centre rduite


P a  X d b

FX b  FX a

0.4
P0 = 0.99

On sintresse ici la loi


normale centre rduite :

fU(u)
M
(u)

P a  U d b ) b  ) a
On veut trouver lintervalle
symtrique contenant une
probabilit donne P0 :
) b 1  ) b
P b  U d b ) b  ) b

P0 = 0.90
0.2
0.1

P0

0
-5

On a :
Do : ) b
Et donc : b

P0  1
2
P 1
) 1 0
2

P0 = 0.95

0.3

0
u

Quelques valeurs caractristiques :


9 P0 = 0.99
{ 2.5758 < U < 2.5758 }
{ 1.9600 < U < 1.9600 }
9 P0 = 0.95
{ 1.6449 < U < 1.6449 }
9 P0 = 0.90

Probabilits et statistiques J.-M. Bourinet 2016

108

Table Fc. de rpartition de la loi normale centre rduite


Calcul de la probabilit de trouver une valeur infrieure u = 1.96 ?

P U d 1.96 ) 1.96
Lecture table : 0.9750

) u 1  ) u

) 1.96 0.9750

) 1.96 0.0250

109

Probabilits et statistiques J.-M. Bourinet 2016

Tables Fractiles de la loi normale centre rduite


Calcul de lintervalle symtrique sur u contenant 95% de probabilit ?

) u0.975 0.975

Lecture table : 1.96


u0.975 1.96

) u0.025 0.025

Lecture table : 1.96


u0.025 1.96 ( c.f. N.B. )

u0.025

) 1 0.025

Probabilits et statistiques J.-M. Bourinet 2016

) 1 1  0.0025
) 1 0.975 u0.975

1.96

110

Lois drives de la loi normale


Loi lognormale Notation : X  LN O , [ ou X  LN P X , V X
Une variable alatoire X suit une loi lognormale ssi Y ln X suit une loi
normale
Une variable alatoire lognormale est positive
Loi du Chi-deux Q degrs de libert Notation : X  FQ2
Soient Q variables alatoires
normales centres rduites et indpendantes
Q
La variable alatoire Y

suit la loi du Chi-deux Q degrs de libert

2
i

i 1

Cest en particulier la loi du carr de la norme euclidienne dun vecteur


Gaussien de dimensionQ
Loi de Student Q degrs de libert Notation : X  TQ
On considre une variable alatoire normale centre rduite U et une
variable alatoire X suivant la loi du Chi-deux Q degrs de libert
U
La variable alatoire
suit la loi de Student Q degrs de libert
XQ
111

Probabilits et statistiques J.-M. Bourinet 2016

Loi lognormale
Densit :

1 ln x  O
exp 
pour x ! 0
2
[
[ x 2S

[2
2
P
O
exp

Moyenne :
Variance : V X
X

X
Paramtres : O Pln X ln
[ V ln X
1 G 2
X

P X Densit fX
2

Moyenne :

[2
P X exp O 
2

x0.5

exp O

GX

PX = 1.0

0.4

PX
1

Mode :
xmax

ln 1  G X2
10

avec G X

VX
PX

P X Densit fX
GX

PX = 3.0

fX(x)

Mdiane :

fX(x)

fX x

Fonction de rpartition :
ln x  O
FX x )

[
2

[ 2
2
exp O  2 exp [  1

PX = 1.0

0.2

PX = 3.0

PX

4
2

exp O  [ 2

0
0

x
Probabilits et statistiques J.-M. Bourinet 2016

0
0

112

Hypothses de la loi de Poisson ( rappel )


On considre un vnement A qui se produit compltement alatoirement
dans le temps ( ou dans lespace ), reprsents par les carrs bleus
Comme pour la loi binomiale,
on peut sintresser :

W3
W2

nbre dapparitions de A
dans lintervalle > 0,t @
X X est une v.a. discrte

T1 W1

T2

T3
t

T1

temps ( ou distance ) jusqu la


1re apparition de A

Ti

temps ( ou distance ) entre les


(i 1)me et ime apparitions de A

Wk

temps ( ou distance ) jusqu la


kme apparition de A

On va sintresser dans un
premier temps la loi de X

X T1 , Ti et Wk sont des v.a. continues


113

Probabilits et statistiques J.-M. Bourinet 2016

Dtermination de la loi exponentielle


On sintresse la loi de la v.a. T1, temps coul jusqu la 1re apparition de
lvnement A, sous lhypothse dun processus homogne de Poisson
Fonction de rpartition de T1

FT1 t

P T1 d t
P un ou plusieurs vnement(s) A dans > 0, t @
1  P zro vnement A dans > 0, t @

Or on a : P zro vnement A dans > 0, t @

P X

O t 0 exp O t

0!

do :

FT1 t 1  exp O t

et par drivation :

f T1 t O exp O t
Loi exponentielle

Rq. :

Cette loi dcrit galement le temps Ti entre les (i 1)me et ime apparitions de A
Probabilits et statistiques J.-M. Bourinet 2016

114

Loi exponentielle
Densit :

Fonction de rpartition :

f X x O exp > O x  x0 @ pour x ! x0

FX x 1  exp > O x  x0 @

PX

Moyenne :

x0 

Densit fX

x0
O

0.5
0
0

O2

Fonction de rpartition FX

0.8

FX(x)

fX(x)

1.5
1

O = 0.5
O = 1.0
O = 2.0

V X2

Variance :

0.6
0.5
0.4
0.2

1
PX

0
0

x0.51

115

Probabilits et statistiques J.-M. Bourinet 2016

Hypothses de la loi de Poisson ( rappel )


On considre un vnement A qui se produit compltement alatoirement
dans le temps ( ou dans lespace ), reprsents par les carrs bleus
Comme pour la loi binomiale,
on peut sintresser :

nbre dapparitions de A
dans lintervalle > 0,t @
X X est une v.a. discrte

T1

temps ( ou distance ) jusqu la


1re apparition de A

Ti

temps ( ou distance ) entre les


(i 1)me et ime apparitions de A

Wk

temps ( ou distance ) jusqu la


kme apparition de A

W3
W2
T1 W1

T2

T3
t

On va sintresser dans un
premier temps la loi de X

X T1 , Ti et Wk sont des v.a. continues


Probabilits et statistiques J.-M. Bourinet 2016

116

Dtermination de la loi gamma


On sintresse la loi de la v.a. Wk, temps coul jusqu la kme apparition de
lvnement A , sous lhypothse dun processus homogne de Poisson

T1  T2  !  Tk

On a : Wk

Les temps Ti suivent chacun une loi exponentielle de paramtre O et ils sont
indpendants
On montre ( par rcurrence ) que Wk suit la loi gamma de paramtres k et O

O Ot

fWk t
Rappel : * k

k 1

k 1

* k

exp O t

pour t ! 0

exp t d t

Rq. : Pour k = 1, on retrouve bien que W1 = T1 suit une loi exponentielle de


paramtre O
117

Probabilits et statistiques J.-M. Bourinet 2016

Loi gamma
Densit :

O O x

fX x

Fonction de rpartition :
J k,O x
FX x
* k
k
V X2
Variance :
2

k 1

exp O x pour x ! 0
* k
k
PX
Moyenne :

* k

Rappels :

k 1

exp t d t et J k , O x

1.5

O1

k 1

exp t d t

Fonction de rpartition FX

0.8

FX(x)

fX(x)

k = 0.5
k = 1.0
k = 2.0

Densit fX

2.5

Ox

0.6
0.5
0.4
0.2

0.5
0
0

Ox

0
0

Probabilits et statistiques J.-M. Bourinet 2016

x0.51

Ox

118

Prliminaire la loi de Weibull (1)


On suppose une variable alatoire continue T reprsentant la dure de vie
dun matriel avant dfaillance

FT t P T d t reprsente la probabilit que la dure de vie T soit plus faible


quune dure vise t, c..d. aussi la probabilit que le matriel soit en panne
linstant t
FT t reprsente la probabilit cumule de dfaillance au bout du
temps t
FT t P T d t
R t 1  FT t P T ! t reprsente la probabilit que la dure de vie T soit
plus grande quune dure vise t, c..d. aussi la probabilit que le matriel
soit en bon tat de fonctionnement linstant t
RT t reprsente la fiabilit du matriel
R t 1  FT t

P T ! t

119

Probabilits et statistiques J.-M. Bourinet 2016

Prliminaire la loi de Weibull (2)


Le taux instantan de dfaillance O au temps t reprsente la probabilit de
dfaillance par unit de temps entre les instants t et t + dt ( vnement A )
sachant la non dfaillance entre les instants 0 et t ( vnement B )

O t d t

P t  T d t  dt | T ! t

O t

d FT t
1
1  FT t d t

P t  T d t  dt
P T ! t

fT t d t
1  FT t

Bien voir que ^t  T d t  d t` ^T ! t` do


^t  T d t  d t`  ^T ! t` ^t  T d t  d t`

Pour un matriel, ce taux de dfaillance est gnralement fonction du temps :


9 Pour O diminuant avec le temps t, on parle de matriel comportement
de jeunesse ( taux de dfaillance plus important en dbut de vie donc
plus de pannes probables dans cette phase de la vie du composant )
9 Pour O augmentant avec le temps t, on parle de matriel vieillissant
ou susant ( taux de dfaillance plus important en fin de vie donc plus de
pannes probables dans cette phase de la vie du composant )
Probabilits et statistiques J.-M. Bourinet 2016

120

Prliminaire la loi de Weibull (3)


La moyenne des dures de bon fonctionnement jusqu dfaillance
( en anglais : Mean Time To Failure ou MTTF ) est dfinie comme suit :

E >T @

MTTF

f

t f t d t
T

0
f

R t d t

! Cette seconde galit


nest pas immdiate

Dm. :

E >T @

f

f

t fT t d t

d FT t
dt
dt

f

t

d R t
dt
dt

> tR t @0

f

En t = 0 :

tR t

En t = +f :

tR t o 0 pour
les lois considres
Par ex. pour Weibull :
t k
t exp  o 0
u

f

R t d t
0

o0

0 u 1 0

121

Probabilits et statistiques J.-M. Bourinet 2016

Loi de Weibull (1)


La loi de Weibull est couramment employe en fiabilit pour modliser la
dure de vie de matriels
Une variable alatoire X suit une loi de Weibull ( 3 paramtres ) ssi :

X  x0 suit une loi exponentielle

u
k

o k, u et x0 sont les paramtres de la loi de Weibull


Densit :

fX x

Fonction de rpartition :

k x  x0

u u

k 1

x  x0 k
exp 

u

pour x ! x0
Moyenne :

PX

1
u * 1   x0
k

Variance :

2
1

u * 1   * 2 1 
k
k

2
X

Probabilits et statistiques J.-M. Bourinet 2016

FX x

x  x0 k
1  exp 

u

Paramtres :
k : paramtre de forme
u : paramtre dchelle
x0 : paramtre de position
122

Loi de Weibull (2)


Densit fX

u 1
x0 0

k = 0.5
k = 1.0
k = 2.0
k = 3.0

1
0.5
0
0

Fonction de rpartition FX

0.8

FX(x)

fX(x)

1.5

0.6
0.4
0.2

0
0

Pour O constant, on prend k = 1


Cest la loi exponentielle

Si le taux de dfaillance O diminue


avec le temps t, on prend k < 1

O (x)

Si O augmente avec le temps t, on


prend k > 1

Taux de dfaillance O
k=2
taux linaire

k = 1 : taux constant

2
0
0

Probabilits et statistiques J.-M. Bourinet 2016

123

Probabilits et statistiques J.-M. Bourinet 2016

124

Vecteur alatoire

125

Probabilits et statistiques J.-M. Bourinet 2007

Vecteur alatoire
tant donn n variables alatoires relles X1, , Xn, le vecteur alatoire
T
X
X 1 ! X n est une application dfinie sur : et valeurs dans
E = `n ( vecteur alatoire discret ) ou E = \n (vecteur alatoire continu )
n
:
o\
X
Z 6 X Z

X 1 Z ! X n Z

Un vecteur alatoire X est tout simplement un vecteur dont chaque


composante X i est une variable alatoire
9 A une issue possible Z de : correspond un vecteur x de `n ou de \n
9 Les probabilits associes chaque vecteur x de `n ou de \n seront
caractrises par des lois dites conjointes
9 X ( lettre majuscule ) dsignera le vecteur alatoire, x ( lettre minuscule )
sera la valeur prise par ce vecteur ( appele aussi ralisation du vecteur
alatoire )
Probabilits et statistiques J.-M. Bourinet 2016

126

Loi conjointe dun vecteur alatoire (1)


Vecteur alatoire discret X
T
X Y
Cas n = 2 : X

p XY x, y

P X

x1  Y

y3

Vecteur alatoire continu X


T
X Y
Cas n = 2 : X

x  X d x d x

P

y Y d y d y

f XY x, y

x1
y1

y2

y yd y
y3

y4

x2

xdx
x

x3
x
p XY xi , y j
P X
p XY

xi  Y

yj

dx
dy

f XY x, y d x d y

P x  X d x  d x  y  Y d y  d y

masse conjointe ponctuelle

f XY

densit conjointe de probabilit


127

Probabilits et statistiques J.-M. Bourinet 2016

Loi conjointe dun vecteur alatoire (2)


Vecteur alatoire discret X

p XY x, y

Vecteur alatoire continu X

f XY x, y

x1
y1

y2

y yd y
y3

y4

x2

xdx
x

x3
x
Rq. : xi , y j , 0 d p XY xi , y j d 1
Les couples xi , y j forment un
systme complet dvnements

p x , y
XY

yj

dx
dy

Rq. : x, y ,

f XY x, y t 0

Les f XY x, y d x d y forment un
systme complet dvnements

xi

Probabilits et statistiques J.-M. Bourinet 2016

f x, y d x d y
XY

y x

128

Loi conjointe dun vecteur alatoire Exemples

pXY(x,y)

Vecteur alatoire discret


Lancer de 2 ds
X ( Y ) = v.a. correspondant la
valeur lue sur le 1er ( 2me ) d

 xi ^ 1, !, 6 `
 y j ^ 1, !, 6 `

p XY xi , y j

0.04
0.02
06

1
36

Vecteur alatoire continu


0.2

fUV u, v

fMUV2 (u,v)
(u,v)

Loi binormale standard


( standard = centre rduite )

u v
1
exp 
2S
2

M 2 u, v

0.1

0
2
0
v

-2

-2

129

Probabilits et statistiques J.-M. Bourinet 2016

Lois marginales dun vecteur alatoire


On appelle lois marginales les lois de probabilit de X et Y pris sparment
Vecteur alatoire discret X

Vecteur alatoire continu X

p XY x, y

f XY x, y
x1

y1

x3

y2

+x2

y
y3

y4

= P X

x3

= fX x

x
P X

xi

p X xi

p x , y
XY

yj

Loi marginale en X
Probabilits et statistiques J.-M. Bourinet 2016

fX x

f x, y d y
XY

Loi marginale en X
130

Fonction de rpartition conjointe dun vecteur alatoire


La fonction de rpartition conjointe
T
X Y
dun vecteur alatoire X
est dfinie par lexpression suivante :

FXY x, y P X d x  Y d y

Pour un vecteur alatoire continu, cest le volume sous la surface


reprsentant la densit conjointe, de moins linfini jusquaux bornes x et y
Proprits :
9 FXY x, f 0 et FXY f, y 0
9 FXY x, f FX x et FXY f, y

FXY f, f 1

FY y

131

Probabilits et statistiques J.-M. Bourinet 2016

Fonction de rpartition conjointe dun vecteur alatoire


Vecteur alatoire discret X
p XY x, y

Vecteur alatoire continu X

f XY x, y

y
y

x
x

x
FXY x, y P X d x  Y d y

p x , y

y j d y xi d x

XY

FXY x, y P X d x  Y d y
y

Fonction de rpartition conjointe

f XY x , y d x d y

f f

Fonction de rpartition conjointe


Proprits :

Probabilits et statistiques J.-M. Bourinet 2016

f XY x, y

w 2 FXY x, y
wx wy
132

Probabilits conditionnelles - Prambule


Avant dintroduire la notion de probabilit conditionnelle applique un
vecteur alatoire ( et dfinir ce quest une variable conditionne sur une
autre ), il est rappel ci-dessous les diffrentes formes de conditionnement
possible en pratique :

P A | B

9 vnement sur vnement

9 vnement sur variable alatoire

P A| X

9 Variable alatoire sur vnement

p X |A x | A

ou

f X |A x | A

FX |A x | A
p X |Y x | y

9 Variable alatoire sur variable alatoire

ou

f X |Y x | y

Sachant que Y = y
FX |Y x | y

133

Probabilits et statistiques J.-M. Bourinet 2016

Variable alatoire conditionnelle (1)


Variables alatoires discrtes
On suppose lvnement ^ Y y j ` de probabilit non nulle, i.e. pY y j z 0
On dfinit la loi conditionnelle de X sachant Y comme suit :

P X

xi | Y

yj

Sachant que Y

p X |Y xi | y j

quon rcrit :

On ne fait quutiliser que P A | B


Proprits :

p XY xi , y j

P X

xi  Y

P Y

yj

yj

yj
p XY xi , y j
pY y j

P A  B
P B

p X |Y xi | y j pY y j

Cest la relation P A  B
Probabilits et statistiques J.-M. Bourinet 2016

pY |X y j | xi p X xi
P A | B P B

P B | A P A
134

Variable alatoire conditionnelle (2)


Variables alatoires continues
On suppose vrifie la condition fY y z 0
On dfinit la loi conditionnelle de X sachant Y comme suit :

P x  X d x  d x | y  Y d y  d y

Y
Sachant que Y

f X |Y x | y

quon rcrit :

f XY x , y

Proprits :

f X |Y x | y d x

do :

P x  X d x  d x  y  Y d y  d y
P y  Y d y  d y

f XY x , y d x d y
fY y d y
f XY x , y
fY y

f X |Y x | y fY y

fY | X y | x f X x
135

Probabilits et statistiques J.-M. Bourinet 2016

Variables alatoire et thorme des probabilits totales


Thorme des probabilits totales dans le cas de v.a. continues

P A

P A | B P B
i

P x  X d x  d x

P x  X d x  d x |Y

y P y  Y d y  d y

Tous les d y

fX x d x

f XY x, y d y d x
y

f x | y d x f y d y
X |Y

do :

fX x

f x, y d y
XY

f x | y
X |Y

fY y d y

Expression donnant la densit


marginale en X en fonction de la
densit conditionnelle de X
sachant Y et de la densit
marginale en Y

Probabilits et statistiques J.-M. Bourinet 2016

136

Indpendance statistique entre 2 variables alatoires


Une variable alatoire X est dite indpendante dune autre Y s.s.i. :

xi , y j ,

Variables alatoires discrtes

x, y ,

Variables alatoires continues

p X |Y xi | y j
f X |Y x | y

p X xi
fX x

X indpendante de Y Y indpendant de X
On parlera de variables alatoires indpendantes entre elles
De la mme faon quon avait dfini auparavant la notion dvnements
mutuellement indpendants, on peut l aussi dfinir la notion de variables
alatoires mutuellement indpendantes
Si 2 variables alatoires X et Y sont indpendantes, alors :

p XY xi , y j

Variables alatoires discrtes


Variables alatoires continues

f XY x, y

p X xi pY yi
f X x fY y
137

Probabilits et statistiques J.-M. Bourinet 2016

Fonction dun vecteur alatoire


On considre n variables alatoires relles X1, , Xn et le vecteur alatoire
T
X1 ! X n
correspondant X
On considre lapplication M telle que :
m
:
o\

Z 6 Y M X Z M X 1 Z ,!, X n Z
T
Y1 ! Ym
o Y

\ n o \ m

X 6 Y M X

note :

Y M X M X 1 , !, X n est un vecteur alatoire dont la loi conjointe est


dfinie par :
n signes



Vecteurs alatoires discrets  y , P M X y ! P X x
x |M x y

n signes

Vecteurs alatoires continus  y , P M X d y

P
! f X x d x
x | M x d y

Rq. : On note x

x1 ! xn

et d x

d x1 ! d xn

Probabilits et statistiques J.-M. Bourinet 2016

138

Transformation dun vecteur alatoire continu


Dans le cas o n = m et si M est
bijective et continment diffrentiable,
on a la relation suivante :

fY y

f X x det J x , y

o x est la solution de lquation y M x , i.e. x M 1 y

1
et o J x , y est le jacobien de M , i.e. dfini par :

On crit en fait que fY y d y

J x, y

wx1
wy
1
#
wx
n
wy1

wx1
wyn

#
wxn
"

wyn
"

fX x d x

( analogie avec la relation fY y d y

f X x d x pour variables alatoires )

139

Probabilits et statistiques J.-M. Bourinet 2016

Moment dune fonction dun vecteur alatoire


Rq. : On se limitera la prsentation du cas dun vecteur alatoire continu
On considre lapplication M telle que : \ n o \

X 6 Y M X
Y M X est une variable alatoire
On dfinit le moment E >M X @ de la fonction M du vecteur alatoire X
par lesprance suivante :

E >M X @

M x f x d x
X

Rq. : On note x

x1 ! xn

et d x

d x1 ! d xn

Probabilits et statistiques J.-M. Bourinet 2016

140

Moments, moment centr dordre k dun vecteur alatoire


Rq. : On se limitera la prsentation du cas dun vecteur alatoire continu
Moments dordre k dun vecteur alatoire

E X k

x k f XY x, y d x d y

y x

Dm. :

E X k

xk f X x d x

pour la v.a. X

x k f XY x, y d x d y

y x

k
x
f
x
,
y
d
y
dx

XY
x y

k
x
f
x
,
y
d
y

d x
x y XY

k
x fX x d x
x

Moments centrs dordre k dun vecteur alatoire


k
E X  E > X @

x  P
X

f XY x, y d x d y

y x

x  P
X

fX x d x

141

Probabilits et statistiques J.-M. Bourinet 2016

Moment mixte entre 2 variables alatoires


On dfinit le moment mixte dordre 2 entre les variables alatoires X et Y
par lesprance suivante :
Variables alatoires discrtes

E > XY @

x y
i

yj

Variables alatoires continues

E > XY @

p XY xi , y j

xi

xy f XY x, y d x d y

y x

Rq. 1 : On prend M telle que : \ 2 o \

X , Y 6 Z

Probabilits et statistiques J.-M. Bourinet 2016

XY

142

Moment mixte centr entre 2 variables alatoires


Le moment mixte centr dordre 2 est connu sous le nom de covariance

Cov > X , Y @

E X  E > X @ Y  E >Y @

E > X  P X Y  PY @

Cov >x@ { Covariance de x


Variables alatoires discrtes

Cov > X , Y @

yj

 P X y j  PY p XY xi , y j

xi

Variables alatoires continues

Cov > X , Y @

x  P y  P f x, y d x d y
X

XY

y x

Relation
importante :

Cov > X , Y @

E > X  P X Y  PY @

E > XY @  P X PY
143

Probabilits et statistiques J.-M. Bourinet 2016

Proprits et relations importantes


Proprits :
9 E > aX  bY @ a E > X @  b E >Y @ o a et b dsignent des rels
9 Var > X  Y @ Var > X @  Var >Y @  2Cov > X , Y @

( voir dm. ci-dessous )

9 Cov > X , X @ Var > X @


9 Si 2 variables alatoires X et Y sont indpendantes, alors :
Cov > X , Y @ 0
E > XY @ E > X @ E >Y @
et
Dm : Var > X  Y @

2
2
E X  Y  E > X  Y @

E X 2  2 XY  Y 2  E > X @  E >Y @

E X 2  2 E > XY @  E Y 2  E > X @  2 E > X @ E >Y @  E >Y @


2

Var > X @  Var >Y @  2Cov > X , Y @


Probabilits et statistiques J.-M. Bourinet 2016

144

Corrlation entre 2 variables alatoires


Le coefficient de corrlation entre 2 variables alatoires X et Y est not U XY
et sobtient partir de la relation suivante :

U XY

Cov > X , Y @

Cov > X , Y @

Var > X @Var >Y @

V XVY

Proprits :
9 On montre que : 1 d U XY d 1
9 Si U XY 1 ou U XY 1 , alors il existe une dpendance linaire entre les
variables X et Y
On peut alors mettre Y sous la forme dune fonction linaire de X ( ou
inversement ) : Y aX  b
U XY r1 suivant le signe de b
9 U XY et a fortiori Cov > X , Y @ sont des mesures de la dpendance linaire
entre les variables
145

Probabilits et statistiques J.-M. Bourinet 2016

Approximation des moments dune fonction non linaire


On considre une fonction
non linaire M telle que :
On note : M X

PX

\ n o \

X 6 Y M X

! PXn

wM

1 wX i X

Y
Dveloppement
en srie de Taylor

X1 ! X n

avec X

M M X 
i

 PXi

MX

1 n n w 2M


2! i 1 j 1 wX i wX j X

 PXi X j  P X j

MX

 !
9 Approximations des moments lordre 1

PY

E >Y @  M M X

V Y2 Var >Y @ 

wM

1
i X

wX
i 1 j

MX

wM

wX j X

UX X V X V X
i

MX

Probabilits et statistiques J.-M. Bourinet 2016

146

Vecteurs alatoires Exemples ( cas continu )

147

Probabilits et statistiques J.-M. Bourinet 2007

Vecteur alatoire continu Exemple 1


On considre 2 variables alatoires continues X et Y indpendantes de
densits marginales respectives f X x et fY y
9 Trouver la densit f Z z de la v.a. Z
La relation gnrale  y , P M X d y

X Y

M
x|

z, P Z d z

f XY x, y d x d y

z, P Z d z

On pose

z, P Z d z

scrit :

x d y

Bien voir quon cherche


caractriser FZ en non f Z

x , y | x yd z

f
x
,
y
d
x


d y
y xdz y XY

fX x d x

On intgre sur tous les y du


domaine de dfinition de Y
et sur les x du domaine de
dfinition de X tels que x d z  y

x  y et lexpression devient :

tdz

f XY t  y , y d t d y

Probabilits et statistiques J.-M. Bourinet 2016

148

Vecteur alatoire continu Exemple 1 ( suite )


9 Trouver la densit f Z z de Z

X  Y ( suite )

z, P Z d z

f
t
y
,
y
d
t


d y
XY
y tdz

z, P Z d z

f
t
y
,
y
d
y


d t
XY
td z y

On a P Z d z

FZ z

f t d t

On inverse lordre dintgration

fZ t

do

tdz

fZ t

f XY x, y

f t  y f y d y
X

XY

X et Y sont indpendantes, on a donc :


On ainsi :

f t  y, y d y
f X x fY y

Convolution de f X et fY

Pas sur tous les y du domaine de dfinition de Y mais en ralit


sur ceux tels que t  y appartienne au domaine de dfinition de X
149

Probabilits et statistiques J.-M. Bourinet 2016

Vecteur alatoire continu Exemple 1 ( application )


Soient X  N P X , V X et Y  N PY , V Y deux v.a. normales et indpendantes
9 Quelle est la densit f Z z de Z

X Y

X  Y sobtient partir de lexpression suivante :


1 t  y  P 2
1 y  P 2
1
1
X
Y
exp 
exp 

dy
V X 2S
V Y 2S
2 V X
2 V Y

La densit de Z

fZ t

f

f

Aprs calculs ( formels


sous Matlab ), on trouve :

fZ t

V X2  V Y2
Z

t  P  P 2
X Y
1
exp 

2
2
2
2S

V
V

X
Y

X  Y  N P X  PY , V X2  V Y2

On a montr que :
1) Z X  Y suit une loi normale
2) cette loi a pour moments PZ P X  PY et V Z2
Probabilits et statistiques J.-M. Bourinet 2016

V X2  V Y2
150

Vecteur alatoire continu Exemple 1 ( remarques )


Remarque 1
Les moments de Z X  Y pouvaient tre dtermins sans avoir
chercher la loi de Z. On a effectivement :
=0

PZ

E >Z @

E > X @  E >Y @

V Z2 Var > Z @ Var > X @  Var >Y @  2Cov > X , Y @

et

P X  PY

V X2  V Y2

X et Y sont
indpendantes

Remarque 2
On utilise plutt les fonctions caractristiques ( non prsentes dans le
cadre de ce cours ) pour montrer la proprit essentielle que la somme
de 2 variables alatoires normales et indpendantes suit une loi normale
Remarque 3
De manire gnrale, on peut montrer que toute combinaison linaire
de variables alatoires normales et indpendantes suit une loi normale
151

Probabilits et statistiques J.-M. Bourinet 2016

Vecteur alatoire continu Exemple 1 ( suite remarques )


Remarque 4
!
fX x

La somme de 2 ( ou plus de 2 ) variables alatoires indpendantes de


mme loi ne suit gnralement pas la mme loi que ces variables
fZ z
1
d c

1
ba

Cas
ba  d c

X
ac bc

fY y

1
ba

1
ba

Y
c

Probabilits et statistiques J.-M. Bourinet 2016

z
Cas
ba d c

ac

1
d c

ad bd

ad bd
bc

z
Cas
ba ! d c

ac ad

bc bd

z
152

Vecteur alatoire continu Exemple 2


Densit conjointe

fXY(x,y)

Pour x, y rels t 1, on donne :

1
2 2
x y

f XY x, y

0.5

0
1

9 X et Y sont-elles des variables


alatoires indpendantes ?

fX x
Calcul des
densits
marginales
en X et Y

fY y

f

f XY x, y d x

x
1

4 4

1
f

1
dy
x2 y2

1
x2
f X x fY y

3
y

f XY x, y d y

1
f

f XY x, y

On a

f

1
dx
y2

1
y2
donc X et Y sont indpendantes
153

Probabilits et statistiques J.-M. Bourinet 2016

Vecteur alatoire continu Exemple 2 ( suite )


Changement de variable U

fUV u, v

9 Montrer que :
On a :

UV

La relation fY y

On a :

J xy ,uv

wx
wu

wy
wu

et

X
Y

XY et V

1
2u 2 v

pour u t 1 et

\2 o \2
X U
o
Y V

1
dvdu
u

U
V

f X x det J x , y devient ici : fUV u, v


wx
wv

wy
wv

M:

v
1 u

2 1

uv

f XY x, y det J xy ,uv

u
v
u 1

v v

Probabilits et statistiques J.-M. Bourinet 2016

154

Vecteur alatoire continu Exemple 2 ( suite )


do :

fUV u, v

fUV(u,v)

0.4

1 1 1
 
4 v v
2 u
uv

v
1
2u 2 v
1

0.2
0
0
2
00
u 44

Calcul du domaine de dfinition de la densit conjointe fUV u, v

x t1
y t1

y
u

x, y
1

xy

do u t 1

uv t 1 do

1
dv
u

u
t 1 do
v

vdu

u, v

1
1

u
155

Probabilits et statistiques J.-M. Bourinet 2016

Vecteur alatoire continu Exemple 2 ( suite )


9 U et V sont-elles des variables alatoires indpendantes ?

fU u

Calcul des
densits
marginales
en U et V

f u, v d v
UV

1
u
u

1
1 2u 2 v d v
u

ln u
u2
fU u fV v

fV v

f

fUV u, v d u

1
f

1
du
2u 2 v

1
2v

ln u
2u 2 v

fUV u, v z fU u fV v donc U et V ne sont pas indpendantes

Probabilits et statistiques J.-M. Bourinet 2016

156

Introduction aux statistiques

Probabilits et statistiques J.-M. Bourinet 2007

157

Problme type en statistiques


Problme 1
Le responsable dun atelier de fabrication cherche vrifier si les pices
produites par une machine sont conformes aux spcifications demandes
par le client ( ex. : longueur comprise dans un intervalle de tolrance )
X Prlvement au hasard de quelques pices ( chantillon )
X Mesure de ces pices ( estimation des proprits de lchantillon )
X En fonction des mesures effectues, il considre que lensemble de sa
production ( population ) est satisfaisante ou pas et prendra une
dcision ( ex. : rglage de la machine ou non )
Problme 2
Un cuisinier cherche savoir si sa sauce est suffisamment sale
X Aprs avoir bien remu, il prlve une cuillre ( chantillon )
X Il la gote ( estimation des proprits de lchantillon )
X En fonction du got de cette cuillre, il considre que lensemble de
sa sauce ( population ) est suffisamment sale ou pas et prendra la
dcision de resaler ou pas
Probabilits et statistiques J.-M. Bourinet 2016

158

Dmarche gnrale, outils / mthodes mettre en uvre


De manire assez gnrale, une tude statistique consistera obtenir des
informations sur un caractre concernant une population de grande taille
en sappuyant sur celles dun sous-ensemble de taille beaucoup plus petite
appel chantillon, afin le plus souvent dorienter une dcision
Choix de lchantillon ( chantillonnage, tirage, sondage )
X Tirage avec ou sans remise
X Tirage uniforme ( dit aussi au hasard ) ou non uniforme ( tirage stratifi
dans le cas dun sondage lectoral, par exemple )
Estimation des proprits dun caractre de lchantillon
A partir des proprits de lchantillon, on cherchera donner au mieux
des valeurs aux paramtres de la population ( ex. : moyenne, cart-type )
X Estimations ponctuelles ou par intervalles de confiance
On pourra galement sintresser la loi suivie par la population
X Tests dajustement ( dit aussi dadquation ) une loi de type donn
Critres de prise de dcision
X Tests statistiques
Probabilits et statistiques J.-M. Bourinet 2016

159

Vocabulaire et dfinitions (1)


Population / Individu
Population = ensemble de cardinalit finie ou infinie
Individu = tout sous-ensemble de cardinalit 1
Ex. 1 : Population = toutes les pices pouvant tre produites
par une machine
Individu = chaque pice
Ex. 2 : Population = ensemble des votants en France
Individu = chaque votant
Taille de la population ( note N ) / de lchantillon ( note n )
Nombre dindividus dans la population / dans lchantillon

Probabilits et statistiques J.-M. Bourinet 2016

160

Vocabulaire et dfinitions (2)


Caractre quantitatif / Caractre qualitatif
Nature de la caractristique laquelle on sintresse statistiquement
9 Caractre quantitatif : les valeurs possibles sont comparables et
sont formulables numriquement
9 Caractre qualitatif : caractre non quantitatif, souvent associ
une caractristique de type espce, genre,
Ex. :

Une cote de la pice, nombre denfants = Caractres quantitatifs


Le candidat pour lequel le votant a vot = Caractre qualitatif

Caractre discret / Caractre continu


9 Caractre discret : les valeurs possibles sont discrtes
9 Caractre continu : les valeurs possibles sont continues
Ex. :

Nombre denfants par couple = Caractre discret


Consommation annuelle de carburant par automobiliste =
Caractre continu

Probabilits et statistiques J.-M. Bourinet 2016

161

Choix de lchantillon
Tirage avec / sans remise
Chaque individu de lchantillon est slectionn par tirage avec ou sans
remise
Il est intuitif de saisir quil ny a que peu de diffrences entre ces 2
mthodes quand la taille de la population devient grande ( N  n )
Tirage uniforme / non uniforme ( chantillonnage stratifi )
Un tirage uniforme consiste tirer au hasard n individus dans une
population de taille N, le tirage tant ralis avec ou sans remise
Lorsquon dispose dinformations ( fiables ! ) sur la composition dune
population, on peut amliorer considrablement la prcision des
estimations en prlevant au hasard dans des sous-ensembles disjoints
de la population ( quon appelle des strates )
On parle de tirage stratifi ( cest un tirage non uniforme )
Ex. :

Prendre les 2 strates hommes / femmes pour faire une tude


statistique sur le poids ou la taille des franais

Probabilits et statistiques J.-M. Bourinet 2016

162

Srie statistique simple, double ou multiple


Srie statistique simple
Ensemble de donnes relatives un unique caractre dun chantillon
Ex. :

Nombre de dchets jets par les habitant dune ville


Volume de vin bu quotidiennement par les franais

Srie statistique double


Ensemble de donnes relatives deux caractres dun chantillon
Ex. :

Module dYoung et limite dlasticit dun matriau donn

Srie statistique multiple


Ensemble de donnes relatives plusieurs caractres dun chantillon
Ex. :

Temprature, salinit, concentration en sels nutritifs, chlorophylle A


et phnopigments des eaux du littoral franais

Probabilits et statistiques J.-M. Bourinet 2016

163

Prsentation dune srie statistique simple


On sintresse une unique variable note X reprsentant le caractre des
individus dune population
On considre que lon dispose de n valeurs x1, x2, , xn donnant le caractre
des individus dun chantillon de taille n pris parmi cette population
On note K le nombre de valeurs distinctes pouvant tre prises par le caractre
La description des donnes ( = srie statistique simple ) se fait comme suit :
Cas n faible et caractres distincts pour chaque individu
On utilise le n-uplet x1 , x2 , ! , xn o xi est le caractre du ime individu
Cas K faible, plusieurs individus pouvant prendre le mme caractre
On utilise les couples xk , nk o nk est le nombre dindividus prenant le
caractre xk , pour k 1 , 2 , ! , K
Cas n et K grands
On utilise les couples classe-frquence > xk 1 , xk > , nk o nk est le
nombre dindividus prenant un caractre compris entre les valeurs xk1 et
xk
Probabilits et statistiques J.-M. Bourinet 2016

164

Statistique descriptive / Statistique infrentielle


Deux branches majeures sont distingues dans le domaine des statistiques :
la statistique descriptive
Lobjectif est de dcrire le caractre dun chantillon en rsumant
linformation quil contient sous la forme :
9 de tableaux ou graphiques ( histogrammes, courbes, secteurs,
nuages de points, etc. )
9 de grandeurs numriques caractristiques : mode, mdiane,
moyenne arithmtique, variance estime, corrlation estime, etc.
la statistique infrentielle ( ou inductive )
Lobjectif est dinfrer ( i.e. dinduire ), partir de linformation recueillie
sur lchantillon, des proprits valables sur toute la population, de
la manire la plus fiable possible
!

Infrence / induction :
Dduction :

Particulier X Gnral
Gnral X Particulier

Probabilits et statistiques J.-M. Bourinet 2016

165

Statistique descriptive
dune srie statistique simple

Probabilits et statistiques J.-M. Bourinet 2007

166

Distribution des frquences


Frquence absolue associe la valeur xk ( ou la classe > xk 1 , xk > )
= Nombre nk dindividus de lchantillon ayant le caractre xk ( ou un
caractre appartenant lintervalle > xk 1 , xk > )
Frquence relative associe la valeur xk ( ou la classe > xk 1 , xk > )
= Rapport nk n o n dsigne la taille de lchantillon
!

Les xk doivent tre ordonns

Aire proportionnelle nk

x2  x1
nk xk  xk 1
n1 x1  x0

n2

n2

nk
nK
n1
x1 x2

xk

xK

x0

x1 x2

xk 1 xk

Diagramme de frquences
( ici absolues ) en btons

Histogramme de frquences
( ici absolues )

Rq. : pour une srie discrte

Rq. : plutt pour sries continues


167

Probabilits et statistiques J.-M. Bourinet 2016

Frquences cumules
Frquences absolues cumules infrieures la valeur xk ( ou des k  1
premires classes )
k 1
= Nombre dindividus de lchantillon ayant
= ni
i 1
un caractre strictement infrieur xk ( ou
un caractre appartenant lintervalle @f, xk > )
k 1
n
Frquences relatives cumules infrieures la valeur xk = i
i 1 n
( ou des k  1 premires classes )
!
k

i 1

n1  n2
n1

Les xk doivent tre ordonns


k

k 1

i 1

n1  n2
n1

ni

On suppose une rpartition


uniforme par classe

i 1

k 1

i 1

x
x1 x2 xk 1 xk xK
x0 x1 x2 xk 1 xk
xK x
Frquences cumules ( ici absolues ) Frquences cumules ( ici absolues )
pour une srie discrte
pour une srie continue par classes
Probabilits et statistiques J.-M. Bourinet 2016

168

Analogie avec loi et fonction de rpartition ( cas discret )


pX x

n2 n

3 10 3 10
2 10

nk n
nK n
n1 n

1 10

x
x1 x2

xk

xK

Histo. des frquences relatives

1
ni n

k 1

n1  n2 n
n1 n

x1

x2

x3 x4

x5

Masses ponctuelles de probabilit

FX x
1

i 1

1 10

9 10
7 10

i 1

4 10

1 10

x1 x2

x
x1 x2
xk x K
Histo. des frquences relatives cumules

x3 x4

x5

Fonction de rpartition
169

Probabilits et statistiques J.-M. Bourinet 2016

Choix du nombre de classes


Difficults pour le choix de la taille des classes dans le cas de sries continues
9 Trop larges X perte dinformation, des dtails pouvant tre dissimuls au
sein dune mme classe
9 Trop troites X incohrence du graphique, des classes pouvant devenir
vides ou presque
Rgle de Yule

Rgle de Sturges

Nombre optimal
de classes K
( rgle empirique )

1

10
log10 n
3

10 14
n
4

Ex. : chantillon de n = 50 valeurs reprsentant le montant dachats de clients

10

20

40
60
80
Montant de l'achat

100

K = 7 classes

15
10
5
0
0

20

40
60
80
Montant de l'achat

Probabilits et statistiques J.-M. Bourinet 2016

100

Frquences absolues

K = 3 classes
20

0
0

20

Frquences absolues

Frquences absolues

30

K = 30 classes

6
4
2
0
0

20

40
60
80
Montant de l'achat

100

170

Rsums numriques
Caractristiques de position ( dite aussi de tendance centrale )
9 Moyenne arithmtique
9 Mdiane
9 Mode
Caractristiques de dispersion
9
9
9
9

tendue ( ou amplitude de variation )


Variance
cart-type
Fractile (dits aussi quantiles)
( quartiles, dciles, centiles )

position

Caractristiques de forme
9 Coefficient dasymtrie
9 Coefficient daplatissement

asymtrie
aplatissement

dispersion
171

Probabilits et statistiques J.-M. Bourinet 2016

Position : Moyenne arithmtique


La moyenne arithmtique x dune srie statistique est le barycentre des xk
( des classes > xk 1 , xk > ) pondrs par les frquences relatives nk / n
srie discrte

srie par classes

1 K
nk xk
nk1
x

Cas xi distincts :

x x
1 K
nk k 1 k

2
nk1

Proprits :

1 n
xi
ni1

Prendre le centre des


classes revient supposer
l encore une rpartition
uniforme par classe

9 Si la distribution est dissymtrique, la moyenne arithmtique reprsente


mal la valeur centrale
9 La moyenne arithmtique est sensible aux valeurs extrmes
9 La somme des carts la moyenne est plus faible que la somme des
carts la mdiane ou au mode X utilisation pour le calcul de la variance
Probabilits et statistiques J.-M. Bourinet 2016

172

Position : Mdiane (1)


La mdiane x0.5 dune srie statistique est la valeur de la variable x qui
spare la srie statistique ordonne en deux groupes deffectifs gaux
x0.5 = Toute valeur de > xk 1 , xk > tel que reprsent
ci-dessous sur les histogrammes des
frquences relatives cumules

srie discrte

0.5

0.5
x

xk 1 xk
Cas xi distincts : x0.5

x0.5

x n 1 / 2

xk 1 xk
si n impair

xn / 2  xn / 21
si n pair
2

Chaque frquence
relative vaut alors 1 n
173

Probabilits et statistiques J.-M. Bourinet 2016

Position : Mdiane (2)


srie par classes

1
!

Faire une interpolation linaire


entre les 2 extrmits de lintervalle
revient l encore supposer une
rpartition uniforme par classe

0.5

x0.5

Proprits :
9 La mdiane est, contrairement la moyenne arithmtique, peu sensible
aux valeurs extrmes

Probabilits et statistiques J.-M. Bourinet 2016

174

Position : Mode, classe modale


Pour une srie discrte, le mode xmax est la valeur de la variable x pour
laquelle la frquence est maximale
Pour une srie par classes, la classe modale est la classe pour laquelle la
frquence est maximale
Proprits :
9 Pour dcrire une srie peu homogne, il vaut mieux donner un mode et
des modes secondaires quune moyenne ou une mdiane
9 Le mode est peu sensible aux valeurs extrmes
9 Le mode est extrmement sensible au choix des bornes des intervalles
de classes

175

Probabilits et statistiques J.-M. Bourinet 2016

Dispersion : Variance estime, cart-type estim


La variance estime s X2 dune srie statistique sur un chantillon de taille n
est dfinie par :
srie discrte

2
1 K
nk xk  x

nk1

s X2

srie par classes

2
X

Cas xi distincts :

1 K xk 1  xk
 x
nk

2
nk1

s X2

2
1 n
xi  x

ni1

sx est appel cart-type estim


Dans le cas de xi distincts, on prfre
souvent utiliser lexpression suivante :
On introduit galement la
variance estime corrige,
dfinie par :

s X 2

2
X

2
1 n 2
xi  n x

n i 1

n 2
sX
n 1

2
1 n
xi  x

n 1 i 1

On justifiera le choix de ce terme n  1


au dnominateur en infrence statistique

Probabilits et statistiques J.-M. Bourinet 2016

176

Dispersion : Coefficient de variation, tendue


Le coefficient de variation est le rapport entre lcart-type estim et la
moyenne arithmtique
Sans unit, il permet de comparer des distributions de frquences dunits
diffrentes. Il nest pas employ si la moyenne est proche ou gale 0

sX
x
Ltendue ( ou amplitude de variation ) est la diffrence entre les valeurs
maximale et minimale de la srie statistique

max xi  min xi
i

Probabilits et statistiques J.-M. Bourinet 2016

177

Position, dispersion : Fractile dordre D


Le fractile dordre D dune srie statistique est la valeur xD de la variable x
qui spare la srie statistique ordonne en deux groupes deffectifs respectifs
D n et 1  D n

D reprsente donc la proportion des individus de lchantillon ayant un


caractre x infrieur la valeur xD
4 classes deffectifs gaux X Quartiles ( x0.25 , x0.5 , x0.75 )
Domaine interquartiles = IQR = x0.75 x0.25
10 classes deffectifs gaux X Dciles ( x0.1 , x0.2 , , x0.80 , x0.90 )
100 classes deffectifs gaux X Centiles ( x0.01 , x0.02 , , x0.98 , x0.99 )
Proprits :
9 Les fractiles sont peu sensibles aux valeurs extrmes
9 Les positions relatives des diffrents fractiles donnent une ide sur la
symtrie / lasymtrie de la srie

Probabilits et statistiques J.-M. Bourinet 2016

178

Forme : Moments dordre suprieur


On dfinit le moment centr dordre p dune srie statistique par :
srie discrte m p

p
1 n
nk xk  x

nk1

srie par classes m p

Cas xi distincts : m p

x x
1 n
nk k 1 k  x

2
nk1

p
1 n
xi  x

ni1

La forme de la srie statistique peut tre galement caractrise par :


m3
J3
9 Le coefficient dasymtrie
s 3X
9 Le coefficient daplatissement
( ou kurtosis )

J4

m4
s X4

179

Probabilits et statistiques J.-M. Bourinet 2016

Forme : Asymtrie, aplatissement


Asymtrie
Asymtrique gauche

Symtrique

J3  0

x  x0.5  xmax
Aplatissement

J3

x  x0.5  xmax

Asymtrique droite

J3 ! 0

xmax  x0.5  x

Le coefficient daplatissement donne une mesure de la concentration


dans la zone centrale par rapport celle des extrmits.
Il permet de juger si lhistogramme est plus ou moins aplati que celui
relatif la loi normale pour lequel J 4 3

J 4 ! 3 X plus pointu que la loi normale


J 4  3 X plus plat que la loi normale
Probabilits et statistiques J.-M. Bourinet 2016

180

Statistique descriptive
dune srie statistique double

Probabilits et statistiques J.-M. Bourinet 2007

181

Prsentation dune srie statistique double


On sintresse aux variables note X et Y reprsentant 2 caractres des
individus dune population
On considre que lon dispose de n couples de valeurs (x1, y1) , (x2, y2), ,
(xn, yn) donnant les 2 caractres des individus dun chantillon de taille n
pris parmi cette population
Afin de dterminer sil existe une liaison entre X et Y, on reprsente chaque
couple (xi, yi) dans le plan cartsien (x, y)

Probabilits et statistiques J.-M. Bourinet 2016

182

tude graphique de la corrlation

Absence de liaison

Corrlation linaire positive

Corrlation non linaire

Il y a corrlation sil y a dpendance en moyenne :


X = x fix, la moyenne Y est fonction de x
Si cette dpendance de Y est linaire en fonction de x, on est en prsence
dune corrlation linaire

Probabilits et statistiques J.-M. Bourinet 2016

183

Corrlation et indpendance
!

La non-corrlation nimplique pas ncessairement lindpendance


mais lindpendance implique la non corrlation

La corrlation nimplique pas ncessairement la dpendance

En 1957, une enqute statistique dans 22 pays a montr quil y avait un lien
entre le rgime alimentaire et les maladies cardio-vasculaires
En 1965, on a remplac les donnes concernant le rgime alimentaire par
celles faisant tat de la possession ou non dun tlphone la maison
On a trouv que la corrlation entre possder un tlphone et avoir une
maladie cardio-vasculaire tait plus importante que celle entre manger gras
et avoir une maladie cardio-vasculaire !!!
Ne pas dduire quune corrlation entre 2 variables implique une
relation de causalit entre ces 2 variables

Probabilits et statistiques J.-M. Bourinet 2016

184

Covariance estime, coefficient de corrlation estim


La covariance estime s XY dune srie statistique double sur un chantillon
de taille n est dfinie par :

s XY

1 n
xi  x yi  y
ni1

s XY

ou

1 n

xi yi  n x y

n i 1

Le coefficient de corrlation estim rXY dune srie statistique double sur un


chantillon de taille n est dfinie par :

rXY

s XY
s X sY

Coefficient de
Bravais-Pearson

Le coefficient de corrlation estim corrig est dfinie par :


1 n


xi yi  n x y
o s XY


n 1 i 1
s XY


rXY

n
s X sY
2
2
1
1 n 2
2
2
2
xi  n x
sY
yi  n y
et s X

n 1 i 1
n 1 i 1

Probabilits et statistiques J.-M. Bourinet 2016

185

Coefficient de corrlation
Remarque :
La coefficient de corrlation estim reprsente le cosinus de langle form
entre les 2 vecteurs de \ 2 suivants :

x1  x
y1  y

# et #
x  x
y  y
n

Do la proprit essentielle suivante :

1 d rXY d 1

Probabilits et statistiques J.-M. Bourinet 2016

186

Rgression linaire
La rgression linaire de Y en X consiste ajuster une fonction linaire au
nuage de points (xi, yi), au sens des moindres carrs :

1 n 2
min eRi
a ,b n
i 1
La solution de ce problme
doptimisation est :

1 n
2
min > yi  axi  b @
a ,b n
i 1
a

s XY
s X2

sY
sX

rXY

et

y  ax

y
yi

eRi

ax  b

xi

187

Probabilits et statistiques J.-M. Bourinet 2016

Variances marginale, rsiduelle et explique


Variance marginale VY
2
1 n
VY sY2
yi  y

ni1

Variance rsiduelle VR

VR

1 n 2
eVi
ni1

VE

9 On a :
do :

VY
VE
2
XY

VE  VR

1 n 2
eEi
ni1

2
1 n
axi  b  y

ni1

y
yi

2
s XY
s X2
2
s XY
s X2 sY2

1 n
2
> yi  axi  b @

ni1

Variance explique VE

Proprits :
9 On a :

1 n 2
eRi
ni1

eVi
VE
VY

Probabilits et statistiques J.-M. Bourinet 2016

ax  b

eEi

VE d VY  1 d rXY d 1

eRi

xi

x
188

Statistique infrentielle

189

Probabilits et statistiques J.-M. Bourinet 2007

Introduction Lanc dun d (1)


Ralisations associes 30 jets successifs dun
mme d non pip, notes x1, , xn , avec n = 30

1
2
3
4
5
6

On parlera de ralisation dun chantillon


not X1, , Xn
On note :

1 n
xi
ni1

moyenne arithmtique
de lchantillon

10

3.8000

0.4

15

20

10

Histogramme des
frquences relatives
la valeur xk = k

0.3

fk

25

nk
n

0.2
0.1
0

PX

0
30

Probabilits et statistiques J.-M. Bourinet 2016

3.5
190

Introduction Lanc dun d (2)


On rpte m fois ces 30 jets
successifs dun mme d,
avec ici m = 10

x1

On obtient 10 chantillons
diffrents
10 x1 diffrents

xi
5

10 xi diffrents
pour chaque i

10

10

15
10
5
0

10
5
0

20

12

25
34

56

78

15

12

25
34

30

910

1
2
3
4
5
6

20

56

78

30

910

191

Probabilits et statistiques J.-M. Bourinet 2016

Introduction Lanc dun d (3)


0.5

Chaque xi sera vu comme la ralisation


dune variable alatoire Xi

0.4

X1

0.3
0.2

Chaque Xi sera appele un individu

0.1
0

0.5

Les Xi seront des variables


alatoires de mme distribution
( variables alatoires dites
identiquement distribues )
et gnralement supposes
mutuellement indpendantes

0.4

Xi

0.3

0.2
0.1

10

15

Loi de X
10
5
0

0.2
0.15

pX(k)

Cette distribution est


celle de la variable
alatoire parente X

20

25

0.1

12
0.05
0

Probabilits et statistiques J.-M. Bourinet 2016

34

56

78

910

1
2
3
4
5
6

30

192

Introduction Lanc dun d (4)


En rptant m = 10 fois les 30 jets
successifs, on obtient m valeurs x
1
2
3
4
5
6

Chaque x sera vu
1 n
X
comme la ralisation
Xi
ni1
de la variable alatoire
X sera appele une statistique
( elle sera appele moyenne empirique
et on montrera que cest un estimateur
de la moyenne de X )

10

j 1

15
10
5
0

20

12

25
34

56

78

910

3.8000

3.1000

0.4

0.4

0.4

0.3

0.3

0.3

0.2

0.2

0.2

0.1

0.1

0.1

3
3.6333

30
0

193

Probabilits et statistiques J.-M. Bourinet 2016

Introduction Lanc dun d (5)


On rpte m = 100000 fois les n jets successifs, on obtient m valeurs x
On reprsente la distribution des x obtenus sous la forme dun histogramme
des frquences absolues ( 20 classes de largeurs gales )
P X 3.5
P X 3.5
P X 3.5
4

x 10

x 10

1.5

1.5

1.5

0.5

0.5

0.5

0
2

30 , m 100000

0
2

n 100 , m 100000

x 10

0
2

500 , m 100000

La moyenne de la v.a. X tend bien vers la moyenne de X


X La statistique X est bien un estimateur de la moyenne
Plus la taille de lchantillon est grande, plus la dispersion de X est faible
La loi de X semble tre normale ( elle lest et ce nest pas un hasard !!! )
Probabilits et statistiques J.-M. Bourinet 2016

194

Introduction Lanc dun d (6)


n x  nP X
avec P X
VX n

On reprsente cette fois lhistogramme u


des frquences absolues de la quantit :
0

x 10

x 10

1.5

1.5

1.5

0.5

0.5

0.5

0
-4

-2

0
-4

30 , m 100000

-2

n 100 , m 100000

7
et V X
2
0

35
12

x 10

0
-4

-2

500 , m 100000

n X  nP X
tend bien vers 0
VX n
La loi semble l aussi normale et de variance constante, quel que soit n
X On montrera que cette v.a. tend vers la loi normale centre rduite
( ce sera le thorme central-limite, essentiel en statistiques )
La moyenne de la v.a. U

Probabilits et statistiques J.-M. Bourinet 2016

195

Introduction Dure de vie dune ampoule (1)


On prlve au hasard n = 30 ampoules dans
une production
0

On suppose les conditions de fabrication


identiques pour toutes ces ampoules
On mesure leur dure de fonctionnement x

10

Problme :
15

20

Sur la base des mesures ralises sur cet


chantillon de taille restreinte, peut-on
caractriser la dure de fonctionnement
de lensemble de la production ?

x 10
4

25

2
0
30

N.B. : Pour la simulation des dures, on suppose que la


variable alatoire parente X ( exprime en h )
suit une loi exponentielle de paramtre O = 104 /h

Probabilits et statistiques J.-M. Bourinet 2016

196

Introduction Dure de vie dune ampoule (2)


-4

x 10

fX(x)

0.8

x1

X1

0.6

0.2
0
0

-4

moyenne arithmtique
de lchantillon

0.4

x 10

fX(x)

0.8

x10

10

X 10

0.6
0.4

0.2
0
0

-4

15

1 n
xi
ni1

x 10

x 10

0.7178 u 104 h
20

x 10

x20

20

fX(x)

0.8

0.4

10

0.2

0
0

x 10

-4

25

15

X 20

0.6

x 10

x 10

0.8

x30

30

fX(x)

0
0

X 30

0.6

0.2
0
0

6
4

x 10

0.4

4
x

PX

6
4

x 10

104 h
197

Probabilits et statistiques J.-M. Bourinet 2016

Introduction Dure de vie dune ampoule (3)


En prlevant m = 10 chantillons de
30 ampoules, on obtient m valeurs x
Chaque x est vu
1 n
X
comme la ralisation
Xi
ni1
de la variable alatoire
( X sera appele moyenne empirique et
on montrera que cest un estimateur de
la moyenne de X )

10

j 1
15
x 10
10
5
0

20

0.7178 u 104

20

15

15

10

10

0.8403 u 104

20

x 1.1053 u 104
15

10

12

25
34

56

78

910

30

0
0

6
4

0
0

x 10

Probabilits et statistiques J.-M. Bourinet 2016

6
4

x 10

0
0

6
4

x 10

198

Introduction Dure de vie dune ampoule (4)


En supposant quon rpte m = 100000 fois ce prlvement de n ampoules
dans la production, on obtient alors m valeurs x

n x  nP X
On reprsente lhistogramme des
u
frquences absolues de la quantit :
VX n
0
0
4

1.5

1.5

0.5

0.5

0.5

-2

0
-4

30 , m 100000

x 10

1.5

0
-4

et V X

x 10

avec P X

-2

x 10

0
-4

n 100 , m 100000

-2

500 , m 100000

La loi de U tend l aussi vers la loi normale centre rduite, quel que soit n
( thorme central-limite ). Ce rsultat ne dpend pas de la loi de X,
pourvu que n soit suffisamment grand ( n > 30 environ en pratique )
199

Probabilits et statistiques J.-M. Bourinet 2016

Introduction Dure de vie dune ampoule (5)


Pour des chantillons de faible taille ( n petit ), les conditions dapplication
du thorme central-limite ne sont pas vrifies ( n grand ) et il nest pas
vident de dterminer la loi de X
On sait ici que la somme de n v.a. de loi exponentielle de mme
paramtre O est une v.a. de loi Gamma de paramtres n et O
( Rq. : la loi Gamma a t dfinie de cette manire dans le cours )
La densit de n X scrit
donc sous la forme :
Et celle de U

fU u V X

fn X n x

O On x
* n

n 1

exp O n x

n X  nP X
scrit donc comme suit :
VX n

O O n P X  uV X n
n
* n

On utilise la relation

n 1

fU u

Probabilits et statistiques J.-M. Bourinet 2016

exp O n P X  uV X n
d n x u
fn X n x u
du
200

Introduction Dure de vie dune ampoule (6)

fU u

et V X

nu n
* n

Loi normale
centre rduite

0.4

n 1

0.2

exp  n  u n

0
-4
4

n=2
n=5
n = 30

fU(u)

PX

x 10

0
u

-2

x 10

x 10

2.5
2
1.5

1.5

1.5

0.5

0.5

1
0.5
0
-4

-2

0
-4

2 , m 100000

-2

5 , m 100000

0
-4

-2

30 , m 100000

Probabilits et statistiques J.-M. Bourinet 2016

201

Retour sur lchantillonnage et la statistique descriptive


En supposant que lchantillon soit prlev par tirage alatoire,
chaque xi sera vu comme la ralisation dune variable alatoire Xi
( de mme distribution que celle de la variable parente X , on parle
de v.a. identiquement distribues ) et ces variables alatoires Xi
seront considres comme mutuellement indpendantes
T

Le vecteur x1 x2 ! xn
o xi est le caractre du ime individu sera ainsi
T
vu comme la ralisation du vecteur alatoire X 1 X 2 ! X n
chantillon alatoire X 1 , X 2 , ! , X n chantillon empirique x1 , x2 , ! , xn
Chaque quantit vue en statistique descriptive sera considre comme une
variable alatoire en statistique infrentielle qui sera fonction des Xi ( ces
quantits seront alors appeles des statistiques )
1 n
x
X
Exemple :
ralisation de la statistique
Xi
ni1
Lhistogramme des frquences relatives cumules sera maintenant vu comme
une ralisation de la fonction de rpartition en un nombre fix de points n ( les
ralisations des Xi ) et sera appel fonction de rpartition empirique
Probabilits et statistiques J.-M. Bourinet 2016

202

Dfinition dune statistique


Soit un chantillon alatoire X 1 , X 2 , ! , X n , on appelle statistique
sur cet chantillon toute variable alatoire T M X 1 , X 2 ,!, X n , n fonction
des v.a. i.i.d. X1, X2, , Xn et de la taille de lchantillon n
Notation. : v.a. i.i.d. pour v.a. indpendantes et identiquement distribues
La statistique T

M X 1 , X 2 ,!, X n , n

9 est une variable alatoire


9 suit une loi de probabilit f T x qui dpend de celle de X
9 aura une ralisation note t ( qui sera la quantit value sur lchantillon )

203

Probabilits et statistiques J.-M. Bourinet 2016

Statistique ( en bref )
variable alatoire

distribution

v.a. parente

fX x

chantillon v.a. i.i.d.

X1 , X 2 , ! , X n

statistique

M X 1 , X 2 ,!, X n , n

f x
X

i 1

fT x

Exemple :
Variable alatoire parente :
Statistique considre :

X  U P X ,V X
X

1 n
Xi
ni1

Pour n lancs de d successifs, on a constat de manire empirique :

n X  nP X
VX n

N 0,1

n of

soit encore :

Probabilits et statistiques J.-M. Bourinet 2016

X N PX , X W f X x
n of
n

204

Convergence de suites de variables alatoires


Principaux thormes

205

Probabilits et statistiques J.-M. Bourinet 2007

Convergence dune suite de variables alatoires


Soit X n une suite de variables alatoires, o n est un entier
X On dfinit la notion de convergence stochastique pour cette suite
Convergence en probabilit de X n
9 vers une constante a

 H ! 0, lim P X n  a ! H 0
n of

Notation :

X n Po a

Thorme : Si lim E > X n @ a et limVar > X n @ 0 , alors


n of

9 vers une variable alatoire X


Convergence en loi de X n
vers une variable alatoire X

n of

X n Po a

X n Po X si X n  X Po 0
 x, lim FX n x
n of

Notation :

FX x

X n Lo X

La convergence en probabilit entrane la converge en loi


Probabilits et statistiques J.-M. Bourinet 2016

206

Convergence en lois : Applications

Loi binomiale
X  B n, p

nof
po0

np Q

En pratique :
np t 10 et n(1p) t 10

nof
np grand

Q of
cv loi

cv loi
Loi normale
X  N P ,V

En pratique :
p < 0.05 et n > 50
cv loi
cv loi
Loi de Poisson
X  P Q

Loi du Chi-deux
X  FQ2

cv loi

Q of

Q of

En pratique :
Q>5

Loi de Student
X  TQ

207

Probabilits et statistiques J.-M. Bourinet 2016

Loi faible des grands nombres


Soient X1, X2, , Xn des variables alatoires indpendantes et identiquement
distribues ( i.i.d. ), de variable parente X
Pour tout i = 1, , n, on note :

E> Xi @

Var > X i @ V X2

PX

On considre la suite alatoire X n de terme gnral X n


Loi faible des grands nombres

X
n

Probabilits et statistiques J.-M. Bourinet 2016

P
o

1 n
Xi
ni1

PX

208

Thorme Central-Limite TCL ( ou de la limite centrale )


Soient X1, X2, , Xn des variables alatoires indpendantes et identiquement
distribues ( i.i.d. ), de variable parente X
Pour tout i = 1, , n, on note :

E> Xi @

PX

Var > X i @ V X2
n

X
On considre la suite alatoire de terme gnral
n

 nP X

i 1

VX n

N 0,1

n of

cv en loi

ou

X  PX

VX

 nP X

i 1

VX n

n N 0,1 ou
n of

X N PX , X
n of
n

Thorme Central-Limite ( TCL )

Si des chantillons sont prlevs alatoirement dans une population de


variable parente X ( peu importe la loi de X ), alors la moyenne empirique
de lchantillon X tend suivre une loi normale de moyenne P X P X et
dcart-type V X V X / n mesure que la taille de lchantillon augmente
Probabilits et statistiques J.-M. Bourinet 2016

209

Vitesse de convergence du Thorme Centrale Limite


En pratique, on montre que la moyenne empirique est approximativement
normale quelle que soit la forme de la loi de la population ds que
lchantillon est constitu dau moins 30 individus
Si la loi de la population est quasi-symtrique, il suffit de 15 individus
Si la loi X de la population est normale, la loi de la moyenne empirique
est normale quel que soit le nombre dindividus
car toute combinaison linaire de variables alatoires normales
suit une loi normale

Probabilits et statistiques J.-M. Bourinet 2016

210

Exemples dapplication
du Thorme Central Limite ( TCL )

211

Probabilits et statistiques J.-M. Bourinet 2007

Application 1 du TCL Production dampoules ( rappel )


Variable alatoire parente : X  Exp O avec O = 104 /h
On prlve n ampoules ( individus ) et on mesure leur dure de vie x
9 chantillon empirique x1 , x2 , ! , xn
9 chantillon alatoire X 1 , X 2 , ! , X n

Statistique considre : X

1 n
Xi
ni1

, x ralisation de cette statistique

n X  nP X
VX n
somme de n v.a. de loi exponentielle
de mme paramtre O est une v.a.
de loi Gamma de paramtres n et O

N 0,1

On peut trouver la loi de U

On constate :

n X  nP X
N 0,1
V X n nof

fU(u)

0.4

0.2

0
-4

Cest le Thorme Central-Limite !


Probabilits et statistiques J.-M. Bourinet 2016

n=2
n=5
n = 30

-2

0
u

212

Application 2 du TCL Loi dune proportion


On prlve de manire alatoire et avec remise n individus dune population
spare en 2 groupes complmentaires :
9 A de proportion p ( exemple : les pices dfectueuses dune production )
9 A de proportion 1  p ( les pices non dfectueuses de cette production )
X Lappartenance du ime individu au groupe A peut tre vue comme le succs
une preuve de Bernoulli
individu i A X xi 1 avec une probabilit p
individu i A X xi 0 avec une probabilit 1  p
X X i suit une loi de Bernoulli de paramtre p ( la v.a. parente sera note X )
X On a : E > X i @ E > X @ P X p et Var > X i @ Var > X @ V X2 p 1  p
Soit K la v.a. associe au nombre dindividus du groupe A contenus dans
lchantillon, k tant une ralisation de K
XK

suit la loi binomiale de paramtre n et p : K  B n, p

i 1

Cest le nombre dapparitions dindividus issus du groupe A lors de n


preuves de Bernoulli ( v.a. de Bernoulli i.i.d., de mme paramtre p )
213

Probabilits et statistiques J.-M. Bourinet 2016

Application 2 du TCL Loi dune proportion ( suite )


Soit F = K /n la v.a. associe la proportion du nombre dindividus du
groupe A au sein de lchantillon de taille n ( on peut aussi voir F comme
une reprsentation de la frquence dapparition des individus de A au sein de
cet chantillon )
X F

1
K
n

1 n
Xi
ni1

Application du
Thorme
Central-Limite

Do :

Cest la moyenne empirique de n variables


F
de Bernoulli i.i.d., de mme paramtre p

X  PX

VX

n N 0,1
n of

proportion F N p ,

n of

Fp
n N 0,1
n of
p 1  p

p 1  p

En pratique : n grand { ( np t 10 et n(1p) t 10 )

Probabilits et statistiques J.-M. Bourinet 2016

214

Loi dune proportion Exemple (1)


58 % des Franais sopposent la fusion des banques
Un dirigeant dune banque franaise B mandate un des responsables de son
service clientle pour sonder une centaine de clients, slectionns au hasard
pour connatre leur opinion ( on supposera que le pourcentage de 58% est
aussi reprsentatif pour les clients de cette banque B )
Quelle est la probabilit quil y ait au moins 65 individus qui soient contre les
fusions parmi cet chantillon de 100 personnes ?
X La clientle de la banque B est divise en 2 groupes :
9 A de proportion p = 0.58, groupe sopposant aux fusions entre banques
9 A de proportion 1  p , groupe favorable aux fusions
X Le TCL nous donne la loi de la proportion F des opposants aux fusions
parmi lchantillon de clients de la banque B, sous rserve que la taille n
de cet chantillon soit grande

p 1  p
proportion F N p ,

n of
n

215

Probabilits et statistiques J.-M. Bourinet 2016

Loi dune proportion Exemple (2)


X La condition n grand est vrifie si lon a np t 10 et n(1p) t 10

np 100 u 0.58 t 10 et n 1  p 100 u 0.42 t 10 X On peut appliquer le TCL

X F N p ,
n of

p 1  p
scrit :
n

F N 0.58 , 0.0493
n of

( TCL )

X On cherche calculer P F t 0.65

F  0.58 0.65  0.58


P F t 0.65 1  P F d 0.65 1  P
d

0.0493
0.0493
F  0.58
Comme F N 0.58 , 0.0493 , on a
N 0 , 1
0.0493
0.65  0.58
On peut donc crire : P F t 0.65  1  )

0.0493
environ 8 chances sur 100 quil y ait au moins
Do : P F t 0.65  0.0778 65 individus opposs la fusion des banques
dans un chantillon de 100 personnes
Probabilits et statistiques J.-M. Bourinet 2016

216

tude des statistiques X et SX , SX*

217

Probabilits et statistiques J.-M. Bourinet 2007

Moyenne empirique
Moyenne empirique

1 n
Xi
ni1

Proprits

E X

1 n

E Xi
n i 1
1 n

E X i
n i 1
1 n
E> Xi @
ni1

Xi v.a. i.i.d. X E > X i @


X

E X

1 n

Var X Var X i
n i 1
1
n

Var X i
2
n
i 1
Xi indpendantes
1 n
( v.a. i.i.d. ) X n 2 Var > X i @

PX

PX

Probabilits et statistiques J.-M. Bourinet 2016

i 1

2
Xi v.a. i.i.d. X Var > X i @ V X

Var X

V X2
n
218

Moyenne empirique ( suite )


Loi de la moyenne empirique
9 Variable alatoire parente X gaussienne

X  N PX , X
n

9 Variable alatoire parente X non gaussienne

X N PX , X
n of
n

( en pratique n > 30 ou 15 si loi de X symtrique )

Taille de lchantillon n grande

TCL X

Taille de lchantillon n petite X Pas vident, au cas par cas


( possible par exemple pour une v.a. X suivant une loi exponentielle )

219

Probabilits et statistiques J.-M. Bourinet 2016

Variance empirique
Variance empirique

S X2

2
1 n
Xi  X

ni1

ou

S X2

2
1 n 2
n Xi  X
i1

S X est appel cart-type empirique


Variance empirique corrige

2
X

2
1 n
Xi  X

n 1 i 1

S X* est appel cart-type empirique corrig

Probabilits et statistiques J.-M. Bourinet 2016

220

Variance empirique ( suite )


Proprits

E S
2
X

2
Xi v.a. i.i.d. X Var > X i @ V X

2
1 n 2
E Xi  E X

n i 1

2
1 n
E X i2  E X


ni1

X E S X2

2
1 n
E X i2  P X2  E X  P X2


ni1

1
E X i2  n P X2

n i 1
n

V 
2
X

 Var X

1 n

E X i2  P X2  Var X

n i 1

1 n

Var > X i @  Var X

n i 1

1 n 2
V X
n i 1

E S X2

V X2
 n

V X2
n

n 1 2
VX
n

On montre que E S X2 z V X2
On dira que S X2 est un
estimateur biais de V X2
221

Probabilits et statistiques J.-M. Bourinet 2016

Variance empirique ( suite )


Proprits ( suite )
On montre, par un calcul dont la
seule difficult est la longueur :
Rappel : J 4
On a S X 2

E S X 2
E S X2

Var S X2

4
E X  P X

Var S X2 

V X4

2
1 n
Xi  X

n 1 i 1

n
E S X2
n 1
n 1 2
VX
n

et

S X2

n 1
n  1 J 4  n  3 @V X4
3 >
n

J 4 1
n

V X4 quand n o f

2
1 n
X i  X do

ni1

Variance empirique
corrige
2
2
X E S X V X

Probabilits et statistiques J.-M. Bourinet 2016

S X 2

n 2
SX
n 1

On montre que E S X 2 V X2
S X 2 est un estimateur
non biais de V X2
222

Variance empirique ( suite )


Loi de la variance empirique
9 Variable alatoire parente X gaussienne
n

X i  PX

On part de la relation

i 1

quon divise par V


2
Loi : F n W

X i  PX

i 1

X
n

2
X

2
2
n
X i  X  n X  PX
i1

nS X2

V X2

Somme des carrs


de n v.a. i.i.d N 0,1

X  PX


VX n

2
Carrs dune
X Loi : F1
v.a. N 0,1

Proprit : Si X 1  F n21 et X 2  F n22 indpendantes, alors Y

nS X2

On a ainsi :

V X2

F

2
n 1

et donc

X 1  X 2  F n21 n2

n  1 S X 2  F 2
n 1
2
VX

223

Probabilits et statistiques J.-M. Bourinet 2016

Dfinition de la loi du Chi-deux n degrs de libert


Densit :

1

Q=1

x 2 exp  x

2
2

fX x
Q
Q
2 2 *
2
pour x ! 0

FX x

Q x
J ,
2 2
Q
*
2

Moyenne : P X
2
Variance : V X

Q=2

0.4

fX(x)

Fonction de rpartition :

0.5

0.3

Q =3
Q=4
0.2
Q =5
0.1

0
0

Q =10 Q =15
Q =20 Q =25 Q =30
10

20

30

2Q

Probabilits et statistiques J.-M. Bourinet 2016

224

Variance empirique ( suite )


Loi de la variance empirique ( suite )
9 Variable alatoire parente X non gaussienne
Taille de lchantillon n grande

S X2  E S X2

TCL X

Var S X2

n 1 2
VX
n
J 1
Var S X2  4 V X4
n

avec E S X2

N 0,1

n of

et

S X2  V X2
n N 0,1
n of
V X2 J 4  1

2 V X2 J 4  1
S N V X ,

n of
n

2
X

soit :

Taille de lchantillon n petite X ???


225

Probabilits et statistiques J.-M. Bourinet 2016

Remarques complmentaires
Corrlation / dpendance entre X et S X
On peut montrer que X et S X deviennent non corrls quand n o f
Si la loi de X est symtrique, X et S X sont non corrls quel que soit n
Si la loi de X est gaussienne, X et S X sont indpendants
Relation utile quand V X est inconnu ( cas X gaussienne )

X  PX
 N 0,1
VX n
nS X2

V X2

F

2
n 1

X  PX
VX n
nS X2
n  1 V X2

X  PX
SX

n 1

suit une loi de Student


Q n  1 degrs de libert

V X nintervient plus

Rq. : c.f. dfinition de


la loi de Student

Probabilits et statistiques J.-M. Bourinet 2016

226

Dfinition de la loi de Student n degrs de libert


Densit :

Moyenne : P X

2
Variance : V X

N 0,1

Q=1
Q=2
Q=5

0.3

fX(x)

fX x

0.4

Q 1
Q 1
*
2  2

1
2 1  x
QS * Q Q

2

0.2
0.1

Q 2

pour Q > 2

0
-4

-2

0
x

Remarque :
La loi de Student Q = 1 degrs de libert est
appele loi de Cauchy. Cest la loi du quotient de
2 v.a. normales centres rduites et indpendantes

U
 T1
X
avec : U  N 2 0,1
X  F1

Cette loi ne possde aucun moment fini

227

Probabilits et statistiques J.-M. Bourinet 2016

En rsum
moments de T
T

E >T @

PX

loi de X

var >T @

V X2

T 218

normale

X  N PX , X
n

T 218

( ou

X 0.5

PX

S X2

n 1 2
VX
n

T 221

non normale ( TCL )

X  PX
SX

X N PX , X
n of
n

T 219

n  1  Tn 1 )

T 219

T 226

S V X2 V X2
!

2 n n

n 1
n  1 J 4  n  3 V X4
n3

S X 2

V X2

T 222

1
n  3 4
J4 
VX

n
n  1

T 214

p 1  p
n

T 222

nS X2

V X2

 F n21

T 223

n  1 S X 2  F 2
n 1
2

VX

T 214

V2
S X2 N V X2 , X J 4  1
n of
n

T 225

T 223

2
X

V2
N V X2 , X J 4  1
n of
n

F Np,
n of

p 1  p

T 214

Conditions dapplication du TCL : pour X , S X et S X 2 : n t 30 ( loi non sym. ), n t 15 ( loi sym. )


pour F : np t 10 et n 1  p t 10
2

Probabilits et statistiques J.-M. Bourinet 2016

228

Estimation

Probabilits et statistiques J.-M. Bourinet 2007

229

Formulation du problme de lestimation


La variable alatoire parente X est de distribution inconnue
Objectif
Dterminer cette distribution partir des observations sur un chantillon
Hypothses
9 On suppose lchantillon constitu de v.a. indpendantes et
identiquement distribues de v.a. parente X
9 On se fixe le type de loi de X, lexception des valeurs numriques
dun ou de plusieurs paramtres T que lon souhaite estimer
Notation dans le cas dune loi continue : f X x,T
Ex. :

PX

VX

X On cherchera ici dterminer la moyenne


et lcart-type de la loi de X

Probabilits et statistiques J.-M. Bourinet 2016

230

Notion destimateur
Un estimateur dun unique paramtre inconnu T dune loi dune v.a. X
est une statistique T M X 1 , X 2 ,!, X n , n dont chaque ralisation t peut
tre considre comme une approximation de ce paramtre T
t M x1 , x2 ,!, xn , n sera appele estimation de T
On notera T T M X 1 , X 2 ,!, X n , n
9 T est une statistique ( donc une variable alatoire )
9 T ne dpend que de lchantillon et videmment pas du paramtre
9 Sa ralisation est calculable partir de lchantillon
Problmes poss
9 Comment estimer un (des) paramtre(s) ?
9 Toute statistique est potentiellement un estimateur, il va falloir choisir
entre plusieurs solutions
9 Quelles proprits devra avoir notre estimateur afin dobtenir une
bonne estimation du (des) paramtre(s)
231

Probabilits et statistiques J.-M. Bourinet 2016

Proprits dun estimateur


Estimateur sans biais / asymptotiquement sans biais
9 Estimateur sans biais pour T
E T T
b n,T E T  T
9 Biais dun estimateur
9 Estimateur asymptotiquement sans biais pour T
lim E T T
n of

Estimateur convergent
9 Un estimateur T est dit convergent pour la paramtre T si :
P
soit :  H ! 0, lim P T  T ! H
0
T 
oT

n of

Quand n devient grand, la probabilit que lestimation scarte de T


devient petite
Prcision dun estimateur
9 Erreur quadratique moyenne dun estimateur T
9 Proprit :

R T ,T Var >T @  b n,T

R T ,T

2
E T  T

9 T1 plus prcis que T2 si R T1 ,T  R T2 ,T


Probabilits et statistiques J.-M. Bourinet 2016

232

Proprits dun estimateur Avec des mots simples


Estimateur sans biais / asymptotiquement sans biais
Il converge vite vers le paramtre de la population,
sans cart systmatique
Estimateur convergent
Il converge vers le paramtre de la population
quand la taille de lchantillon augmente

Prcision dun estimateur


Son imprcision doit tre faible

233

Probabilits et statistiques J.-M. Bourinet 2016

Proprits dun estimateur - Visuellement


convergence

T
biais

T

T sans biais mais peu convergent

T sans biais et convergent

T
+

T
T biais mais peu convergent
Probabilits et statistiques J.-M. Bourinet 2016

T
T convergent mais biais
234

Estimations ponctuelles
Statistiques des moyenne et variance empiriques

235

Probabilits et statistiques J.-M. Bourinet 2007

Estimation ponctuelle
Objectif : Fournir une approximation dun paramtre de la v.a. parente X
associe la population sur la base des donnes de lchantillon
Estimateur de la moyenne P X

Estimateur de la variance V

2
X

Estimateur de lcart-type V X

2
X

1 n
Xi
ni1
2
1 n
Xi  X

n 1 i 1

S X

2
1 n
Xi  X

n 1 i 1

Estimateur dune proportion p,


{ nombre de succs dune exprience binomiale
( Xi binaires )
Probabilits et statistiques J.-M. Bourinet 2016

1 n
Xi
ni1

n xi

236

Estimations ponctuelles
( mthode du maximum de vraisemblance )

237

Probabilits et statistiques J.-M. Bourinet 2007

Fonction de vraisemblance, estimateur associ


Soient X1, X2, , Xn des variables alatoires indpendantes et identiquement
distribues ( i.i.d. ), de variable parente X
On dfinit la fonction L x1 , x2 ,!, xn ,T appele fonction de vraisemblance
du paramtre T par ( L pour Likelihood en anglais ) :
9 Loi de X discrte

L x1 , x2 ,!, xn ,T

p X1!X n x1 ,!, xn ,T

p x ,T
X

i 1

Xi indpendantes ( v.a. i.i.d. )


9 Loi de X continue

L x1 , x2 ,!, xn ,T

f X1!X n x1 ,!, xn ,T

f x ,T
X

i 1

T X 1 , X 2 ,!, X n est dit estimateur de maximum de vraisemblance ( MV )


du paramtre T si la fonction de vraisemblance L x1 , x2 ,!, xn ,T prsente
un maximum en T x1 , x2 ,!, xn
Ayant observ les ralisations x1, x2, , xn, la fonction de vraisemblance
permet de comparer diffrentes valeurs possibles pour le paramtre T
du point de vue de leur plausibilit, ou vraisemblance
Probabilits et statistiques J.-M. Bourinet 2016

238

Dtermination de lestimateur du MV
Sous rserve dexistence des drives partielles, lestimation T
est solution du systme dquations ci-dessous :

wL
wT x1 , x2 ,!, xn ,T

w2 L
0
wT 2 x1 , x2 ,!, xn ,T

et

T x1 , x2 ,!, xn

En pratique, on prfre utiliser la fonction log-vraisemblance du paramtre T


dfinie comme suit :
T o ln L x1 , x2 ,!, xn ,T
L tant sous la forme dun produit, il est plus facile de driver ln L
Le systme permettant de trouver lestimation T

w ln L
wT x1 , x2 ,!, xn ,T

et

T x1 , x2 ,!, xn devient :

w 2 ln L
0
wT 2 x1 , x2 ,!, xn ,T
239

Probabilits et statistiques J.-M. Bourinet 2016

Application lestimation de paramtres multiples


Lestimation par maximum de vraisemblance peut tre tendue sans problme
au cas de paramtres multiples
Les estimations T 1 x1 , x2 ,!, xn ,!,T m x1 , x2 ,!, xn du vecteur T
T1 ! T m
sont alors les solutions du systme dquations simultanes ci-dessous :

w ln L
wT j

pour

j 1,2,!, m

x1 , x2 ,!, xn ,T1 ,T 2!,T m

Probabilits et statistiques J.-M. Bourinet 2016

240

Exemple dapplication la loi exponentielle


X  Exp O avec O

f X x,T T exp T x

10 chantillons de n = 20 individus

10 chantillons de n = 1000 individus


0

ln( L( x1 , ... , xn , T ) )

ln( L( x1 , ... , xn , T ) )

0
-20
-40
-60
-80
-100
0

T

0.7180 ; 1.2547 ; 1.0634 ; 1.0290 ;


0.9902 ; 0.9030 ; 0.9373 ; 1.1583 ;

-1000
-2000
-3000
-4000
-5000
0

T 1.0204 ; 1.0018 ; 0.9980 ; 0.9878 ;

1.2813 ; 1.0257

1.0238 ; 1.0335 ; 1.0090 ; 1.0722 ;


1.0242 ; 1.0214

Probabilits et statistiques J.-M. Bourinet 2016

241

Probabilits et statistiques J.-M. Bourinet 2016

242

Estimations par intervalle de confiance

Probabilits et statistiques J.-M. Bourinet 2007

243

Exemple Problmatique
Contexte
9 Une entreprise envisage de simplanter sur le march espagnol pour
vendre un nouvel apritif
9 Les services financiers ont calcul que cette implantation est rentable
si la consommation moyenne par habitant et par an est suprieure
0.20 litres
9 Une enqute auprs de 400 personnes montre que, sur cet chantillon,
la consommation moyenne est de 0.23 litres avec un cart-type de
0.11 litres
Problme : Quelle dcision lentreprise doit-elle prendre ?
Hypothse
9 On supposera que la consommation individuelle par an dun espagnol
est une variable alatoire normale de moyenne et dcart-type inconnus

Probabilits et statistiques J.-M. Bourinet 2016

244

Exemple introductif Rsolution (1)


Sur lchantillon de 9 0.23 litres X ralisation x de la v.a. X
n = 400 personnes 9 0.11 litres X ralisation s X de la v.a. S X
On cherche comparer P X , consommation moyenne de la population par
habitant et par an ( valeur inconnue ), au seuil de 0.20 litres
X On sintresse la quantit T P X , moyenne de la v.a. parente X
On ne connat ni la moyenne P X , ni lcart-type V X de la v.a. parente X
mais on sait que la v.a. X est normale
X On utilise la statistique :

X  PX
SX

n  1  Tn 1

T 226

9 fait intervenir P X
9 ne dpend pas de V X
9 fait intervenir les statistiques X et S X ( via S X )
dont on aura une ralisation sur lchantillon

X et ici plus particulirement :

X  PX
S X

n  Tn 1

n 2
S X do S X
n 1
X  PX
X  PX
n 1
et donc
SX
S X

On a S X 2

n 1
SX
n
n
245

Probabilits et statistiques J.-M. Bourinet 2016

Exemple introductif Rsolution (2)


X  PX
S X

n suit une loi de Student Q

n  1 degrs de libert

X Cette v.a. note 3 est appele fonction pivotale et dpend :


9 de lchantillon ( via X , S X et n )
9 du paramtre T P X que lon cherche estimer
mais sa loi ( Tn 1 ) ne dpend pas du paramtre T

PX

On se fixe une valeur D faible ( D 0.01  0.10 )


Loi de Student Q n  1
et on crit lexpression suivante :
degrs de libert

X  PX
P tn1 ; D 2 d
n d tn1 ; 1D 2 1  D

SX

D 2
D 2
T
n
1

X 1  D est appel niveau de confiance
La loi de Student est symtrique
X tn 1; D 2

tn 1; 1D 2

Probabilits et statistiques J.-M. Bourinet 2016

tn 1; D 2

tn 1;1D 2
246

Exemple introductif Rsolution (3)


On rcrit :
sous la forme :
soit encore :

X  PX
P  tn 1; 1D 2 d
n d tn 1 ; 1D 2
S X

S
S
P  tn 1 ; 1D 2 X d X  P X d tn 1 ; 1D 2 X
n
n

S X
P X  tn 1; 1D 2
d P X d X  tn 1 ; 1D 2
n

T1

1D

1D


SX
1D
n

T2

X Pour un grand nombre dchantillons de taille n, cette expression nous


indique quune proportion 1  D de ceux-ci vrifieront lingalit suivante :
s
s
x  tn 1; 1D 2 X d P X d x  tn 1; 1D 2 X
n
n

o x et s X reprsente les ralisations respectives de X et S X associes
lchantillon considr

s X
s X


x
t
,
x
t
X
= intervalle de confiance au niveau 1  D
n 1; 1D 2
n 1 ; 1D 2
n
n

247

Probabilits et statistiques J.-M. Bourinet 2016

Exemple introductif Rsolution (4)


Pour lexemple trait, on choisit : D
On a : tn 1; 1D 2

t399 ; 0.995

2.5882

0.01
A titre de comparaison : u 1D 2

2.5758

Pour lchantillon considr de 400 personnes, on obtient :

s X
s X
0.11
0.11
x  tn 1;1D 2 n , x  tn 1; 1D 2 n 0.23  2.5882 400 , 0.23  2.5882 400


> 0.2158 , 0.2442 @
X Le seuil de 0.20 litres se trouvant en dessous de cette fourchette, on peut
donc en dduire, sans trop de risque, que lentreprise peut tenter de
simplanter en Espagne

Probabilits et statistiques J.-M. Bourinet 2016

248

Intervalle de confiance
Soit lchantillon X1, X2, , Xn constitu de variables alatoires
indpendantes et identiquement distribues ( i.i.d. ), de variable parente X
On sintresse un paramtre T de la distribution de X
Intervalle de confiance bilatral pour T , au niveau de confiance 1  D
Tout intervalle >T1 , T2 @ , construit partir de lchantillon alatoire
( les bornes T1 et T2 sont donc des v.a. ), tel que :

P T1 d T d T2
!
!

P T >T1 , T2 @ 1  D

1  D proche de 1

Ce sont les bornes de lintervalle qui sont des v.a., et non T


On obtiendra un intervalle constant > t1 , t2 @ , ralisation de >T1 , T2 @

Intervalle de confiance unilatral pour T , au niveau de confiance 1  D


Tout intervalle >T0 , f> ou @f,T0 @ , construit partir de lchantillon alatoire
( la bornes T0 est donc une v.a. ), tel que :

P T0 d T

P T >T0 , f> 1  D

ou

P T0 t T

P T @f, T0 @ 1  D
249

Probabilits et statistiques J.-M. Bourinet 2016

Interprtation de la notion de niveau de confiance


Exemple
9 Vraie valeur du paramtre T inconnu : T
9 Intervalle de confiance :

>T1 , T2 @

0.53

T  0.02 , T  0.02

9 On rpte le prlvement dchantillons m fois et on obtient :

T

>t1 , t2 @

T >t1 , t2 @

0.51

0.54

>0.49,0.53@
>0.52,0.56@

0.57

>0.55,0.59@

faux

vrai
vrai

Probabilits et statistiques J.-M. Bourinet 2016

Intervalle de confiance
au niveau 1  D
Quand m o f
% de vrai o 1  D
% de faux o D

250

Principe de construction
Principe de construction dun intervalle de confiance bilatral symtrique pour
le paramtre T , au niveau de confiance 1  D
Choix du meilleur estimateur possible pour le paramtre T, dont on connat
la loi de probabilit en fonction de T
Choix dune v.a. fonction pivotale note 3 X 1 , X 2 ,!, X n , n,T

X X 1 , X 2 ,!, X n , n  P X
n
S X X 1 , X 2 ,!, X n , n
La loi de cette fonction pivotale 3 ne dpend pas du paramtre T
Ex. :

Ex. :

3 X 1 , X 2 ,!, X n , n, P X

3 X 1 , X 2 ,!, X n , n, P X  Tn1

Dtermination des constantes a et b vrifiant :

P a d 3 X 1 , X 2 ,!, X n , n,T d b
Ex. :

1D

intervalle de confiance bilatral symtrique 


a
D 2 et 1  D 2 -fractiles de la loi de 3
X 
b

tn 1; 1D 2

tn 1; D 2
tn 1;1D 2

251

Probabilits et statistiques J.-M. Bourinet 2016

Principe de construction ( suite )


Principe de construction dun intervalle de confiance bilatral symtrique pour
le paramtre T , au niveau de confiance 1  D
Si la fonction 3 le permet, transformation de lexpression :

P a d 3 X 1 , X 2 ,!, X n , n,T d b

1D

en une autre du type :

P T1 X 1 , X 2 ,!, X n , n d T d T2 X 1 , X 2 ,!, X n , n
On veut ainsi : P T1 d T d T2
Ex. :

1D

P T >T1 , T2 @ 1  D

S X
S X
P X  tn 1; 1D 2
1D
d P X d X  tn 1 ; 1D 2
n
n

T1 X 1 , X 2 ,!, X n , n

T2 X 1 , X 2 ,!, X n , n

Pour un chantillon donn, on disposera des ralisations t1 et t2 de T1 et T2


>t1 , t2 @ sera lintervalle de confiance au niveau de confiance 1  D relatif
lchantillon considr
Probabilits et statistiques J.-M. Bourinet 2016

252

Moyenne PX dune loi Gaussienne, VX tant suppos connu


On suppose connu lcart-type V X de la v.a. X
X  PX
n  N 0,1 X 3 X 1 , X 2 ,!, X n , n
On sait que :

VX

T 219

P a d 3 X 1 , X 2 ,!, X n , n,T d b

1D

X  PX

VX

fonction pivotale

X  PX
d u1D 2 1  D
P uD 2 d
VX n

o uD dsigne le fractile dordre D de la loi normale ( on a uD 2


se dcline ici sous la forme :

La relation recherche P T1 d T d T2
se dcline ici sous la forme :

u1D 2 )

P T >T1 , T2 @ 1  D

V
V

P X  u1D 2 X d P X d X  u1D 2 X 1  D
n
n

Intervalle de confiance bilatral symtrique au


niveau de confiance 1  D pour un lchantillon
donn ( i.e. une ralisation x de la v.a. X )

VX
VX

x  u1D 2 n , x  u1D 2 n
253

Probabilits et statistiques J.-M. Bourinet 2016

En rsum ( X normale )
T

PX

PX

VX

VX
connu

VX
inconnu

PX
inconnue

donnes

fonction pivotale

x
donne

X  PX

x et s X
donns

X  PX
SX

n  N 0,1

VX

VX
VX

x  u1D 2 n , x  u1D 2 n ( bilat. )

VX

x  u1D n ,  f ,

n  1  Tn 1

x et s X
donns

X  PX
S X

sX
donn

nS X2

s X
donn

intervalle de confiance T

2
X

n  Tn 1

 F n21

n  1 S X 2  F 2
n 1
2
VX

Probabilits et statistiques J.-M. Bourinet 2016

VX

f , x  u1D n ( unilat. )

sX
sX

x  tn 1;1D 2 n  1 , x  tn 1;1D 2 n  1

s X
s
, x  tn 1;1D 2 X
x  tn 1;1D 2
n
n

n sX
,

kn 1;1D 2
n  1 s
X
,

kn 1;1D 2

n sX

kn 1; D 2
n  1 s X

kn 1; D 2

254

En rsum ( X quelconque par TCL quand n o f )


T

PX

VX

VX
inconnu

PX
inconnue

donnes
x et s X
donns
x et s X
donns

intervalle de confiance sur T

fonction pivotale
X  PX
SX

n  1 N 0,1

X  PX
S X

sX
sX

o x  u1D 2
, x  u1D 2
n 1
n  1

n of

n of

s
s
o x  u1D 2 X , x  u1D 2 X
n of
n
n

n N 0,1
n of

sX
donn

S X2  V X2
n N 0,1
n of
V X2 J 4  1

>?

, ?@

s X
donn

S X 2  V X2
n N 0,1
n of
V X2 J 4  1

>?

, ?@

f
donne

Fp
p 1  p

n N 0, 1
n of

o f  u1D 2
n of

f 1  f
n

, f  u1D 2

f 1  f

Probabilits et statistiques J.-M. Bourinet 2016

255

Probabilits et statistiques J.-M. Bourinet 2016

256

Tests statistiques
Introduction

257

Probabilits et statistiques J.-M. Bourinet 2007

Exemples Problmatique
Exemple 1 : Effet dun traitement sur une maladie
9 Pourcentage de gurison spontane en labsence de traitement : 50 %
La gurison de chaque individu est modlise par une v.a. de Bernoulli
X de paramtre p = 0.5 : X  Ber 0.5
9 Sur 100 malades soumis un traitement, on observe 60 gurisons
9 Peut-on conclure lefficacit du traitement ?
Exemple 2 : Changement climatique
9 tudes climatologiques sur une longue priode de la temprature
moyenne Paris au mois daot
9 La temprature moyenne ( en C ) peut tre modlise par une v.a.
normale X  N 20,1
9 Observations des 10 dernires annes :
22 19 21 23 20 22 24 18 20

25

9 Ces observations rendent-elles vraisemblable lhypothse dun


rchauffement climatique de 1C ?
Probabilits et statistiques J.-M. Bourinet 2016

258

Exemples Problmatique ( suite )


Exemple 3 : Les faiseurs de pluie
9 tudes climatologiques sur une longue priode du niveau moyen des
pluies annuelles dans la Beauce
9 Le niveau moyen ( en mm / an ) peut tre modlise par une v.a.
normale X  N 600,100
9 Une entreprise prtend pouvoir augmenter de 50 mm le niveau moyen
des pluies par ensemencement des nuages avec du iodure dargent
9 Hauteurs de pluies en utilisant ce procd sur une priode de 9 ans :
510 614 780 512 501 534 603 788 650
9 Quelle dcision doivent prendre les agriculteurs hsitant investir dans
ce procd forcment onreux ?

Probabilits et statistiques J.-M. Bourinet 2016

259

Test statistique, paramtre du test


Un test statistique est un mcanisme qui permet, partir des rsultats dun
chantillon, deffectuer un choix entre 2 assertions, appeles hypothses,
qui concernent la valeur dun paramtre T dune population
Paramtre Tde la population concern par le test
Exemple 1 :

T = Taux de gurison aprs traitement

Exemple 2 :

T = Moyenne de la temprature Paris au mois daot sur


une longue priode ( = PX )

Exemple 3 :

T = Moyenne des hauteurs de pluies en Beauce sur une


longue priode ( = PX )

Probabilits et statistiques J.-M. Bourinet 2016

260

Hypothses du test statistique


Un test statistique est un mcanisme qui permet, partir des rsultats dun
chantillon, deffectuer un choix entre 2 assertions, appeles hypothses,
qui concernent la valeur dun paramtre T dune population
Hypothses du test
9 Hypothse not H0 dite hypothse nulle
9 Hypothse not H1 dite hypothse alternative
Exemple 1 :

H0T = 0.5 ( le traitement na pas deffet )


H1T > 0.5 ( le traitement a un effet )

Exemple 2 :

H0T = 20 ( pas de changement climatique )


H1T = 21 ( rchauffement climatique de 1C )

Exemple 3 :

H0T = 600 ( lensemencement des nuages ne sert rien )


H1T = 650 ( il augmente le niveau de pluie de 50 mm )

Remarque : Ces 2 hypothses sont complmentaires. On a donc H 0  H1


Une et une seule de ces hypothses est vraie
Probabilits et statistiques J.-M. Bourinet 2016

261

chantillon et variable alatoire


Existence dune variable alatoire X dont la loi dpend du paramtre T
Exemple 1 :

X = Gurison dun patient ( x= 1 si le patient gurit, 0 sinon )


X  Ber T

Exemple 2 :

X = Temprature moyenne Paris au mois daot


X  N T ,1

Exemple 3 :

X = Hauteur deau de pluie annuelle moyenne dans la Beauce


X  N T ,100

Observation dune ralisation dun chantillon de v.a. i.i.d. X1, X2, , Xn ,


de mme variable parente X

Probabilits et statistiques J.-M. Bourinet 2016

262

Hypothse simple / hypothse composite


Une hypothse est dite simple si elle caractrise de manire unique la loi
de X
Sinon elle est dite composite
Ex. :
Test sur le paramtre Q
dune loi de Poisson

H0 : Q

H1 : Q

Test sur la moyenne


dune loi normale
( VX suppos connu )

H0 : PX

H1 : P X

1 (HS)

Test sur la moyenne


dune loi normale
( VX inconnu )

H0 : PX

H1 : P X

1 (HC)

(HS)

(HS)

H0 : Q 2

H1 : Q ! 2

(HS)
(HC)

2 (HS)

2 (HC)
263

Probabilits et statistiques J.-M. Bourinet 2016

Test paramtrique / non paramtrique


Lorsque la forme de la loi de probabilit de X nest pas connue, le test est
dit non paramtrique
Ex. :

Test sur la forme


dune distribution

H 0 : X suit une loi normale

H1 : X ne suit pas une loi normale

Test sur lgalit


de 2 distributions

H 0 : Les 2 distributions sont identiques

( mme loi, mmes paramtres )

H : Les 2 distributions sont diffrentes


1

Sinon il est dit paramtrique


Ex. :

Test sur le paramtre Q


dune loi de Poisson
Test sur la moyenne
dune loi normale
( VX inconnu )

H0 : Q 2

H1 : Q ! 2
H0 : PX

H1 : P X

Probabilits et statistiques J.-M. Bourinet 2016

1
2
264

Principe de rsolution du test Rgle de dcision


Les ralisations de lchantillon ( X1, X2, , Xn ) tant valeurs dans \n, on va
chercher une partition de lespace des ralisations \n en 2 sous-ensembles :
9 lensemble C des ralisations ( x1, x2, , xn ) pour lesquelles on rejette H0
au profit de H1 X C sera appele rgion critique ou zone de rejet
9 lensemble C des ralisations ( x1, x2, , xn ) pour lesquelles on conserve H0
X C sera appele rgion dacceptation
En pratique, on ne travaillera pas dans \n. On choisira une statistique V sur
lchantillon V M X 1 , X 2 ,!, X n , n qui sera appele variable de dcision
X On cherchera ainsi partitionner \ ( plus exactement le domaine de
variation de V ) en 2 rgions : la rgion critique et la rgion dacceptation
Exemple 3 : 9 On utilisera la variable de dcision V X
9 Rgion critique : C ^ x1 , x2 , !, xn \ n | x ! k
Notation simplifie : C

^x ! k `

Bien voir quon retient H1 si x C


265

Probabilits et statistiques J.-M. Bourinet 2016

Erreurs de 1re et 2nde espce, risques associs


4 cas de figure :
H0

Vrit

v C
H0

Bonne dcision
Conserver H0
alors que H0 est vraie

P V C | H 0 1  D

H1

v C
Erreur de 2nde espce
Conserver H0
alors que H1 est vraie

P V C | H1

H0 garde car v, ralisation de V, appartient la rgion dacceptation C

Dcision

v C

H1

Erreur de 1re espce


Rejeter H0 au profit de H1
alors que H0 est vraie

P V C | H 0 D

v C
Bonne dcision
Rejeter H0 au profit de H1
alors que H1 est vraie

P V C | H1 1  E

H0 rejete car v, ralisation de V, appartient la rgion critique C


Probabilits et statistiques J.-M. Bourinet 2016

266

Application lexemple 1
4 cas de figure :
H0

Vrit

xdk

H1

xdk

On a affaire un traitement inefficace.


Le nombre de gurisons constat
H0 sur lchantillon nest pas suffisamment
important pour conduire
retenir ce traitement

On a affaire un traitement efficace.


Le nombre de gurisons constates
est malheureusement
exceptionnellement trop faible pour
conduire retenir ce traitement

H0 garde car x , ralisation de X , appartient la rgion dacceptation C

Dcision

x!k

x!k

On a affaire un traitement inefficace.


Le nombre de gurisons constat est,
pour
une raison non lie la qualit de
H1
ce traitement, suffisamment grand pour
malheureusement conduire le retenir

On a affaire un traitement efficace.


Le nombre de gurisons constat
sur lchantillon est suffisamment
important pour conduire
retenir ce traitement

H0 rejete car x , ralisation de X , appartient la rgion critique C


267

Probabilits et statistiques J.-M. Bourinet 2016

Application lexemple 3
4 cas de figure :
H0

Vrit

xdk
Lensemencement des nuages est un
procd douteux. Les relevs sur 9
H0 ans ne montrent pas daugmentation
significative du niveau de pluie et on ne
retient donc pas ce procd

H1

xdk
Lensemencement des nuages est un
procd efficace. Les relevs sur 9 ans ne
montrent malheureusement pas
daugmentation significative du niveau de
pluie et on carte donc tort ce procd

H0 garde car x , ralisation de X , appartient la rgion dacceptation C

Dcision

x!k

H1

Lensemencement des nuages est un


procd douteux. Les relevs sur 9 ans
montrent, pour une raison non lie
lutilisation de ce procd, une augmentation
significative du niveau de pluie et on retient
malheureusement ce procd

x!k
Lensemencement des nuages est un
procd efficace. Les relevs sur 9 ans
montrent une augmentation
significative du niveau de pluie et on
retient donc naturellement ce procd

H0 rejete car x , ralisation de X , appartient la rgion critique C


Probabilits et statistiques J.-M. Bourinet 2016

268

Risques de 1re et 2nde espce


Risque de 1re espce, not D
Cest la probabilit de rejeter lhypothse H0 alors que H0 est vraie
Risque de 2nde espce, not E
Cest la probabilit de conserver lhypothse H0 alors que H1 est vraie
H0

H0

Vrit

H1
Erreur de 2nde espce
Conserver H0
alors que H1 est vraie

Bonne dcision
Conserver H0
alors que H0 est vraie

P V C | H 0 1  D

Dcision
H1

P V C | H1

Erreur de 1re espce


Rejeter H0 au profit de H1
alors que H0 est vraie

Bonne dcision
Rejeter H0 au profit de H1
alors que H1 est vraie

P V C | H 0 D

P V C | H1 1  E

269

Probabilits et statistiques J.-M. Bourinet 2016

Puissance du test
Puissance du test : 1 E
Cest la probabilit de rejeter raison lhypothse H0
Cest un nombre compris entre 0 et 1

H0

H0

Vrit

Bonne dcision
Conserver H0
alors que H0 est vraie

P V C | H 0 1  D

Dcision
H1

Erreur de 1re espce


Rejeter H0 au profit de H1
alors que H0 est vraie

P V C | H 0 D
Probabilits et statistiques J.-M. Bourinet 2016

H1
Erreur de 2nde espce
Conserver H0
alors que H1 est vraie

P V C | H1

Bonne dcision
Rejeter H0 au profit de H1
alors que H1 est vraie

P V C | H1 1  E

270

Choix dun test


Objectif idal : minimiser les 2 risques ( D et E )
Ceci est impossible, les 2 risques tant antagonistes
Pour une taille dchantillon donn, E varie en sens inverse de D
Si on prend la dcision de ne jamais rejeter lhypothse H0 X D tend vers 0
X C tend vers X C tend vers \ n X 
E P V C | H1 tend vers 1
Stratgie de Neyman et Pearson :
Contrle du seul risque de 1re espce D, considr comme le plus
important en le rendant infrieur ou gal une valeur D fixe a priori
( souvent 1, 5 ou 10 % ), appel niveau de signification du test
En imposant D faible, on se prmunit contre un abandon trop htif de H0
Problme : il existe une infinit de zones critiques C
satisfaisant lquation suivante :

P V C | H 0 d D

Rgle de dcision propose par Neyman et Pearson :


Retenir la rgion critique qui maximise la puissance du test 1 E
271

Probabilits et statistiques J.-M. Bourinet 2016

Remarque concernant les hypothses


Lapproche de Neyman et Pearson qui consiste privilgier le risque de
1re espce D fait que les hypothses H0 et H1 ne jouent plus des rles
symtriques
H0 est une hypothse privilgie
9 elle est abandonne que si les observations sont significativement
contradictoires
9 elle est une hypothse laquelle on tient particulirement pour des
raisons qui peuvent tre subjectives
9 elle est une hypothse de prudence ( ex. : test dinnocuit dun vaccin )
9 elle est une hypothse solidement tablie
9 elle est la seule hypothse facile formuler ( ex. : tester P X
P X z P0 )

Probabilits et statistiques J.-M. Bourinet 2016

P0 contre

272

Dmarche classique dun test statistique


Identification du paramtre Tconcern par le test et choix des hypothses
H0 et H1
Dtermination de la variable de dcision V
9 doit tre lie au paramtre T
9 sa distribution doit tre connue sous lhypothse H0 vraie ( utilisation
dune fonction pivotale )
En fonction de H1, dtermination de la rgion critique C
Formes courantes : C
9 Test HS-HS

@ k,  f >

H 0 : T T0
H1 : T T1

@  f, k @

@  f, k @

H 0 : T T0
H1 : T  T 0

9 Test HS-HC unilatrale


9 Test HS-HC bilatrale

ou

H 0 : T T0
H1 : T z T 0

@  f, kinf @

si T1  T 0 ,

C
C

ou

* ksup ,  f

@ k,  f >

si T1 ! T 0

@  f, k @
@  f, kinf @

* ksup ,  f
273

Probabilits et statistiques J.-M. Bourinet 2016

Dmarche classique dun test statistique ( suite )


En fonction du risque Det sous lhypothse H0 , dtermination de la
borne k ( ou des bornes kmin et ksup ) de cette rgion critique C tel que :

P V C | H 0 D
Rq. : Pour un test faisant intervenir une hypothse bilatrale, on choisira
un risque symtrique :

H 0 : T T0
H1 : T z T 0

@  f, kinf @

* ksup ,  f

P V @  f, kinf @ | H 0 D 2
P V ksup ,  f | H 0 D 2

Calcul de la ralisation v de la variable de dcision V sur l chantillon


considr ( x1, x2, , xn )
Conclure en conservant lhypothse H0 si v C , ou en la rejetant si v C
Calculer ventuellement le risque de 2nde espce E laide de lexpression
suivante :
P V C | H1 E
Probabilits et statistiques J.-M. Bourinet 2016

274

Application lexemple 1
Exemple 1 : Effet dun traitement sur une maladie
9 Pourcentage de gurison spontane en labsence de traitement : 50 %
La gurison de chaque individu est modlise par une v.a. de Bernoulli
X de paramtre p = 0.5 : X  Ber 0.5
9 Sur 100 malades soumis un traitement, on observe 60 gurisons
9 Peut-on conclure lefficacit du traitement ?
Identification du paramtre Tet choix des hypothses H0 et H1
X Paramtre concern T

X Hypothses : H 0 : p 0.5
H1 : p ! 0.5

Dtermination de la variable de dcision V et de la variable pivotale 3


X V
X 3

Fp
n N 0, 1
n of
p 1  p

np 100 u 0.5 50 t 10

car

( TCL )

n 1  p 100 u 1  0.5 50 t 10

T 214

275

Probabilits et statistiques J.-M. Bourinet 2016

Application lexemple 1 ( suite )


En fonction de H1, dtermination de la rgion critique C
Formes courantes : C
X C

@ k,  f >

ou

@  f, k @

ou

@  f, kinf @

* ksup ,  f

@ k,  f >

En fonction du risque Det sous lhypothse H0 , dtermination de la


borne k ( ou des bornes kmin et ksup ) de cette rgion critique C tel que :

P V C | H 0 D
X P F C | H0

P F ! k | H0 D

X P F d k | H0 1  D

On prend en compte H 0 : p

F  0.5

k  0.5
X P
nd
n 1D
0.5 1  0.5

0.5 1  0.5

On choisit D

0.01 X u1D

2.3263 X k

Probabilits et statistiques J.-M. Bourinet 2016

0.5 

0.5

k  0.5
n
0.5 1  0.5

2.3263 0.5 1  0.5


100

u1D

0.616
276

Application lexemple 1 ( suite )


Calcul de la ralisation v de la variable de dcision V sur l chantillon
considr ( x1, x2, , xn )
X v

0.6 ( donne : 60 gurisons sur 100 patients )

Conclure en conservant lhypothse H0 si v C , ou en la rejetant si v C


X v

0.6 C

@ 0.616,  f >

et donc v

0.6 C

X On conserve donc H0 au niveau de signification D 0.01


Calculer ventuellement le risque de 2nde espce E laide de lexpression
suivante :
P V C | H1 E
X P F d k | p ! 0.5

E p

On ne peut dans le cas prsent calculer la puissance du test ( il y a une


puissance du test pour chaque valeur de p suprieure 0.5 )
On parle ici de fonction puissance
277

Probabilits et statistiques J.-M. Bourinet 2016

Application lexemple 2
Exemple 2 : Changement climatique
9 tudes climatologiques sur une longue priode de la temprature
moyenne Paris au mois daot
9 La temprature moyenne ( en C ) peut tre modlise par une v.a.
normale X  N 20,1
9 Observations des 10 dernires annes :
22 19 21 23 20 22 24 18 20

25

9 Ces observations rendent-elles vraisemblable lhypothse dun


rchauffement climatique de 1C ?
Identification du paramtre Tet choix des hypothses H0 et H1
X Paramtre concern T

PX

X Hypothses : H 0 : P X
H1 : P X

Probabilits et statistiques J.-M. Bourinet 2016

20
21

278

Application lexemple 2 ( suite )


Dtermination de la variable de dcision V et de la variable pivotale 3
X V
X 3

X
X  PX

n  N 0,1

VX

( loi normale pour la temprature )

T 219

En fonction de H1, dtermination de la rgion critique C


Formes courantes : C
X C

@ k,  f >

ou

@  f, k @

ou

@  f, kinf @

* ksup ,  f

@ k,  f >

En fonction du risque Det sous lhypothse H0 , dtermination de la


borne k ( ou des bornes kmin et ksup ) de cette rgion critique C tel que :

P V C | H 0 D
X P X C | H0

P X ! k | H0 D

X P X d k | H0 1  D

On prend en compte H 0 : P X

20
279

Probabilits et statistiques J.-M. Bourinet 2016

Application lexemple 2 ( suite )


k  20
X  20

X P
nd
n 1D
1
1

On choisit D

0.05 X u1D

1.6450 X

k  20
n u1D
1
1.6450 u 1
20 
20.52
10
X

Calcul de la ralisation v de la variable de dcision V sur l chantillon


considr ( x1, x2, , xn )
X v

21.4

Conclure en conservant lhypothse H0 si v C , ou en la rejetant si v C


X v

21.4 C

@ 20.52,  f >

X On rejette donc H0 au profit de H1 au niveau de signification D= 0.05

Probabilits et statistiques J.-M. Bourinet 2016

280

Application lexemple 2 ( suite )


Calculer ventuellement le risque de 2nde espce E laide de lexpression
suivante :
P V C | H1 E
X

P X d k | PX

k  21
X  21
P
nd
n
1
1

21

k  21
n
1

20.52  21
10
1

0.065

X La puissance du test 1 E vaut donc 0.935 ( cest la probabilit de


rejeter raison lhypothse H0 )

Probabilits et statistiques J.-M. Bourinet 2016

281

Exemple 2 : Illustration graphique

Rf. Cours UTC 2006

Probabilits et statistiques J.-M. Bourinet 2016

282

Tests statistiques
Principaux tests paramtriques

283

Probabilits et statistiques J.-M. Bourinet 2007

En rsum ( test sur la moyenne, X normale )


Hypothse

Population

H 0 : P X P0
H 1 : P X z P0

X  N P X ,V X

V X connu
X  N P X ,V X

V X inconnu
H 0 : P X P0
H 1 : P X  P0

X  N P X ,V X

V X connu
X  N P X ,V X

V X inconnu
H 0 : P X P0
H 1 : P X ! P0

X  N P X ,V X

V X connu
X  N P X ,V X

V X inconnu

Variable pivotale
3

X  PX

VX

X  PX
S X
X  PX

VX

X  PX
S X
X  PX

VX

X  PX
S X

Rgion de rejet

n  N 0,1

S d u1D 2 * S ! u1D 2

n  Tn 1

S d tn 1;1D 2 * S ! tn 1;1D 2

n  N 0,1

S d u1D

n  Tn 1

S d tn 1;1D

n  N 0,1

S ! u1D

n  Tn 1

S ! tn 1;1D

Probabilits et statistiques J.-M. Bourinet 2016

284

En rsum ( test sur la variance, X normale )


Hypothse

Population

H 0 : V X2 V 02
H1 : V X2 z V 02

X  N P X ,V X

S d kn ; D 2 * S ! kn ;1D 2

X  N P X ,V X

P X connue
3

P X inconnue
X  N P X ,V X
X  N P X ,V X

P X inconnue

 F n2

VX

nTX2

V X2

 F n2

n  1 S X 2  F 2
n 1
2
VX

P X connue

V X2

n  1 S X 2  F 2
n 1
2
3

X  N P X ,V X

Rq. : TX2

nTX2

P X connue

P X inconnue

H 0 : V X2 V 02
H1 : V X2 ! V 02

Rgion de rejet

X  N P X ,V X
H 0 : V X2 V 02
H1 : V X2  V 02

Variable pivotale

nTX2

V X2

 F n2

n  1 S X 2  F 2
n 1
2
VX

S d kn 1; D 2 * S ! kn 1;1D 2
S d kn ; D
S d kn 1; D
S ! kn ;1D

S ! kn 1;1D

1 n
2
X i  PX

ni1

285

Probabilits et statistiques J.-M. Bourinet 2016

En rsum ( X quelconque par TCL quand n o f )


Hypothse

Population

H 0 : P X P0
H 1 : P X z P0

V X inconnu

H 0 : V X2 V 02
H1 : V X2 z V 02

P X inconnue

H 0 : p p0
H1 : p z p0

Variable pivotale
3

3
3

X  PX
S X

n N 0,1
n of

S X 2  V X2
n N 0,1
n of
V X2 J 4  1
Fp
p 1  p

n N 0, 1
n of

Probabilits et statistiques J.-M. Bourinet 2016

Rgion de rejet

S d u1D 2 * S ! u1D 2
S d u1D 2 * S ! u1D 2
S d u1D 2 * S ! u1D 2

286

Tests statistiques
Tests dadquations ( ou dajustements )

Probabilits et statistiques J.-M. Bourinet 2007

287

Tests dadquations ( dits aussi dajustements )


Objectif
Vrifier, partir dun chantillon, si une v.a. suit ou non une certaine loi de
probabilit L suppose priori
Les tests seront de la forme :

H0 : X  L
H1 : X  L
Deux tests couramment utiliss :
9 Test du Chi-deux
9 Test de Kolmogorov ( ou Kolmogorov-Smirnov )

Probabilits et statistiques J.-M. Bourinet 2016

288

Prambule au test dadquation du F2 : loi multinomiale


Soit une exprience alatoire pouvant prendre K valeurs avec les probabilits
p1, p2, , pK telle que p1  p2  !  pK 1
T

Ayant ralis n fois cette exprience, on note N1 N 2 ! N K le vecteur


alatoire o Nk reprsente le nombre de fois o la kme valeur a t obtenue
K

On a :

et

k 1

k 1

Le vecteur alatoire N1 N 2 ! N K
paramtres n, p1, p2, , pK dfinie par :

N k  B n, pk pour k = 1, , K

N1 ! N K

suit alors la loi multinomiale de

n1 ! nK

n!
p1n1 ! pKnK
n1 ! ! nK !

Thorme

cv en loi
T

Si le vecteur N1 N 2 ! N K
suit une loi multinomiale de
paramtres n, p1, p2, , pK, alors :

N k  npk 2 F 2

K 1
n of
K

k 1

npk

289

Probabilits et statistiques J.-M. Bourinet 2016

Principe du test dadquation du F2


Le domaine de dfinition de la v.a. X est partitionn en K classes C1, , CK
On considre un chantillon alatoire X 1 , X 2 , ! , X n
parente note X

issu dune variable

Pour chaque k = 1, , K, on considre la variable alatoire Nk suivante :

Nk
X

N1 ! N K

card ^i ^1,!, n` | X i Ck `

 M n, p1 ,!, pK

loi multinomiale de
paramtres n, p1, p2, , pK

Transformation du test non paramtrique initial

H0 : X  L
H1 : X  L
en un test paramtrique portant sur les paramtres dune loi multinomiale
H 0 : pk pk 0 , k
H1 : k | pk z pk 0
Probabilits et statistiques J.-M. Bourinet 2016

290

Principe du test dadquation du F2 ( suite )


On utilise la variable de dcision suivante :

N k  npk 2 F 2

K 1
n of
K

npk

k 1

Seule la distribution asymptotique de D2 est connue. En pratique,


il faudra que les effectifs thoriques npk soient suprieurs 5

Rq. : D2 mesure lcart entre les frquences relatives empiriques Nk / n et


les frquences relatives thoriques pk, ou alors entre les effectifs Nk
et les effectifs thoriques npk
La rgion critique sera de la forme : C
On aura :

P V C | H 0

@ k,  f >

P D2 ! k | H0 D

Rq. : Plus la valeur prise par D2 sera petite, meilleur sera lajustement
entre la distribution empirique de lchantillon et la distribution
thorique L
291

Probabilits et statistiques J.-M. Bourinet 2016

Principe du test dadquation du F2 ( suite )


Calcul de k
Si H0 est vrifie, alors la distribution asymptotique de D2 est connue et
est une loi du Chi-deux K 1 r degrs de libert o r reprsente le
nombre de paramtres estimer pour la loi L

P V C | H 0

P D2 ! k | X  L

P D2 d k | X  L

1D

X
X

Probabilits et statistiques J.-M. Bourinet 2016

F K2 1r ;1D

292

Exemple 1

Rf. Cours UTC 2006

Probabilits et statistiques J.-M. Bourinet 2016

293

Exemple 2

Rf. Cours UTC 2006

Probabilits et statistiques J.-M. Bourinet 2016

294

Exemple 3

Rf. Cours UTC 2006

Probabilits et statistiques J.-M. Bourinet 2016

295

Exemple 4

Rf. Cours UTC 2006

Probabilits et statistiques J.-M. Bourinet 2016

296

Exemple 5

Rf. Cours UTC 2006

Probabilits et statistiques J.-M. Bourinet 2016

297

Probabilits et statistiques J.-M. Bourinet 2016

298

Cas particuliers :
Equiprobabilit et dnombrement

Probabilits et statistiques J.-M. Bourinet 2007

299

Cas particulier : fini et vnements quiprobables


On considre un univers des possibles : constitu de n lments Zi
On associe ces n lments Zi des vnements lmentaires quiprobables
1
1
 Zi : , P Zi pi p
avec p
card : n
On vrifie bien que

P :

p n
i

i 1

i 1

Pour tout vnement A, on aura P A

card A
card :

Dans ce cas particulier, les calculs de probabilit se ramnent le plus souvent


des problmes de dnombrement

Probabilits et statistiques J.-M. Bourinet 2016

300

Dnombrement Suite quelconque de longueur p


Soit B un ensemble fini de cardinal n
Lensemble des suites b1 ,!, bp
a pour cardinal n p

de longueur p o chaque bi est pris dans B

Cest lensemble de toutes les applications dun ensemble A de cardinal p


vers un ensemble B de cardinal n
Cette opration peut tre vue comme un choix successif au hasard et avec
remise ou comme un arrangement avec rptition de n objets pris p p
A

Probabilits et statistiques J.-M. Bourinet 2016

301

Suite quelconque de longueur p - Exemple


Exemple 1
Nombre de mots de 5 lettres ( non ncessairement prononables )
A : le mot de 5 lettres p = 5
265 mots possibles
B : les lettres de lalphabet n = 26
Exemple 2
r boules numrotes de 1 r, que lon rpartit dans n urnes numrotes
de 1 n. Nombre de rpartitions diffrentes possibles ? ( Rq. : une urne
peut recevoir plusieurs boules )
A : les boules p = r
nr rpartitions possibles
B : les urnes n
Exemple 3
Nombre de triplets possibles en lanant 3 ds
A : les 3 ds p = 3
63 triplets possibles
B : les numros de 1 6 n = 6
Probabilits et statistiques J.-M. Bourinet 2016

302

Dnombrement Nombre de parties dun ensemble


Soit A un ensemble fini de cardinal p
On numrote chaque lment de A : a1 , a2 ,!, a p
Toute partie P de A est caractrise par la donne dune suite x1 , x2 ,!, x p
o pour chaque i, i 1 p, xi 1 ou 0, suivant si ai appartient ou pas P
2
1

p
4

Suite = 1,0,0,1

3
P

Le nombre de parties dun ensemble est gal au nombre de suites de p


lments o chaque lment est pris dans ^ 0,1 `
Il y a donc 2 p parties possibles
Probabilits et statistiques J.-M. Bourinet 2016

303

Ensemble des parties dun ensemble Exemple


Exemple 1
Nombre de comits que lon peut former avec 7 personnes, y compris le
comit vide
27 comits possibles

Probabilits et statistiques J.-M. Bourinet 2016

304

Dnombrement Suite de termes distincts


Soit B un ensemble fini de cardinal n t 1
Lensemble des suites b1 ,!, bp de longueur p o chaque bi est pris dans B
et o tous les termes sont distincts a pour cardinal Anp
Cest lensemble de toutes les injections dun ensemble A de cardinal p vers
un ensemble B de cardinal n
Cette opration peut tre vue comme un arrangement sans rptition de n
objets pris p p
Si n = p, alors cest le nombre de bijections ( ou nombre de permutations )
Rappels :

Anp

n!
n n  1 ! n  p  1
n  p !

App

p!

Probabilits et statistiques J.-M. Bourinet 2016

305

Suite de termes distincts Exemple


Exemple 1
Nombre de tiercs possibles avec 25 chevaux
p=3
3
Anp A25
25 u 24 u 23 tiercs possibles
n = 25
Exemple 2
Anagrammes du mot TRAINE, dont les 6 lettres sont distinctes
p=6
Anp A66 6! anagrammes possibles
n=6

Probabilits et statistiques J.-M. Bourinet 2016

306

Dnombrement Parties dun ensemble


Le nombre de parties de cardinal p
dun ensemble de cardinal n est gal :
0
Proprits : Cn

Cnp

Cnn

Cnp

n!
p ! n  p !

avec n t p

Cnp1  Cnp11 ( triangle de Pascal )


0

Probabilits et statistiques J.-M. Bourinet 2016

307

Parties dun ensemble Exemples


Exemple 1
Nombre de mains de 5 cartes dans un jeu de 52
p=5
Cnp C525 mains possibles
n = 52
Exemple 2
Nombre de mains de 5 cartes dun jeu de bridge contenant exactement
2 as, 2 rois et 1 dame

C42C42C41 mains possibles

Probabilits et statistiques J.-M. Bourinet 2016

308

Vecteurs alatoires Exemples ( cas discret )

309

Probabilits et statistiques J.-M. Bourinet 2007

Vecteur alatoire discret Exemple 1


Exemple ii Chapitre 7 [Maz04]

0.2

P X

n Y

pXY(n,m)

On se donne la loi conjointe suivante :

p XY n, m
1

0.15
0.1
0.05

1 e
2n 1 m !

0
0 1
2 3
1 0
4 5
3 2
4
6 6 5
n
m

pour n, m entiers t 0

P X d n Y d m

FXY n, m

FXY(n,m)

9 Trouver la fonction de rpartition


conjointe FXY n, m

Loi dtermine numriquement

0.5
0
6

3
m

Probabilits et statistiques J.-M. Bourinet 2016

0 0

310

Vecteur alatoire discret Exemple 1 ( suite )


9 Trouver les lois marginales
en x et y

P X

pX n

Loi marginale en y
P Y m pY m

f

p n, m
XY

0.4

1 e 1
n1 m!
m 02

pXY(n,m)

m 0
f

Loi marginale en x
P X n pX n

1
2n 1

0.3
0.2
0.1

P Y

pY m

0
0 1
2 3
4 5
6 6
m

f

p n, m
XY

n 0

1 e 1

n 1
m!
n 02

4 3
n

2 1

e 1
m!

f

311

Probabilits et statistiques J.-M. Bourinet 2016

Vecteur alatoire discret Exemple 1 ( suite )


9 Trouver la loi de la v.a. Z

P Z

n ,m | n  m z

Y
T

n 0

M : `2 o `

X Y
T

n m
zn

X
oZ
Y

X Y

p n, z  n
XY

n 0

e 1
1

n 1
z  n !
n 02
z

ou

P Z

p z  m, m
XY

m 0

e 1

z  m 1
m!
n 02
z

Probabilits et statistiques J.-M. Bourinet 2016

312

Ingalit de Bienaym-Tchbicheff

313

Probabilits et statistiques J.-M. Bourinet 2007

Ingalit de Bienaym-Tchbicheff
Ingalit de Bienaym-Tchbicheff

k ! 0 , P X  P X t kV X

7 et V X2

1
k2

6
5 36 5
36 4
4 36
36 3
3 36
36 2
2 36
36
36 1
1
36
36

pX x

On sintresse la v.a. X associe


la somme des faces de 2 ds non pips
On montre que : P X

35
6

On veut trouver : P X  7 t 5

9 10 11 12

Par lingalit de Bienaym-Tchbicheff ( donc sans connatre la loi ), on a :

P X 7 t 5 d

35 6
7
soit : P X  7 t 5 d
2
5
30

Valeur exacte

P ^ X

2` * ^ X

12`

1
18

Probabilits et statistiques J.-M. Bourinet 2016

0.233 ( On prend ici kV X


0.056

5)

Pas prcis
mais cest sans
connatre la loi de X !
314

Convergence de la binomiale vers la normale

315

Probabilits et statistiques J.-M. Bourinet 2007

Convergence de la binomiale vers la normale


Soit X n la suite de variables alatoires binomiales telle que X n  B n, p
On a :

X n  np L

N 0,1
np

p
1

Problme du passage dune


loi discrte une loi continue

pour

nof
np grand

En pratique :
np t 10 et n(1p) t 10

P X x o P x  X d x  d x
pX x o f X X d x

B n, p

X On effectue ce quon appelle


une correction de continuit

N np, np 1  p

On prend :

P X

1
x  1  np
x

 np

2
2
x  P
U d

np
1
p
np
1
p





Probabilits et statistiques J.-M. Bourinet 2016

1
x
2

1
x
2

x
316

Convergence de la binomiale vers la normale ( suite )


1

x


np

2
On a ainsi : P X d x  P U d

np
1

p

Cas n, p

3.5  10
2.5  10
3  P
U d

10 u 0.9
10 u 0.9

P X

12.5  10
11.5  10
12  P
U d

10 u 0.9
10 u 0.9

0.5

) 2.167  ) 2.500 0.009 / 0.006

0.2

0.3

pX(k)

0.3

np 1
n 1  p 9

0.2

6
k

10

0
0

0.15

np 2
n 1  p 18

0.2
0.1

0.1
2

n, p 20,0.1
pX(k)

n, p 10,0.1

Exact
0.106 / 0.099

) 0.8333  ) 0.5000

0.4

0.4

pX(k)

do :

100,0.1 , soit np 10 et n 1  p 90

P X

0
0

x  1  np

2
FX x  )

np

p
1

10
k

15

n, p 100,0.1
np 10
n 1  p 90

0.1
0.05

20

0
0

20

40

60

80

100

Probabiits et statistiques J.-M. Bourinet 2016

317

ER[SORW RXERLWHjPRXVWDFKH

Probabilits et statistiques J.-M. Bourinet 2007

318

Diagramme de boite ( box plot ) ou boite moustache


Synthse sur un seul graphique, afin de procder des comparaisons entre
sries statistiques
mdiane
Q2 x0.5

1.5 Q3  Q1

Valeur
aberrante

1.5 Q3  Q1

1.5 u IQR

Plus petite valeur


qui ne soit pas une
valeur aberrante

1.5 u IQR

Q1 x0.25
1er quartile

Q3

x0.75
3me quartile

Valeurs
aberrantes

Plus grande valeur


qui ne soit pas une
valeur aberrante

IQR
Q3  Q1

319

Probabilits et statistiques J.-M. Bourinet 2016

Exemple
chantillon de n = 50 valeurs reprsentant le montant dachats de clients
3.11
18.36
24.58
36.37
50.39

8.88
18.43
25.13
38.64
52.75

9.26
19.27
26.24
39.16
54.80

10.81
19.50
26.26
41.02
59.07

12.69
19.54
27.65
42.97
61.22

13.78
20.16
28.06
44.08
70.32

15.23
20.59
28.08
44.67
82.70

15.62
22.22
28.38
45.40
85.76

17.00
23.04
32.03
46.69
86.37

17.39
24.47
34.98
48.65
93.34


X

3

4

J
J

34.70
21.70
1.07
3.52

Frquences absolues

20

Q2
15

x0.5
27.86

3.11

84.60

10

Q1

x0.25
19.27

0
0

20

40
60
80
Montant de l'achat

100

Probabilits et statistiques J.-M. Bourinet 2016

20

Q3

x0.75
45.40

40
60
80
Montant de l'achat
320