Vous êtes sur la page 1sur 72

Introduction et Gnralits

sur les statistiques


1. Introduction
La statistique est un ensemble de techniques
mathmatiques permettant de recueillir,
dcrire et interprter des donnes, avant
la prise de dcision.
1. Introduction
Les statistiques ne se limitent plus comme lorigine aux
seules donnes dmographiques, conomiques ou
sociologiques.
On y a recourt maintenant dans de nombreux domaines :


En sciences physiques : thermodynamique, mcanique
statistique, astronomie.


En gophysique : mtorologie et climatologie.


En biologie : hrdit, gntique, mdecine.


En psychologie : sondages dopinions.


En industrie : contrle de qualit des productions.


Dans le domaine tertiaire : banques et assurances


Les deux aspects de la statistique
1. La statistique descriptive.
2. La statistique infrentielle.
1. La statistique descriptive
On dsigne par statistique descriptive lensemble
des mthodes de collecte et traitement des
donnes.
La description des donnes passe par :


Une prsentation synthtique (tableaux).


Une reprsentation graphique adapte
(histogramme).


Un rsum numrique par le calcul de certaines
grandeurs typiques (moyenne).


Une tude des ventuelles corrlations entre
variables.
Donnes relatives aux employs dune banque
Comment peut-on rendre plus intelligibles ces
donnes ?
Existe-t-

ils des valeurs typiques qui permettraient de rsumer
lensemble des donnes ?
Quelles sont les reprsentations graphiques requises
pour mieux visualiser le comportement de ces
variables et quelles interprtations peut-on en faire ?
(c) K. EL HIMDI (c) K. EL HIMDI
7
Secrtariat Cadre Responsable
Catgorie d'employ
0
100
200
300
400
O
c
c
u
r
r
e
n
c
e
s
363
27
84
Catgorie d'employ
363 76,6 76,6 76,6
27 5,7 5,7 82,3
84 17,7 17,7 100,0
474 100,0 100,0
Secrtariat
Cadre
Responsable
Total
Valide
Effectifs Pourcentage
Pourcentage
valide
Pourcentage
cumul
1. La statistique descriptive
Exemple : notes des tudiants de SMI lexamen
de statistiques.


On collecte les rsultats dans chaque groupe.


On reprsente la rpartition des notes par un
histogramme.


On rsume la srie par sa moyenne,
mdiane


On mesure la dispersion avec lcart-type
2. La statistique infrentielle
La statistique infrentielle est pour sa part
lensemble des mthodes qui permettent partir
de ltude dun chantillon dinduire des
informations sur une population.
Elle ncessite un choix judicieux de lchantillon,
i.e. il doit tre reprsentatif de la population (cf.
exemple des lections amricaines de 1936)
Elle utilise des modles thoriques de rfrence,
les lois de probabilits (dont ltude sera dans
la Partie 1 de ce cours).
En effet, on constate en gnral que la rpartition
statistique dune variable sur un chantillon est
voisine dune loi de probabilit.
(c) K. EL HIMDI
10
Lobjectif :
procder l'estimation de paramtres de la
population partir dun chantillon
Pourquoi?
On fait un chantillonnage et non pas une
enqute exhaustive en gnral pour des raisons
de cot, ou simplement parce que l'enqute est
destructive (exemple : test de dure de vie d'une
batterie).
Infrence Statistique
2. La statistique infrentielle
La statistique infrentielle permet
alors :


Destimer les paramtres de la
loi de probabilit partir de
lchantillon.


De mesurer la validit de cette
estimation par un intervalle de
confiance.


De mesurer ladquation de la
loi de probabilit choisie
lchantillon par des tests
statistiques.
Probabilit vs Statistique
Probabilits :


le modle est compltement spcifie


le but essentiel est dexploiter le modle pour prendre des dcisions


ncessite rigueur et cohrence


Raisonnement dductif
Statistique :


le modle est inconnu, mais on dispose dobservations


le but essentiel est de complter le modle laide des observations


ncessite intuition et sens physique


Raisonnement inductif (Infrence)
NB.


Dans de nombreuses applications, on peut trs bien utiliser le calcul
de probabilits sans faire appel la statistique.


Il est presque impossible de faire de la statistique sans faire appel
au calcul des probabilits.
Exemple de problme de statistique
Exemple de raisonnement probabiliste
15
Partie 1
Introduction aux probabilits
S5-SMA
16
Sommaire
0 -

INTRODUCTION
1 -

THEORIE DES ENSEMBLES ET EVENEMENTS
2 -

THEORIE DES PROBABILITES
2.1 Axiomes et proprits
2.2 Calcul des probabilits
2.3 Dnombrement
2.4 Evnements quiprobables
3 -

PROBABILITES CONDITIONNELLES ET INDEPENDANCE
3.1 Probabilit

conditionnelle
3.2 Indpendance
4 -

VARIABLES ALEATOIRS
4.1 Dfinition d'une variable alatoire
4.2 Fonction de rpartition et densit

de probabilit
4.3 Fonctions de variables alatoires
4.4 Fonction gnratrice des moments et fonction caractristique
5 -

FAMILLE DE DISTRIBUTIONS USUELLES
5.1 Distributions discrtes
5.2 Distributions continues
6 -

VARIABLES ET DISTRIBUTIONS MULTIVARIEES
6.1 Distributions conjointe et marginales de (X,Y)
6.2 Distributions conditionnelles et indpendance
6.3 Distribution d'une fonction du (X,Y)
6.4 Covariance et corrlation
6.5 Gnralisation au cas multivari.
Introduction
Le calcul des probabilits est l'une des branches les plus rcentes
des mathmatiques. Aprs s'tre cantonn

dans l'tude des jeux de
hasard, il s'est introduit dans presque toutes les branches de
l'activit

scientifique. On peut, sans paradoxe, soutenir que toutes
les mathmatiques anciennes sont un cas particulier du calcul des
probabilits, le certain tant de l'alatoire dont la ralisation a une
probabilit

gale

1.
Le calcul des probabilits est n

de l'tude des jeux de hasard. Ce
dernier mot, transmis par l'Espagne, vient d'Arabie. Le mot Arabe
az-zhar, "d


jouer", s'est transform

en azar, "hasard" en
espagnol.
La base du calcul des probabilits est donc le jeu et, sans
l'activit

des joueurs, le calcul des probabilits n'aurait srement
pas vu le jour.
Depuis le 17
ime

sicle, de nombreux mathmaticiens ont apport

une importante contribution au dveloppement de cette science:
Laplace, Poisson, Gauss, Poincar, Borel, Frechet, Levy,
Kolmogorov, Khintchine, etc..
Ce cours introductif a pour objectif de prsenter les outils
probabilistes de base.
Nous introduisons successivement les notions de calcul de
probabilits, de variables alatoires et de distribution thorique
puis nous prsentons quelques unes des distributions classiques.
Introduction
S5-SMA 19
Introduction aux probabilits
S5-SMA 20
S4-SMI 21
22
23
24
S5-SMA 25
3.1 Probabilit conditionnelle
26
3.1 Probabilit conditionnelle
Thorme de Bayes : Il permet dexprimer P(B/A) en
fonction de P(A/B).
P(A)
B)P(B) / P(A
P(B/A)
Thorme des probabilits totales (gnralisation du
thorme de Bayes) :
Soit (B
i
, iIN) une partition

i.e. une suite densembles
B
1
,B
2
,, de parties de

incompatibles 2 2 dont la runion
constitue . On peut alors crire:
) )P(B P(A/B P(A) i
1 i
i

28
S5-SMA 29
30
-1
31
32
4.2 Fonction de rpartition et densit

de probabilit
Dfinition 9
La fonction de rpartition F
X

de la variable
alatoire X est dfinie par:
F
X

(x) = P
X

(]-,x]) = P(X

x ) , x IR.
4.2 Fonction de rpartition et densit

de
probabilit
4.2 Fonction de rpartition et densit

de
probabilit
S5-SMA 36
4.2 Fonction de rpartition et densit

de
probabilit
4.2 Fonction de rpartition et densit

de
probabilit
4.2 Fonction de rpartition et densit

de
probabilit
S4-SMI 40
Chap4-Echantillonnage
S4-SMI 41
Chap4-Echantillonnage
-1
-1
Y
X
42
S4-SMI 43
Chap4-Echantillonnage
S4-SMI 44
Chap4-Echantillonnage
45 S5-SMA
S4-SMI 46
Chap4-Echantillonnage
47 S5-SMA
48 S5-SMA
49 S5-SMA
50 S5-SMA
S4-SMI 51
Chap4-Echantillonnage
S4-SMI 52
Chap4-Echantillonnage
S5-SMA 53
S5-SMA 54
Chap4-Echantillonnage
S5-SMA 55
S4-SMI 56
S4-SMI 57
S5-SMA 58
59 S5-SMA
60 S5-SMA
S4-SMI 61
Chap4-Echantillonnage
S4-SMI 62
63 S5-SMA
S4-SMI 64
Chap4-Echantillonnage
65 S5-SMA
S4-SMI 66
Chap4-Echantillonnage
S4-SMI 67
Chap4-Echantillonnage
68 S5-SMA
S5-SMA 69
S4-SMI 70
Chap4-Echantillonnage
S5-SMA
71
S5-SMA 72