Vous êtes sur la page 1sur 50

1

Statistiques
I ntroduction
Ensemble des mthodes et procds partir desquelles
on recueille, organise, rsume et analyse des donnes, et
qui permettent den tirer des conclusions et de prendre
des dcision judicieuses.
Statistiques descriptives Statistiques inductives
2
Dfinitions
Statistique descriptive
Cest la phase analytique qui consiste rduire les donnes un
nombre limit de paramtres caractristiques susceptibles de dcrire
la srie statistique.

Statistique inductive
Cest une phase qui permet de dduire des rsultats obtenus sur un
chantillon afin de prendre des conclusions relatives lensemble de
la population entire.
3
Quelques terminologies de la statistique
Population (univers):
Tout ensemble tudi en statistique sappelle population. Les lments sont
appels individus.
chantillon:
Cest un sous- ensemble dune population.
Effectif : ( n
i
)
Leffectif est associ une variable: cest le nombre de fois que cette
variable se rpte.
Frquence: ( f
i
)
Le rapport entre leffectif et le nombre deffectif total.
Modalit: La valeur prise par une variable X.
4
Quelques terminologies de la statistique
Variable:
Elle est dfinie comme tant une quantit ou caractristique qui peut
varier dun individu un autre.
Ex: taille, poids, nationalit


Variable quantitative:
Elle prend des valeurs numriques
et peut tre discrte ou continue
Variable qualitative:
Elle ne prend ni valeur numrique et
ni un ordre naturel (ex: profession)
5
Les premiers traitement de linformation
Cest la phase initiale o il sagit de rassembler des donnes, de les
regrouper et les prsents sous forme de :
- Tableaux
Ou
- Graphiques
Le tableau tablit la correspondance entre deux sries de
nombres, lune est constitue par les valeurs de la variable
tudie ( Modalits ), lautre par les effectifs correspondants
( ou dautres : frquences,.)
Exemples:
6
Les premiers traitement de linformation
Exemple 1:
Dosage du phosphore par polarographie tension sinusodale surimpos::La mesure
de la hauteur dun pic de rduction dune solution phosphomolybdique talon donne
les rsultats suivants:
60, 59, 58, 58, 56, 57, 60, 59, 59, 59, 58, 59, 61, 60, 61
60, 58, 59, 60, 59, 59, 60, 59, 57, 60, 61, 59, 59, 56, 58.
Exemple 2:
On effectue lanalyse du sang de 20 personnes qui ont manipul un gaz
toxique. La mesure du taux de leucocytes ( globules blanc), par mm3, donne
les rsultats suivants :
3600 5100 6100 4600 5100 4800 3200 4700
5600 6900 5300 6100 3900 4200 3400 6300
5400 6200 3200 3700
7
Exemple 3:
Lquipe de contrle de qualit dune maison dalimentation doit vrifier le poids dun produit
devant tre vendu en format de 20 g. Pour ce faire, on pse le contenu de 75 pots de ce produit,
slectionns au hasard. On obtient la distribution suivante :
-Cette distribution est-elle celle dune population ou celle dun chantillon?
- Quelle est le caractre tudi? Identifier le type.
- Complter le tableau.
Les premiers traitement de linformation
L(en mm) 115-125 125-135 135-145 145-155 155-165 165-175 175-185
Nbre de tiges 3 5 9 12 5 4 2
Exemple 4:
On veut tudier la longueur des tiges dacier dun certaine production. Pour cela on a extrait
un lot dont les rsultats sont donns dans le tableau ci-dessous.
Faire une tude descriptive.
Poids (en g) 19 20 21 22 23 24
Nbre de pots 1 7 31 24 11 1
8
Prsentations graphiques
Diagramme en btons (variable discrte):
Lorsque la variable est discrte, on utilise le diagramme en btons, tel que les
modalits sont portes sur laxe des abscisses et les frquences (ou effectifs) sur
laxe des ordonnes.
Si lon joint les sommets des btons, on obtient le polygone des frquences
Histogramme (variable continue):
Histogramme est form de bandes rectangulaires ayant la largeur de chaque
classe et dont la hauteur est proportionnelle leffectif de la classe considre.
Le polygone des effectifs (frquences) sobtient en joignant les divers points
(c
i
, n
i
)
Diagramme circulaire (variable qualitative): o
i
= f
i
*360

9
Calcul des lments caractristiques dune srie statistique
Cest une phase analytique qui consiste rduire les donnes un nombre
limit de paramtres caractristiques.
Paramtres de position
(moyenne, mdiane)
Paramtres de dispersion
(cart type, variance)
Permettre de se rendre compte
sur lordre de grandeur de
lensemble des observations et
de localiser la zone des
frquences maximale
Prciser le degr de dispersion
des diffrentes observations
autour dune valeur centrale.
10
Paramtres de position
Mode:
La valeur de la variable correspondant leffectif le plus grand.
Lorsquil sagit de la classe on dit classe modale.
Mdiane:
la valeur de la variable statistique qui partage la population en deux effectifs
gaux.
Deux mthodes sont considrer selon quil sagit de variable statistiques
discrtes ou continues.



Variable discrte- variable continue
11
Paramtres de position
Variable discrte
Reprsentation graphique point dintersection des courbes cumules f
n/2 M
e

Variable continue
On cherche la classe mdiane
12
Paramtres de position
Les moyennes:
i) La moyenne arithmtique:
Soit une variable X x
1
, x
2
, x
i
, x
n

On appelle moyenne arithmtique le rapport:
x = 1/n n
i
x
i

ii) La moyenne gomtrique:
Lorsquune variable croit suivant une progression gomtrique.
x
1
= x
0
*r
x
2
= x
1
*r

x
n
= x
n-1
*r
g = x
0
r
n/2
13
Paramtres de position
iii) Moyenne harmonique:
Soit x (x
1
x
n
) (1/x
1
, 1/x
2
., 1/x
n
)



iv) Moyenne quadratique:
x ( x
1
, x
2
x
n
) (x
2
1
, x
2
2
, x
2
n
)

=
=
n
i
i
n
H
x
1
1

=
=
n
i
i
n
q
x
1
2
1
14
Paramtres de dispersion
Les paramtres de position sont insuffisants pour caractriser compltement
une srie
Ex : m
1
= m
2
de deux sries diffrentes
la rpartition


Paramtres de dispersion
Dev. x
i
X
Ecart |x
i
- X|
Etendue X
max
x
min

15
Paramtres de dispersion
Etendue :
W = X
max
X
min
Ecart moyen arithmtique:
Cest la moyenne arithmtique des carts / la X (MA)
E = 1/n n
i
|x
i
- X|
Variance V :
Cest la moyenne arithmtique des carres des carts / X (MA)
cart- type o :
Lcart type (ou cart quadratique moyen = rms) est la V
o = V
16
Paramtres de dispersion
Covariance:
Cov(X,Y) = 1/n (x
i
X) (y
i
Y)

Coefficient de variation CV :
CV = s/X *100
- CV donne une trs bonne ide sur le degr dhomognit dune
distribution statistique ( CV < 15%).
- Comparaison de deux distribution.
17
Ajustement linaire & corrlation
Cas gnrale:
Lajustement du nuage obtenu consiste dterminer une fonction de liaison
entre X & Y.
y = ax + b ou y = a e
bx

18
Ajustement linaire & corrlation
y= a log x + b
19
Ajustement linaire & corrlation
Y= a/x+ b
20
Ajustement linaire & corrlation
Dune manire gnrale, lajustement consiste rechercher une fonction
f(x) dont la graphe se rapproche le plus possible des points du
digramme.
On a toujours:


y
i
= f(x
i
) +
i

i
= y
i
- f(x
i
)
La mthode dajustement consiste dterminer les paramtres de f(x) qui
minimisent ces carts.
|
i
| ou bien

=
i i
i
i
i
x f y )) ( (
2
2
c
Cest la mthode des moindres carres
21
( ) ( )
2
1
,

=
=
n
i
i
i
b ax b a S
y
Ajustement linaire & corrlation

=
n
i
i
i
i
x n
y x n
a
x
y
x
1
2
2
( )

=
2
x
y x n
a
x
y
x
i
i
i
Droite de rgression:
il sagit de dterminer a et b pour soit
minimale.
La droite de rgression passe par le point (x,y)
22
Ajustement linaire & corrlation
Cfficient de corrlation:
Le coefficient de corrlation permet de mesurer la prcision de lajustement
( )
( )
y x
Y X Cov
Y X r
o o
,
, =
Cas extrmes:
r= -1 il ya relation linaire parfaite y=ax+b avec a<0
r= 1 il ya relation linaire parfaite y=ax+b avce a>0
r0 il nexiste aucune relation linaire entre X&Y
23
Cette loi occupe une place privilgie en calcul statistique.
Soit X une variable alatoire continue. On dit que X suit une loi
normale (ou loi de Laplace- Gauss) si la densit de probabilit est :
f (x) = (1/ o2). e
-1/2 ((x- m)/o)2
Tracer f(x):




o dfinit la largeur mi-hauteur de la courbe :
Plus o est grand plus le max est faible et plus la courbe est large
Loi normale (loi de Laplace- Gauss)
m
24

Calculer : Prob ( m x
0
X m + x
0
)

laire de la courbe de Gauss comprise entre m- x
0
et m+ x
0

Loi normale (loi de Laplace- Gauss)
m m x
0
m + x
0
Changement de variable : t = (x-m)/o ( voir dmonstration )
La loi centre rduite de paramtre m = 0 & o = 1
25
Loi normale (loi de Laplace- Gauss)
Utilisation de la table
Prob (m x
0
X m + x
0
) = Prob (-t
0
T t
0
)

t
0.01 0.02 0.06 0.09
0.0
0.1
1.9 0.475
3.8
3.9
0 t
t = 1.96
26
Loi normale (loi de Laplace- Gauss)
Calculer : Prob (m o X m + o )
Prob (m 2o X m + 2o )

Prob (m 3o X m + 3o )
27
Loi Normale (Loi De Laplace- Gauss)
Exemple:
La taille des lves dune cole suit une distribution N (150, 20). N= 1000
1. Quelle est le nombre dlves ayant une taille comprise entre 140 & 160 ?
2. Quelle est le nombre dlves ayant une taille comprise entre 140 & 170 ?
3. Quelle est le nombre dlves ayant une taille comprise entre 130 & 170 ?
4. Quelle est le nombre dlves ayant une taille suprieure 170 ?
5. Quelle est le nombre dlves ayant une taille infrieure 130 ?
6. Quelle est le nombre dlves ayant une taille infrieure 175 ?
7. Quelle est le nombre dlves ayant une taille suprieure 135 ?
28
Loi Binomiale
Dfinition
Soit une srie de n preuves successives et indpendantes ( preuve de
Bernoulli)dont lissue de chaque preuve est soit succs avec une
probabilit p, soit insuccs avec une probabilit q= 1-p, alors la
probabilit davoir x succs en n preuves est donne par lexpression:

( )
q p
C
x n x
x
n
x X ob

= = Pr
B (n,p)
Conditions dapplication:


Les rsultats de lexprience ne comporte que 2 rsultats possibles: succs ou insuccs
On rpte lexprience n fois
La probabilit de ralisation de lvnement succs est la mme chaque essai note p.
Les essais sont indpendantes et non exhaustifs ( ou n/N 0.10 ) .
29
Loi Binomiale
Proprits:
Les paramtres de la loi binomiale sont n et p ( n > 0 et 0 < p < 1)
La moyenne et la variance sont: M = n p & = n p(1-p)
Les valeurs tabules:
n k p
0.10 0.20 0.30 0.40 0.50

2
0
1
2
0.8100
0.1800
0.0100
0.6400
0.3200
0.0400
0.4900
0.4200
0.0900
0.3600
0.4800
0.1600
0.2500
0.5000
0.2500

3
0
1
2
3
0.7290
0.2430
0.0270
0.0010
30
Loi Binomiale
La loi binomiale permet dvaluer la probabilit de tirer x produits
dfectueux dans un chantillon de n produits provenant dun lot important
contenant p% de dfectueux.

Exemple:
Soit un lot contenant une proportion de 10% de produits dfectueux.
On prlve un chantillon de 8 produits sans remise. Calculer la probabilit de
tirer dans un chantillon:

un ou zro produit non- conforme
au moins deux produits non- conformes
Au plus un produit non- conforme


31
Loi de Poisson
Dfinition:
On dit quune variable alatoire X suit une loi de poisson, si elle est
successible de prendre toutes les valeurs entires 0, 1, 2, 3,..n,
la probabilit que X soit gale k tant:
( )
e
k
k X ob
k


= = Pr
Conditions dapplication:
La loi de poisson sappelle encore la loi des petites probabilits. Elle est
utilise pour prsenter des phnomnes rares:nombres daccidents,
nombre de dfauts, de dchets.
Proprits:
La moyenne et la variance sont: E(X)= & =
32
Loi de Poisson
Les valeurs tabules:

K

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0
1
2 k
3

k

1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
0
1
2
( ) k X ob = Pr
33
Loi de Poisson
La loi de poisson est largement utilise pour dcrire les dfauts
compatibles par unit ( exemple, le nombre de ponts de soudure sur un
circuit imprim, pannes de machines, appels tlphoniques sur une ligne,
arrives de clients comptoir)

Exemple 1:
Supposons que les dfauts pont de soudure sur un circuit imprim soit
distribu selon une loi de poisson avec un paramtre = 2.
Calculer la probabilit quun circuit contienne un pont de soudure au moins.

Exemple 2:
Si la probabilit pour quun individu ait une mauvaise raction dun certain
srum est de 0.001, dterminer la probabilit pour que sur 2000 individus :
- 3
- plus de 2
aient une raction dangereuse.
34
Echantionnage
&
Estimation
35
Echantillonnage
Lchantillonnage a pour objectif dtudier le lien entre la distribution
statistique dune variable X dans une population P et les distributions de
cette variable dans diffrents chantillons.
Pop :
N, M, o

Echantillons i : n, m
i
, o
i
INTRODUCTION
Echantillonage alatoire = Les individus ont mme Probabilit
Exhaustif Non-exhaustif
?
36
Echantillonnage
Soit une Population P X N, M, o : E(X) = M & o = o(X)
soient tous les Echantillons i : n ( k chantillons )

Distribution des moyennes dchantillons
1 ( n, m
1
, o
1
)
2 ( n, m
2
, o
2
)
i ( n, m
i
, o
i
)
k ( n, m
k
, o
k
)
Lensemble :
m (m
1
,m
2
,,m
i
,..m
k
) constitue une
srie statistique deffectif k appele
Distribution des Moyennes.
37
Echantillonnage
Distribution des moyennes dchantillons
Pop :
N, M, o

Echantillons i : n, m
i
, o
i
Non-Exhaustif Exhaustif
E(X) = M
n
m
o
o
=
E(X) = M
1

=
N
n N
n
m
o
o
38
Echantillonnage
Distribution des frquences dchantillons
Soit une Population P N X
1
0
p = proportions dlments ayant X = 1
On dsigne par
q = proportions dlments ayant X = 0
tq : p + q = 1 , 0 < p < 1 & 0 < q < 1
La population P de taille est caractrise par :
E(X) = p
o = p*q
39
Echantillonnage
Soit une Population P X N, F, o
F
: E(F) = p & o
F
= p*q
soient tous les Echantillons i : n ( k chantillons )

Distribution des frquences dchantillons
1 ( n, f
1
, o
1
)
2 ( n, f
2
, o
2
)
i ( n, f
i
, o
i
)
k ( n, f
k
, o
k
)
Lensemble :
m (f
1
,f
2
,,f
i
,..f
k
) constitue une srie
statistique deffectif k appele
Distribution des Frquences.
40
Echantillonnage
Distribution des frquences dchantillons
Pop :
N, F, o
F
Echantillons i : n, f
i
, o
i
Non-Exhaustif Exhaustif
E(f) = p
n
q p
f
m
*
) ( =
o
E(f) = p
1
*
) (

=
N
n N
n
q p
f
m
o
41
Echantillonnage
Autres distributions dchantillonnage
Distributions
N, M, o


_ t
n < 30 Ajustement dune distribution
thorique et exprimentale
On peut dfinir dautres distributions pour toutes variables susceptibles
dtre variable dun chantillon lautre ( o, Me, V,..).
42
Echantillonnage
Distribution t:
Distribution
N, M, o

X
Loi normale N (M, o)
soit un chantillon de taille n (n, m
i
, o
i
)
n
M mi
o

= ti
Ecart Rduit
43
Echantillonnage
Distribution _
Pop :
N, M, o

Echantillons i : n, m
i
, o
i
2
1
2
) (
2
o
_

=

=
n
j
i
m
i
j
x
i
La srie (_
1
, _
2
, _
i
_
n
) constitue une distribution de _
44
Estimation
Introduction
Si lchantillonnage tudi les relations existants entre une population et tous les
chantillons de mme taille n, lestimation vise tudier la reprsentativit de la
population par un chantillon.
IL sagit dattribuer une valeur un paramtre inconnu de la population
partir de la connaissance dun chantillon extrait de cette population.
Il y a deux types destimation :
Estimation ponctuelle : Attribuer une valeur unique
Estimation par intervalle de confiance ( IC ) : Donner un
intervalle susceptible de recouvrir la valeur recherche
avec une probabilit donne.
45
1. Estimation Ponctuelle de la moyenne : M = E(X) = m
2. Estimation Ponctuelle d une variance :



3. Estimation ponctuelle dune variance dun chantillon ( s ) :
Estimation
1
'

=
n
n
o o
1
'

=
n
X
o
o
Estimation Ponctuelle
Pop : N, M, o

Echantillons i : n, m
i
, o
i


( M, o sont inconnus )

=
) (
2
) 1 (
1
2
X
x
s
i
n
46
Estimation
Estimation par I ntervalle de confiance ( I C )
Lestimation par IC dun paramtre O consiste calculer, partir dun estimateur
choisi u, un intervalle dans lequel il est vraisemblable que la valeur correspondante
du paramtre sy trouve.
LIC est dfini par deux limites auxquelles est associe une certaine probabilit, fixe
lavance et aussi leve quon dsire, de contenir la valeur vraie du paramtre
inconnu :
Prob ( LI O LS ) = 1 - o
Avec (1-o) = Probabilit associe
lintervalle dencadrer la vraie valeur

1 - o
o/2 o/2
47
Estimation
Estimation par I ntervalle de confiance ( I C )
On peut crire aussi :
Prob ( u - k O u + k ) = 1 - o
La quantit k dpend de la distribution dchantillonnage spcifie de lestimateur
et de la probabilit associe ( o = risque derreur ) ( voir schma )
Applications :
Estimation par IC dune moyenne
Estimation par IC dune proportion
48
Il y a 3 cas possibles :
1. Si o est connu :
Prob ( m - t
o
o
m
M m + t
o
o
m
) = 1 - o
2. Si o est inconnu et n > 30 :
Prob ( m - t
o
o
m
M m + t
o
o
m
) = 1 - o
3. Si o est inconnu et n < 30 :
Prob ( m - t
ov
o
m
M m + t
ov
o
m
) = 1 - o
o
m
est lcart type de la distribution chantillonnage
t
o
valeur extrait de la table N(0,1)
t
ov
valeur extrait de la table de la loi de Student (o,v)
Estimation
Estimation par IC dune moyenne
49
Estimation
Estimation par IC dune proportion
n
m
o
o
=
Dans le cas de lestimation dune proportion on a seul cas car o est
connu et donn par :
o
2
= p*( 1- p )
Alors IC est donn par :
Prob ( m - t
o
o
m
M m + t
o
o
m
) = 1 - o


Avec o
m
est lcart type de la distribution chantillonnage :

50
Estimation
Remarques
1. Echantillonnage exhaustif :

2. Encadrement de la moyenne de chantillon:

3. Utilisation de la table de Student :
n
m
o
o
=
1

=
N
n N
n
m
o
o
Prob ( M - t
o
o
m
m M + t
o
o
m
) = 1 - o
o/2 o/2
1-o
t
o
-t
o

0.9 0.5 0.4 0.01 0.001
1
2
3

v
o