Vous êtes sur la page 1sur 33

Cours de statistiques dIUT

Jean-Michel BERNABOTTO
1
Ch a p i t r e 1 LES STATI STI QUES DESCRI P TI VES

A. S t a t i st i qu es a u n e va r i a bl e
1. Voca b u la i r e d e la st a t i st i q u e
Un ensemble dobjets ou de personnes dune tude statistique est appel population. Un lment de
cette population est appel individu.
Ltude statistique porte sur un caractre. Si le caractre est quantitatif, les mesures sont alors les
valeurs dune variable statistique (ex : un ge, une taille...). Si le caractre est qualitatif, on est oblig
de le quantifier (ex : sexe...).
La variable est dite discrte si elle ne prend que des valeurs isoles (ex : entires). Elle est continue si
elle peut prendre toutes la valeurs dun intervalle (ex : R).
Leffectif dune population est le nombre dindividus total de cette population. La frquence dun
caractre est le nombre dindividus possdant ce caractre divis par leffectif total de la population.

2. Les va r i a bles d i scr t es
a) Reprsentation
On reprsente les variables alatoires discrtes sous forme dhistogramme ou de camembert grce aux
diffrentes frquences
b) Caractristiques
(1) La moyenne
Soit n valeurs distinctes ou non de la variable. Si cette variable prend p valeurs distinctes (p n), x
1
,,x
p

, deffectifs respectifs n
1
,n
p
alors la moyenne est donne par :

p
i i
i=1
1
x= n x
n


(2) Proprit
si pour tout i, on peut oprer un changement de variable affine du type : x
i
= aX
i
+ b
alors x aX + b.
(3) La variance
Elle est donne par la formule : : V
1
n
n
i
(x
i
x )
2
i1
p

.
(4) Lcart-type
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
2
Il est donn par la formule : V
(5) Proprits
La formule suivante est plus pratique pour le calcul de V : V
1
n
n
i
x
i
2
i1
p

x
2

De plus si pour tout i, x
i
= aX
i
+ b alors V
x
= a
2
V
X
et
x
= a
X
.
3. Les va r i a b les con t i n u es
a) Reprsentation
Pour leur reprsentation, on regroupe en gnral dans des classes adjacentes damplitudes pas
forcment gales. Ceci est reprsent dans le tableau ci-dessous :
classes [X
0
; X
1
[ [X
1
; X
2
[ [X
p-1
; X
p
]
centre des classes x
1
x
2
x
p

effectifs n
1
n
2
n
p

frquences n
1
/n n
2
/n n
p
/n

La reprsentation seffectue alors grce un histogramme dont les rectangles sont de largeur lamplitude
de la classe et dont laire est proportionnelle leffectif.
b) Caractristiques
Pour calculer moyenne et cart-type, on prend les formules connues avec les x
i
centres des classes cest
dire x
i

X
i1
+ X
i
2

B. S t a t i st i qu es a d eu x va r i a bl es
1. Ta b lea u d e d on n es. Nu a ge d e p oi n t s.
On observe que dans certains cas, il semble exister un lien entre 2 caractres dune population (ex :
entre poids et taille, entre lpaisseur dun mur et sa rsistance thermique...).
On dfinit alors une srie statistique 2 variables x et y, prenant des valeurs x
1
,,x
n
et y
1
,,y
n
.
a) Tableau de donnes.
Le nom est explicite. On reprsente les diffrentes valeurs de x et y dans un tableau deux entres.
x en mm 2 4 6 8 10 12 15 20
y en m
2
.C 0,83 1,34 1,63 2,29 2,44 2,93 4,06 4,48
b) Nuage de points
Le plan P tant muni dun repre orthogonal, on peut associer au couple (x
i
; y
i
) de la srie statistique
double, le point M
i
de coordonnes x
i
et y
i
. Lensemble des points M
i
obtenus constitue le nuage de
points reprsentant la srie statistique.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
3
Rsi st ance t her mi que d' un mur en
f onct i on de son pai sseur
0
0. 5
1
1. 5
2
2. 5
3
3. 5
4
4. 5
5
0 5 1 0 1 5 2 0 2 5
Sr i e1

c) Point moyen
On appelle point moyen dun nuage de n points M
i
de coordonnes (x
i
; y
i
), le point G de coordonnes
x
G
x
1
n
x
i
i1
n

y
G
y
1
n
y
i
i1
n

.
C. Aj u st em en t a f f i n e
1. Mt h od e gr a p h i q u e
a) Ajustement la rgle
On trace au jug une droite D passant par plus prs possible des points du nuage de points, en
sefforant dquilibrer le nombre de points situs au dessus et au dessous de la droite D. Lquation de
D est alors de la forme y = ax + b. Pour retrouver cette quation, il suffit alors de connatre 2 points de
D.
b) Ajustement affine par la mthode d e Mayer
On partage le nuage de points en deux nuages de points de nombres quivalents. On calcule alors le
point moyen de chaque nuage quon appelle G
1
et G
2
. La droite (G
1
G
2
) est la droite de Mayer. Elle
passe de plus par le point G. Cest une bonne approximation, si le nuage de points est allong.

Ex : 2 x
i
8 et 10 x
i
20 alors on obtient y = 0,21x + 0,47.

Cours de statistiques dIUT
Jean-Michel BERNABOTTO
4
2. Aju st emen t a ffi n e p a r la mt h od e d es moi n d r es ca r r s
a) La droite de rgression
Soit D une droite dajustement. Soit M
i
(x
i
; y
i
) un point du nuage. P
i
est le point de mme abscisse x
i

que M
i
situ sur la droite D dquation y = ax + b. Q
i
est le point de mme ordonne y
i
que M
i
situ sur
la droite D dquation x = ax + b.
On appelle droite de rgression de y en x, la droite D tell que : M
i
P
i
2
i1
n

y
i
(ax
i
+ b) [ ]
2
i1
n

soit
minimale.
On appelle droite de rgression de x en y, la droite D telle que :
M
i
Q
i
2
i1
n

x
i
(a' y
i
+ b' )
[ ]
2
i1
n


soit minimale.
b) Covariance dune srie statistique double
Cest le nombre
cov(x, y)
xy

1
n
(x
i
x )(y
i
y )
i1
n

. Pratiquement on utilise plutt la formule :

xy

1
n
x
i
y
i
i1
n

x .y

c) Equations des droites de rgression
On montre que la droite de rgression D de y en x a pour quation y = ax + b avec a

xy

x
2
et b
vrifiant b y ax .
De mme on montre que la droite de rgression D de x en y a pour quation x = ay + b avec
a'

xy

y
2
et b' vrifiant b' x a' y .
Les droites D et D passent toutes les deux par le point moyen G.

3. Coeffi ci en t d e cor r la t i on
a) Dfinition
Le coefficient de corrlation dune srie statistique double est le nombre r dfini par r

xy

y

b) Proprits
r, a, b,
xy
, a et b sont tous de mme signe.
-1 r 1
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
5
c) Interprtation graphique
si r
2
= 1 alors aa = 1. Les droites D et D sont alors confondues ; on dit que lajustement affine est
parfait.
si 0,7 | r | <1 alors les deux droites D et D sont proches lune de lautre (en fait langle entre les deux
est infrieur 45) ; on dit que lajustement affine est justifi.
si | r | <0,7 alors langle entre les deux droites est suprieur 45. Lajustement affine ne se justifie pas.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
6

Cours de statistiques dIUT
Jean-Michel BERNABOTTO
7
Ch a p i t r e 2 P ROBABI LI TES ET ANALYSE
COMBI NATOI RE
A. Not i on d expr i en ce a l a t oi r e
1. Dfi n i t i on
Une exprience ayant un nombre fini dissues possibles est appel exprience alatoire sil est
impossible de savoir lavance quelle en sera lissue. Lensemble de toutes les issues possibles est
appel lunivers des possibles associ cette exprience; Il est gnralement not . Chaque sous
ensemble de contenant un seul lment, cest dire chaque issue possible est appel vnement
lmentaire.
2. Rema r qu e
Si on note chaque issues possibles e
1
,,e
n
alors ={e
1
,,e
n
} et chaque {e
i
} est alors un vnement
lmentaire.
Une exprience alatoire est dtermine par lexprience que lon effectue et donc lunivers aussi, cest
dire que si on change dexprience alatoire, on change aussi dunivers !
B. Voca bu l a i r e d es vn em en t s
1. Dfi n i t i on
Soit E une exprience alatoire et lunivers des possibles associ cette exprience. Lensemble de
toutes les parties de , P() est lensemble des vnements li .
est lvnement certain. est lvnement impossible.
2. Comp osi t i on d vn emen t s
a) Evnement A B
La loi dans P() correspond lemploi du ou inclusif entre deux vnements.
) Evnement A
La loi dans P() correspond lemploi du et entre deux vnements.
Dans le cas o A, on dit que les deux vnements A et B sont disjoints ou incompatibles.
c) Evnement contraire
Soit A un vnement li une exprience alatoire E dunivers associ . A est donc une partie de .
Ainsi C
A
={e
i
/e
i
A} est associ lvnement qui nest ralis que si A ne lest pas. On lappelle
complmentaire de A ou non A . Il est not A .
On a alors : AUB A IB et AI B A UB et (n > p) (n p)
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
8
C. Axi om a t i qu e d u ca l cu l d es pr oba bi l i t s
1. Axi ome s d u ca lcu l d e s p r ob a b i li t s
Soit E une exprience alatoire et son univers associ. On appelle probabilit, note p, toute
application de lensemble des vnements P() dans vrifiants les trois axiomes suivants :
A1 : AP() 0 p(A) 1
A2 : p()=1
A3 : si deux vnements A et B sont incompatibles alors p AU B ( ) p(A) + p(B)
2. Con squ en ces
La probabilit dun vnement A={e
1
,,e
n
} est telle que p(A)=p(e
1
)++p(e
n
).

p(A ) 1 p(A)

p() 0

p(A B) p(A) + p(B) p(A B)
3. Ca s p a r t i cu li er i mp or t a n t : lqu i p r oba bi li t
Lquiprobabilit correspond au cas o tous les vnements lmentaires ont la mme probabilit. Sil y
a n vnements lmentaires chacun possde une probabilit de 1/n dapparatre. Dans ce cas, on peut
crire la formule suivante :
p(A)
nbre d' lments de A
nbre d' lments de

nbre de cas favorables


nbre de cas possibles

D. Pr oba bi l i t con d i t i on n el l e
1. Dfi n i t i on
Soit p une probabilit sur un univers et soit A un vnement de probabilit non nulle. La probabilit
que lvnement B soit ralis sachant que A lest dj est dfini par p(B/ A)
p(A B)
p(A)
. On
lappelle probabilit conditionnelle.
2. P r op r i t s
p(/ A) 1
p(B C / A) p(B/ A) + p(C/ A)
p(A B) p(A/ B)p(B) p(B / A)p(A)

Cette formule est appele formule des probabilits composes.
3. Exe mp le
deux machines M1 et M2 fabriquent des tiges. Elles produisent respectivement 1/3 et 2/3 de la
production. La machine M1 sort 5% de tiges dfectueuses et M2 en sort 6%.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
9
Soit les vnements A : la tige est fabrique par M1 B : la tige est fabrique par M2
D : la tige est dfectueuse .
1) Quelle est la probabilit que la tige soit fabrique par M1 ? cest p(A)=1/3.
2) On tire une tige de la production de M1. Quelles est la probabilit quelle soit dfectueuse?
Cest p(D/A)=5/100.
3) On tire une tige de la production. Quelle est la probabilit pour quelle provienne de M1 et quelle
soit dfectueuse ? Cest P(A D) p(D/ A)p(A)
1
60
.
4) On tire une tige de la production. Quelle est la probabilit pour quelle soit dfectueuse ?
Cest p(D) p((A D) (B D)) p(D/ A)p(A) + p(D/ B)p(B)
17
300
.
5) Quelle est la probabilit quune pice dfectueuse ait t fabrique par M1 ?
Cest P(A/ D)
p(A D)
p(D)

1
60

300
17

5
17
.
E. Evn em en t s i n d p en d a n t s
1. Dfi n i t i on
Soit lunivers des possibles dune exprience alatoire E et p une probabilit associe. Deux
vnements sont dits indpendants relativement p si : p(A)p(A)p(B)
2. Rema r qu e
Il ne faut pas confondre indpendant et incompatible
Si deux vnements sont indpendants alors p(A)p(A)p(B) donc p(B/A)=p(B) et p(A/B)=p(A) ;
cela signifie que deux vnements sont indpendants si et seulement si la ralisation de lun ninflue pas
sur la ralisation de lautre.
F. El m en t s d a n a l yse com bi n a t oi r e
1. Le s p -li st e s
Elles correspondent un tirage successif et avec remise c est dire que les rptitions sont possibles et
que lordre est important.
Le nombre de p-listes dun ensemble E n lments est n
p
.
2. Le s su i t e s d e p l me n t s d i st i n ct s
Elles correspondent un tirage successif sans remise, cest dire que les rptitions sont impossibles et
lordre est important.
a) Les permutations
Toute suite de n lments distincts choisis parmi les n lments dun ensemble E est appel permutation
de n lments. Le nombre total de permutations dun ensemble de n lments est : n!.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
10
b) Les arrangements
Toute suites de p lments distincts choisis parmi n lments distincts (n p) est appel arrangement de p
lments parmi n. Le nombre total darrangements de p lments parmi n est :
A
n
p
n(n 1)(n p + 1)
3. Nombr e d e p a r t i es p lmen t s d u n en semble n lmen t s (p n )
Il correspond un tirage simultan cest dire que les rptitions sont non possibles et que lordre nest
pas important.
Toute partie de p lments distincts choisis parmi n lments (p n) est appele combinaison de p
lments parmi n. Le nombre total de combinaisons dun ensemble n lments est : C
n
p

A
n
p
p!
.
4. P r op r i t s d es a r r a n gemen t s et combi n a i son s
A
n
n p
n
p n p
n
p

!
( )!
!
!( )!
et C
n
p
formules videntes montrer partir de la dfinition....

C C
n
p
n
n p

en effet il y a autant de parties de E p lments que de parties de E n-p lments..



C C C
n
p
n
p
n
p

+
1
1
1
cette formule peut se montrer partir des formules de dfinition mais aussi par des
considrations ensembliste : soit aE et E'=E\{a} alors lors du choix d'un sous ensemble F n lments de
E deux cas peuvent se produire savoir aF cela revient choisir une partie p-1 lments de E' (C
n
p

1
1
faon
de la faire) ou aF cela revient choisir une partie p lments de E' (C
n
p
1
faon de le faire) on a donc :
C C C
n
p
n
p
n
p

+
1
1
1


Valeurs particulires :
A
A n n
A n
n
n
n
n
0
1
1 1
1



C
C
C
n
0
n
1
n
n
!


5. Triangle de Pascal - binme de Newton :
Triangle de pascal : la construction est base sur la proprit C C C
n
p
n
p
n
p

+
1
1
1
.

n \ p 0 1 2 3 4 5
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
11
Binme de Newton :
( ) a b C a b
n
n
p p n p
p
p n
+

0


Par exemple : ( ) a b a a b a b a b ab b + + + + + +
5 5 4 3 2 2 3 4 5
5 10 10 5

Remarque : dans les cas particulier o a=b=1 on obtient C
n
p
p
p n
n


0
2
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
12
Ch a p i t r e 3 LES VARI ABLES ALATOIRES
A. Va r i a bl es a l a t oi r es d i scr t es su r u n u n i ver s f i n i
1. Con ven t i on d cr i t u r e
Soit = {
1
,...,
N
} un univers fini probabilis. On appelle variable alatoire, note X, dfinie sur
toute application de dans .
On note X() = {x
1
,,x
n
} (n N) lensemble image de par X.
X = x
i
est la partie de formes de toutes les ventualits
k
ayant pour image x
i
. Il y en a n, formant
une partition de .
X > x est la partie de forme de toutes les ventualits dont le nombre image est suprieur strictement
x.
x X y est la partie de forme de toutes les ventualits dont le nombre image est compris entre x
et y.
2. Loi d e p r ob a b i li t
Soit un univers fini probabilis st X une variable alatoire sur . On appelle loi de probabilit de X,
lapplication qui chaque valeur image x
i
fait correspondre la probabilit p
i
de la partie (X = x
i
) de .
On la reprsente alors sous forme dun tableau :
X = x
i
x
1
x
2
x
i
x
n

p(X=x
i
) p
1
p
2
p
i
p
n


On a donc p() p
i
i1
n

= 1.
3. F on ct i on d e r p a r t i t i on
On appelle fonction de rpartition de la variable alatoire X, lapplication F de dans [0 ; 1] qui
associe tout rel x la probabilit p(X x) cest dire F(x) = p(X x).
Elle est croissante, continue par morceau et en escalier.
De plus on a : p(X > x) = 1 - F(x) et p(x X y) = F(y) - F(x).
4. Va leu r s ca r a ct r i st i qu es d u n e va r i a ble a la t oi r e va leu r s d i scr t es
Soit X une variable alatoire prenant les valeurs {x
1
x
n
} avec les probabilits respectives {p
1
p
n
}.
a) Esprance
On appelle esprance mathmatique de X le nombre E(X) p
i
x
i
i1
n

. Ce nombre sinterprte comme la


moyenne m des valeurs x
i
pondres par leur probabilit p
i
.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
13
b) Proprits
Soit k une constante alors :
E(k) k
E(X+ k) E(X) + k
E(kX) kE(X)

c) Variance et cart-type
On appelle variance de X le nombre V(X) p
i
x
i
2
i1
n

E(X) ( )
2
. Lcart-type est : (X) V(X)
d) Proprits
Soit k une constante alors :
V(k)
V(X+ k) V(X)
V(kX) k
2
V(X)

5. Exe mp le
Contre une mise convenable, on lance un d marqu as, roi, dame, valet, dix et neuf.
Las rapporte 10 F Le roi et la dame 6 F Le valet 5 F le 10 et le 9 rien

Loi de probabilit
X = x
i
0 5 6 10
p
i
1/3 1/6 1/3 1/6

Fonction de rpartition F
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
14
0.4
0.8

E(X)=4,5 V(X)=12,58 et (X)=3,55
6. Loi b i n omi a l e
Une variable alatoire X valeurs entires : 0,1 , 2 , n suit une loi binomiale de paramtres n et p si et
seulement si pour tout k appartenant {1,,n} on a : p(X k) C
n
k
p
k
q
nk
.
On lutilise chaque fois quune mme exprience a 2 ventualits. Elle est note B(n,p).

Son esprance est alors E(X) = np, sa variance V(X) = npq.
B. Va r i a bl es a l a t oi r es d n om br a bl es su r u n u n i ver s i n f i n i
1. Loi d e P oi s s on
Une variable alatoire dnombrable(cest dire tablissant une bijection avec ) X suit une loi de
Poisson de paramtre m (m > 0) sis et seulement si : p(X k) e
m
m
k
k!
.
Son esprance est E(X)=m, sa variance V(X) = k.
C. Va r i a bl es a l a t oi r es con t i n u es
1. Dfi n i t i on
Une variable alatoire continue est une variable alatoire X dont lensemble des valeurs est ou un
intervalle I de .
Une telle variable est gnralement dfinie par sa fonction de rpartition F: x aF(x) p(X x) .
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
15
2. F on ct i on d e n si t d e p r ob a b i li t
On dsigne par fonction densit de probabilit, la fonction drive f de la fonction de rpartition F. On
alors : f (x)dx F(x) et f (x)dx
a
b

F( b) F(a) p(a X b)

. cest dire que laire mesure entre


les droites dquation x = a et x = b, la courbe reprsentative de f et laxe des abscisses correspond
p(a x b).
On a
f (x)dx

F(a) p(X a)
f(x)dx
a
+

1 F(a) p(X a) 1 p(X< a)


f(x)dx

1


4 8 12 16
-0.1
0
0.1
x=a
x=b
p(axb)
Cf


3. Va le u r s ca r a ct r i st i qu es
Soit X une variable alatoire continue alors on a :
E(X) xf (x)dx

V(X) f (x) x E(X) [ ]


2
dx

E(X
2
) E(X) [ ]
2

Cours de statistiques dIUT
Jean-Michel BERNABOTTO
16
D. La l oi n or ma l e ou l oi d e La pl a ce-Ga u ss
1. Dfi n i t i on
Une variable alatoire X suit une loi normale N (m;) de paramtres m et lorsque sa densit de
probabilit est la fonction f dfinie sur par : f(x)
1
2
e

1
2
x m




1
]
1
2
.
Cette loi est souvent qualifie de loi du hasard ; elle est trs frquente dans des mesures rptes dune
mme grandeur.
On a alors : E(X) = m et V(X) =
2

4 8 12 16
-0.1
0
0.1
Cf
m=12 et =3


2. La loi n or ma le cen t r e r d u i t e
Si une variable alatoire suit la loi normale N (m;) il est difficile de calculer F(x) pour nimporte quel x;
Il existe alors une loi qui est tabule qui nous permet grce aux thorme suivant de calculer facilement
F(x) pour N (m;) .
a) Thorme :
si une variable alatoire X suit une loi normale N (m;) alors la variable alatoire T
X m

suit la loi
normale centre rduite N (0;1).
Sa fonction de rpartition est note ( x) = f (t)dt

avec f(x)
1
2
e
x
2
2

Sa lecture se fait grce une table (cf annexe).
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
17
-4 -2 2 4 0
0.2
0.4
(t)


b) Exemples de calculs
p(T 1,67)=(1,67)=0,9525
p(T 1,25)=1-p(T < 1,25)=1-0,8944=0,1056
p(T -1,67)=p(T 1,67)=1-p(T 1,67)
p(-t T t)=2(t) - 1
3. Ca r t e d e con t r le
Soit X une variable alatoire suivant une loi normale N (m;) alors T
X m

suit une loi normale


centre rduite N (0 ; 1) do
p(m < X < m+ ) p(1 < T <1) 2(1) 1 0,64 64%
p(m 2 < X < m+ 2) p(2 < T < 2) 2(2) 1 0,96 96%
p(m 3 < X < m+ 3) p(3 < T < 3) 2(3) 1 0,998 99,8%

ce que lon reprsente sous forme de carte de contrle :








m
64% 96% 99,8%
zone de dreglement
zone de danger
zone de dreglement
zone de danger
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
18



4. Ap p r oxi ma t i on d e s loi s
Dans certaines conditions on peut par commodit approximer certaines lois par une loi normale:
on a
B(n,p) P(np ) si p < 0,1 npq 10 et n > 30
B(n,p) (np , npq ) si npq >10 et n 50
P(m) (m, m) si m > 20

E. Da u t r es exem pl es d e l oi s con t i n u es
La loi uniforme ; son graphe de densit de probabilit est donn par le graphe :
-1 1 2 3
-1
-0.5
0
0.5


La loi triangulaire : elle est donne par son graphe fonction densit de probabilit :
a b
1/(b-a)
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
19
1 2 3
2/(b-a)
a
b

Cours de statistiques dIUT
Jean-Michel BERNABOTTO
20
Ch a p i t r e 4 ECHANTI LLONNAGE
A. Le pr obl m e d e l ch a n t i l l on n a ge
La thorie de lchantillonnage consiste dterminer des proprits sur des chantillons prlevs dans
une population dont on connat dj des proprits.
On ne considre ici que des chantillons alatoires, cest dire constitus dlments pris au hasard dans
une population.
Le tirage des lments dun chantillon peut tre fait sans remise; On dit quil est exhaustif. Sinon si le
tirage est fait avec remise, on dit quil est non exhaustif ; dans ce cas les tirages sont indpendants.
Dans la plupart des cas, la population ayant un grand effectif, dans laquelle on tire une faible proportion
dlments, on assimile un tirage sans remise un tirage avec remise.
B. Di st r i bu t i on d ch a n t i l l on n a ge d es m oyen n es
Considrons une population ayant une certaine proprit avec une moyenne m et un cart-type . Soit
X la variable alatoire qui tout chantillon alatoire prlev avec remise et deffectif n fix, associe la
moyenne de cet chantillon. Pour n suffisamment grand, X suit approximativement la loi normale
N (m;

n
).
Rem :
n suffisamment grand quand n 30.
si la population est-elle mme normale, on peut utiliser ce rsultat mme si n est petit.
lorsque les chantillons de taille n sont prlevs sans remise dans une population deffectif N, on peut
utiliser le rsultat prcdent en prenant

n
N n
N1
au lieu de

n
.
il ne faut pas confondre lcart-type

n
de la variable alatoire qui prend pour valeurs les moyennes
d chantillons de taille n, et lcart-type dun chantillon.
C. Di st r i bu t i on d ch a n t i l l on n a ge d es pou r cen t a ges
Considrons une population dont un pourcentage p dlments possde une certaine proprit. Soit F la
variable alatoire, qui tout chantillon alatoire prlev avec remise deffectif n fix, associe le
pourcentage dlments de cet chantillon possdant cette proprit. Pour n suffisamment grand, F suit
approximativement la loi normale N p,
pq
n




_
,


avec q = 1 - p.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
21
Ch a p i t r e 5 ESTI MATI ON
A. I n t r od u ct i on
Cest le problme inverse de lchantillonnage ; cest dire connaissant des renseignements sur un on
plusieurs chantillons, on cherche en dduire des informations sur la population totale.
B. Est i m a t i on pon ct u el l e
1. Moye n n e
De manire gnrale, on choisit la moyenne x
e
dun chantillon prlev au hasard dans une population
comme meilleure estimation ponctuelle de la moyenne inconnue m de cette population.
2. P r op or t i on
De mme, on choisit la proportion f
e
des lments possdant une certaine proprit dans un chantillon
prlev alatoirement dans une population comme meilleure estimation ponctuelle de la proportion
inconnue p des lments de cette population ayant cette proprit.
3. Va r i a n ce. Eca r t -t yp e
On choisit le nombre
n
n 1

e
2
o n est leffectif et
e
2
la variance dun chantillon prlev au hasard
dans une population, comme meilleure estimation ponctuelle de la variance inconnue
2
de cette
population et on prend
n
n 1

e
comme meilleure estimation ponctuelle de lcart-type inconnue de
cette population.
C. Est i m a t i on p a r i n t er va l l e d e con f i a n ce
Les estimations ponctuelles sont hlas lies au choix de lchantillon ; il faut donc rechercher un nouveau
type destimation de la moyenne dune population ou dun pourcentage. On cherche des intervalles qui,
gnralement, 95% ou 99% des cas, contiennent la moyenne m inconnue ou le pourcentage p dune
certaine proprit que possde la population.
1. De la moyen n e
a) 1er cas
Soit P la population : m la moyenne est inconnue
lcart-type est connu
Soit un chantillon : x
e
la moyenne est connue
n leffectif est connu
On se place dans le cas ou lon peut considrer que la variable alatoire X , qui tout chantillon de
taille n fixe, associe la moyenne de cet chantillon, suit une loi normale N (m;

n
).
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
22
Alors lintervalle de confiance de la moyenne m de la population, avec le coefficient de confiance 2(t) -
1, lu dans la table de la loi normale centre rduite N (0 ; 1) est :
x
e
t

n
; x
e
+ t

n



1
]
1

Cette mthode conduit dans 100(2(t) - 1) cas sur 100, pourcentage choisi lavance, un intervalle de
confiance contenant m.
Les cas usuels les plus frquent sont :
coefficient de confiance 95% alors t = 1,96
coefficient de confiance 99% alors t=2,58.
b) 2me cas
Soit P la population : m la moyenne est inconnue
lcart-type est inconnu
Soit un chantillon : x
e
la moyenne est connue

e
lcart-type est connu
n leffectif est connu et il est infrieur strictement 30.

On se place dans le cas ou lon peut considrer que la variable alatoire X , qui tout chantillon de
taille n fixe, n < 30, associe la moyenne de cet chantillon, suit une loi de Student n - 1 degrs de
libert .
Alors lintervalle de confiance de la moyenne m de la population, avec le coefficient de confiance 2(t) -
1, lu dans la table de la loi de Student n - 1 degrs de libert est :
x
e
t

e
n 1
; x
e
+ t

e
n 1



1
]
1

c) 3me cas

Soit P la population : m la moyenne est inconnue
lcart-type est inconnu
Soit un chantillon : x
e
la moyenne est connue

e
lcart-type est connu
n leffectif est connu et il est suprieur 30.

On se place dans le cas ou lon peut considrer que la variable alatoire X , qui tout chantillon de
taille n fixe, n 30, associe la moyenne de cet chantillon, suit une loi normale N (m;

n
).
Alors lintervalle de confiance de la moyenne m de la population, avec le coefficient de confiance 2(t) -
1, lu dans la table de la loi de la loi normale centre rduite N (0 ; 1) :
x
e
t

e
n 1
; x
e
+ t

e
n 1



1
]
1

Cours de statistiques dIUT
Jean-Michel BERNABOTTO
23
2. De la p r op or t i on
A laide dun chantillon, on dfinit de mme un intervalle de confiance de la proportion p inconnue
dune caractristique de la population.
a) 1er cas
Soit P la population : p la proportion est inconnue
Soit un chantillon : f
e
la proportion est connue
n leffectif est connu et infrieur strictement 30.
Alors lintervalle de confiance de la proportion p de la population avec le coefficient de confiance 2(t) -
1, lu dans la table de la loi de Student n - 1 degrs de libert est :
f
e
t
f
e
1 f
e
( )
n 1
; f
e
+ t
f
e
1 f
e
( )
n 1




1
]
1
1
.
b) 2me cas
Soit P la population : p la proportion est inconnue
Soit un chantillon : f
e
la proportion est connue
n leffectif est connu et suprieur 30.
Alors lintervalle de confiance de la proportion p de la population avec le coefficient de confiance 2(t)
- 1, lu dans la table de la loi normale centre rduite N (0 ; 1) est :
f
e
t
f
e
1 f
e
( )
n 1
; f
e
+ t
f
e
1 f
e
( )
n 1




1
]
1
1
.
3. Exemp les
a) 1er exemple
Dans une population P de grand effectif, on prlve de manire non exhaustive, un chantillon de 100
personnes dont on note la masse en kg:
masse 62 64 68 10 74
effectif 5 18 42 27 8
Calculer la moyenne et lcart-type de cet chantillon: x
e
68 kg
e
3 kg
2. Donner un intervalle de confiance de la moyenne m des masses des personnes de P au coefficient de
confiance 95% : nous sommes dans le 3me cas
m 681,96
3
100 1
; 68+ 1, 96
3
100 1



1
]
1
67,4; 68,6 [ ]
b) 2me exemple
Lors dun contrle de qualit sur une population dappareils mnagers, au cours dun mois de
fabrication, on prlve de manire non exhaustive un chantillon de 1000 appareils. Aprs un test de
conformit, on constate que 60 appareils ont un dfaut. Donner un intervalle de confiance du
pourcentage p dappareils dfectueux au risque de 5%.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
24
p
60
1000
1, 96
60
1000
1
60
1000



_
,

1000 1
;
60
1000
+ 1, 96
60
1000
1
60
1000



_
,

1000 1







1
]
1
1
1
1
1
0, 045; 0, 075 [ ]
4, 5%; 7, 5% [ ]
D. Analyse de sensibilit des coefficients d'une droite d'ajustement
Il est intressant dans les applications d'obtenir un intervalle de confiance prs des coefficients rels,
inconnus videmment
$
$
a et b, partir des donnes mesures pour cela on admet que :

Si on appelle Z
V X V Y Cov X Y
V X n

( ) ( ) ( , )
( )
2
2
alors les variables alatoires :

T
a a
Z

$
et U
b

b
( )
Z
n
x
i
2
i1
n

obissent toutes les deux une loi de Student n-2 degrs de libert.

Exemple : Dterminer des intervalles de confiance 95% (0.05) des coefficients a et b

Etape 1 : Dtermination de t

P( T >t)= avec =0.05 donne dans la table de Student 12-2=10 degrs de libert t=2.228 c'est dire
P( T <t)=95% ou encore
P(-2.28<T<2.28)=95%

Etape 2 : Calcul de Z


Z
2

2206x7857 4394
(12 2)2206
2
0.243 et Z=0.243

Etape 3 : Encadrement de a

T
a a
Z

$
et a=1.68 par consquent : a-tZ<
$
a <a+tZ finalement :

1.68-2.28x0.243<
$
a <1.68+2.28x0.243

1.12<
$
a <2.23

Etape 4 : Encadrement de b

Cours de statistiques dIUT
Jean-Michel BERNABOTTO
25

U
b

b
( )
Z
n
x
2
i
i1
n

et b=-1.3 par consquent :



b tZ
x
2
i
i 1
n

n
<

b < b+ tZ
x
2
i
i1
n

n
et donc :

< < +
< <
13 228 024
224822
12
13 228 024
224822
12
762 736
. . .
$
. . .
.
$
.
x x b x x
b


Cours de statistiques dIUT
Jean-Michel BERNABOTTO
26
Ch a p i t r e 6 TESTS STATI STI QUES
A. Pr i n ci p e d es t est s
Partons dun exemple...Une machine fabrique des tiges dacier. Si la machine est rgle correctement,
lutilisateur obtient une population de tiges de longueurs moyenne m et dcart-type . On dsire savoir
si cette machine se drgle. Ainsi, on prlvera, intervalles rguliers, des chantillons pour mesurer la
longueur effective des tiges.
Nous faisons alors lhypothse H
0
dite hypothse nulle que la machine est bien rgle. On teste alors
cette hypothse: 2 cas se prsentent :
la machine est bien rgle, on accepte H
0
.
la machine est mal rgle, on rejette H
0
et donc on accepte H
1
dite hypothse alternative.

Dfinition : un test statistique est une mthode permettant de prendre une dcision partir
dinformations fournies par un chantillon.
Cette dcision dpend donc de lchantillon. Ainsi quelle que soit la dcision prise, on court deux sortes
de risques :
le risque dit de 1re espce not , est la probabilit de rejeter lhypothse H
0
alors quelle est vraie
en ralit : p(rejeter H
0
/ H
0
vraie)
le risque dit de 2nde espce not , est la probabilit daccepter lhypothse H
0
alors quelle est
fausse en ralit : p(accepter H
0
/ H
0
fausse ) .
Un test est bon si on arrive minimiser et .
B. Test d e com pa r a i son u n e va l eu r st a n d a r d
1. P osi t i on d e p r oblme
On considre une population P sur laquelle on veut tudier un paramtre inconnue associ un
paramtre c. Sur un chantillon de taille n, on obtient
e
connu. Sur la base de cette valeur observe
e
,
on se propose de comparer la vraie valeur une valeur
0
fixe priori, constituant la valeur standard.
2. Test s r ela t i fs u n e moyen n e
Soit une population P de grand effectif sur laquelle on tudie un caractre c. La moyenne m de c est
inconnue. Sur un chantillon, on a trouv une moyenne

x
e
. On doit tester la moyenne m par rapport
une valeur note m
0
qui est la valeur standard.
a) Test bilatral
Soit H
0
: " m=m
0
" l'hypothse nulle et H
1
: " m m
0
" l'hypothse alternative
Soit X la variable alatoire prenant pour valeurs les moyennes des diffrents chantillons de taille n 30,
alors on sait que X suit une N (m
0
;

n
) , tant l'cart-type de la population P.

Cours de statistiques dIUT
Jean-Michel BERNABOTTO
27
Il faut donc que X soit telle que

p( m
0
t

n
< X < m
0
+ t

n
) 1 d'o en faisant le
changement de variable :

T
X m
0

n
alors T suit une loi normale centre rduite N (0,1) d'o

p( t

< T < t

) 1 c'est dire

(t

) 1

2
d'o la rgle du test bilatral :
On choisit un risque
on cherche dans la table de la loi normale centre rduite N (0,1), t

tel que

(t

) 1

2

soit

x
e
la moyenne de l'chantillon de taille n alors
si

x
e
m
0
t

n
;m
0
+ t

n



1
]
1
, on accepte H
0
avec le risque
sinon on rejette H
0
et donc on accepte H
1
avec un risque .
Remarque : dans le cas usuel o = 5% alors t

= 1,96 et si = 1% alors t

= 2,58.
Si est inconnu (ce qui est souvent le cas ) alors on prend son estimateur ponctuel

n
n 1

e
o
e
est
l'cart-type de l'chantillon.
b) Tests unilatraux
Rgle du test unilatral gauche
-4 -2 2 0
0.2
zone d'acceptation
de H0
zone de
refus de H0
zone de
refus de
H0
/2
/2
1-
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
28
L'hypothse nulle est H
0
: "m = m
0
" et l'hypothse alternative est H
1
: "m > m
0
"
On peut la retrouver par exemple dans le cas d'un test de dpassement d'une norme.
On choisit un risque
On cherche dans la table de la loi normale centre rduite N (0;1) t

tel que (t

) = 1 -
Si

x
e
m
0
+ t

n
alors on accepte H
0
sinon on refuse H
0
et donc on accepte H
1

Rem : dans les cas usuels : si = 5% alors t

= 1,645 ; si = 1% alors t

= 2,33

Rgle du test unilatral droite
-4 -2 2 0
0.2
rgion de refus de
H0
rgion d'acceptation de H0
1-

m=m0
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
29
L'hypothse nulle est : H
0
: "m = m
0
" et l'hypothse alternative est : H
1
: "m < m
0
"
On la retrouve dans les cas de tests de non galit d'une norme.
On choisit un risque
On cherche dans la table de la loi normale centre rduite N (0;1) t

tel que (t

) = 1 -
Si

x
e
> m
0
t

n
on accepte H
0
, sinon on rejette H
0
et donc on accepte H
1

Dans ces deux cas, il est trs frquent qu'on ne connaisse pas ; on a alors

e
n 1

3. Test s r ela t i fs u n fr qu en ce ou u n p ou r cen t a ge
Tous les tests que l'on vient de voir restent valables ; il suffit de remplacer m par p (proportion inconnue
dans la population P),

x
e
par f
e
(proportion effective sur l'chantillon) et

n
par
f
e
1 f
e
( )
n 1

C. T est d e com pa r a i son d e 2 popu l a t i on s
1. Test d e comp a r a i son d e 2 moyen n es





-4 -2 2 0
0.2
0.4
rgion
d'acceptation de
H0
rgion de refus
de H0
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
30
Population P1 Population P2
Caractres
Etudis
C C
Moyenne
Ecart-type
m
1

1
i
n
c
o
n
n
u
s

m
2

2

i
n
c
o
n
n
u
s

Echantillon e
1
Echantillon e
2

Taille
Moyenne
Ecart-type
n
1
30

x
e
1

e
1

c
o
n
n
u
s

n
2
30

x
e
2

e
2

c
o
n
n
u
s

Rgle du test de comparaison de 2 moyennes
L'hypothse nulle est : H
0
: "m
1
= m
2
" et l'hypothse alternative est H
1
: "m
1
m
2
"
On choisit un risque
On cherche dans la table de la loi normale centre rduite N (0;1) t

tel que (t

) = 1- /2
Si

x
e
1
x
e
2

e
1
2
n
1
1
+

e
2
2
n
2
1
t

;t
[ ]
on accepte H
0
sinon on rejette H
0
et donc on accepte H
1

Si H
0
est accepte, on dit que la diffrence m
1
-m
2
n'est pas significative au risque
2. R gle d e comp a r a i son d e d e u x p ou r ce n t a ge s
Population P
1
Population P
2

Caractre tudi
Pourcentage
C
p
1
inconnu
C
p
2
inconnu
Echantillon e
1
Echantillon e
2

Taille
Pourcentage
n
1
30
f
1
connu
n
2
30
f
2
connu
L'hypothse nulle est H
0
: "p
1
=p
2
" et l'hypothse alternative H
1
: "p
1
p
2
"
On choisit un risque
On cherche dans la table de la loi normale centre rduite N (0;1) t

tel que (t

) = 1- /2
Soit

f
n
1
f
1
+ n
2
f
2
n
1
+ n
2
alors si

f
1
f
2
f 1 f ( )
1
n
1
+
1
n
2



_
,

t

;t
[ ]
on accepte H
0
sinon on rejette H
0
et
on accepte donc H
1
.
Si H
0
est accepte, on dit que p
1
- p
2
n'est pas significative au risque .
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
31
D. T est d u Kh i -Deu x
On considre une distribution laquelle on associe un ensemble fini de probabilits qui sont, soit les
probabilits dun ensemble fini dvnements lmentaires, soit les probabilits de regroupements de
classes statistiques. Les classes peuvent correspondre des modalits qualitatives prises par une variable
non numriques ou des modalits quantitatives classiques. Les cas les plus classiques sont :
2 classes de probabilits donnes p et 1-p
k classes quiprobables
k classes dont les probabilits sont donnes priori
n+1 classes associes aux valeurs dune variable binomiale de paramtres n et p
n+1 classes associes aux valeurs dune variable alatoire valeurs entires positives, la n+1
me regroupant les valeurs suprieures ou gales n
Le but du test est de comparer globalement la distribution observe la distribution thorique. Un risque
derreur est fix dans les conditions habituelles.

On note A1, A2,,Ak les k classes. On dispose, dune part les k probabilits thoriques p
j
, dautre
part dun chantillon de taille n dont on connat les effectifs observs des classes. Lhypothse H
0
est la
conformit de la distribution relle la distribution thorique, et sexprimera en affirmant, pour chaque
classe, lgalit de la probabilit relle avec la probabilit thorique, soit H
0
= p(A1) = p
1
,,p(Ak) =
p
k
.
Lcart entre la distribution relle et la distribution thorique est calcul en faisant intervenir pour chaque
classe deux effectifs : leffectif observ o
j
et leffectif thorique np
j
.
Une reprsentation graphique de la sorte est alors plus pratique :
o
1

np
1

o
j

np
j


Lexcution du test du
2
fait intervenir un paramtre qui est le nombre de degrs de libert ddl et qui
prend une valeur lie au nombre de cases :
dans le cas gnral , ddl = k 1 (nbre de cases moins un)
dans le cas dune loi binomiale, dune loi de Poisson ou dune loi normale ddl = k 2

Hypothse tester : H
0
= p(A1) = p
1
,,p(Ak) = p
k


Ecart tester :
2
2
1
( )
k
j j
j j
o np
np


Ecart critique :
2

est lu dans la table de la loi du


2
, avec le nombre de degrs de libert indiqu
plus haut et le risque souhait.

Rgle : Si
2

alors H
0
est accept, sinon elle est refuse.

Une restriction demploi est cependant ncessaire : les effectifs thoriques np
j
ne doivent pas tre plus
petits que 5. En cas de difficults, la solution consiste regrouper des classes contigus pour que ces
effectifs thoriques dpassent 5.
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
32

Chapitre 1 LES STATISTIQUES DESCRIPTIVES ............................................................ 1
A. Statistiques a une variable ................................................................................................. 1
1. Vocabulaire de la statistique.....................................................................................................................................1
2. Les variables discrtes ..............................................................................................................................................1
3. Les variables continues.............................................................................................................................................2
B. Statistiques a deux variables ............................................................................................. 2
1. Tableau de donnes. Nuage de points. ..................................................................................................................2
C. Ajustement affine ............................................................................................................... 3
1. Mthode graphique ...................................................................................................................................................3
2. Ajustement affine par la mthode des moindres carrs........................................................................................4
3. Coefficient de corrlation..........................................................................................................................................4
Chapitre 2 PROBABILITES ET ANALYSE COMBINATOIRE........................................ 7
A. Notion dexprience alatoire ............................................................................................ 7
1. Dfinition.....................................................................................................................................................................7
2. Remarque.....................................................................................................................................................................7
B. Vocabulaire des vnements ............................................................................................. 7
1. Dfinition.....................................................................................................................................................................7
2. Composition dvnements ......................................................................................................................................7
C. Axiomatique du calcul des probabilits ............................................................................. 8
1. Axiomes du calcul des probabilits .........................................................................................................................8
2. Consquences ............................................................................................................................................................8
3. Cas particulier important : lquiprobabilit ...........................................................................................................8
D. Probabilit conditionnelle .................................................................................................. 8
1. Dfinition.....................................................................................................................................................................8
2. Proprits.....................................................................................................................................................................8
3. Exemple ........................................................................................................................................................................8
E. Evnements indpendants ................................................................................................. 9
1. Dfinition.....................................................................................................................................................................9
2. Remarque.....................................................................................................................................................................9
F. Elments danalyse combinatoire ...................................................................................... 9
1. Les p-listes ..................................................................................................................................................................9
2. Les suites de p lments distincts ...........................................................................................................................9
3. Nombre de parties p lments dun ensemble n lments (p n) .................................................................10
4. Proprits des arrangements et combinaisons ....................................................................................................10
5. Triangle de Pascal - binme de Newton : ....................................................................................................................10
Chapitre 3 LES VARIABLES ALATOIRES.................................................................... 12
A. Variables alatoires discrtes sur un univers fini............................................................ 12
1. Convention dcriture..............................................................................................................................................12
2. Loi de probabilit......................................................................................................................................................12
3. Fonction de rpartition............................................................................................................................................12
4. Valeurs caractristiques dune variable alatoire valeurs discrtes...............................................................12
5. Exemple ......................................................................................................................................................................13
6. Loi binomiale .............................................................................................................................................................14
Cours de statistiques dIUT
Jean-Michel BERNABOTTO
33
B. Variables alatoires dnombrables sur un univers infini................................................. 14
1. Loi de Poisson ..........................................................................................................................................................14
C. Variables alatoires continues ......................................................................................... 14
1. Dfinition...................................................................................................................................................................14
2. Fonction densit de probabilit .............................................................................................................................15
3. Valeurs caractristiques ..........................................................................................................................................15
D. La loi normale ou loi de Laplace-Gauss .......................................................................... 16
1. Dfinition...................................................................................................................................................................16
2. La loi normale centre rduite.................................................................................................................................16
3. Carte de contrle ......................................................................................................................................................17
4. Approximation des lois ............................................................................................................................................18
E. Dautres exemples de lois continues .............................................................................. 18
Chapitre 4 ECHANTILLONNAGE..................................................................................... 20
A. Le problme de lchantillonnage.................................................................................... 20
B. Distribution dchantillonnage des moyennes................................................................. 20
C. Distribution dchantillonnage des pourcentages ........................................................... 20
Chapitre 5 ESTIMATION..................................................................................................... 21
A. Introduction...................................................................................................................... 21
B. Estimation ponctuelle ...................................................................................................... 21
1. Moyenne ...................................................................................................................................................................21
2. Proportion..................................................................................................................................................................21
3. Variance. Ecart-type.................................................................................................................................................21
C. Estimation par intervalle de confiance ............................................................................ 21
1. De la moyenne ..........................................................................................................................................................21
2. De la proportion........................................................................................................................................................23
3. Exemples ....................................................................................................................................................................23
D. Analyse de sensibilit des coefficients d'une droite d'ajustement............................................... 24
Chapitre 6 TESTS STATISTIQUES.................................................................................... 26
A. Principe des tests............................................................................................................. 26
B. Test de comparaison une valeur standard.................................................................... 26
1. Position de problme ...............................................................................................................................................26
2. Tests relatifs une moyenne ..................................................................................................................................26
3. Tests relatifs un frquence ou un pourcentage ................................................................................................29
C. Test de comparaison de 2 populations ............................................................................ 29
1. Test de comparaison de 2 moyennes ....................................................................................................................29
2. Rgle de comparaison de deux pourcentages......................................................................................................30
D. Test du Khi-Deux ............................................................................................................ 31

Vous aimerez peut-être aussi