Vous êtes sur la page 1sur 36

PROBABILITES ET METHODES

STATISTIQUES PRATIQUES

Mohsine BENABDALLAH
Dpartement de Mathmatiques
bmohsine@gmail.com

SMP Semestre 3
Automne 2013

Le but de ce cours est d'introduire quelques modles probabilistes an de les


appliquer aux rsultats statistiques obtenus.
On introduira les modles d'espaces probabiliss en partant d'expriences alatoires, on parlera d'espace d'vnements sur lequel on dnira une mesure de
probabilit. Aprs avoir donn les proprits de cette dernire, on voquera le
conditionnement pour aboutir la formule de Bayes.
Les variables alatoires, aussi bien discrtes que continues, seront introduites
pour pouvoir les utiliser dans le chapitre suivant.
Enn, le troisime chapitre donnera un aperu sur les mthodes qu'on appliquera
aux donnes statistiques. On dcriera ces donnes (statistique descriptive) qu'on
pourra utiliser pour passer une population plus grande.
Ce cours s'inspire pour une grande part des notes de cours du Pr. EL Arrouchi.

CHAPITRE 1 : Modles d'espaces probabiliss

CHAPITRE 2 : Modles de variables alatoires

CHAPITRE 3 : Methodes statistiques

CHAPITRE 1 :
Modles d'espaces probabiliss

Exprience, Evnement, Univers


 Tout commence par une exprience alatoire appele aussi preuve
dont les rsultats sont ds au hasard et mme si elle est rpte dans les
mmes conditions ne donne pas forcment le mme rsultat.
 Tous les rsultats possibles d'une exprience sont mis dans une ensemble
appel univers qu'on note gnralement .
 Toute partie de l'univers sera appel un vnement.
Exemples
 "Lancer un d et noter le rsultat obtenu" est une exprience alatoire qui
donne 6 rsultats ou issues possibles. Les dirents rsultats possibles de
cette preuve sont
= {1, 2, 3, 4, 5, 6}

est compos de 6 vnements lmentaires.


 "Extraire trois tudiants d'une population d'tudiants constitue de garons
(G) et de lles (F)" est une exprience alatoire dont les rsultats possibles
sont
= {F F F, F F G, F GF, GF F, F GG, GF G, GGF, GGG}
est compos de 8 vnements lmentaires.
Notations
1. est l'vnement impossible et est l'vnement certain.
2. A est l'vnement complmentaire (ou contraire) de A. C'est l'vnement
qui se ralise si A ne l'est pas.
3. Si A et B sont deux vnements , A B est l'vnement qui se ralise ds
que A ou B s'est ralis.
4. Si A et B sont deux vnements , A B est l'vnement qui se ralise ds
que A et B se sont raliss.
5. L'vnement A \ B est dni par l'ensemble des lments de A qui n'appartiennent pas B .
6. L'vnement A implique l'vnement B si A B .
7. Les vnements A et B sont disjoints, ou incompatibles si A B = .
Exemples
Soient A, B et C trois vnements quelconques. Traduire l'aide de l'criture
ensembliste les vnements suivants :
 E : "au moins un des vnements B et C se ralise"
 F : "aucun des vnements A et C ne se ralise"
 G : "C , seul, se ralise"
 H : "un seul vnement parmi les trois , se ralise"
 I : "aucun vnement parmi les trois ne se ralise"
 J : "au moins un parmi les trois vnements se ralise"
3

Espace probabilisable On associe toute exprience l'ensemble A de tous


les vnements de . Si est ni ou dnombrable alors A = P() l'ensemble
de toutes les parties de .

Dnition

Le couple (, A) est appel espace probabilisable

Exemple

Si on jette une pice de monnaie alors = {P, F } et

A = {, {P }, {F }, {P, F }}

Exercice

Dcrire A quand = {1, 2, 3, 4, 5, 6}.


Systme complet
Les vnements A1 , ..., An forment un systme complet d'vnements,
s'ils constituent une partition de ; c'est dire si
 S
tous les couples Ai , Aj sont disjoints quand i 6= j ;
n
 i=1 Ai = .
Probabilit : dnition frquentiste
On considre une exprience pouvant donner lieu un rsultat quelconque
parmi N rsultats galement possibles. Supposons que n rsultats soient favorables la ralisation d'un vnement particulier A. La probabilit de l'vnement
A est dnie comme :

P (A) =

Card(A)
n
nombre de cas favorables
=
= .
nombre de cas possibles
Card()
N

Exemple
Pour les besoins d'un test sur un vaccin V , nous disposons de 10 volontaires,
3 d'entre eux appartiennent une mme famille. Deux personnes sont tires au
hasard. Quelle est la probabilit P (F ) que ces deux personnes soient de la mme
famille ?

Solution

L'exprience consiste tirer (simultanment) deux personnes parmi 10. Il s'agit


2
de dnombrer le nombre de combinaisons de 2 parmi 10 ce qui donne C10
ce qui
donne le nombre de cas possibles savoir Card (). Le nombre de cas favorable
est le nombre de combinaisons de 2 parmi 3 c'est dire C32 .
On obtient P (F ) = 1/15.
Probabilit : dnition axiomatique (Kolmogorov) Dnition
Une probabilit P est une application de A dans [0, 1] telle que
 P ()
S= 1; P
 P ( i=1 ) = i=1 P (Ai ), pour toute suite dnombrable d'vnements A1 , A2 , ...
disjoints deux deux appartenant A.
Le triplet (, A, P ) dnit un espace probabilis.
Proprits d'une probabilit
1. P (A) = 1 P (A) ;
2. P () = 0 ;
3. P (A \ B) = P (A B) = P (A) P (A B) ;
4

4. A B = P (A) P (B) ;
5. P (A B) = P (A) + P (B) P (A B) ;
6. Si A1 , ..., An forment un systme complet d'vnements, alors pour tout
B A,
n
X
P (B) =
P (B Ai ).
i=1

Probabilit conditionnelle

Dnition

Soient deux vnements A et B avec P (B) > 0. On dnit la probabilit


conditionnelle de A sachant que B est ralis, note P (A|B) par

P (A|B) =

P (A B)
.
P (B)

Exemple

On jette un d quilibr. Quelle est la probabilit d'avoir un nombre pair sachant


qu'il est suprieur ou gal 4 ?
Indpendance Dnition
Deux vnements A et B sont dits indpendants si

P (A|B) = P (A).

Consquence

On peut montrer facilement que si A et B sont indpendants, alors

P (A B) = P (A)P (B).

Exercice

Montrer que si A et B sont indpendants, il en est de mme de A et B .


Probabilit totales
Soient A1 , .., An un systme complet d'vnements,alors pour tout B A

P (B) =

n
X

P (Ai )P (B|Ai ).

i=1

Exemple de l'itinraire
Pour se rendre la facult des sciences, un tudiant a le choix entre 3 itinraires A, B et C . La probabilit qu'il a de choisir A(resp B ,C ) est 13 (resp
1 5
1
4 , 12 ). La probabilit d'arriver en retard en empruntant A(resp B ,C ) est 20 (resp
1 1
,
).
10 5
Quelle est probabilit que l'tudiant arrive en retard ?

Rponse

Les vnements A, B et C forment un systme complet car A B C = et


A B = A C = B C = . Soit R l'vnement "arriver en retard", en utilisant
la formule des probabilits totales, on obtient

P (R) = P (A)P (R|A) + P (B)P (R|B) + P (C)P (R|C)

Formule de Bayes
Soient A1 , .., An un systme complet d'vnements et B A alors

P (Ai )P (B|Ai )
P (Ai |B) = Pn
.
j=1 P (Aj )P (B|Aj )
Retour l'exemple de l'itinraire
L'tudiant arrive en retard. Quelle est la probabilit qu'il ait emprunt l'itinraire C ?

Rponse

On cherche la probabilit de C sachant R, on utilise pour cela la formule de


Bayes :

P (C|R) =

P (C)P (R|C)
P (A)P (R|A) + P (B)P (R|B) + P (C)P (R|C)

Exercice
Considrons deux urnes U1 et U2 . L'urne U1 contient 2 boules blanches et 3
boules noires. L'urne U2 contient 1 boule blanche et 4 boules noires. Appelons B
l'vnement "tirer une boule blanche" et N l'vnement "tirer une boule noire".
Dans chaque urne, il y a quiprobabili du choix des boules.
On choisit une urne au hasard, chaque urne ayant la mme probabilit d'tre
choisie que l'autre, puis on tire une boule de cette urne.
On sait qu'une boule blanche a t tire. Quelle est la probabilit d'avoir choisi
l'urne U1 ?
Exercice 9 :
Une usine de pellicules de photo dispose de trois machines A, B et C qui
fabriquent respectivement 20%, 50% et 30% de la production totale. Les proportions de pellicules dfectueuses fabriques par les machines A, B ou C sont
respectivement gales 6%, 5% et 3%.
On tire au hasard une pellicule dans la production, calculez :
 la probabilit que cette pellicule soit dfectueuse ;
 la probabilit qu'elle provienne de la machine A sachant qu'elle est dfectueuse ;
 la probabilit qu'elle provienne de la machine A sachant qu'elle est non
dfectueuse.
Corrig Exercice 9 :
On a P (A) = 0.2, P (B) = 0.5, P (C) = 0.3 et en notant D l'vnement la
pellicule obtenue est dfectueuse.
Ainsi P (D|A) = 0.06, P (D|B) = 0.05, P (D|C) = 0.03.
 la probabilit que cette pellicule soit dfectueuse est donne par

P (D) = P (D|A)P (A) + P (D|B)P (B) + P (D|C)P (C) = 0.046


 la probabilit qu'elle provienne de la machine A sachant qu'elle est dfectueuse est donne par

P (A|D) = P (A D)/P (D) = P (D|A)P (A)/P (D) = 6/23


 la probabilit qu'elle provienne de la machine A sachant qu'elle est non
dfectueuse est donne par

P (A|D) =

P (A) P (A D)
0.2(1 0.06)
P (A D)
=
=
0.954
P (D)
P (D)

CHAPITRE 2 :
Modles de variables alatoires

Dnition
Une variable alatoire relle sur (, A) est une application

X : R
telle que pour chaque x R

{ : X() = x} A

Exemple

On lance deux pices de monnaie. L'ensemble des rsultats possibles est

= {(F, F ); (F, P ); (P, F ); (P, P )}.


Chacun des vnements lmentaires de a une probabilit gale 1/4 de se
produire.
Considrons la variable alatoire relle X reprsentant le nombre de 'faces'
obtenues. Donc X() = {0, 1, 2}. On a de plus,

0 avec une probabilit 1/4


1 avec une probabilit 1/2
X=

2 avec une probabilit 1/4.

Frquence

0.5
0.4
0.3
0.2
0.1
0

Distribution de "Faces" obtenus


Fonction de rpartition
Soit X une variable alatoire relle. La fonction de rpartition de X est
la fonction dnie par
FX : R
7 [0, 1]

x P (X x)
Elle vrie les proprits suivantes
7

 limx FX (x) = 0, limx, FX (x) = 1


 P (a < X b) = FX (b) FX (a).
 P (X = a) = FX (a) FX (a ) o

FX (a ) = lim FX (x)
xa

Variables alatoires discrtes


Dnition
 Une variable alatoire relle X est dite discrte si elle ne prend que des
valeurs discrtes, c'est dire X() = {x1 , x2 , ..}.
 On appelle distribution de probabilit, ou loi de probabilit de X ,
l'ensemble des couples
{(xi , pi ), i = 1, ...}
o pi = P (X = xi ) vriant

pi = 1.

Esprance, Variance et cart-type d'une variable alatoire discrte


L'esprance mathmatique d'une variable alatoire discrte est dnie de la
manire suivante :
n
X
pi xi ,
= E(X) =
i=1

sa variance

V(X) = E(X )2 =

n
X

pi (xi )2 =

i=1

n
X

pi x2i 2

i=1

et son cart-type

(X) =

V(X)

Exemple

On mise une certaine somme. On lance un d marqu as,roi,dame,valet,dix et


neuf.L'as rapporte 10 DH, le roi et la dame 6 DH , le valet 5 DH alors que le 10
ou le 9 ne rapportent rien. Soit X la variable alatoire indiquant le gain obtenu.

Loi de probabilit

X = xi
pi
pi xi
pi x2i

0
1/3
0
0

5
1/6
5/6
25/6

6
1/3
2
12

10
1/6
5/3
50/3

Total
1
4,5
32,83

E(X) = 4, 5; V(X) = 32, 83 4, 52 = 12, 58.


p
(X) = V(X) = 3, 55.
Proprits de l'esprance et de la variance

Proposition

Soient X et Y deux variables alatoires discrtes sur l'univers . Alors on


a, pour tous rels a et b,
 E(aX + b) = aE(X) + b,
8

 E(aX + bY ) = aE(X) + bE(Y ),


 V(aX + b) = a2 V(X)
 Si X et Y sont indpendantes, alors
V(aX + bY ) = a2 V(X) + b2 V(Y ).
Variable de Bernoulli
On dnit une variable alatoire qui ne peut prendre que deux valeurs 0 et
1 comme variable de Bernoulli. Sa loi de probabilit est trs simple pour
laquelle p reprsente la probabilit de l'issue qu'on veut mettre en vidence
(succs) et q = 1 p la probabilit de l'autre terme (chec).

1 avec une probabilit p
X=
0 avec une probabilit 1 p.
Son esprance vaut

E(X) = (1 p) 0 + p 1 = p
Sa variance vaut

V(X) = E(X p)2 = (1 p)(0 p)2 + p(1 p)2 = p(1 p)


On retiendra que toute situation alatoire d'alternative peut tre reprsente par une variable de Bernoulli dont le paramtre p, gal la probabilit de
l'issue qu'on cherche mettre en vidence, est gal l'esprance, la variance
tant gale p(1 p).

Exemple

On tire au hasard une boule dans une urne contenant 18 boules rouges et 16
boules blanches. On dsire mettre en vidence le tirage d'une boule rouge. On
dnit alors la variable alatoire de Bernoulli X qui vaut 1 si la boule tire est
rouge et 0 sinon. Il reste dterminer p, c'est la probabilit de tirer une boule
rouge.
Variable Binomiale
On rpte la mme exprience de Bernoulli, de paramtre p, n fois de manire
indpendante et on dsigne par X le nombre de succs obtenus. Alors X est
appele variable binomiale de paramtre n et p qu'on note : X B(n, p). Sa
loi est donne par

P (X = k) = Cnk pk (1 p)nk , k = 0, 1, 2, ..., n

Thorme

Si X B(n, p), alors on a

E(X) = np, V(X) = E(X np)2 = np(1 p)


p
p
(X) = V(X) = np(1 p)

Exemple
On tire au hasard avec remise et de manire indpendante 5 boules d'une
urne contenant 18 boules rouges et 12 boules blanches. Si X est le nombre de
boules rouges obtenues,
18
alors X suit une loi binomiale de paramtre n = 5 et p = 30
= 0, 6. Donc,

P (X = k) = C5k (0, 6)k (0, 4)5k , k = 0, 1, .., 5


9

Exercice 3 :

Calculez la probabilit qu'il y ait 3 lles et 2 garons dans une famille de 5


enfants :
1. Si on suppose la probabilit de naissance d'une lle gale la probabilit
de naissance d'un garon.
2. Si on suppose la probabilit de naissance d'une lle gale 0,48.

Corrig Exercice 3 :
L'univers est constitu de tous les 5-uplets constitus de F(lle) et G(garon).
= {F F F F F, F F F F G, F F F GF, ..., GGGGG}
Alors Card = 25 ,
1. Si on suppose la probabilit de naissance d'une lle gale la probabilit
de naissance d'un garon, alors et P ({}) = 215 ) pour tout et par
la suite, il reste dnombrer les cas favorables , c'est dire le nombre de
faons de choisir deux places parmi 5 pour y installer les deux garons et
remplir les autres par des lles. Ce nombre est gal C52 et la probabilit
C2
demande est 55 .
2
2. Si on suppose la probabilit de naissance d'une lle gale 0,48. Alors la
probabilit d'un garon est de 0,52 et la probabilit d'obtenir une combinaison (3 lles et deux garons) est gale (0, 48)3 (0, 52)2 ainsi la probabilit demande est gale

C52 (0, 48)3 (0, 52)2


Variable de Poisson
La variable X suit une loi de Poisson, de paramtre > 0 si

P (X = k) = e

k
, k = 0, 1, 2, ..
k!

10

On la note X P().

Thorme

Si X P() alors on a

E(X) = V (X) = .
Utilisation
La loi de Poisson est la loi discrte reprsentant un nombre d'vnements.
Elle est utilise pour dcrire :
 la ralisation d'vnements peu probables, dans une succession d'preuves
trs nombreuses, au moins 50
 le nombre d'accidents dans un atelier, le nombre de dfauts sur un appareil,
 elle est la loi limite de la loi binomiale, quand n tend vers l'inni et p tend
vers zro, le produit np restant ni.
La loi de Poisson est la loi des vnements rares ou loi des petites probabilits.
Application 1
Selon les donnes rcoltes depuis plusieurs annes, le nombre de pannes
hebdomadaires du systme lectronique d'une entreprise suit une loi de Poisson de paramtre = 0, 05. Soit X la variable alatoire "nombre de pannes
hebdomadaires" :
(0, 05)k
P (X = k) = e0,05
k!
La probabilit que le systme tombe en panne une fois au cours d'une semaine
quelconque (k = 1) est gale 0, 04756.
La probabilit qu'il fonctionne sans panne (k = 0) est gale 0, 95122.
Quelle est la probabilit d'observer 2 pannes au cours d'une semaine ? d'un
mois ?
Application 2
La probabilit pour une ampoule lectrique de claquer son premier allumage est de 0, 01. On suppose poissonnienne cette loi cet ge. Sur un groupe
de 100 ampoules, quelle est la probabilit d'observer :
1. 0 claquage
2. 1 claquage
3. plus de 2 claquages

Rponse

n = 100 et p = 0, 01 donc sur 100 ampoules la moyenne est np = 1. X


reprsentant le nombre de claquages suit la loi de Poisson P(1). Alors
0

1. P (0 claquage) = P (X = 0) = e1 10! = 0, 3679


1

2. P (1 claquage) = P (X = 1) = e1 11! = 0, 3679


3. P (plus de 2 claquages) = 1 P (X 2) = 0, 0803
Loi gomtrique
On considre une preuve de Bernoulli dont la probabilit de succs est p et
celle d'chec q = 1 p. On renouvelle cette preuve de manire indpendante
jusqu'au premier succs. On note X la variable alatoire donnant le rang du
premier succs.
1. Montrer que P (X = k) = pq k1 , k = 1, 2, ... Dans ce cas, on dit que X
suit une loi gomtrique de paramtre p.
11

2. Montrer que E(X) =


Montrons que E(X) =

E(X)

1
p
1
p

et V (X) =

q
p2 .

kpq k1 = lim

k=1

n
X

kpq k1

k=1

n
n
X
d X k
d k
(q ) = lim p
(q )
= lim p
n
n dq
dq
k=1

k=1

1
d 1 qn
p
=
= lim p (q
)=
n dq
1q
(1 q)2
p
Le calcul de la variance est laisse en exercice.
Application

Exercice

Un certain matriel a une probabilit p = 0, 02 constante de dfaillance


chaque mise en service. On procde l'exprience suivante, l'appareil est mis
en marche, arrt, remis en marche, arrt, jusqu' ce qu'il tombe en panne.
Quelle est la probabilit que ce matriel tombe en panne (pour la premire fois)
au dixime essai ?
Le nombre d'essais ncessaires pour obtenir la panne est une variable alatoire
X suivant une loi gomtrique de paramtre p. La probabilit que ce matriel
tombe en panne (pour la premire fois) au dixime essai est gale :

P (X = 0) = (0, 02)(1 0, 02)9 = 0, 0167


Exercice
Un atelier fabrique un grand nombre d'objets. On admet que la probabilit
qu'un objet soit dfectueux est gale 1/100. Combien doit-on contrler de
pices pour avoir 95 chances sur 100 d'obtenir au moins une pice dfectueuse ?
Il s'agit d'une rptition d'une loi de Bernoulli avec une probabilit de succs
(obtenir une pice dfectueuse) p = 0, 01. On considre X la variable alatoire
correspondant au nombre d'essais eectuer pour obtenir une pice dfectueuse,
X suit alors une loi gomtrique de paramtre p et sa loi est donne par

P (X = k) = p(1 p)k1 , k = 1, 2, ...


Ainsi on cherche k de telle faon que P (X = k) = 0, 95

Variables alatoires continues

Une variable alatoire continue prend ses valeurs sur un ensemble inni non
dnombrable de points, elle dcrit par exemple la dure de vie d'une batterie de
voiture, l'heure d'arrive des voitures un page donn d'autoroute..
Il existe une fonction f non ngative, dnie pour toute valeur x de R et vriant,
pour toute partie A de R, la proprit :
Z
P (X A) =
f (x)dx.
A

Z
f (x)dx = 1
R

La fonction f est appele la densit de probabilit de la variable alatoire


X.
12

La fonction de rpartition de la variable alatoire X , ayant pour densit


de probabilit f , est dnie par :
Z a
FX (a) = P (X a) =
f (t)dt

Pour toutes les valeurs a et b appartenant R, on a donc la relation :

P (a < X b) = FX (b) FX (a)


L'esprance d'une variable alatoire continue est donne par :
Z +
= E(X) =
xf (x)dx,

et la variance

2 = V ar(X) =

(x )2 f (x)dx.

Proprits de l'esprance et de la variance

Proposition

Soient X et Y deux variables alatoires (discrtes ou continues) sur l'espace


probabilis (, A, P ). Alors on a, pour tous rels a et b,
 E(aX + b) = aE(X) + b,
 E(X + Y ) = E(X) + E(Y ),
 V ar(aX + b) = a2 V ar(X),
 V ar(X) = E(X 2 ) (E(X))2 ,
 V ar(X + Y ) = V ar(X) + V ar(Y ) si X et Y sont indpendants.
Loi uniforme Une loi va tre uniforme si toutes les valeurs sont quiprobables, mais il y a une innit de valeurs, on parlera d'quiprobabilit pour des
intervalles de mme taille.

Dnition

On dit que la variable alatoire continue X suit la loi uniforme sur [a, b] si sa
densit est donne par :
 1
si x [a, b]
ba
f (x) =
0 sinon .
On note alors X U[a,b] .

Thorme

Soit X une variable alatoire telle que X U[a,b] . Alors

E(X) =

a+b
2

(b a)2
V ar(X) =
12

0 si x < a

xa
si x [a, b]
F (x) =
ba

1 si x > b.

13

Loi exponentielle Soit un rel strictement positif. On dit qu'une variable


alatoire X suit la loi exponentielle de paramtre si elle admet pour
densit la fonction f dnie sur R par :

0 si x < 0
f (x) =
ex si x 0.
On note X E().

Proposition

La fonction de rpartition d'une variable alatoire suivant une loi exponentielle de paramtre est :

0 si x < 0
f (x) =
1 ex si x 0.

Thorme

Si X suit une loi exponentielle de paramtre > 0 alors X admet une


esprance et une variance donnes par :

E(X) =

1
1
, V ar(X) = 2 .

Une situation trs classique aussi o on envisage un modle exponentiel est


celle o on s'intresse au dlai de survenue d'vnements alatoires dans le temps
(souvent appel dure de vie), et o on admet que le devenir X d'un individu
(au sens statistique du terme) ne dpend pas de son ge :

P (X x0 + x|X > x0 ) = P (X x), x > 0, x0 > 0


On peut montrer que cette condition implique que X suit une loi de type exponentiel.
Variable normale

Dnition

Soit X une variable alatoire continue. On dit que X suit la loi normale de
paramtres m et 2 si sa fonction densit est donne par :

f (x) =

(xm)2
1
e 22 , x R.
2

On note alors X N (m, 2 ).

14

Densit de la loi normale

Thorme

Soit X une variable alatoire telle que X N (m, 2 ).


On a alors E(X) = m et V ar(X) = 2 .

Proposition

Soient X et Y deux variables alatoires indpendantes telles que X N (m1 , 12 )


et Y N (m2 , 22 ). Alors

X + Y N (m1 + m2 , 12 + 22 ).

Proposition

Soit X une variable alatoire telle que X N (m, 2 ). On pose Z =


alors Z est une variable alatoire telle que Z N (0, 1).
On dit que Z suit la loi normale centre rduite.
Utilisation des tables statistiques de N (0, 1)

Xm
,

Proposition

Soit Z telle que Z N (0, 1). Alors pour tout a > 0 on a



P (Z > a) = P (Z < a)
P (|Z| a) = 2P (Z a) 1

La table 1 donne, pour direntes valeurs de u, les valeurs de p = P (Z u)


avec Z N (0, 1). Ainsi
p = P (N (0, 1) u)

15

Exemple d'utilisation de la table 1


Soit Z N (0, 1). Dterminer les probabilits suivantes :

P (Z 0), P (Z 1), P (Z 1, 96), P (Z 1)


On lit par exemple dans la table 1 :

u = 0 = 0, 0 + 0, 00 p1 = P (Z 0) = 0, 5
u = 1 = 1, 0 + 0, 00 p2 = P (Z 1) = 0, 8413
u = 1, 96 = 1, 9 + 0, 06 p3 = P (Z 1, 96) = 0, 9750
p4 = P (Z 1)1 P (Z 1) = 1 0, 8413 = 0, 1587
16

Exemple d'utilisation de la table 2 Soit Z N (0, 1). Dterminer la valeur


17

de u dans les cas suivants :


(a) P (Z < u) = 0, 63
(b) P (Z > u) = 0.63
(c) P (|Z| < u) = 0.63

Rponse

(a) On crit d'abord p = 0.63 + 0.000, puis on repre l'intersection de la


ligne 0.63 et la colonne 0.000 ce qui donne u = 0.3319.
(b) On a P (Z > u) = 0.63, P (Z < u) = 1 0.63 = 0.37) donc on crit
d'abord p = 0.37 + 0.000 puis on repre l'intersection de la ligne 0.37 et
la colonne 0.000 ce qui donne u = 0.3319.(u ngatif puisque 0.37 < 0.5.)
(c) On remarque que P (|Z| < u) = 2P (Z < u) 1 = 0.63. Donc, P (Z <
u) = 0.815. L'intersection de la ligne 0.81 et de la colonne 0.005 donne
u = 0.8965.
Exercice 8 :
Soit X une variable alatoire dont la densit est dnie par :
a
f (x) = 4 1[1,+[ (x)
x
1.
2.
3.
4.

Dterminer a.
Dterminer FX la fonction de rpartition de X .
Calculer, sous rserve d'existence, E(X p ) pour p N.
Quelle est la densit de Y = ln(X) ? Que valent E(Y ) et V (Y ) ?

Corrig Exercice 8 :
1. Pour que f soit une densit, Rf doit tre positive et d'intgrale gale 1.
Donc a doit vrier a > 0 et R f (x)dx = 1. Ainsi
Z
Z +
a
a
f (x)dx =
dx = = 1 a = 3
4
x
3
R
1
2. Pour x 1 FX (x) =R 0 car la fonction densit est nulle pour x 1. Pour
x
x > 1, on a F (x) = 1 t34 dt = 1 x13 .
R + 3xp
R + 1
p
3. On sait que 1
xn dx < n > 1. Ainsi E(X ) = 1
x4 dx =
R + 1
3 1
x4p dx < 4 p > 1 p < 3. Ainsi pour p 2 qui donne
Z +
3
1
dx =
.
E(X p ) = 3
4p
x
3

p
1
4. Puisque X() [1, +( alors Y () [0, +(. On dtermine la fonction
de rpartition de Y qu'on drive pour obtenir sa densit.
Soit y [0, +( alors

P (Y y) = P (ln(X) y) = P (X ey ) = FX (ey ) = 1

1
e3y

Ainsi fY (y) = 3e3y 1[0,+[ (y).


On remarque qu'il s'agit d'une loi exponentielle de paramtre 3.
Ainsi E(Y ) = 13 et V (Y ) = 91 .
Exercice 9 : Un tube lectronique, fabriqu selon un certain procd, a une
dure de vie qui, exprime en heures est une variable alatoire X suivant une
loi normale N (160; 302 ).
18

1. Calculer les diverses probabilits :

p1 = P (X 140), p2 = P (X 200), p3 = P (130 X 190).


2. Trouver les rels a et b vriant : P (X a) = 0, 9; P (X b) = 0, 8.
3. Calculer la probabilit conditionnelle : q = P (X 200|X > 160).
On sait que Y = X160
N (0, 1) dont on peut lire sur la table 1 les
30
direntes valeurs de la fonction de rpartition.
1. p1 = P (X 140) = P (Y 32 ) = P (Y 23 )
= 1 P (Y 23 ) = 1 0.745 = 0.255
p2 = P (X 200) = P (Y 43 ) = 1 P (Y 43 )
= 1 0.908 = 0.092
p3 = P (130 X 190) = P (1 Y 1)
= 2P (Y 1) 1 = 0.682.
2. On obtient P (X a) = P (Y a160
30 ) = 0, 9
= 1.281 a = 198.43
En utilisant la table 2, on obtient a160
30
b160
P (X b) = P (Y b160
)
=
1

P
(Y

30
30 ) = 0, 8.
b160
b160
Ainsi on a P (Y 30 ) = 0, 2 30 = 0.841 b = 134.77
3. q = P (X 200|X > 160) =

P (X200)
P (X>160)

0.092
0.5 .

Approximation de la loi binomiale par la loi de Poisson


On considre une variable alatoire X suivant une loi binomiale B(n, p). Pour
n susamment grand et p susamment proche de 0, on peut approcher la loi
binomiale B(n, p) par la loi de Poisson de paramtre = np.
En pratique :
Si n > 50 et p < 0, 1, alors on a

B(n, p) P(np)
c'est dire :

(np)k
.
k!
Approximation de la loi binomiale par la loi normale
On considre une variable alatoire X suivant une loi binomiale B(n, p), p
tant un paramtre x. Alors
P (X = k) enp

X np
lim p
= N (0, 1)
np(1 p)

n+

En pratique :
Si n > 30, np > 5 et np(1 p) > 5,

B(n, p) N (np, np(1 p)).


Correction de continuit
On corrige de la faon suivante :

k+0,5np

)
P (X k) P (N (0, 1)

np(1p)

k0,5np
k+0,5np
P (X = k) P (
N (0, 1)
)
np(1p)
np(1p)

k0,5np

P (k X m) P (
N (0, 1) m+0,5np
)
np(1p)

19

np(1p)

Exemple
On lance une pice de monnaie "honnte" 1000 fois. Quelle est la probabilit
d'obtenir au moins 548 piles ?
On dsigne par X la variable alatoire dsignant le nombre de piles obtenus.
X suit une loi binomiale de paramtre n = 1000 et p = 1/2. On dsire calculer
P (X 548). On remarque que

P (X 548) = 1 P (X < 548) = 1 P (X 547).


On peut approcher la loi de X par une loi normale car n = 1000 > 30, np =
500 > 5, np(1 p) = 250 > 5. Donc

P (X 547) P (N (0, 1)

547, 5 500

) P (N (0, 1) 3)
5 10

En utilisant la table 1, on obtient P (X 547) 0, 99865. D'o P (X 548)


0, 00135.
Exercice 10 :
Une machine embouteiller peut tomber en panne. La probabilit d'une
panne chaque emploi est de 0,01. La machine doit tre utilise 100 fois. Soit
X le nombre de pannes obtenues aprs 100 utilisations.
1. Quelle est la loi de X ? Calculer P (X = 0), P (X = 1) et P (X 2).
2. On estime le cot d'une rparation 500 dirhams. Soit Y la dpense pour
les rparations aprs 100 utilisations. Calculer E(Y ) et V (Y ).
Loi du Khi-deux

Dnition

Soient X1 , ..., Xn n variables alatoires indpendantes telles que Xi N (0, 1), i.


Alors
X12 + ... + Xn2 2n
La fonction densit de probabilit de 2n est donne par
n

f2n (t) =

2 2 n/21 t/2
t
e
, t > 0
(n/2)

On a reprsent ci-dessus la loi du 2n pour diverses valeurs de n (k dans la


gure).

Densit de la loi du Khi-deux.


20

Thorme

Si X suit la loi du Khi-deux n degrs de libert, alors X admet une esprance et une variance :

E(X) = n

V ar(X) = 2n

Remarque

La table 3 donne les fractiles de la loi du Khi-deux.

Loi de Student

Dnition

Soient X N (0, 1) et Y 2n des variables alatoires indpendantes. Alors

X
p
Tn
Y /n
La fonction densit de probabilit de Tn est donne par

( n+1 )
t2
fTn (t) = 2
(1 + )(n+1)/2
n
n (n/2)
On a reprsent ci-dessus la densit de la loi de Student pour direntes
valeurs de n.( dans la gure).

21

Thorme

Si X suit la loi de Student n degrs de libert, alors

E(X) = 0
V ar(X) =

si n > 1

n
n2

Remarque

si n > 2.

La table 4 donne les fractiles de la loi de Student.

22

CHAPITRE 3 :
Mthodes statistiques

Statistiques Descriptives

Statistique Descriptive : Vocabulaire des statistiques


 Ensemble tudi : population
 Sous-ensemble de cet ensemble : chantillon
 lments de cet ensemble : individus
 Objet de l'tude : caractre
 Valeurs prises par le caractre : modalits
 Ensemble des individus ayant mme modalit ou groupe de modalits :

classe

Type de caractres
 Qualitatif : non mesur par un nombre
 nominal : quand les modalits ne peuvent pas tre ordonnes.
 ordinal : quand les modalits peuvent tre ordonnes.
 Quantitatif : mesur par un nombre
 discret : si l'ensemble des valeurs possibles est dnombrable.
 continu : si l'ensemble des valeurs possibles est continu.
Prsentation fonctionnelle
Soit une population, X un caractre, i un individu. On note X(i) ou xi
la valeur du caractre X pour l'individu i. Le caractre X est une application
de dans l'ensemble des modalits.
Exemples de caractres qualitatifs
a. Couleur d'une voiture dans un parking (Nominal)
population : les voitures du parking
caractre : la couleur
modalits : bleu, vert,..
b. Dcision nale un examen (Ordinal)
population : un amphi
individus : tudiants
caractre : dcision
modalits : ajourn,passable, AB,B,TB,excellent
Exemples de caractres quantitatifs
a. Nombre d'enfants par famille marocaine (Discret)
population : familles marocaines
caractre : nombre d'enfants
modalits : des nombres entiers.
b. Note l'examen de statistiques des tudiants de votre amphi
(Continu)
population : un amphi
individus : tudiants
caractre : note
modalits : [0, 20].

23

Distributions statistiques : Eectifs, frquences


Modalits
x1
x2
.
.
.
xi
.
.
.
xk
Total

Variable qualitative ou discrte


Eectifs
Frquences
Frq. cumules
n1
f1 = n1 /N
F1 = f 1
n2
f2 = n2 /N
F2 = f1 + f2
.
.
.
.
.
.
Tableau des
.
.
.
ni
fi = ni /N Fi = f1 + .. + fi
.
.
.
.
.
.
.
.
.
nP
f
=
n
/N
F
=
100
k
k
k
k
N=
ni
100%
|||
frquences

Classes
[a0 , a1 ]
[a1 , a2 ]
.
.
.
[ai1 , ai ]
.
.
.
[ak1 , ak ]
Total

Variable quantitative continue


Ampli
ni
fi
Fi
A1
n1
f1
f1
A2
n2
f2
f1 + f2
.
.
.
.
.
.
.
.
.
.
.
.
Ai = ai ai1 ni
fi
f1 + .. + fi
.
.
.
.
.
.
.
.
.
.
.
.
Ak
nk
fk
100%
|||
N 100%
|||
Tableau des frquences

di
d1 = f1 /A1
d2 = f2 /A2
.
.
.
di = fi /Ai
.
.
.
dk
|||

Exercice 1 : Nombre d'enfants par famille observ dans un chantillon de 133


familles

001111111122222222223333333333
333333333333333333333333333333
333333333333444444444444444444
444444455555555555555566666666
6 6 6 6 6 6 6 6 6 7 7 9 9 10
Echantillon de taille 133.

24

Solution

Xi
0
1
2
3
4
5
6
7
8
9
10
Total

ni
2
8
10
52
25
14
17
2
0
2
1
N = 133

i
2
10
20
72
97
111
128
130
130
132
133
|||

fi (%)
1.5
6.0
7.5
39.1
18.8
10.5
12.8
1.5
0
1.5
0.8
100

Fi (%)
1.5
7.5
15
54.1
72.9
83.4
96.2
97.7
97.7
99.2
100.0
|||

Exercice 2 : Age l'admission l'hpital pour un chantillon de 100 patients


10
9
32
36
27
63
46
16
51
30

22
10
29
69
33
53
33
42
60
76

24
7
2
40
1
88
85
69
58
7

42
51
15
61
25
48
22
7
9
6

37
2
46
12
22
52
5
10
14
27

77
1
48
21
6
87
87
53
74
18

89
52
39
54
81
71
28
33
24
17

85
7
6
53
11
51
2
3
87
53

28
48
72
58
56
52
85
85
7
70

63
54
14
32
5
33
61
8
81
49

Dpouiller ces donnes suivant une distribution de frquences en utilisant 9


classes avec 0 comme limite infrieure de la premire classe et 90 comme limite
suprieure de la dernire classe. Quel pourcentage de patients dont l'age est
suprieur ou gal 60 ans ?
Solution
Classes
[0 10[
[10 20[
[20 30[
[30 40[
[40 50[
[50 60[
[60 70[
[70 80[
[80 90[
Total

Ci
5
15
25
35
45
55
65
75
85
|||

ni
22
8
13
10
8
16
7
5
11
N = 100

fi (%)
22
8
13
10
8
16
7
5
11
100

Fi (%)
22
30
43
53
61
77
84
89
100
|||

Fonction de rpartition Dnition


La fonction de rpartition du caractre quantitatif X est la fonction F ,
dnie sur R valeurs dans [0, 1], dnie par :
F (x) = proportion d'individus de l'chantillon dont la valeur de X est < x.

25

Si X est discrte
Alors

F (x) =

0
Fi1

si x < xi
si xi1 x < xi , i 2
si x xk .

Si X est une variable quantitative continue

Alors, d'aprs la mthode d'interpolation linaire, on obtient

0 si x < a0

fi
Fi1 + Ai (x ai1 si ai1 x < ai , i 1
F (x) =

1 si x ak .
Reprsentations graphiques d'une srie de donnes

Variable nominale

Diagramme en btons

A chaque modalit, on associe un "bton" de longueur hi proportionnelle la


frquence fi (ou, si l'on veut dire l'eectif ni ). On a donc hi = cte fi .

Diagramme en secteur

L'angle de chaque secteur i est proportionnel la frquence fi . En degr, on


a i = 360 fi .
Exemple

Variable ordinale-Variable discrte


Variable ordinale
 Diagramme en btons
 Diagramme en secteurs

26

Variable discrte
 Diagramme en btons car, dans ce cas, l'ordre et l'cart entre les btons
sont signicatifs.
Reprsentation d'une variable continue
Classes
[a0 , a1 ]
[a1 , a2 ]
.
.
.
[ai1 , ai ]
.
.
.
[ak1 , ak ]
Total

Amplitudes
A1
A2
.
.
.
Ai = ai ai1
.
.
.
Ak
|||
Amplitudes et

ni
fi
Densits de frquences
n1
f1
d1 = f1 /A1
n2
f2
d2 = f2 /A2
.
.
.
.
.
.
.
.
.
ni
fi
di = fi /Ai
.
.
.
.
.
.
.
.
.
nk
fk
dk
N 100%
|||
densits de frquences

Histogramme- Polygone des frquences

Exercice
On a relev l'ge de 150 personnes. Les rsultats de l'enqute sont donnes
dans le tableau suivant :

27

Classes
[20, 25[
[25, 30[
[30, 35[
[35, 40[
[40, 50[
[50, 60[
Total

Eectifs
9
27
36
45
27
6
N=150

1. Tracer l'histogramme des frquences.


2. Tracer le polygone des frquences et la courbe cumulative.
Rponse
Classes
[20, 25[
[25, 30[
[30, 35[
[35, 40[
[40, 50[
[50, 60[
Total

Ai
5
5
5
5
10
10
|||

ni
9
2
36
45
27
6
150

fi
6
18
24
30
18
4
100

Fi
6
24
48
78
96
100
|||

di
1.2
3.6
4.8
6
1.8
0.4
|||

Paramtres associs la distribution d'une srie de donnes


 Paramtres de tendance centrale
 Paramtres de dispersion
Mode
Il est dni pour tous types de variables. Le mode n'est pas ncessairement
unique.

Dnition

 Si X est une variable statistique nominale, ordinale ou discrte, le mode


de la distribution associe est la modalit de X la plus reprsente, c'est-dire pour laquelle l'eectif est le plus grand.
 Si X est une variable continue, le mode (ou classe modale de la distribution associe est la classe dont la densit de frquences est la plus
leve.
Exemple
Modalit
A
B
C
D

ni
19
14
12
6

fi (%)
37,3
27,5
23,5
11,8

Mode=A
Classes
[20, 25[
[25, 30[
[30, 35[
[35, 40[
[40, 50[
[50, 60[
Total

Ai
5
5
5
5
10
10
|||

ni
9
2
36
45
27
6
150
28

fi (%)
6
18
24
30
18
4
100

di
1.2
3.6
4.8
6
1.8
0.4
|||

Classe modale=[35,40[
Mdiane

Dnition
La mdiane est la valeur centrale de la srie. On dit qu'elle partage la

srie en deux moitis. Ainsi 50% des lments de l'chantillon ont une valeur
infrieure la mdiane et 50% une valeur suprieure.

En gnral, on note x(1) < x(2) < ...... < x(n) la srie ordonne par ordre
croissant de la srie brute x1 , x2 , ..., xn de donnes.
Alors,
Si n est impair
Si n est pair

M = x( n+1 )
2

1
M = {x( n2 ) + x( n2 +1) }
2

Exemple : Cas continu


Trouver la mdiane de la srie brute suivante :

21, 25, 28, 30, 27, 24, 31, 21, 28, 30, 25, 28, 26, 25.

Rponses : On ordonne la srie par ordre croissant :


21, 21, 24, 25, 25, 26, 27, 28, 28, 28, 30, 30, 31
On a n = 14 qui est pair, donc la mdiane est

M=

x(7) + x(8)
26 + 27
=
= 26, 5.
2
2

Cas continu

Dnition La mdiane de la distribution d'une variable continue X , rpartie en classes [ai1 , ai [ est donne par :
 si F (ai1 ) < 0, 5 et F (ai ) > 0, 5, la classe mdiane est [ai1 , ai [ et on
calcule la mdiane par interpolation linaire sur l'intervalle [ai1 , ai [ :
M = ai1 + (ai ai1 )

0, 5 F (ai1 )
F (ai ) F (ai1 )

avec F fonction de rpartition de X


 si F (ai1 ) = 0, 5 alors M = ai1 .
Exemple : Cas continu
Classes
[20, 25[
[25, 30[
[30, 35[
[35, 40[
[40, 50[
[50, 60[
Total

ni
9
27
36
45
27
6
150

fi (%)
6
18
24
30
18
4
100
29

Fi (%)
6
24
48
78
96
100
|||

D'aprs la table, la classe mdiane et [35, 40[ car

F (35) = 0, 48 < 0, 5 < F (40) = 0, 78.


En appliquant la formule de la mdiane, on obtient

M = 35, 33
Quantiles
Soit dans l'intervalle ]0, 1[. On note x(1) < x(2) < ...... < x(n) la srie
ordonne par ordre croissant de la srie brute x1 , x2 , ..., xn de donnes. Alors on
dnit le nombre Q , quantile d'ordre , par
Si n n'est pas un entier naturel

Q = x([n]+1)
1
Q = { {x(n) + x(n+1) }
2

Si n est un entier naturel

o [n] reprsente la partie entire de n.


Si F (ai1 ) < et F (ai ) > , par interpolation linaire on obtient :

Q = ai1 + (ai ai1 )

F (ai1 )
F (ai ) F (ai1 )

Quartiles-Dciles

Quartiles

Les quartiles partagent la srie en 4 :


 Q0,25 premier quartile ;
 Q0,5 mdiane ;
 Q0,75 dernier quartile.

Dciles

Les dciles partagent la srie en 10 : (Q0,1 , Q0,2 , ..., Q0,9 ).


Exemple : Cas discret
Trouver les quartiles de la srie brute suivante :

21, 25, 28, 30, 27, 24, 31, 21, 28, 30, 25, 28, 26, 25.

Rponses : On ordonne la srie par ordre croissant :


21, 21, 24, 25, 25, 26, 27, 28, 28, 28, 30, 30, 31
On a n = 14

1
4

= 3, 5 qui n'est pas entier, donc


Q0,25 = x(4) = 25.

Ainsi, 14

3
4

= 11, 5 n'est pas entier, donc


Q0,75 = x(12) = 30.

Exemple : Cas continu


Classes
[20, 25[
[25, 30[
[30, 35[
[35, 40[
[40, 50[
[50, 60[
Total

ni
9
2
36
45
27
6
150

fi (%)
6
18
24
30
18
4
100
30

Fi (%)
6
24
48
78
96
100
|||

D'aprs la table, on obtient Q0,25 = 30, 2 et Q0,75 = 39, 5.


Asymtrie
 on emploie ce type de paramtres pour tudier la symtrie. Si

M Q0,25 >> Q0,75 M asymtrie gauche.


 sinon asymtrie droite.
Exemple
On considre les moyennes du semestre de deux classes de SMP :
Notes
Eectifs SM P1
Eectifs SM P2

5
0
2

6
3
4

7
4
3

8
4
3

9
5
3

10
7
4

11
3
3

12
4
2

13
2
2

14
1
3

15
0
1

16
0
2

Etudier l'asymtrie de ces deux sries.

Rponses :
SM P1 : M = 10, Q0,25 = 8, Q0,75 = 11 SM P2 : M = 10, Q0,25 = 7, Q0,75 =
12, 5
Moyenne arithmtique Dnition
La moyenne arithmtique d'une srie de donnes x1 , ..., xn ou tout simplement
est dnie par :
moyenne, note X
n

X
X
1X
= 1
fi xi .
xi =
ni xi =
X
n i=1
n i=1
i=1

Dnition

La moyenne arithmtique d'une variable continue rpartie en classe [ai1 , ai [ est


dnie par
k
k
X
X
1
X
n i ci =
fi ci .
n i=1
i=1
o ci = ai12+ai est le centre de la classe [ai1 , ai [.
Forme d'une distribution

Paramtres de dispersion

tendue

Etendue = x(n) x(1)

cart interquartile
IQ = Q0,75 Q0,25 . Cet intervalle englobe la moiti
31

Variance-cart type

Cas discret

V ar(X) =

X
1X
1X
(xi x
)2 =
ni (xi x
)2 =
fi (xi x
)2
n i=1
n i=1
i=1

Cas continu
k

V ar(X)

X
1X
ni (ci x
)2 =
fi (ci x
)2
n i=1
i=1

Thorme

La variance peut aussi s'crire


Discret
n

V ar(X) =

X
1X 2
1X
xi x
2 =
ni x2i x
2 =
fi x2i x
2 .
n i=1
n i=1
i=1

Continu
k

X
1X
fi c2i x
2 .
V ar(X)
ni c2i x
2 =
n i=1
i=1

Dnition

On dnit l'Ecart-type :

(X) =

p
V ar(X).

Coecient de variation
L'objectif de ce coecient est de fournir un indice quantitatif permettant de
comparer la dispersion de deux distributions de faon indpendante du choix
des units de mesure.
(X)
C.V. = 100%
X
Plus le coecient de variation est lev, plus la dispersion autour de la moyenne
est leve.
Exemple
On considre les moyennes du semestre de deux classes de SMP :
Notes
ni de SM P1
ni de SM P2

5
0
2

6
3
4

7
4
3

8
4
3

9
5
3

10
7
4

11
3
3

12
4
2

13
2
2

14
1
3

15
0
1

16
0
2

1. Calculer les coecients de variations de SM P1 et SM P2 .


2. Commenter.

Rgression linaire

On s'intresse tudier la relation entre deux variables X et Y . On veut


trouver la fonction f :
Y = f (X)

32

La srie statistique est alors une suite de n couples des valeurs prises par deux
variables sur chaque individu :

(x1 , y1 ), ....(xi , yi ), ...(xn , yn )


Nuage de points

Exemple de nuage de points.


Analyse des variables : paramtres marginaux
n

X
1X
= 1
2;
X
xi , 2 (X) =
(xi X)
n i=1
n i=1
1X
1X
Y =
yi , 2 (Y ) =
(yi Y )2 .
n i=1
n i=1

Dnition
La covariance est dnie
n

Cov(X, Y ) =

1X
i Y ).
(xi X)(y
n i=1

Proprits de la covariance

Remarque

 La covariance peut prendre des valeurs positives, ngatives ou nulles.


 Quand X = Y, Cov(X, Y ) = 2 (X) = 2 (Y ).

Thorme

La covariance peut galement s'crire :


n

Cov(X, Y ) =

1X
Y .
xi yi X
n i=1
33

Corrlation

Dnition
Le coecient de corrlation est dni par :
r(X, Y ) =

Cov(X, Y )
.
(X)(Y )

Le coecient de dtermination est le carr du coecient de corrlation :

r2 (X, Y ).
r(X, Y ) mesure la dpendance linaire entre X et Y .
Nuages de points et Corrlation

Droite de rgression

Dnition
La droite de rgression est la droite qui ajuste au mieux un nuage de

points.

On considre que la variable X est explicative (indpendante) et que la


variable Y est explique (dpendante). Donc, l'quation d'une droite est y =
a + bx
Critre des moindres carrs
Pour dterminer la valeur des coecients A et b on utilise le principe des
moindres carrs qui consiste chercher la droite qui minimise la somme des
carrs des rsidus :

M (a, b) =

n
X
i=1

e2i

n
X
=
(yi a bxi )2 .
i=1

Le rsidu ei est l'erreur que l'on commet en utilisant la droite de rgression


pour prdire yi partir de xi . Donc
34

 Les valeurs yi = a + bxi sont appeles les valeurs prdites. On a

Y = Y .
 Les valeurs ei = yi yi sont appeles rsidus. On a

= 0.
E
Nuage de points et Rsidu

Estimation de a et b

Thorme

Les coecients a et b qui minimisent le critre des moindres carrs sont


donns par :
Cov(X, Y )

b=
, a = Y bX.
2 (X)
 L'quation de la droite de rgression de Y en X :

y=

Cov(X, Y )
+ Y .
(x X
2 (X)

 La droite de rgression de Y en X n'est pas la mme que la droite de


rgression de X en Y .
 On a la formule de dcomposition de la variance :

V ar(Y ) = V ar(Y ) + V ar(E)


Qualit de la rgression
On appelle r2 (X, Y ) (coecient de dtermination) la part de variance explique :
V ar(Y )
r2 (X, Y ) =
.
V ar(Y )
C'est un indicateur de la qualit de la rgression.

Exemple 1

On considre les deux variables X et Y dont on connat quelques valeurs :


35

10
30

xi
yi

20
60

30
90

40
120

50
150

60
180

Quelle est la droite de rgression de Y en fonction de X ? Rponse :


= 35, Y = 105, Cov(X, Y ) = 875, 2 (X) = 291.66, a = 0, b = 3. Ainsi la
X
droite de rgression de Y en fonction de X est y = 3x.

Exemple 2

Le tableau suivant donne la longueur totale X d'un oiseau (en cm) en fonction
de la longueur Y de son uf (en mm).

X
Y
X
Y

15
8
28
16

32
25
17
11

79
60
16
8

40
32
18
11

55
38
57
60

16
10
30
26

22
15
23
13

20
13

et Y des variables X et Y .
1. Calculer les moyennes respectives X
2. Calculer les variances respectives 2 (X) et 2 (Y ) des variables X et Y .
3. Calculer le coecient de corrlation linaire r(X, Y ) entre X et Y . Commenter ce rsultat.
4. Dterminer la droite de rgression linaire de Y en X .
5. Quelle longueur de l'uf peut-on prvoir pour une longueur totale de
l'oiseau de 70 cm ?
= 31, 2 cm et Y = 23, 07 mm.
1. X
2. V ar(X) = 2 (X) = 332, 29 cm2 et V ar(Y ) = 2 (Y ) = 285, 13 mm2 .
3. (X) = 18, 23 cm, (Y ) = 16, 89 mm, Cov(X, Y ) = 296, 32 cm.mm ainsi
r(X, Y ) 0, 96.
Le coecient de dtermination r2 (X, Y ) 0, 93 est proche de 1. Il existe
donc une forte dpendance linaire entre X et Y .
4. L'quation de la droite de rgression linaire est y = a+bx avec a 4, 76
et b 0, 89.
5. La longueur de l'uf 4, 76 + 0, 89 70 = 57, 54 mm.

Rgression non-linaire
De nombreux modles non-linaires se ramnent facilement aux modles
linaires par des simples transformations. Voici quelques cas frquents :
Dpendance
non-linaire
y = kex

Transformation

Y = log(y)

Droite de
rgression linaire
Y = log k + x

y = kx

Y = log(y), X = log(x)

Y = log(k) + X

y=

x
x+k

Y = y1 , X =

36

1
x

Y =

+ k X