Académique Documents
Professionnel Documents
Culture Documents
STATISTIQUE I - COURS - (A&B) - 12-13-14x PDF
STATISTIQUE I - COURS - (A&B) - 12-13-14x PDF
TOUIJAR 02/10/2013
3 4
statistique descriptive. 5 6
1
D.TOUIJAR 02/10/2013
I) DEFINITIONS :
Dfinition 1: La population est un
PARTIE 1
ensemble d'objets ou de personnes
SERIES SIMPLES
sur lesquelles porte une tude.
Exemples de populations :
CHAPITRE 1 : -La population du Maroc la date du
Tableaux statistiques et reprsentations recensement de 2004.
graphiques -Lensemble des socits SARL Fs en
2013.
12
2
D.TOUIJAR 02/10/2013
13 14
Un caractre qualitatif peut tre soit : Les variables statistiques discrtes (notes: v.s.d.) :
se sont des variables dont l'ensemble des
Ordinal : si ses modalits peuvent tre
modalits est un ensemble discret (la variable ne
naturellement ordonnes exemple : satisfaction
peut prendre que des valeurs isoles d'un
plus ou moins grande aprs lachat dun produit. intervalle).
Nominal : si ses modalits ne peuvent tre Exemple : Pour le nombre d'enfants par
naturellement ordonnes exemple : tat mnage lensemble des modalits peut tre
matrimoniale. {0, 1, 2, 3, 4}.
Les variables statistiques continues (v.s.c.) : dans
On appelle variable statistique, un caractre ce cas, l'ensemble des modalits est continue; la
quantitatif.
variable peut prendre toutes les valeurs d'un
intervalle.
On distingue deux sortes de variables statistiques:
Exemple : Salaire, ge, taille, poids etc.
15 16
3
D.TOUIJAR 02/10/2013
Remarque : 4+2+3+3+3+1+2+1+1=20
19 20
ni = n En %:
i =1 k
f i % = f i 100 f i % = 100
i =1
21 22
Exemple : Remarque :
n1 4 n En terme de frquence, la distribution de X , scrit
f1 = = = 0,20 et f 6 = 6 = 0,05 aussi :
n 20 n
Commentaire : La proportion des machines ayant
{(x1, f1 ), (x2 , f2 ),, (xk , fk )}
produit 3 pices dfectueuses est de 20%; et celle
des machines ayant produit 10 pices dfectueuses Exemple : La distribution des dfectuosits des 20
est de 5%. machines est : {(03 ; 4), (5 ; 2), (7 ; 3),
Dfinition : On appelle distribution d'un (8 ; 3), (9 ; 3), (10 ; 1), (14 ; 2), (16 ; 1), (33 ; 1)}
caractre X , l'ensemble de couples
{(x1, n1 ), (x2 , n2 ),, (xk , nk )} {(3 ; 0,20), (5 ; 0,10), (7 ; 0,15), (8 ; 0,15)}
Ou
23 24
4
D.TOUIJAR 02/10/2013
Pour une meilleure exploitation de la distribution, on a intrt Cette matrice (srie selon plusieurs variables) peut tre reprsente
la reprsenter par un tableau statistique . comme suit :
Date de naissance
Nombre
Prnom Nom Jour Mois Anne d'enfants Revenu Ville Opinion
1 Aline Michalco 23 1 1953 4 30000 Paris Mauvaise
II) TABLEAUX STATISTIQUES 2 Mathilde Crepineau 13 10 1953 0 60000 Montpellier Trs bonne
3 Bndicte Avelin 9 3 1953 1 9000 Rouen Mauvaise
9 caractres : Prnom, nom, jour de naissance, 7 Agns Roche 2 5 1953 2 10000 Nice Bonne
lments qui comprennent chacun les 9 16 Fabiola Couic 2 5 1953 1 10000 Nancy Passable
Dans cette 1re Partie, on ne considrera quun seul caractre Sa reprsentation par tableau est alors comme suit :
la fois.
Reprsentation de la distribution dun Modalit Effectif Frquence
caractre X par un Tableau xi ni fi
x1 n1 f1
1) Cas dun caractre qualitatif : x2 n2 f2
Exemple : On reprend les 20 femmes selon Le Tableau statistique est comme suit :
lopinion caractre ordinal : ni fi
Ma, Tb, Ma, Ma, Mo, Mo, Bo, Mo, Pa, Mo, Pa, Bo,
Bo, Mo, Bo, Pa, Ma, Mo, Tb, Pa. 4 0,2
4 0,2
Une fois classes : Ma, Ma, Ma, Ma, Pa, Pa, Pa, Pa,
Mo, Mo, Mo, Mo, Mo, Mo, Bo, Bo, Bo, Bo, Tb, Tb.
6 0,3
On a donc 5 modalits (k=5 ). 4 0,2
La distribution scrit : 2 0,1
{(Ma ; 4), (Pa ; 4), (Mo ; 6), (Bo ; 4), (Tb ; 2) } n=20 1
29 30
5
D.TOUIJAR 02/10/2013
6
D.TOUIJAR 02/10/2013
= f i + f i +1 ++ f k = f j f j
Fi Pour la ime classe, on note :
j =1
j =1 ai = ei ei-1 lamplitude de cette classe.
=1
ei 1 + ei
= 1 Fi 1 xi = le centre de cette classe.
39 2 40
7
D.TOUIJAR 02/10/2013
0,3
1) Cas du caractre qualitatif : 30%
0,1
i = c fi
10%
; i=1,...,K
0%
Ma Pa Mo Bo Tb Or
K K
02/10/2013
47
i = c f i 360 = c 1 c = 360
i =1 i =1
48
8
D.TOUIJAR 02/10/2013
Tb
10%
xi fi % i Bo
36 Ma
Pa
20%
Ma 20 72 72 Mo
Pa 20 72 Pa
20%
Bo
Mo 30 108 108 Tb
Mo
Bo 20 72 30%
Tb 10 36
Total 100 360 49 50
51 52
des 20 femmes 4
3
2
1
0
-1 0 1 2 3 4 5 xi
53 54
9
D.TOUIJAR 02/10/2013
Remarques :
ii) Courbe Cumulative
Si x = xi alors F(xi ) = f1++ fi = Fi .
Dfinition : On appelle fonction de rpartition Si xi x < xi+1 alors F(x)= Fi + 0= Fi .
F( x), la fonction qui chaque valeur x de R Conclusion :
associe la proportion dindividus pour lesquels la F(x)=Fi pour tout x tel que xi x < xi+1
valeur de la variable X est infrieure ou gale x.
La reprsentation graphique de F(x) est appele
Notation : Courbe cumulative, cest une courbe
F (x ) = P( X x )
en escalier dont les paliers sont
horizontaux, puisque F(x) est constante sur
55
chaque intervalle [xi , xi+1[. 56
75
chaque classe, on associe un rectangle
dont la base est gale lamplitude de la
45
classe et dont la hauteur est de telle sorte
que sa surface (Si = b i x hi) soit
20 proportionnelle la frquence de la
5 classe. La juxtaposition de tous ces
0
x
0
10
D.TOUIJAR 02/10/2013
0,8
Classes fi ai li fi
0,7
[0 ; 35[ 0,30 35 1 0,30
0,6
0,3
[70 ; 140[ 0,25 70 2 0,13
0,2 Total 1 ar=35 --- --
0,1
11
D.TOUIJAR 02/10/2013
f'i
Rpartition des femmes selon ii) Courbe Cumulative
0,5
le revenu en 1000
0,45
Fi = P( X ei )
0,15
0,1
0,05
0
-35 0 35 70 105 140 67 X 68
175
90
Classes fi % Fi% 80
[0 ; 35[ 30 30 70
60
[35 ; 70[ 45 75 50
40
0
69 00 35 70 105 140 X70
71 72
12
D.TOUIJAR 02/10/2013
1 6 53
xi ni ni xi fi fi xi x=
n i =1
ni x i =
20
= 2,65
0 1 0 0,05 0 6
1 3 03 0,15 0,15 ou x = f i xi = 2,65
i =1
2 5 10 0,25 0,50
Exemple 2 : Pour les revenus des femmes
3 6 18 0,30 0,90
4 3 12 0,15 0,60
1 3 3
5 2 10 0,10 0,50 x = ni xi = f i xi = 55125
Total 20 53 1 2,65 n i =1 i =1
75 76
13
D.TOUIJAR 02/10/2013
Dmonstration :
k k (d) Proprit de lagrgation
(x i a) = ( x ) + (x a )
2
x
2
f i f i i
i =1 i =1
k k Soit une population P de taille n, compose
= (x i x ) + (x a)
2 2
f f
i =1
i
i =1
i
de m sous populations P1, P2, . . . , Pm ; de
k
tailles respectives n1, n2, . . .nm et de
+ 2 f i (x i x )( x a)
i =1 moyennes respectives x 1 , x 2 ,.... x m . Alors
k k
(x i ) + (x a )
2 2
= f i x
81 82
i =1
14
D.TOUIJAR 02/10/2013
(x ) = ( )
k 1 k
G= n
i
ni n
x x2 xk
1
n1 n2 nk = L og xi ni
n i =1
i=1 k
1 k k
o n = ni
85
= ni L og (xi ) =
n i =1
f i L og ( xi )
86
i=1 i =1
15
D.TOUIJAR 02/10/2013
I) LES MOYENNES
Domaines dapplication :
(4) La moyenne quadratique
On utilise cette moyenne dans le
calcul des dures moyennes, dans Dfinition et proprit : La moyenne
le calcul des moyennes de rapports quadratique, note Q , dune distribution
et de pourcentages et dans les
{ }
(xi , ni )1ik est la racine carre de la moyenne
{( ) }
tudes du pouvoir dachat (inverse
du MGP)...etc. arithmtique de la distribution xi2 , ni 1 i k
1 k k
Q= ni xi = f x
2 2
i i
91 n i=1 i =1 92
93 94
16
D.TOUIJAR 02/10/2013
Distribution unimodale
Exemple 1 : On reprend lexemple des 20
femmes selon le nb denfants
xi ni fi
0 1 0,05
Distribution bimodale Mo
1 3 0,15
M intervalle modale
2 5 0,25 M o = 3 enfts
3 6 0,30
4 3 0,15
5 2 0,10
Mo2 Mo1
99 Total 20 1 100
17
D.TOUIJAR 02/10/2013
Exemple :
III) LA MEDIANE
S'il existe une modalit xi pour laquelle ii) Cas dune v.s.c.
Fi = 0,5, dans ce cas on parle dun intervalle Dans le cas continue, la mdiane est
mdian : [xi , xi+1].
toujours unique : cest la valeur qui
partage exactement la population en
Exemple 1 : On xi fi % Fi % deux parties gales. En d'autres termes,
reprend lexemple 0 5 5 M est la solution de lquation :
des 20 femmes 1 15 20
selon le nb F(M) =0,5
denfants 2 25 45
o F est la fonction de rpartition de X.
3 30 75
F3 =0,45< 0,5< F4 4 15 90
On a deux mthodes pour dterminer la
5 10 100
Do M=3 enfts mdiane :
Total 100 Au plus
107 108
18
D.TOUIJAR 02/10/2013
0,5 F1
Exemple:
M = e1 + a2 F(x) Rpartition des femmes selon le
revenu en 1000
f2 100
Classes fi % Fi% 90
M = 35 + 80
[0 ; 35[ 30 30 70
50 30 60
[35 ; 70[ 45 75 35 50
30 Mdiane
0
111 00 35 70 105 140 X112
Conclusion Gnrale
IV) POSITIONS RELATIVES DES 3
Population htrogne : La moyenne arithmtique
est prfrable la mdiane et au mode. PARAMTRES MO , M et x
Prsence des valeurs aberrantes (ou extrmes) : La f distribution symtrique unimodale : les 3
paramtres coincident au point de symtrie
mdiane est prfrable.
Rsultats dun concours: la note mdiane est la plus
significative.
Dmographie : Lesprance de vie est conseille
pour comparer des pays en voie de dvpt. Pour un
seul, la dure mdiane ou le mode (ge le plus
frquent la mort) sont utiliss.
113 114
Mo =M=x
19
D.TOUIJAR 02/10/2013
f
distribution unimodale dissymtrique distribution unimodale dissymtrique tale
tale droite :Mo < M < x gauche : x< M < Mo
Mo M x
x
115
x M Mo 116
20
D.TOUIJAR 02/10/2013
2)QUINTILES: Soient q 1, q 2, q 3 et q 4 ces 4 3) DECILES: Soient D1, D2, ,D9 ces 9 dciles. Ils
quintiles. On a : partagent la population en dix parties
q 1 = x1/5 , P(X < q 1 ) = 1/5= 20%
deffectif =10 % chacune.
21
D.TOUIJAR 02/10/2013
Exemple : Pour les vingt femmes : Exemple : Pour les vingt femmes :
25 F0
F0<25<F 10 F0 F0<10<F1
Q1 =e0 + a1 1
D1 =e0 + a1
f1 f1
F2 75<F3 F2 90<F3
25 0 10
= 0 + 35 = 29,17 m = 0 + 35 = 11,67 m
30 30
90 F2
75 F2 D9 =e2 + a3
Q 2=M Q3 =e2 + a3 D5=M f3
f3
=50,56 m =50,56 m 90 75
= 70 + 0 = 70 m = 70 + 70 = 112 m
129
25 130
Ecart interquantile: Ce sont des paramtres de c) Les carts relatifs: Afin de comparer des
dispersion, donns par la diffrence entre le distributions diffrentes, on peut utiliser :
Q
premier et le dernier quantile : i)Ecart interquartile relatif : Q r =
M
i) Ecart interquartile: Q = Q 3 - Q 1 . ii)Ecart interdcile relatif : Dr =
D9
D1
ii) Ecart interquintile: q = q4 - q1 .
Exemple :
iii) Ecart interdcile: D = D9 - D1 . Q r =40,83/50,56 = 0,808= 80,8%
Exemple : Dr =112/11,67= 9,6
Q = 40,83 m
Les moins riches des 10% les plus riches
D = 79,33 m ont un revenu suprieure 9,6 fois le revenu
131 des plus riches des 10% les plus pauvres. 132
22
D.TOUIJAR 02/10/2013
3
Cas VSD 3
V ( X ) = f i ( xi x ) 2 = 1049,672
Sachant que x = f i x i = 55 ,125 m i =1
i =1
X = 1049,672 = 32,3986 m
Classes fi xi (xi- x)2 fi (xi- x)2
3)Formule dveloppe de la variance
[0 ; 35[ 0,30 17,5 1415,641 424,692 La variance scrit aussi comme la diffrence
entre la moyenne des carrs et le carr de la
[35 ; 70[ 0,45 52,5 6,891 3,101 moyenne :
[70 ; 140[ 0,25 105 2487,516 621,879 V ( X ) = x2 x 2
1 k k
Total 1 --- --- 1049,672 = ni xi2 ( x ) 2 = f i xi2 ( x ) 2
135 n i =1 i =1 136
Exemple :
(55,125)
81768,75
V ( X ) = x2 x 2 =
2
20
Classes ni xi ni xi ni xi2 = 4088,438 3038,766 = 1049,672
[0 ; 35 [ 6 17,5 105 1837,5 X = 1049,672 = 32,399 m
[35 ; 70 [ 9 52,5 472,5 24806,25
[70 ; 140 [ 5 105 525 55125 4) Changement de variable :
23
D.TOUIJAR 02/10/2013
i i
Soit X une variable statistique continue. Dont Si = s j = n j x j est la masse du caractre possde
les valeurs sont positives et regroupes en k j =1 j =1
par les individus prsentant une valeur infrieure ei
classes [ e0 , e1 [, [ e1, e2 [ , , [ ek-1, ek [ (ou la masse cumule associe la classe [ei-1, ei [).
deffectifs respectifs n1, n2 , ,nk, et de centres
s i ni x i fx
respectifs x1, x2 , ,xk. On note : gi = = = i i est la masse relative de la
S S x
classe [ ei-1, ei [ (ou la proportion de la masse globale
1. si = ni xi : la masse du caractre X dans la dans [ ei-1, ei [ ).
classe [ ei-1, ei [ (ou relative xi )
Si
Gi = est la masse cumule relative associe la
k k S
classe [e ,e [ (ou la proportion de la masse globale
2. S = s i = n i xi :est la masse globale du i-1 i
24
D.TOUIJAR 02/10/2013
25
D.TOUIJAR 02/10/2013
Salaires fi Fi Gi = Si fi(Gi-1+Gi)
S
[10 , 12[ 0,136 0,136 0,092 0,013 PARTIE 2
[12 , 15[ 0,318 0,454 0,356
0,375 0,142
0,149
[15 , 20[ 0,410 0,864 0,797 0,473
0,481
SERIES DOUBLES
[20 , 25[ 0,091 0,955 0,923 0,157
[25 , 30[ 0,045 1 1 0,087 Ajustement linaire et Corrlation
Total 1 ____ ____ 0,887
0,872
FIN 153
I) TABLEAUX DE CONTINGENCE Y en
X en CDH
(1) Exemple introductif anne
On dsire tudier la rpartition de 50184 salaris
selon lanciennet et le salaire mensuel. 2890 1836 102 0 4828
Posons : 9044 7378 884 204 17510
26
D.TOUIJAR 02/10/2013
X ni x1 1 0 0 0 1
rpartition des 50184 salaris selon
x2 0 1 0 0 1
lanciennet : distribution marginale 4828
de (X) 17510
xi 0 0 1 0 1
18088
La ligne (Total) et la colonne (Total) 9758 xn 0 0 0 1 1
sont appeles marges.
Total 50184
157
TOTAL 1 1 1 1 n 158
27
D.TOUIJAR 02/10/2013
O Y
70 Nuage de points: Ventes en
1 n
Cov( X , Y ) = xi yi ( x y ) et 65
60
fonction de la Pub
n i =1
50
1 n 1 n
x = xi et y = yi 45
40
n i =1 n i =1 35
30
1 n 2
V ( x) = xi x 2 ( ) 25
20
n i =1
10 5 9 X
Revenons notre exemple introductif 163
4 6 8 10 12 14 16 18
164
Cov ( X , Y ) = xy x y y=ax+b
1 5
1 5
1 5
= xi yi xi yi y =
3 x + 10
5 i =1 5 i =1 5 i =1
milliers flacons flacon / DH mDH milliers flacons
1
= 2330 10 40 = 66
5
a=3 est la pente de la droite, cela signifie
66
a= = 3 et b = 40 3 10 = 10 que 1 DH supplmentaire investi en pub
22
permet de vendre 3 flacons de plus.
167 168
28
D.TOUIJAR 02/10/2013
b) La droite de rgression de X en Y : elle est Revenons encore une fois notre exemple
utilise pour expliquer X par Y. Cette
droite a pour quation DX/Y : x =a y + b
O
1 5 2
( )
V ( y ) = y i y 2 = 1800 1600
Cov( X ,Y ) 5 i =1
a' = et b' = x a ' y 66
V (Y ) = 200 et a = = 0,33
Remarque : Gnralement, on trace les 200
deux droites DX/Y et DY/X dans un mme b = 10 0,33 40 = 3, 2
repre. Dans ce cas, l'quation de DX/Y
s'crit :
1 b DX / Y : y = 3,03 x + 9,7
y= x o a' 0.
a a 169 170
29
D.TOUIJAR 02/10/2013
r = -1 -1 < r < 0
Valeurs de r pour interprtation: Y D
Y
D
D
0 |r| < 0,40 : faible ou quasi absence de D
corrlation X
X Une liaison linaire
Une liaison linaire relative et ngative.
0,40 | r | < 0,60 : moyenne corrlation totale et ngative.
0,80 | r |
1 : corrlation leve. 175 176
r=0
r=1
D Y D
Y
D
D
0<r<1
D
X X
Indpendance totale. Y
Une liaison linaire totale et positive.
D
X
Une liaison linaire relative et
positive. 177 178
cov ( X , Y ) 66
r= = = 0,99 PARTIE 3
V ( X )V (Y ) 66 ,33
Conclusion:
r est positif et sa valeur est trs proche de
1, donc il y a une trs forte corrlation
linaire entre X et Y et est positive. Cest
LES INDICES :
ce que lon a constat graphiquement par
la construction des droites D et D.
179
30
D.TOUIJAR 02/10/2013
181 182
( X ) 100 = +4%
Avril 2000 Av. 2001 Av.2002
250 260 205 r X = I 01
00
Base100 en 2000 (Avril)
183 184
I 00 ( X ) = 0 100 =
x 250
100 = 96,15 I 02 ( X ) = x2 100 = 205 100 = 82
01 x1 260 185
00 x0 250 186
31
D.TOUIJAR 02/10/2013
I 1 (Y ) I 1 (Z )
Lindice lmentaire de la variable X j la
date t, base 100 la date 0
I 1 (X ) = 0 0
0 100 187 188
(1) Dfinition : Lindice synthtique t/0 , est un (2) Diffrentes formules dindices synthtiques
nombre qui rsume la srie des k indices
a) Indice de laspeyres :t/0 est la moyenne
simple (I1t/0 ,I2t/0 ,, Ikt/0).
arithmtique des indices simples Ijt/0 pondrs
par les coefficients 0j (calculs lanne de
Exemple : I.G.P. (Produits alimentaires,
Produits non alimentaires) base et dsignent limportance relative de Xj)
k k j
t/0 = 0j I t j/ 0 = 0j xtj 100
j =1 j =1 x0
k
o 0j = 1
189
j =1 190
b) Indice de Paasche :Pt/0 est la moyenne c) Indice de Fisher :t/0 est la moyenne
harmonique des indices simples Ijt/0 pondrs gomtrique de laspeyres et de paasche :
par les coefficients t j (calculs la date
courante t )
t/0 = t/0 x Pt/0
1 100
Pt/0 = =
k
t j k
x0j Souvent, on a
I
j =1
j
j =1
t j
xt
j
t/ 0
Pt/0 t/0 t/0
191 192
32
D.TOUIJAR 02/10/2013
195
q 0j 0.
196
j =1
choisies lanne de base. k
q
j =1
t
j
ptj
ii) L indice de Paasche des Prix Do Pt/0 ( p) = k
100
q
j =1
t
j
p 0
j
Cest la moyenne harmonique des indices Il dcrit lvolution du prix dun panier de
des prix des k articles pondrs par leur consommation dont les quantits sont
valeur globale (tj) la date courante t. choisies lanne courante
197 198
33
D.TOUIJAR 02/10/2013
qt
k
qtj
p q j j
0 t
j =1 j =1
p q
k
q0 j j
j =1
p q
j =1
j j
0 0 Dt/0 = j =1
k
t t
100 =
Dpenses Totales la date t
199
p q
j =1
j j
0 0
Dpenses Totales la date 0
200
C01j t j
j
Questions: I 01
j
t
Anne j
I
1- Calculer P (p) base 100 en 1999. 99 01 / 99
I j 0198 = 99 98
I 01 =
j
j
98
100
t j
C01j
100 99 I I 01j / 99
99
98 203 j =1 204
34
D.TOUIJAR 02/10/2013
Do
1
P01 / 99 ( p ) = = 111,1
0,009
2- lindice du chiffre daffaire en 01/99 :
V01/
01/99 = 150 (par nonc).
3- indice de quantit ; on a :
V 01 / 99
t/0 (q)= 100 =
P 01 / 99 ( p )
150
100 = 135
111 ,1 205
35