Académique Documents
Professionnel Documents
Culture Documents
19/08/2020 1
SOMMAIRE
1. La statistique
C’est une science qui consiste à collecter les données, les traiter , les analyser,
les interpréter et les présenter en vue d’étudier un phénomène donné.
Exemple: Statistique descriptive, statistique décisionnelle,….
2. Les statistiques
Ce sont les informations et les données collectées auprès des établissements.
Exemple: indices de la bourse, taux de chômage , ….
3. La statistique descriptive
C’est l'ensemble des méthodes permettant de décrire, de résumer, de présenter
les données.
1. Population
C’est l’ensemble des éléments ayant un caractère commun à étudier. On la note .
Exemple : Les étudiants de la faculté Ain Sebâa.
3. Echantillon
C’est un sous-ensemble ou une partie de la population. On le note E .
Exemple : les étudiants S1 de la faculté Ain Sebâa.
4. Taille de la population
C’est le nombre d’éléments de la population. On le note N..
Exemple : le nombre d’étudiants de la faculté Ain Sebâa.
Quantitatif Qualitatif
Remarque importante:
Echantillon de taille n = 5
Caractères Modalités
- Prénom: Ali
Population de taille N = 30 - Taille en cm: 170
- Nombre d’enfants 1
8. L'effectif total
L'effectif total (taille) d’une population ou d’une série statistique (série brute)
, noté N , est le nombre d'individus qui composent cette série ou population.
Exemple : Au cours d’un semestre, on a observé 20 élèves d’une école dont les
notes sont données par le tableau suivant :
1 2 3 4 5 6 7 8 9 10
12 10 12 7 5 12 10 7 13 8
11 12 13 14 15 16 17 18 19 20
7 7 10 12 10 5 5 5 8 13
9. L’effectif
L’effectif ni d'une modalité xi est le nombre d'individus ayant cette modalité, ou le
nombre de fois que la modalité xi est observée.
Exemple :
Le classement de la série des 20 notes précédentes par ordre croissant donne les
résultats suivants: 5,5,5, 5, 5, 7,7,7, 8,8, 8, 8, 8, 8,10,10,10,10, 10, 10,
Les modalités obtenues après le regroupement des observations sont: 5,7,8 et 10.
Donc on a:
La modalité x1 = 5 a pour effectif n1 = 5
La modalité x2 = 7 a pour effectif n2 = 3
La modalité x3 = 8 a pour effectif n3 = 6
La modalité x4 = 10 a pour effectif n4 = 6
Exemple : Le nombre des élèves qui ont obtenu au plus la note 8 est :
3
N 3 n1 n2 n3 4 4 2 nk 10
k 1
11. L’effectif cumulé décroissant 𝑁𝑖𝑑 est le nombre d’individus présentant au mois
la modalité xk . k
N ni ni 1 ... nk n j
i
d
j i
12. Fréquence
La fréquence de la modalité xi est le nombre d’individus possédant ce caractère
divisé par l’effectif total de la population. On écrit:
ni
fi
N
Remarque
f i est appelée aussi fréquence relative et on a :
k
f
i 1
i f1 f 2 ... f k
Exemple :
4
La fréquence des élèves qui ont obtenu 5 est égale à : f1 0, 2
20
19/08/2020 Statistique Descriptive 17
II. Vocabulaires de base
pi fi 100
14. Fréquence cumulée croissante est la proportion d’individus ayant des modalités
du caractère étudié inférieures ou égales à 𝑥𝑖 . On a :
i
Fi f1 f 2 ... f i f k
k 1
3
F3 f1 f 2 f 3 0.2 0.2 0.1 f k 0.5
Exemple : k 1
j i
6
Exemple : F f3 f 4 f 5 f 6 0.1 0.2 0.2 0.1 f k 0.6
3
d
k 3
x , n , x , n ,..., x , n
1 1 2 2 k k
On effectué une enquête sur 20 agriculteurs d’un petit village concernant leurs
opinions vis-à-vis un produit agricole appelé GA. Les informations obtenues
dans cette enquête sont :
Soit X un caractère qui désigne l’opinion des agriculteurs par rapport à un produit
agricole appelé GA.
Les 5 valeurs possibles de ce caractère sont : x1 M , x2 P, x3 AB, x4 B, x5 TB
1Alors
2 le3tableau
4 statistique
5 6 7 de ce
8 caractère
9 10 est11: 12 13 14 15 16 17 18 19 20
M B P TB AB M B AB TB P B M AB B TB P M P B M
i i
n
fi i Ni n1 n2 ... ni nk Fi f1 f 2 ... f i f k
N k 1 k 1
k
ni
N ni ni 1 ... nk n j
k
fi Fi fi fi 1 ... f k f j
d d
i
N j i j 1
xi ni Ni fi Fi 𝑵𝒅𝒊 𝑭𝒅𝒊
M 5 5 0,25 0,25 20 1
P 4 9 0,2 0,45 15 0,75
AB 3 12 0,15 0,6 10 0,65
B 5 17 0,25 0,85 7 0,4
TB 3 20 0,15 1 3 0,15
Total 20 1
i k
N i n1 n2 ... ni nk N ni ni 1 ... nk n j
i
d
k 1 j i
k
i
Fi fi fi 1 ... f k f j
d
Fi f1 f 2 ... f i f k j 1
k 1
Soit X un caractère qui désigne le nombre d’enfants par ménage pour les 20
agriculteurs. Les 7 valeurs possibles de ce caractère sont:
x 0, x
1 2 1, x3 2, x4 3, x5 4, x6 5, x7 6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
5 2 1 4 1 3 5 4 6 3 1 4 2 0 5 0 4 1 2 4
i i
n
fi i Ni n1 n2 ... ni nk Fi f1 f 2 ... f i f k
N k 1 k 1
k
n
N ni ni 1 ... nk n j
k
fi i Fi fi fi 1 ... f k f j
d d
i
N j i j 1
xi ni Ni fi Fi 𝑵𝒅𝒊 𝑭𝒅𝒊
0 2 2 0,1 0,1 20 1
1 4 6 0,2 0,3 18 0,9
2 3 9 0,15 0,45 14 0,7
3 2 11 0,1 0,55 11 0,55
4 5 16 0,25 0,8 9 0,45
5 3 19 0,15 0,95 4 0,2
6 1 20 0,05 1 1 0,05
Total 20 1
i
N i n1 n2 ... ni nk
i
Fi f1 f 2 ... f i f k
k 1 k 1
k k
N ni ni 1 ... nk n j
i
d
Fi fi fi 1 ... f k f j
d
j i j 1
B- Variable continue
k 1 3.22log n
E
e : est l’étendu de la classe
k
Alors:
e0 xmin e1 xmin e ............. ek xmin ke
Donc:
e0 , e1 e1 , e2 ............. ek 1 , ek
1ére classe 2éme classe k éme classe
N° de classe Classes ni fi
1 𝑒0 , 𝑒1 n1 f1
2 𝑒1 , 𝑒2 n2 f2
. . . .
i 𝑒i−1 , 𝑒𝑖 ni fi
. . . .
k 𝑒k−1 , 𝑒k nk fk
Total - N 1
k 1 3.22log 20 5
Alors:
e0 1.5 e1 1.5 0.08 1.58 e2 1.5 2 0.08 1.66
Donc :
1.74,1.82 1.82,1.9
4éme classe 5éme classe
N° de classe Classes ni fi
1 1.5,1.58 1 0.05
2 1.58,1.66 3 0.15
3 1.66,1.74 4 0.2
4 1.74,1.82 4 0.2
5 [1.82,1.90] 8 0.4
Total - 20 1
Soit X une variable qui désigne « Le Revenu» des agriculteurs qui est supposée
continue. On a:
Revenu X 1200 1500 2000 2500 3000 4000 5000 5300 6500
Effectif ni 1 3 2 3 3 3 1 2 2
Modalité xi ni fi θi
M 5 0,25 90
P 4 0,2 72
AB 3 0,15 54
B 4 0,25 90
TB 3 0,15 54
Modalité xi ni fi
0 2 0,1
1 4 0,2
2 3 0,15
3 2 0,1
4 5 0,25
5 3 0,15
6 1 0,05
Modalité xi ni fi Fi
0 2 0,1 0,1
1 4 0,2 0,3
2 3 0,15 0,45
3 2 0,1 0,55
4 5 0,25 0,8
5 3 0,15 0,95
6 1 0,05 1
Classes Amplitude ni fi
0,20 20 4 0,2
20,40 20 8 0,4
40,60 20 6 0,3
60,80 20 2 0,1
Lorsque les amplitudes sont inégales, il faut effectuer une correction des
effectifs (ou fréquences) d’une classe d’effectif ni et d’amplitude ai .
ni
L’ effectif corrigé, noté nci , est: nci
ai
fi
La fréquence corrigée (ou densité de fréquence ) ,notée di , est : d i
ai
La hauteur de chaque rectangle de l’histogramme est proportionnelle
à effectif corrigé (fréquence corrigée ). Si en regroupant les deux dernières
classes, alors on obtient:
Classes Amplitude fi di
0,20 20 0,2 0,01
20,40 20 0,4 0,02
40,80 40 0,4 0,01
B. Polygone de fréquences
Ce diagramme est formé en joignant ,par des segments de droites, les milieux
des sommets de chaque rectangle de l’histogramme.
Ainsi, il doit commencer par 0 et se terminer par 0.
Classes ni fi
0,20 4 0,2
20,40 8 0,4
40,60 6 0,3
60,80 2 0,1
C. Diagramme cumulatif
Ce diagramme est formé en joignant les points de coordonnées (xi , Fi ) pour
chaque classe [xi-1 , xi[ où Fi est la fréquence cumulée de cette classe.
Classes ni fi Fi
0,20 4 0,2 0,2
20,40 8 0,4 0,6
40,60 6 0,3 0,9
60,80 2 0,1 1
La moyenne arithmétique simple , notée x , d’une série statistique est donnée par :
x1 x2 .... xn 1 n
x xi
n n i 1
Exemple :
Soit la série statistique {10, 25, 20,25}, alors :
10 25 20 25
x 20
4
1 n n
x ni c i f i x i
n i 1 i 1
où ci
xi1 xi
2
désigne le centre de la classe xi , xi 1
Modalité xi ni xi ni fi xi fi
0 2 0 0,1 0
1 4 4 0,2 0,8
2 3 6 0,15 0,45
3 2 6 0,1 0,2
4 5 20 0,25 1,25
5 3 15 0,15 0,45
6 1 6 0,05 0,05
Total 20 57 1 2,85
7
n x i i 7
57
Alors : x i 1
fi xi 2.85
n i 1 20
Classes ci ni ci ni fi ci fi
0,20 10 4 40 0,2 2
20,40 30 8 240 0,4 12
40,60 50 6 300 0,3 15
60,80 70 2 140 0,1 7
Total 20 1 36
n c i i 4
720
x i 1
fi ci 36
n i 1 20
k
G n x ... x
n1
1
nk
k
où n ni
i 1
n1 nk n
1
1 k ni
log G log x1 ... xk log xi
n i 1
log xi ni log xi fi log xi
1 k ni 1 k k
n i 1 n i 1 i 1
Modalité xi ni ni Log(xi)
1 2 0
3 1 0,47
4 2 1,2
5 3 1,39
Total 8 0,38
k
1 1
H où n ni
1 k 1 k
fi
i n
n i 1 xi
i 1 xi
i 1
Modalité xi ni 𝒏𝒊
𝒙𝒊
1 2 2
1 1
3 1 0,33 H
1 k ni k
fi
4 2 0,5
n i 1 xi
i 1 xi
5 3 0,6
Total 8 3,43
k
1 k n ni
k
Q
n i 1
ni xi2 fx
i 1
2
i i
où
i 1
Modalité xi ni 𝒏𝒊 𝒙𝟐𝒊
1 2 2
1 k k
3 1 9 Q
n i 1
ni i
x 2
ii
f x
i 1
2
4 2 32
5 3 75
Total 8 118
Q
1
8
2 12 1 32 2 42 3 52
1
Q 2 9 32 75 3.84
8
La moyenne harmonique est plus sensible aux plus petites valeurs de la série
qu’aux plus grandes.
H G x Q
Détermination du mode
M 0 x1
k1
x2 x1
k1 k2
de la classe précédente de la CM .
k2 = 8- 6 = 2 : la différence entre la fréquence (ou l’effectif) de la
classe modale et de la classe suivante de la CM.
Donc :
4
M 0 20 40 20 33, 33
42
Donc :
M0 9
1,1
11 9 9,2
1,1 10
Détermination de la médiane:
- Cas d’une série brute:
Soit une série de n observations ordonnées par ordre croissant: x1 ,..., xn
Exemple 1 : 16 12 1 9 17 19 18 10 3 7 2 11 15 14
e xmax xmin
Exemples :
2. Ecart interquantile
Quartiles :
Ils partagent une série statistique en 4 groupes égaux, chacun
représentant 25% des observations.
Déciles :
Ils partagent une série statistique en 10 groupes égaux, chacun
représentant 10% des observations.
Centiles :
Ils partagent une série statistique en 100 groupes égaux, chacun
représentant 1% des observations.
- Le premier quartile, noté Q1, d’une série statistique est la plus petite valeur
telle qu’au moins 25% des valeurs sont inférieures ou égales à Q1.
- Le deuxième quartile d’une série statistique c’est la médiane (Q2)
- Le troisième quartile , noté Q3, d’une série statistique est la plus petite valeur
telle qu’au moins 75% des valeurs sont inférieures ou égales à Q3.
17 13 7 27 29 12 19 14 16 1 18 4 8 21 20 11
1 4 7 8 11 12 13 14 16 17 18 19 20 21 27 29
16
Le premier quartile est le k éme 4 éme rang , c’est-à-dire Q1 8
4
16
Le troisième quartile est le 3 k 3 3 4 12 éme rang ,
éme
4
c’est-à-dire Q3 19
Exemple: considérons les valeurs rangées par ordre croissant comme suit:
3 4 5 6 7 8 9 10 12 13 15 16 17 19 21 22 23 24 25 27 28 29 39
n n
On a n 23 k 5.75 et 3 17.25
4 4
Donc :
rang , c’est-à-dire Q3 24
ème
Le troisième quartile est le 18
𝑎𝑖 : Amplitude de la (CQ)
𝑓𝑖 : Fréquence de la (CQ)
𝐹𝑖−1 :Fréquence cumulé de la classe précédente de la (CQ)
Q1 Q3
- On a 𝛼1 = 0.25 (F0 0.25< F1) - On a 𝛼3 = 0.75 ( F2 0.75< F3)
- La classe de Q1 est [20,40[ - La classe de Q3 est [40,60[
- 𝑓𝑖 = 0,4 - 𝑓𝑖 = 0,3
- 𝐹𝑖−1= 0,2 - 𝐹𝑖−1= 0,6
0.25 0.2 - Q 40 20 0.75 0.6 50
Q
- 1 20 20 22.5 3
0.3
0.4
0,75
0,5
0,25
1. Variance
Elle mesure la dispersion des valeurs autour de la moyenne. Plus les valeurs
sont regroupées autour de la moyenne, plus la variance est petite. Plus elles
sont dispersées, plus la variance est grande.
La variance, notée V(X), d’une variable statistique de distribution xi , ni 1i k
est donnée par:
1 k 1 k
V X ni xi x ni xi2 x 2
2
n i 1 n i 1
2. Ecart-type
X V X
Remarque:
- Pour une variable statistique continue, les xi désignent les centres des classes.
- Dans le cas d’une série brute, la variance de cette série est égale à :
1 k 1 k 2
V X xi x xi x 2
2
n i 1 n i 1
1 k 11 14 24 8 32 9 10 17
x xi 15, 625
n i 1 8
11 15, 625 14 15, 625 ... 17 15, 625 62, 225
2 2 2
1 k
V X xi x
2
n i 1 8
ou
11 14 ... 17 15, 625 2 62, 225
2 2 2
1 k 2
V X xi x 2
n i 1 8
Revenus ci ni ci ni (ci )2 ni 1 n
V X ni c 2 c 2
0,20 10 4 40 400 n i 1
20,40 30 8 240 7200 720
c 36
40,60 50 6 300 15000 20
60,80 70 2 140 9800 32400
V ( x) 36
2
X V ( x) 324 18
X
CV
x
Me Mo X
Mesures de l’asymétrie
Xmin Q1 Me Q2 Xmax
Soit X une variable continue dont les valeurs sont regroupées en k classes
comme suit: Classes Centre xi Effectif ni
𝑒0 , 𝑒1 x1 n1
𝑒1 , 𝑒2 x2 n2
. . .
𝑒k−1 , 𝑒k xk nk
i Mi
M i nk xk Qi k
k 1
n
j 1
j xj
Remarques :
i) On a , 0 Qi 1 pour tout i
ii) On a Qi Q ei
mi
mi ni xi qi
m
i
Mi
M i nk xk Qi k
k 1
n
j 1
j xj
Remarque: Q M I 0.5
Détermination de la médiale
Revoir cette
courbe en utilisant
les couples (Fi,Qi)
Revenus ci ni fi Fi mi qi Qi
0,20 10 4 0,2 0,2 40 0,056 0,056
20,40 30 8 0,4 0,6 240 0,333 0,389 Revoir cette
40,60 50 6 0,3 0,9 300 0,417 0,805 courbe en utilisant
les couples (Fi,Qi)
60,80 70 2 0,1 1 140 0,195 1
Total n = 20 1 m = 720
0<G<1;
Revenus ci ni fi mi qi Qi Si = Qi-1+Qi fi Si
0,20 10 4 0,2 40 0,056 0,056 0,056 0,0112
20,40 30 8 0,4 240 0,333 0,389 0,056 + 0,389 = 0,445 0,178
40,60 50 6 0,3 300 0,417 0,805 0,389 + 0,805 = 1,194 0,3582
60,80 70 2 0,1 140 0,195 1 0,805 + 1 =1,805 0,1805
Total n = 20 1 m = 720 3,5 0,7279
k
G 1 f i Si G 1 0.7279 0.2721
i 1
X 3 4 5
Marge de X ni 45 35 20
Y P AB B TB
Marge de Y n j 45 25 20 10
Les données de ces deux variables peuvent être regroupées dans un tableau dit
tableau de contingence.
k
ni n p 1
ip correspond au nombre d’individus ayant les modalités xi où
i = 1,…,m.
n j n
p 1
pj correspond au nombre d’individus ayant les modalités yj où
j = 1,…,k.
k m k n m n
N n j ni nkj nik correspond à l’effectif total.
j 1 i 1 j 1 k 1 i 1 k 1
ni
fi
n
n j
f j
n
ni
X\Y y1 y2 … yk i f i
Marge de fX
n
x1 f11 f12 … f1k f1
x2 f21 f22 … f2k f 2
… … … … …
xm fm1 fm2 … fmk f m
Marge de Y f j f1 f2 … fk 1
nij ni n j
f ij fi f j
n n n
Exemple :
Variable X Variable Y
Moyenne marginale de X Moyenne marginale de Y
1 m m
1 k k
x ni xi fi xi y n j y j f j y j
n i 1 i 1 n j 1 j1
1 m
ni xi2 x 1 k
2
n j y j y
2 2 2 2
X Y
n i 1 n j 1
1 m 1
x ni xi 1280 12.8
n i 1 100
1 m 1
ni xi2 x 20525 12.8 205.25 163.84 41.41
2 2 2
X
n i 1 100
Soient:
X une variable qui varie en parcourant toutes les classes
[0,5[ 2 0,12
[5,10[ 4 0,23
[10,15[ 2 0,12
[15,20[ 4 0,23
[20,25[ 5 0,3
n1 17 1
[15,20[ 4 4 2 1 1 12
[20,25[ 5 2 1 10 2 20
Marge de Y n j 17 25 15 33 10 N = 100
X\Y n3
La distribution conditionnelle de X
[0,5[ 2
sachant [10,15[ est une série univariée [5,10[ 5
obtenue par l’élimination de toutes les [10,15[ 5
[15,20[ 2
classes sauf celle correspond à n3
[20,25[ 1
1 m 162.5
x/10,15 x/3
n3 i 1
c n
i i3
15
10.83
1 m 2193.75
ij i /3 34.7
2 2 2 2 2
/10,15 /3 n x x 10.83
n3 i 1 15
n x x nij y j y/ i
m
1 1 k
2 2
2
X/j ij i /j Y2/i
n j i 1 ni i 1
n x x y y
m k
1
Cov X , Y ij i j
N i 1 j 1
m k
1
N
n x y
i 1 j 1
ij i j xy
xy x y
Remarque:
Dans le cas des séries quantitatives non-groupées, on a nij 1
1280 1220
x 12.8 et y 12.2
100 100
17168 20525
V Y 12.2 7.84 et V X 12.8 56.41
2 2
100 100
Case N°1:
Centre de X x1
Effectif marginaux n1 j de [0,5[ 2 4 2 5 1 2,5
Centre de Y y j 2,5 7,5 12,5 17,5 22,5
n11 y1 n12 y2 n13 y3 n14 y4 n15 y5 x1 2 2.5 4 7.5 2 12.5 517.5 1 22.5 2.5 425
Case N°2:
Centre de X x2
Effectif marginaux n2 j de [5,10[ 4 5 5 2 2 7,5
Centre de Y yj 2,5 7,5 12,5 17,5 22,5
n11 y1 n12 y2 n13 y3 n14 y4 n15 y5 x1 4 2.5 5 7.5 512.5 2 17.5 2 22.5 7.5 1425
n11 y1 n12 y2 n13 y3 n14 y4 n15 y5 x1 2 2.5 10 7.5 5 12.5 15 17.5 4 22.5 12.5 6187.5
Case N°4:
Centre de X x4
Effectif marginaux n4 j de [15,20[ 4 4 2 1 1 17,5
Centre de Y yj 2,5 7,5 12,5 17,5 22,5
n11 y1 n12 y2 n13 y3 n14 y4 n15 y5 x1 4 2.5 4 7.5 2 12.5 117.5 1 22.5 17.5 1837.5
n11 y1 n12 y2 n13 y3 n14 y4 n15 y5 x1 5 2.5 2 7.5 112.5 10 17.5 2 22.5 22.5 5850
1 m k
Cov X , Y nij xi y j x y
N i 1 j 1
1
425 1425 6187.5 1837.5 5850 12.2 12.8
100
157.25 156.16 1.09
Cov X , Y
R
XY
R 2 désigne le coefficient de détermination de X et Y
Remarques importante :
On a toujours −1 ≤ R ≤ 1 ⇒ 0 ≤ R2 ≤ 1.
La covariance dépend des unités ce qui est difficile à interpréter .
La corrélation ne dépend pas des unités.
1280 1220
x 12.8 et y 12.2
100 100
17168 20525
V X 12.8 7.84 et V Y 12.2 56.41
2 2
100 100
Cov X , Y 1.09
Cov X , Y 1.09
R 0.051
XY 2.8 7.51
Considérons la série statistique constituée de n couples des valeurs prises par les
deux variables pour chaque individu : x1 , y1 ,..., xi , yi ,..., xn , yn
L’objectif de la régression linéaire est d’étudier la relation qui peut exister entre
X et Y en cherchant la fonction f telle que: Y f X
L’ajustement linéaire se base sur le choix de la droite qui passe le plus proche de
tous les points du nuage. Cette droite est appelée droite de régression linéaire de
Y en X, noté DY / X , et son équation est donnée par: y a bx
où a et b représentent les paramètres de cette droite.
n n
2
Minimiser E ei yi a bxi
2
i 1 i 1
Cov X , Y a y bx
b et
V Y
Cov X , Y
r X ,Y
XY
On a: -1 ≤ r ≤ +1
Pus la valeur absolue de r est proche de 1 plus la liaison entre X et Y est forte.
Pus la valeur absolue de r est proche de 0 plus la liaison entre X et Y est faible
57 645
C ov X , Y 10.5 9,5 7.75
63
On a : x 10.5 , y 9,5 et
6 6 6
1 n 2 731 1 n 2 585
V X xi x 10.5 11.58 V Y yi y 9.5 7.25
2 2 2 2
et
n i 1 6 n i 1 6
et Cov X , Y 1.09
17168
12.2 , V Y 100 12.2 7.84
1280 1220 2
x 12.8 , y
100 100
Cov X , Y 1,09 y 1.79 0.14 x
b 0.14 , a y bx Donc
V (Y ) 7.84
12.2 0.14 12.8 1.79
19/08/2020 Statistique Descriptive 140