Académique Documents
Professionnel Documents
Culture Documents
1- Définitions :
a- On appelle population un ensemble d’éléments homogènes
auxquels on s’intéresse. Par exemple, les étudiants d’une section,
les familles des travailleurs, les enseignants d’une université, les
élèves d’une école…., cet ensemble (population) est noté par
Quantitatif :
Un caractère est dit quantitatif si toutes les modalités sont
mesurables,
On distingue 2 types de caractères quantitatifs :
Caractère quantitatif discret, si les modalités sont des
valeurs isolées. Par exemple le nombre d’enfants par ménage
ne peut être que 0, ou 1, ou 2, ou 3, . . . ; il ne peut jamais
prendre une valeur strictement comprise entre 0 et 1, ou 1 et
2, ou 2 et 3, . . . .
caractère quantitatif continu, les modalités peuvent
prendre toute valeur dans un intervalle. Par exemple la
moyenne obtenue appartient à l’intervalle [0 , 20], la taille
d’un étudiant appartient à l’intervalle [150,190] mais si on
change de population, par exemple la taille d’un nouveau né
appartient à [40 cm, 60cm].
Caractère
Qualitatif Quantitatif
2- Variable statistique :
On appelle statistique à une dimension, l’application notée X, définie
d’un ensemble fini appelé population, vers un ensemble appelé
ensemble des valeurs du caractère.
X
X :
X
Exemples :
1- : les étudiants admis au baccalauréat
X : La mention du bac
X :{passable, AB , B, TB, Excellent }
3- Tableau statistique :
a. Cas discret :
Soit X une statistique à une dimension, supposons que :
X( ) = x1 , x 2 ,..., x k .
n
fréquence de la valeur xi , le nombre noté f i i .
n
k
n est la taille de l’échantillon ( n ni n1 n2 .....nk ).
i 1
~ i n~i
fréquence cumulée en xi : fi f j .
j 1 n
les résultats concernant les observations, sont présentés dans un
tableau, en présentant les modalités numériques en ordre croissant,
et en donnant les effectifs, effectifs cumulés, fréquences et
fréquences cumulées.
k k
Remarque: n ni ; f i 1.
i 1 i 1
modalité Effectif Effectif fréquence Fréquence
cumulé cumulée
x1 n1 n1 f1 f1
x2 n2 n1 n2 f 2 f1 f 2
. . .
. . .
xk nk n fk 1
k k
ni n fi 1
i 1 i 1
Exemple :
On a noté le nombre d'enfants X de 20 familles.
On a les résultats suivants:
X 1 1 2 1 2 0 3 2 0 2
2 1 3 2 4 1 3 4 3 2
b. Cas continu :
Soit X une statistique à une dimension, supposons que X( ) = [a , b] tel
que cet intervalle soit subdivisé en k classes :
a0 , a1, a1, a2 ,....,ak 1 , ak . Avec : a0 a et ak b
Exemple :
Soient les données suivantes relevées sur un échantillon de 100 étudiants de MI :
Compléter ce tableau statistique suivant:
Taille (cm) ni ni fi fi
[150 ; 160 [ 5
[160 ; 170 [ 10
[170 ; 180 [ 40
[180 ; 190 [ 30
[190 ; 200 ] 15
a. Séries statistiques :
Définition :
Le couple xi , ni i 1, p est appelé série statistique discrète.
Le couple ai 1 , ai , ni i 1, p est appelé série statistique
continue.
4- Représentations graphiques :
a. Caractère qualitatif :
Représentation en secteurs circulaires :
On appelle diagramme en secteurs circulaire, le cercle contenant toutes
les modalités du caractère étudié, tel que la i ème modalité soit
représentée par l’angle i 2 f i ( f i est la fréquence de la
i ème modalité).
Représentation en tuyaux d’orgues :
On appelle représentation en tuyaux d’orgues d’un caractère qualitatif,
un rectangle obtenu pour la i ème modalité, en prenant une base
constante et une hauteur proportionnelle à l’effectif ni .
Exemple :
Le tableau suivant donne la répartition selon le groupe sanguin de
1000 individus pris au hasard
A
B
AB
O
5- Paramètres de caractérisation :
a- Etendu :
Etendu de la série, est le nombre noté e X max X min .
b- Amplitude :
Soit ai 1 , ai , ni i 1, p une série statistique continue, on appelle
e
amplitude de la classe ai 1, ai , le nombre noté am , ou k est le
k
nombre de classes.
Remarque :
Pour le moment, on choisit des classes de même amplitude. Diverses
formules empiriques permettent d’établir le nombre de classes pour un
échantillon de taille n .
On choisit le nombre de classes k E n .
Exemple 2 :
On a noté la moyenne (X) obtenue de 30 étudiants. On a les résultats
suivants:
X 12 10 8 13.5 10 17 10.5 8.5 13.5 11.5
13 11.5 9 7 8 14 7 5 9.5 6
2 3 4 3 6 10 9 9 12 13
[5 ; 8 [ 5 9 0.17 0.3
[8 ; 11 [ 11 20 0.37 0.67
[14 ; 17 ] 2 30 0.06 1
total 30 1
12
10
[2 ; 5 [
8
[5 ; 8 [
6 [8 ; 11 [
[11 ; 14 [
4
[14 ; 17 ]
2
7. Fonction de répartition :
a- Cas discret :
F : R 0 ,1
x F ( x) f i
x xi
F est une fonction en escalier, continue sur chaque intervalle
xi 1 , xi , et les xi sont les points de discontinuité. C’est-à-dire que
les points de X sont les points de discontinuité.
Reprenons l’exemple 1 :
X : Le nombre d’enfants à charge par famille :
xi ni ni fi fi
0 18 18 0.09 0.09
1 32 50 0.16 0.25
2 66 116 0.33 0.58
3 41 157 0.2 0.78
4 32 189 0.16 0.94
5 9 198 0.05 0.99
6 2 200 0.01 1
total 200 1
0 x0
0.09 0 x 1
0.25 1 x 2
0.58 2 x3
F x
0.78 3 x 4
0.94 4 x5
0.99 5 x6
1 x6
b- Cas continu :
On appelle fonction de répartition, la fonction notée F :
F : R 0 ,1
i 1 x ai 1
x F ( x) f j f i , x ai 1 , ai
j 1 ai ai 1
[5 ; 8 [ 5 9 0.17 0.3
[8 ; 11 [ 11 20 0.37 0.67
[14 ; 17 ] 2 30 0.06 1
total 30 1
0 x2
x2
0 . 0.13 x 2,5
52
x5
0.13 . 0.17 x 5,8
8 5
x 8
F x 0.3 . 0.37 x 8,11
11 8
x 11
0.67 14 11 . 0.27 x 11,14
0.94 x 14 . 0.06 x 14, 17
17 14
1 x 17
Remarque :
Le graphe de la fonction de répartition, appelé courbe cumulative, peut
s’obtenir directement à partir de l’histogramme des fréquences cumulées
en joignant les sommets internes des rectangles, cette fonction est
continue sur R .
La différence entre le cas discret et continu,
Dans le cas discret : La fonction de répartition, est une fonction en
escalier, continue sur chaque intervalle xi 1 , xi , et les xi sont les points
de discontinuité.
Dans le cas continue, la fonction de répartition est continue sue R ;
Cas continu :
On appelle classe modale, la classe qui correspond à l’effectif le
plus élevé. Si la classe modale est unique, alors le mode est
calculé par la formule suivante :
d1
M 0 LM 0 am
d1 d 2 0
Avec :
LM 0 la borne inferieure de la classe modale.
d1 : l’effectif de la classe modale – l’effectif précédent.
d 2 : l’effectif de la classe modale – l’effectif suivant.
[5 ; 8 [ 5 9 0.17 0.3
[8 ; 11 [ 11 20 0.37 0.67
[14 ; 17 ] 2 30 0.06 1
Total 30 1
M 0 LM 0
d1
a m0 8
11 5 3 8 4 .3 10
d1 d 2 11 5 11 8 6
Le plus grand nombre d’étudiants, ont eu une moyenne 10
12
10
[2 ; 5 [
8
[5 ; 8 [
6 [8 ; 11 [
[11 ; 14 [
4
[14 ; 17 ]
2
b- La médiane :
Cas discret :
Soit x1 x2 ... xn un échantillon discret.
On appelle médiane de cette série, la valeur notée M ed , telle
n n
que valeurs sont inferieurs et valeurs sont supérieurs.
2 2
xn xn
2 1
2
si n pair
M ed 2
x n 1 si n impair
2
x x 22
M ed 100 100 1 2
2 2
50% de familles ont le nombre d’enfants à charge 2
Cas continu :
On appelle classe médiane, la 1° classe dont l’effectif cumulé
n
soit supérieur ou égal à . On calcule la médiane par la formule
2
d’interpolation suivante :
n
ncummed
a
2
M ed LM ed med .
nmed
Avec :
LMed : la borne inferieure de la classe médiane.
ncummed : l’effectif cumulé jusqu’à la classe médiane
nmed : l’effectif de la classe médiane.
a med : l’amplitude de la classe médiane
[5 ; 8 [ 5 9 0.17 0.3
[8 ; 11 [ 11 20 0.37 0.67
[14 ; 17 ] 2 30 0.06 1
Total 30 1
n
ncummed
M ed LM ed
2 a 15 9 .3 9.63
med 8
nmed 11
50% d’étudiants ont eu une moyenne 9.63
c. Les quantiles :
Soit X une statistique telle que x1 x2 ... xn , et soit 0 ,1 . On
appelle quantile d’ordre , la valeur notée Q tel que n valeurs sont
Q et n n valeurs sont Q .
En pratique :
x n x n 1
si n N
Cas discret : Q 2
x E n 1 si n N
Cas continu :
On détermine d’abord la classe l1 ,l2 ,
Remarque :
On peut déterminer graphiquement les quantiles d’ordre , à partir du
graphe de la courbe cumulative, c’est la valeur x , qu’on peut lire sur
l’axe des abscisses, qui soit projection du point sur la courbe cumulative
correspondant à la valeur représentée sur l’axe des ordonnés :
x Q F 1
Cas particuliers :
i. Les quartiles :
Il y a 3 quartiles Q1 , Q2 , Q3 .
Le premier quartile Q1 est le quantile d’ordre 0.25
Le deuxième quartile Q2 est le quantile d’ordre 0.5
Le troisième quartile Q3 est le quantile d’ordre 0.75
x1 Q1 Q2 Q3 xn
25% 25% 25% 25%
Exemples :
Pour les deux exemples 1 et 2 , précédents , calculer les quantiles
d’ordre 0.25, 0.7 et 0.75
[5 ; 8 [ 5 9 0.17 0.3
[8 ; 11 [ 11 20 0.37 0.67
[14 ; 17 ] 2 30 0.06 1
total 30 1
7.5 4
0.25 n 7.5 Q0.25 5,8 Q0.25 5 .3 7.1
5
La médiane : M ed 9.63
21 20
0.7 n 21 Q0.7 11,14 Q0.7 11 .3 11.37
8
Remarque :
On peut déterminer graphiquement les quantiles d’ordre , à partir du
graphe de la courbe cumulative :
d. La moyenne arithmétique :
Soit xi , ni i 1, p respectivement ai 1 , ai , ni i 1, p une série
statistique discrète (respectivement continue).
xi ni ni xi
0 18 0
1 32 32
2 66 132
3 41 123
4 32 128
5 9 45
6 2 12
Total 200 472
1 k 472
X ni X i 2.36
n i 1 200
Cas continu :
La moyenne Le ni ni Ci
centre
[2 ; 5 [ 3.5 4 14
[5 ; 8 [ 6.5 5 32.5
[8 ; 11 [ 9.5 11 104.5
[14 ; 17 ] 15.5 2 31
Total 30 282
1 k 282
X ni Ci 9.4
n i 1 30
e. Forme de la distribution :
Distributions uni-modales dissymétriques (à droite ou à gauche)
mod med Moy : Etalement à droite mod med Moy : Etalement à gauche
ni xi2 X 2 2 xi X
1 k
n i1
1 k 1 k 1 k
ni xi ni X 2 ni xi X
2 2
[2 ; 5 [ 3.5 4 14 49
1 k 282
X ni Ci 9.4
n i 1 30
1 k
V X ni ci2 X 2
2983 .5
9.42 11.09 : Une dispersion
n i 1 30
8- Les Moments :
a- On appelle moment d’ordre r , le nombre :
1 k 1 k
mr ni xir (respectivement : mr ni Cir .
n i 1 n i 1
Remarque : m 1 X , 1 0, 2 2 .
9- Paramètres de formes :
a- On appelle coefficient de variation, le nombre : CV .
X
3
b- On appelle coefficient d’asymétrie, le nombre : .
3
Si 0 étalement à droite
0 symétrie
0 étalement à gauche.
0 : symétrique
4
3.
4
Si : 0 aplatissement faible .
0 aplatissement fort.
r ( Z ) ni zi Z a r r X
1 n r
n i1
Démonstration :
k k k k
ni a xi b
1 1 1 1
Z
n
ni zi
i 1 n i 1 n
a ni xi
i 1 n
i 1
ni b
1 k 1 k
n i1
ni xi ba
n
i 1
ni
a X b
V Z ni zi Z ni (a xi b) (a X b)
1 n 2 1 n 2
n i1 n i1
2
ni axi X
1 n
n i1
2
a 2 ni xi X
1 n
n i1
a2 V X
ni zi Z b) r
n
1 n
r Z
1
r
ni ( a xi b ) ( a X
n i 1 n i1
ni axi X r
1 n
n i1
r
a r ni xi X
1 n
n i1
ar r X
Exercice 1:
On a relevé entre les années 1974 et 1984, la production de blé (X en quintaux), On a
obtenu les résultats suivants :
Valeurs 200 184 225 250 240 195 210 225 250 230
de X
Réponse :
Les classes Ci Yi ni ni yi ni yi 2
[184, 206[ 195 -1 3 -3 3
[206,228[ 217 0 3 0 0
[228,250] 239 1 4 4 4
1 7
e 66
am 22
k 3
1 3 1
Y ni yi 0.1
n i 1 10
1 n
V Y ni yi2 Y 2 . 7 0.12 0.69
1
n i 1 10
X 217 1
Y X 9.86
22 22
X 217 1 1
Y X 9.86 0.1 X 9.86 0.1 9.96
22 22 22
X 219 .2
2
1
V Y 0.69 V X V X 22 2 .. 0.69
22
V X 333 .96
X 18.3
Exercice 2 :
L’étude de la taille de 50 nouveaux nés, a donné les résultats suivants :
Réponse :
Xi Ci ni ni ni Ci Ci X ni Ci X ni Ci X ni Ci X
2 3 4
[46 ; 48 [ 47 35 20 940 0 0 0 0
Le mode :
d1
M 0 LM 0 am0 46
20 8 2 47
d1 d 2 20 8 20 8
n
ncummed
La médiane : M ed LM ed
2 a 25 15 .2 47
med 46
nmed 20
2350
La moyenne : X 47
50
mod med Moy , donc la distribution est symétrique.
ni ci X
k
La variance : V X 2
1 368
2
7,36
n i 1 50
ni ci X 0 donc le coefficient d’asymétrie : 3 . 0 .
1 k
3 2
n i 1 3
Alors la distribution est symétrique.
ni ci X
k
1 8000
4
4 160
n i 1 50
4 160
Donc le coefficient d’aplatissement : 3. 3 0.04 0
4 7,36 2
On peut dire que l’aplatissement est moyen.