Académique Documents
Professionnel Documents
Culture Documents
Y. LAMRANI ALAOUI
2020-2021
Variable quantitative
Une variable est dite quantitative si toutes ses valeurs possibles sont
numériques. On fait également la différence entre deux types de variables
quantitatives:
Variable quantitative discrète: si l’ensemble des valeurs possibles
est dénombrable.
Variable quantitative continue: si l’ensemble des valeurs possibles
est continu.
Variable qualitative
Une variable est dite qualitative quand toutes ses valeurs possibles(
modalités) ne sont pas numériques; mais des noms, des catégories, des
adjectifs,. . . . Il y a deux catégories de variables qualitatives:
Variable qualitative nominale : modalités ne peuvent pas être
ordonnées(ex.coleur des yeux).
Variable qualitative ordinale : quand les modalités peuvent être
ordonnées(ex. satisfaction client).
Une série statistique est la suite des valeurs prises par une variable X sur
les individus statistiques(observations):
Le nombre d’observations est noté n.
Les valeurs de la variable X sont notées: x1 , . . . , xi , . . . , xn
Exemple
On s’intéresse à la variable ’age’ et à la série statistique des valeurs prises
par cette variable sur 6 personnes(voir Table 2). Ici on a:
Effectifs et fréquences
Pour une variable qualitative nominale on peut calculer les effectifs et les
fréquences
Représentations graphiques
Le tableau statistique d’une variable qualitative nominale peut être
représenté par deux types de graphique:
1 Diagramme en secteurs(ou camembert ou piechart en anglais) pour
représenter les fréquences
2 Diagramme en barres pour représenter les effectifs
Exemple
Soit la variable ’Coleur-voiture’ notée X et soit la série statistique des
valeurs prises par X sur 20 voitures:
{N, N, B, G, G, N, G, G, G, N,G, N, J, N, J, B, G, G, G, N}
G grise
N noire
J jaune
B blanche.
Exemple(suite)
de plus on a :
xj nj fj
G 9 0.45
N 7 0.35
J 2 0.10
B 2 0.10
P4 P4
j=1 nj = 20 et j=1 fj =1
Exemple(suite):
Exemple
On interroge 16 personnes sur leur satisfaction d’un produit (variable Y ).
On a obtenu la série statistique suivante:
{S, MS, TS, NS, NS, S, TS, NS, NS, MS, S, TS, NS, NS, S, MS}
Exemple(suite)
De plus on a:
xj nj Nj fj Fj
NS 6 6 0.375 0.375
MS 3 9 0.1875 0.5625
S 4 13 0.25 0.8125
TS 3 16 0.1875 1
Exemple(suite):
Exemple(suite):
Les effectifs, les effectifs cumulés, les fréquences, les fréquences cumulées
sont données dans le tableau qui suit:
xj nj Nj fj Fj
1 5 5 0.10 0.10
2 9 14 0.18 0.28
3 15 29 0.30 0.58
4 10 39 0.20 0.78
5 6 45 0.12 0.90
6 3 48 0.06 0.96
8 2 50 0.04 1
On a n = 50
Avec xmax et xmin désigne la plus grande (resp. la plus petite) valeur
observée.
J = 1 + 3.3log10 (50) ≈ 7
[152; 155[
[155; 158[
[158; 161[
[161; 164[
[164; 167[
[167; 170[
[170; 173[
[aj ; bj ] nj Nj fj Fj
[152; 155[ 8 8 0.16 0.16
[155; 158[ 10 18 0.2 0.36
[158; 161[ 7 25 0.14 0.5
[161; 164[ 8 33 0.16 0.66
[164; 167[ 6 39 0.12 0.78
[167; 170[ 6 45 0.12 0.9
[170; 173[ 5 50 0.1 1.00
Histogramme
L’histogramme est une représentation graphique qui nous permet de
voir la forme de la distribution des données. On l’utilise surtout
lorsqu’on est en présence d’une variable quantitative continue.
La première chose à faire pour construire un histogramme est de
grouper les données en classes convenablement choisies.
fj
dj =
αj
Exemple:
Soit le tableau statistique de l’exemple précédent:
[aj ; bj ] nj Nj fj Fj αj hj dj
[152; 155[ 8 8 0.16 0.16 3 2.66 0.053
[155; 158[ 10 18 0.2 0.36 3 3.33 0.066
[158; 161[ 7 25 0.14 0.5 3 2.33 0.046
[161; 164[ 8 33 0.16 0.66 3 2.66 0.053
[164; 167[ 6 39 0.12 0.78 3 2 0.04
[167; 170[ 6 45 0.12 0.9 3 2 0.04
[170; 173[ 5 50 0.1 1.00 3 1.66 0.033
Exemple(suite):
Si on représente l’histogramme de l’exemple précédent on trouve la figure
ci-dessous:
Remarques
Lorsque les amplitudes (αj )des classes sont égales, dans un
histogramme on peut considérer l’effectif de chaque classe comme sa
hauteur sans diviser par l’amplitude.
Fonction de répartition
La fonction de répartition F (x) est une fonction de R dans [0, 1], qui est
définie par:
0 x < L0
fi+1
F (x) = F + αi (x − Li ) Li ≤ x < Li+1
i
1 x > Ln
Exemple:
Exemple:
xi ni fi ni × xi fi × xi
23 3 0.3 69 6.9
10 4 0.4 40 4
15 2 0.2 30 3
13 1 0.1 13 1.3
Total n=10 1 152 15.2
Formule généralisée par les fréquences:
X n
x̄ = fi × xi = 15.2
i=1
Formule généralisée par les effectifs:
n
1X 152
x̄ = ni × xi = = 15.2
n 10
i=1
Youssef, L. A. (EMSI) Statistiques descriptives 2020-2021 41 / 83
Paramètres de position
La moyenne : Variable quantitative continue
La moyenne arithmétique
n n
1X X
x̄ = ni × ci OU x̄ = fi × ci
n
i=1 i=1
Exemple:
Classe ni ci ni × ci
[3000; 4000[ 26 3500 91000
[4000; 5000[ 33 4500 148500
[5000; 6000[ 64 5500 352000
[6000; 7000[ 7 6500 45500
[7000; 8000[ 10 7500 75000
Total n=140 − 712000
Exemple(suite):
Classe ni ci ni × ci
[3000; 4000[ 26 3500 91000
[4000; 5000[ 33 4500 148500
[5000; 6000[ 64 5500 352000
[6000; 7000[ 7 6500 45500
[7000; 8000[ 10 7500 75000
Total n=140 712000
n
1X 1
x̄ = ni × ci = × 712000 = 5085.07
n 140
i=1
Remarques
Une moyenne ne se calcule que si les valeurs observées sont
numériques.
Une série ne peut pas posséder plusieurs moyennes distinctes.
Une moyenne est rarement une valeur observée de la série.
La moyenne est sensible aux valeurs aberrantes :
{1, 1, 1, 3, 3, 5, 6} 7→ x̄ = 2.86
Exemple:
Si on reprend la variable ‘Etat civil’ , dont le tableau statistique est le
suivant, le mode est C (célébataire)
xj nj fj
C 9 0.45
M 7 0.35
V 2 0.10
D 2 0.10
Le mode
Le mode correspond à la valeur de la variable pour laquelle l’effectif (ou la
fréquence) est le plus grand.
Exemple:
xi ni fi
1 5 0.10
2 9 0.18
3 15 0.30
4 10 0.20
5 6 0.12
6 3 0.06
8 2 0.04
Total n=50 1
Le mode dans cet exemple est: 3
Youssef, L. A. (EMSI) Statistiques descriptives 2020-2021 46 / 83
Paramètres de position
Le mode : Variable quantitative continue
Exemple(amplitudes égales):
Classes ni αi
[10; 20[ 5 10
[20; 30[ 10 10
[30; 40[ 15 10
[40; 50[ 5 10
Total n=35
Exemple(amplitudes inégales):
Classes ni αi hi
[10; 20[ 10 10 1
[20; 30[ 40 10 4
[30; 50[ 220 20 11
[50; 90[ 240 40 6
[90; 100[ 10 10 1
Total n=520
Méthode graphique
Exemple:
Classes ni αi
[210; 230[ 30 20
[230; 250[ 60 20
[250; 270[ 100 20
[270; 290[ 20 20
Total n=210
Solution de l’exemple:
Classes ni αi
[210; 230[ 30 20
[230; 250[ 60 20
[250; 270[ 100 20
[270; 290[ 20 20
Total n=210
Li = 250
αi = 270 − 250 = 20
∆1 = 100 − 60 = 40
∆2 = 100 − 20 = 80
Alors:
40
Mo = 250 + × 20 = 256.66
40 + 80
Médiane
Soit une série statistique ordonnée par ordre croissant.: {x1 , x2 , . . . , xn }, la
médiane Me est la valeur qui se trouve au milieu de la série ordonnée par
ordre croissant. Elle est calculée comme suit:
Si n est impair: Me = x( n+1 )
2
Remarque
La médiane peut toujours être définie comme la valeur pour laquelle
la fonction de répartition égale à 0.5, c’est-à-dire: F (Me ) = 0.5
La médiane est la valeur qui corresponde au 1ère fréquence cumulé
supérieur ou égale à 50%
Exemple 1
Soit la série statistique suivante {0, 0, 1, 1, 2, 2, 3, 4, }, on a n = 8. Alors:
x(4) + x(5) 1+2
Me = = = 1.5
2 2
Exemple 2
Soit la série statistique suivante {0, 0, 1, 1, 2, 2, 3}, on a n = 7. Alors:
Me = x(4) = 1
Exemple 3
Soit le tableau statistique suivant:
xj ni fj Fi
0 20 0.1 0.1
1 65 0.325 0.425
2 70 0.35 0.775
3 30 0.15 0.925
4 15 0.075 1
Total n=200 1
On a
0.425 < 0.5 ≤ F (2) = 0.775
On déduit que 2 est la valeur médiane.
−Fi
On a tan(α) = FLi+1
i+1 −Li
=M 0.5−Fi
e −Li
⇒ Me = Li + F0.5−F i
i+1 −Fi
× αi
Avec [Li+1 , Li [ est la classe médiane et αi = Li+1 − Li .
Youssef, L. A. (EMSI) Statistiques descriptives 2020-2021 56 / 83
Paramètres de position
La médiane : variable quantitative continue
Exemple
Soit le tableau statistique suivant:
Classe ni fj Fi
[3000; 4000[ 26 0.186 0.186
[4000; 5000[ 33 0.235 0.421
[5000; 6000[ 64 0.458 0.879
[6000; 7000[ 7 0.050 0.929
[7000; 8000[ 10 0.071 1
Total n=140 1
Les quantiles
La notion de quantile d’ordre p (où 0 < p < 1) généralise la médiane.
Un quantile xp d’ordre p est donné par: F (xp ) = p
Soit n le nombre de valeurs d’une série statistique ordonnée, si np est
un nombre entier, alors:
1
xp = (x(np) + x(np+1) )
2
Si np n’est pas un nombre entier, alors:
xp = x(dnpe)
où dnpe représente le plus petit nombre entier supérieur ou égal à np.
Exercice
Soit la série statistique suivante:{20, 13, 16, 7, 12, 30, 1, 18, 6, 34}:
1 Calculer le quantile x 1
2
2 Calculer le quantile x 1
3
Solution:
On commence par ordonner les valeurs de la série par ordre croissant:
:
1
1 On a np = 10 × 2 = 5; c’est un entier, alors:
x 1 = x(d3.33e) = x(4) = 12
3
Les quartiles
Les quantiles: {x 1 ; x 1 ; x 3 } s’appellent des quartiles:
4 2 4
x 1 représente le 1er quartile ou Q1
4
x 1 représente la médiane, appelé également le 2ème quartile ou Q2
2
x 3 représente le 3ème quartile ou Q3
4
Remarque
Le quartile d’ordre p est la valeur qui corresponde à la 1ère fréquence
cumulée supéerieure ou éegale à p.
Exemple
Soit le tableau statistique suivant:
xj ni fj Fi
0 20 0.1 0.1
1 65 0.325 0.425
2 70 0.35 0.775
3 30 0.15 0.925
4 15 0.075 1
Total n=200 1 −
Exemple:
Classe ni fj Fi
[3000; 4000[ 12 0.024 0.024
[4000; 6000[ 30 0.061 0.085
[6000; 8000[ 120 0.246 0.331
[8000; 9000[ 210 0.431 0.762
[9000; 10000[ 90 0.184 0.946
[10000; 12000[ 25 0.051 1
Total n=487 1 −
Exemple (suite):
Classe ni fj Fi
[3000; 4000[ 12 0.024 0.024
[4000; 6000[ 30 0.061 0.085
[6000; 8000[ 120 0.246 0.331
[8000; 9000[ 210 0.431 0.762
[9000; 10000[ 90 0.184 0.946
[10000; 12000[ 25 0.051 1
Total n=487 1 −
Exemple(suite): calcul de Q1 :
Classe ni fj Fi
[3000; 4000[ 12 0.024 0.024
[4000; 6000[ 30 0.061 0.085
[6000; 8000[ 120 0.246 0.331
[8000; 9000[ 210 0.431 0.762
[9000; 10000[ 90 0.184 0.946
[10000; 12000[ 25 0.051 1
Total n=487 1 −
Classe ni fj Fi
[3000; 4000[ 12 0.024 0.024
[4000; 6000[ 30 0.061 0.085
[6000; 8000[ 120 0.246 0.331
[8000; 9000[ 210 0.431 0.762
[9000; 10000[ 90 0.184 0.946
[10000; 12000[ 25 0.051 1
Total n=487 1 −
Classe ni fj Fi
[3000; 4000[ 12 0.024 0.024
[4000; 6000[ 30 0.061 0.085
[6000; 8000[ 120 0.246 0.331
[8000; 9000[ 210 0.431 0.762
[9000; 10000[ 90 0.184 0.946
[10000; 12000[ 25 0.051 1
Total n=487 1 −
Remarque
La formule de l’interpolation linéaire pourra être utilisé pour déterminer
n’importe quel quantile d’ordre p.
Etendue
L’etendue d’une variable quantitative discrète est la différence entre la
plus grande valeur et la plus petite valeur de cette variable, donnée
par:
E = xmax − xmin
L’étendue donne une idée de la dispersion des observations.
EQ = Q3 − Q1
[Q1 , Q3 [
a1 = Q1 − 1.5(Q3 − Q1 )
a2 = Q3 + 1.5(Q3 − Q1 )
xg = Plus petite observation supérieure ou égale a1 (moustache gauche)
xd = Plus grande observation inférieure ou égale a2 (moustache droite)
Exerice
Tracer la boı̂te à moustaches pour cette série statistiques:
Exercice:
Dans un groupe de 40 étudiants, on a fait une étude sur le nombre
d’heures de classe de chacun la journée de mardi:
Solution:
1.
xj ni fj Fi
1 2 0.05 0.05
2 3 0.075 0.125
3 7 0.175 0.300
4 9 0.225 0.525
5 10 0.250 0.775
6 6 0.150 0.925
7 2 0.05 0.975
8 1 0.025 1
Total n=40 1
Solution:
2.
x̄ Mode Médiane(Q2 ) Q1 Q3
4.325 5 4 3 5
3.
OU
n n
1X 1X
Var (X ) = ni (xi − x̄)2 = ni xi2 − x̄ 2
n n
i=1 i=1
Exemple:
xj ni ni × xi ni × xi2
3 3 9 27
5 1 5 25
9 2 18 162
11 2 22 247
Total n=8 54 456
1 Pn 54
x̄ = n i=1 ni xi = 8 = 6.75
1 n 2 2 456
− (6.75)2 = 11.44
P
V (x) = n i=1 ni xi − x̄ = 8
OU
n n
1X 1X
Var (X ) = ni (ci − x̄)2 = ni ci2 − x̄ 2
n n
i=1 i=1
Exemple:
Classe ni ci ni × ci ni × ci2
[0; 10[ 8 5 40 200
[10; 20[ 20 15 300 4500
[20; 30[ 32 25 800 20000
[30; 40[ 35 35 1225 42875
[40; 50[ 16 45 720 32400
[50; 60[ 15 55 825 45375
Total n=126 − 3910 145350
1 Pn 3910
x̄ = n i=1 ni ci = 126 = 31.03
1 Pn 2 2 145350
V (x) = n i=1 ni ci − x̄ = 126 − (31.03)2 = 190.71
p
La quantité: σX = Var (X ) s’appelle l’écart type de la variable
statistique X.
Exercice:
Y. LAMRANI ALAOUI
2020-2021