Vous êtes sur la page 1sur 15

Vocabulaire spécifique des statistiques

______________________________

On considère un ensemble Ω fini appelé population, les unités statistiques ou les individus
sont les éléments de Ω, le nombre d’individus, N, est l’effectif total.
A chaque individu ω, on associe un seul nombre réel X(ω) ; la notation X est appelé caractère
quantitatif ou variable statistique numérique : X est une application de Ω vers ℝ.

I. Cas où X est une variable statistique discrète

C’est le cas où on précise bien toutes les valeurs prises par X. Il y en a p et elles sont rangées
en ordre strictement croissant : x1, x2,…, xp.
x1, x2,…, xp sont appelées les modalités de X.

A chaque modalité xi (pour 1≤ i≤ p et i entier), on associe son effectif ni qui est le nombre
d’individus prenant par X, la valeur xi ; fi = ni /N est la fréquence de la modalité xi.

La série statistique simple associée à X est donnée par un tableau qui indique bien toutes les
modalités rangées en ordre strictement croissant et l’effectif ou la fréquence de chaque
modalité :

Modalités x1 x2 x3 ……… xp
Effectifs n1 n2 n3 ……… np
Fréquences f1 f2 f3 ……… fp

Un mode de la série statistique est une modalité pour laquelle l’effectif est maximal .
Exemple 1

Étude des avaries dans un atelier composé de 10 machines identiques pendant une
période de 200 jours ouvrables
Caractère étudié : X= nombre d’avaries dans l’atelier au cours d’une journée (on admettra
qu’une machine ne peut pas tomber en panne plus d’une fois par jour). X est une variable
discrète prenant ses valeurs dans l’ensemble {0 ; 1 ; 2 ;… ;10} ; les valeurs xi prises par X
sont les modalités.
La population est l’ensemble des 200 journées qui font l’objet de l’étude : N=200.
Les effectifs ni sont le nombre de journées ayant vu xi machines en panne.

La série statistique étudiée donne le tableau statistique ci-dessous :

xi 0 1 2 3 4 5
ni 86 74 30 7 2 1
fi 0,43 0,37 0,15 0,035 0,01 0,005

1°) Donner le mode.


Réponse :

2°) Calculer l’effectif des jours pour lesquels le nombre d’avaries est inférieur strictement à 2.
Réponse :

3°) Calculer l’effectif des jours pour lesquels le nombre d’avaries est supérieur strictement à 3.
Réponse :

Exemple 2
L’entreprise d’entretien A dispose d’un fichier clients comportant nom, nature de l’activité,
pièces et superficies à entretenir, produits achetés, dates de renouvellement, factures réglées
ou à récupérer, remises accordées…
On extrait du fichier de cette entreprise une liste de 50 clients disposant de bureaux, la liste du
nombre de bureaux par client constitue une série statistique à variable discrète. Un
regroupement fournit alors le tableau suivant des effectifs et des fréquences.

Nombre de bureaux 1 2 3 4 5 6 7 8 9 11
Effectifs 2 5 5 7 11 9 4 3 2 2
Fréquences 0,04 0,10 0,10 0,14 0,22 0,18 0,08 0,06 0,04 0,04

1°) Donner le mode.


Réponse :

2°) Calculer l’effectif des clients qui ont au plus 3 bureaux


Réponse :

3°) Calculer l’effectif des clients qui ont strictement plus de 7 bureaux.
Réponse :
On représente une telle série par un diagramme en bâtons dont les hauteurs sont
proportionnelles aux effectifs et qui est d’interprétation immédiate.

Fréquences Effectifs

0,2

0,1

Nombre de bureaux

Exemple 3
Pour la vérification de véhicules en sortie de fabrication, on a établi 32 points de contrôle.
Sur un échantillon de 100 véhicules pris au hasard dans la chaîne, on relève la variable X,
nombre de points non satisfaisants par véhicule.
X prend les valeurs xi : xi ∈ {0 ; 1 ; 2 ;… ; 32}, aux quelles on associe ni, nombre de véhicules
ayant xi contrôles non satisfaisant.

xi 0 1 2 3 4 5 6
ni 20 32 25 14 5 3 1

1°) Donner le mode.


2°) Calculer l’effectif des véhicules qui ont au moins 5 points non satisfaisants.
3°) Calculer l’effectif des véhicules qui ont au plus 2 points non satisfaisants.
4°) Dresser le diagramme en bâtons correspondant.

Réponse :

1°) Le mode est 1, c’est la modalité pour laquelle l’effectif est maximal.

2°) L’effectif des véhicules ayant au moins 5 points non satisfaisants est donné par 3+1=4.
3°) L’effectif des véhicules ayant au plus 2 points non satisfaisants est donné par
20+32+25=77.

4°) Le diagramme en bâtons est le suivant :

32

25

20

14

3
1
II. Cas où X est une variable statistique continue

On se place dans le cas suivant :


- On se donne p + 1 (avec p dans ℕ*) nombres rangés en ordre strictement croissant α0,
α1, α2,…,αp-1, αp.
- X ne prend ses valeurs que dans l’intervalle semi-ouvert [α0, αp+1[.
- A chaque intervalle [αi-1, αi[ appelé classe (pour i entier avec 1≤ i≤ p), on associe son
effectif ni qui est le nombre d’individus prenant par X une valeur dans [αi-1, αi[ ;
fi=ni/N est la fréquence de la classe [αi-1, αi[. xi=(αi-1+ αi)/2 est le centre de cette classe.

La série statistique continue, définie par X, est donnée par un tableau qui indique, pour chaque
classe [αi-1, αi[ (avec i entier et 1≤ i ≤ p), son centre éventuellement, son effectif ou sa
fréquence :
Classes [α0, α1[ [α1, α2[ … … … [αp-1, αp[
Centres x1 x2 ... … … xp
Effectifs n1 n2 ... … … np
Fréquences f1 f2 ……… fp

Avec i entier et 1≤ i ≤ p,
- L’effectif cumulé croissant de la classe [αi-1, αi[ est le nombre d’individus prenant par
X, une valeur dans l’intervalle [α0, αi[ ; ce nombre vaut : n1+n2+…+ni. La fréquence
cumulée croissante de cette classe vaut : (n1+n2+…+ni)/N = f1+f2+…+fi.
- L’effectif cumulé décroissant de la classe [αi-1, αi[ est le nombre d’individus prenant
par X une valeur dans l’intervalle [αi-1, αp[ ; ce nombre vaut : ni+ni+1+…+np. La fré-
quence cumulée décroissante de cette classe vaut : (ni+ni+1+…+np)/N = fi+fi+1+…+fp.

Une classe modale est une classe pour laquelle l’effectif est maximal.

1. Exemple, histogramme, polygone des effectifs ou des fréquences

Énoncé : On a relevé et rassemblé dans un tableau les surfaces de plancher à nettoyer pour les
50 clients de l’entreprise de nettoyage A.
Surface [10, 30[ [30, 50[ [50, 70[ [70, 90[ [90, 110[ [110, 130[ Plus
en m2 de 130
Effectifs 2 8 14 12 7 4 3

1ère Partie : 1°) Remplacer l’indication " Plus de 130" par un intervalle [a, b[ avec a et b réels
et a< b. Dresser le tableau statistique donnant le centre, l’effectif et la fréquence de chaque
classe.
2°) Quel est l’effectif de la classe [50, b[ ? Que représente ce nombre ?
3°) Quel est l’effectif de la classe [10, 70[ ? Que représente ce nombre ?

2ème Partie : Sur l’axe des modalités, 1 cm donne la distance des graduations 0 et 20. Sur l’axe
des effectifs, 1 cm donne la distance des graduations 0 et 2.
1°) Tracer l’histogramme de la série statistique continue.
2°) Tracer, en pointillé, le polygone des effectifs.
Résolution :

1ère Partie : 1°) Les intervalles précédents ayant pour amplitude 20, on choisit l’intervalle [130,
150[ pour l’indication " Plus de 130".
On obtient le tableau statistique suivant ( L’effectif total est 50) :

Surfaces
en m2 [10, 30[ [30, 50[ [50, 70[ [70, 90[ [90, 110[ [110, 130[ [130, 150[
Centres
des classes 20 40 60 80 100 110 140
Effectifs 2 8 14 12 7 4 3
Fréquences 0,04 0,16 0,28 0,24 0,14 0,08 0,06

2°) L’effectif de la classe [50, 150[ vaut : 14+12+7+4+3=40. C’est l’effectif cumulé
décroissant de la classe [50, 70[.

3°) L’effectif de la classe [10, 70[ vaut : 2+8+14=24. C’est l’effectif cumulé croissant de la
classe [50, 70[.

2ème Partie :

1°) On dessine des rectangles de hauteur les effectifs des classes pour obtenir l’histogramme.
2°) On joint par des segments de droite les points de coordonnées (0, 0), (20, 2), (40, 8), (60,
14), (80, 12), (100, 7), (120, 4), (140, 3), (160, 0) pour obtenir le polygone des effectifs.
En changeant l’échelle de l’axe des ordonnées, on obtient aussi le polygone des fréquences.

Le polygone des effectifs ou des fréquences est en pointillé.

Effectifs Fréquences

14

10 0,2

0,1

0 20 40 60 80 100 120 140


2. Exemple avec les effectifs cumulés

Énoncé : Un relevé du nombre d’année au service d’une entreprise fournit le tableau suivant :

Nombre Moins de 4 à 8 8 à 12 12 à 16 16 à 20 20 à 30 Plus de 30


d’années 4
Effectifs 6 7 10 8 5 4 3

Remplacer les indications "Moins de 4" et "Plus de 30"par des intervalles et faire le tableau
statistique donnant, en fonction des classes, les centres, les effectifs, les effectifs cumulés.

Résolution : Le tableau statistique est donné de la manière suivante :

Nombre
d’années [0, 4[ [4, 8[ [8, 12[ [12, 16[ [16, 20[ [20, 30[ [30, 40[
Effectifs 6 7 10 8 5 4 3
Effectifs cumulés
croissants 6 13 23 31 36 40 43
Effectifs cumulés
décroissants 43 37 30 20 12 7 3
3. Polygones d ‘effectifs ou de fréquences cumulés
On reprend les notations précédant le paragraphe 1 : La série statistique continue X est
représentée par le tableau statistique :

Classes [α0, α1[ [α1, α2[ … [αi–1, αi[ … [αp-1, αp[


Centres x1 x2 ... xi ... xp
Effectifs n1 n2 ... ni … np
Fréquences f1 f2 … fi … fp

où α1< α2< …< αi–1 < αi… αp-1< αp et N= n1+n2+…+np.

① On commence par dresser le tableau statistique donnant les classes, leurs effectifs
cumulés :
Classes [α0, α1[ [α1, α2[ … [αi–1, αi[ … [αp-1, αp[
Effectifs n1 n2 ... ni … np
Effectifs cumulés A1 A2 ... Ai … Ap=N
croissants
Effectifs cumulés B1=N B2 … Bi … Bp
décroissants

② On trace une ligne polygonale en joignant par des segments de droites successivement les
points de coordonnées (α0, 0), (α1, A1), (α2,A2),…( αi, Ai),...( αp, Ap) .
On a obtenu la ligne polygonale des effectifs cumulés croissants ; c’est la représentation
graphique d’une fonction F.

On trace une ligne polygonale en joignant par des segments de droites successivement les
points de coordonnées (α0, B1), (α1, B2)…(αi, Bi+1, ... (αp-1, Bp), (αp, 0) .
On a obtenu la ligne polygonale des effectifs cumulés décroissants ; c’est la représentation
graphique d’une fonction G.

Propriétés et définitions
∗ On peut vérifier l’égalité : Pour tout x de [α 0, α p], F(x)+G(x)=N.

∗ Les 2 fonctions F et G sont affines sur chacun des intervalles [α0, α1], [α1, α2],…
[αp-1, αp] ; on dit que ces fonctions sont affines par morceaux sur [α0, αp].

∗ Si les effectifs n1, n2,…,np sont tous strictement positifs :


F est continue et strictement croissante sur [α 0, α p] avec F(α 0)=0 et F(αp)= N,
G est continue et strictement décroissante sur [α 0, α p] avec G(α 0)= N et G(αp)= 0.
③ En remplaçant les effectifs cumulés par les fréquences cumulées dans les constructions
précédentes, on obtient les polygones des fréquences cumulées qui sont les représentations
1 1
graphiques des 2 fonctions f et g définies par f(x)= F(x) et g(x)= G(x).
N N
④ Fonction de répartition
- Avec x dans [α0, αp], on considère que F(x) est l’effectif de la classe [α0, x[ tandis que f(x)
est la fréquence de cette classe. On dit que F , ou que f, est la fonction de répartition de la
variable statistique X.

- Avec α0 ≤ a ≤ b ≤ αp, F(b)–F(a) est l’effectif de la classe [a, b[ tandis que f(b)–f(a) est la
fréquence de la classe [a, b [.

⑤ Étude d’un exemple

On reprend l’exemple de l’entreprise A vue au paragraphe II.1 où l’on a obtenu le tableau


statistique suivant ( L’effectif total est 50) :
Surfaces
en m2 [10, 30[ [30, 50[ [50, 70[ [70, 90[ [90, 110[ [110, 130[ [130, 150[
Effectifs 2 8 14 12 7 4 3

1°) Dresser le tableau statistique donnant les classes, leurs effectifs et leurs effectifs cumulés.

2°) Tracer les polygones des effectifs cumulés et des fréquences cumulées.

3°) Soit Me l’abscisse du point d’intersection I des polygones des effectifs cumulés. Quelle est
l’ordonnée de ce point ?

Sur l’axe des modalités, 4 cm donne la distance des graduations 0 et 50. Sur l’axe des effectifs
cumulés, 2 cm donne la distance des graduations 0 et 10.

Corrigé de l’exercice
1°)

Classes [10, 30[ [30, 50[ [50, 70[ [70, 90[ [90, 110[ [110, 130[ [130, 150[
Effectifs 2 8 14 12 7 4 3
Effectifs
cumulés 2 10 24 36 43 47 50
croissants
Effectifs
cumulés 50 48 40 26 14 7 3
décroissants

2°) Les ordonnées donnant les effectifs cumulés, le polygone des effectifs cumulés croissants
passe par les points de coordonnées (10, 0), (30, 2), (50, 10), (70, 24), (90, 36), (110, 43),
(130, 47), (150, 50).

Le polygone des effectifs cumulés décroissants passe par les points de coordonnées (10, 50),
(30, 48), (50, 40), (70, 26), (90, 14), (110, 7), (130, 3), (150, 0).
y y/50

Effectifs Fréquences
cumulés cumulées

50 1

40

30
25 0,5
20

10

O 50 Me 100 150
2
Surface (m )

3) Le polygone des effectifs cumulés croissants est la représentation graphique de la fonction


numérique F, le polygone des effectifs cumulés décroissants est la représentation graphique
de la fonction numérique G.
∗ Les propositions suivantes sont équivalentes :
{ F(Me)=G(Me)}, {F(Me)+G(Me)=50 et F(Me)–G(Me)=0},{2F(Me)=50 et F(Me)+G(Me)=50},
{ F(Me)=25}.
∗ On en déduit que 25 est l’ordonnée du point I, d’abscisse Me, commun aux 2 polygones des
effectifs cumulés.

Dans un paragraphe suivant, on va calculer la valeur de Me.


5. Valeurs caractéristiques
On prend les notations précédant le paragraphe 1 et les notations du paragraphe 3.

a) La classe modale est la classe d’effectif maximal. Le mode est le centre de cette classe.

b) La médiane est le nombre Me qui vérifie Ê(Me)=N/2 soit Ĝ (Me)=1/2, c’est-à-dire


ê(Me)=N/2 soit ĝ(Me)=1/2.

Le nombre Me est ainsi le point d’intersection des polygones des effectifs ( ou des fréquences)
cumulées.

c) Quartiles
Le premier quartile Q1 est la valeur qui vérifie Ê(Q1) =N/4 ou Ĝ(Q1)= 1/4.
Le troisième quartile Q3 est la valeur qui vérifie Ê(Q3)= 3N/4 ou Ĝ(Q3)= 2/4.

La différence I=Q3–Q1 est l’(intervalle) interquartile ; c’est une caractéristique de dispersion


tandis que la médiane et les quartiles sont des caractéristiques de position.
6.Calcul des caractéristiques de position

a) Préliminaires
r r
∗ Soit R=(O, i , j ) un repère du plan et (D) la droite d’équation y= px+r (p et r sont 2 réels
constants).
Soit f une fonction numérique définie (au moins) sur I, un ensemble de réels, soit (C) la
représentation graphique de f dans R.

(D)
β B

γ C
α A

r
j
r
O i a c b

On se place dans le cas où pour tout x de I, le point M de (C) d’abscisse x se trouve sur (D) ;
cela revient à dire que : f(x)=px+r pour tout x de I . On dit alors que f est une fonction affine
sur I.

Soient a, b et c trois réels de I et α, β et γ les images respectives de a, b et c par f.


Par exemple, on se place aussi dans le cas où α, β et γ sont 3 réels distincts deux à deux.
Forcément a,b et c sont aussi 3 réels distincts deux à deux.

Les 3 points A, B et C de coordonnées respectives (a, α), (b, β) et (c, γ) se trouvant sur la
γ −α β −α
droite (D) de pente p, on a p= = soit en passant aux inverses de ces réels non
c−a b−a
c−a b−a
nuls : = . On résumera ce résultat de la manière suivante :
γ −α β −α

a ; c ; b 
La correspondance   due à la fonction f affine sur I, donne par interpolation
α ; γ ; β 
γ −α β −α c−a b−a
linéaire : = ou = .
c−a b−a γ −α β −α

∗ Pour la suite, on écrira tous les nombres à calculer sous la forme e+ s où e est un entier et s
un réel vérifiant 0≤ s < 1.
b) Exemple de calcul

On a le tableau statistique suivant :

Classes [10 ; 30[ [30 ; 50[ [50 ; 70[ [70 ; 90[ [90 ; 110[ [110 ; 130[ [130 ; 150[
Effectifs 2 8 14 12 7 4 3
Effectifs 2 10 24 36 43 47 50
cumulés
croissants

Le polygone des effectifs cumulés croissants est la représentation graphique de la fonction F.

1° Donner les valeurs F(x) pour x dans {10, 30, 50, 70, 90, 110, 130, 150 }.
2° Calculer la médiane Me.
3° Calculer le premier quartile.
4° Calculer le troisième quartile et l’interquartile.
5° Attribuer à la classe [65, 85[, son effectif et sa fréquence.
_____________________________
1° On donne les résultats sous forme de tableau :

x 10 30 50 70 90 110 130 150


F(x) 0 2 10 24 36 43 47 50

2° La moitié de l’effectif total est 25=50/2 et F(70)<25< F(90). F étant une fonction affine sur
[70, 90], elle prend la valeur 25 en Me de ]70, 90[. On a, par F, la correspondance :
 70 ; M e ; 90 
  .
 24 ; 25 ; 36 
Cela donne par interpolation linéaire :
M e − 70 90 − 70
= soit Me–70= 20/12=5/3= 1+2/3 d’où : Me=71+2/3≈71,67 .
25 − 24 36 − 24

3° Le quart de l’effectif total est 50/4=12,5 et F(50)<12,5<F(70). F étant une fonction affine
sur [50, 70], elle prend la valeur 12,5 en Q1 de ] 50, 70[. On a par F la correspondance :
 50 ; Q1 ; 70 
  .
10 ; 12,5 ; 24 
Cela donne par interpolation linéaire :
Q1 − 50 70 − 50 Q − 50 20 10
= soit 1 = = d’où Q1–50 = 25/7= 3+4/7 soit :
12,5 − 10 24 − 10 2,5 14 7
Q1=53+4/7 ≈53,57 .

4° Trois quart de l’effectif total vaut 3× 50/4=37,5 et F(90)<37,5<F(110). F étant une


fonction affine sur [90, 110], elle prend la valeur 37,5 en Q3 de ] 90, 110[. On a par F la
correspondance :
 90 ; Q3 ; 110 
  .
 36 ; 37,5 ; 43 
Cela donne par interpolation linéaire :
Q3 − 90 110 − 90 Q − 90 20
= soit 3 = d’où Q3–90 = 30/7= 4+2/7 soit Q3=94+2/7 ≈94,29 .
37,5 − 36 43 − 36 1,5 7

L’interquartile I vaut : I=Q3–Q1= 94–53+2/7–4/7=41–2/7=40+(1–2/7) soit :


I=40+5/7≈40,71 .

5° L’effectif attribué à la classe [65, 85[ est e=F(85)–F(65), sa fréquence est f=e/50.

 70 ; 85 ; 90 
a) F est une fonction affine sur [70, 90] qui donne la correspondance   où
 24 ; e2 ; 36 
e − 24 36 − 24 e − 24 12
e2= F(85) ; par interpolation linéaire, on a : 2 = soit 2 = =0,6.
85 − 70 90 − 70 15 20
Alors e2–24=9 d’où F(85)= e2=33.

 50 ; 65 ; 70 
b) F est une fonction affine sur [50, 70] qui donne la correspondance   où
10 ; e1 ; 24 
e − 10 24 − 10 e − 10 14
e1= F(65) ; par interpolation linéaire, on a : 1 = soit 1 = =0,7.
65 − 50 70 − 50 15 20
Alors e1–10 = 10,7 d’où F(65)= e1=20,5.

c) Finalement : e= 33–20,5= 12,5 et f=12,5/50=0,25 .


III. Cas des variables statistiques discrètes

En utilisant les effectifs cumulés croissants, les fréquences cumulées croissantes…on


définit aussi médiane, quartiles, écart interquartile.

Exemple : Le relevé du nombre journalier d’interventions demandée à une entreprise de


réparation à domicile s’établit comme suit pour les 60 jours ouvrables d’un trimestre.
Nombre 15 18 19 20 21 22 23 24 25 26 27 28 29 30 32
de demandes
Nombres 1 1 2 2 4 6 6 7 9 8 4 5 3 1 1
de jours
1° Effectuer la représentation en bâtons de cette série.
2° Donner le mode. Calculer la médiane Me et les quartiles Q1 et Q2.

Résolution : 1°

Effectifs
(Nombre de jours)
10

0
15 17 19 21 23 25 27 29 31 33 Modalités
(Nombre de demandes)

2° On a le tableau de calcul suivant :

Modalités 15 18 19 20 21 22 23 24 25 26 27 28 29 30 32
Effectifs 1 1 2 2 4 6 6 7 9 8 4 5 3 1 1
Effectifs
cumulés 1 2 4 6 10 16 22 29 38 46 50 55 58 59 60
croissants

60/4=15 ; 60/2=30 ; 3×60/4=45

Au vu du tableau : 22 est le 1er quartile, 25 est la médiane, 26 est le 3ème quartile .