Vous êtes sur la page 1sur 15

Chapitre 1:

STATISTIQUE DESCRIPTIVE A UNE SEULE DIMENSION

0- Introduction
Le but de la statistique descriptive est qu’à partir d’un nombre de résultats
obtenus au cours de l’étude d’un phénomène (économique social, politique,…) on
peut tirer de conclusions concernant ce phénomène.

1 - Définitions et Notions de Base


Maintenant, on passe à la terminologie élémentaire utilisée en statistique descriptive.
1.1 Population (Univers statistique)
La population ou l’univers statistique, est l’ensemble de tous les éléments
concernés par l’étude statistique.

Exemples

-On considère l’ensemble des étudiants de la section A. On s’intéresse aux


nombre de frères et sœurs de chaque étudiant. Dans ce cas la population est
l’ensemble de tous les étudiants de la section A.

– Si l’on s’intéresse maintenant à la circulation automobile dans la ville de Sétif à une


date donnée. Dans ce cas, la population est alors constituée de l’ensemble des
véhicules susceptibles de circuler dans la ville de Sétif à une date donnée.

1.2 Individu ( Unité statistique).


Un individu, ou une unité statistique, est un élément d'une population.
Exemple : Dans le premier exemple indiqué ci-dessus, un individu est tout étudiant
de la section A.

1.3 Echantillon
Lorsque la population est trop importante, on étudie un échantillon, c’est-à-dire un
sous-ensemble de la population.

1.4 Taille
La taille d’un échantillon (d’une population) est le nombre des individus de
l’échantillon (ou de la population).

1.5 Caractère ou variable statistique


Le caractère, ou la variable statistique, est la propriété caractéristique d'un
individu.
1.6 Nature du caractère

Les caractères se décomposent en deux types :

1.6.1 Caractère qualitatif


Tout caractère qu’on ne peut pas mesurer par des valeurs réelles.
Exemples : région géographique, religion d'une personne, nationalité, groupe
sanguin d'une personne, profession, … etc.

1.6.2 Caractère quantitatif


C’est un caractère mesurable, autrement dit, on peut associer à chaque individu de la
population une valeur réelle qui mesure le caractère.

Ce dernier se décompose à son tour à deux types :


a)- Caractère quantitatif discret (Variable statistique discrète) :

Un caractère quantitatif est dit discret lorsqu’il ne peut prendre que des valeurs
isolées.

Exemples :

1- Le nombre d'enfants chez chaque famille d’un ensemble de familles.

2- Le nombre d’années de scolarité complétées par d’un groupe de 100 personnes.

3- Le nombre de salariés dans une entreprise d’un ensemble de 20 entreprises.

b)- Caractère quantitatif continue (Variable statistique continue)

Un caractère quantitatif est dit continue lorsqu’il peut prendre toutes les valeurs de
son intervalle de variation.

Exemples :

- 1- Les poids d’un ensemble de personnes.


2- Les tailles d’un ensemble de personnes.
3- Le temps passé devant la télévision d’un ensemble de personnes.

1.7 Modalité
Le même caractère peut changer d’état d’un individu à un autre. Généralement,
lorsque le caractère est qualitatif : chaque état est dit modalité et l’osque le caractère
est quantitatif : chaque valeur réelle ( ou intervalle) est une modalité.

Exemples :
- Le cas qualitatif : Si on considère le caractère " groupe sanguin ", ses modalités
seront : A, B, ,AB ,O.
- Le cas quantitatif discret : Si on considère le caractère " Le nombre d'enfants",
ses modalités seront par exemple : 0, 1, 2, 3 ,…
Le cas quantitatif continu : Si on considère le caractère " La taille ", ses modalités
seront par exemple : [ 150cm,155cm [ ; [ 155cm,157cm [ ; [ 157cm,165cm [,…
1.8 Classes

Pour étudier un caractère quantitatif continu, on divise son ensemble de variation en


des sous intervalles (classes) de valeurs ayans des amplitudes ( la longueur de
l’intervalle) constantes .

Si [ ai,bi[ est la ième classe , alors l’amplitude est : ki=ai-bi.

1.9 Effectif et fréquence


- L’effectif est le nombre des éléments correspondant à la modalité Mi. Il est noté par
.

- La fréquence notée de la modalité Mi est donnée par : .

- L’effectif total est .

- La fréquence totale est .

1.8 Distribution statistique ou série statistique


C’est l'ensemble des modalités d'un caractère et des effectifs (freq) d’individus de
cette population, présentés sous forme de tableau statistique.

Xi ni
X1 n1
X2 n2
. .
. .
Xk nk
total N

X : le caractère considéré.
Xi : les modalités du caractère ordonnées de la plus petite à la plus grande valeur, s’il
est quantitatif.
ni : l'effectif qui présentent la modalité Xi
N : l'effectif total.

1.9 Effectifs cumulés croissants et décroissants

Cas discret :

- L’effectif cumulé croissant noté Ni↑ est la somme des effectifs correspondants aux
Valeurs du caractère inférieures à Xi, alors on a :
Ni↑= n1 + n2 + ... + ni.

- Similairement à la définition précédente, on définit la fréquence cumulée croissante


notée Fi↑ , on a :

Fi↑= f1 + f2 + ... + fi.


- L’effectif cumulé décroissant noté Ni# est la somme des effectifs correspondants aux
valeurs du caractère supérieure à Xi.
Même chose pour la définition de la fréquence cumulée décroissante notée Fi#
Cas continu :

Dans le cas continu, on définit d’une manière analogue Ni↑ , Fi↑ en remplaçant Xi par la
borne supérieure de la ième classe, et pour Ni# , Fi# ,on remplace Xi par la borne

inférieure de la ième classe.

Exemple *: Dans une cité résidée par 64 familles. On s’intéresse au nombre d’enfants
chez chaque famille.

Xi (modalités)
0 1 2 3 4
5

ni (effectifs) 16 18 14 11 3 2

fi (Fréquence) 0.25 0.291 0.218 0.178 0.047 0.031

Ni↑ 16 34 48 59 62 64

Ni# 64 48 30 16 5 2

Fi↑ 0.25 0.541 0.759 0.931 0.978 1

Fi# 1 0.750 0.471 0.253 0.081 0.034

Exemple **

On considère le poids de 1000 personnes. La répartition en fonction de leurs poids


est donnée par le tableau suivant :
Classes ni fi Ni↑ Ni# Fi↑ Fi#
(kg)

[0,20[ 360 0.36 360 1000 0.36 1

[20,40[ 380 0.38 740 640 0.74 0.64

[40,60[ 160 0.16 900 260 0.90 0.26

[60,80[ 100 0.1 1000 100 1 0.10

N=1000 F=1

1.10 Représentations graphiques

La représentation graphique est une façon dont on représente les données sur un
schéma. Elle est très utile pour comprendre les observations d’une étude statistique.

1.10.1 Variable qualitatives

1- Tuyaux d’orgue

Cette représentation fait figurer les différentes modalités du caractère sous formes
de rectangles dont la base est constante et la hauteur est proportionnelle à l’effectif
(ou la fréquence).

Exemple: Un échantillon composé de 10 étudiants parmi les nouveaux bacheliers. On


s’intéresse à leur distribution selon la spécialité choisie (médecine :Méd -
commerce :com - statistique: sta- économie: Eco- biologie :Bio).

Etudiant 1 2 3 4 5 6 7 8 9 10

Spécialité Méd Com Com Stat Eco Bio Bio Stat Com Com

Le tableau statistique de cette série statistique est :

Effectifs(ni) Méd Com Sta Eco Bio

Modalités 1 4 2 1 2
1-Tuyaux d’orgue

2- Diagramme circulaire

Dans cette représentation, les aires des angles sont proportionnels aux effectifs ni (ou
fréquence fi).

Remarque : le degré d’un secteur est déterminé à l’aide de la règle de trois de la


manière suivante :
N →360°_
ni → (degré de la modalité i).

2-Diagramme circulaire
4- Diagramme en barre

3-Diagramme en barre

Variables quantitatives

Cas discret :

Diagramme en bâtons et polygone des effectifs :

A chaque valeur (modalité) Xi portée sur l’axe (OX), on fait correspondre un segment
vertical d’une longueur proportionnelle à l’effectifs ni (ou fréquence fi) de la valeur Xi.

Si on joigne les sommets de ces segments verticaux par une ligne brisée, on obtient
ce qu’on appelle le polygone des effectifs (des fréquences).

Exemple* : ( le nombre d’enfants chez chaque famille).


Les valeurs discrètes xi prises par les
variables sont px Diagramme en bâtons e des abscisses, et les effectifs ni (ou les
fréquences fi) sur l’axe des ordonnées. La hauteur du bâton est proportionnelle à l
Cas continu :’e

Histogramme :

A chaque classe (modalité) portée en abscisse, on fait correspondre un rectangle basé


sur cette classe d’ont l’aire de ce rectangle est proportionnel à ni (ou fi).

D’une manière analogue, si on joigne les milieux des base supérieure des rectangles
par une ligne brisée, on obtient ce qu’on appelle le polygone des effectifs ni (des
fréquences fi).

Exemple** : ( le poids de 1000 personnes).

Histogramme à amplitudes égaux.


1.11 Représentation graphique des effectifs (fréquences) cumulés

Cas discret : C'est un graphe escalier dont les marches correspondantes aux
valeurs possibles du caractère Xi et ont des hauteurs proportionnelles à Ni↑( ou Fi↑)
dans le cas croissant ou bien des hauteurs proportionnelles à Ni  ( ou Fi  ) dans le
cas décroissant.

Exemple*e

Courbe cumulative croissante des effectifs.


Courbe cumulative décroissante des effectifs.
Cas continu :

Exemple**
Courbe cumulative croissante des effectifs.
Courbe cumulative décroissante des effectifs.

1.12 Les paramètres caractéristiques


Pour l’étude d’un caractère quantitatif, on s’intéresse essentiellement à deux types de
paramètres.
- Les paramètres de position
Ces paramètre permettent de savoir autour desquelles valeurs se regroupent les
valeurs d’une variable statistique. Ce sont le mode, la médiane et la moyenne
arithmétique.
Cas discret :
1- Mode :
C’est la valeur du caractère qui a l’effectif (ou la fréquence) le plus élevé, il est noté
Mo.
Remarque : le mode n’est pas unique.
2- Médiane :
Considérons la série quantitative discrète dont les valeurs sont ordonnées dans le
sens croissants : X1, X2, …,Xn .
La médiane notée Me est la valeur qui divise la série en deux série partielles
égales.
On distingue deux cas :

 Si N est pair : Me = .
 Si N est impair : Me = .

Remarque : La médiane peut être une valeur qui n’appartient pas aux valeurs de
la série.
3- La moyenne arithmétique:
La moyenne arithmétique notée est donnée par la formule suivante :

= ou bien =  fi X i .
Cas continu :
1- Mode
La classe modale est la classe ayant l’effectif ( ou la fréquence) le plus grand.
Le mode est alors déterminé à l’intérieur de la classe modale et qu’on peut l’identifier
sa valeur exacte par la relation suivante :
a  1
Mo  li 1  i
1   2

l11 : La borne inférieure de la classe modale.


a i : L’amplitude de la classe modale.

 1 = n0 − n1,  2 = n0 − n2 ou bien  1 = f0 − f1,  2 = f0 − f2.

– n0 et f0 sont l’effectif et la fréquence de la classe modale.


– n1 et f1 sont l’effectif et la fréquence de la classe qui précède la classe modale.
– n2 et f2 sont l’effectif et la fréquence de la classe qui suit la classe modale.

Comme on peut également déterminer le mode graphiquement.

2- Médiane

Pour déterminer la médiane , on doit d’abord dans le cas continu, on doit déterminer
N
la classe qui la contient ( on cherche la position de par rapport aux effectifs Ni↑, la pus
2
grande valeur nous donne la classe médiane, qu’on note par : l1 ,l 2  donc

l 2  l1  N 
Me  l1    S1 
n0  2 

Ou l1 ,l 2 sont les bornes de la classe médiane ( Me  l1 ,l 2  ).

n0 : est l’effectif de la classe médiane.

S1 :est l’effectif cumulé croissant de la classe qui précède la classe médiane.

3- La moyenne arithmétique: On applique la même formule = , en

prenant Xi comme les centres de classes.

- Les paramètres de dispersion

Ces paramètres nous renseignent sur la dispersion des valeurs de la série statistique.

Cas discret :

1- L’étendue

L’étendue notée E est définie par :


E  X i max  X i min .

2-Variance

La variance est définie par :

V ( X )   ni ( X i ) 2  ( X ) 2 .

3-L’écart type :

L’écart type noté est la racine carrée de V(X), alors :

= .

Cas continu

Dans ce cas, pour déterminer ces paramètre, on applique les mêmes formules
précédentes de et de V  X  en prenant Xi comme les centres des classes et
X imas =le centre de la dernière classe, X imin =le centre de la première classe pour
déterminer l’étendue E.

Les quartiles
A partir de médiane, on peut généraliser cette notion pour définir les quartiles notés
Q1 ,Q3 . Ils sont des valeurs qui divisent une série statistique en quatre parties égales.

-On appelle Q1 ,Q3  l’intervalle interquartile et la différence Q3  Q1 c’est l’intervalle


interquartile.

Exemple *:

Déterminer les paramètres de position et de dispersion et les quartiles.

Xi (modalités) 
0 1 2 3 4
5

ni (effectifs) 16 18 14 11 3 2 N=64

fi (Fréquence) 0.25 0.291 0.218 0.178 0.047 0.031

Ni↑ 16 34 48 59 62
64
Ni*Xi 0 18 28 33 12 10 101

ni * ( X i ) 2 0 18 86 99 48 50 271
Mode :

nimax  18  Mo  1 .

La médiane :

X N 1  X N
X 33  X 32 1  1
N=64 est pair  Me  2 2
  1
2 2 2

L’étendue :

E  X i max  X i min  5  0  5

La moyenne arithmétique :

101 .
X  1.58
64

La variance :

 1.58  1.73.
271
V ( X )   ni ( X i ) 2  ( X ) 2 =
2

64

L’écart type :

= = 1.73  1.31.

Les quartiles :

N 64
  16  Q1  X 16 1 .
4 2

N 64
3*  3*  48  Q1  X 48 2. .
4 2

Exemple**

Déterminer les paramètres de position et de dispersion.

L’étendue :

E  X i max  X i min  70  10  60

La médiane :

N 1000
Pour cet exemple :   500 , alors
2 2
40  20
Me  20,40  Me  20  500  360  27.37
380

Le mode :

nimax  380  Mo  20,40 , donc :

li 1 20
ai  20
n0  380
n1  360
n2  160

Alors :

20  20
Mo  20   21.6666
20  220

La moyenne arithmétique :

Classes ni Xi Ni↑ ni* Xi ni * ( X i ) 2


(kg)

[0,20[ 360 10 360 3600 36000

[20,40[ 380 30 740 11400 342000

[40,60[ 160 50 900 8000 400000

[60,80[ 100 70 1000 7000 490000

 N=1000 F=1 30000 1268000

30000
X   30 .
1000

La variance :

V ( X )   ni ( X i ) 2  ( X ) 2 = 368.

L’écart type :

= = 368  19.18. .

Les quartiles :

 250  Q1  0.20 ,
N 1000
1) 
4 4
20  0
donc : Q1  0  250  0  13.8888.
360

 750  Q3  40.60 ,
N 1000
2) 3*  3*
4 4

60  40
donc : Q1  40  750  740  41.5..
160

Vous aimerez peut-être aussi