Vous êtes sur la page 1sur 18

Copain JO Votre Noble Serviteur

FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Chapitre 1 : Vocabulaire, définitions et représentations graphiques

1. Populations – Unités statistiques


1.1 Définitions
La statistique est la science qui a pour objet de recueillir un ensemble de
données numériques relatives à tel ou tel phénomène et d’exploiter
rationnellement ces données pour établir toutes relations de causalité
par l’analyse et l’interprétation.

Une population est l’ensemble des éléments auxquels se rapportent


les données étudiées. En Statistique, le terme « population » s’applique
à des ensembles de même nature : étudiants d’une Faculté, production
d’une usine, entreprises d’un secteur donné, poissons d’une rivière,
etc.

La population est donc l’ensemble sur lequel on recueille les données ;


on la désigne par .

Exemples

Exemple 1 : Si l’on fait le recensement des Sénégalais, la population est


l’ensemble de tous les Sénégalais.

Exemple 2 : Si l’on fait une étude sur le chiffre d’affaires des entreprises
de la Zone Franche Industrielle de Dakar, la population est l’ensemble
de toutes les entreprises de la « Zone Franche Industrielle ».

Remarque

La définition de la population est importante, car elle conditionne


l’homogénéité des unités observées et la fiabilité des résultats.

Tout élément de la population étudiée est appelé individu ou unité


statistique, terme qui peut désigner aussi bien une personne (un
Sénégalais) qu’un objet (une entreprise).

Ainsi la population  désigne l’ensemble de référence c’est à dire


l’ensemble des unités statistiques observées.

On désigne par Card  le nombre d’éléments de la population .

Cours de statistique descriptive


1
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Généralement Card  est trop grand, il n’est pas possible de réaliser


toutes les mesures souhaitées. Ce qui fait qu’on est souvent amené à ne
considérer qu’un sous-ensemble E de . L’ensemble des individus de E
est appelé échantillon et Card E s’appelle taille de l’échantillon et sera
noté n.

1.2 Caractères et modalités


1.2.1 Caractères
Un caractère est un aspect particulier de l’individu auquel on s’intéresse
(âge, profession, taille, poids, sexe, situation matrimoniale, religion,
ethnie, …). Un caractère peut prendre deux ou plusieurs modalités.

1.2.2 Modalités
Les modalités d’un caractère sont les différentes valeurs que peut
prendre ce caractère sur l’ensemble de la population.

Les modalités d’un caractère doivent former une partition, c’est à dire
doivent être exhaustives et disjointes. A chaque individu, on doit pouvoir
associer une modalité et une seule.
Exemples de modalités
- Le caractère « Sexe » a deux modalités : Masculin et Féminin.

- Le caractère « Situation Matrimoniale » a quatre modalités : Marié,


Célibataire, Divorcé, Veuf.

2. Les différents types de caractères


Un caractère peut être quantitatif ou qualitatif. S’il est quantitatif, il peut
être discret ou continu.

2.1 Caractères qualitatifs


Un caractère est qualitatif s’il est lié à une observation ne pouvant
pas faire l’objet d’une mesure. Ses diverses modalités sont
simplement constatées et repérées par un mot traduisant son état.
Les modalités d’un caractère qualitatif ne sont pas numériques.

Cours de statistique descriptive


2
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Ainsi : le sexe, la situation matrimoniale, la religion, l’ethnie, la région


habitée, la nationalité, la catégorie socio-professionnelle (CSP) sont des
caractères qualitatifs.

2.2 Caractères quantitatifs.


Un caractère est quantitatif si on peut le mesurer ou le compter : ses
modalités sont numériques. On peut effectuer des opérations
algébriques (addition, multiplication…) sur un tel caractère.

On distingue deux types de caractères quantitatifs : d’une part le


caractère quantitatif discret, d’autre part le caractère quantitatif
continu.

2.2.1 Caractère quantitatif discret


Un caractère quantitatif est discret (ou discontinu) si ses modalités
prennent des valeurs isolées, discrètes. Le nombre d’enfants d’une
famille, le nombre de personnes habitant une résidence, le nombre
d’accidents de travail survenus dans un groupe d’entreprises, le nombre
de buts marqués lors d’une rencontre de football, le nombre d’heures
de cours de statistique sont des caractères quantitatifs discrets.

Par exemple les modalités du caractère « nombre d’enfants par


ménage » peuvent être 0, 1, 2, 3, 4,…, 9,10 et plus mais non 2,5 ou
3,756.

2.2.2 Caractère quantitatif continu


a) Définition
Un caractère quantitatif est dit continu s’il peut prendre toutes les
valeurs possibles à l’intérieur d’un intervalle de IR.

Le chiffre d’affaires d’une entreprise, l’âge d’un groupe d’individus


exprimé en années, le poids d’un groupe d’individus exprimé en kg, le
revenu, le taux de natalité sont des caractères quantitatifs continus.

La taille d’une personne peut être de 176 centimètres (cm), 183,3 ou


178,8343 cm, en fonction de la précision de la mesure.

Cours de statistique descriptive


3
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

b) Concept de classe
Comme les variables quantitatives continues possèdent un nombre de
valeurs distinctes très important, on est amené pour plus de commodité
à les regrouper en un certain nombre de classes.

Une classe c i est un intervalle de IR et s’écrit généralement sous la


forme : [ b i , b i 1[.

Les nombres bi et bi1 sont les bornes de la classe, bi est la borne


inférieure et b i 1 est la borne supérieure.

La différence a i  b i 1  b i s’appelle amplitude de la classe.

b i  b i 1
La valeur équidistante des deux bornes s’appelle centre de la
2
classe.

On appelle effectif d’une modalité X i le nombre n i d’individus observés


ayant pris cette modalité
n
On appelle densité de la classe c i la valeur di  i , on utilise cette
ai
quantité quand les classes sont d’amplitudes inégales.

Dans certains ouvrages, la densité est appelée effectif corrigé.

3. Tableaux statistiques associés aux différents types de


caractères

3.1 Caractères qualitatifs


Le tableau de distribution statistique ci-dessous décrit une population de
n individus sur laquelle on a observé le caractère X. X1 , X 2 ,  , X k
sont les modalités de X.

Cours de statistique descriptive


4
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Modalités du Effectifs Fréquences relatives


caractère X ni fi
n
X1 n1 f1  1
n
n2
X2 n2 f2 
n
  
n
Xi ni fi  i
n
  
n
Xk nk fk  k
n
Total n 1

Effectif n i

On appelle effectif d’une modalité X i le nombre n i d’individus observés


ayant pris cette modalité.

Fréquence f i

On appelle fréquence relative d’une modalité X i l’effectif de cette


modalité divisé par l’effectif total n.
ni k
fi  , n   n .
n i
i 1

3.2 Caractères quantitatifs

On distingue deux types de tableaux selon que le caractère étudié est


discret ou continu.

Cours de statistique descriptive


5
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

3.2.1 Tableau associé à un caractère discret


Fréquences
Modalités du Effectifs Fréquences cumulées
relatives
caractère X ni croissantes F i
fi
n
X1 n1 f1  1 F1  f1
n
n2
X2 n2 f2  F2  f1  f 2
n
   
n
Xi ni fi  i Fi  f1  f 2    f i
n
   
n
Xk nk fk  k Fk  1
n
Total n 1
On appelle fréquence relative cumulée d’une modalité X i (ou d’une
classe c i ) le nombre
i
Fi  f1  f 2    f i   f j .
j1
3.2.2 Tableau associé à un caractère continu

Modalités du Fréquences Fréquences


Centre de Effectifs
caractère X relatives cumulées
classe x i ni
en classes fi croissantes F i
b  b2
b1 , b 2  x1  1 n1
n
f1  1 F1  f1
2 n
b  b3
b 2 , b 3  x2  2 n2 f2 
n2
F2  f1  f 2
2 n
    
b  b i 1
b i , b i 1 xi  i ni
n
fi  i Fi  f1  f 2    f i
2 n
    
b  b k 1
b k , b k 1 xk  k nk
n
fk  k Fk  1
2 n
Total n 1

Cours de statistique descriptive


6
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4. Représentations graphiques

4.1 Caractères qualitatifs

Pour représenter graphiquement les distributions statistiques relatives à


un caractère qualitatif on utilise habituellement, soit des graphiques à
secteurs (ou diagramme à secteurs), soit des graphiques à bandes (ou
tuyaux d’orgues).

4.1.1 Graphique à secteurs

La population étudiée est représentée graphiquement par une surface


circulaire. Cette surface est découpée en autant de secteurs que le
caractère considéré comporte de modalités. Chaque secteur circulaire a
un angle au centre proportionnel à l’effectif de la modalité qu’il
représente.

Modalités

Exemple 1 : Le tableau suivant donne la répartition des ménages


sénégalais selon la source d’approvisionnement en eau.

Robinet Robinet Forage Puits Puits


Source Intérieur Extérieur Pompe Intérieur extérieur Autre
RI RE FP PI PE
Fréquence
Relative 16,7 27,4 4,6 6,4 37,9 7
(en %)

Source : RGPH/1988, Direction de Prévision et de la Statistique.

Le caractère étudié ici est la source d’approvisionnement en eau, c’est


un caractère qualitatif, ses modalités ne sont pas numériques.

Cours de statistique descriptive


7
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Fréquence
Angle
Source Relative f i Cumul
 i en degrés
en %
RI 16,7 60,12 60,12
RE 27,4 98,64 158,76
FP 4,6 16,56 175,32
PI 6,4 23,04 198,36
PE 37,9 136,44 334,80
Autre 7 25,20 360
Total 100 360

 i  360  f i

Le graphique à secteurs associé au tableau statistique de la répartition


des ménages sénégalais selon la source d’approvisionnement en eau
est donné ci-dessous :

Graphique à secteurs

Autre
RI
7%
17%

PE
38% RE
27%

PI FP
6% 5%

4.1.2 Graphique à bandes (diagramme à bandes)

Dans ce type de graphique les sous populations relatives à chacune des


modalités du caractère étudié sont représentées par des bandes
rectangulaires. Les bandes ont une base constante et la hauteur de
chacune d’entre elle est proportionnelle à l’effectif ou à la fréquence de
la sous population correspondante.

Cours de statistique descriptive


8
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Ce système de représentations se prête plus aisément que le précédent


aux comparaisons dans le temps ou dans l’espace.

Effectifs ou fréquences

Modalités
Le graphique à bandes associé au tableau statistique de l’exemple 1 est
donné ci-dessous :
Graphique à bandes

40

35

30

25

20

15

10

0
RI RE FP PI PE AUTRE

4.2 Caractère quantitatif discret


4.2.1 Diagramme en bâtons

On porte sur l’axe des abscisses les valeurs discrètes du caractère, et


sur l’axe des ordonnées les effectifs (ou fréquences) associés au
caractère. On trace des bâtons verticaux dont la longueur est
proportionnelle aux effectifs (ou fréquences).

Cours de statistique descriptive


9
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Exemple 2 : Une enquête effectuée auprès de 100 familles


sénégalaises a conduit à la distribution suivante, selon le nombre
d’enfants.

xi 0 1 2 3 4 5
ni 6 9 13 16 10 12

xi 6 7 8 9 10 et plus
ni 10 4 3 5 12

Le caractère « nombre d’enfants » qui est ici étudié est un caractère


quantitatif discret. Ses modalités sont au nombre de 11 : 0,1, 2,…,9, 10
et plus.
La dernière modalité « 10 et plus » sera assimilée à la modalité
« exactement 10 ».

Diagramme en bâtons et polygone des fréquences.


ni
16 - Polygone des Fréquences

14 -

12 -

10 -

8 -

6 -

4 -

2 -

0 1 2 3 4 5 6 7 8 9 10 xi

Cours de statistique descriptive


10
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4.2.2 Polygone des fréquences


Le diagramme en bâtons étant construit, on peut définir le polygone des
fréquences (ou des effectifs) qui a pour but de préciser l’évolution des
effectifs.
On trace le polygone des fréquences en joignant les bouts des bâtons.
Le polygone des fréquences de l’exemple 2 est donné dans le graphique
précédent.

4.2.3 Courbe cumulative (diagramme cumulatif)


La courbe cumulative est la courbe représentative de la fonction F de la
variable réelle x, telle que, pour toute valeur de x, la valeur prise par la
fonction F, notée F(x), est égale à la proportion ou l’effectif des individus
dont la valeur du caractère est strictement inférieure à x. On dit alors que
F(x) est l’effectif ou la fréquence cumulée relative à x.
Cette courbe est donc le graphique en escaliers représentatif de la
fonction F définie par :

 0 si x  x1
 i

Fx     fj si xi  x  xi1
 j1
 1 si x  xk

Nous allons dessiner le diagramme cumulatif de la distribution du


nombre d’enfants de l’exemple 2

Les fréquences de la distribution du nombre d’enfants sont données


dans le tableau ci-dessous :

xi fi Fi
0 0,06 0,06
1 0,09 0,15
2 0,13 0,28
3 0,16 0,44
4 0,10 0,54
5 0,12 0,66
6 0,10 0,76
7 0,04 0,80
8 0,03 0,83
9 0,05 0,88
10 0,12 1,00
Cours de statistique descriptive
11
Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Interprétation

i) La population de familles ayant 0, 1, 2 ou 3 enfants est égale à 44 %.

ii) La population des familles ayant 0,1,2,3 , … ,6 ou 7 est égale à


80%

Fi

1-

0,9-

0,8 -

0,7 -

0,6 -

0,5 -

0,4 -

0,3 -

0,2 -

0,1 -

0 1 2 3 4 5 6 7 8 9 10 xi

Cours de statistique descriptive 12


Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4.3 Caractère quantitatif continu


4.3.1 Histogramme (diagramme différentiel)
L’histogramme est la représentation graphique de la distribution des
effectifs ou des fréquences d’une variable statistique. Un histogramme
est un ensemble de rectangles contigus, chaque rectangle, associé à
chaque classe, a une surface proportionnelle à l’effectif de cette classe.
On peut distinguer deux cas :

a) Classes d’amplitudes égales


Dans le cas où les classes sont d’amplitudes égales, chaque rectangle
de l’histogramme aura une hauteur proportionnelle à l’effectif de chaque
classe.

Exemple 3 : Soit la distribution suivante :


Classes Effectifs
[10,20[ 15
[20,30[ 20
[30,40[ 10
[40,50[ 25
[50,60[ 5
Total 75
L’histogramme de cette distribution est :
ni

30 -

25 -

20 -

15 -

10 -

5 -

0 10 20 30 40 50 60 xi

Cours de statistique descriptive 13


Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

b) Classes d’amplitudes inégales

Dans ce cas, la hauteur proportionnelle à l’effectif ne permet plus de


construire l’histogramme. Il faut alors construire des rectangles dont la
hauteur est proportionnelle à la densité, ce qui permet d’assurer une
surface proportionnelle à l’effectif.

La densité associée à chaque classe est définie par :


n
di  i
ai

où a i est l’amplitude de la classe d’effectif ni .

E x e m pl e 4 : Soit la distribution suivante :

Classes ni ai di
[10,20[ 10 10 1
[20,30[ 16 10 1,6
[30,40[ 34 10 3,4
[40,60[ 24 20 1,2
[60,100[ 16 40 0,4
Total 100
L’histogramme est :
di
3,5 -

3-

2,5 -

2-

1,5 -

1-

0,5 -

0 10 20 30 40 50 60 70 80 90 100 xi

Cours de statistique descriptive 14


Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4.3.2 Polygone des fréquences (ou polygone des effectifs)

L’histogramme étant construit, on peut définir le polygone des


fréquences (ou des effectifs) qui a pour but de préciser l’évolution des
effectifs sur les différentes classes.

On trace le polygone des fréquences en joignant les milieux des


segments supérieurs de chaque rectangle (en ajoutant éventuellement
deux classes de même amplitude et d’effectif nul, de chaque coté de
l’histogramme).

Ce polygone des fréquences a toujours une surface égale à la surface


de l’histogramme.

Le polygone des fréquences de la distribution de l’exemple 3 est :

ni
Polygone des
30 - fréquences

25 -

20 -

15 -

10 -

5 -

0 10 20 30 40 50 60 70 xi

4.3.3 Courbe des fréquences cumulées croissantes


(Courbe cumulative)

Comme pour les variables discrètes, la courbe cumulative est la


représentation graphique de la fonction cumulative qui est égale à la
proportion des observations pour lesquelles la variable statistique est
inférieure à x.

Cours de statistique descriptive 15


Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Les observations étant groupées par classes c i , si e i représente


l’extrémité supérieure de chaque classe, alors la courbe cumulative est
la courbe qui passe par les points représentatifs de Fe i   Fi .

C’est une courbe monotone non décroissante et on a :

F    0

 F    1

R e m a r q u e : On peut également tracer une courbe associée aux


fréquences cumulées décroissantes. La représentation graphique de sa
fonction cumulative est G  1  F , elle représente le pourcentage des
observations supérieures à x. C’est une courbe monotone non
croissante.

Exemple 5

La répartition des employés d’une entreprise en fonction de la prime de


fin d’année est la suivante :
f i en F i en % F i  en %
Prime en F ni
%
[0 ; 1000[ 18 2,1 2,1 100
[1000 ; 2000[ 44 5,1 7,2 97,9
[2000 ; 3000[ 112 13,0 20,2 92,8
[3000 ; 3500[ 120 14,0 34,2 79,8
[3500 ; 4000[ 138 16,0 50,2 65,8
[4000 ; 4500[ 164 19,1 69,3 49,8
[4500 ; 5000[ 106 12,3 81,6 30,7
[5000 ; 6000[ 98 11,4 93,0 18,4
[6000 ; 7000[ 52 6,0 99,0 7
[7000 ; 8000[ 8 1,0 100,0 1
Total 860 100,0

k
L’effectif total est : n   ni  860 ; où k  10 est le nombre de classes.
i 1

n
Les fréquences relatives sont : fi  i  100 ,
n

Copain JO Votre Noble Serviteur Cours de statistique descriptive


Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
16
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Les fréquences cumulées croissantes sont les F i  .

Les fréquences cumulées décroissantes sont les F i  .

Pour tracer la courbe des fréquences cumulées croissantes, il faut tracer


une courbe continue, car le caractère observé (prime de fin d’année) est
un caractère quantitatif continu.

Le cumul se fait pour chaque classe à la limite supérieure de la classe.

Fi en %

100 --- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -
90 -
80 -
70 -
60 -
50 -
40 -
30 -
20 -
10 -

0 10 20 30 40 50 60 70 80 Prime (en 102 F)

L’interprétation de la courbe des fréquences cumulées croissantes est


par exemple : 93 % des employés ont une prime de fin d’année
inférieure à 6000 F.

Cours de statistique descriptive 17


Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

On peut aussi tracer la courbe des fréquences cumulées décroissantes

Fi en %

100 ---------------------------------------------------------------
90 -
80 -
70 -
60 -
50 -
40 -
30 -
20 -
10 -

0 10 20 30 40 50 60 70 80 Prime (en 102 F)

Son interprétation est par exemple : 92,8 % des employés ont une prime
de fin d’année supérieure à 2000 F.

Cours de statistique descriptive 18


Chapitre 1 : Vocabulaire, définitions et représentations graphiques
Responsable matière : Fodiyé Bakary DOUCOURE

Vous aimerez peut-être aussi