Vous êtes sur la page 1sur 11

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

CHAPITRE 1 : Distribution statistique une dimension

Section 1 : Vocabulaire lmentaire de la statistique descriptive


1. Population et individu
Dfinition
On appelle population statistique, tout ensemble d'units statistiques constituant les units
observes.
On appelle individu (ou unit statistique), tout lment de la population tudie.
Remarque
La dtermination avec prcision de la population et des individus qui la composent
conditionne l'homognit des units observe et la fiabilit des rsultats.
2. Variable statistique
2.1. Dfinition
On appelle variable statistique (ou caractre), une application (relation) qui associe chaque
individu de la population, une observation particulire.
2.2. Type d'une variable statistique
a) Variable qualitative
Une variable est qualitative si elle est lie un ensemble d'observations non mesurables.
Exemple : La population active tunisienne peut tre caractrise par :
- Le sexe (masculin ou fminin)
- La catgorie professionnelle (cadres, employs, ouvriers, etc...)
La nature qualitative d'une variable s'exprime donc par l'appartenance une catgorie ou
rubrique d'un ensemble fini.
b) Variable quantitative
Une variable est quantitative si l'ensemble des observations est un ensemble de nombres. Ces
observations expriment donc des valeurs numriques (quantitatif = mesurable).
Exemple : La Catgorie Htelire, La Capacit en lits,
Les variables quantitatives peuvent tre discrtes ou continues :
Une variable quantitative est dite discrte lorsqu'elle prend un nombre fini ou dnombrable
de valeurs (La Catgorie Htelire).
La variable nombre d'enfants par mnage est une variable quantitative discrte.

3
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

Une variable quantitative est dite continue, lorsqu'elle prend toutes les valeurs d'un
intervalle rel.
La variable La Capacit en lits peut tre envisage comme une variable quantitative
continue. Ses valeurs sont le plus souvent regroupes par intervalle.
3. Effectifs
Dfinition
On appelle effectif d'une valeur (ou rubrique) donne xi le nombre de fois ou cette valeur (ou
rubrique), apparait dans la population statistique tudie. Ce nombre est note ni. L'effectif est
parfois appel frquence absolue.
On appelle effectif total de la population tudie, not n, la somme des p effectifs particuliers
ni correspondant chacune des valeurs (ou rubriques), soit :
p

n = n1 +n2 +.+np =

i
1

Le symbole (lu somme) permet une criture synthtique de la somme des p effectifs
n1, n2.... np. On lit alors n = somme des ni (pour i variant de 1 p) .
4. Frquences
On appelle frquence de la valeur (ou modalit) xi, note f i, le rapport de l'effectif ni correspondant a
la valeur xi et de l'effectif n de la population observe.

n
fi i
n

Ce rapport est gal au pourcentage d'individus prsentant la valeur (ou modalit) x i par rapport
l'ensemble de la population observe. f i est toujours comprise entre 0 et 1.
Pour une srie statistique prsentant p valeurs (ou modalits), on a :
p

f
i
1

f 1 f 2 ........... f p 1

Remarque :
Parfois on peut rencontrer le terme de frquence relative pour les frquences.
L
emploi des frquences ou frquences relatives s
avre utile pour comparer deux
distributions de frquences tablies partir dchantillons de taille diffrente.
On appelle frquences cumules ou frquences relatives cumules en xi , le nombre fi cum tel
i

que F j f i cum f p
p
1

4
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

Section 2 : Reprsentation des donnes


Il existe plusieurs niveaux de description statistique : la prsentation brute des donnes, des
prsentations par tableaux numriques, des reprsentations graphiques et des rsums
numriques fournis par un petit nombre de paramtres caractristiques.
1. Sries statistiques
Une srie statistique correspond aux diffrentes modalits dun caractre sur un chantillon
dindividus appartenant une population donne.
Le nombre dindividus qui constituent lchantillon tudi sappelle la taille de lchantillon.
2. Tableaux statistiques
Le tableau de distribution de frquences est un mode synthtique de prsentation des donnes.
Sa constitution est immdiate dans le cas dun caractre discret mais ncessite en revanche
une transformation des donnes dans le cas dun caractre continu.
2.1 Caractre qualitatif
Modalit
Numro i
1
2
..
p
On a les relations suivantes:

Effectif
ni
n1
n2
.
np

Frquence
fi
f1
f2

fp

p
n
fi i
f i 1

n
i1
i1
Remarque : les frquences peuvent tre exprimes dans le tableau en pourcentage, dans ce

n ni

cas :

f
i1

100

2.2 Caractre quantitatif


a) Caractre quantitatif discret
Valeurs observes
xi
x1
x2
.
xP

Effectifs
ni
n1
n2
..
nP

Frquences
fi
f1
f2
.
fP

Frquences cumules
croissantes Fi
F1
F2

FP

5
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

b) Caractre quantitatif continu


Classes
numro i
[bi ; bi+1[
[b1 ; b2 [
[b2 ; b3 [
..
[bP ; bP+1[

Centres
ci

Effectifs
ni

Frquences
fi

c1
c2

n1
n2

f1
f2

Frquences
cumules
croissantes Fi
F1
F2

cP

nP

fP

FP

Remarque :
- Une classe est un intervalle ferm gauche et ouvert droite, du type [bi ; b i+1[.
b bi1
- Le centre d'une classe est ci i
2

- L'amplitude d'une classe est ai bi 1 bi


3. Reprsentations graphiques
3.1 Caractres qualitatifs
a) Diagrammes bandes
On appelle diagramme bandes un graphique qui, chaque modalit de la variable qualitative
associe un rectangle de base constante dont la hauteur est proportionnelle l'effectif.
Figure 1-1 : Diagramme bandes (verticales) :
nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005
Nationalits

40 000
35 000
30 000
25 000
20 000
15 000
10 000
5 000
0

Sudois

Danois

Norvgiens Finlandais

b) Diagrammes secteurs
On appelle diagramme secteurs un graphique qui divise un disque en secteurs angulaires
dont les angles au centre sont proportionnels aux effectifs de chaque modalit.

6
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

Pour une modalit donne Mi, d'effectif ni, l'angle au centre i, correspondant est donn (en
n
degr) par : i i 360 f i 360
n

Figure 1-2 : Diagramme secteurs :


nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005

Sudois
Danois
Norvgiens
Finlandais

3.2 Caractres quantitatifs


3.2.1 Caractre quantitatif Discret
a) Diagramme en btons
On appelle diagramme en btons un graphique qui associe chaque valeur de la variable un
segment (bton) dont la hauteur est proportionnelle l'effectif.
Remarque
On suppose les valeurs observes de la variable quantitative discrte, ordonnes par ordre
croissant.
Figure 1-3 : Diagramme en btons :
Nombre de nuites des non rsidants par nombre dtoile en 2005

7
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

b) Diagrammes cumulatifs
On appelle diagramme cumulatif, la courbe reprsentative de la fonction de rpartition.
On appelle fonction de rpartition d'un caractre X, l'application note F, dont l'ensemble de
dpart est R et l'ensemble d'arrive, l'intervalle [0,1].
F : R [0,1]
X F(x) = P(X<x)
F(x) = proportion des individus dont la valeur du caractre est strictement inferieure x.
F ( x ) frquence de ( X x ) f 1 f 2 ... f p

Remarque
Le plus souvent, le diagramme cumulatif est obtenu partir des frquences cumules
croissantes. Dans le cas d'une variable discrte, la courbe cumulative se prsente comme une
courbe en escalier (La fonction F est dans le cas discret, une fonction constante par intervalle)
Chaque segment de cette courbe en escalier est ouvert gauche et ferme droite (sauf le
dernier).
Si on dfinit la fonction de rpartition par F(x) = P(X x), alors les segments deviennent
ferms gauche et ouverts droit (sauf le premier).
Figure 1-4 : Courbe en escalier du
Nombre de nuites des non rsidants par nombre dtoile en 2005

3.2.2 Caractres quantitatifs continus


a) Histogrammes
On appelle histogramme un diagramme compar d'un ensemble de rectangles contigus
(adjacents), chaque rectangle, associ chaque classe, ayant une surface proportionnelle
l'effectif (ou la frquence) de cette classe. Deux cas peuvent se prsenter :
8
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

Classes d'amplitudes gales :


Lorsque les classes sont d'amplitudes gales (ai = a)
Figure 1-5 : Histogramme (amplitude gales) :
Capacit Htelire en lits pour la rgion de Nabeul-Hammamet
0,30
0,25

Frquences

0,20

0,15
0,10
0,05
0,00
101

201

301

401

501

capa cit hteli re en lits

Classes d'amplitudes ingales :


Lorsqu'au moins deux classes ont des amplitudes diffrentes, la hauteur proportionnelle
l'effectif ne permet plus de construire un histogramme. En effet, la surface de chaque
rectangle n'est plus proportionnelle l'effectif (conformment la dfinition).
Do la ncessit de corrig les frquences (ou les effectifs).

f
f ic i
ai

ou

n
nic i
ai

Avec: f i c : frquence corrig ; nic : effectif corrig


Figure 1-6: Histogramme (amplitude ingales) : Chmeurs par groupe d'ges

9
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

b) Polygone des frquences


On obtient un polygone de frquences en joignant les milieux des segments suprieurs de
chaque rectangle de lhistogramme (laire du polygone des frquences est laire de la surface
par la ligne polygonale et laxe des abscisses).
Figure 1-7 : Polygone des frquences (amplitude gales) :
Capacit Htelire en lits pour la rgion de Nabeul-Hammamet

c) Courbe des frquences cumules croissantes


Dfinition
On appelle courbe des frquences cumules croissantes la reprsentation graphique de la
fonction de rpartition de la variable x.
Les donnes tant groupes en classes, la frquence cumule croissante Fi associe la classe
n : i reprsente la proportion d'individus de la population pour lequel la variable prend une
valeur inferieure (strictement) la limite suprieure bi de la classe n : i.
En pratique, la courbe des frquences cumules croissantes est obtenue en joignant, dans un
systme d'axes orthogonaux, les points d'abscisse bi (extrmit de la classe n : i) et
d'ordonne Fi (frquence cumule croissante correspondante) [Remarque : Joindre les points
de coordonnes (bi, F i) par des segments revient faire lhypothse dune rpartition
uniforme des individus lintrieur des classes].

10
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

Figure 1-8 : Courbe des frquences cumules croissantes : Capacit Htelire en lits pour la
rgion de Sousse-Kairouan

frquences cumules
croissantes en %

Courbe des frquences cumules


croissantes
100,00
80,00
60,00
40,00
20,00
0,00
101

201

301

401

501

601

Capacit Htelire en lits

3.3 Graphiques spcialises


a) Pyramide des ges
Exemple : Pyramide des ges en Tunisie en 1994 :
La pyramide est une version particulire de l'histogramme, uti lis e po ur rep art ir un e
pop ul ati on en fon cti on de l ge (va ri abl e qu ant ita tiv e con tin ue) et du sex e des
ind ivi dus (va ria ble qu ali tat ive secondaire).
Le graphi que se prse nte comme un histo gramme double , les valeur s de la va ri ab le
pr in ci pa le ( l g e) t an t po rt e s su r l' ax e ve rt ic al .
Fi gu re 1-9 : Py ra mi de de s g es (e n% ) 19 94

11
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

b) Diagramme cartographique (ou cartogramme)


Lors qu'u ne tud e stat ist ique conc erne des donn es gog raph iqu es, les indivi dus ou les
modalit s de la variabl e tudie sont des units spatial es (des rgions par exemple).
On petit alors utili ser une carte pour visua lise r les valeu rs associes a un caractre et a
une unit spatiale.
La popula tion tudi e est l'ens emble des gouver norats de la Tunisi e . La var iab le
tu di e est l' car t glo bal en tau x (L' car t glo bal en tau x, rep rs ent e ici le
dif fr ent iel de cro iss anc e de l'e mpl oi un gouver nor at don n et la nat ion tou t e ent ir e
sur la pr iod e 198 4 -198 9. Un cart glo bal pos iti f (n gat if) , sig nif ie que le tau x de
cro iss anc e de l emp loi du gouver nor at con sid r est sup ri eur (in fer ieu r), au tau x do
cro iss anc e moy en au niv eau nat ion a l). Ell e est qua nti tat ive con tin ue. Une
dc omp osi tio n des val eur s de la var iab le en 5 cla sse s di ng ale amp lit ude con dui t
la fig ure sui van te :
Fig ure 1-10 : Dia gra mme Car tog rap hiq ue
Eca rt glo bal en tau x (Tr ) par gou ver nor at (19 84-198 9)

12
Cours Statistique descriptive

Mahmoud BABAY

Chapitre1 : Distribution Statistique une dimension

I.H.E.T de Sidi Dhrif

c) Diagramme polaire
Ce diagramme (figure 1-10) est utilise lorsqu'on cherche comparer, pour une variable
donne, des observations relatives plusieurs sous populations (d'une mme population).
On suppose que la variable (qualitative ou quantitative) tudie prsente p modalits. Le plan
est divis en p secteurs dlimits par des axes associes aux diffrentes modalits de la
variable. On reporte sur chaque axe la valeur correspondant la modalit concerne ; la
distance du point l'origine est proportionnelle la valeur correspondante. Les points
correspondants une mme sous population peuvent tre joints (figure 1-10).
Les donnes du tableau prcisent le nombre de chmeurs selon la dure du chmage (en mois)
et le niveau d'instruction enregistres en 1997(Source : enqute national sur l'emploi, 1999).
Tableau: Nombre de chmeurs en Tunisie, enregistrs en 1997
Dure de
chmage
(en mois)
[0,1[

nant

primaire

secondaire

suprieur

total

1880

5089

2453

138

9560

[1,3[

12616

39895

16193

731

69435

[3,6[

12108

43318

16346

1072

72844

[6,9[

4002

19797

13263

1657

38719

[9,12[
[12,24[

2112
16224

8419
93402

8582
83346

1816
11708

20929
204680

Figure 1-10 : Diagramme Polaire

13
Cours Statistique descriptive

Mahmoud BABAY

Vous aimerez peut-être aussi