Vous êtes sur la page 1sur 8

Chapitre 1 : Concepts fondamentaux et représentation graphique

Introduction :

La statistique est la science qui a pour objet de recueillir des données numériques relatives à tel ou
tel phénomène, d’analyser, de commenter, et d’interpréter ces données.

Les ensembles qui constituent l’objet de cette science doivent être définis avec précision de sorte
qu’on doit être à mesure d’identifier un élément de l’ensemble. La statistique étudie les éléments
des ensembles dans ce qu’ils ont en commun et non de ce qu’il leur différencie.

Ce chapitre a pour but de donner les éléments de base de la statistique et montrer comment faire la
représentation graphique des distributions statistiques à un caractère.

1-Population

La population est l’ensemble sur lequel on recueille les données. On le désigne par Ω

Exemple :

- Si l’on fait le recensement des salaires des agents de la SNE, la population est l’ensemble de
tous les salariés de la SNE
- Si l’on fait une étude sur la situation matrimoniale des habitants d’un quartier, la population
est l’ensemble des habitants du quartier

2-Individu

Un individu ou unité statistique est un élément (personne ou objet) de la population étudiée

3-Taille de la population

On appelle taille de la population et on note N, le nombre d’éléments de la population.

Si l’on fait une étude sur une population de très grande taille, on choisit généralement un sous
ensemble de la population de taille n appelé échantillon

4-Caractère

Un caractère est un trait particulier commun aux individus auquel on s’intéresse

Exemple : âge, profession, salaire, chiffre d’affaires, taille, poids, sexe, situation matrimoniale,
nationalité, prime de fin d’année, nombre d’enfants par ménage …

Remarque : le caractère est souvent désigné par une lettre majuscule par exemple X = « poids »

5-Modalités

Les modalités d’un caractère sont les différentes éventualités que peut prendre ce caractère. A
chaque individu, on doit pouvoir associer une modalité et une seule

1
Exemple :

- Le caractère « sexe » a deux modalités : masculin et féminin


- Le caractère « situation matrimoniale » a quatre modalités : marié, célibataire, divorcé, veuf

6-Les différents types de caractère

6-1-Caractères qualitatifs

Un caractère est qualitatif si ses modalités ne sont pas mesurables

Exemple : le sexe, la situation matrimoniale, la région habitée, la nationalité, la catégorie


socioprofessionnelle , types d’ouvrages, marques de voitures sont des caractères qualitatifs

6-2-Caractères quantitatifs

Un caractère est dit quantitatif s’il est mesurable c'est-à-dire si ses modalités sont des valeurs
numériques. On distingue deux types de caractères quantitatifs

6-2-1-Caractère quantitatif discret

Un caractère quantitatif est dit discret si ses modalités sont des valeurs isolées

Exemple : le nombre d’enfants par ménage, le nombre d’accidents de travail, le nombre d’absences
par an sont des caractères quantitatifs discrets

6-2-2- Caractère quantitatif continu

Un caractère quantitatif est dit continu si ses modalités peuvent prendre toutes les valeurs possibles
à l’intérieur d’un intervalle de IR

Exemple : le chiffre d’affaires d’une entreprise, l’âge des responsables d’une administration, la taille,
le revenu annuel d’un ménage, le poids d’un individu sont des caractères quantitatifs continus

7-Notion de classe

Comme les variables quantitatives continues possèdent un nombre de valeurs distinctes très
important, on est amené pour plus de commodité à les regrouper en un certain nombre de classes.

Une classe Ci est un intervalle de IR et s’écrit généralement sous la forme [bi ; bi+1[. Les nombres bi et
bi+1 sont les bornes de la classe, bi est la borne inférieure et bi+1 est la borne supérieure
𝑏𝑖+1 +𝑏𝑖
ai = bi+1 - bi est l’amplitude de la classe Ci et xi = est le centre de la classe
2

8-Effectifs

On appelle effectif d’une modalité xi (respectivement d’une classe Ci ) que l’on note ni , le nombre
d’individus dont la valeur du caractère est égale à xi (respectivement appartient à la classe Ci ).

Pour un échantillon de taille n, si le caractère observé possède k modalités, on : n1 + n2 + … + nk = n

2
8-1-Effectif cumulé croissant

On appelle effectif cumulé croissant (ECC) d’une modalité xi (respectivement d’une classe Ci ), la
somme des effectifs des modalités inférieurs à xi (respectivement contenu dans toutes les classes qui
sont avant Ci )

ECC = n1 + n2 + … + ni

8-2-Effectif cumulé décroissant

On appelle effectif cumulé décroissant (ECD) d’une modalité xi (respectivement d’une classe Ci ), la
somme des effectifs des modalités supérieurs à x i (respectivement contenu dans toutes les classes
qui sont après Ci )

ECD = n - (n1 + n2 + … + ni-1)

9-Fréquence

On appelle fréquence d’une modalité xi (respectivement d’une classe Ci ) d’effectif ni que l’on note fi ,
𝑛𝑖
la quantité fi = où N étant l’effectif total
𝑁

Pour un échantillon de taille n , si le caractère observé possède k modalités, on a : f1 + f2 + … + fk = 1

9-1-Fréquence cumulée croissante

On appelle fréquence cumulée croissante (FCC) d’une modalité xi (respectivement d’une classe Ci ), la
somme des fréquences des modalités inférieurs à xi (respectivement contenu dans toutes les classes
qui sont avant Ci )

FCC = f1 + f2 + … + fi

9-2-Fréquence cumulée décroissante

On appelle fréquence cumulée décroissante (FCD) d’une modalité xi (respectivement d’une classe Ci
), la somme des fréquences des modalités inférieurs à xi (respectivement contenu dans toutes les
classes qui sont avant Ci )

FCD = 1 – ( f1 + f2 + … + fi-1 )

10-Densité
𝑛
On appelle densité de la classe Ci et d’amplitude ai , la valeur di = 𝑎𝑖
𝑖

NB : on utilise cette quantité quand les classes sont d’amplitudes inégales. Dans ce cas, la densité est
appelée effectif corrigé

11-Tableau statistique

Généralement le tableau obtenu après la récolte des données ne permet pas d’avoir rapidement une
idée générale sur le caractère étudié. On est donc amené à organiser ces observations dans un
tableau statistique.

3
Un tableau statistique permet alors de résumer les différentes informations recueillies sur
l’échantillon afin de pouvoir les représenter, les traiter et les analyser pour une prise meilleure de
décision.

Un tableau statistique dépend de la nature de la distribution étudiée.

12-Représentation graphique

En général, un graphique est moins précis qu’un tableau statistique mais il permet de voir plus
rapidement certaines caractéristiques du caractère étudié.

La représentation graphique se rapporte toujours à la nature des données.

12-1 Caractères qualitatifs

Pour représenter graphiquement les distributions statistiques relatives à un caractère qualitatif, on


utilise habituellement, soit des graphiques à secteurs (ou diagramme à secteurs), soit des graphiques
à bandes (ou tuyaux d’orgues)

a)Le graphique à secteurs

La population étudiée est représentée graphiquement par une surface circulaire. Cette surface est
découpée en autant de secteurs que le caractère considéré comporte de modalités. Chaque secteur
circulaire a un angle au centre proportionnel à l’effectif de la modalité qu’il représente.

b)Le graphique à bandes (diagramme à bandes)

Dans ce type de graphique les sous populations relatives à chacune des modalités du caractère
étudié sont représentés par des bandes rectangulaires. Les bandes ont une base constante et la
hauteur de chacune d’entre elle est proportionnelle à l’effectif ou à la fréquence de la sous
population correspondante.

12-2 Caractère quantitatif discret

Le diagramme en bâtons

On porte sur l’axe des abscisses les valeurs discrètes du caractère, et sur l’axe des ordonnées les
effectifs (ou fréquences) associés au caractère. On trace des bâtons verticaux dont la longueur est
proportionnelle aux effectifs (ou fréquences)

Polygone des fréquences

Le diagramme en bâtons étant construit, on peut définir le polygone des fréquences (ou des effectifs)

12-3 Caractères quantitatif continu

Histogramme (diagramme différentiel)

L’histogramme est la représentation graphique de la distribution des effectifs ou des fréquences


d’une variable statistique continue. Un histogramme est un ensemble de rectangles contigus

4
(accolés), chaque rectangle, associé à chaque classe, a une surface proportionnelle à l’effectif de
cette classe. On peut distinguer deux cas

a- Les classes sont d’amplitudes égales : dans ce cas, chaque rectangle de l’histogramme aura une
hauteur proportionnelle à l’effectif de la classe correspondante.
b- Les classes sont d’amplitudes inégales : dans ce cas, la hauteur proportionnelle à l’effectif ne
permet plus de construire l’histogramme. Il faut alors corriger les effectifs avant de construire
l’histogramme. Pour cela on construit des rectangles dont la hauteur est proportionnelle à la
densité, ce qui permet d’assurer une surface proportionnelle à l’effectif. L’histogramme étant
construit, on peut définir le polygone des fréquences ( ou des effectifs). On trace le polygone des
fréquences en joignant les milieux des segments supérieurs de chaque rectangle (en ajoutant
éventuellement deux classes de même amplitude et d’effectif nul, de chaque côté de
l’histogramme)

Remarque : le polygone des fréquences a pour but de préciser l’évolution des effectifs sur les
différentes classes. Ce polygone des fréquences a toujours une surface égale à la surface de
l’histogramme.

13-Courbe cumulative

13-1-Caractère quantitatif discret

La courbe cumulative dans le cas discret est la fonction de la variable x définie par :

0 𝑠𝑖 𝑥 < 𝑥1
f(x) = {∑𝑖𝑗=1 𝑓𝑗 𝑠𝑖 𝑥𝑖 ≤ 𝑥 < 𝑥𝑖+1
1 𝑠𝑖 𝑥 > 𝑥𝑘

13-2-Caractère quantitatif continu

Dans le cas continu, on a une courbe des fréquences cumulées croissants et une courbe des
fréquences cumulées décroissantes.

La courbe des fréquences cumulées croissantes est la fonction passant par les points M i (bi+1, FCC) où
bi+1 est la borne supérieure de la classe CI et FCC la fréquence cumulée croissante de la même classe.

La courbe des fréquences cumulées décroissantes est la fonction passant par les points M i (bi, FCD)
où bi est la borne inférieure de la classe CI et FCD la fréquence cumulée décroissante de la même
classe.

Exercice1

Le tableau suivant donne la répartition des ménages congolais selon la source d’approvisionnement
en eau

Source Robinet Robinet Forage Puits Puits Autres


intérieur extérieur Pompe intérieur extérieur
(RI) (RE) (FP) (PI) (PE)
Effectif 18 30 9 12 45 6

5
1-Quelle est la population étudiée ? Quel est le caractère étudié ? Quelle est sa nature ?

2-Représenter le tableau statistique en faisant figurer les fréquences

3-Représenter graphiquement cette distribution

Exercice2

Une enquête effectuée auprès de 50 familles congolaises a conduit à la distribution suivante, selon le
nombre d’enfants

Nombre 0 1 2 3 4 5 6 7
d’enfants
(xi)
Effectif(ni) 6 3 8 5 2 12 9 5

1-Quelle est la population étudiée ? Quel est le caractère étudié ? Quelle est sa nature ?

2-Représenter le tableau statistique en faisant figurer les fréquences cumulées et les effectifs
cumulés

3-Quel est le nombre des familles qui ont au moins 3 enfants ? au plus 3 enfants ?

4-Quel est le pourcentage des familles qui ont au moins 4 enfants ? au plus 4 enfants ?

5-Représenter graphiquement cette distribution

6-Construire la courbe cumulative de cette distribution

Exercice3

La distribution suivante donne la répartition des salaires des employés d’une entreprise

Salaires (x103) [10 ; 20[ [20 ; 30[ [30 ; 40[ [40 ; 50[ [50 ; 60[
Effectif 15 10 18 5 2

1-Quelle est la population étudiée ? Quel est le caractère étudié ? Quelle est sa nature ?

2-Représenter le tableau statistique en faisant figurer les fréquences cumulées et les effectifs
cumulés

3-Quel est le nombre des employés qui ont au moins 40000 Frs ? au plus 40000 Frs ?

4-Quel est le pourcentage des employés qui ont au moins 30000 Frs ? au plus 30000 Frs ?

5-Représenter graphiquement cette distribution

6-Construire dans le même repère la courbe des fréquences cumulées croissantes et décroissantes

6
7
8

Vous aimerez peut-être aussi