Vous êtes sur la page 1sur 23

Introduction Tableaux statistiques Représentation graphique

Chapitre 1. L’appréhension statistique descriptive

A. El maliki, abdelmaliki@gmail.com

ENCG Casablanca

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 1 / 23


Introduction Tableaux statistiques Représentation graphique

1 Introduction
Statistique descriptive
Domaines d’application
Définitions
Typologie des variables
2 Tableaux statistiques
Distribution des fréquences
Exemples : variable nominale
3 Représentation graphique
Utilité de la représenation graphique
Cas d’une variable qualitative
Cas d’une variable discrète : exemple de l’ensemble de commandes
Cas d’une variable continue : revenu mensuel des employés d’une
entreprise

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 2 / 23


Introduction Tableaux statistiques Représentation graphique

Statistique descriptive

Qu’est ce que la statistique descriptive


La statistique descriptive est un ensemble de méthodes permettant de
décrire, présenter, résumer et interpréter des données.

Objectifs : Le cours de statistique descriptive a pour objectifs d’organiser,


résumer, représenter un ensemble de données souvent nombreuses.

L’étude statistique descriptive porte sur des individus caractérisés par une
seule variable ou par deux variables :
Tableaux : Trier et regrouper des observations
Représentation graphique : Visualisation des données
Mesures statistiques : Synthèse des données en quelques grandeurs
représentatives (médiane, moyenne, variance, écart-type, ...)
Corrélation et dépendance entre deux variables

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 3 / 23


Introduction Tableaux statistiques Représentation graphique

Domaines d’application

Le domaine d’application de statistique est varié


Finance : On analyse un certain nombre de données financières pour
faire des recommandations en matière d’investissement.
Marketing : On recueille des données par des scanners des caisses
enregistreuses et puis exploiter et utiliser les conclusions statistiques
par des producteurs.
Gestion de la production : Afin de corriger le processus de
production, on utilise des outils statistiques tels que des graphiques
(diagramme en barres).
Économie : On intègre des indicateurs statistiques dans un modèle
de prévision pour prévoir certains faits économiques futurs, par
exemple inflation.

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 4 / 23


Introduction Tableaux statistiques Représentation graphique

Définitions

On veut étudier le revenu mensuel de 1000 ménages d’une ville.


Question : L’étude statistique porte sur qui ? Que mesure-t-on ?
Définitions
La population statistique est l’ensemble d’individus sur lequel porte
l’analyse (étude) statistique.
L’individu (l’unité statistique) est un élément qui compose la
population. C’est l’entité abstraite qui représente une personne,
ménage, entreprise,...
L’échantillon est un sous-ensemble (beaucoup plus petit) de la
population et il doit être bien choisi pour représenter la population.
La variable statistique est ce que l’on observe/mesure chez les
individus de la population.
Le recensement est l’étude de tous les individus d’une population
donnée.
Un sondage est l’étude d’une partie d’une population.
A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 5 / 23
Introduction Tableaux statistiques Représentation graphique

Typologie des variables

Variables
Ensemble de caractéristiques d’une population. Le type de ces variables
statistiques dépend de la nature de ses modalités ou ses valeurs.
1 Une variable qualitative est une variable non mesurable (non

numériques), ses valeurs possibles sont des catégories.


Variables nominales (catégorielles) : aucune relation d’ordre ne peut
être établie sur l’ensemble des modalités.
Exp :sexe (masculin,féminin), couleur des yeux (noir, bleu, ...).
Variables ordinales : une relation d’ordres existe.
Exp :niveau de satisfaction (mauvais, bon, très bon,. . . ), cote d’un
examen (faible, moyen, bien, très bien).
2 Une variable est quantitative s’elle est mesurable :
Variable discrète si ses valeurs observées sont isolées et dénombrable
Exp :nombre de condidats, quantités vendues,...
Variable continue si ses valeurs possibles sont continues
Exp :valeur de la bourse, chiffre d’affaires, revenu du ménage,...

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 6 / 23


Introduction Tableaux statistiques Représentation graphique

Typologie des variables

Les valeurs prises par une variable, sont appelées aussi modalités.
Exp1 : Les modalités de la variable sexe sont masculin (codé M) et
féminin (codé F). C’est une variable qualitative nominale.
Exp2 : Les valeurs de la variable quantité vendue d’un article sont
0, 1, 2, · · · , 1000, · · · . C’est une variable quantitative discrète.

Les variables seront désignées par simplicité par une lettre majuscule
(X , Y , Z )
Effectif total : nombre d’individus observés, sera noté n.

Série statistique
On appelle série statistique la suite des valeurs prises par une variable X
sur les individus (unités d’observation).
Les valeurs de la variable X sont notées par x1 , x2 , · · · , xi , · · · , xn

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 7 / 23


Introduction Tableaux statistiques Représentation graphique

Exemple

Exercice
On s’intéresse à l’état-civil (C=célibataire, M=marié(e),
V=veuf(ve),D=divorcé(e)) d’un ensemble de personnes. La série
statistique associée est donnée par
MMDCCMCCCMCMVMVDCCCM
1 Définir la population et donner l’effectif total.
2 Définir la variable. De quelle variable s’agit-elle (qualitative,
quantitative)
3 Préciser les modalités de cette variable.

Réponse
1 Population : ensemble de persesonnes. L’effectif total n = 20
2 Variable : état civil, c’est une variable qualitative.
3 Les modalités : x1 = C , x2 = M, x3 = V , x4 = D

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 8 / 23


Introduction Tableaux statistiques Représentation graphique

Distribution des fréquences

Soit k le nombre de modalités que l’on notera xi , i = 1, ..., k

L’effectif correspondant à la modalité xi est noté par ni :


C’est le nombre de fois où l’on observe la valeur xi .
L’effectif total est n = ki=1 ni .
P

La fréquence est la proportion d’individus de la population ayant la


ni
modalité xi . Elle est définie par fi = et fi × 100 représente un
n
pourcentage.
On a toujours :n = ki=1 ni , 0 ≤ fi ≤ 1, ki=1 fi = 1
P P

Pour variable ordinale, discrète ou continue, on peut calculer :


L’effectif cumulé : Ni = ij=1 nj . Il représente le nombre
P
d’observations inférieures ou égales à xi .
la fréquence cumulée Fi = ij=1 fj = n1 ij=1 nj . Elle indique la
P P
proportion d’observations inférieures ou égales à xi .
A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 9 / 23
Introduction Tableaux statistiques Représentation graphique

Distribution des fréquences

Le tableau de distribution de fréquences est un mode synthétique de


présentation des données. Son utilisation a pour but de résumer les
données.
Un tableau statistique donne pour chaque valeur de la variable,
l’effectif correspondant . Il intègre également la fréquence de chaque
modalité ainsi que l’effectif ou la fréquence cumulée .

On appellera distribution statistique des effectifs d’une variable X :

(xi , ni ), i = 1, · · · , k

Distribution de fréquences est donnée par (xi , fi ), i = 1, · · · , k

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 10 / 23


Introduction Tableaux statistiques Représentation graphique

Exemples : variable nominale

Tableau de distribution de fréquences


xi ni fi
Reprenons la série donnée dans C 9 0.45
l’exercice précédent (page 8), le M 7 0.35
tableau statistique est donné : V 2 0.1
D 2 0.1

Interprétation :
n2 = 7 est le nombre de personnes mariées.
f4 = 10% est la proportion des personnes divorcées.
L’état civil le plus dominant est x1 = C avec une proportion de f1 = 45%

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 11 / 23


Introduction Tableaux statistiques Représentation graphique

Exemples :variable discrète

Les données ci-dessous représentent le nombre de jours nécessaires à la


société MM pour honorer un ensemble de commandes :
2, 2, 3, 5, 5, 4, 2, 1, 5, 3, 4, 2, 1, 1, 5, 3, 1, 5, 4, 2, 3, 5, 5, 5, 3, 4, 5, 8, 2, 3
Question : Quelle est la population ? Quelle est la variable étudiée , et quel
est son type. Préciser les valeurs de cette variable.
Donner le tableau statistique correspond à la série ci-haut :

xi Effect.(ni ) Fréq.(fi ) Fréq. cumulée(Fi )


1 4 0,133333333 0,133333333
2 6 0,2 0,333333333
3 6 0,2 0,533333333
4 4 0,133333333 0,666666667
5 9 0,3 0,966666667
8 1 0,033333333 1

La proportion des commandes effectués en 4 jours et moins est


F4 ' 66.67%
A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 12 / 23
Introduction Tableaux statistiques Représentation graphique

Exemple : variable continue

On désire étudier le revenu mensuel (en 1000 DH) des employés d’une
entreprise : (8 , 8.5, 9.5, 9.8, 10, 11, 11.5, 12, 13, 14, 14.5,14.8, 15, 15.5,
15.6, 16, 17, 18, 20, 23)
Question : Quelle est la population ? Quelle est la variable étudiée , et quel
est son type.

Lorsque la variable est continue, il faut regrouper les observations en


classess ; on parle de données regroupée :
Nombre de classes (k) : En général, on recommande d’utiliser entr
5 et 20 classes. Il existent des formules qui permettent d’établir le
nombre de classe :
ln(n)
- La règle de Sturge k = 1 + 3.3( ln(10) ).
- La plus petite valeur k telle que 2k ≥ n.
Longueur des classes = xmax −x k
min
, où xmax est la plus grande valeur
observée,xmin est la plus petite valeur observée
Exemple d’application, voir en classe.
A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 13 / 23
Introduction Tableaux statistiques Représentation graphique

Exemples : variable continue

Complétez le tableau statistique :


Salaire Eff.(ni ) Eff. cumulé(Ni ) Fréq.(fi ) Fréq. cumulée(Fi )
[8, 10[ 4 4 0.2 0.2
[10, 14[ 5 9 0.25 0.45
[14, 16[ 6 15 0.3 0.75
[16, 20[ 3 18 0.15 0.9
[20, 24[ 2 20 0.1 1

Quelques interprétations :
n1 = 4 d’employés ont un revenu compris entre 8000 et 10000
dihrams
N3 = 15 est le nombre des employés qui gagnent moins 16000
dirhams
10% des employés ont un revenu compris entre 20000 et 24000
dirhams .
45% des employés ont un revenu inférieur à 14000 dirhams.
A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 14 / 23
Introduction Tableaux statistiques Représentation graphique

Exemples : variable continue (suite)

Si [bi−1 , bi [ designe la classe i, on note


bi−1 la borne inférieure de la classe i
bi la borne supérieure de la classe i
bi−1 + bi
ci = le centre de la classe i
2
ai = bi − bi−1 l’amplitude de la classe i
ni , Ni , fi , Fi sont respectivement l’effectif, effectif cumulé, fréquence
et fréquence cumulée de la classe i

Pour l’exemple précédent on a :


Le centre de la classe 2 ([b1 , b2 [= [10, 14[) est
b1 + b2 10 + 14
c2 = = = 12
2 2
L’amplitude de la classe 2 ([10, 14[) est a2 = b2 − b1 = 14 − 10 = 4

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 15 / 23


Introduction Tableaux statistiques Représentation graphique

Utilité de la représenation graphique

Permet d’avoir une vision globale de la série statistique


Permet de comparer deux séries statistiques en superposant les
graphiques.
Graphique reste assez imprécis ; c’est un résumé numérique qu’il faut
absolument associer au tableau.
Graphiques différents selon le type de variable étudiée.

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 16 / 23


Introduction Tableaux statistiques Représentation graphique

Cas d’une variable qualitative

On représente chaque modalité de la variable par une surface


proportionnelle à l’effectif ou la fréquence.
Les deux principales représentations graphiques sont :
Graphique en barres (ou en tuyaux d’orgues).
Graphique en secteurs ou camembert

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 17 / 23


Introduction Tableaux statistiques Représentation graphique

Cas d’une variable qualitative

CSP xi ni fi
Cadre supérieur 60 6%
Patron 90 9%
Cadre moyen 170 17%
Ouvrier 320 32%
Retraité, inactif 230 23%
Agriculteur 130 13%
On représente les modalités par
des rectangles de base constante.
Les hauteurs de ces rectangles
correspondent aux effectifs (ou
fréquences) : À chaque modalité xi
on associe une “barre” de hauteur
hi = C1 × ni = C2 × fi , où C1 , C2
sont deux constantes.

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 18 / 23


Introduction Tableaux statistiques Représentation graphique

Cas d’une variable qualitative

CSP xi fi θio
Cadre supérieur 6% 21.6
Les modalités sont représentées
Patron 9% 32.4
par des secteurs de disque dont
Cadre moyen 17% 61.2
l’angle est proportionnel aux
Ouvrier 32% 115.2
fréquences ou effectifs.
Retraité, inactif 23% 82.8
Agriculteur 13% 46.8

L’angle de chaque secteur


θi est proportionnel à la
fréquence fi . En degré, on
a θi = 360 × fi .
Exemple : Pour f2 = 9%,
l’angle correpsondant est
θi = 360 × 9% = 32.4o

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 19 / 23


Introduction Tableaux statistiques Représentation graphique

Cas d’une variable discrète : exemple de l’ensemble de commandes

Deux types de graphique :


Diagramme en bâtons fréquenciel (ou d’effectifs) [à gauche]
diagramme des fréquences cumulées. [à droite]

Les fréquences cumulées sont 


 0 pour x < x1 (= 1);
représentées au moyen de
F (x) = F pour xi ≤ x < xi+1 ;
la fonction de répartition  i
1 pour x ≥ x7 (= 8).
FA.(x)(définie de R dans [0,
El maliki ( ENCG Casablanca)
1]) :
Chapitre 1. L’appréhension statistique descriptive 20 / 23
Introduction Tableaux statistiques Représentation graphique

Cas d’une variable continue : revenu mensuel des employés d’une entreprise

Pour représenter graphiquement une variable continue regroupée en


classes, on dispose de deux outils :
histogramme fréquenciel .
courbe des fréquences cumulées

L’histogramme est un ensemble de rectangles juxtaposés tel que la


surface de chacun des rectangles soit proportionnelle à la fréquence de
chacune des classes. La longueur de la base de ces rectangles est
proportionnelle à l’amplitude de la classe

Dans un histogramme la hauteur des rectangles est aussi appelée


densité et est noté di .
fi
Formule : ai × di = fi ⇔ di =
ai
La surface totale des rectangles vaut un ( ki=1 fi = 1)
P

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 21 / 23


Introduction Tableaux statistiques Représentation graphique

Cas d’une variable continue : revenu mensuel des employés d’une entreprise

Salaire Eff.(ni ) Fréq. (fi ai di


[8, 10[ 4 20% 2 10%
[10, 14[ 5 25% 4 6.25%
[14, 16[ 6 30% 2 15%
[16, 20[ 3 15% 4 3.75%
[20, 24[ 2 10% 4 2.5%

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 22 / 23


Introduction Tableaux statistiques Représentation graphique

Cas d’une variable continue : Graphique des fréquences cumulées

Salaire Eff.(ni ) Fréq. (fi Fi


[8, 10[ 4 20% 20%
[10, 14[ 5 25% 45%
[14, 16[ 6 30% 75%
[16, 20[ 3 15% 90%
[20, 24[ 2 10% 100%

Les fréquences cumulées sont représentées au moyen de la fonction de


répartition F (x) : Cette fonction est définie comme une droite sur chaque
intervalle [bi−1 , bi [ :


 0 pour x < b0 ;
 F (bi ) − F (bi−1 )
F (x) = Fi−1 + (x − bi−1 ) pour bi−1 ≤ x < bi ;

 bi − bi−1
1 pour bk ≤ x.

A. El maliki ( ENCG Casablanca) Chapitre 1. L’appréhension statistique descriptive 23 / 23

Vous aimerez peut-être aussi