Vous êtes sur la page 1sur 110

STATISTIQUE Semestre 1 : Sciences

Economiques Et Gestion
DESCRIPTIVE
Le présent support de cours est destiné aux étudiants du premier semestre filière : Sciences Economiques et Gestion.
Pr Mr. HASSINI
SOMMAIRE
Introduction
Vocabulaire
Chapitre I : Tableaux ; représentation et graphiques
Chapitre II : Paramètres de tendance centrale
Chapitre III : Caractéristiques de dispersion
Chapitre IV : Caractéristiques de concentration
Chapitre V : Tableaux Statistiques à deux variables
Chapitre VI : Séries chronologiques
Chapitre VII : Les indices Statistiques
BIBLIOGRAPHIE
E.A..HASSINI , B.KOUHLANI, M.BENABDESSELAM
Statistique Descriptive, cours et exercices corrigés, édit. ALMASSAR
E.A.HASSINI, B.KOUHLANI, M.BENABDESSELAM
Statistique à une ou deux Dimensions, cours et exercices corrigés ,edit.Consulting
INTRODUCTION
La statistique est une méthode scientifique permettant la collecte ; l’analyse et
l’Interprétation des ensembles d’observation relative a un même phénomène et qui
peuvent être dénombrés et classés.
L’objectif de la statistique est de :
- Recueillir ; décrire et présenter les faits observés
- Interpréter et étudier ces faits
- Rechercher les lois qui les régissent
VOCABULAIRE STATISTIQUE
(1/7)
Population statistique
Ou bien l’univers statistique ; désigne tout ensemble sur le quel doit porter l’étude statistique.
Unité statistique ou individu statistique.
C’est un élément ou individu d’une population.
Echantillon
C’est une partie de la population qui représente la population mère.
Exemple :
On veut tirer des conclusions sur la taille ou le poids de 400 étudiants ; en considérant seulement 30
étudiants ; alors
La population est : 400 étudiants
L’échantillon est : 30 étudiants
VOCABULAIRE STATISTIQUE
(2/7)
Caractère
C’est la propriété retenue pour spécifier la population
Exemple
La répartition du personnel d’une entreprise suivant le grade
- le caractère ici c’est le grade
La répartition d’un groupe d’étudiants suivant l’âge
- le caractère ici c’est l’âge
Les modalités
Les modalités sont les différents états possibles d’un caractère
Exemple 1
On reprend l’exemple précédent
VOCABULAIRE STATISTIQUE
(3/7)
La répartition du personnel suivant le grade ; ce dernier peut être : manœuvre ; agent de
maîtrise ; etc …….
Exemple 2
Une population est repartie suivant le lieu de résidence ; dans ce cas il y a deux modalités :
Urbaine et rurale.
Un Caractère peut être Qualitatif ou Quantitatif
A / Caractère Qualitatif ( qualité )
Le caractère est dit qualitatif lorsque ses modalités ne sont pas mesurable et on ne peut pas les
dénombrer . par exemple : le sexe ; la nationalité ; le type de baccalauréat ; ………..
B / Caractère Quantitatif ( quantité )
Le caractère est dit quantitatif lorsque ses modalités sont mesurable
VOCABULAIRE STATISTIQUE
(4/7)
Par exemple : l’âge ; le nombre d’enfant par famille ; les salaires distribués au sein
d’une entreprise.
Le caractère quantitatif peut être discret ou continu
- Le caractère est discret si ses modalités sont des nombres entiers isolés
Exemple : nombre d’enfant
- Le caractère est continu si ses modalités sont exprimés par des intervalles de
valeurs
Exemple : l’âge
NB : les modalités d’un caractère qualitatif ne sont pas des nombres ; dans ce cas on
ne parle jamais de variable
VOCABULAIRE STATISTIQUE
(5/7)
Effectif
On l’appelle aussi fréquence absolue ; c’est le nombre de fois que se répète chaque modalité
du caractère.
La fréquence ou fréquence relative
C’est la part de l’effectif d’une modalité à l’effectif total.
Classes
Sont des intervalles égaux ou inégaux déterminés a l’intérieur du champ de variation de la
variable statistique .
On peut définir pour chaque classe une limite inférieur < ou supérieure > et une amplitude
de classe ; cette dernière est définie comme la différence entre la limite supérieure et
inférieure.
VOCABULAIRE STATISTIQUE
(6/7)
Série statistique ou distribution statistique
C’est l’ensemble des valeurs qui mesurent le caractère.
Application :
-Le classement d’individus
Sexe
suivant le sexe Effectif

Masculin 100

Féminin 200

Total 300

-Le caractère est le sexe ; n’est pas mesurable donc c’est un caractère qualitatif
-Il y a deux modalités ( Masculin et Féminin )
VOCABULAIRE STATISTIQUE
(7/7)
-Le classement de familles selon le nombre d’enfant
Nombre d’enfant par famille Effectif

1 2
2 3
3 5
4 12
5 17
6 11
7 et plus 10
Total 60

-Les familles sont classées en fonction du nombre d’enfant ; le caractère est quantitatif discret
Car il prend des valeurs isolées ( 1 ; 2 ; 3 ; …..)

-Il y a 7 modalités.
CHAPITRE I : ELABORATION DES
TABLEAUX STATISTIQUES ET
REPRESENTATION GRAPHIQUE
I - Elaboration des tableaux statistiques
I – 1 – Présentation

Le dépouillement des données statistiques ( Dénombrement ) permet de les


synthétiser dans des tableaux statistiques . Un tableau statistique comporte au moins
deux colonnes : la première contient les modalités ; la deuxième contient les effectifs
ou les fréquences.
I – 2 – CAS D’UN CARACTÈRE QUALITATIF

Rappel : un caractère est dit qualitatif lorsque ses modalités ne sont pas mesurables .
Exemple N 1 :
Dans une entreprise de fabrication de matériel électrique ; on dénombre 96 salariés
que l’on classe en fonction de leur qualification.

Modalités Effectif ni Fréquence fi

Manœuvre 41 0.43
Ouvriers 30 0.31
spécialisés 17 0.18
Cadres 8 0.08

Total 96 1
On démontre que la somme des fi est égale a l’unité.
Chaque Effectif est noté ni.
La fréquence est notée fi.
L’effectif total = 96 ( N = 96 )
∑ ni = N ( 41 + 30 + 17 + 8 = 96 )
ni n1 41
fi = — ( exemple : f 1 = — = — = 0 . 43 )
N N 96
Exemple 2 :
Les réponses à la question – Etat familiale – lors d’une enquête pour 30 salariés d’une
entreprise ont été comme suit ( C = Célibataire ; M = marié ; V = Veuf ; D = Divorcé )
C ; C ; M ; C ; C ; C ; C ; M ; C ; D ; C ; C ; M ; C ; C ; C ; C ; C ; M ; C ;C ;C ; M ;M ;
D ;C ;C ;C ;V;C.
Modalities Effectif fréquence

Célibataire 21
Marié 6
Veuf 1
Divorcé 2

Total 30

Chaque effectif est note ni ; la somme des ni ( ∑ ni ) est l’effectif total


I – 3 - CAS D’UN CARACTÈRE QUANTITATIF

I – 3 – 1 – Caractère quantitatif discret


Rappel : un caractère est dit quantitatif discret lorsque ses modalités sont
mesurables ; et elles prennent des valeurs isolées.
Exemple 1: Dans un ensemble résidentiel ; on considère 320 appartements classés en
fonction du nombre de pièces ; les résultats sont récapitulés dans le tableau suivant :
Modalités Effectif ni Fréquence fi

1 47 0 .15
2 63 0 .20
3 152 0 .47
4 38 0 .12
5 20 0 .06

Total 320 1
Exemple 2
La répartition d’un échantillon de 50 familles d’un quartier , selon le nombre
d’enfants par famille à donné les résultats suivants :
0–0–1–1–1–2–3–2–1–0–0–3–3–4–4–4–5–5–6–6–0–0–1
–1–2–3–3–4–4–5–5–6–6–1–1–2–1–2–3–3–4–5–5–6–6–
6 – 5 – 6-3 – 6.
Nombre Effectif Fréquence fi Fréquence
d’enfants cumulée fc

0 6 0.12 0.12
1 9 0.18 0.30
2 5 0.10 0.40
3 8 0.16 0.56
4 6 0.12 0.68
5 7 0.14 0.82
6 9 0.18 1.00

Total 50 1
Dans cet exemple ; la variable est discrète et prend 7 valeurs ou modalités.
X1= 0 ; X2 = 1 ; X3 = 2 ; ………………… ; X7 = 9

A chacune de ces valeurs correspond un effectif ni


n1 = 6 ; n2 = 9 ; n3 = 5 ; …………………. ; n7 = 9

f
i 1
i =1 ( 0.12 + 0.18 + 0.10 + 0.6 + 0.12 + 0.14 + 0.18 = 1 )
I – 3 – 2 – CARACTÈRE QUANTITATIF CONTINU

Rappel : un caractère est dit quantitatif continu lorsque ses modalités sont
mesurables ; et peuvent prendre toutes les valeurs d’un intervalle donné.
Exemple 1:Dans une entreprise de 96 salariés ; on classe les individus en fonction de
leur salaire horaire :
Salaire Effectif ni Fréquence fi fi en %
horaire en
Dhs
[ 5 - 10 [ 23 0.24 24
[ 10 - 15 [ 25 0.26 26
[ 15 - 25 [ 31 0.32 32
[ 25 - 35 [ 11 0.12 12
[35 - 65 [ 6 0.06 6

Total 96 1 100
I – 3 – 2 – CARACTÈRE
QUANTITATIF CONTINU
Le tableau montre que :
-24 ℅ des salariés perçoivent un salaire horaire compris entre 5 et 10 Dhs
-26 ℅ des salariés perçoivent un salaire horaire compris entre 10 et 15 Dhs
-32 ℅ des salariés perçoivent un salaire horaire compris entre 15 et 25 Dhs
-12 ℅ des salariés perçoivent un salaire horaire compris entre 25 et 35 Dhs
-6 ℅ des salariés perçoivent un salaire horaire compris entre 35 et 65 Dhs.
Exemple 2:
La série suivante représente le poids réel en gramme d’un échantillon de 42 boîtes de
conserve de marques différentes :
300 – 250 – 242 - 320 - 410 - 420 - 500 - 512 - 600 - 630 - 710 - 350 - 200 - 210 –
250 - 310 320 - 400 - 460 - 380 - 510 - 560 - 740 - 240 - 270 - 280 - 340 - 360 -
230 - 290 - 310 - 430 460 - 530 - 640 - 680 - 720 - 450 - 470 - 640 - 780 - 440 .
On peut présenter cette série dans des tableaux avec des classes d’amplitudes égales
ou inégales.
PREMIER CAS : TABLEAU AVEC DES
CLASSES D’AMPLITUDE ÉGALES

Classe de Effectif Fréquence ni c ni c fi c fi c


poids ni fi

200 – 300 10 0.24 10 42 0.24 1.00


300 – 400 9 0.21 19 32 0.45 0.76
400 – 500 9 0.22 28 23 0.67 0.55
500 – 600 5 0.12 33 14 0.79 0.33
600 – 700 5 0.12 38 9 0.91 0.21
700 – 800 4 0.09 42 4 1.00 0.09

Total 42 1.00
DEUXIÈME CAS : TABLEAU AVEC DES CLASSES
D’AMPLITUDES INÉGALES

Classes Effectifs ni Fréquence fi Amplitude ai

200 – 250 5 0.12 50


250 – 350 11 0.26 100
350 – 500 12 0.29 150
500 – 600 5 0.12 100
600 – 800 9 0.21 200

Total 42 1.00
Remarques :
1 - Le choix du nombre de classes et de l’amplitude varie avec la statistique qu’on veut utiliser
. Le nombre de classe doit être raisonnable: il ne doit être ni trop petit ni trop grand afin
d’obtenir des résultats significatifs et qui aident à la décision.
2 - En général, la limite inférieure de la classe fait partie de cette dernière alors que la limite
supérieure en est exclue ; mais elle fait partie de la classe suivante . Cette présentation permet
d’éviter le double emploi de cette limite.
3 - La première et la dernière classe peuvent avoir des amplitudes indéterminées.
I-3-3 - EFFECTIFS CUMULÉS OU
FRÉQUENCES CUMULÉES:
Pour des besoins de calcul ou d’analyse on s’intéresse souvent soit
aux effectifs cumulés soit aux fréquences cumulées.
Reprenons l’exemple précédent ( premier cas : tableau avec des
classes d’amplitudes égales ).
 Lecture des effectifs c umulés ( nic ) et des effectifs cumulés
décroissants (nic )
•19 boites ont moins de 400 grammes
•23 boites ont plus de 400 grammes

 Lecture des fréquences cumulées ( fic ) et des fréquences cumulées décroissantes (fic )
•67 ℅ des boites ont moins de 500 grammes
•33 ℅ des boites ont plus de 500 grammes.
II – REPRÉSENTATION GRAPHIQUE
L'intérêt des représentations graphiques est qu'elles permettent de visualiser
les caractéristiques générales de la population observée.
Le principe fondamental est que la surface relative à la modalité i est
proportionnelle à l'effectif ni ( ou la fréquence fi ) de cette modalité.
Le choix des graphiques à retenir dépend de la nature du caractère considéré
pour étudier cette population.
II – 1- Représentation graphique d'un caractère qualitatif
Pour cette représentation on retient deux types graphiques:
Le diagramme rectangulaire ou diagramme en tuyaux d'orgue;
Le diagramme circulaire.
II -1- A – DIAGRAMME RECTANGULAIRE OU
DIAGRAMME EN " TUYAUX D'ORGUE "

Il s'agit de bande dont la base est constante et dont la hauteur est proportionnelle à
l'effectif ni ou la fréquence fi.
On considère l'exemple 2 du paragraphe I – 2 concernant la réponse de l'état familial
lors d'une enquête menée auprès de 30 salariés.
Etat familial Effectif ni Fréquence fi

Célibataire 21 0.70
Marié 6 0.20
Veuf 1 0.03
Divorcé 2 0.07

Total 30 1.00
II -1- A – DIAGRAMME
RECTANGULAIRE OU DIAGRAMME
EN " TUYAUX D'ORGUE "
II – 1 – B – DIAGRAMME CIRCULAIRE
A partir d'un cercle , on trace des portions ( ou secteurs ) correspondants à
chacune des modalités , le problème qui se pose alors est de déterminer
l'angle αi relatif à la modalité i.
Exemple : reprenons l'exemple précédent:

Etat familiale Effectif fi ai= 360xfi

Celibalaire 21 0.70 252


Marie 6 0.20 72
Veuf 1 0.03 10.8
Divorcé 2 0.06 25.2

Total 30 1 360
II – 1 – B – DIAGRAMME
CIRCULAIRE
II – 1 – B – DIAGRAMME
CIRCULAIRE
Divorcé 6%
6%
Veuf 3%
20%
20%

70%
70%

Remarque: Lorsque les modalités d’un caractère sont en nombre réduit , la représentation graphique peut se faire
sur un diagramme semi circulaire.
Dans ce cas, on détermine les portions par la relation suivante :
II – 2 – REPRÉSENTATION GRAPHIQUE D’UN
CARACTÈRE QUANTITATIF

On sait qu’à ce niveau, il est nécessaire de distinguer les variables statistiques


discrètes des variables statistiques continues.
II – 2 – 1 – Représentation graphique d’un caractère quantitatif discret
Selon l’objectif de l’étude , on utilisera :
-Le diagramme en bâtons
-La courbe cumulative
A / LE DIAGRAMME EN BÂTONS

A chacune des valeurs possibles de la variable, on fait correspondre un bâton dont la


hauteur est proportionnelle à l’effectif.
A ce niveau, on rencontre une exception par rapport au principe fondamental énoncé
en début du paragraphe ; en effet il ne s’agit pas à proprement parler de surface mais
de longueur .
Exemple 1 : on reprend l’exemple 2 du paragraphe I – 3 – 1 ( la répartition d’un
échantillon de 50 familles selon le nombre d’enfants )
nombre Effectif ni Fréquence fi
d’enfants

0 6 0.12
1 9 0.18
2 5 0.10
3 8 0.16
4 6 0.12
5 7 0.14
6 9 0.18

Total 50 1
A / LE DIAGRAMME EN
BÂTONS

0
B / LA COURBE CUMULATIVE

Définition: Cette courbe représente la fonction de répartition ( ou courbe cumulative ) F


(x) .
On l’appelle aussi courbe de fréquence cumulées. C’est une courbe en escalier.
F(x) est la fonction qui a tout réel x associe la proportion des individus dont le caractère est
strictement inférieur à x.

Propriétés: F(x) est définie pour tout réel x


F(x) est constante dans l’intervalle qui sépare deux valeurs consécutives de x
F(x) = 0 ; pour tout x inférieur ou égale à la petite valeur prise par x.
F(x) = 1 ;pour tout x supérieur à la plus grande valeur prise par x
Par convention F( − ∞ ) = 0 et F( + ∞ ) = 1
B / LA COURBE
CUMULATIVE
Exemple :Dans un ensemble résidentiel , on considère 320 appartements classés
suivant le nombre de pièces. Les résultats sont récapitulés dans le tableau suivant:
Valeurs possible de Effectif ni Fréquence fi Fréquence cumulée
la variable xi ou F(x)

-------------------------- 0
1 47 0.15
-------------------------- 0.15
2 63 0.20
-------------------------- 0.35
3 152 0.47
-------------------------- 0.82
4 38 0.12
-------------------------- 0.94
5 20 0.06
1

Total 320 1
Lecture du tableau:
-La proportion des appartements qui ont moins d’une pièce est nulle;
-La proportion des appartements qui ont moins de 2 pièces est 0.15 ( 15 % );
-La proportion des appartements qui ont moins de 3 pièces est 0. 35 ( 35 %);
-La proportion des appartements qui ont moins de 4 pièces est 0.82 ( 82 %);
-La proportion des appartements qui ont moins de 5 pièces est 0.94 ( 94 %);
-La proportion des appartements qui ont moins de 6 ; 7 ; 8 ; ….. ; N ( N > 5 ) est
égale à l’unité ( 1 ) ou 100% ; cela veut dire que la totalité des appartements observés
ont au plus ( au maximum ) 5 pièces ( en tout cas moins de 6 pièces ).
Valeurs de F(x)
x −∞ 0 1 2 3 4 5 +∞
F(x) 0 0 0 0.15 0.35 0.82 0.94 1
F(2) est la proportion des appartements qui ont moins de 2 pièces c’est-à-dire une pièce.

F ( 3 ) est la proportion des appartements qui ont un nombre de pièces inférieur à 3 ( 1 pièce ou 2 pièces ).
II – 2 – 2 – REPRÉSENTATION D’UN CARACTÈRE
QUANTITATIF CONTINU OU VARIABLE CONTINUE

Un caractère quantitatif continu peut être représenté par deux types de graphiques :
-l’histogramme qui représente les effectifs ou les fréquences ;
-la courbe cumulative qui représente les fréquences cumulées.

A / l’Histogramme
Définition :
L’histogramme se présente comme la juxtaposition de tuyaux d’orgue dont la base est égale à
l’amplitude des classes
Rappel : l’amplitude ai d’une classe i ou d’un intervalle de classe [ ei ; ei+1[ se mesure à partir des
extrémités : ai = ei+1 - ei
A / L’HISTOGRAMME
La hauteur de ces tuyaux fait intervenir les effectifs ou les fréquences .
Quand les amplitudes des classes sont égales , il suffit de tracer pour chaque classe un
rectangle dont la base est égale à son amplitude et dont la hauteur est égale à l’effectif ni ou la
fréquence fi.
Quand les amplitudes des classes sont inégales , cette hauteur est égale à l’effectif corrigé ou
à la fréquence corrigée.
Pour corriger les effectifs, il faut :
-Choisir une amplitude de base ou de référence ( généralement ) la plus petite amplitude: on
l’appelle a0 )
-Corriger les effectifs ou les fréquences des classes dont l’amplitude ai est différente de
l’amplitude a0 ; cela consiste à multiplier l’effectif ni par a0 et le diviser par ai . ainsi n’i est
l’effectif corrigé de la classe i ; on a :
1 – CAS DES AMPLITUDES
ÉGALES
Reprenons l’exemple 2 du paragraphe I-3-2 ( Echantillon de 42 boites de conserve )

Classe de poids Effectif ni Amplitude Fréquence fi

200 – 300 10 100 0.24


300 – 400 9 100 0.21
400 – 500 9 100 0.22
500 – 600 5 100 0.12
600 – 700 5 100 0.12
700 – 800 4 100 0.09

Total 42
1 – CAS DES AMPLITUDES
ÉGALES
-2- CAS DES CLASSES
INÉGALES:
Soit la série statistique suivante relative à la répartition de 100 exploitations agricoles
selon leur superficie en hectare :
-2- CAS DES CLASSES
INÉGALES:

Pour tracer le polygone de fréquence il convient de joindre les milieux des cotes supérieurs des
tuyaux d’orgues par unité d’amplitude.
B / COURBE CUMULATIVE

Comme dans le cas d’une variable discrète ; c’est un graphique de la fonction dite
cumulative ou la fonction de répartition F(x) ; cette fonction est connue ici ( dans le
cas d’une variable continue ) pour les valeurs de x qui sont des extrémités ou limites
de classes
ei = extrémité de classes : x = e0 ; e1 ; e2 ; …………. ; eK
C’est une courbe continue ; régulière passant par les points ayant pour coordonnées
les limites ou extrémités supérieures des classes et les fréquences cumulées
croissantes.
F(x) = 0 pour la plus petite valeur de x
F(x) = 1 pour tout x supérieure à la plus grande valeur possible prise par x
B / COURBE CUMULATIVE
Par convention F( −∞ ) = 0 et F(+ ∞ ) = 1
Exemple : prenons l’exemple précédent
F( 3 ) = 0.55 : proportion des exploitations qui ont une superficie inférieure à 3
hectares.
F( 18 ) = 0.86 :proportion des exploitations qui ont une superficie inférieure à 18
Hectares.
F( 30 ) = 1 correspond à 100 % ; évident parce que toutes les exploitations ont une
superficie inférieure à 30 hectares.
B / COURBE CUMULATIVE
CHAPITRE II : PARAMETRES DE TENDANCE
CENTRALE

-Les représentations graphiques déjà présentées permettent certes de faire une première
synthèse des informations contenues dans les tableaux et donnent l’aspect général du
phénomène étudié mais restent quand même insuffisantes et peu pratiques lorsqu’on cherche
à effectuer des comparaisons entre plusieurs séries statistiques.

-Pour combler cette lacune ; les statisticiens ont eu l’idée de résumer une série statistique
par des paramètres numériques ou des nombres appelés : Caractéristiques d’une série.

-Parmi les caractéristiques de tendance centrale les plus utilisées on retient la Médiane , le
Mode et la Moyenne.

NB : Il est à préciser qu’à partir de ce chapitre ; les populations seront étudiées selon un
caractère quantitatif.
I - La Médiane
I – 1- Définition
La médiane est une valeur de la variable statistique qui partage la population en deux
effectifs égaux telle que la moitié de ces effectifs lui soit inférieure et l’autre moitié
lui soit supérieure.

I – 2 – Détermination de la médiane
La détermination de la médiane suppose que les valeurs prises par la variable soient
rangées dans un ordre croissant.
I – 2 – 1 – CAS D’UNE VARIABLE DISCRÈTE
A – LE NOMBRE D’OBSERVATIONS DE LA
VARIABLE EST IMPAIR

Dans ce cas le nombre de modalités N = 2n + 1, la médiane


correspond à la modalité de rang n+1 .
Exemple : les notes d’un étudiant à un examen sont comme suit
15 ; 10 ; 9 ; 11 ; 5 ; 8 ; 12

Rangeons par ordre croissant les différentes notes :


5 ; 8 ; 9 ; 10 ; 11 ; 12 ; 15
.

On détermine le rang n+1

La médiane correspond au 4 ème rang ; dans ce cas M e = 10.

Cela signifie que trois notes sont supérieures à 10 et trois notes sont
inférieures à 10.
B / LE NOMBRE
D’OBSERVATIONS DE LA
VARIABLE EST PAIR
Dans ce cas le nombre de modalités N = 2n, la médiane Me correspond à la
demi – somme des modalités de rang n et n+1 ( Dans ce cas on a un
intervalle médian ; et la valeur Me correspond au milieu de cet intervalle ).
Exemple : les notes d’un étudiant dans un examen sont comme suit :
5 ; 8 ; 9 ; 10 ; 11 ; 12
cette série est déjà rangée par ordre croissant
Remarque :

-La Me peut être indéterminée dans le cas suivant :


6 ; 7 ; 9 ; 11 ; 11 ; 12 ; 13

N = 2n + 1 = 7 donc n = 3

Me correspond au rang n + 1 c – à – d le 4 ème


rang donc

Me = 11

Mais il y a trois notes inférieures à 11 et deux notes


supérieures à 11
I – 2 – 2 – CAS D’UNE VARIABLE
CONTINUE
A / détermination algébrique de la médiane
Exemple : le tableau suivant donne la répartition du personnel d’une entreprise selon
leur salaire mensuel en Dhs.
Salaire mensuel en Effectif ni Effectif cumulé Effectif cumulé
Dhs croissant ni c décroissant ni c

1500 - 2000 26 26 60
2000 - 2500 12 38 34
2500 – 3000 11 49 22
3000 - 3500 6 55 11
3500 - 4000 5 60 5
Total 60
A / DÉTERMINATION
ALGÉBRIQUE DE LA MÉDIANE
Le calcul de la médiane se fait en trois étapes :
Première Etape : Détermination du rang de la médiane

Me correspond au salaire du 30 eme individu.


Deuxième Etape : détermination de la classe médiane ( en consultant la colonne
des nic croissant )
On voit que le 30 eme individu appartient à la classe [ 2000 – 2500 [
A / DÉTERMINATION
ALGÉBRIQUE DE LA
MÉDIANE
Troisième Etape :

_ _

_ _
A / DÉTERMINATION
ALGÉBRIQUE DE LA
MÉDIANE
Troisième Etape :

L 1 : représente la limite inférieure de la classe Me


L 2 : représente la limite supérieure de la classe Me
Application:

50 % des salariés touchent un salaire < à 2166.67 Dhs et 50 % des salariés touchent un
salaire > à 2166.67 Dhs.
B / DÉTERMINATION
GRAPHIQUE DE LA
MÉDIANE
La détermination graphique de la médiane consiste à tracer la courbe des fréquences
cumulées croissantes ( ou des effectifs cumulés croissants ) et la courbe des
fréquences cumulées décroissantes ( ou effectifs cumulés décroissants ) .
La médiane Me est l’abscisse du point d’intersection de ces deux courbes ; avec le
droite d’ordonnée qui est parallèle à l’axe des x .
B / DÉTERMINATION
GRAPHIQUE DE LA
MÉDIANE
On reprend l’exemple précédent :
Salaire mensuel Effectif ni Effectifs Effectifs
en Dhs cumulés cumulés
croissants ni c décroissants n c

1500 - 2000 26 26 60
12 38 34
2000 - 2500 11 49 22
2500 – 3000 6 55 11
3000 - 3500 5 60 5
3500 - 4000

Total 60
Alors : Me = 2166.67 Dhs
II – LE MODE
II – 1 Définition :
On appelle le mode d’une variable statistique la valeur à laquelle correspond le plus grand
effectif ou la plus grande fréquence.
II – 2 – Détermination du mode:
La détermination du mode varie selon la nature da la variable statistique étudiée.
II – 2 – 1 – Cas d’une variable discrète:
La détermination du mode est ici facile et immédiate.
Ainsi dans le tableau statistique des effectifs ou des fréquences , le mode est la valeur ou la
modalité qui a le plus grand effectif ou la plus grande fréquence.
II – 2 – 1 – CAS D’UNE
VARIABLE DISCRÈTE
Exemple: Soit la série statistique suivante relative à la répartition du personnel d’une entreprise selon le nombre
d’enfants à leur charge .
Nombre d’enfants xi Effectif ni

1 20
2 35
3 23
4 12
5 7
La valeur 2 dont l’effectif est le plus
6 grand est le mode de la série considérée
3
( cette série n’a qu’un seul modeTotal
; c’est une série unimodale ) 100
Remarques
Une série statistique peut avoir deux ou plusieurs modes ; elle est dite
respectivement : série bimodale et série multimodale ou plurimodale.
Graphiquement, le mode correspond au bâton le plus grand.
II – 2 – 2 – CAS D’UNE
VARIABLE CONTINUE
Reprenons l’exemple précédent:
Salaire mensuel Effectif ni
en Dhs

1500 - 2000 26 Pour déterminer le mode, on définit d’abord la classe


2000 - 2500 12
2500 – 3000 11
modale dont l’effectif est le plus élevé.
3000 - 3500 6 Dans notre exemple, c’est la classe [ 1500 – 2000 [.
3500 - 4000 5

Total 60

Il existe 2 méthodes pour déterminer la valeur du mode: méthode graphique et méthode


algébrique.
A / DÉTERMINATION GRAPHIQUE DU MODE

Elle consiste à tracer l’histogramme, tout en se limitant à sa partie qui donne la


classe modale et les 2 classes adjacentes à celle-ci.
A / DÉTERMINATION
GRAPHIQUE DU MODE

i = intervalle de la classe
modale
Par deux diagonales, on joint les 2 sommets du rectangle modal aux points d’intersection respectifs des 2
hauteurs de ce rectangle avec les bases supérieures des 2 rectangles qui l’encadrent.
B / DÉTERMINATION
ALGÉBRIQUE DU MODE
Une fois on a défini la classe modale , on détermine le mode en appliquant la
formule démontré plus haut :

L1 : limite inférieure de la classe modale


d1 : différence entre l’effectif ou la fréquence de la classe modale et l’effectif ou la
fréquence de la classe précédente
d2 : différence entre l’effectif ou la fréquence de la classe modale et l’effectif ou la
fréquence de la classe suivante
i : l’amplitude de la classe modale
B / DÉTERMINATION
ALGÉBRIQUE DU MODE

Important :

Si la série classée présente des classes d’amplitudes inégales , il faut corriger les
effectifs ou les fréquences pour déterminer le mode algébriquement et graphiquement.
EXEMPLE:
Soit la série statistique suivante relative à la répartition de 500 employés d’une
entreprise selon leur salaire mensuel en Dhs:
Salaire mensuel ni ai ni corrigé
en Dhs

2000 – 3000 100 1000 = a0 100


3000 – 5000 300 2000 150
5000 – 7000 80 2000 40
7000 – 14000 20 7000 2.85

Total 500
- DÉTERMINATION
GRAPHIQUE
Les classes sont inégales donc on doit corriger les effectifs
La classe modale est : [ 3000 – 5000[
Détermination algébrique ( par calcul )
x
.

III – La Moyenne arithmétique


Définition:
On appelle moyenne arithmétique de la variable x ; notée x ( x barre ) ; le nombre
obtenu en divisant la somme de toutes les valeurs prises par cette variable par le
nombre total d’observations ( ou effectif total ).
III – 1 – Formule simple
Lorsque chaque valeur xi n’a été observée qu’une seule fois :
III – 2 – FORMULE
PONDÉRÉE
Elle s’applique aux cas où les valeurs de la variable ont été observées plusieurs fois (
se répètent plusieurs fois ) cela revient à pondérer ( c-à – d multiplier ) chaque valeur
de la variable par l’effectif qui lui correspond:
III – 2 – FORMULE
PONDÉRÉE
Exemple :
1 Kg de pomme coûte : 10 Dhs
1 kg d’orange coûte : 4 Dhs
1 Kg de bananes coûte : 14 Dhs

Gardons les mêmes prix ; mais pour des poids différents


2 Kg de Pomme
5 Kg d’Orange
3 Kg de bananes
III – 3 – MÉTHODE DE
CALCUL DE LA MOYENNE
ARITHMÉTIQUE
A / Cas d’une variable discrète

B / Cas d’une variable continue

n i désigne l’effectif et x i le centre de la classe i


x i s’obtient de la manière suivante :

L 1 désigne la limite inférieure de la classe


L 2 désigne la limite supérieure de la classe
B / CAS D’UNE VARIABLE
CONTINUE
Exemple :
Le tableau suivant donne la répartition de 80 entreprises d’une certaine région selon
le montant des investissements réalisés pendant une période donnée.
Tranches ni xi ni .xi
d’investissement en
1000 Dhs

200 – 300 10 250 2500


300 – 400 18 350 6300
400 – 500 30 450 13500
500 – 600 12 550 6600
600 – 700 6 650 3900
700 – 800 4 750 3000

80 35800
B / CAS D’UNE VARIABLE
CONTINUE

Soit 447500 Dhs.


CHAPITRE III : LES
CARACTERSITIQUES DE
DISPERSION
Les caractéristiques de tendance centrale ne sont pas toujours suffisantes pour caractériser
une série statistique car 2 séries statistiques ; peuvent avoir le même mode , la même
médiane et la même moyenne et cependant être distribuées différemment comme le
montre le cas suivant :

Soit les deux séries A et B représentant les nombres mensuels de pièces jugées
défectueuses par un détecteur de pièces mécaniques pendant 7 mois.
Série A : 78 – 79 – 80 – 80 – 80 – 81 – 82
Série B : 30 – 35 – 80 – 80 – 80 – 125 – 130
CHAPITRE III : LES
CARACTERSITIQUES DE
DISPERSION
On constate que ces deux séries ont la même médiane ( Me = 80 ) ; le même mode
( M0 = 80 ) et la même moyenne ( Moy = 80 ) .
Cependant elles ne sont pas comparables ; elles sont donc différentes par la
dispersion de leurs valeurs.
Dans la série A les valeurs sont resserrées ou concentrées autour de la valeur centrale
( 80 ) ; tandis que dans la série B les valeurs sont plus étalées ; plus dispersées par
rapport à la valeur centrale.
Ainsi pour donner une représentation plus signifiante du phénomène étudié, il est
important de mesurer la dispersion entre les différentes valeurs prises par une
variable statistique et leur valeur centrale.
I – L’ETENDUE OU RANGE
Définition
L’étendue d’une série statistique notée E est la différence entre la plus grande valeur et
la plus petite valeur de la variable statistique.
Exemple :
Soit la série : 6 – 10 – 13 – 20 – 26 – 32 – 48 – 50
E = 50 – 6 = 44
Reprenons l’exemple du chapitre II paragraphe : I – 2 – 2 – a
La répartition de 60 salariés suivant leur salaire : E = 4000 – 1500 = 2500
L’étendue ou domaine de variation est très facile à calculer ; elle contient 100 % des
observations.
II - LES QUANTILES
Définition
Les quantiles sont des paramètres qui nous renseignent sur la dispersion des valeurs
de la variable autour de la médiane.
A – Les Quartiles
Les quartiles sont des valeurs du caractère qui partagent la série statistique en 4
parties égales ; ils sont au nombre de 3 que l’on désigne par : Q1 ; Q2 ; Q3
Le premier quartile Q1 : est la valeur du caractère telle que 25% des observations lui
soient inférieurs et 75 % des observations lui soient supérieures.
A – LES QUARTILES

Le Deuxième quartile : Q2 correspond à la médiane ( 50 % < et 50 % > )


Le troisième quartile : Q3 est la valeur du caractère telle que 75 % des observations
lui soient inférieures et 25 % des observations lui soient supérieures.
l’Intervalle interquartile ou l’écart interquartile est la différence entre Q 3 et Q1.
on note : Iq = Q3 - Q1
cet intervalle contient 50 % des observations ; c’est un indicateur très important en
matière de dispersion.
A – 1 – DÉTERMINATION DES
QUANTILES PAR CALCUL
Comme la médiane, les quantiles se déterminent à partir des effectifs ou fréquences
cumulées
Exemple :
Soit la répartition du personnel d’une entreprise selon leur salaire mensuel
Modalités Effectif ni Effectif cumulé croissant
ni c

1500 - 2000 26 26
2000 - 2500 12 38
2500 – 3000 11 49
3000 - 3500 6 55
3500 - 4000 5 60
Total 60
CALCUL DE Q1 :
On suit trois étapes

Q 1 = 1788 .46 Dhs

Interprétation

- 25 % des salaires sont inférieurs à 1788.46 Dhs


- 75 % des salaires sont supérieurs à 1788.46 Dhs
CALCUL DE Q2( CORRESPOND À LA
MÉDIANE )

Q 2 = 2166.67 Dhs

Interprétation

- 50 % des salaires sont < à 2166.67 Dhs


- 50 % des salaires sont > à 2166.67 Dhs
CALCUL DE Q3

Q 3 = 2818.18 Dhs

Interprétation : 75 % des salaires sont < à 2818.18 Dhs


25 % des salaires sont > à 2818.18 Dhs
CALCUL DE Q3
* Intervalle interquartile
Iq = Q3 – Q1 = 2818.18 - 1788.46 = 1029.72 Dhs.

50 % des salaires ont un écart qui ne dépasse pas 1029.72 Dhs.


La comparaison de cette valeur à l’entendue donne

Cela veut dire que 41.18 % de l’étendue correspond à 50 % de la population c à d


50% des salaires sont compris entre Q1=1788.46 Dhs et Q3= 2818.18 Dhs.
B - AUTRES QUANTILES : LES DÉCILES ET
L’INTERVALLE INTERDÉCILE

B-1- Définition
Les déciles sont des valeurs qui partagent la série statistique en 10 parties égales ; ils
sont au nombre de 9 : D1 ; D2 ; D3 ; D4 ; D5 ; D6 : D7 ; D8 et D9 . les plus
signifiants sont le premier décile D1 et le neuvième décile D9 .
Le premier décile ou D1 est la valeur du caractère telle que 10 % des observations
lui soient inférieur et 90 % des observations lui soient supérieur.
Le neuvième décile ou D9 est la valeur du caractère telle que 90 % des observations
lui soient inférieur et 10 % des observations lui soient supérieur.
B-1- DÉFINITION
l’intervalle interdécile est la différence entre D9 et D1

I d = D9 – D1
De la même manière on définit les centiles qui partagent la série en 100 parties
égales et l’intervalle intercentile Ic = C 99 - C 1
B – 2 – DÉTERMINATION DES
DÉCILES
Reprenons l’exemple précèdent ( paragraphe A-1 )
Calcul de D1
B – 2 – DÉTERMINATION DES
DÉCILES
Calcul de D9 :

L’intervalle interdécile : I d = D9 - D1 = 3416.67 - 1615.38 = 1801.29 Dhs.


III – LA VARIANCE ET
L’ÉCART TYPE
1 - Définitions
A- la variance

La variance est la moyenne arithmétique des carrés des écarts des valeurs de la
variable à leur moyenne arithmétique ; on la désigne par V(x) ou ( lire sigma
au carré )

Elle a pour formule :


A- LA VARIANCE
B- L’ECART-TYPE
L’écart type est la racine carrée arithmétique positive de la variance.
nxix.x xx
i
i
2
i
2

2- CALCUL DE LA VARIANCE ET
L’ÉCART TYPE

La variance et l’écart type se calculent à partir de leurs formules respectives :


Soit la série représentant la répartition des salaires :
2- CALCUL DE LA VARIANCE
ET L’ÉCART TYPE
Par définition :
2- CALCUL DE LA VARIANCE
ET L’ÉCART TYPE
Par la formule développée

Signification : en moyenne les salaires s’écartent de 2.27 Kdh par rapport au salaire moyen qui
est de 12.06 Kdh.
Conclusion :
Le cœfficient de variation noté Cv ; il est défini comme le rapport de l’écart type et la moyenne ;
il sert à comparer la dispersion de deux séries statistiques dont les valeurs sont de grandeurs
différentes .
LE CŒFFICIENT DE
VARIATION
Il a pour formule

C’est un nombre sans dimension ; il est toujours exprimé en % .

Application de l’exemple précédent :


CHAPITRE IV : LES CARACTÉRISTIQUES DE
CONCENTRATON

L’étude de la concentration permet de caractériser la structure d’un grand nombre


d’entités économiques (revenus, salaires, chiffre d’affaires, superficies cultivables,
etc…) dont les modalités du caractère sont susceptibles d’être additionnées.
On parle ainsi de concentration chaque fois qu’on peut remarquer une disparité ou
inégalité de répartition entre les unités de la population considérée.
A) DÉTERMINATION GRAPHIQUE DE LA CONCENTRATION
1) COURBE DE CONCENTRATION OU COURBE DE LORENTZ :

Dans un carré, on porte :


_ Sur sa base qui sert d’axe des abscisses les fréquences cumulées croissantes
en %(‘fi%c↗ ).
_ Sur sa hauteur qui sert d’axe des ordonnées, les nixi cumulés croissants en%
(ou fréquences relatives cumulées croissantes) de la masse totale du caractère.
Les 2 axes sont gradués de 0 à 100 %.
Exemple : Soit la distribution suivante relative à la répartition de 80 salariés selon
leur salaire horaire en DHS.
Salaire Nombre xi fi en % fi en % nixi nixi % Nixi% Nixi c↗
horaire de C↗ c↗
en DHS salariés
ni
10 - 20 20 15 25 25 300 8,67 8,67 300
20 - 40 32 30 40 65 960 27,74 36,41 1260
40 - 80 16 60 20 85 960 27,75 64,16 2220
80 -100 8 90 10 95 720 20,81 84,97 2940
100-160 4 130 5 100 520 15,03 100,00 3450

Total 80 /// 100 En 3460 100,00 En


abscisse ordonnée
COURBE DE CONCENTRATION
INTERPRÉTATION DE LA
COURBE :
Le graphique ainsi obtenu est appelé courbe de concentration des salaires (ou courbe
de LORENTZ)
Ainsi de façon générale, plus la courbe se rapproche de la diagonale principale
OB(ou de la bissectrice OB), plus la concentration est faible, et plus elle s’éloigne de
cette diagonale et se rapproche des 2 côtés OA et AB ,plus la concentration est forte.
On dira enfin que la concentration est nulle si la courbe se confond avec la diagonale
principale. Pour toute situation intermédiaire, il est nécessaire de mesurer l’intensité
de la concentration par le coefficient de concentration ( ou indice de GINI).
2 ) L’INDICE DE
CONCENTRATION GINI :
L’indice de concentration de GINI est égal au rapport de l’aire de concentration à
l’aire du triangle OAB dans lequel s’inscrit la zone de concentration :

C’est un nombre sans dimension, toujours compris entre 0 ( concentration nulle) et 1


(concentration totale); il s’exprime en %. .
L’aire de concentration correspond à la différence entre l’aire du triangle OAB et
l’aire (S) délimitée par la courbe et les 2 côtés OA et AB.
L’aire du triangle OAB = base x hauteur = 100 X 100 = 5000
2 2
L’aire (S) est égale à la somme des aires du triangle et des différents trapèzes résultant de la
construction de la courbe.
Donc S = S1 + S2 + S3 +S4 + S5 .

S1 = ½ (25 X8,67) = 108,375

S2 + ½(8,67 + 36,41)(65 – 25) = 901,6

S3 = ½ (36,,41 + 64,16)(85 - 65) = 1005,7

S4 = ½ (64,16 + 84,97)(95 – 85) = 745,65

S5 = ½ (84,97 + 100)(100 – 95) = 462,425

S = S1 + …………….+ S5 = 3223,75

D’où IC = 5000 - 3223,75 = 0,35 soit 35%


5000

Interprétation :
B)DÉTERMINATION ALGÉBRIQUE DE LA CONCENTRATION

1) Détermination de la médiale
a)Définition
La médiale est une valeur particulière qui partage la somme des nixi en 2 parties
égales. En d’autres termes, elle divise la masse totale du caractère en 2 parties égales.
Sa détermination analytique est équivalente à celle de la médiane à la seule différence
qu’elle se calcule à partir des sommes des valeurs, c'est-à-dire à partir des cumuls de
nixi.
La détermination de la médiale ne présente un intérêt que si le cumul des valeurs nixi
a une signification.
b) Calcul de la médiale
En reprenant l’exemple précédent :
Le calcul de la médiale s’effectue en 3 étapes :
_ 1ère étape : rang de la médiale (ML) = ∑nixi 3460
——— = ——— = 1780
2 2

_ 2ème étape : La classe contenant la ML : [40 - 80[

_ 3ème étape : interpolation linéaire : ML = 40 + (40)(1730 - 1260) 59,58 DH


————— =
2220 - 1260
SIGNIFICATION :
La moitié de la masse des salaires horaires distribués est partagée par des salariés
dont le salaire horaire est inférieur à 59,58 DH et l’autre moitié de la masse des
salaires horaires distribués est partagée par des individus dont le salaire horaire est
supérieur à 59,58 DH.
2°) DÉTERMINATION DE LA
CONCENTRATION
La détermination de la concentration proprement dite se fait par le calcul de l’écart entre la
Mle et la Me, on le note ∆M=ML-Me
Cet écart est toujours positif vu que ML≥Me puisque le calcul de la ML est fait en fonction de
la masse des valeurs.
Une fois cet écart calculé, on le compare à l’étendue ( ou domaine de variation) de la série
étudiée. Trois situations possibles découlent de cette comparaison:
-si ∆M est grand par rapport à l’étendue, la concentration est forte, ce qui signifie que
l’inégalité est très élevée.
-si ∆M est petit par rapport à l’étendue, la concentration est faible, ce qui signifie que
l’inégalité n’est pas très grande.
-si ∆M est nul par rapport à l’étendue, la ML est égale à la Me ce qui signifie que l’égalité est
parfaite.
EXEMPLE:
A partir de l’exemple précédent, calculons ∆M.
Calculons la Me:
-Rang de la Me : ∑fi%=50
2

-Classe Me=[20-40[

-Me=20+[(40-20) (50-25)]=32,5
65-25

D’où l’écart : ∆M=Ml-Me


∆M=59,58-32,5=27,08 D’après cet indicateur, la concentration des salaires
horaires distribués est faible.
On le compare à l’étendue ( E ):E=160-10=150 On note toutefois que l’indice de GINI permet une
AM/E=27,08/150=0,18 soit 18% approche plus précise du phénomène

Vous aimerez peut-être aussi