Vous êtes sur la page 1sur 136

ROYAUME DU MAROC

OFPPT


Office de la Formation Professionnelle et de la Promotion du Travail
DIRECTION RECHERCHE ET INGENIERIE DE FORMATION

RESUME THEORIQUE
&
GUIDE DE TRAVAUX PRATIQUES

MODULE : STATISTIQUES

SECTEUR : TERTIAIRE
SPECIALITE : COMPTABILITE DES
ENTREPRISES
NIVEAU : TECHNICIEN

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Document labor par :


Mlle Nadia BENHADDOU BAKKIOUI

ISTA Taroudant

DR SMD

Rvision linguistique:
Validation :
-

OFPPT/DRIF

Rsum de Thorie et
Guide des travaux pratiques

OFPPT/DRIF

Statistiques

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

SOMMAIRE
Prsentation du module

RESUME DE THEORIE

10

Chapitre I- Les statistiques descriptives :

11

Terminologie :

11

IITableaux statistiques :
A- Cas dune seule variable
B- Cas de deux variables

12
12
13

IIIReprsentations graphiques :
A- Variable qualitative
B- Variable quantitative
1) Variable discrte
2) Variable classe

14
14
16
16
17

IVCaractristiques de tendance centrale et de position :


A- Mode
B- Mdiane
C- Moyenne arithmtique
D- Moyenne gomtrique
E- Moyenne harmonique
F- Moyenne quadratique
G- Quantiles

19
19
20
21
22
22
22
23

VCaractristiques de dispersion :
A- tendue
B- Intervalle inter-quartile
C- Variance et cart-type
D- Coefficient de variation

23
23
23
24
24

VILa concentration :
A- Valeurs globales
B- Mdiale
C- Courbe de concentration (ou de LORENZ)
D- Indice de GINI

25
25
25
26
26

VII- Les indices :


A- Indices lmentaires
B- Indices de LASPEYRES et de PAASCHE
1) Indice de Laspeyres des prix
2) Indice de Laspeyres des quantits
3) Indice de Paasche des prix
4) Indice de Paasche des quantits

27
27
28
29
29
29
29

I-

OFPPT/DRIF

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

VIII- Rgression et corrlation :


A- Ajustement dun nuage de points une fonction une fonction
mathmatique
B- Mesure de lintensit de la relation linaire entre deux variables
1) Covariance
2) Coefficient de corrlation linaire
3) Droites de rgression

30
30

IX-

33
33
34
35
35
35
35

Sries chronologiques :
A- Dcomposition des chroniques
B- La dtermination du trend
C- Analyse de la composante alatoire
D- Dsaisonnalisation
E- Srie ajuste
F- Prvisions court terme

31
31
32
32

Chapitre II. Ralisation des enqutes


I.
Dtermination optimale dun chantillon
II.
Elaboration du questionnaire

37
37
38

Chapitre III. Ralisation des sondages


IEstimateur dune moyenne ou dune proportion
IIVariance de ces estimateurs
IIIEstimation par intervalle de confiance

40
40
43
44

Contrle continu

46

GUIDE DES TRAVAUX PRATIQUES


TP1 : reprsentation graphique, paramtres de tendance centrale, de dispersion.
TP2 : reprsentation graphique
TP3 : paramtres de tendance centrale
TP4 : reprsentation graphique, la corrlation
TP5 : reprsentation graphique, paramtres de tendance centrale et de dispersion
TP6 : ajustement linaire, prvisions et corrlation
TP7 : QCM
Evaluation de fin de module
Liste bibliographique

47
48
49
50
52
53
55
56
76
77

OFPPT/DRIF

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Module : Statistiques
Dure : 50 H
40% : Thorique
60% : Pratique
OBJECTIF OPERATIONNEL DE PREMIER NIVEAU
DE COMPORTEMENT

COMPORTEMENT ATTENDU
Pour dmontrer sa comptence, le stagiaire doit
appliquer les mthodes statistiques.
Selon les conditions, les critres et les prcisions qui suivent :
CONDITIONS DEVALUATION

A partir des tudes de cas, mise en situation, consignes du formateur, toute


documentation ncessaire ;
A laide de : calculatrice, tableur et logiciel de statistiques.

CRITERES GENERAUX DE PERFORMANCE


o Respect de la dmarche de calcul
o Respect des principes de gestion de temps
o Respect des pratiques courantes et des rgles tablies par lentreprise
o Exactitude des calculs
o Vrification approprie du travail.

OFPPT/DRIF

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

OBJECTIF OPERATIONNEL DE PREMIER NIVEAU


DE COMPORTEMENT
CRITERES PARTICULIERS DE
PRECISION SUR LE
PERFORMANCE
COMPORTEMENT ATTENDU
o
Qualification dune variable
A. Comprendre les variables statistiques
qualitative
o
Qualification dune variable
quantitative discrte
o
Qualification dune variable
quantitative continue
B. Raliser des reprsentations
o
Reprsentation correcte des
graphiques
variables quantitatives discrtes
o
Reprsentation correcte des
variables quantitatives continues
C. Calculer les caractristiques des
distributions

D. Dterminer les liens entre deux


variables

o
OFPPT/DRIF

Calcul et interprtation juste des


paramtres de tendance centrale
Mode
Mdiane
Quartiles
Moyennes
Calcul et interprtation correcte des
paramtres de dispersion
Etendue
Ecart absolu moyen et cart
quantile
Variance, cart-type et coefficient
de variation
Traitement du cas de deux
caractres quantitatifs (coefficient de
corrlation linaire, ajustement par la
droite des moindres carrs, rapport de
corrlation)
Traitement du cas dun caractre
quantitatif et dun caractre qualitatif
(rapport de corrlation)
Traitement du cas de deux
caractres qualitatifs
7

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

E. Raliser des sondages


o

F. Raliser des enqutes

o
o
o
o
o
o
o

OFPPT/DRIF

Ralisation de sondage simple


avec :
estimateur dune moyenne ou
dune proportion
variance de ces estimateurs
estimateurs de ces variances
algorithmes de tirages

Dtermination optimale de
lchantillon
Elaboration du questionnaire
Recueil des donnes
Dpouillement, codage et saisie
Validation des donnes
Traitement statistique
Analyse des rsultats

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

OBJECTIFS OPERATIONNELS DE SECOND NIVEAU

Avant dapprendre comprendre les variables statistiques, le stagiaire doit :


1- Comprendre la notion des statistique
2- Comprendre les objectifs des statistiques
Avant dapprendre raliser les reprsentations graphiques, le stagiaire doit :
3- Distinguer entre les variables qualitatives et les variables quantitatives
4- Distinguer entre les variables quantitatives discrtes et les variables quantitatives continues
5- Prsenter les sries statistiques dans des tableaux
Avant dapprendre calculer les caractristiques des distributions, le stagiaire doit :
6- Raliser des reprsentations graphiques
7- Interprter ces reprsentations graphiques
Avant dapprendre dterminer les liens entre deux variables, le stagiaire doit :
8- reprsentez les distributions deux variables dans des tableaux
9- reprsentez graphiquement ces distributions
10- calculer les caractristiques des distributions
11- Interprter ces caractristiques des distributions
Avant dapprendre raliser des sondages, le stagiaire doit :
12- dfinir le sondage
13- comprendre les objectifs de la ralisation des sondages
14- calculer les caractristiques des distributions
Avant dapprendre raliser des enqutes, le stagiaire doit :
15- dfinir lenqute
16- comprendre les objectifs de la ralisation des enqutes

OFPPT/DRIF

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

PRESENTATION DU MODULE
Ce module sadresse en priorit aux techniciens comptables des
entreprises et aux techniciens spcialiss en gestion des entreprises.
Il rpond trois objectifs fondamentaux :
1) Lacquisition des connaissances : chaque chapitre comprend ainsi une
partie Cours dtaille : les formules mathmatiques fondamentales, mais
aussi les points dlicats du cours sont abords.
2) Lutilisation des connaissances : chaque chapitre comprend des
applications nombreuses et varies qui permettent aux stagiaires dutiliser
leurs connaissances.
La plupart de ces applications sont accompagnes dindications de
rsultats ou lments de rponse.
3) Ladaptation des connaissances : des Travaux Pratiques proposs, devront
permettre aux stagiaires de mettre en application leurs qualits de
raisonnement et dadaptation face des problmes plus longs o de
nombreuses connaissances sont exiges.
La masse horaire affecte ce module est de 50 heures dont 30
heures consacres aux travaux pratiques.

OFPPT/DRIF

10

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Module : Statistiques Descriptives


RESUME THEORIQUE

OFPPT/DRIF

11

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Chapitre I- Les statistiques descriptives :


I-

Terminologie :

1. Statistique :
La statistique est une mthode scientifique dont lobjet est de recueillir, dorganiser, de
rsumer et danalyser les donnes dune enqute, dune tude o dune exprience, aussi bien
que de tirer les conclusions logiques et de prendre les dcisions qui simposent partir des
analyses effectues.
2. Population :
Ensemble d'individus dfinis par une proprit commune donne.
Exp : si lon veut tudier la dure de vie des ampoules lectriques fabriques par une
compagnie, la population considre est lensemble de toutes les ampoules fabriques par
cette compagnie.
3. Echantillon :
Sous-ensemble de la population.
Exp : pour tablir la dure de vie des ampoules lectriques produites par une machine, on peut
prlever au hasard un certain nombre dampoules - un chantillon- parmi toutes les celles
produites par cette machine.
4. Individu ou unit statistique :
Chaque lment de la population ou de lchantillon.
Exp : dans lexemple prcdant, chaque ampoule constitue un individu ou une unit
statistique.
5. La taille :
Reprsente le nombre dindividus dun chantillon ou dune population. Elle est symbolise
par n dans le cas dun chantillon et par N dans le cas dune population.
6. Le caractre :
Cest laspect particulier que lon dsire tudier.
Exp : concernant un groupe de personnes, on peut sintresser leur age, leur sexe leur
taille
7. Les modalits :
Les diffrentes manires dtre que peut prsenter un caractre.
Exp 1 : le sexe est un caractere qui presente deux modalits : feminin ou masculin
Exp 2 : quant au nombre denfants par famille, les modalits de ce caractere peuvent etre 0,1
2,3,20.
8. Caractre qualitatif :
Ses modalits ne sexpriment pas par un nombre
Exp : la religion, le sexe, lopinion
9. Caractre quantitatif :
Ses modalits sont numriques.
Exp : lage, la taille, le poids

OFPPT/DRIF

12

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

10. Caractre quantitatif discret


Lensemble des valeurs que peut prendre le caractre est fini ou dnombrable. Le plus
souvent, ces valeurs sont entires.
Exp :le nombre denfant dans une famille, le nombre de tlviseurs par foyer et la pointure
des souliers.
11. Caractre quantitatif continu :
Le caractre peut prendre thoriquement nimporte quelle valeur dans un intervalle donn de
nombres rels.
Exp : la taille dun individu, le poids
12. Srie statistique :
Lensemble des diffrentes donnes associes un certain nombre dindividus.
Exp : la srie suivante rsulte dune courte enqute auprs de quelques personnes pour
connatre leur age :
18 21 19 19 17 22 27 18 18 17 20 20 23

II-

Tableaux statistiques :

A- Cas dune seule variable :


Le tableau brut se prsente sous la forme suivante:

Le nombre d'individus observ tant en gnral important, le tableau prcdant ne permet pas
d'analyser l'information obtenue. Il est donc ncessaire de crer un tableau plus synthtique o
les observations identiques (possdant la mme modalit) ont t regroupes.

Pour une variable qualitative, les modalits ne sont pas mesurables.


Pour une variable quantitative, les modalits sont mesurables. Ce sont
des valeurs numriques ponctuelles lorsque la variable est discrte
des intervalles lorsque la variable est continue ou lorsque la variable est discrte et
qu'elle comporte beaucoup de modalits.
OFPPT/DRIF

13

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
Nous tudions une population de 1000 entreprises selon le caractre modalit forme
juridique .
Les modalits retenues : S.A (Socit Anonyme), SARL (Socit A Responsabilit Limite), EI
(Entreprise Individuelle), SNC ( Socit en Nom Collectif).
Leurs effectifs respectifs : 200, 400, 340, 60.
T.A.F :
Prsentez cette srie dans un tableau.

B- Cas de deux variables :


Le tableau brut se prsente sous la forme suivante:

On dsire crer un tableau appel tableau de contingence donnant le nombre d'individus


possdant simultanment la modalit i de variable1 et la modalit j de variable2 qui se
prsentera sous la forme suivante:

OFPPT/DRIF

14

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application:
Dans une entreprise, une enqute statistique a t faite sur 300 employs, et portant sur deux
caractres, lage et la rmunration. Les rsultats de lenqute sont prsents dans les deux
tableaux suivants :
Age
n
150
20 25
100
25 30
200
30 35
50
35 40
Rmunration en dhs
n
200
Moins de 1500
150
1500 2000
100
2000 2500
50
plus de 2500
TAF :
Prsentez dans un mme tableau la distribution de ces deux caractres.

III-

Reprsentations graphiques :

Lorsqu'on observe un caractre sur des individus, on aboutit un tableau de chiffres peu
parlant. L'objectif est de donner une reprsentation graphique de ce tableau qui permette d'un
seul coup d'il d'avoir une ide de la manire dont se rpartissent les individus.

A- Variable qualitative :
A chaque modalit i est associ un effectif ni.
La seule reprsentation qui nous intresse est celle des effectifs ni (ou des frquences ni/n).
Suivant la variable observe, de nombreuses reprsentations plus ou moins informatives
peuvent tre utilises. Cependant les 2 plus classiques sont:

Les tuyaux d'orgue (ou diagramme en barre ou diagramme bandes)

- les modalits de la variable sont places sur une droite horizontale (attention: ne pas
orienter cette droite car les modalits ne sont pas mesurables et il n'y a donc pas de
relation d'ordre entre elles).
- les effectifs (ou les frquences) sont placs sur un axe vertical. La hauteur du tuyau est
proportionnelle l'effectif.

OFPPT/DRIF

15

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

les diagrammes secteurs (ou camemberts)


- L'effectif total est reprsent par un disque.
- Chaque modalit est reprsente par un secteur circulaire dont la surface (pratiquement :
l'angle au centre) est proportionnelle l'effectif correspondant.

Application :
La rpartition des candidats convoqus pour participer au Test dAdmissibilit la Formation
en Management (TAFEM 1998) pour laccession LEcole Nationale de Commerce et de
Gestion dAgadir , selon la srie du baccalaurat se prsente comme suit :
Srie du Bac xi
Nombre de candidats ni
Sciences conomiques
250
Sciences mathmatiques
200
Sciences exprimentales
400
T.G.A
50
T.G.C
100
Total
1000
TAF: reprsentez cette distribution en Tuyaux dorgues et Diagramme circulaire.

OFPPT/DRIF

16

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

B- Variable quantitative :
Avant toute tentative de reprsentation, il y a lieu de distinguer entre variable discrte et
variable classe (regroupements en classes).
Deux types de graphiques sont intressants de reprsenter:
a) les diagrammes diffrentiels qui mettent en vidence les diffrences d'effectifs (ou de
frquences) entre les diffrentes modalits ou classes.
b) les diagrammes cumulatifs qui permettent de rpondre aux questions du style "combien
d'individus ont pris une valeur infrieure (ou suprieure) tant?".
1) Variable discrte

Diagramme diffrentiel : le diagramme en btons


Les valeurs discrtes xi prises par les variables sont places sur l'axe des
abscisses, et les effectifs (ou les frquences) sur l'axe des ordonnes. La
hauteur du bton est proportionnelle l'effectif.

Diagrammes cumulatifs : ils permettent de visualiser l'volution des effectifs


(frquences) cumuls croissants ou dcroissants.

Remarque: les deux courbes sont symtriques par rapport un axe horizontal d'ordonne n/2
pour les effectifs, pour les frquences.
On utilise l'effectif (frquence) cumul croissant pour rpondre aux questions du style :
Quel est le nombre (%) d'individus dont la valeur du caractre est infrieure ou gale x ?
On utilise l'effectif (frquence) cumul dcroissant pour rpondre aux questions du style :
Quel est le nombre (%) d'individus dont la valeur du caractre est strictement suprieure x ?
OFPPT/DRIF

17

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Se souvenir:
(au plus x) quivalent ( < x) donc utiliser N(x) ou F(x)
(plus que x) quivalent ( > x) donc utiliser N '(x) ou F '(x)
Exemple:

- (au plus 6) quivalent ( < 6) donc on pourra lire la frquence cumule croissante en 6, c-d. F(6) = 0,3
- (plus de 6) quivalent ( > 6) donc on pourra lire la frquence cumule dcroissante en 6,
c..d. F '(6) = 0,7
- (moins de 6) quivalent (< 6) quivalent ( < 6- ) o est une trs faible valeur
positive, donc on pourra lire la frquence cumule croissante en 6- , c..d. F(6- ) = 0,2
- (au moins 6) quivalent ( > 6) quivalent ( > 6- ) o est une trs faible valeur
positive, donc on pourra lire la frquence cumule dcroissante en 6- , c..d. F '(6- ) = 0,8
Application :
Reprsentez graphiquement la distribution des 50 tudiants en fonction du nombre de personnes
par mnage suivante :
Nombre de personnes par mnage xi
Nombre dtudiants ni
5
3
15
4
15
6
10
7
5
8
Total
50

2) Variable classe

Diagramme diffrentiel : l'histogramme

C'est un ensemble de rectangles contigus, chaque rectangle associ chaque classe ayant une
surface proportionnelle l'effectif (frquence) de cette classe.
Attention: Avant toute construction d'histogramme, il y a lieu de regarder si les classes sont
d'amplitudes gales ou ingales.
OFPPT/DRIF

18

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Le cas des classes d'amplitudes gales ne pose aucune difficult car il suffit de reporter en
ordonne l'effectif (la frquence).
Dans le cas d'amplitudes ingales on reporte en ordonne la densit di (effectif divis par
l'amplitude de la classe)

Diagrammes cumulatifs

L'utilisation des courbes est identique au cas discret.


Exemple:

OFPPT/DRIF

19

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
Reprsentez graphiquement la distribution de 50 tudiants en fonction de leur taille suivante :
Taille en cm xi
Nombre dtudiants
16
150-160
6
160-165
12
165-170
14
170-175
2
175-180
Total
50

IV-

Caractristiques de tendance centrale et de position :

Les caractristiques de tendance centrale essayent de donner la valeur la plus


reprsentative d'un ensemble de valeurs numriques.

A- Mode :
C'est la valeur observe d'effectif maximum.
Variable discrte: classer les donnes par ordre croissant. Celle d'effectif maximum donne le
mode.
Il est fortement conseill d'utiliser le diagramme en btons pour dterminer le mode. En effet,
deux valeurs conscutives xi , xi+1 peuvent avoir le mme effectif maximum; on parlera
d'intervalle modal [xi , xi+1]. Il peut aussi y avoir un mlange de deux populations qui
conduit un diagramme en btons o apparaissent deux bosses; on considrera deux modes.
Il est dconseill, sauf raison explicite, d'envisager plus de deux modes.
Variable classe: la classe modale correspond la classe ayant l'effectif maximum. Il est
fortement conseill d'utiliser l'histogramme pour dterminer le mode. Comme pour le cas
discret, on peut avoir deux classes modales. Toutes les valeurs de la classe pouvant priori se
raliser, on ne se contentera pas de dterminer la classe modale. Une des valeurs de cette
classe sera le mode. Certains auteurs prconisent par simplicit de prendre le centre de la
classe modale. Il est prfrable cependant de tenir compte des classes adjacentes de la manire
suivante:

OFPPT/DRIF

20

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
Dterminez la valeur modale de la distribution suivante, de 50 tudiants selon leur taille :
Taille en cm : xi
Nombre dtudiants : ni
150-160
15
160-170
6
170-175
10
175-180
16
185-200
3
Total
50
Elments de rponse :
Mo = 173.77 cm

B- Mdiane :
Les valeurs tant ranges par ordre croissant, c'est la valeur de la variable qui spare
les observations en deux groupes d'effectifs gaux.
Variable discrte: la dtermination peut s'obtenir partir du tableau statistique en
recherchant la valeur de la variable correspondant une fonction cumule gale n/2 (effectif
cumul) ou (frquence cumule). Il est encore plus facile de lire sur les graphiques
cumulatifs les abscisses des points d'ordonne n/2 (effectif cumul) ou (frquence
cumule). Si tout un intervalle a pour image n/2 ( pour la frquence), on parlera d'intervalle
mdian (on peut prendre le milieu de l'intervalle comme mdiane)

Application :
Soit la srie statistique suivante :
19 17 20 18 17 17 20 19 15 16 20 23 22 14 15 24
TAF : Calculez la mdiane de cette srie
Elments de rponse :
Me=18.5

Variable classe: l'abscisse du point d'ordonne n/2 ( pour la frquence)se situe en gnral
l'intrieur d'une classe. Pour obtenir une valeur plus prcise de la mdiane, on procde une
interpolation linaire. La valeur de la mdiane peut tre lue sur le graphique ou calcule
analytiquement.

OFPPT/DRIF

21

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

d'o la valeur de la mdiane.


De manire gnrale, si a et b sont les bornes de la classe contenant la mdiane, F(a) et F(b)
les valeurs de la frquence cumule croissante en a et b, alors

Application :
Dterminez la valeur mdiane de la distribution des tailles suivantes :
Taille en cm xi
Nombre dtudiants ni
N
150-160
15
15
160-165
5
20
165-170
10
30
170-175
18
48
175-180
2
50
Total
50
#
Elments de rponse : Me = 167.5

N
50
35
30
20
2
#

C- Moyenne arithmtique :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable
classe,
La moyenne arithmtique est un paramtre de tendance centrale plus utilis que les autres de
par ses proprits algbriques:
a) Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes
respectives
moyenne globale = moyenne des moyennes

b) La moyenne arithmtique conserve les changements d'chelle et d'origine

OFPPT/DRIF

22

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
Dterminez la taille moyenne des 50 tudiants dont la distribution par taille se prsente comme
suit :
Taille en cm xi
Nombre dtudiants
150-160
16
160-165
6
165-170
12
170-175
14
175-180
2
Total
50
Elments de rponse :
x = 168.3 cm

D- Moyenne gomtrique :
Si xi sont les observations d'une variable quantitative, la moyenne gomtrique est gale
Ce type de moyenne est surtout utilis pour calculer des pourcentages moyens.
r tant un taux d'accroissement, 1+r est appel coefficient multiplicateur; et le coefficient
multiplicateur moyen est alors gal la moyenne gomtrique des coefficients
multiplicateurs.

E- Moyenne harmonique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale

Il n'est pas vident d'utiliser ce type de moyenne.


Elle intervient lorsqu'on demande une moyenne de valeurs se prsentant sous forme de
quotient de deux variables x/y (km/h, km/litre,...). Attention, il faut cependant bien
dcortiquer le problme car il peut aussi s'agir d'une moyenne arithmtique.
Application :
Un cycliste effectue une travers de 50 kms. Pendant les 20 premiers kms il roulait avec une
vitesse constance de km/h, les 15 kms suivants une vitesse constante de 30 km/h. Du point
kilomtrique 35 au 55 la vitesse de notre cycliste nest que de 10 km/h et au-del du point
kilomtrique sa vitesse nest que de 5 km/h.
TAF :
Quelle est la vitesse de ce cycliste sur lensemble du parcours ?
Elments de rponse :
H = 16.67

F- Moyenne quadratique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale

OFPPT/DRIF

23

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

G- Quantiles :
Ce sont des caractristiques de position.
Il y a 1 mdiane Me qui spare les observations en 2 groupes d'effectifs gaux
3 quartiles Q1, Q2, Q3 qui sparent les observations en 4 groupes d'effectifs gaux
9 dciles D1, D2, ..., D9 qui sparent les observations en 10 groupes d'effectifs gaux
99 centiles C1, C2, ..., C99 qui sparent les observations en 100 groupes d'effectifs gaux
La dtermination de ces caractristiques est identique celle de la mdiane.
Les quartiles sont obtenus lorsqu'on a cumul 25, 50, 75% de la population
Les dciles sont obtenus lorsqu'on a cumul 10, 20,...., 90% de la population
Les centiles sont obtenus lorsqu'on a cumul 1, 2,...., 99% de la population
Remarque: la notion de dciles et de centiles n'a de sens que s'il y a beaucoup d'observations
et donc essentiellement pour une variable classe.
Application :
Soit la population de 80 salaris classs daprs le niveau de leur salaire journalier.
Classes en dhs
ni
ni cumuls
5
5
90 100
1
14
9
100 110
2
30
16
110 120
3
55
25
120 130
4
68
13
130 140
5
75
7
140 150
6
78
3
150 160
7
80
2
160 170
8
Total
80
TAF : calculez la mdiane et les deux quartiles
Elments de rponse :
Me = 124
Q1= 110+ (10x6)/16 = 113.7
Q3= 130+(10x5)/13 = 133.8

V-

Caractristiques de dispersion :

Comme leur nom l'indique, ces caractristiques essayent de synthtiser par une seule valeur
numrique la dispersion de toutes les valeurs observes.

A- tendue :
C'est la diffrence entre la plus grande et la plus petite observation
Application :
Quelle est ltendue de la srie statistique suivante :
10 390 395 405 410 1000
Elments de rponse :
Etendue = 990

B- Intervalle inter-quartile :
C'est la diffrence entre le troisime et le premier quartile
Application :
Reprenez les donnes de lapplication sur les quartiles et calculez lintervalle inter-quartile.
Elments de rponse :
Q3-Q1=20

OFPPT/DRIF

24

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

C- Variance et cart-type :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable
classe, la variance

On utilise plus couramment l'cart type qui est la racine carre de la variance et qui a
l'avantage d'tre un nombre de mme dimension que les donnes (contrairement la variance
qui en est le carr)
La variance est un paramtre de dispersion plus utilis que les autres de par ses proprits
algbriques:

D- Coefficient de variation :

C'est un coefficient qui permet de relativiser l'cart type en fonction de la taille des valeurs. Il
permet ainsi de comparer la dispersion de sries de mesures exprimes dans des units
diffrentes
Applications :
App.1- Les sries suivantes reprsentent la mesure dun caractre auprs des individus dune
population :
a. 6 1 8 10 5 4 11 3 2 9 7 12 13
b. 19 17 7 1 4 24 15 22 10 13
c. 15 12 17 15 20 15 20 15 15 9 7
d. 21 25 34 10 20 27 14 20 34
Dans chacun de ces cas calculez : la moyenne, la mdiane, le mode,la variance, lcart type et le
coefficient de variation.
Elments de rponse :
a. x=7, Me=7, pas de mode, =14, =3.74, V=53.4%
b. x=13.2, Me=14, pas de mode, =52.76, =7.26, V=55%
c. x=14.5, Me=15, Mo=15, =14.61, =3.82, V=26.3%
d. x=22.8, Me=21, deux modes :20 et 34, =59.28, =7.70, V=33.8%

OFPPT/DRIF

25

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

App.2- La distribution suivante reprsente la rpartition de la longueur de pinces dcrevisse


provenant dune rivire :
Limites
ni
5
1.02---1.23
7
1.24---1.45
4
1.46---1.67
1
1.68---1.89
4
1.90---2.11
6
2.12---2.33
3
2.34---2.55
1
2.56---2.77
TAF : calculez : la moyenne, la mdiane, le mode,la variance, lcart type et le coefficient de
variation.
Elments de rponse :
x=1.757, Mo=1.345 (le centre de la classe modale), Me=1.648, =0.238, =0.488, V=27.8%

VI-

La concentration :

L'objectif est de mesurer les ingalits dans la rpartition d'une variable l'intrieur d'une
population. Cette notion n'a d'intrt que dans la mesure o les valeurs globales suivantes ont
une signification concrte

A- Valeurs globales :
xi reprsentent les valeurs ponctuelles ou les centres des classes, ni les effectifs
correspondants.
Les valeurs globales de la srie (xi , ni) sont les quantits gi = ni xi

B- Mdiale :
La mdiale de la srie (xi , ni) est la mdiane de la srie (xi , gi)
Application :
Limportance quantitative des portefeuilles de titres dposs dans une socit de portefeuille
Maroc Invest en Kdh en 1996.
Importance du portefeuille en kdh
f%
f cumul
f%
fcumul
2
2
41
41
Moins de 10.000
17
15
78
37
10.000 50.000
28
11
88
10
50.000 100.000
41
13
94
6
100.000 200.000
60
19
98
4
200.000 500.000
100
40
100
2
500.000 plus
Total
100
100
f reprsentent les pourcentages du nombre total des portefeuilles.
f reprsentent les pourcentages de la valeur totale des portefeuilles.
TAF : calculez la mdiane et la mdiale de cette distribution
Elments de rponse :
Me = 19730, Ml= 342105 kdh

OFPPT/DRIF

26

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

C- Courbe de concentration (ou de LORENZ)


C'est la courbe obtenue en reprsentant

L'allure de la courbe permet d'avoir une ide de la


concentration

D- Indice de GINI

Proprits:

Exercice synthtique : (voir TP N1)

OFPPT/DRIF

27

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

VII- Les indices :


Permettent de mesurer l'volution d'un phnomne au cours du temps

A- Indices lmentaires :
L'indice d'volution d'une variable lmentaire y entre la date t0, dite date de rfrence ou
date de base, et la date t, dite date courante est

L'indice base 100, c..d. exprim en pourcentage est


Remarque: Il est toujours prfrable d'effectuer les calculs avec i et de donner le rsultat en
base 100 la fin des calculs.
On utilise essentiellement l'indice des prix (P), l'indice des quantits ou volumes (Q), et
l'indice des valeurs ou dpenses (V = P Q)
Proprits:
- identit
- rversibilit
- circularit
- L'indice est troitement li au taux de croissance

i = r +1 est aussi appel coefficient multiplicateur par les conomistes

OFPPT/DRIF

28

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Applications :
App.1- Le prix de la tomate au Maroc a t de 1.5 dhs en moyenne en 1980 et de 2.3 dhs en 1995.
TAF : calculez lindice lmentaire du prix de la tomate en 1995, base 100 en 1980 et interprtezle.
Elments de rponse :
I95/80= G95 =(2.3/1.5) x 100 = 153.33
G80
Le prix de la tomate au Maroc a augment de 53.33% entre 1980 et 1995
App.2- On savait que le prix du sucre dans un pays X a augment de 2.5% entre 1960 et 1975 et
de 7.5% entre 1960 et 1995.
TAF : dterminez lindice lmentaire du prix du sucre en 1995 base 100 en 1975, pour le pays
en question.
Elments de rponse :
I95/75= I95/75 = 107.5x100 104.88
I75/60 102.5
Exercice de synthse :
Les donnes concernant lvolution des prix de plusieurs articles entre les priodes 1995 et 1985,
ainsi que leur poids sont groups dans le tableau suivant :
P85
Prix
P95
i
Articles
0.15
40
36
A
0.10
15
12
B
0.25
45
40
C
0.05
13
15
D
0.15
50
42
E
0.10
8
5
F
0.05
40
30
G
0.15
10
8
H
TAF: calculez les indices lmentaires des prix des diffrents articles, puis dterminez lindice
gnral des prix.
Elments de rponse :
I95/85 ( PA) = 40/36 x 100 = 111.11
I95/85 ( PB) = 15/12 x 100 = 125
I95/85 ( PC) = 45/40 x 100 = 112.5
I95/85 ( PD) = 13/15 x 100 = 86.67
I95/85 ( PE) = 50/42 x 100 = 119.05
I95/85 ( PF) = 8/5 x 100 = 160
I95/85 ( PG) = 40/30 x 100 = 133.33
I95/85 ( PH) = 10/8 x 100 = 125
- Lindice des moyennes: I95/85 = P95 = 31.2/26.85 x 100 = 116.2
P85
- La moyenne des indices : I95/85 (P) = i I95/85i =120.9

B- Indices de LASPEYRES et de PAASCHE


Ce sont des indices synthtiques qui sont des rsums numriques des indices lmentaires
lorsqu'on cherche mesurer l'volution d'un ensemble de plusieurs produits.
coefficient de pondration ou budgtaire du produit j par rapport la date t :
OFPPT/DRIF

29

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

a) Indice de Laspeyres des prix

b) Indice de Laspeyres des quantits

c) Indice de Paasche des prix

d) Indice de Paasche des quantits

OFPPT/DRIF

30

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
Les donnes concernant lvolution des prix et des quantits de plusieurs articles entre les
priodes 1995 et 1985 :
P85
P95
Q85
Q95
Prix
Articles
7
6
40
36
A
20
20
15
12
B
11
13
45
40
C
15
15
13
15
D
18
9
50
42
E
25
25
8
5
F
9
10
40
30
G
30
30
10
8
H
TAF : calculez les diffrents indices synthtiques des prix, des quantits et des valeurs.
Elments de rponse :
- Indice de Laspeyrs des prix :
L95/85 (P) = 125
- Indice de Paasche des prix :
P (P) = 119
- Indice de Laspeyrs des quantits:
L95/85 (Q) = 119
- Indice de Paasche des quantits :
P (P) = 134
- indice des valeurs (indice des dpenses totales) :
D 95/85 = P95 Q95 = 3030/2136 x 100 =142
P85 Q85

VIII- Rgression et corrlation :


Lorsqu'on observe deux variables quantitatives sur les mmes individus, on peut s'intresser
une liaison ventuelle entre ces deux variables.
La rgression fournit une expression de cette liaison sous la forme d'une fonction
mathmatique.
La corrlation renseigne sur l'intensit de cette liaison.

A- Ajustement dun nuage de points une fonction mathmatique :


a) Ajustement linaire par la mthode des moindres carrs

Lorsque le nuage de points (xi , yi) est peu prs rectiligne, on peut envisager d'exprimer la
liaison entre x et y sous forme de fonction affine y = ax + b

OFPPT/DRIF

31

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

b) Ajustement une fonction exponentielle

Pour ajuster un nuage de points une courbe exponentielle


, il suffit de faire le
changement de variable Y = ln y , X = x , A = ln a , B = ln b , pour obtenir l'quation Y = AX
+ B, et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les points
(Xi , Yi).
c) Ajustement une fonction puissance

Pour ajuster un nuage de points une courbe puissance


, il suffit de faire le
changement de variable Y = ln y , X = ln x , A = a , B = ln b , pour obtenir l'quation Y = AX
+ B , et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les
points (Xi , Yi).

B- Mesure de lintensit de la relation linaire entre deux variables :


1) Covariance

x et y varient dans le mme sens


x et y varient en sens contraire

OFPPT/DRIF

32

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

2) Coefficient de corrlation linaire

relation fonctionnelle linaire


indpendance linaire
dpendance linaire d'autant plus forte que

est grand

Attention:
Une forte causalit entre x et y implique une forte relation entre x et y qui n'est
pas forcment linaire; on n'a donc pas obligatoirement une forte corrlation
linaire.
Une forte corrlation linaire n'implique pas forcment une forte causalit.
3) Droites de rgression

Dy/x : y = ax + b avec

Dx/y : x = a'y + b' avec

La position des deux droites de rgression l'une par rapport l'autre donne un renseignement
sur l'intensit de la relation linaire:
* droites de rgression confondues

relation fonctionnelle linaire

* droites de rgression perpendiculaires dont une de pente nulle


indpendance linaire
* Plus les droites sont proches, plus la relation linaire est importante
Relations intressantes:
r = aa'

OFPPT/DRIF

33

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
Les sries statistiques simples de deux variables continues X et Y se prsentent comme suit :
Individus 1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
X
2
12 13 7
6
3
12 10 9
7
4
2
10 6
3
Y
22 2
4
14 15 19 7
8
10 11 16 18 11 12 21
TAF : aprs avoir labor un tableau de contingence, en adoptant des classes damplitudes
gales 4 units pour la variable X et des amplitudes 5 units pour la variable Y, il vous est
demand dapprcier la liaison qui existe entre ces deux variables.
Elments de rponse :
Y 27
7 12
12 17
17 22
n.j
X
26
0
0
2
3
5
6 10
0
3
2
0
5
10 14
3
2
0
0
5
ni.
3
5
4
3
15
Les quations des droites dajustement linaire :
-lajustement linaire de Y X : Y= a.X + b = -1.37 X+ 22.79
-lajustement linaire de X Y : X = a.Y + b = -0.56 Y+14.62
- coefficient de corrlation r : r = -0.87 Forte liaison linaire ngative entre les deux variables.

IX-

Sries chronologiques :

Ce sont des sries d'observations chelonnes dans le temps. L'objectif de l'tude des sries
chronologiques est double:
analyse d'un phnomne temporel en mettant en vidence essentiellement la tendance
gnrale et les fluctuations saisonnires
laboration d'un modle permettant de faire de la prvision court terme

A- Dcomposition des chroniques :


Lvolution dans le temps dun phnomne rsulte de plusieurs facteurs :
- le Trend ou Tendance : T. Cest le mouvement de longue priode que lon considre le plus
souvent comme une droite (tendance linaire)
- les cycles : C. Cest une alternance de mouvements croissants et dcroissants de moyen
terme.
- les variations saisonnires : S. On estime quil y a une composante saisonnire dans une
srie, si, chaque anne, la mme priode, il se produit une variation du phnomne dau
moins 25% par rapport la valeur moyenne.
- le rsidu ou ala : . Cest un vnement exceptionnel impossible ou difficile estimer.
Lvolution dune variable X peut alors sexprimer comme suit :
(1) X= T+C+S+ ou (2) X= T.C.S.
Le modle additif (1) suppose que chaque composante apporte une contribution pure
lvolution observe.
Le modle multiplicatif (2) montre que chaque composante amplifie les autres et traduit
linterdpendance entre les composantes.

OFPPT/DRIF

34

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

B- La dtermination du Trend :
1) Ajustement linaire par la mthode des moindres carrs

La droite de rgression de Y par rapport au temps t donne pour chaque t une valeur Tt
Lissage par moyennes mobiles d'ordre k (k = nombre d'observations dans un cycle)

2)
temps

variable

moyennes mobiles d'ordre 3

moyennes mobiles d'ordre 4

y1

y2

(y1 + y2 + y3)/3

y3

(y2 + y3 + y4)/3

(y1/2 + y2 + y3 + y4 + y5/2)/4

y4

(y3 + y4 + y5)/3

(y2/2 + y3 + y4 + y5 + y6/2)/4

y5

(y4 + y5 + y6)/3

(y3/2 + y4 + y5 + y6 + y7/2)/4

y6

(y5 + y6 + y7)/3

y7

les moyennes mobiles donnent pour chaque t (mis part les valeurs extrmes) une valeur Tt
Application :
La socit BMT a pour activit la vente de systme dalarme. Le caractre porteur de ce march
lui a permis sur les cinq dernires annes denregistrer les ventes suivantes en KDH :
Annes
N 4
N 3
N 2
N 1
N
Chiffre
71697
90574
94550
125257
138150
daffaires
TAF :estimez la prvision des ventes pour lanne N+1 en utilisant la mthode des moindres
carrs.
Elments de rponse :
soit x le rang de lanne et y le chiffre daffaires
xi
yi
xiyi
xi
1
71697
71697
1
4
181148
90574
2
9
283650
94550
3
16
501028
125257
4
25
690750
138150
5
Sommes
15
520228
1728272
55
Moyennes
3
104046
a=16759 et b=53769
le chiffre daffaires y sexprimerait donc en fonction du rang x de lanne :
y=16759x + 53769
Pour lanne N+1 (rang 6), la prevision serait la suivante : y=16759 x 6+53769 = 154323 kdh

OFPPT/DRIF

35

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

C- Analyse de la composante saisonnire :


1) modle additif

- calcul des diffrences Yt - Tt = St + At


- calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne des
diffrences de la saison j
- calcul des coefficients saisonniers
2) modle multiplicatif

- calcul des rapports Yt / Tt = St . At


- calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne des
rapports de la saison j
- calcul des coefficients saisonniers

D- Analyse de la composante alatoire


1) modle additif
At = Yt - Tt - St
2) modle multiplicatif
At = Yt / (Tt . St)

E- Dsaisonnalisation :
Pour exprimer ce qu'aurait t le mouvement brut sans l'influence saisonnire, on utilise la
srie corrige des variations saisonnires Y* (ou Ycvs)
1) modle additif
Y*t = Yt - St
2) modle multiplicatif
Y*t = Yt / St

F- Srie Ajuste
Cette srie est utilise pour reprsenter ce qu'aurait t le phnomne en l'absence de phnomnes
alatoires
1) modle additif
= Tt + St
2) modle multiplicatif
= Tt . St

F- Prvision court terme:


Lorsque le trend est obtenu par la mthode des moindres carrs, il est possible
d'obtenir une prvision postrieure l'intervalle d'tude ( condition de rester dans des
limites raisonnables), en utilisant le modle prcdent. Pour une date x correspondant
un coefficient saisonnier Sx , la tendance vaut Tx , et la prvision est donc donne par
Tx + Sx en modle additif ou Tx . Sx en modle multiplicatif

OFPPT/DRIF

36

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
La socit Jihane fabrique des jouets en plastique. Son activit a un caractre saisonnier trs
marqu. On dispose des donnes suivantes relatives aux annes N-2, N-1 et N :
N2
N1
N
Trimestre 1
18912
25052
27635
Trimestre 2
28362
37579
41440
Trimestre 3
33098
43837
48357
Trimestre 4
14178
18789
20718
Total
94550
125257
138150
TAF :
1. Reprsentez graphiquement cette srie statistique
2. Calculez les coefficients saisonniers de cette srie.
3. Dterminez la srie corrige des variations saisonniers
4. Quelles sont les prvisions pour les annes N+1, N+2, N+3 et N+4 ?
Elments de rponse :
60000
50000
ventes

40000
30000
20000
10000
0
1

10

11

12

trimestres

2.
Trimestr1
Timestre2
Trimestre3
Trimestre4
yt
yt yt/yt
yt
yt
yt/yt
yt
yt
yt/yt
yt
yt yt/yt
N 2 189
28362
33098 24405 1.36
14178 26325 0.54
12
N-1 250 28819 0.87 37579 30738 1.22
43837 31637 1.39
18789 32443 0.58
52
N
276 33490 0.83 27635 34296 1.21
48357
20718
35
0.85
1.215
1.375
0.56
Coeff
saiso
nnier
s
Coefficient saisonnier 1er trimestre = (0.87+0.83)2 = 0.85
3.
Trimestre 1
2
3
4
5
6
7
8
9
10
11
12
t
yt
18912 28362 33098 14178 25052 37579 43837 18789 27635 41440 48357 20718
Coeff.sais. 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56
Srie
21013 22690 25460 25778 27836 30063 33721 34162 30706 33152 37198 37669
corrige

OFPPT/DRIF

37

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

4. la prvision de la tendance ncessite un ajustement de la srie corrige des variations


saisonniers (les moyennes mobiles).
Droite dajustement de yt => yt = 1391x + 21228
On obtient les prvisions suivantes pour la tendance :
Trimestre
13
14
15
16
Prvision
39311
40702
42093
43484
Prvisions des ventes des trimestres 13,14,15 et 16 ( N+1, N+2, N+3 et N+4)
Trimestre
13
14
15
16
Prvision de la
39311
40702
42093
43484
tendance
Coeff. Saisonn.
0.85
1.215
1.375
0.56
Prvisions des
33414
49453
57878
24351
ventes

Chapitre II. Ralisation des enqutes


Enqute : Investigation auprs dune population donne pour obtenir des rponses
prcises des questions sur un march (enqute par tlphone, enqute postale,
enqute par Internet..)

Ioptimale dun chantillon

Dtermination

Echantillon : fraction reprsentative dune population ou dun univers statistique sur lequel
porte une tude. Tous les membres de la population considrs doivent avoir la mme chance
dtre choisis.

A.

Mthodes dchantillonnage :

Il existe diffrentes manires dextraire un chantillon dune population. Nous ne verrons que
les deux pratiques les plus courantes :
1- Echantillon alatoire :
Tous les individus dune population possdent au dpart des chances gales de faire partie de
lchantillon. On effectue un choix au hasard.
2- Echantillon stratifi :
On divise en strates le population et on tire au hasard dans chaque strate homogne, les
lments obtenus dans chaque strate sont combins pour obtenir le rsultat final.
3- Tirage par quota :
Il consiste reconstituer une population mre miniaturise, au sein de lchantillon.
Lchantillon est considr comme reprsentatif de la population mre.
Exp : dans une population donne, il y a 49% de femmes et 51% dhommes ; on dfinit les
quotas qui permettront dobtenir un chantillon comprenant 49% de femmes et 51%
dhommes.

B.
OFPPT/DRIF

Dtermination optimale de la taille de lchantillon :


38

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Exp : un calcul financier prvisionnel a un chef de produit que sa nouvelle marque doit
obtenir une part de march dau moins 15%, sil veut dgager un bnfice. Une tude est
mene auprs de s acheteurs potentiels. Le chef de produit fait pari quune part de march de
20% est tout fait probable. Il se donne une marge de fluctuation de 3 points autour de ce
chiffre. Il veut organiser un test qui simule un achat rel, en prsentant les principales
marques du march. Combien faudra-t-il interroger de consommateurs potentiels pour vrifier
la prvision,
Formule de calcul : n=zp q
e
avec :
n : taille de lchantillon ncessaire
z : valeur fournie par la table de la loi normale ; elle varie selon le risque derreur que lon
accepte pour gnraliser les rsultats. Lusage est de retenir 5% soit une valeur de z=1.96
p : pourcentage prvu de consommateurs qui achtent la nouvelle marque, soit ici 20%
q =1-p : pourcentage de consommateurs qui choisissent une autre marque , ici 80%.
e: marge de fluctuation (prcision) accepte pour gnraliser les rsultats : ici 3 points de
part de march, soit 0.03.
Rsultats :
n= (1.96)(0.2)(0.8)=683
(0.03)

II- Elaboration du questionnaire


A- Dfinition :
Instrument de collecte de l'information. Il est fond sur un recueil de rponses un ensemble
de questions poses gnralement un chantillon reprsentatif dune population.

B- Finalits :
Recueillir des informations auprs des personnes concernes par le sujet traiter
Dresser le portrait dune ralit un moment prcis dans le temps
Evaluer les effets d'une action
Raliser un sondage sur un chantillon important

C- Domaine dapplication :
Tout type de sujet
Analyse de
l'existant

Critique de l'existant

Diagnostic

Elaboration et
choix de
solutions

Mise en
uvre

Suivi et
ajustement

D- Caractristiques :

OFPPT/DRIF

39

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Le questionnaire implique gnralement le choix dun chantillon de la population


concerne
La standardisation du questionnaire est ncessaire : il est prsent tous les
interlocuteurs sous la mme forme, avec les mmes modalits
Le questionnaire est un instrument pr-test : il doit tre mis lessai avant dtre
utilis pour vrifier sa pertinence
Le questionnaire permet dobtenir trois catgories dinformations :
- Les faits, les attitudes, les attentes, les opinions
- Les caractristiques associes aux rpondants (sexe, ge, fonction)
- Les informations relies ladministration du questionnaire (date, lieu, groupe de
rpondants, etc)
Le questionnaire doit tre accompagn en amont par une communication sur les
objectifs et l'utilit du questionnaire, et en aval par une communication sur les rsultats
obtenus.

E- Mode demploi :
Dmarche en 8 tapes :
Dfinition de la problmatique
Dfinition de la population
choix du type de questionnaire. Il existe deux types de questionnaires : Le questionnaire
auto-administr o le sujet rpond lui mme et le questionnaire administr individuellement
complt par lenquteur lui mme lors dun entretien individuel.
Formulation des questions. Les questionnaires possdent en gnral la fois des questions
ouvertes et fermes :
conception du questionnaire
Pr-test du questionnaire : Il consiste vrifier si le questionnaire fonctionne ou si
certaines modifications simposent en termes de contenu et de forme
Codification des rsultats. Raliser une matrice de donnes double entre :
*Chaque ligne correspond un rpondant
*Chaque colonne correspond une variable ou information demande
Questions fermes : A laide dun code numrique ou alphanumrique, on transforme
linformation dans un format qui la rend exploitable
Questions ouvertes : Il faut posteriori dvelopper une liste de codes pour identifier les
diverses rponses des interlocuteurs
Exemple :
Questions 1
2
3
4
5

n
Rponses 1 2 3 O N 1 2 1 2 3 1 2 3
Question1
Question2
Question3

Question n
Analyse et interprtation des rsultats. Lanalyse a pour but de rsumer les donnes
recueillies de faon rpondre aux questions souleves par la problmatique aborde.
Dmarche en 3 tapes
- Lanalyse quantitative

OFPPT/DRIF

40

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Il sagit grce au calcul statistique danalyser les informations recueillies, en se


plaant du point de vue prcis des objectifs de lenqute.
Deux grandes catgories dapproche statistique sont gnralement utilises :
Les statistiques descriptives :
Utilisation des mesures de tendance centrales (moyenne, mdiane, mode), ainsi
que des indices de dispersion autour de ces mesures (cart type, interquartile)
Les statistiques dductives :
Utilises pour rechercher des rapports significatifs entre des variables
(corrlation). Elles permettent de faire ressortir des liaisons que lon n'avait pas
souponnes lors du lancement de lenqute
- Lanalyse qualitative
Elle privilgie les aspects socio-conomiques et psychologiques des rsultats. Elle
vise l'interprtation des rponses fournies.
- Le rapport d'enqute
Il fournit une srie de tableaux accompagns de commentaires sur les points les
plus importants. ; il est structur de la manire suivante :
La prsentation de lenqute qui comprend ;
La prsentation des rsultats qui concerne ;
Les conclusions .

Chapitre III. Ralisation des sondages


Quelques dfinitions :
Sondage : Etude dune partie dune population considrs directement ou aprs redressement,
comme reprsentative de la population totale. Les rsultats obtenus sont rapports la totalit
de cette population.
Le sondage soppose au recensement qui est ltude exhaustive de toutes les units dun
ensemble .
Base de sondage : liste ou fichier regroupant lunivers tudi et permettant le tirage au sort
des units de lchantillon.
La statistique : toute mesure calcule partir des donnes chantillonnales
Paramtre : toute mesure calcule partir de lensemble des donnes de la population.
Estimation : le procd par lequel on cherche dterminer la valeur dun paramtre dune
population.
Estimateur : la statistique utilise pour effectuer lestimation ; cest une variable alatoire.
Valeur estime : la valeur que prend lestimateur une fois lchantillon tir ; cest une valeur
de la variable alatoire que constitue lestimateur.

I- Estimateur dune moyenne ou dune proportion


Problmatique : Quelle statistique de lchantillon constituera le meilleur estimateur dun
paramtre de la population ?
Exp : on dsire connatre la grandeur moyenne de toutes les femmes ges de 18 ans ou plus
vivant dans une certaine ville. Puisquil serait trop long dtudier toute la population, on
procde donc partir dun chantillon alatoire. Mais, puisque les individus de lchantillon
ont t choisis de faon ce quil reprsente le plus fidlement possible la population, on est
OFPPT/DRIF

41

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

en droit de penser que la moyenne de lchantillon peut prendre une valeur proche de la
moyenne de la population. Mais la moyenne dun chantillon choisi alatoirement dans la
population rencontre-t-elle le critre dun estimateur sans biais ?

A- Esprance mathmatique dune moyenne :


Lesprance mathmatique de la moyenne dun chantillon est un estimateur sans biais de la
moyenne de la population laquelle il appartient :
E (X) =
Exp : soit la population 2,3,6,8. Considrons la variable X reprsentant la moyenne dun
chantillon de taille 2 tir avec remise. Lensemble de tous les chantillons possibles
auxquels on associe la moyenne est :
X
2
3
6
8
2
3
6
8
2
3
6
8
2
3
6
8

2.0
2.5
4.0
5.0
2.5
3.0
4.5
5.5
4.0
4.5
6.0
7.0
5.0
5.5
7.0
8.0

Do la distribution de probabilit suivante :


X

2.0

2.5

3.0

4.0

4.5

5.0

5.5

6.0

7.0

8.0

Fi (X)

1/16

2/16

1/16

2/16

2/16

2/16

2/16

1/16

2/16

1/16

On a donc : E(X) = (2.0) 1/16 + (2.5) 2/16 + . + (8.0) 1/16 = 4.75


De plus la moyenne de la population :
= 2+3+6+8 = 4.75
4

B-

Esprance mathmatique dune proportion :

La proportion dindividus prsentant un caractre particulier dans un chantillon est un


estimateur sans biais de la proportion de ces individus dans la population laquelle appartient
lchantillon.
Exp :
OFPPT/DRIF

42

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Reprenons lexemple prcdant, considrons cette fois-ci la variable alatoire P reprsentant


la proportion de nombre impair dans un chantillon de taille 2 tir avec remise. Lensemble
des rsultats possibles est :
P
2
3
6
8
2
3
6
8
2
3
6
8
2
3
6
8

0/2
1 /2
0/2
0/2
1 /2
2/2
1 /2
1 /2
0/2
1 /2
0/2
0/2
0/2
1 /2
0/2
0/2

Do la distribution de probabilit suivante :


P

1 /2

Fi (P)

9/16

6/16

1/16

On a donc : E(P) = (0) 9/16 + (1/ 2) 6/16+ (1) 1/16 = 1/4


De plus la proportion de nombres impairs dans la population est :
= 1/ 4

Estimation ponctuelle dun paramtre :


Lestimation ponctuelle dun paramtre consiste en lvaluation de la valeur du paramtre de
la population laide dune valeur unique prise dans un chantillon. La statistique utilise
comme estimateur doit rencontrer un certain nombre de critres, on a vu celui de lestimateur
sans biais. Dautres caractristiques existent mais ne font pas notre objectif.
Il importe davantage de connatre les rsultats qui suivent :
Signification des termes

Paramtre (population)

Statistique utilise (chantillon)

Moyenne

Proportion

OFPPT/DRIF

43

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Application :
Soit la population 3,7,12,16,25. Considrer tous les chantillons de taille 2 pris avec remise
dans celle-ci.
1. pour chacun des chantillons, calculez la valeur de la variable alatoire X
2. calculez E(x)
3. calculez , la moyenne de la population
4. comparez les rsultats obtenus en b et c
Elments de rponse :
1.
0.3 5.0 7.5 9.5 14.0 5.0 7.0 9.5 11.5 16.0 7.5 9.5 12.0 14.0 18.5 9.5 11.5 14.0
16.0 20.5 14.0 16.0 18.5 20.5 25.0
2. 12.6
3. 12.6
4. E(x) =

II-

Variance des estimateurs

On peut sinterroger sur les chances que la valeur estime, partir de lchantillon, gale la
valeur du paramtre de l population. Il convient donc de pouvoir faire lestimation dun
paramtre tout en tant capable dvaluer les chances qu cette estimation de se raliser. Pour
ce faire nous effectuons ce quon appelle une estimation pat intervalle de confiance dun
paramtre de la population. Le problme consiste donc trouver les bornes de cet intervalle.
La moyenne de la variable alatoire X est : E( x ) = X = et lcart -type de X est
X = / n (sachant que var (x) = E(x) - [ E(x)] )
Si lchantillon est tir sans remise dans une population infinie ou trs grande avec n< 0.05N
ou encore avec remise dan,s la population, quelle que soit la taille de celle-ci, et
X = N-n
n N-1
Si lchantillon est tir sans remise dans une population finie.
Exp : reprenons lexemple prcdant :
X

2.0

2.5

3.0

4.0

4.5

5.0

5.5

6.0

7.0

8.0

Fi (X)

1/16

2/16

1/16

2/16

2/16

2/16

2/16

1/16

2/16

1/16

On sait que var (x) = E(x) - [ E(x)]


Or, on a :
E(x) = (2.0) 1/16 + (2.5) 2/16 + + ( 8.0) 1/16 = 25.40
OFPPT/DRIF

44

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Do : var (x) = 25.40 (4.75)


De plus = (2-4.75) + ( 3-4.75)+ ( 6-4.75) + ( 8-4.75) = 5.69
4
et /n = 5.69/2 = 2.84 o n reprsente la taille de lchantillon.
Application :
Un chantillon de taille n est tir, sans remise, dune population de taille 350 dont la moyenne et
la variance sont respectivement 115 et 169. pour chacune des valeurs suivantes de n, valuer la
variance et lcart_ type de la variable alatoire X :
1. 5
2. 15
3. 30
4. 50
Elments de rponse :
1. 33.5 et 5.8
2. 11.3 et 3.4
3. 5.2 et 2.3
4. 2.9 et 1.7

III-

Estimation par intervalle de confiance de :

On appelle INTERVALLE DE CONFIANCE un intervalle de la forme [L1,L2] , ayant une


certaine probabilit de contenir la valeur dun paramtre.
L1= X - z/2 x et L2= X - z/2 x
O : z/2 est la valeur de la variable z telle que P(z z/2) = 1- /2, le risque derreur et x
lcart- type de la distribution dchantillonnage de X appele aussi ERREUR TYPE.
Il convient dutiliser :
z/2 =2.58 si = 1%
z/2 =1.96 si = 5%
z/2 =1.65 si = 10%
On appelle NIVEAU DE CONFIANCE, not 1 - , la probabilit qua lintervalle de
confiance de contenir la valeur du paramtre.
On appelle RISQUE DERREUR , not , la probabilit qua lintervalle de confiance de ne
pas contenir la valeur du paramtre.
Exp :
La moyenne et lcart -type du rsultat cumulatif dun chantillon de 36 tudiants dune
universit sont 2.6 et 0.3 respectivement. Trouvons un intervalle de confiance 99% pour la
moyenne des rsultats cumulatifs de tous les tudiants de cette universit. On a donc :
X = 2.6, z/2= z1/2%=2.58
Et x= 0.3/ 36 = 0.05
Do : L1 = 2.6 (2.58)0.05 = 2.47
Et
L2 = 2.6 + (2.58)0.05 = 2.73
OFPPT/DRIF

45

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Donc : [2.47 ; 2..73]


Avec un niveau de confiance de 99% , cest dire que l intervalle [2.47 ; 2..73]
Possde 99% des chances de contenir la moyenne du rsultat cumulatif des tudiants de
cette universit.
Application :
Dans une rgion, on sintresse au temps moyen , inconnu , que prennent les individus dun
groupe pour se rendre leur travail. A partir dun chantillon alatoire de taille 100, on a
obtenu un temps moyen de 12 minutes. Construisez un intervalle de confiance 90% pour , si
lon sait que = 9.
Elments de rponse :
[11.505 ; 12.495] minutes

OFPPT/DRIF

46

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Contrle continu
Dure : 2h
Un professeur dEPS en charge de deux groupes de filles nayant jamais pratiqu le saut la
perche dcide de les initier ce sport en utilisant deux mthodes dinitiation diffrentes. Les
performances ralises la fin du cycle dapprentissage sont les suivantes :
Groupe 1(mthode A) :
2.20 2.35 2.40 1.15 2.35 2.00 2.55 2.05 1.85 2.85
2.65 2.35 1.90 2.70 2.05 1.95 2.15 2.05 2.80 2.45
Groupe 2(mthode B) :
1.80 2.00 1.45 2.05 2.00 1.65
2.05 1.65 1.50 1.60 2.15 2.10
1- construire les histogrammes des deux sries de valeurs en utilisant des classes de largeur
0.2m du type : [1.00-1.20[
2- laquelle de ces deux mthodes semble donner les meilleurs rsultats ? rpondre la
question tout dabord daprs les histogrammes puis selon que le critre est :

moyenne la plus leve


mdiane la plus leve
classe modale la plus leve
maximum le plus leve
minimum le plus lev
cart type le plus faible
tendue la plus faible
autres critres ?

3- construire un nouvel histogramme, cette fois uniquement pour le groupe 1, en utilisant des
classes de largeur 0.5. le comparer celui de la question 1. Lequel apporte linformation la
plus pertinente ?

OFPPT/DRIF

47

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Module : Statistiques
GUIDE DES TRAVAUX PRATIQUES

TP 1
Objectifs viss :
OFPPT/DRIF

48

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

- reprsenter graphiquement une distribution statistique


- tudier la tendance centrale de cette distribution
- tudier la dispersion de cette distribution
- apprcier la forme de cette distribution
Dure du TP :
2h
Description du TP :
Cet exercice permet au stagiaire de matriser la reprsentation graphique dune distribution
caractre quantitatif continu, de sentraner sur le calcul des paramtres de la tendance
centrale et de dispersion et galement de faire un commentaire en se basant sur la forme de la
reprsentation graphique de la distribution.
Droulement du TP :
Dans une commune rurale, o aucune exploitation agricole natteint 123 Ha. La distribution
des 100 exploitants en fonction de la superficie se prsente comme suit :
Superficie en Ha : xi
Le pourcentage des propritaires fonciers :fi
Moins de 5
15
5 10
20
10 15
15
15 20
10
20 30
10
30 50
12
50 et plus
18
Total
100
Questions :
1- quelle est la population cible ?
quel est le caractre tudi ?
quel est le nombre de modalits ?
2- reprsentez graphiquement la distribution tudie (simple et cumulative)
3- dterminez les diffrentes caractristiques de tendance centrale
4- quen est-il de la dispersion ?
5- est-ce que la rpartition des terres au sein de cette commune est quitable ?
Elments de rponse :
1- population cible : les 100 exploitations
caractre tudi : la superficie ; sa nature : quantitatif continu
nombre de modalits : 7
3X=28.55 Ha
Me = 15 Ha
Mo= 7.5 Ha
4- Etendue = 125 Ha
intervalle interquartile : [Q1 ;Q3] = [7.5 ;38.33]
coefficient de variation = 1.04
5- indice de GINI : IG=0.613
lindice tend vers 1 plus que vers 0, on dira que la distribution des terres dans cette commune
est assez concentre donc cette distribution est non quitable.

TP 2
OFPPT/DRIF

49

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Objectifs viss :
- raliser des reprsentations graphiques pour des variables quantitatives continues.
Dure du TP :
1h30
Description du TP :
Ce TP permettra au stagiaire de matriser la lecture dun tableau reprsentant la distribution
dune variable quantitative continue. Il lui permettra galement de reprsenter graphiquement
ce genre de variable.
Droulement du TP :
On considre la distribution dfinie par le tableau ci-dessus :
Loyer mensuel en DH
Nombre dappartements
150-179
3
180-209
8
210-239
10
240-269
13
270-299
33
300-329
40
330-359
35
360-389
30
Total
172
Questions :
a- quelles sont les bornes infrieures et suprieures de la 1ere classe ?
b- quelles sont les vraies limites de la 1ere classe ?
c- lintervalle de classe utilise est identique pour chaque classe ? quelle est sa taille ?
d- quel est le centre de la 1ere classe ?
e- quels sont les vraies limites de la classe correspondant leffectif le plus lev ?
f- quelles sont les bornes de la classe lintrieur de laquelle sest trouv recens un loyer
mensuel de 239.50 DH ?
g- construisez un histogramme exprimant les donnes du tableau.
h- construisez une courbe deffectifs pour les donnes du tableau.
Elments de rponse :
a- 150dh et 179dh
b- 149.50dh et 179.50dh
c- 179.50 149.5 = 30
d- 149.5 + 30/2 = 164.50 dh
e- 299.5 dh et 329.50 dh
f- 240 dh et 269 dh

TP 3
OFPPT/DRIF

50

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Objectifs viss :
- calculer les paramtres de tendance centrale
- interprter les paramtres de tendance centrale
Dure du TP :
1h30
Description du TP :
Cet exercice permet au stagiaire de matriser lutilisation des formules de calcul des
paramtres de tendance centrale.
Droulement du TP :
Une agence durbanisme a effectu une tude sur la structure des familles susceptibles de
venir habiter une ville nouvelle dont elle est charge dtablir le projet. Trois types de familles
ont t dfinis selon la prsence et lactivit du conjoint. Daprs cette tude, les distributions
de frquences de ces familles selon le nombre denfants sont les suivantes :
Nombre denfants
sans conjoint
0
1
2
3
4
5
6
7
Total

33.3
39.3
16.6
6.4
2.5
1.1
0.8
0.0
100.0

Chef de famille
avec femme active avec femme
inactive
16.2
8.4
26.6
16.4
26.6
25.2
15.6
20.6
9.3
15.3
4.5
12.2
1.2
1.9
0.0
0.0
100.0
100.0

Les trois types de familles considrs se repartissent en pourcentage comme ci-aprs :


sans conjoint

Chef de famille
avec femme active

5.8

52.9

Total
100

avec femme
inactive
41.2

Questions :
1- dterminez pour chaque type de famille et pour lensemble, le mode de la distribution selon
le nombre denfants.
2- dterminez pour chaque type de famille et pour lensemble, la mdiane de la distribution
selon le nombre denfants.
3- calculez pour chaque type de famille et pour lensemble, le nombre moyen denfants .

Elments de rponse :
OFPPT/DRIF

51

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

1Ensemble
sans conjoint
Valeur du
mode

2 enfants

1 enfant

Chef de famille
avec femme
active
Intervalle
modale : 1
enfants

avec femme
inactive
2 enfants

2- On retient pour la mdiane la valeur M pour laquelle la frquence cumule est gale .
3Ensemble
sans conjoint
Nombre moyen
denfants

2.171

1.120

Chef de famille
avec femme
active
1.935

avec femme
inactive
2.622

TP 4
OFPPT/DRIF

52

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Objectifs viss :
- traiter le lien entre variables caractre quantitatif
- choisir la reprsentation graphique adquate pour chaque distribution statistique
- interprter les reprsentations graphiques
Dure du TP :
2h30
Description du TP :
Cet exercice permet au stagiaire dtudier le lien existant entre deux variables caractre
quantitatifs en se basant sur la lecture dune reprsentation graphique.
Droulement du TP :
Au cours de la dcennie 1990-2000, les effectifs employs au fond dune houillre et la
production nette de charbon ont volu de faon suivante :
Anne
Effectifs du fond (milliers de Production nette de charbon
personnes
(millions de tonnes)
1990
71.3
40.1
1991
65.3
35.8
1992
57.6
32.7
1993
50.4
28.4
1994
47.1
25.7
1995
45.8
25.6
1996
42.4
25.1
1997
38.6
24.4
1998
35.9
22.4
1999
32.7
21.1
2000
30.8
20.7
1- reprsentez lvolution de ces deux sries sur deux graphiques coordonnes arithmtiques
prsents lun au dessous de lautre faon mettre en vidence lexistence de covariations
ventuelles dans le temps.
2- quels sont les inconvnients de cette prsentation ?
3- quel type de graphique permettrait dy remdier ?
4- tracer le graphique de corrlation correspondant au tableau prcdant.
5- comment interprtez-vous ce graphique ?

TP 5
OFPPT/DRIF

53

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Objectifs viss :
- construire des reprsentations graphiques adaptes aux variables qualitatives et quantitatives
discrtes
- calculer les paramtres de la tendance centrale
- calculer les paramtres de dispersion
Dure du TP :
2h
Description du TP :
Ce TP permet au stagiaire de sentraner sur la reprsentation graphique des variables
qualitatives et quantitatives discrtes. Il lui permet galement de matriser le calcul des
paramtres de la tendance centrale et ceux de la dispersion.
Un sondage sur la capacit pulmonaire des individus nous a donn les rsultats suivants :
Age
Sexe
Capacit pulmonaire (litre)
2.94
F
54
4.03
M
19
3.75
F
18
6.04
M
26
4.92
F
19
6.57
M
22
5.28
M
18
5.19
M
20
4.08
F
20
4.68
M
18
5.38
M
17
4.71
M
29
5.20
M
17
4.50
M
43
4.93
M
30
3.92
F
18
6.54
M
25
5.35
M
38
4.21
F
19
5.40
M
26
6.66
M
20
5.14
M
18
3.49
F
16
5.82
M
19
5.25
M
20
4.89
M
21
6.07
M
19
3.82
F
19
6.71
M
19
5.93
M
30
6.22
M
24
3.86
F
17
Questions:
OFPPT/DRIF

54

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

1- Construisez une distribution deffectifs pour chacune des variables


2- donner une reprsentation graphique pour chacun des cas
3- donnez la mesure de tendance centrale la plus approprie, pour chacune des variables
4- calculez lcart type de la distribution de la capacit pulmonaire
Elments de rponse :
3Age : x= 23.4 ans, sexe: Mo=M, capacit pulmonaire : x= 4.98 litres
4- 0.93 litres

TP 6
OFPPT/DRIF

55

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Objectifs viss :
- tracer un nuage statistique
- trouver lquation de la droite dajustement linaire
- faire des prvisions en se basant sur la droite dajustement linaire
- tudier la corrlation entre deux variables
Dure du TP :
2h30
Description du TP :
Cet exercice permet au stagiaire de faire des prvisions en trouvant la droite dajustement
linaire par la mthode des moindre carrs. Il permet galement dtudier la corrlation entre
deux variables.
Droulement du TP :
Des tudiants de 1ere anne TCE ont eu les rsultats en statistiques et en mathmatiques
financires (/100):
x (notes de 66
64
69
93
80
71
87
73
79
56
47
statistiques)
Y(notes de 72
70
60
94
82
68
86
82
90
55
64
math.fin.)
Questions :
1- tracez le nuage statistique
2- ajustez la droite des moindres carrs
3- quelle note de mathmatiques financires pouvez-vous prdire un tudiant de ce niveau
qui a eu 75 en statistiques ?
4- calculez le coefficient de corrlation ?
Elments de rponse :
2- y= 16.82+0.81x
3- 77.8
4- 0.845

OFPPT/DRIF

56

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

TP 7
Objectifs viss :
- connatre la terminologie principale des statistiques
- tablir des tableaux statistiques
- construire des reprsentations graphiques
- calculer et interprter les diffrents paramtres des distributions
Dure du TP :
18h
Description du TP :
Ce TP est prsent sous forme de QCM. Il couvre presque la totalit des points traits dans ce
module. Il pourrait tre utilis comme test de connaissances la fin de chaque section.
Droulement du TP :
TERMINOLOGIE ET TABLEAUX STATISTIQUES
1Les caractres suivants sont

qualitatifs quantitatifs

- Le tour de ceinture d'une personne


- Le code postal de l'habitation d'un foyer franais
- La superficie d'une exploitation agricole
- Le groupe sanguin d'un individu
2Les classes suivantes sont-elles bien dfinies?
oui non
oui non
oui non

oui non

3- La frquence d'une classe s'obtient en divisant l'effectif de la classe par


OFPPT/DRIF

57

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

L'effectif total
Le nombre de classes
L'amplitude de la classe

4- Le caractre quantitatif discret x admet le tableau de distribution suivant


valeurs
frquences

total

10,5%

22,3%

30,4%

23,6%

13,2%

100%

5- Quelle est la frquence cumule croissante pour x = 3

67,2%

63,2%

32,8%

30,4%

6- Pour une distribution continue, l'effectif total s'obtient en multipliant l'effectif de chaque
classe par le centre de la classe et en ajoutant les nombres ainsi obtenus

vrai

faux

7- Le tableau ci-dessous (notes obtenues par 40 tudiants un examen de statistique) est un


tableau
12

13

18

12

14

15

10

13

11

10

12

De donnes ponctuelles

De distribution

8- Les caractres quantitatifs suivants peuvent-ils tre considrs comme des variables
statistiques continues
OFPPT/DRIF

58

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

le nombre d'accidents du travail survenus dans une PME en 1


an
la teneur en aluminium d'un alliage

oui

non

oui

non

9- Les tudiants de formation continue sont rpartis selon leur ge dans le tableau suivant
ge
effectifs

[20 ; 25[
38

[25 ; 30[
59

[30 ; 35[
47

[35 ; 40[
24

[40 ; 45[
12

+ de 45
2

total
182

Quelle limite doit-on donner la dernire classe si l'on veut que toutes les classes aient la
mme amplitude
50

55

34

Quel est le centre de la classe [30 ; 35[


33

35

37,5

autre rponse

Quelle est la proportion d'tudiants gs de moins de 35 ans


53,3%

79,12%

92,31%

25,82%

10- La frquence cumule croissante est dfinie par


- proportion d'individus dont la valeur du caractre est infrieure x
- proportion d'individus dont la valeur du caractre est suprieure x
- ensemble des modalits que peut prendre le caractre
- autre rponse

11- On a pu regrouper les individus dune population par classes dont les centres sont les
suivants : 52, 60, 68, 76, 84, 92. Quelle est lamplitude des classes
2

OFPPT/DRIF

16

59

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

REPRSENTATIONS GRAPHIQUES
1- A partir du tableau ci-dessous, 3 graphiques ont t tablis. Indiquez celui (unique) de ces
graphiques qui ne constitue pas une reprsentation correcte du phnomne

OFPPT/DRIF

60

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

2- Lequel des graphiques ci-dessous correspond l'histogramme des donnes suivantes

OFPPT/DRIF

61

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

3- Le caractre quantitatif X admet la distribution suivante:


classes

[0 ; 1[

[1 ; 2[

[2 ; 4[

effectifs

40

30

30

Quelle est la reprsentation graphique des frquences qui convient?

une autre reprsentation


4- Le caractre quantitatif X admet la distribution suivante:
classes

[0 ; 1[

[1 ; 2[

[2 ; 4[

effectifs

40

30

30

Quelle reprsentation graphique des frquences cumules croissantes convient?

OFPPT/DRIF

62

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

une autre reprsentation

5- La reprsentation graphique ci-dessous est un diagramme

en btons
secteurs
bandes

6- Un histogramme est une reprsentation graphique de la distribution des frquences d'une


variable statistique continue
VRAI
FAUX
7- Dans un diagramme secteurs, la modalit n 2 du tableau ci-dessous serait reprsente par
un secteur d'angle

OFPPT/DRIF

63

Rsum de Thorie et
Guide des travaux pratiques

modalits

Statistiques

effectifs

30

15 degrs

15

54 degrs

25

60 degrs

30

8- Le tableau suivant donne la rpartition des mnages d'une population selon le nombre de
vhicules possds
nombre
d'automobiles
nombre de
mnages

4 et plus

528

2463

906

156

12

9- La reprsentation graphique qui convient le mieux est


un diagramme en btons

un histogramme

une autre reprsentation

CARACTRISTIQUES DE TENDANCE CENTRALE ET DE POSITION


1- Quelle est la moyenne des valeurs ci-dessous
xi

ni

20

58

29,87

30

188

30

40

54

30,54

82,89

2- La mdiane d'une distribution est toujours gale au second quartile


OUI

NON

3- Dans une srie statistique, il est possible de dterminer dix dciles


OUI
OFPPT/DRIF

NON
64

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

4- On observe pendant 79 jours ouvrables, le nombre de lettres recommandes mises au


cours de la journe, par le service des approvisionnements. L'volution de ces envois au cours
de cette priode est fournie dans le tableau suivant. Dterminer le premier et le troisime
quartile de cette srie d'expditions quotidiennes de lettres recommandes.
rang nbre rang nbre rang nbre rang nbre rang nbre
lettres
lettres
lettres
lettres
lettres
1

17

33

49

65

11

18

34

50

66

11

19

35

51

67

11

20

36

52

68

11

21

37

53

69

11

22

38

54

70

11

Q1=7

Q3=12

23

39

55

71

11

Q1=6

Q3=11

24

40

56

72

12

Q1=7

Q3=10

25

41

57

73

12

Q1=3,75 Q3=11,25

10

26

42

58

74

12

autre rponse

11

27

43

59

10 75

12

12

28

44

60

10 76

13

13

29

45

61

10 77

13

14

30

46

62

10 78

14

15

31

47

63

10 79

15

16

32

48

64

10

5- Cocher la nature des indicateurs numriques suivants


Paramtre de
Paramtre de
position
dispersion

ni l'un ni l'autre

effectif total
3 dcile
moyenne gomtrique

OFPPT/DRIF

65

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

6- Soit le tableau suivant


modalits

effectifs

employs de service

manoeuvres

ouvriers

12

Sachant que la moyenne arithmtique


est 12,5 le nombre de cadres suprieurs
est
7

ouvriers spcialiss

22

agents de matrise

15

employs

28

cadres

13

cadres suprieurs

10
5
autre rponse

7- Il existe 100 centiles qui partagent une srie statistique


OUI

NON

8- On donne la srie statistique suivante : 14, 16, 12, 9, 11, 18, 7, 8, 9, 16, 7, 9, 18. La
mdiane est gale

11

14

16

18

[9;18[

[11;18[

autre
rponse

9- La moyenne gomtrique d'une srie statistique est


La racine carre du produit des valeurs observes
la racine cubique du produit des valeurs observes
la racine n-ime du produit des valeurs observes
le produit des racines n-ime des valeurs observes
le quotient des racines n-ime des valeurs observes
autre rponse
OFPPT/DRIF

66

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

10- Quand les classes d'une srie statistique sont d'amplitudes ingales, il faut obligatoirement
corriger les effectifs ou les frquences pour calculer la mdiane
OUI

NON

11- La moyenne harmonique d'une srie statistique est gale l'inverse de la moyenne
arithmtique des inverses des valeurs
OUI

NON

12- La mdiane partage l'histogramme en deux surfaces gales


OUI

NON

13- Soit la srie suivante

xi
1
2
3
4
5
6

ni
20
30
15
10
5
2

la moyenne quadratique est


gale

1,92

2,78

357

4,86

5,04

15

la moyenne gomtrique est


gale

1,87

2,15

3,57

6,25

autre rponse

la moyenne harmonique est


gale

6,25

215

1,87

autre rponse

1,92

14- La rpartition des clibataires selon leur ge est fournie par le tableau suivant
ge

[15 ; 30[ [30 ; 40[

effectifs

4500

450

[40 ; 50[

[50 ; 60[

[60 ; 70[

[70 ; 80[

[80 ; 90[

400

230

200

20

Sachant que l'ge moyen est gal 28,8 ans, la valeur manquante est
65

97

102

165

autre rponse

20,4

22,6

24,8

26,7

autre rponse

150
l'ge mdian est

OFPPT/DRIF

67

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

CARACTRISTIQUES DE DISPERSION
1- Compltez le tableau suivant pour calculer la

variance
la variance vaut
6,293

7,69

4341,73

59,08

2- Calculez le coefficient de variation des donnes suivantes:


xi

ni

70

91

0,085

45,64

80

189

0,546

6,76

90

70

3- La synthse d'un ensemble d'observations relatives une variable quantitative peut


s'effectuer par des paramtres de tendance centrale et de dispersion.
L'une des quatre rponses suivantes n'a rien voir avec ce type de synthse:
moyenne
et cart-type

frquence moyenne par unit d'amplitude


et mode

mdiane
et cart-type

variance
et mode

4- On observe sur un tronon d'autoroute, pendant 51 jours, le nombre x de dpannages


effectus au cours de la journe. Calculer l'intervalle inter-quartile des observations

OFPPT/DRIF

68

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

ran
nbre
rang
nbre
rang
nbre
rang
nbre
rang
nbre
g dpannages
dpannages
dpannages
dpannages
dpannage
s
1
1
11
3
21
4
31
4
41
6
2

12

22

32

42

13

23

33

43

14

24

34

44

15

25

35

45

16

26

36

46

17

27

37

47

18

28

38

48

19

29

39

49

10

20

30

40

50

10

51

11

L'intervalle inter-quartile vaut


3

autre rponse

5- La variance est toujours positive ou nulle


OUI

NON

6- Une entreprise E possde 3 tablissements A, B, C. Les effectifs et les salaires moyens


pour les ouvriers , les employs , et les cadres , sont donns dans le tableau suivant
A

effectifs

salaire
moyen

effectifs

salaire
moyen

effectifs

salaire
moyen

effectifs

salaire
moyen

Ouvriers

60

10

180

10

245

8,5306

Employs

30

20

10

16

30

25

70

21,571

Cadres

10

100

10

90

15

100

35

97,143

Total

100

22

200

12,5

50

46

350

20

La variance intra-tablissements est gale


OFPPT/DRIF

129,86

478,28

562,51
69

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

LA CONCENTRATION
1- Si, pour un caractre quantitatif continu et positif, la mdiane est trs peu diffrente de la
mdiale, alors l'indice de concentration de Gini est peu diffrent de
0

0,5

2- Dans un diagramme de concentration on porte gnralement en ordonnes les valeurs des


frquences cumules des valeurs globales. Comment s'crivent ces valeurs

autre rponse

INDICES
1- Le chiffre d'affaires d'une entreprise a augment de 2% par an pendant 2 ans, puis a
diminu de 9% par an pendant 4 ans, et a augment de 8% par an pendant 3 ans. Quelle est
l'augmentation moyenne sur la priode
1%

9%

10%

autre rponse

2- tant donn une population de 50 millions qui a cr au taux de 20% par an, quelle tait
cette population il y a 12 ans
38 486 689

39 424 659

1 555 318

5 607 832

autre rponse

3- Une hausse de 80% suivie d'une baisse de 50% revient


une baisse de 10%

une baisse de 20%

une baisse de 30%

une hausse de 10%

une hausse de 30%

autre rponse

4- Une hausse de 60% suivie d'une baisse de 40% revient


une hausse de 20%

une baisse de 10%

une hausse de 10%

une baisse de 20%

une baisse de 4%

autre rponse

OFPPT/DRIF

70

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

5- Une grandeur augmente de 10% par an. Au bout de combien d'annes aura-t-elle doubl
11 ans

11,1 ans

10 ans

7,27 ans

1 an

12,45 ans

8,27 ans

autre rponse

6,23 ans

6- Le calcul de l'indice de Laspeyres ncessite de pondrer les indices lmentaires par des
coefficients budgtaires relatifs
la priode de base

la priode courante

7- Calculez l'indice de Laspeyres des prix de 1998 par rapport 1990 partir des donnes du
tableau suivant
Modle

Quantits

Prix

Ventes

1990 1998 1990 1998 1990

1998

Produit A

50

55

18

22

900

1210

Produit B

69

62

23

25

1587

1550

Produit C

96

115

28

25

2688

2875

5175

5635

Total

108,91

100,97

107,85

99,98

8- Calculez l'indice de Paasche des quantits de 1998 par rapport 1990 partir des donnes
du tableau suivant

Modle

Quantits

Prix

Ventes

1990 1998 1990 1998 1990

1998

Produit A

90

99

13

16

1170

1584

Produit B

56

50

18

20

1008

1000

Produit C

78

94

23

21

1794

1974

3972

4558

Total

OFPPT/DRIF

109,53

108,58

104,81

105,69

71

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

RGRESSION LINAIRE
1- Pour justifier un ajustement affine (y = ax + b) , on a calcul le coefficient de corrlation
linaire r. Dans les cas suivants, le rsultat est
r = 1,22

mdiocre

bon

idiot

r = -0,89

mdiocre

bon

idiot

2- Quand on ajuste linairement x et y par la mthode des moindres carrs, on obtient deux
droites de rgression. L'quation de la droite D de y par rapport x est

3- Dans le cas d'indpendance totale, le coefficient de corrlation linaire est gal


0

-1

autre rponse

4- Une valeur leve du coefficient de corrlation linaire est signe d'une relle relation
causale, dans le cas
du revenu national et de la consommation finale

OUI

NON

du prix d'un produit et du prix d'un produit substituable

OUI

NON

OUI

NON

OUI

NON

de la taille des salaris et de leurs salaires

OUI

NON

de la taille des salaris et de leurs poids

OUI

NON

de la temprature et de l'allongement d'une barre d'acier

OUI

NON

du nombre d'abonns au tlphone et des ventes de mdicaments


contre le stress
des heures travailles par les tudiants pour rviser leurs examens et
leurs taux de russite ces examens

OFPPT/DRIF

72

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

5- Utiliser les calculs effectus dans le tableau ci-dessous pour calculer la covariance entre
les variables x et y
i

xi

yi

xiyi

xi

yi

50

350

2500

49

60

300

3600

25

70

420

4900

36

80

240

6400

5
SOMME

90
350

1
22

90
1400

8100
255000

1
120

6300

-28

28

308

autre rponse

6- D'aprs les donnes et le graphique du tableau ci-dessous, indiquer laquelle des


propositions s'applique correctement ces informations

xi
19
52
38
81
109
75
66
100

yi
12
17
25
43
55
73
42
75

La covariance entre x et y est


positive
on ne peut rien dire priori sur le
signe de la covariance entre x et y

La covariance entre x et y est ngative


Le concept de la covariance n'est pas
pertinent pour analyser statistiquement le
phnomne tudi

aucune proposition ne convient

OFPPT/DRIF

73

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

7- Calculer la pente a de l'quation de rgression y = ax + b , pour les donnes du tableau


suivant
i

xi

10

12

14

16

18

yi

957

939

971

1006

1012

853,1

977

0,09

8,85

autre rponse

8- Calculer l'ordonne l'origine b de l'quation de rgression y = ax + b , pour les donnes


du tableau suivant
i

xi

16

18

20

22

24

yi

462

449

458

378

365

422,4

-13,25

756,14

687,4

autre rponse

SRIES CHRONOLOGIQUES
1-On considre la srie chronologique
Trimestre 1
Trimestre 2
1995
10
12
1996
11
15
1997
12
17
1998
13
17

Trimestre 3
13
16
18
19

Trimestre 4
14
13
15
16

2- Si une srie suit un modle multiplicatif et qu'on divise les valeurs de la srie brute par les
valeurs des coefficients saisonniers, on obtient
la srie des variations alatoires ou accidentelles
la srie ajuste
la srie dsaisonnalise (C.V.S.)
autre rponse
3- Soit la srie chronologique suivante, qui suit un modle multiplicatif
t
1
2
3
4
5
6
7
8
9
10
yt
47
30
39
14
62
40
50
16
69
50

11
62

12
15

Le trend, la date t = 3, calcul par les moyennes mobiles d'ordre 4 est gal
39
OFPPT/DRIF

22

34,38

68,75

28,51
74

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

La valeur la mme date de la srie CVS est


41,46

0,98

37,5

4- Soit la srie chronologique


Trimestre 1
Anne 1
20
Anne 2
24
Anne 3
28,8
Anne 4
34,6
Anne 5
41,5

38,4

Trimestre 2
18
22
26,8
32,6
39,5

Trimestre 3
20
24
28,8
34,6
41,5

33,9

Trimestre 4
22
26
30,8
36,6
43,5

La srie suit un modle de type


additif

multiplicatif

5- Soit Yt la srie du chiffre d'affaires mensuel d'une entreprise de janvier 1987 dcembre
1991. L'quation du trend est Tt = 3,76 t + 700 ; (t = 1,....,60)
Les coefficients saisonniers sont :
janvier S1 = -16

mai S5 = 11

septembre S9 = - 60

fvrier S2 = -51

juin S6 = 64

octobre S10 = -1

mars S3 = -80

juillet S7 = 0,09

novembre S11 = 62

avril S4 = -81

aot S8 = -69

dcembre S12 = 222

Sachant qu'on a un modle additif, une estimation de la valeur future de juin 1993 est
940,64

1057,3

764

1038,48

831,7

autre rponse

6- Soit la srie chronologique ci-aprs qui suit un modle de type additif


1996
1997
1998
1 trimestre
420
515
500
2 trimestre
615
685
835
3 trimestre
825
1000
980
4 trimestre
540
620
700
- La moyenne mobile d'ordre 4 du 3 trimestre 1997 est
768

772

703

733

680

- La valeur du coefficient saisonnier brut S' du 1 trimestre est


OFPPT/DRIF

75

Rsum de Thorie et
Guide des travaux pratiques
5,15

Statistiques

48

- 65

- 192

- 109

- Le coefficient saisonnier S du 1 trimestre est


- 109
- 179
-194
- 13
- La valeur de la srie CVS au 2 trimestre de l'anne 1996 est
609

OFPPT/DRIF

679

576

642

76

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Evaluation de fin de module


Dure : 2h30
Questions : (8 points)
1- quest ce quon entend par :
caractre qualitatif ?
caractre quantitatif ?
variable statistique discrte ?
variable statistique continue ?
2- Dfinissez les termes suivants :
le mode
la mdiane
ltendue
lcart type
Exercice 1 (6 points)
En lanne N, les recettes du budget de lEtat se prsentent de la faon suivante (en milliards
de HD):
- taxe de la valeur ajoute (TVA)
: 348
- Impt gnral sur les revenus(IGR) : 168
- Impt sur les socits (IS)
:71
- Taxe sur les produits ptroliers
: 54
- Autres impts
: 161
- Recettes non fiscales
: 41
Travail faire :
Reprsentez graphiquement les recettes du budget de lEtat en N par deux graphiques
adquats de votre choix.
Exercice 2 : (6 points)
Une srie dobservations concernant les notes obtenues un examen par un groupe de
stagiaires de mme age a donn les rsultats suivants :
Notes [10,30[ [30,50[ [50,70[ [70,90[ [90,110[ [110,130[ [130,150[ [150,170[ [170,190[
Effectifs
4
17
63
83
72
33
21
5
2
Travail faire :
Dterminez la note moyenne et calculez lcart type de la srie.
Elments -critres dvaluation
Questions :
1- distinguer les diffrents types de caractres
2- dfinir les diffrents paramtres de tendance centrale et de dispersion
Exercice 1 :
Exercice 2 :
OFPPT/DRIF

choisir les reprsentations graphiques correspondantes


choisir les graduations et les lgendes adquates
Calculer avec exactitude la moyenne
Calculer avec exactitude lcart type
Suivre une mthodologie pour le calcul.
77

Rsum de Thorie et
Guide des travaux pratiques

Statistiques

Liste des rfrences bibliographiques :

Ouvrage

Auteur

Probabilits et statistiques Audet, Boucher,


Caumartin et Skeene
Manuel de statistiques
Omar Raja
descriptives
Mmento pratique sta
Rachid Boutti
tistiques
Gestion prvisionnelle et Brigitte Doriath et
mesure de la performance christian Goujet
Lessentiel du marketing Eric Vernette
Statistiques descriptives O.F.P.P.T
Niveau technicien
www.larrun.iut.bayonne.univ-pau.fr

OFPPT/DRIF

Edition
Gaten morin, 1983
El Wataniya, 2001
Collection Expertise,
1996
Dunod, 2002
Editions dOrganisation,
2002
Mars 1993

78

SOMMAIRE

Gnralits :................................................................................................................................ 2
I.
II.
III.
IV.
V.

Dfinitions :.................................................................................................................... 2
Apport de la statistique aux conomistes : ..................................................................... 2
Les limites de la mthode statistique : ........................................................................... 2
Le vocabulaire utilis en statistique : ............................................................................. 3
Quelques symboles mathmatiques utiliss : ................................................................. 5

Chapitre I : La reprsentation graphique.................................................................................... 6


I. Le diagramme en btons : .............................................................................................. 6
II. Le tuyau dorgue : .......................................................................................................... 6
III. Le diagramme :............................................................................................................... 7
IV. Le polygone des frquences : ......................................................................................... 7
V. La courbe cumulation (courbe des f cumuls) : ............................................................. 8
VI. Le diagramme polaire : .................................................................................................. 9
VII. Les graphiques secteurs :........................................................................................... 11
Chapitre II : LES PRANCIPALES CARACTERISTIQUES DUN SERIE ........................... 12
INTRODUCTION.................................................................................................................... 12
SECTION 1 .............................................................................................................................. 12
I. LES MOYENNES....................................................................................................... 12
II. La mdiane (Me) .......................................................................................................... 23
III.
Le Mode : ................................................................................................................. 25
IV.
Le choix dune caractristique de tendance centrale :.............................................. 27
SECTION 2 .............................................................................................................................. 28
I. Lintervalle de variation ou ltendue : ........................................................................ 28
II. Lintervalle inter quartile : ........................................................................................... 29
III.
Lcart absolu moyen :............................................................................................. 31
SECTION III ............................................................................................................................ 33
I. La dtermination algbrique de la concentration ......................................................... 33
II. La dtermination graphique de la concentration la courbe de Lorentz GINI............... 35
Chapitre III :Les Sries double entres : Rgression Linaire (Corrlation) ........................ 37
I- notion de tableau de contingence : ............................................................................... 37
II- gnralisation du tableau de contingences : ................................................................. 38
III- La rgression linaire ................................................................................................... 39
IV- la corrlation linaire :.................................................................................................. 43
Chapitre IV : Analyse des sries chronologiques..................................................................... 47
I Gnralits : .................................................................................................................... 47
II lanalyse de la tendance longue : trend .................................................................... 48
CHAPITRE V :Populations et chantillons, recensements et sondages .................................. 49
I. Quelques termes de base : ............................................................................................ 49
II.
Exemples: ........................................................................................................ 50
III.
tapes d'une enqute statistique : .................................................................... 50
EXERCICES ............................................................................................................................ 52

STATISTIQUE DESCRIPTIVE

Statistique descriptive
GENERALITES :
I. Dfinitions :

On appelle statistique la mthode scientifique qui vise observer, collecter,


analyser des donnes quantitatives.

La statistique descriptive est la partie de la statistique qui sert dcrire un


phnomne, c--d de mesurer, classer les mesures, prsenter ces mesures par
quelques indicateurs de manire donner une ide simple et rapide dun phnomne
tudi.
Les statistiques se sont des donnes chiffres relatives un phnomne tudi.
EX : des statistiques du chmage.

II. Apport de la statistique aux conomistes :


La statistique est un outil indispensable tant aux thoriciens quaux praticiens de
lconomie.

1. La statistique est utile aux thoriciens :

Elle permet de mettre en vidence (rvler) lexistence dinterdpendance entre


diffrents phnomnes conomiques. EX : M=P*T

Elle permet de tester la validit dune hypothse thorique.


Investissement = f (revenu) =0.76R+124
Consomm
Revenu
thsauris
Epargn
Investi

2. La statistique est utile aux praticiens de lconomie :

La statistique permet aux entrepreneurs de mieux contrler la gestion de leurs


entreprises.

Elle permet galement au pouvoir public de mieux dfinir leurs politiques


conomique, fiscale, montaire et demploi.

III. Les limites de la mthode statistique :


Pour viter des erreurs dinterprtation due une mauvaise utilisation statistique, il
faut savoir :
1.
La statistique sintresse au grand nombre, elle ignore les cas particuliers.
2.
La rsultante dun grand nombre dinformations peut tre diffrente de la
sommation de ces diffrentes informations.
*comportement collectif # sommation des comportements individuels
3.
Quand on tudie un phnomne on nest jamais certain que lon dispose de
toues les informations le concernant.

Page 2

STATISTIQUE DESCRIPTIVE
4.
Il ne faut pas oublier que la statistique nest quun outil au service de
lconomiste, ce qui nous oblige de ne jamais, oublier de faire une analyse
conomique des rsultats.

Les mmes causes # les mmes effets.

Les corrlations mmes trs parfaites ne signifient pas toujours


quil y a interdpendance entre les phnomnes tudis.

IV. Le vocabulaire utilis en statistique :


1. Population statistique :
Ensemble sur lequel porte ltude

Ex : Age des tudiants de 1reanne : lensemble tudi cest lge.

2. Unit statistique :
Une population se compose dlments chaque lment est appel
unit statistique.
EX : la population dtudiants : lunit statistique est un tudiant.

3. Caractre statistique :
Cest le critre retenu pour tudier une population
Continu
quantitatif
discontinu, discret
Qualitatif
Un caractre est dit quantitatif lorsquil est mesurable
Continu : cest un caractre qui peut prendre toutes les valeurs
dun intervalle donn.
EX : ge
Il peut tre

Discontinu : cest un caractre qui ne peut prendre que quelques


valeurs dans un intervalle donn
EX : le nombre des frres, Mnage
Un caractre est dit qualitatif lorsquil nest pas mesurable
EX : la nationalit, les catgories sociales professionnelles.

4. Modalit statistique : de caractre :


On appelle une modalit les diffrentes situations possibles dun caractre.
EX : caractre sexe : modalits possibles : M/F
Caractre tat matrimonial : 4 modalits possibles :
clibataire/mari/divorc/veuf.

Page 3

STATISTIQUE DESCRIPTIVE

5.

Effectifs (frquences absolues) :

Cest le nombre dunits statistiques relatif une modalit donne :


45Age
Effectifs
17-18
200
18-19
350
19-20
50
Effectifs
total
600

6. Frquence relative :
Cest la part des effectifs dune modalit.
EX : 200/600=33/100 est la frquence relative de premire modalit

7. Srie statistique :
Distribution de frquences, distribution de statistiques ou tableau statistique,
cest un tableau qui nous donne lensemble des valeurs mesurant le caractre.
EX :
sexe
Masc.
Fm.
total

Effectifs
200
100
300

Salaires (dh)
[40-60[
[60-70[
[70-80[
total

Effectifs
10
25
05
40

Nombre
denfants
2
3
4
5
total

Arbre de
mnages
18
28
10
4
60

Srie simple.

Srie avec des classes.

8. Classes :
On appelle classe un groupement de valeurs du caractre selon des intervalles
qui peuvent tre gaux ou ingaux.
Pour chaque classe on peut dfinir :
Une limite infrieure
Une limite suprieure
Intervalle de classe (amplitude)= limite (sup)- limite (inf)
Centre de classe = [limite (sup) + limite (inf)]/2
NB : [40-60[ signifie quon comptabilise les salaris qui gagnent entre 40 et 60DH,
en incluant ceux qui gagnent 40 DH et excluant ceux qui gagnent 60Dh.

Page 4

STATISTIQUE DESCRIPTIVE

V. Quelque symboles mathmatiques utiliss :


1. Les valeurs du caractre = x1, x2,, xi,, xn
Notes
x1
x2
x3
x4

Nbre dtudiants
10 x1
25 x2
12 x3
4 x4

2. Les effectifs sont symboliss par : x1, x2,, xi,, xn

x1, x2,, xi,, xn= N =effectif total

3. Frquence relative :
Fi = effectif de la modalit i / effectif total

4. Loprateur somme (

Notation : n variables
n

x1+ x2++ xi+.+ xn= xi


i =1

Proprits :
n

axi = a xi
i =1

i =1

i =1

a + xi = a xi = n.a + xi
5. Lopration de produit : ( )
Notation : le produit de x variable scrit :
X1.x2.x3.xn =

xi
i =1

Proprit :
n

a = a n
i =1

axi = a n
i =1

xi

Page 5

i =1

STATISTIQUE DESCRIPTIVE

CHAPITRE I : LA REPRESENTATION GRAPHIQUE


Lintrt dun graphique cest de synthtiser des informations statistiques dune
manir image, cest dire globale.

I. Le diagramme en btons :
On sen sert pour reprsenter des sries caractre discret.
Cordonn
Nombre denfants Nombre de mnage
40 .
0
25
30 .
1
42
20 .
2
38
10
.
3
15
. . . . . . .Les valeurs de
4
6
0123456
caractre
5
Total

Abscisse

128

II. Le tuyau dorgue :


On se sert de ce graphique pour reprsenter des sries caractre qualitatif
EX : La population une station balnaire est compose de :
Allemands : 45%
Franais : 30%
Espagnoles : 15%
Autres : 10%

50%
45%
Srie1

40%
35%
30%
25%
20%
15%
10%
5%
0%
Allemands

Franais

Espagnoles

Autres

Page 6

STATISTIQUE DESCRIPTIVE

III. Le diagramme :
Il permet de reprsenter des sries de caractres ou les observations sont
regroupes en classe.
a.
Cas ou les intervalles de classe sont gaux :
50%
45%
40%

Allemands
Franais
Espagnoles
Autres

35%
30%
25%
20%
15%
10%
5%
0%
1

Remarque :
1)
Lorsque une des limites de classe nest pas prcise dans un tableau il
convient de prendre comme intervalle de classe le mme que celui de la classe
suivante ou prcdente.
2)
La surface des rectangles est proportionnelle leur effectif.
b.

Cas ou les intervalles de classe ne sont pas gaux :

EX : Rpartition de population selon leurs salaires.


25

Srie1
20

15

10

0
1

Pour tracer lhistogramme, on commence par corriger les effectifs.

IV. Le polygone des frquences :


Il permet de donner une image plus lisse du phnomne que lhistogramme. On
lobtient en joignant les milieux des sommes des rectangles de lhistogramme.

Page 7

STATISTIQUE DESCRIPTIVE

. . . . . . . .
0 10 20 30 40 50 60
Remarque :
1)
La surface sous le polygone = la surface de lhistogramme.
2)
Lorsquil y a un trs grand nombre de classe, lintervalle de classe devient de
plus en plus petit et le polygone de frquences se transforme en cours de frquence.

Courbe de frquences

V. La courbe de cumulation (courbe des f cumuls) :


Elle permet de connatre le nombre dobservations suprieures ou infrieures une
valeur donne.
Les 2 types de courbes de cumulation :
Courbe cumulative croissante : permet de connatre le nombre
dobservations infrieures une valeur donne.
Courbe cumulative dcroissante : il permet de connatre le nombre
dobservations suprieures une valeur donne.
a)

Cas dune variable continue :

Salaire

xi

Xi cumuls

Xi cumuls

[10-20[
[20-30[
[30-40[
[40-50[
[50-60[
[60-70[
Total

9
13
22
10
7
4
65

9
22
44
54
61
65
Moins de la borne
suprieure

65
56
43
21
11
4
Plus de la
borne
infrieure

Page 8

STATISTIQUE DESCRIPTIVE

Remarque :
On obtiendrait le mme graphique si on remplace les frquences absolues par les
frquences relatives (les pourcentages)
Courbe cumule dcroissante
Courbe cumule croissante
70

60

50

40

30

20

10

0
1

b) Cas dune variable discrte (discontinue)


NB denfants (xi)
1
2
3
4
Total

NB de mnage
5
10
30
20
65

Xi cumuls
5
15
45
65
<=xi

Xi cumuls
65
60
50
20
>=xi

Xi
65
40
20
10
Xi
0 1 2 3 4 5

VI. Le diagramme polaire :


On lutilise pour reprsenter des sries chronologiques cest dire des sries ou
les observations seront des temps rguliers.

Page 9

STATISTIQUE DESCRIPTIVE
a)
Les principes des coordonnes polaires : un point M dans lespace est
parfaitement repr :
Si on connat ses coordonnes cartsiennes (x, y).
Si on connat ses coordonnes polaires (e, o).

M
e

O
b)

X
Le diagramme polaire :

Soit la srie chronologique suivante : chiffre daffaire mensuel


Anne
Janvier
Fvrier
Mars
Avril
Mai
Juin
Juillet
Aot
Septembre
Octobre
Novembre
dcembre

1999
55
53
65
50
43
41
35
30
34
40
45
55

2000
65
75
72
40
42
38
32
34
38
40
33
45

Lide est de prsenter chaque mois par un


axe, nous aurons donc 12 axes, chaque axe
faisant avec son voisin un angle.

Avr

Juillet

.
30 .
20 .
10
.
. . . . . . . . ..
. . . . . . . . . . . .
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
10 .
20 .
30 .
Oct.

Page 10

Jan

STATISTIQUE DESCRIPTIVE

VII. Les graphiques secteurs :

On les utilise pour reprsenter une srie exprime en pourcentages.


EX : Pourcentage de touristes.

FR
All
Esp
Autres

Page 11

STATISTIQUE DESCRIPTIVE

CHAPITRE II : LES PRANCIPALES CARACTERISTIQUES


DUN SERIE
INTRODUCTION
Avec la reprsentation graphique nous avons vu comment synthtiser une srie avec
image.
Dans ce chapitre nous allons voir comment synthtiser une srie par quelques chiffres.
Ces nombres sont appels caractristiques dune srie.
Soit les srie suivantes :
Serie1 : 78-79-80-83
Srie2 : 60-70-80-90-100
Srie3 : 1-1-1-1-396
Les sries ont toutes la moyenne 80 mme si elles sont trs diffrentes les unes que les autres.
Les valeurs de la 1re srie sont proches de la moyenne alors que celles de la 3me sont
loignes de la moyenne.
Il y a donc ncessit, pour rsumer une srie de donnes de la prsenter en 2 types de
caractristiques :
- les caractristiques de valeurs centrales.
- les caractristiques de dispersion.

SECTION 1 : Les Caractristiques de Valeur Centrale :


I. LES MOYENNES
A- La moyenne arithmtique :
A-1 Dfinition
Etant donne n observations quon va appeler X1,X2 ,X3,Xi,Xn on
appelle une moyenne arithmtique simple le nombre
Somme de toutes les observations

=
Le nombre dobservations

x1 + x 2 + ....... + xi + ...... + x n
n

Page 12

STATISTIQUE DESCRIPTIVE

x
i =n

: Une moyenne arithmtique simple

n
Lorsque les observations sont groupes c'est--dire que lon observe
N1 fois X1
N2 fois X2
La moyenne arithmtique scrit :

x1 + x1 + ..... + x 2 + x 2 + ......
n1 + n 2 + .... + n n

n x
i =n
n

n
i =1

Une moyenne arithmtique pondre

A-2 Application
Exercice1 : soit la srie de notes suivante : 2-6-12-10-12-10-10-6
2 + 6 + 12 + 10 + 12 + 10 + 10 + 6 68
=
8
8
= 8,5
=

Exercice2 : soit la srie des notes de lexercice qui peut tre prsente de la
manire
suivante :
Notes xi
Effectifs ni
ni xi
=

68
= 8,5
8
n

n x
=
n
i =1

2
6
10
12
total

Page 13

1
2
3
2
8

2
12
30
24
68

STATISTIQUE DESCRIPTIVE

Exercice3 : soit les srie suivante :


rpartition selon lage

age

Ni

ni xi

[20 25[
[25 30[
[30 35[
[35 40[
[40 45[
[45 50[

Centre de
classe xi

8
10
20
25
15
10

22,5
27,5
32,5
37,5
42,5
47,5

180
275
650
937,5
637,5
475

TOTAL

88

3155
= 35,85 Annes
88
Moyenne de lage ou lage moyen

3155

a-3 Mthode des simplifications des calculs


Lorsque les calculs sont compliqus, on peut les simplifier en prcdant un
changement de variable
Par changement dchelle : Tout variable Xi peut scrire : Xi= a Xi
a= nouvelle chelle

Xi= nouvelle variable

Ex
Xi

Xi

Xi

Xi

24

24

24

36

36

36

a=1
Xi = Xi

a=6
a =6

Xi = 4
Xi = 6

par changement dorigine et dchelle : tout variable Xi peut scrire

xi = x 0 + axi'
X0 = nouvelle origine

a : n.chelle

Xi : n. variable

Ex :
Xi

X0

14

= 4

22

Xi
*

5
*

Page 14

STATISTIQUE DESCRIPTIVE

Si on pose xi = x0 + axi' xi' =

xi x0
a

La moyenne arithmtique :
ni x i
=
ni

n (x + ax )
=
n
x n + a n x
=
n
n x
= x +a
n
i

'
i

'
i

'
i

= x 0 + a avec
'
i

'
i

n x
=
n
i

'
i

X0= n origine
a: n chelle
xi' : n variable

= x0 + a xi'

On utilise cette relation pour simplifier les calculs de la manire suivante


On prend pour X0 la valeur de caractre la plus frquente
On prend a lintervalle des classes lorsque les classes sont gaux
Application :
Calculez la moyenne avec
changement du variable
x0 = 37,5 cest le centre de
classe modale
a= 5
xi =( xi - x0)/5

'
i

n x
=
n
i

'
i

Age
20-25
25-30
30-35
35-40
40-45
45-50
total

effictifs
8
10
20
25
15
10
88

= 37,5+5(-29/88)=35,8 ans

Page 15

xi
22,5
27,5
32,5
37,5
42,5
47,5

xi= (xi- x0)/a


-3
-2
-1
0
1
2

ni*xi
-24
-20
-20
0
15
20
-29

STATISTIQUE DESCRIPTIVE

a-4 calcul de la moyenne arithmtique laide des frquences relatives

n x
n
i

n1 x1 + n2 x 2 + ...... + ni xi + nn x n
ni

ni x i
n x
n x
+ 2 2 + ......... + n n
n i ni
ni

= f i xi + f 2 x 2 + ........ + f n x n

ni

ni

frquence relative
xi
10
11
12
13
14

do : = f1x1 +f2x2 +.+fnxn

fixi

=12,7

Ni
5
8
10
12
5
40

fi
0,125
0,20
0,25
0,30
0,125

fixi
1,25
1,6
2,5
3,6
0,75
12,7

B- La moyenne gomtrique :
b-1 Dfinition
tant donne n observations connues individuellement (x1,x2,x3,,,,,,,,,,, xn)
on appelle moyenne gomtrique simple de ces n observations la grandeur G t.p :
G= n X 1. X 2..... Xn = ( X 1. X 2.... Xn) 1/n

i =n
G = xi
i =1
b-2 calcul de G

lorsque les observations sont groupes ; chaque pondr Xi sera pondr


par leffectif correspondant, la moyenne gomtrique scrit :
G = n X 1. X 1. X 1 * X 2. X 2. X 2 * X 3 * X 3 X 3
N= n1+n2 +..+nn

G= n X 1n1. X 2 n 2. X 3 n 3.... Xn nn .

calculer G est plus facile en passant par le logarithme, en effet.

Page 16

STATISTIQUE DESCRIPTIVE

G= n X 1. X 2.... Xn = ( X 1. X 2. X 3..... Xn )
log G = 1/n log (X1.X2..Xn)

1/ n

= 1/n [log X 1 + log X 2..... + log Xn]

log Xi
Log G=
Ni

La moyenne gomtrique pondre

G = n x1n1 .x 2n2 ........x nnn

G = x1n1 .x 2n2 .......x nnn

log x1n1 .x2n2 .....xnnn


1
nn
n1
n2
log G = log x1 .x2 ........xn =
n
n
=

n1.logx1 + n2 logx2 +......+ nnnn


n

log G =

n log
n
i

xi

Application :
calculer la
moyenne gomtrique
7,316
= 0,9145
8
G = 10 0,9145 = 8,2
log G =

xi
2
6
10
12
Total

Page 17

ni
1
2
3
2
8

log xi
0,301
0,772
1
1,158

ni log xi
0,301
1,556
3,0
2,158
7,316

STATISTIQUE DESCRIPTIVE

C-

la moyenne harmonique :

c-1 Dfinition
tant donne n observations connues individuellement x1,x2,x3 ..xn
on appelle moyenne hormique le nombre H tel que :

1
=
H
H=

x1

n
1

1
+ ...... + 1
xn
x2
=
n

1x

moyenne harmonique simple.

xi

Si les observations sont groupes la moyenne harmonique scrit :

1
=
M

x1 . 1

x1

n 1x
n

+ x2 . 1

+ ..... + nn . 1
x2
xn
=
n1 + n2 + ......nn

H=
Moyenne harmonique pondre

c-2 Application

1
=
H

1
=
H

xi

ni

H=
c-3 Remarque

xi

ni

2
6
10
12
total

1
2
3
2
8

1/ xi
0,5
0,166
0,1
0,083

1,298
8

8
= 6,16
1,298

n 1x
n

n
n 1x

n .X
n
i

avecX i =

1
xi

Linverse de la moyenne = moyenne des inverses

Page 18

ni.1/ xi
0,5
0,332
0,2
0,166
1,298

STATISTIQUE DESCRIPTIVE

-La moyenne quadratique :

Dfinition : Etant donn n observations connues individuellement X1 ;


X2 ;..xn
xi2
x12 + x 22 + ..... + x n2

2
2
Q =
Q =
n
n

Q=

2
i

moyenne quadratique simple

si les observations sont groupes, la moyenne quadratique scrit :


n .x 2 + n2 .x 22 + ...... + nn .x n2
Q2 = 1 1
n1 + n2 + ...... + nn

n .x
=
n
i

2
i

Q=

n .x
n
i

2
i

moyenne quadratique pondre

Application :

Q2 =

n .x
n
i

2
i

664
= 83
8

Q = 83 = 9.1

n .x
=
n
i

2
i

n .X
n
i

avecX i = xi2

Carr de la moyenne = la moyenne des carrs

Page 19

xi
2
6
10
12

Ni
1
2
3
2

total

Xi
4
36
100
144

Ni. Xi
4
72
300
288
664

STATISTIQUE DESCRIPTIVE

Gnralisation de la notion moyennes :


d.1-

moyenne dordre r

on appelle moyenne dordre r la quantit Mr tel que :

x r + x 2r + ........ + x nr
M r = 1
n

M rr =

x1r + x 2r + .... + x nr
n

Si r= 1 M 11 =

x1 + x 2 + x3 + ....... + x n
M 11 =
n

si r= 2 M 22 =

x12 + x 22 + ....... + x n2
M 22 = Q 2 M 2 = Q
n

si r= -1 M 11 =
si r=

d.2-

0.

x11 + x 21 + ...... + x n1
1
1

= H 1 =
M1 = H
n
M 1
H
M 0 = G

le classement des moyennes : les ingalits entre les moyennes :

On dmontre que les moyennes sordonnent selon la valeur de r c--d


que si : r1 < r 2 M r1 < M r2 Ce qui nous donne : M 1 < M 0 < M 1 < M 2

H <G<<Q
Dans notre exemple, on trouve : 6,16 <8,2 <8,5 < 9,11.
d-3 Le choix dune moyenne :
En thorie, aucune moyenne nest meilleure que lautre. Lutilisation de telle
moyenne dpend du problme pos.
Exemple :
Ex1 : Soit un petit jardin sous forme de rectangle, le propritaire ne peut se souvenir
que dun seul chiffre.
9

4
9

Sil veut entourer son champs de fil de fer il a intrt se souvenir de la


moyenne arithmtique car le primtre est li la somme des diffrents cts.

Page 20

STATISTIQUE DESCRIPTIVE

Sil veut mettre de lengrais son jardin, il a intrt se souvenir de la


moyenne gomtrique

9+4+9+4
= 6,5; G = 9 * 4 = 6
4
moyenne arithmtique du primtre =26 =6,5 * 4 6 * 4
moyenne gomtrique : surface =36 =6*6 6,5 * 6,5
=

Gnralits :
Dune manire gnrale, on retient la moyenne arithmtique quand les variables
sadditionnent, et on utilise la moyenne gomtrique lorsque les variables se
multiplient.
Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h 80Km/h.
distoncetotale 100 + 160
100 + 160
Vitessemoy =
=
=
100 160
1
1
tempstotal
100. + 160
+
50
80
50 80
ni
MH =
ni . 1 xi
La vitesse moyenne est gale la moyenne harmonique des vitesses pondres par
les distances.
Ex3 : Une voiture roule pendant une heure 50 Km/h puis 3h 80Km/h.

Vitesse.moy =
=

distoncetotal (1 50) + (3 80)


=
1+ 3
tempstotal

n x
n

i i
i

La vitesse moyenne est gale donc la moyenne arithmtique des vitesses


pondres par le temps.
Ex 4 : Une grandeur S0 a augment sur 3 annes, dabord de 10% puis de 15% et
30% pour le 3me anne.
Quel est le taux moyenne de croissance ?
1re anne : S0 devient S1=S0 + (S0*10/100)
S1 =S0(1+0,10 ) = 1,10S0
2me anne S1 devient S2 = S1 +0,15S1
S1*1,15 (S1*(1+0,15))
3me anne S2 devient S3 = S2 +0,3S2 = 1,3S2 (S2*(1+0,3))
S3 = S01,1 1,15 1,3
Moyenne gomtrique G = 3 1,1 1,15 1,3 = 1,1804
Remarque: le taux de croissance moyenne est 18,04%

Page 21

STATISTIQUE DESCRIPTIVE

Ex 5 : Un tudiant a obtenu les notes suivantes : 8-10-12 on veut calculer la


moyenne des carts entre les notes et la moyenne arithmtique.

8 + 10 + 12
= 10
3

Ecart type la moyenne


8-10 = -2
10-10 =0
12-10 =2

moyenne arithmtique des carts = (-2+0+2)/3


moyenne arithmtique des carts = 0

On retrouve ici une des proprits des moyennes arithmtiques :


xi = 0

x x =x

n x = xi n

=0
n
Si on veut calculer la moyenne des carts, il vaut mieux calculer la moyenne
quadratique

Dmonstration :

Q2 =
Q=

( 2)2 + (0)2 + (2)2


3

8
3

8
= 1,6
3

Page 22

STATISTIQUE DESCRIPTIVE

II. La mdiane (Me)


b-1- Dfinition :
On appelle mdiane dune srie classe par ordre croissant ou
dcroissant, la valeur du caractre qui partage en deux parties gales les effectifs.
Cest la valeur du caractre telle que la moiti des effectifs lui est
suprieure et lautre lui est infrieure.

b-2- Calcul de ME :
Cas dune variable discrte
Si la srie a un nombre impair de terme

Me =57
75 62 57 12 18
Si la srie a un nombre pair

12 25 32 44 52 69
Intervalle Mdian [32-44]
On prend le centre de lintervalle comme la mdiane :
Cas dune srie de classes :
Salaires
10-15
15-20
20-25
25-30
Total

Effectifs
9
25
32
16
82

Le calcul de la mdiane se fait en 3


tapes :
1re tape : on repre le rang de la

Effectifs cumuls
9
34
66
82

mdiane. Rang = 82/2 = 41


Rang =

ni

2me tape : on repre la classe de Me :


Il sagit de trouver la classe laquelle appartient le 41me individu,
pour cela on classe les individus par ordre croissant des salaires, ce qui revient
construire la colonne des effectifs cumuls.
.
Me [20-25], on peut calculer avec plus de prcision Me en faisant une
interpolation linaire.
3me tape : linterpolation linaire :
On connat les salaires des 34 individus 20
On connat les salaires des 66 individus 25
Le 41me individus cest le 7me individus que je rencontre dans la classe 20 -25,
son salaire sera obligatoirement gal 20 + supplment que lon calcule par
interpolation.
En supposant que les 32 individus de la classe 20-25 sont rpartis dune manire
uniforme dans la classe
20-25 puis sont spars par la mme quantit de salaire
On raisonne alors de la manire suivante :
Si pour 32 individus nous avons un cart de salaire de 5 DH

Page 23

STATISTIQUE DESCRIPTIVE
Pour 1 individu
5/32
Pour 7
individus
5/32 * 7 = 1.09 DH
Me=20+1.09 =21.09
La moiti des effectifs gagnent plus de 21,09 DH et lautre moiti gagne (moins de
21,09 DH)

b-3- Dtermination graphique de la mdiane :


Courbe cumulative

b-4-Remarque :
Salaire
10 15
15 - 20
20 - 25
25 - 30

Xi
9
25
32
16

Xi
9
34
66
82

Total Xi =82

Page 24

STATISTIQUE DESCRIPTIVE

Mthode rapide dinterpolation :

Me 20
41 34
75
=
Me =
+ 20 21
25 20
66 34
32

2. le 41 me individu normalement la mdiane devrait se situer entre le 41


me et le 42 me, mais on convient lorsque les effectifs sont nombreux de
prendre (N / 2)
III. Le Mode :
Cest la valeur du caractre le plus frquent.
A- Calcul Mode :
1- Cas dune variable discrte :
Xi
3
14
21
42

ni
3
18
7
4

Mo =14
Srie
Uni modal

Xi Ni
2
4
17 16
33 15
39 16
51 8
Mo = 17

Mo = 39
Srie bimodale
Srie plurimodale (srie plusieurs modes)

Page 25

STATISTIQUE DESCRIPTIVE

2-Cas dune srie de classe :


Salaires
10 15
15 20
20 25
25 - 30
Total

ni
9
25
32
16
82

-Nous avons une classe modale : 20 25


- On peut prendre comme mode le centre de classe 22,5
- On peut chercher obtenir le mode avec plus de prcision :

1/ Par Mthode graphique : Elle consiste dabord construire lhistogramme

N.B : Ne pas oublier, lorsqu on construit lhistogramme de corriger les


effectifs.
2/ Par la mthode algbrique :
Mo = L1 + [d1. I / (d1 + d2)]
Mo = 20 +

( 32

25 ) *

(32-25) + (32 - 16)

Page 26

STATISTIQUE DESCRIPTIVE

L1 : Limite Infrieure de classe modale


d1 : La diffrence entre les effectifs de la classe modale et les effectifs de
classe prcdente
d2 :
La diffrence entre les effectifs de classe modale et les effectifs de
classe suivante
i : Lintervalle de la classe modale
IV. VI- Le choix dune caractristique de tendance centrale :
A : Les conditions de Yule :
1 r conditions : Une modalit caractristique doit tre : dfinie de faon
objective. (2 personnes diffrentes doivent trouver le mme rsultat)
2 me conditions : Tenir compte de toutes les observations
3 me conditions : tre facile comprendre
4 me conditions : tre facile calculer
5 me conditions : Doit se prter au calcul algbrique
B : Comparaison des diffrentes caractristiques de tendance centrale :
1-La moyenne :
Elle rpond parfaitement aux conditions de Yule ; cest pour
cela quelle est la caractristique la plus utilise, mais il y a des cas ou il faut lui
prfrer la mdiane quand elle risque dtre influenc des valeurs extrmes.
EX:
Notes
1
16
17
18

Xi
1
2
5
2
10

Ni * Xi
1
32
85
36
154

X = 154 / 10 = 15,4
X = 153 / 9 = 17

2-La mdiane :
Elle ne satisfait pas les conditions de yule.
En effet, la valeur de la mdiane ne change pas quand on augmente la valeur
dune observation qui lui est infrieure
15 22 34 41 60
1 2 34 41 60

122

34

Page 27

41

110

STATISTIQUE DESCRIPTIVE

3-Le mode :
Ne remplit pas les conditions de Yule, mais il y a des cas ou il est
utile, en particulier quand on cherche la valeur la plus typique dune srie :
Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure
moyenne, mais va stocker les chaussures les plus vendues.

SECTION 2 : Les Caractristiques de Dispersion:


Partons de 3 sries
Srie 1 : 9
Srie 2 : 5
Srie 3 : 1

11
15

X
_

= 10
= 10

19
X = 10
Les 3 sries ont la mme moyenne : 10 et portant ils sont
diffrents lunes des autres.
Dans la 1re srie ; les valeurs du caractre sont proches de la
moyenne. La moyenne est reprsentative.
Dans la 3 me Srie les valeurs du caractre sont loignes de la
moyenne. Il faut donc lorsquon rsume une srie, indiquer par un nombre si les
valeurs sont proches ou loignes de la valeur centrale.
Ce nombre est appel caractristiques de dispersion.
I. Lintervalle de variation ou ltendue :
Cest la diffrence entre la plus grande valeur du caractre et la plus petite.
Lintervalle de variation = Val MAX Val MIN
= 10 srie 2
= 18 Srie 3
= 2 Srie 1
Etendu ou intervalle de variation nest pas un indicateur toujours fiable, car il
dpend des valeurs extrmes qui prouvent tre fausses ou aberrantes.
EX :
17.1820.60.Age
1000 tudiants
=3

= 60 17 = 43

Page 28

STATISTIQUE DESCRIPTIVE

II. Lintervalle inter quartile :


A- Dfinition des quartiles :
On appelle 1r quartile Q1 la valeur du caractre tel que : 25%
des observations lui sont infrieurs et 75% lui sont suprieurs. 25% < ; 75%>
2me quartile Q2= Me 50% < 50%>
3m quartile Q3=
75%<
25%>
B- Dfinition inter quartile :
On appelle inter quartile : Q3 Q1 diffrence entre 1r quartile
et 3me quartile.
N.B : Intervalle Inter quartile contient 50% des observations
C- Application :
N= 82
Rang : 82/4 =20 ,5
Classe : [15-20]
Interpolation : 15+
Salaires
Effectifs Ecart I. Inter quartile
10-15
9
Q3 Q1
15-20
25
=24,3 - 17,3
20-25
32
= 7DH
25-30
16
Total
82
Interprtation : Si 25 individus
Si 01 Individu
(20,5 - 9) = 11,5

Ni Cum
9
34
66
82

Augmentation de 5 DH
Augmentation 5/25 DH

5/25 * 11,5

Donc Q1 = 15 + 5/25 *11,5 = 17,3 DH


2me Mthode :

Page 29

STATISTIQUE DESCRIPTIVE

Calcul de Q3
Rang : 82*3/4 =61,5
Classe = [20-25]
Interpolation : si 32 individus

augmentation de 5 DH

01 Individu

Augmentation de 5/32

(61,5 34) = 27,5 individus

Augmentation 5/32 *27,5

Donc Q3 = 20+ [(5/32) *27,5]


Signification : 24,3dh cest le salaire tel que 75% gagnent plus de 24,3 et 25%
gagnent moins de 24,3 DH.
Inter. Inter quartile : 7 DH = Q3-Q1
Signification : pour 50% des effectifs lcart Maximum de salaire est de 7 DH
D Remarque :
1- Les dciles : valeur du caractre que 10 % des observations ont une valeur qui
est infrieure D1 et 90% des observations ont une valeur qui est suprieure
D1.
On appelle 9 me dcile de 9 la valeur du caractre tel que 90% des observations
lui sont infrieures, et 10% des observations lui sont suprieures. Lintervalle
inter dcile D9 - D1 contient 80% des observations
2- Les percentiles :
On appelle percentiles P1 la valeur du caractre telle que un pourcent (1%) des
observations ont une valeur infrieure P1 et 98% ont une valeur suprieure
P1.
Pour le statisticien KELLY pour supprimer les valeurs aberrantes il suffit de
calculer lintervalle inter percentile P93 P07 qui contient 86% des observations.

Page 30

STATISTIQUE DESCRIPTIVE

Lcart absolu moyen :


A- Dfinition : On appelle cart absolu moyen que lon dsigne par la
moyenne arithmtique des carts absolus entre les valeurs du caractre et
la moyenne arithmtique.
Ca=

ni xi x /

ni

B- Application : soit le tableau suivant :


Poids
55-60
60-65
65-70
70-75
75-80

ni

xi

12
17
36
24
11
100

57,5
62,5
67,5
72,5
77,5

ni * xi
690
1062,50
2430
1740
852,50
6775

Ca= 442.5 / 100 = 4.42 Kg

xi x

10,25
5,25
0,25
4,75
9,75

ni xi x

123
89,25
9
114
107,25
442,5

= 67.75 Kg

Signification : Ca = 4.42 Kg signifie quen moyenne, chaque individu


sloigne de la moyenne (67.75 Kg) de 4.42 Kg.
Remarque : Pour dire si une dispersion est grande ou non, pour comparer
deux sries entre elles, on se sert de lindice de dispersion relatif = Ca / X *100
Exemple :
Poids de filles
Poids des garons
=52 Kg
=68 Kg
Ca= 2 Kg
Ca = 17 Kg
2/52 *100= 3.8%
Dispersion Faible

17/68 * 100 = 25%


dispersion plus importante

IV- La variance et lcart type :


A- Dfinition :
On appelle une variance la moyenne arithmtique des carrs des carts entre les
valeurs du caractre et la moyenne arithmtique.
2 = ni ( xi x) /
2

ni
Page 31

STATISTIQUE DESCRIPTIVE

On appelle cart-type (ou cart quadratique moyen) la racine carr de 62


=

ni ( xi x) 2 / ni

B- Application :
Le mme tableau prcdent
(xi- )2

ni*(xi- )2

105,0625
27,5625
0,0625
22,5625
95,0625

1260,75
468,5625
2,25
541,50
1045,6875
3318,75

ni( xi x) / ni
2

3318.75/100 =5.76

Signification : En moyenne chaque individu scarte du poids moyen


(67.5 kg) de 5.76 kg.
C- Remarque :
Si on veut savoir la valeur de dispersion on utilise le cfficient de
variation = /
Ex :
=67.75 Kg / =(5.76/67.75) *100= 8.5%
Ex 2 :
Soient 2 modles dampoules lectrique dont on a relev les dures de
vie.
Modle 1 : Dure de vie moyenne 1400 H.
Modle 1 : Dure cart-type =100 H
Modle 2 : Dure de vie moyenne 1800 H.
Modle 2 : Dure cart-type = 250 H

Page 32

STATISTIQUE DESCRIPTIVE

Modle I
Modle II
250/1800 *100 = 14%
6/ =100/1400 = 7%
Le modle I est plus faible que le modle II
Formule dveloppe :
2
Donc
= ni xi

ni

Poids
55-60
60-65
65-70
70-75
75-80

ni

xi

xi2

ni * xi2

12
17
36
24
11
100

57,5
62,5
67,5
72,5
77,5

330625
390625
455625
525625
600625

39675
66406,25
164025
126150
66068,75
462325

= 462325 - (67.75)2 33.19


100

= 33.19 =5.76

SECTION III : Les Caractristiques de Concentration


La concentration ne sapplique qu des sries statistiques ou la concentration
de la variable a un sens
EX : on peut parler de la concentration de revenus, concentration foncire
Autres EX : on ne peut pas parler de concentration dge
On peut dterminer la concentration soit algbriquement soit graphiquement
I. La dtermination algbrique de la concentration
Cette dtermination ncessite la connaissance de la mdiale
Notion de la mdiale (Ml)

A- La mdiale
Si dans une srie on dsigne par xi la valeur du caractre, par ni les effectifs, la
mdiale est la valeur du caractre qui partage en deux parties gales le produit
cumul de ni xi.
Si xi dsigne un salaire
Ni dsigne le nombre de salaris

Page 33

STATISTIQUE DESCRIPTIVE

Le produit cumul des ni xi reprsente la totalit des salaires Verss

nixi

Cest--dire la masse salariale.


La mdiale, cest le salaire tel que la moiti de la masse salariale a servi payer
une partie qui touche moins de cette Mdiale et lautre moiti de la masse s a servi
payer les gens qui touchent plus de cette Mdiale.
B- Mesure de la concentration
M sert mesurer la diffrence entre ML et ME :
M=ML ME
* Si M = 0 cela veut dire que ML =ME
C'est--dire lindividu qui est au milieu leffectif est en mme
temps celui qui est plac tel que la moiti de la masse salariale a t
verse des gens qui touchent moins que lui, et lautre moiti des gens
qui reoivent plus que lui, on a donc une distribution galitaire
concentration est nulle
* Si m 0 cela indique quil y a une concentration
* Si m est faible par rapport lintervalle de variation la concentration est
faible
* Si
m
est important, la concentration est forte
Inter variation

C- application
salaire
10-15
15-20
20-25
25-30
total

ni
8
25
32
16
82

M= ML ME
Calcule de la ML :
Rang = 1710/2=855
Classe [20.25]
Interpolation linaire

Donc ML= 20+5/720*350

ML = 22.12dh

xi
12.5
17.5
22.5
27.5

nixi
112.5
437.5
720
440
1710

nixi
112.5
550
1270
1710

720 5dh
1dh 5/720dh
(855-550) =3055 5/720*305dh

M = ML - ME
= 22 ,12 - 21,09 1dh

Page 34

STATISTIQUE DESCRIPTIVE

M/inter varia = 1/20=5% concentration faible


Lintervalle de variation
tant gale : (30-10)=20
Signification ML = 22.12 dh

Cest le salaire tel que la moiti de la masse salariale a servi payer des
gens qui gagnent moins que 22.12 dh et lautre moiti de la masse
salariale a servi payer les gens qui gagnent plus que 22.12 dh

II. La dtermination graphique de la concentration la courbe de Lorentz


GINI
A- la graphique de GINI
GINI propose de mesurer la concentration en mettant en abssices les
frquences cumules en%, et en ordonnes ni xi cumuls en %
salaire

ni

Fi%

Fi% *n

xi

nixi

Nixi%

10-15

11

11

12.5

112.5

6.6

15-20

25

30.5

41.5

17.5

437.5

25.6

20-25

32

39

80.5

22.5

720

24.1

25-30

16

13.5

100

27.5

440

25.7

82

100

total

Nixi%cum
6.6
32.2
74.3
100

1710

: Diagonal de lgalit
: Aire de concentration

Remarques :

1) si 10% de la population touchent 10% du revenu, 20% de la


population touchent 20% du revenu. Dans le cas dune rpartition
galitaire du salaire, laire de concentration serait confondue avec
diagonal.
2) Dans le cas dune repartions illgalitaire parfaite des salaires,
(comme dans le cas thorique ou 0.1% de la population toucherait
99.99% de la masse salariale : la courbe

Page 35

STATISTIQUE DESCRIPTIVE

B)-Le coefficient de Gini :


Gini propose de calculer la concentration laide de coefficient suivant :

Aire de concentration
C=
Aire du triangle ABC
Aire de G
C=
5000(100*100/2)
On peu estimer laire de concentration de la manire suivant :
Aire de concentration = 5000-(S1+S2+S3+S3)
B

S=1/2 a*b

S1 = (116.6)
S2= (41.5-11)/2(6.6+32.2)
S3= (80.5-41.5)/2(32.2+74.3)
S4 = (100-80.5)/2(74.3+100)
Si = 4404

A
A
n
S = n/2(a+b)
b
Remarque : 0<c<1
c = 0 Concentration lev
c = 1 Concentration faible

Donc c=5000-4404/5000 0.12


C d les gens sont pareils

Page 36

STATISTIQUE DESCRIPTIVE

CHAPITRE III :LES SERIES A DOUBLE ENTREES :


REGRESSION LINEAIRE (CORRELATION)
I-

notion de tableau de contingence :

A. une distribution statistique double


Cest une distribution ou lobservation seffectue selon 2 caractres.
EX : Rpartition des tudiants selon la taille et lge
Rpartition des logements selon le nbre de pices et superficie
10-30
30-50
50-70
70-80
total
superficie
nbr de piece

1
2
3
4
5
total

3
1

1
14
1

3
7
10
6
20

16

4
7
6
17

18
12
17
6
57

B. distributions marginales

Ce sont les distributions relatives la seul variable X ou Y


a- la rpartition des logements selon le nombre de pices (X)
Nbre de
Nbre de logement
pices (x)
1
4
2
18
3
12
4
17
5
6
total
57

Cette distribution qui concerne la seule variable x est applle distribution marginale (marginal
car on la trouve la marge du tableau statistique)
On peut calculer la moyenne de cette distribution, (et sa signification est le nbre de pices
moyenne par logement)
Moyenne appele moy.marginale note
b- la rpartition des logements selon la superficie :
superficie y
10-30
30-50
50-70
70-80
total

Nbre de logements
4
16
20
17
57

Page 37

STATISTIQUE DESCRIPTIVE
Cette distribution qui concerne la seule variable y est appele distribution marginale on peut
calculer la moyenne (qui exprime la surface moy des logements) applle moy.marginal note

C. Les distributions conditionnelles :

On appelle distribution Conditionnelle la distribution ou lon a pos une condition sur lune
des variables.
Ex : Rparation de logements de 30-50m
Cette distribution est appele Distribution Conditionnelle parce que lon ne sintresse quaux
logements qui satisfont la condition de surface 30-50 m2.
On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pices des
logts de 30-50 m2) on appelle cette moyenne : moyenne conditionnelle.
Dans cet exercice on calcule
Remarque il existe autant de distributions conditionnelles relatives au caractre x que le
caractre y a de modalits

II-

gnralisation du tableau de contingences :

Y2
.
Yj
.
x
y Y1
X1
X11
X12
.
X1j
.
X2
X21

.
X2j
.

.
Xi
Xi1
Xi2
.
Xij
.

.
Xk
Xk1
Xk2
.
Xkj
.
total
x.1
x.2
.
x.j
.
x1 x2 . . . xk = les modalits de x
y1 y2 . . . yk = les modalits de y
x1 .effectifs pour la 1re modalits de x et pour toutes les modalits de y
La distribution marginale de X :
X(xi)
X1
X2
.
.
Xi
Xk
Total

Xi.
X1.
X2.
.
.
Xi.
Xk.
X..

Page 38

Ym
X1m
X2m

Xim

Xkm
x.m

total
X1.
X2.

Xi.

Xk.
x..

STATISTIQUE DESCRIPTIVE

La distribution marginale de y :
Xj.
X.1
X.2
.
.
X.i
Xm.
X..

y(xi)
y1
y2
.
.
yi
ym
Total

Distribution conditionnelle relatif X et Y


Dist. Conditionnelle relative X
X
X1
X2
.
.
Xi
Xk
Total

III-

Dist. Conditionnelle relative Y

Xij
X1j
X2j
.
.
Xij
Xkj
X.j

y
y1
y2
.
.
yi
ym
Total

Xij
Xi1
Xi2
.
.
Xij
Xim
Xi.

74

83

Total

1
1

1
1
1
1
1
1
6

La rgression linaire
A. Prsentation du problme :

Soit le tableau suivant :


qu
Prix
70
75
77
80
86
93
Total

42

51

60

62

1
1
1
1
1
1

Ce tableau est un tableau de contingence ou les observations sont connues individuellement,


on peut prsenter plus simplement ce tableau de la manire suivante :

Page 39

STATISTIQUE DESCRIPTIVE

Nous avons un ensemble de points un nuage statistique qui nous indique que les prix est
les quantits voluent selon la mme tendance.
Il est possible de schmatiser ce nuage :
-Par une fonction simple : la fonction linaire (Droite) qui sont inconnus et quil faudra
trouver.
a=pente de droite
b=ordonne lorigine
Une telle droite est appelle droite de rgression D(x)
A=coefficient de rgression
La rgression cest le fait de relier y x par une fonction
Calcule des paramtres de la droite de rgression :

B. la mthode des moindres carrs

Notion de moindres carrs :

Partons dun nuage statistique thorique :

Il sagit de rsumer ce nuage par une droite.


Soit y= ax+b lquation de la droite recherche.
Pour toute valeur de x (xi) nous avons une valeur rellement observe y.
Pour toute valeur xi, nous avons une valeur calcule sur la droite y.
Pour toute une valeur xi, nous avons une erreur destimation gale | yi yi |.

Page 40

STATISTIQUE DESCRIPTIVE

La droite de rgression idale doit tre de telle manire que la somme des erreurs
destimation doit tre la plus faible possible, | yi yi | doit tre minimum.
Pour viter les valeurs absolues, on convient de calculer les carrs des erreurs. La
droite de rgression doit tre telle que :
(yi yi) 2 minimum, et on appelle cela la condition des moindres carrs.

C. Calcul des paramtres de la droite de rgression.


Il sagit de trouver y= ax + b sachant que : (yi yi) 2 min.
Remplaons yi par sa valeur
(yi (axi+b)) 2 min.
Posons (yi ax ; - f) 2 = Z (a , b).
Pour que Z soit minimum, il suffit dannuler (rendre nul) les drivs de ce polynme par
rapport a et par rapport b.
1 Calcul de b :
Supposons a est connu, et drivons par rapport a b et a.
Z = U2
dZ / db = 2 [ (yi ax ; -b)] (-1) = 0
Z = 2UU
[yi ax ; -b) = 0
yi axi nb = 0
U = (yi ax ; -b)
Divisons par n, on obtient (yi / n axi / n b = 0
- a = b
Donc :
b = - a
La droite de rgression passe donc par le point moyen ( , ).
2 Calcul des a :
ax
y
yi

xi

Xi
0

Le paramtre a Que nous cherchons correspond la pente de la droite de rgression qui passe
par le point moyen M ( ; ).
Procdons un changement dorigine, et prenons comme nouvelle origine le point moyen
M(x ; ), les nouvelles cordonnes deviennent :
Xi = xi
Yi = yi -
La droite de rgression a pour quation y = ax
Page 41

STATISTIQUE DESCRIPTIVE
La condition des moindres carre scrit ;
(yi i) 2 min
(yi yi) 2 = (yi axi) 2min
Drivons par rapport a : 2 [ (yi axi)] (-Xi) = 0
[ (yi axi)] Xi = 0 => (yi ai) Xi = 0 => xi yi a xi2 = 0
Donc
a = xi yi /xi2 = (xi x) (yi - )/ (xi x) 2
3- lquation de la droite de rgression :
Dy(x) =
Y = ax + b
a = (xi - ) (yi - ) / (xi ) 2
b=-a

D Application:
Prix(x)
Qts(y)
72
70
51
75
60
77
62
80
74
86
83
33
481
372

Dy (x) a pour quation:


Y = ax + b

xi xi
x

a=

x=

x
n

(x

(x
i

x)( yi y )
_

x) 2

= 481 / 6 = 80

y = 372 / 6 = 62
Trouver Dy (x).
xi - yi -
-20
-10
-11
-5
-2
-3
0
0
12
6
21
13

(xi- ) (yi - )
200
55
6
0
72
273
606

(xi- ) 2
100
25
9
0
36
169
339

a = 606 / 339 = 1.79


b = 62 (1.73)80
b = -81
Donc
Dy(x) a pour quation :
y = 1.79x 81
La loi de loffre pour ce bien

Page 42

STATISTIQUE DESCRIPTIVE

IV- la corrlation linaire :


Dans le paragraphe prcdent, nous avions estim y en fonction de x, et nous avions obtenu la
droite de rgression Dy(x)
On peut pour le mme nuage statistique estimer x en fonction de y, et trouver la droite de
rgression Dx(y) lui aura pour quation.

Pour toute yi, nous avons une valeur observe xi.


Pour toute yi, nous avons une valeur estime sur la droite xi
Pour toute yi, nous avons une erreur destimation gale | xi xi |
Dx(y) idale est tel que : | xi xi | minimum ou encore (xi xi) 2 minimum
En procdant de la mme manire que dans le paragraphe prcdent, on trouve lquation de
Dx(y).
X = ay + b
a = xi yi
yi2
b = a

Dans le rfrentiel XMY nous obtenons 2 droites :


Soit y = ax pour Dy(x)
Soit x = ay pour Dx(y)
Ou encore y = 1/a x
4 cas peuvent se produire :
1er cas : les 2 droites sont confondues
Y= ax
X = ay
Y = 1/yx

Page 43

a = 1/a

aa = 1

STATISTIQUE DESCRIPTIVE
2me cas : les 2 droite font entre elles un angle trs faible :

3me cas : les 2 droite font entre elles un angle lev :

4me cas : les 2 variables sont indpendantes lune de lautre :

Si on appelle coff de corrlation la Quantit

r tel que : r = a . a , on peut crire :


2

Si r = 1 on a une corrlation parfaite.


Si r = +1 on a une corrlation parfaite positive.
Si r = -1 on a une corrlation parfaite.
Corr. positive : c d les variables varient dans le mme sens.
Si r = -1 = corrlation parfaite ngative.
C d les deux phnomnes varient en sens inverse.
Par exemple Prix et Quantit
Si 0 < r < 1 = la corrlation est positive, elle est dautant plus forte que lon se
rapproche de 1.
Si -1 < r < 0 = la corrlation est ngative, et elle est dautant plus forte que lon se
rapproche de -1.
Si r = 0 = corrlation nulle.

Page 44

STATISTIQUE DESCRIPTIVE
Application : calculer le coefficient de corrlation dune autre faon (existe-t-il un lien entre y
et x).
Prix

Qt

70
75
77
80
86
33

42
51
60
62
74
83

x x

y-

(x x ) (yi - )

(x x ) 2 (yi - ) 2

606

339

1110

606 606
r = a. a = 339

donc r = 0.98
1110
2

a=

a =

xi y i
x

( xi x)( y i y)

606
= 1.79
339

( x x)
( x x)( y y) = 606 = 0.545
=
1110
( y y)
2

x y
y
i

On a une trs forte corrlation car r = 0.975 tend vers 1


:Remarque : lorsquon crit

r = a. a
2

r = racine a .a, nous avons une expression trs

positif. Comment trouver alors le signe dune corrlation ?


Rponse : le sens de la corrlation est donne par le signe de a et a.
Si a et a sont >0 le produit a.a >0 corrlation positive.
Si a et a sont <0 le produit a.a>0 corrlation ngative.
On peut dire dune corrlation quelle est trs satisfaisante partir 0.86.
On peut dire dune corrlation quelle parfaite partir de 0.96.
IV formule facilitant les calculs :
1/ calcul de a :

N
a = (xi ) (yi - ) = , N = xi yi - xi x yi + x
D
(xi x) 2

xi xi = n x
Or x =
N
y i yi = n
=
N

On remplace : N = xi yi - n x -n x + n x
N=

x y
i

nx y

D = (xi x ) 2 = (xi2 2xi x + x2) = xi2 2 x xi + n x 2

= xi2 2n x 2 + n x 2
D = xi2 n 2

Page 45

STATISTIQUE DESCRIPTIVE

Donc a =

xi y i n x y
2

x2 n x
Formule dveloppe
xi

yi

xi2

Xi yi

2 calcul de r :
r2= a.a

xi yi n

a=

xi2 n 2
xi yi n

a =

Donc

r=

yi2 n 2

a * a'

V Autre formule de r :
r=

[ (xi ) (yi - )] 2

(xi ) 2 (yi - ) 2
Or
(xi ) 2
2 x =
n
2

y=

(xi ) 2 = n2x

(yi ) 2

(yi ) 2 = n2y

Donc r ==

[( x

(xi ) (yi )

x)( y i y )] 2

n.x. y

n 2 . 2 x. 2 y

Si on appelle : covariance de x et de y lexpression :

Cov (xy)

(xi ) (yi )
n
Cov (xy)

r scrit : r =
x.y
Page 46

STATISTIQUE DESCRIPTIVE

CHAPITRE IV : ANALYSE DES SERIES


CHRONOLOGIQUES.
I Gnralits :
A. Dfinition :
Une srie chronologique est une srie o les observations de la variable sont faites des
intervalles rguliers de temps.

B. les diffrentes composantes dune srie chronologique.


Soit la srie chronologique suivante : Evolution trimestrielle du chiffre daffaire dune
entreprise
trimtres
1998
1999
2000
2001

1
120
130
144
157

2
148
162
178
196

3
155
169
186
210

4
120
132
145
160

Reprsentation graphique de la srie :

Lexamen dune srie chronologique rvle lexistence de diffrences composantes :


Un mouvement de tendance longue ( long terme), appele trend .
Un mouvement saisonnier qui est les variations saisonnires.
Des variations accidentelles : ce sont des variations imprvisibles dues des circonstances
exceptionnelles.

C. intrt dune analyse dune srie chronologique :


Lanalyse des sries chronologiques permet de sparer le mouvement de long terme du
mouvement saisonnier, ce qui nous permettra de faire des calculs de prvision.

Page 47

STATISTIQUE DESCRIPTIVE

II lanalyse de la tendance longue : trend


Dterminer le trend, cela revient lisser la srie pour liminer les variations saisonnires,
cette technique de lissage de la srie est appele Ajustement. Les 2 mthodes dajustement
les plus utiliss sont :
La mthode des moyennes mobiles.
Lajustement analytique.

A. la mthode des moyennes mobiles :


Elle consiste diviser un nuage statistique en sous nuages comprenant chacune
(n1) donnes du sous nuages prcdent, et remplacer chaque sous nuage par un point tel
que : xi = mdiane des xi yi = moyenne des valeurs yi.

B.

Oprations sur les matrices :

1 matrices transposes :
1 3 4
A=
2 -1 5
2 Laddition :
1 -1 3
+
2 4 1

A=

0 4 3

1 2
3 -1
4 5

1 3 6
=

3 -1 -1

(aij) + (bij)

Proprits :
-

commutativit
association
lment neutre
lment symtrique

5 3 0

(aij + bij)

t (a+b) = ta+tb

aii = 0(n ;p)

3- Multiplication par un rel :


1 -1 3
3 -3 9
3*
=
2 4 1
6 12 3

Page 48

la matrice nulle

STATISTIQUE DESCRIPTIVE

CHAPITRE V :POPULATIONS ET ECHANTILLONS,


RECENSEMENTS ET SONDAGES

Les journaux, la tlvision, les revues nous inondent constamment de graphiques, de


tableaux et de statistiques de toutes sortes, dans diffrents domaines :
Politique

Sondages, rfrendums, popularit des partis politiques et de leur chef.

Social

Criminalit, suicide, avortement, racisme, pratiques religieuses, orientations


sexuelles, habitudes alimentaires.

conomie

Importations, exportations, prix de vente, taux d'inflation, indice des prix la


consommation (IPC), taux d'intrt, salaires, taux de chmage, cotes
boursires, indices boursiers, dficits gouvernementaux.

Dmographie Taux de mortalit, taux de natalit, population par province, par nationalit.
Culture

Entres au box office, cotes d'coutes.

tudes

Rsultats scolaires, prts et bourses, cote R et cote Z.

Sports

Meilleurs compteurs, classement des quipes, salaires des joueurs.

Ces prsentations peuvent parfois nous induire en erreur volontairement ou non.


Il nous faut donc dvelopper un esprit critique et savoir interprter ces
informations.

I.

Quelques termes de base :

La population cible est l'ensemble de tous les objets que l'on tudie.
Une unit statistique est un objet de cette population.
Un chantillon est une partie choisie d'une population.
Le nombre d'objets composant une population ou un chantillon est appel sa taille.
Lorsque l'on veut connatre certaines caractristiques d'une population, on dit qu'on
enqute sur la population.
Une enqute peut tre ralise auprs de toute la population ou sur un chantillon.
Un recensement est une enqute ralise auprs de toute la population.

Page 49

STATISTIQUE DESCRIPTIVE
Un sondage est une enqute ralise sur un chantillon.

II.

Exemples:
1. tude portant sur la langue maternelle des Qubcois:
la population est l'ensemble des Qubcois
et la caractristique est la langue maternelle.

2. tude portant sur la dure des ampoules lectriques produites l'usine X.


La population est constitue des ampoules lectriques produites l'usine X
et la caractristique tudie est la dure des ampoules.

3. Une compagnie pharmaceutique veut vrifier un nouveau vaccin contre une certaine maladie.
On administre ce produit 50 patients atteints de la maladie.
La population est forme de tous les gens atteints de la maladie,
l'chantillon est form des 50 patients qui on a administr le mdicament et la
caractristique tudie est la rponse au mdicament.

Les cots levs et les dlais trop longs, relis un recensement, sont les
principales raisons qui nous amnent utiliser un sondage puisque la taille d'un
chantillon est beaucoup plus petite que celle de la population.
Au Canada, il y a un recensement tous les cinq ans. Le dernier date de 1996.

III.

tapes d'une enqute statistique :


1. Dterminer la population cible et les caractristiques de cette population que l'on veut
tudier.
2. Dterminer la manire dont l'chantillon va tre prlev.

Page 50

STATISTIQUE DESCRIPTIVE
3. Construire des instruments (questionnaires ou autres).
4. tablir un pr-test ou tude-pilote.
5. Recueillir les donnes.
6. Compiler les donnes.
7. Mettre en forme les donnes.
8. Analyser les donnes (analyse descriptive ou infrentielle).
9. Interprter les rsultats.
10. Communiquer les rsultats.

Page 51

STATISTIQUE DESCRIPTIVE

EXERCICES

Page 52

STATISTIQUE DESCRIPTIVE

OBJECTIFS VISES :

1.
2.
3.
4.

construction dun tableau statistique :


distinguer une variable quantitative dune variable qualitative
reprsentation graphique des variables quantitatives discrtes et continues
calcul et interprtation des caractristiques de tendance centrale :
moyenne.
mdiane
mode
quartiles
5.
calcul et interprtation des caractristiques de dispersion :
variance
cart type
coefficient de variation
Exercice 1 :

Dans une entreprise de 80 salaris on a enregistr les salaires mensuels suivants :


54 salaris gagnent 6 000 dirhams ou plus ;
34 salaris gagnent 8 000 dirhams ou plus ;
20 salaris gagnent 10 000 dirhams ou plus ;
8 salaris gagnent 12 000 dirhams ou plus ;
1. Prsenter ces donnes dans un tableau avec des classes de mme amplitude en
sachant quaucun salari ne gagne plus de 14 000 DH.
2. Calculer la moyenne et donner sa signification.
3. Calculer la mdiane et donner sa signification.
4. Calculer le mode graphiquement, algbriquement et donner sa signification.
5. Combien gagnent les 20% des salaris les mieux pays.
Exercice 2 :
La rpartition des salaris dune entreprise de confection selon leurs gains
mensuels (en milliers de dirhams) se prsente comme suit :
Gains mensuels
effectifs
25
[4-6[
40
[6-8[
58
[8-12[
27
[12-18[
6
[18-20[
4
20 et plus

1.
2.
3.
4.

dterminer graphiquement le salaire modal


calculer le coefficient de variation
calculer ltendue
calculer algbriquement et graphiquement la mdiane.

Page 53

STATISTIQUE DESCRIPTIVE
Exercice 3 :

La rpartition par ge dune population dun centre de vacances est comme suit :
Classe dage (en annes)
effectifs
16
0-5
42
5-15
44
15-25
40
25-35
30
35-45
32
45-55
15
55-60
36
60-75
15
75-100
1. tracer lhistogramme de cette distribution
2. calculer lcart type et donner sa signification
3. on dsire rajeunir cette population en invitant au centre des vacances des
personnes de la classe [25-35[.combien faudrait-il en faire venir pour que
la moyenne de la population soit de 35 ans.
Exercice 4 :

1.
2.
3.
4.

Dans une commune urbaine, on a relev la rpartition en pourcentages de


10 000 contribuables selon le montant des impts pays.
Classes dimpts
Frquences relatives en pourcentages
8
1-3
12
3-6
20
6-L2
26
L2-12
F6
12-18
10
18-22
6
22-30
Trouver les valeurs manquantes de ce tableau sachant que la moyenne est gale
11,42
tracer la courbe cumulative croissante
dterminer graphiquement et algbriquement limpt mdian. donner sa signification
quel est le pourcentage des contribuables qui paient un impt annuel suprieur
20 000dh ?cela reprsente combien de personnes ?
Exercice 5 :

Soit la distribution statistique suivante qui donne la rpartition des propritaires


terriens selon la superficie des terres cultivables dans une certaine rgion agricole :
Superficie des terres en hectares
2-4
4-8
8-14
14-20
20-40
40-100

Nombre de propritaires
24
36
22
18
14
6

Page 54

STATISTIQUE DESCRIPTIVE
Partie I :
prciser le caractre tudi et prciser sa nature.
donner la signification de du centre de la 2me classe.
dterminer rapidement la mdiane et donner sa signification
dterminer algbriquement le mode et donner sa signification
calculer la superficie moyenne et lcart type. Que peut on conclure ?
dterminer le 1er et le 9me dcile et donner leurs significations
Partie II :
1. dterminer graphiquement la concentration foncire dans cette rgion agricole,
Calculer lindice de GINI
2. dterminer algbriquement la concentration
3. dterminer graphiquement le pourcentage des propritaires dont la superficie des
terres est infrieure la mdiale.

1.
2.
3.
4.
5.
6.

Exercice 6 :
Pendant 9 annes les bnfices dune entreprise ont augment :

de 4% par an pendant les 3 premires annes.


de 7% par an pendant les 4 annes suivantes.
De 10% par an pendant les 2 dernires annes de la priode considre.
Quelle est laugmentation moyenne des bnfices de cette entreprise sur les 9 annes ?
Exercice 7 :
Le tableau suivant donne la rpartition des salaires mensuels des cadres dune
entreprise :

Salaires en 1000DH
6-8
8-10
10-16
16-22
22-30
30-34
34-38
total

Nombre des cadres


50
70
80
50
50
80
20
400

1. prciser le caractre tudi et sa nature


2. reprsenter graphiquement cette distribution, tracer le polygone des frquences
3. dterminer rapidement :
le salaire mdian des cadres donner sa signification.
Le 3me quartile (Q3). donner sa signification.
4. donner graphiquement le salaire modal des cadres.
5. calculer le salaire moyen des cadres.
6. Calculer le coefficient de variation et donner sa signification
7. Pour motiver davantage ses cadres, lentreprise dcide une augmentation gnrale des
salaires de 20%. Calculer la nouvelle moyenne et le nouveau coefficient de variation.

Page 55

STATISTIQUE DESCRIPTIVE
II

1.
2.
3.
4.

OBJECTIFS VISES :
Calcul de la fonction linaire
calcul et commentaire du coefficient de corrlation
interprtation des distributions marginales
interprtation des distributions conditionnelles

Exercice 8 :
Une entreprise a prsent ses dpenses de publicit et ses chiffres pour les 6
dernires annes dans le tableau suivant (en 106 DH)
Dpenses de publicit
Chiffre daffaires
10
2
16
4
50
10
120
14
140
18
210
24

1. Lentreprise pense qu il ya un lien entre dpenses de publicit (X) et le chiffre


daffaire(Y).pouvez vous le confirmer ?
2. tablir par la mthode des moindres carrs la relation liant le chiffre daffaires et
les dpenses de publicit
3. combien lentreprise peut-elle esprer raliser comme chiffre daffaireS avec des
dpenses de publicit de 30 ?

Exercice 9 :

On a observ une population en retenant 2 caractres : le nombre denfants(X) et la


taille du logement (Y).les rsultats sont les suivants :
2
3
4
Total
Nombre de pices
Nombre denfants
1
2
3
Total

22
7
0
29

15
38
7
60

9
22
30
61

46
67
37
150

1. calculer le nombre moyen denfants et le nombre moyen de pices des logements.

2. calculer x 2 et donner sa signification

3. calculer y 3 et donner sa signification


4. on se propose de voir sil existe un lien entre le nombre denfants et la surface des
logements. Confirmer

Page 56

STATISTIQUE DESCRIPTIVE
Exercice 10 :

Le tableau suivant donne la rpartition des salaris dune entreprise de btiment selon le
nombre denfants charge X et les salaires mensuels perus y en milliers de DH
Nombre de pices Y

1-3

3-5

5-9

Nombre denfants X
1
4
8
16
2
6
12
24
3
6
12
3
4
2
4
8
1. donner la distribution marginale de la variable X
2. donner la distribution conditionnelle de la variable Y lie la modalit 4 de X.
3. que signifient les valeurs 16 et 3 souligne dans le tableau
4. vrifier de deux manires diffrentes que les deux variables sont indpendantes.
Dites dans ce cas est gal le coefficient de corrlation linaire : r (sans le
calculer.
5. calculer la variance marginale de Y.

Exercice 11 :
Une tude ralise dans un club sportif concernant le poids et la taille de 124 adhrents
a fourni les informations suivantes :
50-60
60-65
65-75
75-80
poids en Kg Y

taille en mtres X
1,60-1,70
1,70-1,75
1,75-1,80
1,80-1,90
1,90-2,00

12
?
9
?
3

7
6
8
7
5

6
8
8
5
3

4
3
4
6
3

1. complter le tableau sachant quil y a 27 adhrents qui mesurent entre 1.70met


1.75m.
2. quels sont les caractres tudis ? Quelle est leur nature ?
3. que signifient les chiffres 7 et 8souligns dans le tableau
4. quelle est la moyenne du poids des adhrents ? Comment appelle-t-on cette
moyenne ?
5. quelle est la taille moyenne des adhrents ? Comment appelle-t-on cette
moyenne ?
6. en dsignant par X la taille et par Y le poids calculer et donner la signification
_

de y 2
_

7. donner sans la calculer la signification de x 3

Page 57

STATISTIQUE DESCRIPTIVE

Exercice 12 :

Une entreprise commerciale a prsent ses ventes xi et ses frais de publicit yi au


cours du premier semestre de lanne 2003 comme suit (en 1000 DH)
Mois
Janvier
Fvrier
Mars
Avril
Mai
juin

Ventes
40
30
42
46
44
38

Frais de publicit
1.1
0.8
1.2
1.4
1.3
1.1

1. dterminer une fonction linaire qui donne le montant des ventes lorsquon
connat les frais de publicit.
2. quel serait le montant des ventes si les frais de publicit atteindront
3500DH.
3. dterminer sil y a ou non une liaison entre les ventes et les frais de
publicit.

Page 58

Vous aimerez peut-être aussi