Vous êtes sur la page 1sur 145

ROYAUMEDUMAROC

Office de a Formation Professionnelle et de la Promotion du


Travail
DIRECTION ^C^RCHE ET INGE^E^E DE FORMATION
RESUME THEORIQUE &
GUIDE DE TRAVAUX PRATIQUES
MODULE : STATISTIQUES
SECTEUR : TERTIAIRE
SPECIALITE : COMPTABILITE DES
ENTREPRISES
NIVEAU : TECHNICIEN

OFPPT
OFPPT/DRIF 2


Document labor par :
Mlle Nadia BENHADDOU BAKKIOUI ISTA Taroudant DR SMD
Rvision linguistique:
Validation :

Rsum de Thorie et Statistiques
Guide des travaux pratiques

Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF


Rsum de Thorie et Guide des
travaux pratiques
Statistiques

SOMMAIRE

Prsentation du module

9
RESUME DE THEORIE

10
Chapitre I- Les statistiques descriptives : 11
I- Terminologie :

11
II- Tableaux statistiques : 12
A- Cas dune seule variable

12
B- Cas de deux variables

13
III- Reprsentations graphiques : 14
A- Variable qualitative

14
B- Variable quantitative

16
1) Variable discrte

16
2) Variable classe

17
IV- Caractristiques de tendance centrale et de position : 19
A- Mode

19
B- Mdiane

20
C- Moyenne arithmtique

21
D- Moyenne gomtrique

22
E- Moyenne harmonique

22
F- Moyenne quadratique

22
G- Quantiles

23
V- Caractristiques de dispersion : 23
A- tendue

23
B- Intervalle inter-quartile

23
C- Variance et cart-type

24
D- Coefficient de variation

24
VI- La concentration :

25
A- Valeurs globales

25
B- Mdiale

25
C- Courbe de concentration (ou de LORENZ) 26
D- Indice de GINI

26
VII- Les indices :

27
A- Indices lmentaires

27
B- Indices de LASPEYRES et de PAASCHE
28
1) Indice de Laspeyres des prix 29
2) Indice de Laspeyres des quantits 29
3) Indice de Paasche des prix 29
4) Indice de Paasche des quantits 29
OFPPT/DRIF

4

VIII- Rgression et corrlation :
A- Ajustement dun nuage de points une fonction une fonction mathmatique
B- Mesure de ]intensit de la relation linaire entre deux variables
1) Covariance
2) Coefficient de corrlation linaire
3) Droites de rgression
IX- Sries chronologiques :
A- Dcomposition des chroniques B- La dtermination du trend C- Analyse de la
composante alatoire D- Dsaisonnalisation E- Srie ajuste F- Prvisions court
terme
Chapitre II. Ralisation des enqutes
I. Dtermination optimale dun chantillon
II. Elaboration du questionnaire
Chapitre III. Ralisation des sondages
I- Estimateur dune moyenne ou dune proportion
II- Variance de ces estimateurs
III- Estimation par intervalle de confiance
Contrle continu GUIDE DES TRAVAUX PRATIQUES
TP1 : reprsentation graphique, paramtres de tendance centrale, de dispersion.
TP2 : reprsentation graphique
TP3 : paramtres de tendance centrale
TP4 : reprsentation graphique, la corrlation
TP5 : reprsentation graphique, paramtres de tendance centrale et de dispersion
TP6 : ajustement linaire, prvisions et corrlation TP7 : QCM
Evaluation de fin de module Liste bibliographique
Rsum de Thorie et Statistiques
Guide des travaux pratiques

30
30
31
31
32
32
33
33
34
31
35
35
35
37
37
38
40
40
43
44
46
47
48
49
50
52
53
55
56
76
77
OFPPT/DRIF 5


Module : Statistiques
Dure : 50 H
40% : Thorique
60% : Pratique
OBJECTIF OPERATIONNEL DE PREMIER NIVEAU DE COMPORTEMENT
COMPORTEMENT ATTENDU
Pour dmontrer sa comptence, le stagiaire doit
appliquer les mthodes statistiques.
Selon les conditions, les critres et les prcisions qui suivent :
CONDITIONS DEVALUATION
A partir des tudes de cas, mise en situation, consignes du formateur, toute
documentation ncessaire ;
A laide de : calculatrice, tableur et logiciel de statistiques.
CRITERES GENERAUX DE PERFORMANCE
o Respect de la dmarche de calcul o Respect
des principes de gestion de temps
o Respect des pratiques courantes et des rgles tablies par lentreprise o
Exactitude des calculs o Vrification approprie du travail.
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF



OBJECTIF OPERATIONNEL DE PREMIER NIVEAU
DE COM [PORTEMENT
PRECISION SUR LE CRITERES PARTICULIERS DE
COMPORTEMENT ATTENDU PERFORMANCE
A. Comprendre les variables statistiques o Qualification dune variable

qualitative
o Qualification dune variable

quantitative discrte
o Qualification dune variable

quantitative continue
B. Raliser des reprsentations

graphiques o Reprsentation correcte des

variables quantitatives discrtes

o Reprsentation correcte des

variables quantitatives continues
C. Calculer les caractristiques des

distributions o Calcul et interprtation juste des

paramtres de tendance centrale
Mode

Mdiane

Quartiles
Moyennes

o Calcul et interprtation correcte des

paramtres de dispersion
Etendue

Ecart absolu moyen et cart
quantile
Variance, cart-type et coefficient
de variation
D. Dterminer les liens entre deux

variables o Traitement du cas de deux

caractres quantitatifs (coefficient de
corrlation linaire, ajustement par la
droite des moindres carrs, rapport de
corrlation)
o Traitement du cas dun caractre

quantitatif et dun caractre qualitatif
(rapport de corrlation)
o Traitement du cas de deux

caractres qualitatifs
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 7




OBJECTIFS OPERATIONNELS DE SECOND NIVEAU
Avant dapprendre comprendre les variables statistiques, le stagiaire doit :
1- Comprendre la notion des statistique
2- Comprendre les objectifs des statistiques
Avant dapprendre raliser les reprsentations graphiques, le stagiaire doit :
3- Distinguer entre les variables qualitatives et les variables quantitatives
4- Distinguer entre les variables quantitatives discrtes et les variables quantitatives continues
5- Prsenter les sries statistiques dans des tableaux
Avant dapprendre calculer les caractristiques des distributions, le stagiaire doit :
6- Raliser des reprsentations graphiques
E. Raliser des sondages


o Ralisation de sondage simple

avec :

estimateur dune moyenne ou
dune proportion

variance de ces estimateurs

estimateurs de ces variances

algorithmes de tirages
F. Raliser des enqutes


o Dtermination optimale de

lchantillon

o Elaboration du questionnaire

o Recueil des donnes

o Dpouillement, codage et saisie

o Validation des donnes

o Traitement statistique

o Analyse des rsultats
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 8

7- Interprter ces reprsentations graphiques
Avant dapprendre dterminer les liens entre deux variables, le stagiaire doit :
8- reprsentez les distributions deux variables dans des tableaux
9- reprsentez graphiquement ces distributions
10- calculer les caractristiques des distributions
11- Interprter ces caractristiques des distributions
Avant dapprendre raliser des sondages, le stagiaire doit :
12- dfinir le sondage
13- comprendre les objectifs de la ralisation des sondages
14- calculer les caractristiques des distributions
Avant dapprendre raliser des enqutes, le stagiaire doit :
15- dfinir lenqute
16- comprendre les objectifs de la ralisation des enqutes

PRESENTATION DU MODULE
Ce module sadresse en priorit aux techniciens comptables des
entreprises et aux techniciens spcialiss en gestion des entreprises.
Il rpond trois objectifs fondamentaux :
1) Lacquisition des connaissances : chaque chapitre comprend ainsi une partie
Cours dtaille : les formules mathmatiques fondamentales, mais aussi les
points dlicats du cours sont abords.
2) Lutilisation des connaissances : chaque chapitre comprend des applications
nombreuses et varies qui permettent aux stagiaires dutiliser leurs
connaissances.
La plupart de ces applications sont accompagnes dindications de
rsultats ou lments de rponse.
3) Ladaptation des connaissances : des Travaux Pratiques proposs, devront
permettre aux stagiaires de mettre en application leurs qualits de raisonnement
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF

et dadaptation face des problmes plus longs o de nombreuses
connaissances sont exiges.
La masse horaire affecte ce module est de 50 heures dont 30
heures consacres aux travaux pratiques.

Module : Statistiques Descriptives
RESUME THEORIQUE
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 10


Chapitre I- Les statistiques descriptives :
I- Terminologie :
1. Statistique :
La statistique est une mthode scientifique dont lobjet est de recueillir, dorganiser, de rsumer
et danalyser les donnes dune enqute, dune tude o dune exprience, aussi bien que de tirer
les conclusions logiques et de prendre les dcisions qui simposent partir des analyses
effectues.
2. Population :
Ensemble d'individus dfinis par une proprit commune donne.
Exp : si lon veut tudier la dure de vie des ampoules lectriques fabriques par une compagnie,
la population considre est lensemble de toutes les ampoules fabriques par cette compagnie.
3. Echantillon :
Sous-ensemble de la population.
Exp : pour tablir la dure de vie des ampoules lectriques produites par une machine, on peut
prlever au hasard un certain nombre dampoules - un chantillon- parmi toutes les celles
produites par cette machin e.
4. Individu ou unit statistique :
Chaque lment de la population ou de lchantillon.
Exp : dans lexemple prcdant, chaque ampoule constitue un individu ou une unit statistique.
5. La taille :
Reprsente le nombre dindividus dun chantillon ou dune population. Elle est symbolise par
n dans le cas dun chantillon et par N dans le cas dune population.
6. Le caractre :
Cest laspect particulier que lon dsire tudier.
Exp : concernant un groupe de personnes, on peut sintresser leur age, leur sexe leur taille...
7. Les modalits :
Les diffrentes manires dtre que peut prsenter un caractre.
Exp 1 : le sexe est un caractere qui presente deux modalits : feminin ou masculin
Exp 2 : quant au nombre denfants par famille, les modalits de ce caractere peuvent etre 0,1
2,3...,20.
8. Caractre qualitatif :
Ses modalits ne sexpriment pas par un nombre Exp : la
religion, le sexe, lopinion.
9. Caractre quantitatif :
Ses modalits sont numriques.
Exp : lage, la taille, le poids.

10. Caractre quantitatif discret
Lensemble des valeurs que peut prendre le caractre est fini ou dnombrable. Le plus
souvent, ces valeurs sont entires.
Exp :le nombre denfant dans une famille, le nombre de tlviseurs par foyer et la pointure
des souliers.
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 11

11. Caractre quantitatif continu :
Le caractre peut prendre thoriquement nimporte quelle valeur dans un intervalle donn de
nombres rels.
Exp : la taille dun individu, le poids...
12. Srie statistique :
Lensemble des diffrentes donnes associes un certain nombre dindividus.
Exp : la srie suivante rsulte dune courte enqute auprs de quelques personnes pour connatre
leur age :
18 21 19 19 17 22 27 18 18 17 20 20 23
II- Tableaux statistiques :
A- Cas dune seule variable :
Le tableau brut se prsente sous la forme suivante: ______

Le nombre d'individus observ tant en gnral important, le tableau prcdant ne permet pas
d'analyser l'information obtenue. Il est donc ncessaire de crer un tableau plus synthtique o
les observations identiques (possdant la mme modalit) ont t regroupes.

Pour une variable qualitative, les modalits ne sont pas mesurables.
Pour une variable quantitative, les modalits sont mesurables. Ce sont
des valeurs numriques
ponctuelles lorsque la variable est discrte
des intervalles
lorsque la variable est continue ou lorsque la variable est discrte et
qu'elle comporte beaucoup de modalits.

Individu variable
1 i
2

n n
modalit effectif
G
n
i
c
2


c
k


Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 12

Application :
Nous tudions une population de 1000 entreprises selon le caractre modalit forme
juridique .
Les modalits retenues : S.A (Socit Anonyme), SARL (Socit A Responsabilit Limite), EI
(Entreprise Individuelle), SNC ( Socit en Nom Collectif).
Leurs effectifs respectifs : 200, 400, 340, 60.
T.A.F :
Prsentez cette srie dans un tableau.
B- Cas de deux variables :
Le tableau brut se prsente sous la forme suivante:

On dsire crer un tableau appel tableau de contingence donnant le nombre d'individus
possdant simultanment la modalit i de variablel et la modalit j de variable2 qui se
prsentera sous la forme suivante: _________________________________


Application:
Dans une entreprise, une enqute statistique a t faite sur 300 employs, et portant sur deux
caractres, lage et la rmunration. Les rsultats de lenqute sont prsents dans les deux
tableaux suivants :

Individu variablel variable2
1 X j yi
2 2
J2
n

y*

Variable2
Di
. . .
D
r


Cj
n
n
n
ij n
u

variablel G

. . ny . . nir

c
k

n
ki
n
kj
n
ki
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Age n
20 25 150
25 30 100
30 35 200
35 40 50
OFPPT/DRIF 13


TAF :
Prsentez dans un mme tableau la distribution de ces deux caractres.
III- Reprsentations graphiques :
Lorsqu'on observe un caractre sur des individus, on aboutit un tableau de chiffres peu
parlant. L'objectif est de donner une reprsentation graphique de ce tableau qui permette d'un
s eul coup d'il d'avoir une ide de la manire dont se rpartissent les individus.
A- Variable qualitative :
A chaque modalit i est associ un effectif ni.
La seule reprsentation qui nous intresse est celle des effectifs ni (ou des frquences ni/n).
Suivant la variable observe, de nombreuses reprsentations plus ou moins informatives
peuvent tre utilises. Cependant les 2 plus classiques sont:
Les tuyaux dorgue (ou diagramme en barre ou diagramme bandes)
- les modalits de la variable sont places sur une droite horizontale (attention: ne pas
orienter cette droite car les modalits ne sont pas mesurables et il n'y a donc pas de
relation d'ordre entre elles).
- les effectifs (ou les frquences) sont placs sur un axe vertical. La hauteur du tuyau est
proportionnelle l'effectif.
Rmunration en dhs n
Moins de 1500 200
1500 2000 150
2000 2500 100
plus de 2500 50
OFPPT/DRIF 14


Effectifs ou frquences
Il est prfrable de laisser un espace entre chaque tuyau
Pas de flche
modalits
V_ L'ordre dans lequel sont
prsents les tuyaux n'a pas d'importance
les diagrammes secteurs (ou camemberts)
L'effectif total est reprsent par un disque.
Chaque modalit est reprsente par un secteur circulaire dont la surface
(pratiquement 'angle au centre) est proportionnelle l'effectif correspondant.

Rsum de Thorie et Statistiques
Guide des travaux pratiques

r~

Application :
La rpartition des candidats convoqus pour participer au Test dAdmissibilit la Formation en
Management (TAFEM 1998) pour laccession LEcole Nationale de Commerce et de Gestion
dAgadir , selon la srie du baccalaurat se prsente comme suit : ________________________
Srie du Bac xi Nombre de candidats ni
Sciences conomiques 250
Sciences mathmatiques
200
Sciences exprimentales 400
T.G.A 50
T.G.C
100
Total
1000
TAF: reprsentez cette distribution en Tuyaux dorgues et Diagramme circulaire.
OFPPT/DR1F 15


B- Variable quantitative :
Avant toute tentative de reprsentation, il y a lieu de distinguer entre variable discrte et
variable classe (regroupements en classes).
Deux types de graphiques sont intressants de reprsenter:
a) les diagrammes diffrentiels qui mettent en vidence les diffrences d'effectifs (ou
de frquences) entre les diffrentes modalits ou classes.
b) les diagrammes cumulatifs qui permettent de rpondre aux questions du style
"combien d'individus ont pris une valeur infrieure (ou suprieure) tant?".
1) Variable discrte
Diagramme diffrentiel : le diagramme en btons
Les valeurs discrtes xi prises par les variables sont places sur l'axe des
abscisses, et les effectifs (ou les frquences) sur l'axe des ordonnes. La
hauteur du bton est proportionnelle l'effectif.
n
i
J
'
ou

Diagrammes cumulatifs : ils permettent de visualiser lvolution des effectifs

Remarque: les deux courbes sont symtriques par rapport un axe horizontal d'ordonne n/2
pour les effectifs,
1
/2 pour les frquences.
On utilise l'effectif (frquence) cumul croissant pour rpondre aux questions du style :
Quel est le nombre (%) d'individus dont la valeur du caractre est infrieure ou gale x ?
On utilise l'effectif (frquence) cumul dcroissant pour rpondre aux questions du style :
Quel est le nombre (%) d'individus dont la valeur du caractre est strictement suprieure x ?
Rsum de Thorie et Statistiques
Guide des travaux pratiques


OFPPT/DR1F 16


(au plus x) quivalent ( < x) donc utiliser N(x) ou F(x) (plus que x) quivalent ( > x) donc
utiliser N '(x) ou F '(x)
Exemple:
__





<
<
Fix)
<



- (au plus 6 ) quivalent ( < 6) donc on pourra lire la frquence cumule
croissante en 6, c-- d. F(6) = 0,3
- (plus de 6) quivalent ( > 6) donc on pourra lire la frquence cumule dcroissante en 6,
c. .d. F '(6) = 0,7
- (moins de 6) quivalent (< 6) quivalent ( < 6-) o est une trs faible valeur
positive, donc on pourra lire la frquence cumule croissante en 6-, c..d. F(6-) = 0,2
- (au moins 6) quivalent ( > 6) quivalent ( > 6-) o est une trs faible valeur
positive, donc on pourra lire la frquence cumule dcroissante en 6-, c..d. F '(6-) = 0,8

2) Variable classe
Diagramme diffrentiel : !
1
histogramme
C'est un ensemble de rectangles contigus, chaque rectangle associ chaque classe ayant une
surface proportionnelle l'effectif (frquence) de cette classe.
Attention: Avant toute construction d'histogramme, il y a lieu de regarder si les classes sont
d'amplitudes gales ou ingales.
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Se souvenir:
0,s
0,7
0,55

0,4
,
, 0
F(x)
Application :
Reprsentez graphiquement la distribution des 50 tudiants en fonction du nombre de personnes
par mnage suivante : _____________________ ________________________________________
Nombre de personnes par mnage xi Nombre dtudiants ni
3 5
4 15
6 15
7 10
8 5
Total 50
OFPPT/DRIF 17


Le cas des classes d'amplitudes gales ne pose aucune difficult car il suffit de reporter en
ordonne l'effectif (la frquence).
Dans le cas d'amplitudes ingales on reporte en ordonne la densit di (effectif divis par
l'amplitude de la classe)


L'utilisation des courbes est identique au cas discret.
Exemple:

Rsum de Thorie et Statistiques
Guide des travaux pratiques




OFPPT/DRIF 18



IV- Caractristiques de tendance centrale et de position :
Les caractristiques de tendance centrale essayent de donner la valeur la plus
reprsentative d'un ensemble de valeurs numriques.
A- Mode :
C'est la valeur observe d'effectif maximum.
Variable discrte: classer les donnes par ordre croissant. Celle d'effectif maximum donne le
mode.
Il est fortement conseill d'utiliser le diagramme en btons pour dterminer le mode. En effet,
deux valeurs conscutives xi , xi+1 peuvent avoir le mme effectif maximum; on parlera
d'intervalle modal [xi , xi+1]. Il peut aussi y avoir un mlange de deux populations qui conduit
un diagramme en btons o apparaissent deux bosses; on considrera deux modes.
Il est dconseill, sauf raison explicite, d'envisager plus de deux modes.
Variable classe: la classe modale correspond la classe ayant l'effectif maximum. Il est
fortement conseill d'utiliser l'histogramme pour dterminer le mode. Comme pour le cas
discret, on peut avoir deux classes modales. Toutes les valeurs de la classe pouvant priori se
raliser, on ne se contentera pas de dterminer la classe modale. Une des valeurs de cette classe
sera le mode. Certains auteurs prconisent par simplicit de prendre le centre de la classe
modale. Il est prfrable cependant de tenir compte des classes adjacentes de la manire
suivante:

Rsum de Thorie et Statistiques
Guide des travaux pratiques

Application :
Reprsentez graphiquement la distribution de 50 tudiants en fonction de leur taille suivante :
Taille en cm xi Nombre dtudiants
150-160 16
160-165 6
165-170 12
170-175 14
175-180 2
Total 50

OFPPT/DRIF 19



B- Mdiane :
Les valeurs tant ranges par ordre croissant, c'est la valeur de la variable qui spare
les observations en deux groupes d'effectifs gaux.
Variable discrte: la dtermination peut s'obtenir partir du tableau statistique en recherchant
la valeur de la variable correspondant une fonction cumule gale n/2 (effectif cumul) ou
1
/2
(frquence cumule). Il est encore plus facile de lire sur les graphiques cumulatifs les abscisses
des points d'ordonne n/2 (effectif cumul) ou / (frquence cumule). Si tout un intervalle a pour
image n/2 ( / pour la frquence), on parlera d'intervalle mdian (on peut prendre le milieu de
l'intervalle comme mdiane)





------- f-

Inteivalle mdian

Application :
Soit la srie statistique suivante :
19 17 20 18 17 17 20 19 15 16 20 23 22 14 15 24 TAF : Calculez la
mdiane de cette srie Elments de rponse :
Me=18.5
Variable classe: l'abscisse du point d'ordonne n/2 (
1
/2 pour la frquence)se situe en gnral
l'intrieur d'une classe. Pour obtenir une valeur plus prcise de la mdiane, on procde une
interpolation linaire. La valeur de la mdiane peut tre lue sur le graphique ou calcule
analytiquement.
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Application :
Dterminez la valeur modale de la distribution suivante, de 50 tudiants selon leur taille :
Taille en cm : xi Nombre dtudiants : ni
150-160 15
160-170 6
170-175 10
175-180 16
185-200 3
Total 50
Elments de rponse :
Mo = 173.77 cm

,<
OFPPT/DRIF 20



M-2 0 , 0 , 2 -
4- 2 0, 7- G, 2
d'o la valeur de la mdiane.
De manire gnrale, si a et b sont les bornes de la classe contenant la mdiane, F(a) et F(b) les
valeurs de la frquence cumule croissante en a et b, alors
0, 5 - F(a)
M = a+(b-a)x
F(b)-F(a)

C- Moyenne arithmtique :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable
la moyenne arithmtiq lie gale = f
1
x
1
classe,

i=1 n i=1

La moyenne arithmtique est un paramtre de tendance centrale plus utilis que les autres de par
ses proprits algbriques:
a) Pour plusieurs populations d'effectifs ni, n2, ...... nk, de moyennes
res^ctives^
Xk

moyenne globale = moyenne des moyennes k

n
b) La moyenne arithmtique conserve les changements d'chelle et d'origine
x: ( , : (y = ax + b , Hj )
X ->=ax + b

Rsum de Thorie et Statistiques
Guide des travaux pratiques


Application :
Dterminez la valeur mdiane de la distribution des tailles suivantes :
Taille en cm xi Nombre dtudiants ni 4N iN
150-160 15 15 50
160-165 5
20
35
165-170
10
30 30
170-175 18 48 20
175-180 2 50 2
Total 50 # #
Elments de rponse : Me = 167.5
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Application :
Dterminez la taille moyenne des 50 tudiants dont la distribution par taille se prsente comme
suit :
OFPPT/DRIF 21


D- Moyenne gomtrique :
Si xi sont les observations d'une variable quantitative, la moyenne gomtrique est gale
G x .....
Ce type de moyenne est surtout utilis pour calculer des pourcentages moyens. r tant un taux
d'accroissement, 1+r est appel coefficient multiplicateur; et le coefficient multiplicateur moyen
est alors gal la moyenne gomtrique des coefficients multiplicateurs.
E- Moyenne harmonique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale
"S
Il n'est pas vident d'utiliser ce type de moyenne.
Elle intervient lorsqu'on demande une moyenne de valeurs se prsentant sous forme de quotient
de deux variables x/y (km/h, km/litre,...). Attention, il faut cependant bien dcortiquer le
problme car il peut aussi s'agir d'une moyenne arithmtique.
Application :
Un cycliste effectue une travers de 50 kms. Pendant les 20 premiers kms il roulait avec une
vitesse constance de km/h, les 15 kms suivants une vitesse constante de 30 km/h. Du point
kilomtrique 35 au 55 la vitesse de notre cycliste nest que de 10 km/h et au-del du point
kilomtrique sa vitesse nest que de 5 km/h.
TAF :
Quelle est la vitesse de ce cycliste sur lensemble du parcours ?
Elments de rponse :
H = 16.67
F- Moyenne quadratique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale
~
n
ix? + +n
k
x
n
Taille en cm xi Nombre dtudiants
150-160 16
160-165 6
165-170 12
170-175 14
175-180 2
Total 50
Elments de rponse : x = 168.3 cm


G- Quantiles :
Ce sont des caractristiques de position.
Il y a 1 mdiane Me qui spare les observations en 2 groupes d'effectifs gaux 3 quartiles Q1,
Q2, Q3 qui sparent les observations en 4 groupes d'effectifs gaux 9 dciles D1, D2, ..., D9 qui
sparent les observations en 10 groupes d'effectifs gaux 99 centiles C1, C2, ..., C99 qui
sparent les observations en 100 groupes d'effectifs gaux La dtermination de ces
caractristiques est identique celle de la mdiane.
Les quartiles sont obtenus lorsqu'on a cumul 25, 50, 75% de la population
Les dciles sont obtenus lorsqu'on a cumul 10, 20,...., 90% de la population
Les centiles sont obtenus lorsqu'on a cumul 1, 2,...., 99% de la population
Remarque: la notion de dciles et de centiles n'a de sens que s'il y a beaucoup d'observations
et donc essentiellement pour une variable classe.

V- Caractristiques de dispersion :
Comme leur nom l'indique, ces caractristiques essayent de synthtiser par une seule valeur
numrique la dispersion de toutes les valeurs observes.
A- tendue :
C'est la diffrence entre la plus grande et la plus petite observation
Application :
Quelle est ltendue de la srie statistique suivante : 10 390 395 405 410 1000 Elments de
rponse :
Etendue = 990
B- Intervalle inter-quartile :
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Application :
Soit la population de 80 ^ salaris classs daprs le niveau de leur salaire journalier.

Classes en dhs ni ni cumuls
1 90 100 5 5
2
100 110 9 14
3 110 120 16 30
4 120 130 25 55
5 130 140 13
68
6
140 150 7 75
7 150 160 3 78
8 160 170 2 80
Total

80

TAF : calculez la mdiane et les deux quartiles Elments de rponse :
Me = 124
Qi= 110+ (10x6)/16 = 113.7 Qa= 130+(10x5)/13 = 133.8
C'est la diffrence entre le troisime et le premier quartile



C- Variance et cart-type :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable
classe, la variance
V est gale s E l i i = 2f (x - x)
2

i=l n i=i
On a aussi V = 2
ni Xi
- x
2

i=i n
c..d. moyenne des carrs - carr de la moyenne
On utilise plus couramment l'cart type qui est la racine carre de la variance et qui a
l'avantage d'tre un nombre de mme dimension que les donnes (contrairement la variance
qui en est le carr)
La variance est un paramtre de dispersion plus utilis que les autres de par ses proprits
algbriques:
a) ............................................................................... Pour plusieurs populations d'effectifs n
h
n
2
,
............................................................................................ , n
k
, de moyennes respectives
X
1;
X
2J
,x
k ;
de variances V
1;
V
2
, V
k

Variance globale = variance des moyennes + moyenne des variances
V =
o X reprsente la moyenne des moyennes
b) changement d'chelle et d'origine
V
x
^V
y
=a
2
V
K

D- Coefficient de variation :
CV =
C'est un coefficient qui permet de relativiser l'cart type en fonction de la taille des valeurs. Il
permet ainsi de comparer la dispersion de sries de mesures exprimes dans des units
diffrentes Applications :
App.1- Les sries suivantes reprsentent la mesure dun caractre auprs des individus dune
population :
a. 61 810 5 4 11 3 2 9 7 12 13
b. 19 177 1 4 24 15 22 10 13
c. 15 12 17 15 20 15 20 15 15 9 7
d. 21 25 34 10 20 27 14 20 34
Dans chacun de ces cas calculez : la moyenne, la mdiane, le mode,la variance, lcart type et le
coefficient de variation.
Elments de rponse :
a. x=7, Me=7, pas de mode, o
2
=14, o=3.74, V=53.4%
b. x=13.2, Me=14, pas de mode, 02=52.76, o=7.26, V=55%
c. x=14.5, Me=15, Mo=15, 02=14.61, o=3.82, V=26.3%
d. x=22.8, Me=21, deux modes :20 et 34, o2=59.28, o=7.70, V=33.8%

Rsum de Thorie et Statistiques
Guide des travaux pratiques



OFPPT/DRIF 25
OFPPT/DRIF 24



VI- La concentration :
L'objectif est de mesurer les ingalits dans la rpartition d'une variable l'intrieur d'une
population. Cette notion n'a d'intrt que dans la mesure o les valeurs globales suivantes ont une
signification concrte
A- Valeurs globales :
xi reprsentent les valeurs ponctuelles ou les centres des classes, ni les effectifs correspondants.
Les valeurs globales de la srie (xi , ni) sont les quantits gi = ni xi B- Mdiale :
La mdiale de la srie (xi , ni) est la mdiane de la srie (xi , gi)

Rsum de Thorie et Statistiques
Guide des travaux pratiques

App.2- La distribution suivante reprsente la rpartition de la longueur de pinces dcrevisse
provenant dune rivire : ___________________ _____________________________________
Limites ni
1.021.23 5
1.241.45 7
1.461.67 4
1.681.89 1
1.902.11 4
2.122.33 6
2.342.55 3
2.562.77
1
TAF : calculez : la moyenne, la mdiane, le mode,la variance, lcart type et le coefficient de
variation.
Elments de rponse :
x=1.757, Mo=1.345 (le centre de la classe modale), Me=1.648, o
2
=0.238, o=0.488, V=27.8%
Application :
Limportance quantitative des portefeuilles de titres dposs dans une socit de portefeuille
Maroc Invest en Kdh en 1996.
Importance du portefeuille en kdh f% f cumul f% fcumul
Moins de 10.000 41 41 2 2
10.000 50.000 37 78 15 17
50.000 100.000 10 88 11 28
100.000 200.000
6
94 13 41
200.000 500.000 4 98 19
60
500.000 plus 2 100 40 100
Total
100
-
100
-
f reprsentent les pourcentages du nombre total des portefeuilles. f reprsentent les pourcentages
de la valeur totale des portefeuilles. TAF : calculez la mdiane et la mdiale de cette distribution
Elments de rponse :
Me = 19730, Ml= 342105 kdh
OFPPT/DRIF 25


C- Courbe de concentration (ou de LORENZ)
C'est la courbe obtenue en reprsentant
en abscisse, f * les frquences cumules croissantes de la srie (x, n)
en ordonne, q* les frquences cumules croissantes de la srie (x, g
L'allure de la courbe permet d'avoir une ide de la
concentration


quirpartiticn : concentration nulle
Faible concentration Forte
concentration






D- Indice de GINI











Exercice synthtique : (voir TP N1)
Rsum de Thorie et Statistiques
Guide des travaux pratiques


+
!

+
y = 2 A
!
Proprits:
0 <
,
y < 1
y proche de 1 =>
y proche de 0 =>
forte concentration
faible coi centrt on
OFPPT/DRIF 26


VII- Les indices :
Permettent de mesurer l'volution d'un phnomne au cours du temps
A- Indices lmentaires :
L'indice d'volution d'une variable lmentaire y entre la date t0, dite date de rfrence ou
date de base, et la date t, dite date courante est

L'indice base 100, c..d. exprim en pourcentage est
^t/t
0

=
t/tQ
X
100
Remarque: Il est toujours prfrable d'effectuer les calculs avec i et de donner le rsultat en
base 100 la fin des calculs.
On utilise essentiellement l'indice des prix (P), l'indice des quantits ou volumes (Q), et
l'indice des valeurs ou dpenses (V = P Q)
Proprits:
-identit ^t/t


-rversibilit^2^1
X

1

-circularit V*
X
VH
- L'indice est troitement li au taux de croissance
y
t
i - y
t0
. ,
Vki v Vt-o
JtQ
i = r +1 est aussi appel coefficient multiplicateur par les conomistes


Applications :
Rsum de Thorie et Statistiques
Guide des travaux pratiques



Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 27

App.1- Le prix de la tomate au Maroc a t de 1.5 dhs en moyenne en 1980 et de 2.3 dhs en 1995.
TAF : calculez lindice lmentaire du prix de la tomate en 1995, base 100 en 1980 et
interprtez-
Elments de rponse :
2.3/1.5 =) = 95/80) x 100 = 153.33
8
Le prix de la tomate au Maroc a augment de 53.33% entre 1980 et 1995
App.2- On savait que le prix du sucre dans un pays X a augment de 2.5% entre 1960 et 1975 et
de 7.5% entre 1960 et 1995.
TAF : dterminez lindice lmentaire du prix du sucre en 1995 base 100 en 1975, pour le pays
en question.
Elments de rponse :
107.5 = 95/75= 95/75x100 104.88 102.5 60/7

TAF: calculez les indices lmentaires des prix des diffrents articles, puis dterminez lindice
gnral des prix.
Elments de rponse :
I95/85 ( PA) = 40/36 x 100 = 111.11 I95/85 ( PB) = 15/12 x 100 = 125 I95/85 ( PC) = 45/40 x 100 =
112.5 I95/85 ( PD) = 13/15 x 100 = 86.67 I95/85 ( PE) = 50/42 x 100 = 119.05 I95/85 ( PF) = 8/5 x
100 = 160 I95/85 ( PG) = 40/30 x 100 = 133.33 I95/85 ( PH) = 10/8 x 100 = 125
- L in dice des m oyenn es : I
95/85
= 31.2/26.85 = x 100 = 116.2
P85
- La moyenne des indices : I
9S/8
S (P) = a
i
I
95/
85
i
=120.9
B- Indices de LASPEYRES et. de PAASCHE
Ce sont des indices synthtiques qui sont des rsums numriques des indices lmentaires
lorsqu'on cherche mesurer l'volution d'un ensemble de plusieurs produits. coefficient de
pondration ou budgtaire du produit j par rapport la date t :
Exercice de synthse :
Les donnes concernant lvolution des prix de plusieurs articles entre les priodes 1995 et 1985,
ainsi que leur poids sont groups dans le tableau suivant : ____________ ___________________
Prix
Articles
P:- P95 a'
A 36 40 0.15
B 12 15 0.10
C 40 45 0.25
D 15 13 0.05
E 42 50 0.15
F 5 :
0.10
G 30 40 0.05
H :
10
0.15
OFPPT/DR1F 28





=
a) Indice de Laspeyres des prix
sP
j,tQj,t
0

= ( _
x l 0

, ,

Dpense de la date courante e^ rime en quantits de la date de rfrence
Dpense de la date de rfrence
b) Indice de Laspeyres des quantits
. .
x l 0
- = / ( )^ , / (
, ,

Dpense de la date courante e^ rime en prix de la date de rfrence


X
| QQ _
Dpense de la date de rfrence
c) Indice de Paasche des prix
,
" '
<,,

( )
Dpense de la date courante _
Dpense de ladate de rfrenceexp rime en quantit s de ladate courante
d) Indice de Paasche des quantits
'" '
j
I
C Q j ) t / t 0
Dpense de la date courante
= ---------------------------------- ----------------------------------------------------------------- xiUU
Dpense de la date de rfrence esp rime en prix de la date courante
Rsum de Thorie et Statistiques
Guide des travaux pratiques

x i o o
x i o o
OFPPT/DRIF 29



VIII- Rgression et corrlation :
Lorsqu'on observe deux variables quantitatives sur les mmes individus, on peut s'intresser
une liaison ventuelle entre ces deux variables.
La rgression fournit une expression de cette liaison sous la forme d'une fonction
mathmatique.
La corrlation renseigne sur l'intensit de cette liaison.
A- Ajustement dun nuage de points une fonction mathmatique :
a) Ajustement linaire par la mthode des moindres carrs
Lorsque le nuage de points (xi , yi) est peu prs rectiligne, on peut envisager d'exprimer la
liaison entre x et y sous forme de fonction affine y = ax + b
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Application :
Les donnes concernant lvolution des prix et des quantits de plusieurs articles entre les
priodes 1995 et 1985 : ______________ ________________ _______________ ________
Prix
Articles
Ps Ps QSS Q%s
A s
B li ls io io
C

ls ll
D ls ls ls ls
E ! so 1S
F s S is is
G so lo
H S lo so so
TAF : calculez les diffrents indices synthtiques des prix, des quantits et des valeurs. Elments
de rponse :
- Indice de Laspeyrs des prix :
125 ( = ) 8 / 9
- Indice de Paasche des prix :
P( P) =119
- Indice de Laspeyrs des quantits:
L
95/85
(Q)
=
119

- Indice de Paasche des quantits :
P( P) =134
- indice des valeurs (indice des dpenses totales) :
D
95/85
= y P
95
Q
95
= 3030/2136 x 100 =142

P
85
Q
85
OFPPT/DRIF 30





- )
b) Ajustement une fonction exponentielle
Pour ajuster un nuage de points une courbe exponentielle , " suffit de faire le changement
de variable Y = ln y , X = x , A = ln a , B = ln b , pour obtenir l'quation Y = AX + B, et
d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les points (Xi ,
Yi).
c) Ajustement une fonction puissance
Pour ajuster un nuage de points une courbe puissance
:
~~ ,il suffit de faire le changement
de variable Y = ln y , X = ln x , A = a , B = ln b , pour obtenir l'quation Y = AX + B , et
d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les points (Xi ,
Yi).
B- Mesure de lintensit de la relation linaire entre deux variables :
1) Covariance
c
v
(
x
?
y) - "S(
x
i - x) ( y, - )
n
i = l
Cov(x
?
y)>0
(^? y) ^ x et y varient en sens contraire
Cov(x
?
y) = Cov(y,x) Cov(x,x) = V(x)
Rsum de Thorie et Statistiques
Guide des travaux pratiques


b = y -
i =i
a =
b' =x - a ' y
n
a ' =
i = 1

- )?
x et y varient dans le mme sens
OFPPT/DRIF 31


n
Zt xj - x) ( yj - y)



2
( x)
2
Z( yi - y- ! ZC

- 1<r <l
r = 1 s i a> 0
r = - 1 si a< 0
| r | = 1
relation fonctionnelle linaire indpendance linaire 0 < | r | < 1 <=>
dpendance linaire d'autant plus forte que est grand
Attention:
Une forte causalit entre x et y implique une forte relation entre x et y qui n'est
pas forcment linaire; on n'a donc pas obligatoirement une forte corrlation
linaire.
Une forte corrlation linaire n'implique pas forcment une forte causalit.
3) Droites de rgression
) , y ) , _ _
Dy/x : y = ax + bavec
_

)*( ^
La position des deux droites de rgression l'une par rapport l'autre donne un renseignement
sur l'intensit de la relation linaire:
relation fonctionnelle linaire o aa' =0
* droites de rgression
perpendiculaires dont une de pente nulle indpendance linaire
* Plus les droites sont proches, plus la relation linaire est
importante Relations intressantes:
" ^(x) *(y)
r a
( y)
a
( x)
Rsum de Thorie et Statistiques
Guide des travaux pratiques

2) Coefficient de corrlation linaire
cov(x
?
y)
r =
* droites de rgression confondues
OFPPT/DRIF 32




IX- Sries chronologiques :
Ce sont des sries d'observations chelonnes dans le temps. L'objectif de l'tude des sries
chronologiques est double:
analyse d'un phnomne temporel en mettant en vidence essentiellement la tendance
gnrale et les fluctuations saisonnires
laboration d'un modle permettant de faire de la prvision court terme
A- Dcomposition des chroniques :
Lvolution dans le temps dun phnomne rsulte de plusieurs facteurs :
- le Trend ou Tendance : T. Cest le mouvement de longue priode que lon considre le plus
souvent comme une droite (tendance linaire)
- les cycles : C. Cest une alternance de mouvements croissants et dcroissants de moyen terme.
- les variations saisonnires : S. On estime quil y a une composante saisonnire dans une
srie, si, chaque anne, la mme priode, il se produit une variation du phnomne dau moins
25% par rapport la valeur moyenne.
- le rsidu ou ala : s. Cest un vnement exceptionnel impossible ou difficile estimer.
Lvolution dune variable X peut alors sexprimer comme suit :
(1) X= T+C+S+s ou (2) X= T.C.S.s
Le modle additif (1) suppose que chaque composante apporte une contribution pure lvolution
observe.
Le modle multiplicatif (2) montre que chaque composante amplifie les autres et traduit
linterdpendance entre les composantes.
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Application :
Les sries statistiques simples de deux variab es continues X et Y se prsentent comme suit :
Individus 1 3 5 10 11 12 13 14 15
X 12 13 3 12 10 10 3
Y 22 14 15 19 10 11 16 18 11 12 21
TAF : aprs avoir labor un tab eau de contingence, en adoptant des classes damplitudes gales
4 units pour la variable X et des amplitudes 5 units pour la variable Y, il vous est demand
dapprcier la liaison qui existe entre ces deux variables.
Elments de rponse :
Y
X
2 - 7 7 - 12 12 - 17 17 - 22
n
.j
2 - 6 0 0 2 3 5
6 - 10 0 3 2 0 5
10 - 14 3 2 0 0 5
ni. 3 5 4 3 15
Les quations des droites dajustement linaire :
-lajustement linaire de Y X : Y= a.X + b = -1.37 X+ 22.79 -lajustement linaire de X Y : X =
a.Y + b = -0.56 Y+14.62
- coefficient de corrlation r : r = -0.87 ^ Forte liaison linaire ngative entre les deux variables.
OFPPT/DR1F 33


B- La dtermination du Trend :
1) Ajustement linaire par la mthode des moindres carrs
La droite de rgression de Y par rapport au temps t donne pour chaque t une valeur Tt


Rsum de Thorie et Statistiques
Guide des travaux pratiques

2) Lissage par moyennes mobiles dordre k (k = nombre dobservations dans un cycle)
temps variable moyennes mobiles d'ordre 3 moyennes mobiles d'ordre 4
1 yi

2 y2 (yl + y2 + y3)/3

3 y3 (y2 + y3 + y4)/3 (yl/2 + y2 + y3 + y4 + y5/2)/4
4 y4 (y3 + y4 + y5)/3 (y2/2 + y3 + y4 + y5 + y6/2)/4
5 y5 (y4 + y5 + y6)/3 (y3/2 + y4 + y5 + y6 + y7/2)/4
6 y6 (y5 + y6 + y7)/3

7 y7

les moyennes mobiles donnent pour chaque t (mis part les valeurs extrmes) une valeur Tt

Application :
La socit BMT a pour activit la vente de systr
lui a permis sur les cinq dernires annes denre
e dalarme. Le caractre porteur de ce march
gistrer les ventes suivantes en KDH :


Annes N -4 N -3 N -2 N -1 N

Chiffre
daffaires
71697 90574 94550 125257 1-38150

TAF :estimez la prvision des ve
carrs.
Elments de rponse :
soit x le rang de lanne et y le c
ntes pour lanne N+1 en utilisant la mthode des moindres
iffre daffaires


xi y
i
xiyi xi
2



1
2
3
4
5
71697
90574
94550
125257
138150
71697
181148
283650
501028
690750
1
4
9
16
25

Sommes 15 520228 1728272 55
Moyennes 3 104046


a=16759 et b=53769
le chiffre daffaires y sexprimerait donc en fonction du rang x de lanne : y=16759x + 53769
Pou r lanne N+1 (rang 6), la prevision serait la suivante : y=16759 x 6+53769 = 154323 kdh
OFPPT/DRIF 34


C- Analyse de la composante saisonnire :
1) modle additif
- calcul des diffrences Yt - Tt = St + At
- calcul des coefficients saisonniers bruts diffrences de
la saison j
- calcul des coefficients saisonniers
2) modle multiplicatif
- calcul des rapports Yt / Tt = St . At
- calcul des coefficients saisonniers bruts rapports de la
saison j
- calcul des coefficients saisonniers
D- Analyse de la composante alatoire
1) modle additif
At = Yt - Tt - St
2) modle multiplicatif
At = Yt / (Tt . St)
E- Dsaisonnalisation :
Pour exprimer ce qu'aurait t le mouvement brut sans l'influence saisonnire, on utilise la srie corrige
des variations saisonnires Y* (ou Ycvs)
1) modle additif Y*t = Yt - St
2) modle multiplicatif Y*t = Yt / St
F- Srie Ajuste
Cette srie est utilise pour reprsenter ce qu'aurait t le phnomne en l'absence de
phnomnes alatoires
1) modle additif
= Tt + St
2) modle multiplicatif
Y
t = Tt . St
F- Prvision court terme:
Lorsque le trend est obtenu par la mthode des moindres carrs, il est possible d'obtenir une
prvision postrieure l'intervalle d'tude ( condition de rester dans des limites raisonnables),
en utilisant le modle prcdent. Pour une date x correspondant un coefficient saisonnier Sx ,
la tendance vaut Tx , et la prvision est donc donne par Tx + Sx en modle additif ou Tx . Sx
en modle multiplicatif
Rsum de Thorie et Statistiques
Guide des travaux pratiques

S'j : pour chaque saison j, S'j = moyenne des

S'j : pour chaque saison j, S'j = moyenne des

OFPPT/DRIF 35



1. Reprsentez graphiquement cette srie statistique
2. Calculez les coefficients saisonniers de cette srie.
3. Dterminez la srie corrige des variations saisonniers
4. Quelles sont les prvisions pour les annes N+1, N+2, N+3 et N+4 ?
Elments de rponse :
60000 50000 40000 ! 30000 20000 10000 0
1 2 3 4 5 6 7 8 9 10 11 12
trimestres
2.

Rsum de Thorie et Statistiques
Guide des travaux pratiques

Application :
La socit Jihane fabrique des jouets en plastique. Son activit a un caractre saisonnier trs
marqu. On dispose des donnes suivantes relatives aux annes N-2, N-1 et N : ____________

N - 2 N - 1 N
Trimestre 1 18912 25052 27635
Trimestre 2 28362 37579 41440
Trimestre 3 33098 43837 48357
Trimestre 4 14178 18789 20718
Total 94550 125257 138150
TAF :


rimestr1 Timestre2 Trimestre3 Trimestre

yt yt
yt/y
t
yt yt yt/yt yt yt yt/yt yt yt yt/yt
N - 2 189
12

28362

33098 24405 1.36 14178 26325 0.54
N-1 250
52
28819 0.87 37579 30738
1.22
43837 31637 1.39 18789 32443 0.58
N 276
35
33490 0.83 27635 34296
1.21
48357

20718

Coeff
saiso
nnier
s

0.85

1.215

1.375

0.56
Coefficient saisonnier 1
er
trimestre = (0.87+0.83)2 = 0.85 3.
Trimestre
t
1 2
3 4 5
6
7
8
9
10 11 12
yt 18912 28362 33098 14178 25052 37579 43837 18789 27635 41440 48357 20718
Coeff.sais. 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56
Srie
corrige
21013 22690 25460 25778 27836 30063 33721 34162 30706 33152 37198 37669
OFPPT/DR1F 36



Chapitre II. Ralisation des enqutes
Enqute : Investigation auprs dune population donne pour obtenir des rponses prcises
des questions sur un march (enqute par tlphone, enqute postale, enqute par Internet
)
Dtermination
optimale dun chantillon
Echantillon : fraction reprsentative dune population ou dun univers statistique sur lequel porte une
tude. Tous les membres de la population considrs doivent avoir la mme chance dtre choisis.
A. Mthodes dchantillonnage :
Il existe diffrentes manires dextraire un chantillon dune population. Nous ne verrons que les deux
pratiques les plus courantes :
1- Echantillon alatoire :
Tous les individus dune population possdent au dpart des chances gales de faire partie de
lchantillon. On effectue un choix au hasard.
2- Echantillon stratifi :
On divise en strates le population et on tire au hasard dans chaque strate homogne, les
lments obtenus dans chaque strate sont combins pour obtenir le rsultat final.
3- Tirage par quota :
Il consiste reconstituer une population mre miniaturise, au sein de lchantillon.
Lchantillon est considr comme reprsentatif de la population mre.
Exp : dans une population donne, il y a 49% de femmes et 51% dhommes ; on dfinit les quotas qui
permettront dobtenir un chantillon comprenant 49% de femmes et 51% dhommes.
B. Dtermination optimale de la taille de lchantillon :
Rsum de Thorie et Statistiques
Guide des travaux pratiques

4. la prvision de la tendance ncessite un ajustement de la srie corrige des variations
saisonniers (les moyennes mobiles).
Droite dajustement de y
t
=> yt = 1391x + 21228
On obtient les prvisions suivantes pour la tendance : ________________ _______
Trimestre 13 14 15 16
Prvision 39311 40702 42093 43484
Prvisions des ventes des trimestres 13,14,15 et 16 ( N+1,
N
[+2, N+3 et N+4)
Trimestre 13 14 15 16
Prvision de la
tendance
39311 40702 42093 43484
Coeff. Saisonn. 0.85 1.215 1.375 0.56
Prvisions des
ventes
33414 49453 57878 24351
OFPPT/DRIF 37


Exp : un calcul financier prvisionnel a un chef de produit que sa nouvelle marque doit obtenir une part
de march dau moins 15%, sil veut dgager un bnfice. Une tude est mene auprs de s acheteurs
potentiels. Le chef de produit fait pari quune part de march de 20% est tout fait probable. Il se
donne une marge de fluctuation de 3 points autour de ce chiffre. Il veut organiser un test qui simule un
achat rel, en prsentant les principales marques du march. Combien faudra-t-il interroger de
consommateurs potentiels pour vrifier la prvision,
F o r m u 1 e d e c al c u 1
avec :
n : taille de lchantillon ncessaire
z : valeur fournie par la table de la loi normale ; elle varie selon le risque derreur que lon accepte pour
gnraliser les rsultats. Lusage est de retenir 5% soit une valeur de z=1.96 p : pourcentage prvu de
consommateurs qui achtent la nouvelle marque, soit ici 20% q =1-p : pourcentage de consommateurs
qui choisissent une autre marque , ici 80%. e: marge de fluctuation (prcision) accepte pour gnraliser
les rsultats : ici 3 points de part de march, soit 0.03.
Rsultats :
n= (1.96)2(0.2)(0.8)=683 (0.03)
2

I- Elaboration du questionnaire A-
Dfinition :
Instrument de collecte de l'information. Il est fond sur un recueil de rponses un ensemble de
questions poses gnralement un chantillon reprsentatif dune population.
B- Finalits :
Recueillir des informations auprs des personnes concernes par le sujet traiter
Dresser le portrait dune ralit un moment prcis dans le temps
Evaluer les effets d'une action
Raliser un sondage sur un chantillon important
C- Domaine dapplication :

D- Caractristiques :
Rsum de Thorie et Statistiques
Guide des travaux pratiques


Tout type de sujet
Analyse de Critique de l'existant Diagnostic Elaboration et Mise en Suivi et
l'existant

choix de
solutions
uvre ajustement
OFPPT/DRIF 38


Le questionnaire implique gnralement le choix dun chantillon de la population concerne
La standardisation du questionnaire est ncessaire : il est prsent tous les interlocuteurs sous la
mme forme, avec les mmes modalits
Le questionnaire est un instrument pr-test : il doit tre mis lessai avant dtre utilis pour
vrifier sa pertinence
Le questionnaire permet dobtenir trois catgories dinformations :
- Les faits, les attitudes, les attentes, les opinions.
- Les caractristiques associes aux rpondants (sexe, ge, fonction.)
- Les informations relies ladministration du questionnaire (date, lieu, groupe de
rpondants, etc.)
Le questionnaire doit tre accompagn en amont par une communication sur les objectifs et l'utilit
du questionnaire, et en aval par une communication sur les rsultats obtenus.
E- Mode demploi :
Dmarche en 8 tapes :
Dfinition de la problmatique
Dfinition de la population
choix du type de questionnaire. Il existe deux types de questionnaires : Le questionnaire auto-
administr o le sujet rpond lui mme et le questionnaire administr individuellement complt par
lenquteur lui mme lors dun entretien individuel.
Formulation des questions. Les questionnaires possdent en gnral la fois des questions
ouvertes et fermes :
conception du questionnaire
Pr-test du questionnaire : Il consiste vrifier si le questionnaire fonctionne ou si
certaines modifications simposent en termes de contenu et de forme
Codification des rsultats. Raliser une matrice de donnes double entre :
*Chaque ligne correspond un rpondant
*Chaque colonne correspond une variable ou information demande Questions fermes : A
laide dun code numrique ou alphanumrique, on transforme linformation dans un format qui la rend
exploitable
Questions ouvertes : Il faut posteriori dvelopper une liste de codes pour identifier les

Analyse et interprtation des rsultats. Lanalyse a pour but de rsumer les donnes recueillies
de faon rpondre aux questions souleves par la problmatique aborde.
Dmarche en 3 tapes
- Lanalyse quantitative

Il sagit grce au calcul statistique danalyser les informations recueillies, en se plaant du point
de vue prcis des objectifs de lenqute.
Deux grandes catgories dapproche statistique sont gnralement utilises :
Les statistiques descriptives :
Utilisation des mesures de tendance centrales (moyenne, mdiane, mode), ainsi que des
Rsum de Thorie et Statistiques
Guide des travaux pratiques

diverses rponses des interlocuteurs Exemple :
Questions 1 2 3 4 5

n
Rponses
1 2
3 O N
1 2 1 2
3
1 2
3

Question

Question2

Question3


Question n

Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 39

indices de dispersion autour de ces mesures (cart type, interquartile...)
Les statistiques dductives :
Utilises pour rechercher des rapports significatifs entre des variables (corrlation). Elles
permettent de faire ressortir des liaisons que lon n'avait pas souponnes lors du lancement
de lenqute
- Lanalyse qualitative
Elle privilgie les aspects socio-conomiques et psychologiques des rsultats. Elle vise
l'interprtation des rponses fournies.
- Le rapport d'enqute
Il fournit une srie de tableaux accompagns de commentaires sur les points les plus
importants. ; il est structur de la manire suivante :
La prsentation de lenqute qui comprend ;
La prsentation des rsultats qui concerne ;
Les conclusions .
Chapitre III. Ralisation des sondages
Quelques dfinitions :
Sondage : Etude dune partie dune population considrs directement ou aprs redressement, comme
reprsentative de la population totale. Les rsultats obtenus sont rapports la totalit de cette
population.
Le sondage soppose au recensement qui est ltude exhaustive de toutes les units dun ensemble .
Base de sondage : liste ou fichier regroupant lunivers tudi et permettant le tirage au sort des units de
lchantillon.
La statistique : toute mesure calcule partir des donnes chantillonnales Paramtre : toute mesure
calcule partir de lensemble des donnes de la population. Estimation : le procd par lequel on
cherche dterminer la valeur dun paramtre dune population.
Estimateur : la statistique utilise pour effectuer lestimation ; cest une variable alatoire. Valeur estime
: la valeur que prend lestimateur une fois lchantillon tir ; cest une valeur de la variable alatoire que
constitue lestimateur.
I- Estimateur dune moyenne ou dune proportion
Problmatique : Quelle statistique de lchantillon constituera le meilleur estimateur dun paramtre de
la population ?
Exp : on dsire connatre la grandeur moyenne de toutes les femmes ges de 18 ans ou plus vivant dans
une certaine ville. Puisquil serait trop long dtudier toute la population, on procde donc partir dun
chantillon alatoire. Mais, puisque les individus de lchantillon ont t choisis de faon ce quil
reprsente le plus fidlement possible la population, on est

en droit de penser que la moyenne de lchantillon peut prendre une valeur proche de la moyenne
de la population. Mais la moyenne dun chantillon choisi alatoirement dans la population
rencontre-t-elle le critre dun estimateur sans biais ?
A- Esprance mathmatique dune moyenne :
Lesprance mathmatique de la moyenne dun chantillon est un estimateur sans biais de la
moyenne de la population laquelle il appartient :
E (X) =
Exp : soit la population i 2,3,6,8 . Considrons la variable X reprsentant la moyenne dun
chantillon de taille 2 tir avec remise. Lensemble de tous les chantillons possibles auxquels on
associe la moyenne est : _________________________
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 40



On a donc : E(X) = (2.0) 1/16 + (2.5) 2/16 + . . . . + (8.0) 1/16 = 4.75 De plus la
moyenne de la population :
4.75 = 2+3+6+8 =
4
B- Esprance mathmatique dune proportion :
La proportion dindividus prsentant un caractre particulier dans un chantillon est un estimateur
sans biais de la proportion de ces individus dans la population laquelle appartient lchantillon.
Exp :

Reprenons lexemple prcdant, considrons cette fois-ci la variable alatoire P reprsentant la
proportion de nombre impair dans un chantillon de taille 2 tir avec remise. Lensemble des rsultats
possibles est :

Do la ^ distribution de probabilit suivante :
X 2.0 2.5 3.0 4.0 4.5 5.0 5.5 6.0 7.0 8.0
Fi (X) 1/16 2/16 1/16 2/16 2/16 2/16 2/16 1/16 2/16 1/16
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 41



On a donc : E(P) = (0) 9/16 + (1/ 2) 6/16+ (1) 1/16 = 1/4 De plus la proportion de nombres impairs dans
la population est : n = 1/ 4
Estimation ponctuelle dun paramtre :
Lestimation ponctuelle dun paramtre consiste en lvaluation de la valeur du paramtre de la
population laide dune valeur unique prise dans un chantillon. La statistique utilise comme
estimateur doit rencontrer un certain nombre de critres, on a vu celui de lestimateur sans biais.
Dautres caractristiques existent mais ne font pas notre objectif.
Il importe davantage de connatre les rsultats qui suivent :

7

2
0/2
2
3 1 /2
6
0/2

8
0/2

2
1 /2
3
3 2/2
6
1 /2

8
1 /2

2
0/2

3 1 /2
VJ
6
0/2

8
0/2

2
0/2
O 3 1 /2
O
6
0/2

8
0/2
Do la distribution de probabi it suivante :
7
0 1 /2 1
Fi (P) 9/16 6/16 1/16
Signification des termes Paramtre (population) Statistique utilise (chantillon)
Moyenne
I
Proportion n P
OFPPT^R^ 42


Application :
Soit la population 3,7,12,16,25^. Considrer tous les chantillons de taille 2 pris avec remise dans
celle-ci.
1. pour chacun des chantillons, calculez la valeur de la variable alatoire X
2. calculez E(x)
3. calculez , la moyenne de la population
4. comparez les rsultats obtenus en b et c
Elments de rponse :
0. 3 5.0 7.5 9.5 14.0 5.0 7.0 9.5 11.5 16.0 7.5 9.5 12.0 14.0 18.5 9.5 11.5 14.0 16.0 20.5 14.0 16.0 18.5
20.5 25.0
2. 12.6
3. 12.6
4. E(x) =
II- Variance des estimateurs
On peut sinterroger sur les chances que la valeur estime, partir de lchantillon, gale la valeur du
paramtre de l population. Il convient donc de pouvoir faire lestimation dun paramtre tout en tant
capable dvaluer les chances qu cette estimation de se raliser. Pour ce faire nous effectuons ce quon
appelle une estimation pat intervalle de confiance dun paramtre de la population. Le problme
consiste donc trouver les bornes de cet intervalle.
La moyenne de la variable alatoire X est : E( x ) = X = et lcart -type de X est a
X
= a/
Vn (sachant que var (x) = E(x
2
) - [ E(x)]
2
)
Si lchantillon est tir sans remise dans une population infinie ou trs grande avec n< 0.05N ou encore
avec remise dan,s la population, quelle que soit la taille de celle-ci, et
a
X
= a V
N-a
Vn

Si lchantillon est tir sans remise dans une population finie.

On sait que var (x) = E(x
2
) - [ E(x)]
2
Or, on
a :
E(x
2
) = (2.0)
2
1/16 + (2.5)
2
2/16 + ... + ( 8.0)
2
1/16 = 25.40

Rsum de Thorie et Statistiques
Guide des travaux pratiques

Exp : reprenons lexemp e
prcc


n

a

X 2 0 2.5 3.0 4.0 4.5 50 5.5 60 7.0 80
Fi (X) 1/16 2/16 1/16 2/16 2/16 2/16 2/16 1/16 2/16 1/16
Rsum de Thorie et Statistiques
Guide des travaux pratiques


Do : var (x) = 25.40 - (4.75)2
De plus a
2
= (2-4.75)
2
+ ( 3-4.75)
2
+ ( 6-4.75)
2
+ ( 8-4.75)
2
= 5.69
4
et ^2/n = 5.69/2 = 2.84 o n reprsente la taille de lchantillon.
Application :
Un chantillon de taille n est tir, sans remise, dune population de taille 350 dont la moyenne et
la variance sont respectivement 115 et 169. pour chacune des valeurssuivantes de n, valuer la
variance et lcart^ type de la variable alatoire X :
1. 5
2. 15
3. 30
4. 50
Elments de rponse :
1. 33.5 et 5.8
2. 11.3 et 3.4
3. 5.2 et 2.3 4
2.9 et 1.7
III- Estimation par intervalle de confiance de m :
On appelle INTERVALLE DE CONFIANCE un intervalle de la forme [L
1
,L
2
] , ayant une certaine
probabilit de contenir la valeur dun paramtre.
L
1
X -
Z
a
/2
G
x
_et L
2
X -
Z
a
/2
G
x

On appelle NIVEAU DE CONFIANCE, not 1 - g , la probabilit qua lintervalle de confiance
de contenir la valeur du paramtre.
On appelle RISQUE DERREUR , not g , la probabilit qua lintervalle de confiance de ne pas
contenir la valeur du paramtre.
Exp :
La moyenne et lcart -type du rsultat cumulatif dun chantillon de 36 tudiants dune universit
sont 2.6 et 0.3 respectivement. Trouvons un intervalle de confiance 99% pour la moyenne des
rsultats cumulatifs de tous les tudiants de cette universit. On a donc :
X = 2.6, Za/2= Zi/2%=2.58
Et g x= 0.3/ V36 = 0.05
Do : Li = 2.6 - (2.58)0.05 = 2.47
Et L2 = 2.6 + (2.58)0.05 = 2.73
OFPPT/DRIF 45
O : z
a/2
est la valeur de la variable z telle que P(z <
lcart- type d^la distribution dchantillonnage de
Il convient dutiliser :
z
a/2
) = 1- a/2, a le risque d^eur et a
x
X
appele aussi ERREUR TYPE.
z
a/2
=2.58 si a = 1%
z
a/2
=1.96 si a = 5%
z
a/2
=1.65 si a = 10%
OFPPT/DRIF 44


Donc : g [2.47 ; 2..73]
Avec un niveau de confiance de 99% , cest dire que l intervalle [2.47 ; 2..73]
Possde 99% des chances de contenir la moyenne du rsultat cumulatif des tudiants de cette
universit.
Application :
Dans une rgion, on sintresse au temps moyen , inconnu , que prennent les individus dun groupe
pour se rendre leur travail. A partir dun chantillon alatoire de taille 100, on a obtenu un temps
moyen de 12 minutes. Construisez un intervalle de confiance 90% pour , si lon sait que c
2
= 9.
Elments de rponse :
[11.505 ; 12.495] minutes

Contrle continu
Dure : 2h
Un professeur dEPS en charge de deux groupes de filles nayant jamais pratiqu le saut la
perche dcide de les initier ce sport en utilisant deux mthodes dinitiation diffrentes. Les
pe^ormances ralises la fin du cycle dapprentissage sont les suivantes :
Groupe !(mthode A) :
2.20 2.35 2.40 1.15 2.35 2.00 2.55 2.05 1.85 2.85
2.65 2.35 1.90 2.70 2.05 1.95 2.15 2.05 2.80 2.45
Groupe 2(mthode B) :
80 2.00 1.45 2.05 2.00 1.65
2.05 1.65 1.50 1.60 2.15 2.10
1- construire les histogrammes des deux sries de valeurs en utilisant des classes de largeur
0. 2m du type : [1.00-1.20[
2- laquelle de ces deux mthodes semble donner les meilleurs rsultats ? rpondre
la question tout dabord daprs les histogrammes puis selon que le critre est :
moyenne la plus leve
mdiane la plus leve
classe modale la plus leve
maximum le plus leve
minimum le plus lev
cart - type le plus faible
tendue la plus faible
autres critres ?
3- construire un nouvel histogramme, cette fois uniquement pour le groupe 1, en utilisant des
classes de largeur 0.5. le comparer celui de la question 1. Lequel apporte linformation la plus
pertinente ?
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT^R^ 45


Module : Statistiques GUIDE DES TRAVAUX
PRATIQUES
__________________________________________ TPJ __________________________________________
Objectifs viss :

Rsum de Thorie et Statistiques
Guide des travaux pratiques

Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 46

- reprsenter graphiquement une distribution statistique
- tudier la tendance centrale de cette distribution
- tudier la dispersion de cette distribution
- apprcier la forme de cette distribution Dure du
TP :
2h
Description du TP :
Cet exercice permet au stagiaire de matriser la reprsentation graphique dune distribution
caractre quantitatif continu, de sentraner sur le calcul des paramtres de la tendance centrale
et de dispersion et galement de faire un commentaire en se basant sur la forme de la
reprsentation graphique de la distribution.
Droulement du TP :
Dans une commune rurale, o aucune exploitation agricole natteint 123 Ha. La distribution

Questions :
1- quelle est la population cible ? quel est le caractre tudi ? quel est le
nombre de modalits ?
2- reprsentez graphiquement la distribution tudie (simple et cumulative)
3- dterminez les diffrentes caractristiques de tendance centrale
4- quen est-il de la dispersion ?
5- est-ce que la rpartition des terres au sein de cette commune est quitable ?
Elments de rponse :
1- population cible : les 100 exploitations
caractre tudi : la superficie ; sa nature : quantitatif continu
nombre de modalits : 7
^=28.55 Ha
Me = 15 Ha
Mo= 7.5 Ha
4- Etendue = 125 Ha
intervalle interquartile : [Q
1
;Q
3
] = [7.5 ;38.33]
coefficient de variation = 1.04
5- indice de G^I : I
G
=0.613
lindice tend vers 1 plus que vers 0, on dira que la distribution des terres dans cette commune
est assez concentre donc cette distribution est non quitable.
TP 2
des 100 exploitants en fonction de la superficie se prsente comme suit :
Supe^cie en Ha : xi Le pourcentage des propritaires fonciers :fi
Moins de 5 15
5 - 10
20
10- 15 15
15 -20
10
20 - 30
10
30 - 50
12
50 et plus 18
Total
100
OFPPT/DRIF 47


Objectifs viss :
- raliser des reprsentations graphiques pour des variables quantitatives continues.
Dure du TP :
1h30
Description du TP :
Ce TP permettra au stagiaire de matriser la lecture dun tableau reprsentant la distribution
dune variable quantitative continue. Il lui permettra galement de reprsenter graphiquement
ce genre de variable.
Droulement du TP :

Questions :
a- quelles sont les bornes infrieures et suprieures de la 1ere classe ? b- quelles sont les vraies
limites de la 1ere classe ?
c- lintervalle de classe utilise est identique pour chaque classe ? quelle est sa taille ? d- quel est
le centre de la 1ere classe ?
e- quels sont les vraies limites de la classe correspondant leffectif le plus lev ? f- quelles sont
les bornes de la classe lintrieur de laquelle sest trouv recens un loyer mensuel de 239.50
DH ?
g- construisez un histogramme exprimant les donnes du tableau. h- construisez une courbe
deffectifs pour les donnes du tableau.
Elments de rponse :
a- 150dh et 179dh b- 149.50dh
et 179.50dh c- 179.50 - 149.5 =
30 d- 149.5 + 30/2 = 164.50 dh
e- 299.5 dh et 329.50 dh f- 240
dh et 269 dh
TP 3

Objectifs viss :
- calculer les paramtres de tendance centrale
Rsum de Thorie et Statistiques
Guide des travaux pratiques

On considre la distribution dfinie par le tableau ci-dessus :
Loyer mensuel en DH Nombre dappartements
150-179 3
180-209
8
210-239
10
240-269 13
270-299 33
300-329 40
330-359 35
360-389 30
Total 172
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 48

- interprter les paramtres de tendance centrale
Dure du TP :
1h30
Description du TP :
Cet exercice permet au stagiaire de matriser lutilisation des formules de calcul des
paramtres de tendance centrale.
Droulement du TP :
Une agence durbanisme a effectu une tude sur la structure des familles susceptibles de venir
habiter une ville nouvelle dont elle est charge dtablir le projet. Trois types de familles ont t
dfinis selon la prsence et lactivit du conjoint. Daprs cette tude, les distributions de
frquences de ces familles selon le nombre denfants sont les suivantes :


1- dterminez pour chaque type de famille et pour lensemble, le mode de la distribution
selon le nombre denfants.
2- dterminez pour chaque type de famille et pour lensemble, la mdiane de la distribution
selon le nombre denfants.
3- calculez pour chaque type de famille et pour lensemble, le nombre moyen denfants .
Elments de rponse :

Nombre denfants
Chef de famille...
...sans conjoint ... avec femme active
.avec femme inactive
0 33.3 16.2 8.4
1 39.3 26.6 16.4
2 16.6 26.6
25.2
3 6.4 15.6 20.6
4 2.5 9.3 15.3
5 1.1 4.5 12.2
6 0.8 1.2
1.9
7
0.0 0.0 0.0
Total
100.0 100.0 100.0
Les trois types de familles considrs se repartissent en pourcentage comme ci-aprs :
Total
Chef de famille.
.sans conjoint ... avec femme active
... avec femme inactive
100 5.8 52.9 41.2
Questions :
Rsum de Thorie et Statistiques
Guide des travaux pratiques


Ensemble
Chef de famille.
.sans conjoint
. avec femme active
.avec femme
inactive
Valeur du mode
2 enfants 1 enfant
Intervalle modale :
1 enfants
2 enfants
2- On retient pour la mdiane la valeur M pour laquelle la frquence cumule est gale
1
/2.
OFPPT/DRIF 49



TP 4
3-

Ensemble
Chef de famille.
.sans conjoint
... avec femme
active
.avec femme
inactive
Nombre moyen
denfants
2.171
1.120
1.935
2.622


Objectifs viss :
- traiter le lien entre variables caractre quantitatif
- choisir la reprsentation graphique adquate pour chaque distribution statistique
- interprter les reprsentations graphiques
Dure du TP :
2h30
Description du TP :
Cet exercice permet au stagiaire dtudier le lien existant entre deux variables caractre
quantitatifs en se basant sur la lecture dune reprsentation graphique.
Droulement du TP :
Au cours de la dcennie 1990-2000, les effectifs employs au fond dune houillre et la

1- reprsentez lvolution de ces deux sries sur deux graphiques coordonnes
arithmtiques prsents lun au dessous de lautre faon mettre en vidence lexistence de
covariations ventuelles dans le temps.
2- quels sont les inconvnients de cette prsentation ?
3- quel type de graphique permettrait dy remdier ?
4- tracer le graphique de corrlation correspondant au tableau prcdant.
5- comment interprtez-vous ce graphique ?
Rsum de Thorie et Statistiques
Guide des travaux pratiques

production nette de charbon ont volu de faon suivante :
Anne
Effectifs du fond (milliers de
personnes
Production nette de charbon
(millions de tonnes)
1990 71.3 40.1
1991 65.3 35.8
1992 57.6 32.7
1993 50.4 28.4
1994 47.1 25.7
1995 45.8 25.6
1996 42.4 25.1
1997 38.6 24.4
1998 35.9 22.4
1999 32.7 21.1
2000
30.8 20.7

TP 5

OFPPT/DRIF

53


Objectifs viss :
- construire des reprsentations graphiques adaptes aux variables qualitatives et
quantitatives discrtes
- calculer les paramtres de la tendance centrale
- calculer les paramtres de dispersion
Dure du TP :
2h
Description du TP :
Ce TP permet au stagiaire de sentraner sur la reprsentation graphique des variables
qualitatives et quantitatives discrtes. Il lui permet galement de matriser le calcul des
paramtres de la tendance centrale et ceux de la dispersion.


Rsum de Thorie et Statistiques
Guide des travaux pratiques

Un sondage sur la capacit pulmonaire des individus nous a donn les rsultats suivants :
Age Sexe Capacit pulmonaire (litre)
54 F 2.94
19 M 4.03
18
F 3.75
26
M 6.04
19 F 4 92
22
M 6 57
18
M 5 28
20
M 5.19
20
F 4.08
18
M 4.68
17 M 5.38
29 M 4.71
17 M 5.20
43 M 4.50
30 M 4.93
18
F 3 92
25 M 6.54
38 M 5.35
19 F 4.21
26
M 5.40
20
M
6.66
18
M 5.14
16 F 3.49
19 M 5 82
20 M 5.25
21
M 4.89
19 M 6.07
19 F 3 82
19 M 6.71
30 M 5 93
24 M
6 22
17 F 3 86
Questions:

OFPPT/DRIF 54
OFPPT/DRIF 52


1- ConstruiseZ une distribution deffectifs pour chacune des variables
2- donner une reprsentation graphique pour chacun des cas
3- donneZ la mesure de tendance centrale la plus approprie, pour chacune des variables
4- calculeZ lcart type de la distribution de la capacit pulmonaire
Elments de rponse :
3- - -
Age : x= 23.4 ans, sexe: Mo=M, capacit pulmonaire : x= 4.98 litres
4- 0.93 litres
TP 6

Rsum de Thorie et Statistiques
Guide des travaux pratiques

Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 53

Objectifs viss :
- tracer un nuage statistique
- trouver lquation de la droite dajustement linaire
- faire des prvisions en se basant sur la droite dajustement linaire
- tudier la corrlation entre deux variables
Dure du TP :
2h30
Description du TP :
Cet exercice permet au stagiaire de faire des prvisions en trouvant la droite dajustement
linaire par la mthode des moindre carrs. Il permet galement dtudier la corrlation entre
deux variables.
Droulement du TP :

1- tracez le nuage statistique
2- ajustez la droite des moindres carrs
3- quelle note de mathmatiques financires pouvez-vous prdire un tudiant de ce
niveau qui a eu 75 en statistiques ?
4- calculez le coefficient de corrlation ?
Elments de rponse :
2- y= 16.82+0.81x
3- 77.8
4- 0.845
Des tudiants de lere anne TCE ont eu les rsultats en statistiques et en mathmatiques
financires (/100): _______ _____ ______ _____ ______ _____ ______ ______ _____
x (notes de
statistiques)
66
64 69 93
80
71 87 73 79 56 47
Y(notes de
math.fin.)
72 70
60
94
82 68 86 82
90 55 64
Questions :


TP 7
Objectifs viss :
- connatre la terminologie principale des statistiques
- tablir des tableaux statistiques
- construire des reprsentations graphiques
- calculer et interprter les diffrents paramtres des distributions
Dure du TP :
18h
Description du TP :
Ce TP est prsent sous forme de QCM. Il couvre presque la totalit des points traits dans ce
module. Il pourrait tre utilis comme test de connaissances la fin de chaque section.
Droulement du TP :


3- La frquence d'une classe s'obtient en divisant l'effectif de la classe par
OFPPT/DRIF 57
Rsum de Thorie et Statistiques
Guide des travaux pratiques

r r
oui non
r r
oui non
r r
oui non
r r
oui non
TERMINOLOGIE ET TABLEAUX STATISTIQUES
Les caractres suivants sont qualitatifs quantitatifs
- Le tour de ceinture d'une personne r r
- Le code postal de l'habitation d'un foyer franais r r
- La superficie d'une exploitation agricole r r
- Le groupe sanguin d'un individu r r
2-
Les classes suivantes sont-elles bien dfinies?
[ - [
p; 100[ [10G ; 300[ [3GO ; 000[ [600 ;+ [

moins de 4 entre 4 et S entre 8 et 12 entre 12 et 14 plus de 14

X<1 1 <X<2 2 < X < 5 5< X < 10 X > 10

OU ;2.5[ ]4,5 P [5-5,5[ [<5 ;0,5[
]7,5 U
OFPPT/DRIF 55




5- Quelle est la frquence cumule croissante pour x = 3
r r r r
67,2% 63,2% 32,8% 30,4%
6- Pour une distribution continue, l'effectif total s'obtient en multipliant l'effectif de
chaque classe par le centre de la classe et en ajoutant les nombres ainsi obtenus

7- Le tableau ci-dessous (notes obtenues par 40 tudiants un examen de statistique) est un
tableau
Rsum de Thorie et Statistiques
Guide des travaux pratiques

L'effectif total r
Le nombre de classes r
L'amplitude de la classe r
4- Le caractre quantitatif discret x admet le tableau de distribution
suivant
valeurs 1 2 3 4 5 total
frquences 10,5% 22,3% 30,4% 23,6% 13,2% 100%
r r
vrai faux
r De distribution
De donnes ponctuelles
8- Les caractres quantitatifs suivants peuvent-ils tre considrs comme des variables statistiques
continues
12
9 7
1
13
18 12
3
4
6
9 14 5
0 6
15
7 10 3 5 9 5 6 9
0
7 13
8
4 4
11
3
10 12 6 5 8 0 1 7



9- Les tudiants de formation continue sont rpartis selon leur ge dans le tableau suivant
| ge 11 [20 ; 25[ |f [25 ; 30[ IfTsO ; 35[ f\35 ; 40[ || [40 ; 45[ || + de 45~|| total |
| effectifs 11 38 |f 59 ||~ 47 || 24 || 12 || 2 ~|| 182 |
Quelle limite doit-on donner la dernire classe si l'on veut que toutes les classes aient la
mme amplitude



11- On a pu regrouper les individus dune population par classes dont les centres sont les
suivants : 52, 60, 68, 76, 84, 92. Quelle est lamplitude des classes


REPRSENTATIONS GRAPHIQUES
1- A partir du tableau ci-dessous, 3 graphiques ont t tablis. Indiquez celui (unique) de ces
graphiques qui ne constitue pas une reprsentation correcte du phnomne
Rsum de Thorie et Statistiques
Guide des travaux pratiques

le nombre d'accidents du travail survenus dans une PME en 1
an
r
oui
r
non

r r
la teneur en aluminium d'un alliage


oui non
50 55 r 34
Quel est le centre de la classe [30 ; 35[

33 35 37,5 autre rponse
Quelle est la proportion d'tudiants gs de moins de 35 ans
53,3%
R
79,12% 92,31% 25,82%
10- La frquence cumule croissante est dfinie par
- proportion d'individus dont la valeur du caractre est infrieure x r
- proportion d'individus dont la valeur du caractre est suprieure x r
- ensemble des modalits que peut prendre le caractre r
- autre rponse r
2 4
L

16
Rsum de Thorie et Statistiques
Guide des travaux pratiques

OFPPT/DRIF 57


Classe effectifs effectifs cumuls
500 <x <1500
41
>11
1500 <x <2500
15
1 1
2500 <x <3500
62
1 '
3500 <x <4500
226

4500 <x <5500
S 9

5500 <x <6500
W9

6500 <x <7500
83

total 6S5





3
2- Lequel des graphiques ci-dessous correspond l'histogramme des donnes suivantes






( 100 105 110 120 130 150 (xlO ^
90 80 70 40
( 10 ) 150 30 1 30 1 110 105 100 95 90 80 70 40

Rsum de Thorie et Statistiques
Guide des travaux pratiques


Ch effectifs cumul fsctif
400 < x <700 11

700 < x <800 21

900 > 00 <x 23

900 < K <950 24

950 i x < 1000 18
P7
1000 < x < 1050 20

1050 < K <1100 19

1100 i K <1200 35

1200 < x < 1300 21
li'
1300 <K < 1500 8

tatal 200

50 50
40
40

30 30
20
10

20
10
rffh-L
r
i 2


OFPPT/DRIF

61
OFPPT/DRIF 59


OFPPT/DRIF 60




3- Le caractre quantitatif X admet la distribution suivante:

Quelle est la reprsentation graphique des frquences qui
convient?

0 1 2 4 0 1 2 4

une autre reprsentation

Quelle reprsentation graphique des frquences cumules croissantes convient?
Rsum de Thorie et Statistiques
Guide des travaux pratiques




classes [0 ; 1[ [1 ; 2[ [2 ; 4[
effectifs 40 30 30


r r
2
r
r
4- Le caractre quantitatif X admet la distribution
suivante:
classes [0 ; 1[ [1 ; 2[ [2 ; 4[
effectifs 40 30 30
OFPPT/DRIF 61




5- La reprsentation graphique ci-dessous est un
diagramme

6- Un histogramme est une reprsentation graphique de la distribution des frquences
d'une variable statistique continue

7- Dans un diagramme secteurs, la modalit n 2 du tableau ci-dessous serait reprsente par
un secteur d'angle
Rsum de Thorie et Statistiques
Guide des travaux pratiques


r
i 2 3

une autre reprsentation


2 4

r en btons
r secteurs
r bandes
VRAI r
FAUX r
OFPPT/DRIF 62








8- Le tableau suivant donne la rpartition des mnages d'une population selon le nombre de
vhicules possds


CARACTRISTIQUES DE TENDANCE CENTRALE ET DE POSITION
1- Quelle est la moyenne des valeurs ci-dessous


Rsum de Thorie et Statistiques
Guide des travaux pratiques

modalits effectifs
1
30
2
15
3 25
4 30
15 degrs r
54 degrs r
60 degrs r
nombre
d'automobiles
0 1 2
3 4 et plus
nombre de mnages
528 2463 906 156
12
9- La reprsentation graphique qui convient le mieux est
r r r
un histogramme une autre reprsentation un diagramme en btons

xi ni
20
58
30
188
40 54
2- La mdiane d'une distribution est toujours gale au second quartile
OUI NON
3- Dans une srie statistique, il est possible de dterminer dix dciles
OUI NON
OFPPT/DRIF 63


OFPPT/DRIF 64


4- On observe pendant 79 jours ouvrables, le nombre de lettres recommandes mises au cours
de la journe, par le service des approvisionnements. L'volution de ces envois au cours de cette
priode est fournie dans le tableau suivant. Dterminer le premier et le troisime quartile de
cette srie d'expditions quotidiennes de lettres recommandes.


Rsum de Thorie et Statistiques
Guide des travaux pratiques

ran
g
nbre
lettres
ran
g
nbre
lettres
ran
g
nbre
lettres
ran
g
nbre
lettres
ran
g
nbre
lettres
Ql=7 Q3=12
1 1
17
6
33 7 49
8
65
11
2
3
18 6
34 7 50
8 66 11
3 3 19 6 35 7 51 9 67 11
4 4 20 6 36 7 52 9 68 11
5 4 21 6 37 7 53 9 69 11
6 5 22 6 38 7 54 9 70 11
7 5 23 6 39 8 55 9 71 11
Ql=6 Q3=l 1
8 5 24 6 40 8 56 9 72 12
Ql=7 Q3=10
9 5 25 7 41 8 57 9 73 12 Ql=3,75 Q3=l 1,25
10 5 26 7 42 8 58 9 74 12 autre rponse

11 5 27 7 43 8 59 10 75 12
12 6 28
7 44
8 60 10
76 13
13
6
29 7 45
8 61 10
77 13
14 6 30 7 46 8 62 10 78 14
15 6 31 7 47 8 63 10 79 15
16 6
32 7 48
8
64
10

5- Cocher la nature des indicateurs numriques suivants

Paramtre de position
Paramtre de
dispersion
ni l'un ni l'autre
effectif total r r r
3 dcile
r
r r
moyenne gomtrique r r r
OFPPT/DRIF 65




8- On donne la srie statistique suivante : 14, 16, 12, 9, 11, 18, 7, 8, 9, 16, 7, 9, 18. La
mdiane est gale


Rsum de Thorie et Statistiques
Guide des travaux pratiques

6- Soit le tableau suivant
modalits effectifs

employs de service
2
manoeuvres 3
Sachant que la moyenne arithmtique est
12,5 le nombre de cadres suprieurs est ouvriers
12
7
ouvriers spcialiss
22
10
5
agents de matrise 15
autre rponse
employs 28

cadres 13
cadres suprieurs ?
7- Il existe 100 centiles qui partagent une srie statistique
r r
OUI NON
r r r F r r r autre
9
11
14
16 18
[9;18[ [11;18[ rponse
9- La moyenne gomtrique d'une srie statistique est
La racine carre du produit des valeurs observes r
la racine cubique du produit des valeurs observes r
la racine n-ime du produit des valeurs observes r
le produit des racines n-ime des valeurs observes r
le quotient des racines n-ime des valeurs observes r
autre rponse r
OFPPT/DRIF 66


OFPPT/DRIF 67


10- Quand les classes d'une srie statistique sont d'amplitudes ingales, il faut obligatoirement
corriger les effectifs ou les frquences pour calculer la mdiane

11- La moyenne harmonique d'une srie statistique est gale l'inverse de la moyenne
arithmtique des inverses des valeurs

12- La mdiane partage l'histogramme en deux surfaces gales

13- Soit la srie suivante





Rsum de Thorie et Statistiques
Guide des travaux pratiques

r r
OUI NON
r r
OUI NON
r r
OUI NON
la moyenne quadratique est
r
1,92
r
2,78 357
gale
r
4,86
r
5,04 15
la moyenne gomtrique est
r
1,87
r
2,15 3, 57
gale r
6,25
r
autre rponse
la moyenne harmonique est
r
6,25
r
215 1, 92
gale r
1,87
r
autre rponse
1 xi ni 1
1 1 II 20 |
1 2 | 30 |
1 3 | 15 |
1 4 | 10 I
1 5 | 5
1 6 II 2 |
14- La rpartition des clibataires selon leur ge est fournie par le tableau suivant
ge [15 ; 30[ [30 ; 40[ [40 ; 50[ [50 ; 60[ [60 ; 70[ [70 ; 80[ [80 ; 90[
effectifs 4500 450 400 230 200 ? 20
Sachant que l'ge moyen est gal 28,8 ans, la valeur manquante est
65 97 102
150 165 autre rponse
mdian est
20,4
r
22,6 24,8
26,7
r
autre rponse

OFPPT/DRIF 68


OFPPT/DRIF 69


CARACTRISTIQUES DE DISPERSION
1- Compltez le tableau suivant pour calculer la

variance


3- La synthse d'un ensemble d'observations relatives une variable quantitative peut
s'effectuer par des paramtres de tendance centrale et de dispersion.
L'une des quatre rponses suivantes n'a rien voir avec ce type de synthse:

4- On observe sur un tronon d'autoroute, pendant 51 jours, le nombre x de dpannages
effectus au cours de la journe. Calculer l'intervalle inter-quartile des observations
Rsum de Thorie et Statistiques
Guide des travaux pratiques


x
i

X
n
i
X
i

40
... ... ...

50
...
5000
...

...
87 5220 313200
TOTAL
... ...
12740 664000
la variance vaut
6,293 7,69 4341,73 59,08
2- Calculez le coefficient de variation des donnes suivantes:
xi ni

70 91 0,085 45,64
80 189
0,546 6,76
90 70

moyenne frquence moyenne par unit d'amplitude
et cart-type et mode
mdiane variance
et cart-type et mode
OFPPT/DRIF 70



















Rsum de Thorie et Statistiques
Guide des travaux pratiques

ran
g
nbre
dpannages
ran
g
nbre
dpannages
ran
g
nbre
dpannages
ran
g
nbre
dpannages
ran
g
nbre
dpannage
s
1 1 11
3
21
4 31 4 41
6
2 1 12
3
22
4 32 4 42
6
3 1 13 3 23 4 33 5 43 6
4 1 14 3 24 4 34 5 44 6
5 1 15 3 25 4 35 5 45 6
6 2 16
3
26
4 36 5 46
6
7
2
17 3 27 4 37 5 47 7
8 2 18
3
28
4 38 5 48
8
9
2
19 3 29 4 39 5 49 9
10 3 20 4 30 4 40 5 50 10

51
11

L'intervalle inter-quartile vaut
r r . r , 6 r ,

4 5
autre reponse
5- La variance est toujours positive ou nulle
r r
OUI NON

A B C E

effectifs
salaire
moyen
effectifs
salaire
moyen
effectifs
salaire
moyen
effectifs
salaire
moyen
Ouvriers
60 10 180 8
5
10
245 8,5306
Employs 30
20 10 16
30 25 70 21,571
Cadres
10 100 10
90 15
100
35 97,143
Total
100 22 200
12,5 50 46 350
20
6- Une entreprise E possde 3 tablissements A, B, C. Les effectifs et les salaires moyens pour les ouvriers
, les employs , et les cadres , sont donns dans le tableau suivant
562,51 478,28 129,86
La variance intra-tablissements est gale
r r r
OFPPT/DRIF 71


OFPPT/DRIF 72


LA CONCE NTRATION
1- Si, pour un caractre quantitatif continu et positif, la mdiane est trs peu diffrente de la
mdiale, alors l'indice de concentration de Gini est peu diffrent de

2- Dans un diagramme de concentration on porte gnralement en ordonnes les valeurs des
frquences cumules des valeurs globales. Comment s'crivent ces valeurs

INDICES
1- Le chiffre d'affaires d'une entreprise a augment de 2% par an pendant 2 ans, puis a
diminu de 9% par an pendant 4 ans, et a augment de 8% par an pendant 3 ans. Quelle est
l'augmentation moyenne sur la priode




Rsum de Thorie et Statistiques
Guide des travaux pratiques





n
i
x
i

n
nx

T! nx
;


autre rponse

1% 9% < 0% autre rponse
2- tant donn une population de 50 millions qui a cr au taux de 20% par an, quelle tait
cette population il y a 12 ans _____________________________________________________
689 486 38 659 424 39 318 555 1 832 607 5 autre rponse
3- Une hausse de 80% suivie d'une baisse de 50% revient
une baisse de 10% une baisse de 20% une baisse de 30%
une hausse de 10% une hausse de 30% autre rponse
4- Une hausse de 60% suivie d'une baisse de 40% revient
une hausse de 20% une baisse de 10% une hausse de 10%
une baisse de 20% une baisse de 4% autre rponse
OFPPT/DRIF 73



6- Le calcul de l'indice de Laspeyres ncessite de pondrer les indices lmentaires par des
coefficients budgtaires relatifs ____________________________________________________

7- Calculez l'indice de Laspeyres des prix de 1998 par rapport 1990 partir des donnes du
tableau suivant





8- Calculez l'indice de Paasche des quantits de 1998 par rapport 1990 partir des donnes du
tableau suivant

Rsum de Thorie et Statistiques
Guide des travaux pratiques

5- Une grandeur augmente de 10% par an. Au bout de combien d'annes aura-t-elle doubl
11 ans 11,1 ans 10 ans 7,27 ans 6,23 ans
1 an 12,45 ans 8,27 ans autre rponse
r r
la priode de base la priode courante
Modle
Quantits Prix Ventes

1990 1998 1990 1998 1990 1998
Produit A 50 55
18 22
900
1210
Produit B 69
62
23 25 1587 1550
Produit C 96 115
28
25
2688
2875
Total

5175 5635
108,91 100,97
107,85 99,98
Modle Quantits Prix Ventes


1990 1998 1990 1998 1990 1998
Produit A 90 99 13
16
1170 1584
109,53 108,58
Produit B 56 50
18 20 1008 1000
104,81 105,69
Produit C 78 94 23 21 1794 1974

Total

3972 4558
OFPPT/DRIF 74


OFPPT/DRIF 75


RGRESSION LINAIRE
1- Pour justifier un ajustement affine (y = ax + b) , on a calcul le coefficient de corrlation
linaire r. Dans les cas suivants, le rsultat est

2- Quand on ajuste linairement x et y par la mthode des moindres carrs, on obtient deux
droites de rgression. L'quation de la droite D de y par rapport x est

3- Dans le cas d'indpendance totale, le coefficient de corrlation linaire est gal

4- Une valeur leve du coefficient de corrlation linaire est signe d'une relle relation
causale, dans le cas

Rsum de Thorie et Statistiques
Guide des travaux pratiques

r = 1,22 mdiocre bon idiot
r = -0,89 mdiocre bon idiot
1
"? < v
r

r r r r
0 autre rponse
du revenu national et de la consommation finale r OUI r NON
du prix d'un produit et du prix d'un produit substituable r OUI r NON
du nombre d'abonns au tlphone et des ventes de mdicaments contre
le stress
r OUI r NON
des heures travailles par les tudiants pour rviser leurs examens et
leurs taux de russite ces examens
r OUI r NON
de la taille des salaris et de leurs salaires r OUI r NON
de la taille des salaris et de leurs poids r OUI r NON
de la temprature et de l'allongement d'une barre d'acier r OUI r NON
OFPPT/DRIF 76


OFPPT/DRIF 77


5- Utiliser les calculs effectus dans le tableau ci-dessous pour calculer la covariance entre
les variables x et y

































Rsum de Thorie et Statistiques
Guide des travaux pratiques

1
xi y
i
xiyi xi
2
y
i2

1
50 7 350 2500 49
2 60 5 300 3600 25
3 70
6
420 4900 36
4
80
3 240 6400 9
5 90
1
90
8100 1
SOMME 350
22
1400 255000
120
autre rponse 308 28 -28
6- D'aprs les donnes et le graphique du tableau ci-dessous, indiquer laquelle des propositions
s'applique correctement ces informations
xi y
i

19
12
52 17
38 25
81
43
109 55
75 73
66
42
100
75
La covariance entre x et y est positive
La covariance entre x et y est ngative
on ne peut rien dire priori sur le signe
de la covariance entre x et y
Le concept de la covariance n'est pas pertinent
pour analyser statistiquement le phnomne
tudi
aucune proposition ne convient

r
6300
r r r r
0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 3 0 9 0 1 0 0 1 1 0 1 2 0
OFPPT^R^ 78




SRIES CHRONOLOGIQUES




Rsum de Thorie et Statistiques
Guide des travaux pratiques

i 2 3 4 5

xi
10 12
14 6 8

yi 957 939 97 006 2 0

7- Calculer la pente a de l'quation de rgression y = ax + b , pour les donnes du tableau
suivant
autre
rponse

,8
5

0,09

977

853,

i 2 3 4 5

xi 6 8
20 22
24

yi 462 449 458 378 365

8- Calculer l'ordonne l'origine b de l'quation de rgression y = ax + b , pour les donnes
du tableau suivant
autre
rponse

687,4

4 , 756

-13,25

422,4

1-On considre la srie chronologique

Trimestre Trimestre 2 Trimestre 3 Trimestre 4
995 0 2 3 4
996 5 6 3
997 2 7 8 5
998 3 7 9 6
2- Si une srie suit un modle multiplicatif et qu'on divise les valeurs de
la srie brute par les valeurs des coefficients saisonniers, on obtient ___
la srie des variations alatoires ou accidentelles

la srie ajuste

la srie dsaisonnalise (C.V.S.)

autre rponse
3- Soit la srie chronologique suivante, qui suit un modle multiplicatif
t 2 3 4 5 6 7 8 9 0 2
yt 47 30 39 4
62
40 50 6 69 50
62
5
Le trend, la date t = 3, calcul par les moyennes mobiles d'ordre 4 est gal
39 22 34,38 68,75 28,51
OFPPT/DRIF 79









Rsum de Thorie et Statistiques
Guide des travaux pratiques

La valeur la mme date de la srie CVS est
41,46 0,98 37,5 38,4 33,9
4- Soit la srie chronologique

Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
Anne 1
20 18 20 22
Anne 2 24
22
24
26
Anne 3
28,8 26,8 28,8
30,8
Anne 4 34,6 32,6 34,6 36,6
Anne 5 41,5 39,5 41,5 43,5
La srie suit un modle de type
r r
additif multiplicatif
5- Soit Yt la srie du chiffre d'affaires mensuel d'une entreprise de janvier 1987 dcembre
1991. L'quation du trend est Tt = 3,76 t + 700 ; (t = 1,....,60)
Les coefficients saisonniers sont :
janvier S1 = -16 mai S5 = 11 septembre S9 = - 60
fvrier S2 = -51 juin S6 = 64 octobre S10 = -1
mars S3 = -80 juillet S7 = 0,09 novembre S11 = 62
avril S4 = -81 aot S8 = -69 dcembre S12 = 222
Sachant qu'on a un modle additif, une estimation de la valeur
future de juin 1993 est
940,64 1057,3 764
1038,48 831,7 autre rponse
6- Soit la srie chronologique ci-aprs q ui suit un modle de type additif

1996 1997 1998
1 trimestre 420 515 500
2 trimestre 615 685 835
3 trimestre 825 1000 980
4 trimestre 540 620 700
- La moyenne mobile d'ordre 4 du 3 trimestre 1997 est
768 772 703 733 680
- La valeur du coefficient saisonnier brut S' du 1 trimestre est
OFPPT/DRIF 80


OFPPT/DRIF 81




Rsum de Thorie et Statistiques
Guide des travaux pratiques

r 5,15 48 65 - r - 192 109 -
- Le coefficient saisonnier S du 1 trimestre est

r - 109 179 - 194 - r - 13

La valeur de la srie CVS au 2 trimestre de l'anne 1996 est
r r r r
609 679 576 642
OFPPT/DRIF 82


Evaluation de fin de module
Dure : 2h30 Questions : (8 points)
1- quest ce quon entend par :
caractre qualitatif ?
caractre quantitatif ?
variable statistique discrte ?
variable statistique continue ?
2- Dfinissez les termes suivants :
le mode
la mdiane
ltendue
lcart type
Exercice 1 (6 points)
En lanne N, les recettes du budget de lEtat se prsentent de la faon suivante (en milliards
de HD):
- taxe de la valeur ajoute (TVA) : 348
- Impt gnral sur les revenus(IGR) : 168
- Impt sur les socits (IS) :71
- Taxe sur les produits ptroliers : 54
- Autres impts : 161
- Recettes non fiscales : 41
Travail faire :
Reprsentez graphiquement les recettes du budget de lEtat en N par deux graphiques
adquats de votre choix.
Exercice 2 : (6 points)
Une srie dobservations concernant les notes obtenues un examen par un groupe de

Travail faire :
Dterminez la note moyenne et calculez lcart type de la srie.
Elments -critres dvaluation
Questions :
1- distinguer les diffrents types de caractres
2- dfinir les diffrents paramtres de tendance centrale et de dispersion
Exercice 1
choisir les reprsentations graphiques correspondantes choisir les graduations et les lgendes
adquates
Calculer avec exactitude la moyenne
Calculer avec exactitude lcart -type
Suivre une mthodologie pour le
calcul.
Rsum de Thorie et Statistiques
Guide des travaux pratiques

Notes [10,30[ [30,50[ [50,70[ [70,90[ [90,110[ [110,130[ [130,150[ [150,170[ [170,190[
Effectifs 4 17 63 83 72 33
21
5
2
Exercice 2


Liste des rfrences bibliographiques :

Rsum de Thorie et Statistiques
Guide des travaux pratiques

Ouvrage Auteur Edition
Probabilits et statistiques
Audet, Boucher, Caumartin
et Skeene
Gaten morin, 1983
Manuel de statistiques
descriptives
Omar Raja El Wataniya, 7.001
Mmento pratique sta
tistiques
Rachid Boutti
Collection Expertise, 1996
Gestion prvisionnelle et
mesure de la performance
Brigitte Doriath et Christian
Goujet
Dunod, 7007
Lessentiel du marketing Eric Vernette
Editions dOrganisation,
7007
Statistiques descriptives
Niveau technicien
O.F.P.P.T Mars 1993
www.larrun.iut.bavonne.univ-au.fr
OFPPT/DR1F 84

SOMMAIRE
Gnralits : .......................................................................................................................................... 2
I. Dfinitions : .............................................................................................................................. 2
II. Apport de la statistique aux conomistes : ......................................................................... 2
III. Les limites de la mthode statistique : ................................................................................... 2
IV. Le vocabulaire utilis en statistique : ..................................................................................... 3
V. Quelques symboles mathmatiques utiliss : ........................................................................ 5
Chapitre I : La reprsentation graphique ........................................................................................ 6
I. Le ................................................................................................... diagramme en btons : 6
II. Le ................................................................................................................ tuyau dorgue : 6
III. Le ..................................................................................................................... diagramme : 7
IV. Le ............................................................................................... polygone des frquences : 7
V. La courbe cumulation (courbe ............................................ des f cumuls) : 8
VI. Le ........................................................................................................ diagramme polaire : 9
VII. ......................................................................................................................................
Les graphiques secteurs : ............................................................................................................ 11
Chapitre II : LES PRANCIPALES CARACTERISTIQUES DUN SERIE ................................ 12
INTRODUCTION ............................................................................................................................... 12
SECTION 1 ......................................................................................................................................... 12
I. LES MOYENNES ................................................................................................................. 12
II. La mdiane (Me) .................................................................................................................... 23
III. ....................................................................................................................................... Le
Mode : .............................................................................................................................................. 25
IV. Le choix dune caractristique de
tendance centrale : ............................................... 27
SECTION 2 ......................................................................................................................................... 28
I. Lintervalle de variation ou ltendue : ............................................................................... 28
II. .........................................................................................................................................
Lintervalle inter quartile : ............................................................................................................ 29
III. .......................................................................................................................................
Lcart absolu moyen : ................................................................................................................... 31
SECTION III ....................................................................................................................................... 33
I. La dtermination algbrique de la concentration ............................................................. 33
II. La dtermination graphique de la concentration la courbedeLorentz GINI ................. 35
Chapitre III :Les Sries double entres : Rgression Linaire (Corrlation) ............................ 37
I- notion de tableau de contingence : ....................................................................................... 37
II- gnralisation du tableau de contingences : ........................................................................ 38
III- La rgression linaire ............................................................................................................ 39
IV- la corrlation linaire : .......................................................................................................... 43
Chapitre IV : Analyse des sries chronologiques ............................................................................. 47
I ........................................................................................................................................... -
Gnralits : .................................................................................................................................... 47
II .......................................................................................................................................... -
lanalyse de la tendance longue : trend ................................................................................... 48
CHAPITRE V :Populations et chantillons, recensements et sondages ........................................ 49

I. Quelques termes de base : ................................................................................................... 49
II. Exemples: ................................................................................................................... 50
III. Etapes d'une enqute statistique : ........................................................................... 50
EXERCICES 52
STATISTIQUE DESCRIPTIVE
Page 2


Statistique descriptive
GENERALITES : I. Dfinitions :
On appelle statistique la mthode scientifique qui vise observer, collecter, analyser
des donnes quantitatives.
La statistique descriptive est la partie de la statistique qui sert dcrire un phnomne, c-
-d de mesurer, classer les mesures, prsenter ces mesures par quelques indicateurs de manire
donner une ide simple et rapide dun phnomne tudi.
Les statistiques se sont des donnes chiffres relatives un phnomne tudi.
EX : des statistiques du chmage.
II. Apport de la statistique aux conomistes :
La statistique est un outil indispensable tant aux thoriciens quaux praticiens de lconomie.
1. La statistique est utile aux thoriciens :
Elle permet de mettre en vidence (rvler) lexistence dinterdpendance entre diffrents
phnomnes conomiques. EX : M=P*T
Elle permet de tester la validit dune hypothse thorique.
Investissement = f (revenu) =0.76R+124
Consomm Revenu ^ thsauris
^. Epargn^
^. Investi
2. La statistique est utile aux praticiens de lconomie :
La statistique permet aux entrepreneurs de mieux contrler la gestion de leurs
entreprises.
Elle permet galement au pouvoir public de mieux dfinir leurs politiques conomique,
fiscale, montaire et demploi.
III. Les limites de la mthode statistique :
Pour viter des erreurs dinterprtation due une mauvaise utilisation statistique, il faut savoir :
1. La statistique sintresse au grand nombre, elle ignore les cas particuliers.
2. La rsultante dun grand nombre dinformations peut tre diffrente de la sommation de
ces diffrentes informations.
*comportement collectif # sommation des comportements individuels
3. Quand on tudie un phnomne on nest jamais certain que lon dispose de toues les
informations le concernant.
4. Il ne faut pas oublier que la statistique nest quun outil au service de
lconomiste, ce qui nous oblige de ne jamais, oublier de faire une analyse
conomique des rsultats.
Les mmes causes # les mmes effets.
Les corrlations mmes trs parfaites ne signifient pas toujours
quil y a interdpendance entre les phnomnes tudis.
IV. Le vocabulaire utilis en statistique :
1. Population statistique :
STATISTIQUE DESCRIPTIVE
Page 3


Ensemble sur lequel porte ltude
Ex : Age des tudiants de 1
ere
anne : lensemble tudi cest lge.
2. Unit statistique :
Une population se compose dlments chaque lment est appel
unit statistique.
EX : la population dtudiants : lunit statistique est un tudiant.
3. Caractre statistique :
Cest le critre retenu pour tudier une population
Continu
Il peut tre quantitatifs^^ discontinu, discret X Qualitatif
S Un caractre est dit quantitatif lorsquil est mesurable
Continu : cest un caractre qui peut prendre toutes les valeurs dun
intervalle donn.
EX : ge
Discontinu : cest un caractre qui ne peut prendre que quelques valeurs
dans un intervalle donn
EX : le nombre des frres, Mnage
S Un caractre est dit qualitatif lorsquil nest pas mesurable
EX : la nationalit, les catgories sociales professionnelles.
4. Modalit statistique : de caractre :
On appelle une modalit les diffrentes situations possibles dun caractre.
EX : caractre sexe : modalits possibles : M/F Caractre
tat matrimonial : 4 modalits possibles :
clibataire/mari/divorc/veuf.
STATISTIQUE DESCRIPTIVE
Page 4


Effectifs (frquences absolues)



6. Frquence relative :
Cest la part des effectifs dune modalit.
EX : 200/600=33/100 est la frquence relative de premire modalit
7. Srie statistique :
Distribution de frquences, distribution de statistiques ou tableau statistique, cest
un tableau qui nous donne lensemble des valeurs mesurant le caractre.
EX :

Srie avec des classes.
8 Classes
On appelle classe un groupement de valeurs du caractre selon des intervalles qui
peuvent tre gaux ou ingaux.
Pour chaque classe on peut dfinir :
Une limite infrieure
Une limite suprieure
Intervalle de classe (amplitude)= limite (sup)- limite (inf)
Centre de classe = [limite (sup) + limite (inf)]/2
NB : [40-60[ signifie quon comptabilise les salaris qui gagnent entre 40 et 60DH,
en incluant ceux qui gagnent 40 DH et excluant ceux qui gagnent 60Dh.
5.
iques relatif une modalit donne :
45Age Electifs
17-18
200
18-19 350
19-20 50
total
600
Cest le nombre dunits statis
Effectifs
sexe Effectifs

Masc. 200

Nombre Arbre de
Fm
100

denfants mnages
total 300

2 18

3 28
Salaires (dh) Effectifs

4 10
[40-60[ 10

5 4
[60-70[ 25

total
60
[70-80[ 05

total 40
S

r

(D

i

p

.

STATISTIQUE DESCRIPTIVE
Page 5


V. Quelque symboles mathmatiques utiliss :
1. Les valeurs du caractre = x1, x2,..., xi,..., xn





2. Les effectifs sont symboliss par : x
1
, x
2
,..., x,..., x
n

x
1
, x
2^ .
x
h .
x
n= N =effectif total
3. Frquence relative :
Fi = effectif de la modalit i / effectif total
4. Loprateur somme ( )
Notation : n variables
x!+ x
2
+... + xi+..+ x
n
= xi
Proprits :



5. Lopration de produit : (
n
)
Notation : le produit de x variable scrit :
Xi.x
2
.x
3
....x
n
= xi
z=l
Proprit :
n a = a
n
n axi = a
n
H xi
Notes Nbre dtudiants
X
1 10 x
1

x
2
25 x
2

X3 12 X3
X
4
4 x
4



xi = n.a + xi
i=l
V a + xi =V aV
STATISTIQUE DESCRIPTIVE
Page 6


CHAPITRE I : LA REPRESENTATION GRAPHIQUE
Lintrt dun graphique cest de synthtiser des informations statistiques dune
manir image, cest dire globale.
I. Le diagramme en btons :

On sen sert pour reprsenter des sries caractre discret.
Cordonn




II. Le tuyau dorgue :
On se sert de ce graphique pour reprsenter des sries caractre qualitatif EX : La
population une station balnaire est compose de :
Allemands : 45%
Franais : 30%
Espagnoles : 15%
Autres : 10%

.Les valeurs de
caractre
.
0 1 2 3 4 5
Abscisse
Nombre denfants Nombre de mnage
0
25
1 42
2
38
3 15
4
6
5

Total
128

STATISTIQUE DESCRIPTIVE
Page 7


III. Le diagramme :
Il permet de reprsenter des sries de caractres ou les observations sont regroupes en
classe.
Cas ou les intervalles de classe sont gaux :

Remarque :
1) Lorsque une des limites de classe nest pas prcise dans un tableau il convient de prendre
comme intervalle de classe le mme que celui de la classe suivante ou prcdente.
2) La surface des rectangles est proportionnelle leur effectif.
Cas ou les intervalles de classe ne sont pas gaux :
EX : Rpartition de population selon leurs salaires.

Pour tracer lhistogramme, on commence par corriger les effectifs.
IV. Le polygone des frquences :
Il permet de donner une image plus lisse du phnomne que lhistogramme. On lobtient en
joignant les milieux des sommes des rectangles de lhistogramme.


Sriel


STATISTIQUE DESCRIPTIVE
Page 8


Remarque :
1) La surface sous le polygone = la surface de lhistogramme.
2) Lorsquil y a un trs grand nombre de classe, lintervalle de classe devient de plus en
plus petit et le polygone de frquences se transforme en cours de frquence.
Courbe de frquences
I ,
V. La courbe de cumulation (courbe des f cumuls) :
Elle permet de connatre le nombre dobservations suprieures ou infrieures une valeur
donne.
Les 2 types de courbes de cumulation :
Courbecumulative croissante : permet de connatre le nombre
dobservations infrieures une valeur donne.
Courbecumulative dcroissante : il permet de connatre le nombre
dobservations suprieures une valeur donne.
Cas dune variable continue :

Remarque :
On obtiendrait le mme graphique si on remplace les frquences absolues par les frquences
relatives (les pourcentages)
Courbe cumule dcroissante
Salaire xi Xi cumuls ^ Xi cumuls^
[10^0[ 9 9 65
] 0-30 ] 13
22
56
[30-40[

44 43
] 0 - 40 ]
10
54
21
] 0 0 ] 7
61 11
] 0-70 ] 4 65 4
Total

Moins de la borne
suprieure
Plus de la
borne
infrieure
STATISTIQUE DESCRIPTIVE
Page 9



b) Cas dune variable discrte (discontinue)


VI. Le diagramme polaire :
On lutilise pour reprsenter des sries chronologiques cest dire des sries ou les
observations seront des temps rguliers.

4 5 6 7
NB denfants (xi) NB de mnage Xi cumuls H Xi cumuls &
1 5 5 65
2 10
15
60
3 30 45 50
4
20
65
20
Total 65 <=xi >=xi

STATISTIQUE DESCRIPTIVE
Page 10


Les principes des coordonnes polaires : un point M dans lespace est
parfaitement repr :
Si on connat ses coordonnes cartsiennes (x, y).
Si on connat ses coordonnes polaires (e, o).

a) Le diagramme polaire :
Soit la srie chronologique suivante : chiffre daffaire mensuel


Lide est de prsenter chaque mois par un axe,
nous aurons donc 12 axes, chaque axe faisant
avec son voisin un angle.




Avr

30
20
10
Juillet
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
10 .
20 .
30.
Oct.

Anne 1999
2000
Janvier 55 65
Fvrier 53 75
Mars 65 72
Avril 50 40
Mai 43 42
Juin 41 38
Juillet 35 32
Aot 30 34
Septembre 34 38
Octobre 40 40
Novembre 45 33
dcembre 55 45
Jan
STATISTIQUE DESCRIPTIVE
Page 11


VII. Les graphiques secteurs :
On les utilise pour reprsenter une srie exprime en pourcentages. EX :
Pourcentage de touristes.

STATISTIQUE DESCRIPTIVE
Page 12


CHAPITRE II : LES PRANCIPALES CARACTERISTIQUES
DUN SERIE
INTRODUCTION
Avec la reprsentation graphique nous avons vu comment synthtiser une srie avec
image.
Dans ce chapitre nous allons voir comment synthtiser une srie par quelques chiffres.
Ces nombres sont appels caractristiques dune srie.
Soit les srie suivantes :
Seriel : 78-79-80-83
Srie2 : 60-70-80-90-100
Srie3 : 1-1-1-1-396
Les sries ont toutes la moyenne 80 mme si elles sont trs diffrentes les unes que les autres.
Les valeurs de la 1
ere
srie sont proches de la moyenne alors que celles de la 3me sont loignes
de la moyenne.
Il y a donc ncessit, pour rsumer une srie de donnes de la prsenter en 2 types de
caractristiques :
- les caractristiques de valeurs centrales.
- les caractristiques de dispersion.
SECTION 1 : Les Caractristiques de Valeur Centrale :
I. LES MOYENNES
A- La moyenne arithmtique :
A-1 Dfinition
Etant donne n observations quon va appeler X1,X2 ,X3, ......................... Xi,...Xn on
appelle une moyenne arithmtique simple le nombre X
Somme de toutes les observations
X = ----------------------------------------------------
Le nombre dobservations
X = *1 + *2 + .................................... +
X
+ ............... +
x
n
n
STATISTIQUE DESCRIPTIVE
Page 13


Lorsque les observations sont groupes c'est--dire que lon
observe
N1 fois X1 N2
fois X2
La moyenne arithmtique scrit :
Xi + Xi + ...... + X2 + X2 + .
ni + n2 +.... + nn
Une moyenne arithmtique pondre
A-2 Application
Exercicel : soit la srie de notes suivante : 2-6-12-10-12-10-102 + 6 +12 +10 +12 +10 +10 + 6
68
X
X = 8,5



Exercice2 : soit la srie des notes de lexercice qui peut tre prsente de la manire
suivante :







: Une moyenne arithmtique simple
X

X= = 8,5
8
V nx
X
V
n
i
Notes xi Effectifs ni ni xi
2 1 2
6 2 12
10 3 30
12 2
24
total
8 68
STATISTIQUE DESCRIPTIVE
Page 14


Exercice3 : soit les srie suivante
rpartition selon lage
X =
3155
= 35,85 Annes 88
Moyenne de lage ou lage moyen

a-3 Mthode des simplifications des calculs
Lorsque les calculs sont compliqus, on peut les simplifier en prcdant un
changement de variable
Par changement dchelle : Tout variable Xi peut scrire : Xi= a Xi a= nouvelle chelle Xi=
nouvelle variable Ex

par changement dorigine et dchelle : tout
variable Xi peut scrire
= x
0
+ ax

X0 = nouvelle origine
Ex :



age Ni
Centre de classe xi
ni xi
[20 - 25[ 8 22,5 180
[25 - 30[
10
27,5 275
[30 - 35[
20
32,5 650
1 "

-

.


25 37,5 937,5
[40 - 45[ 15 42,5 637,5
[45 - 50[
10
47,5 475
TOTAL
88

3155
Xi

a
*
X'i
24
=
1
*
24
36 =
1
*
36
r=v a =
Xi

a
*
X'i
24
=
6 * 4
36 =
6
*
6
X'i = 4
X'
i
= 6
a : n.chelle
X'i : n. variable
Xi
14
22
X'i
5
a
2
2
+
+
STATISTIQUE DESCRIPTIVE
Page 15


Si on pose xt = x
0
+ axi ^ xi =
a
La moyenne arithmtique :
v Z
n
X " Z n _ Z n (
x
o +
ax
i)
Z n
x
0
Z
n
i + aZ
n
x'
Z
n
i Z
n
i
x
i
X = x
0
+ a
Vni




On utilise cette relation pour simplifier les calculs de la manire suivante
On prend pour X
0
la valeur de caractre la plus frquente
On prend a lintervalle des classes lorsque les classes sont gaux
Application :

Calculez la moyenne avec
changement du variable x
0
=
37,5 cest le centre de classe
modale
xi =( X - x0)/5



X = 37,5+5(-29/88)=35,8 ans
V
n
i
x
i
V n
X = x
0
+ a X iavecX
X
0
= n origine a: n
chelle
x'. : n variable
X = x
0
+ axi

Age effictifs xi x

n


i

x

a

ni*x
i

20-25 8 22,5 -3 -24
25-30 10 27,5
-2 -20
30-35 20 32,5
-1 -20
35-40 25 37,5 0 0
40-45 15 42,5 1 15
45-50
10
47,5
2 20
total
88

-29
STATISTIQUE DESCRIPTIVE
Page 16


a-4 calcul de la moyenne arithmtique laide des frquences relatives
nixi n1 x1 + n
2
x2 +...... + nixi + nnxn
X
n
i
x
i .
n
2
x
2 , .
n
n
x
n
" n n
= f,
x
, + 2
x
2 + ........ + fn
x
n




ni
: frquence relative
ni
do : X = fiXi +f
2
x
2
+ +f
n
x
n

X = fiX X
=12,7




B- La moyenne gomtrique :
b-1 Dfinition
tant donne n observations connues individuellement ( x
n
)
on appelle moyenne gomtrique simple de ces n observations la grandeur t.p :
G=v X 1.X 2..... Xn = ( X 1.X 2....Xn)
1/n

=]
b-2 calcul de G
lorsque les observations sont groupes ; chaque pondr Xi sera pondr par
leffectif correspondant, la moyenne gomtrique scrit :
G =
n
4X 1 .X1.X1 * X2.X2.X2 * X3 * X3X3 G= Vx 1
n
1
.X2
n2
.X3
n
3
....Xn
nn
.
N= n
1
+n
2
+. . . +
calculer G est plus facile en passant par le logarithme, en effet.
Xi Ni fi fiXi
10 5 0,125 1,25
1

1

8 0,20 1,6
12 10 0,25 2,5
13 12 0,30 3,6
14 5 0,125 0,75

40

12,7
STATISTIQUE DESCRIPTIVE
Page 17


G=
n
4X 1.X 2.... Xn = (X 1.X 2. X 3 Xnj'
n

log G = 1/n log (X1.X2 Xn)
= 1/n [log X1 + log X2 + log Xn]

La moyenne gomtrique pondre


n n
1
.iogx
1
+
fl2iog*2 + +nn
n


Application : calculer la
moyenne gomtrique
log G =
7316
= 0,9145 8
G = 10
09145
= 8,2

Ni



Xi ni log Xi ni log Xi
2 1 0,301 0,301
6 2 0,772 1,556
10 3 1 3,0
12 2 1,158 2,158
Total 8

7,316
STATISTIQUE DESCRIPTIVE
Page 18


C- la moyenne harmonique : c-1 Dfinition
tant donne n observations connues individuellement x
1
,x
2
,x
3
x
n

on appelle moyenne hormique le nombre H tel que :

moyenne harmonique simple.
Si les observations sont groupes la moyenne harmonique scrit :

Moyenne harmonique pondre


c-3 Remarque
1
V
n
,/x, V ni.
H V n, V n
cnvcX
'= x,
Linverse de la moyenne = moyenne des inverses




M
n
1 +
n
2 + .....
n
n Z
n
i
c-2 Application
Xi ni 1/ Xi n
i
.1/ xi
2 1 0,5 0,5
6 2 0,166 0,332
10
3
0,1 0,2
12 2 0,083 0,166
total
8

1,298

STATISTIQUE DESCRIPTIVE
Page 19


D -La moyenne quadratique :
Dfinition : Etant donn n observations connues individuellement X1
X2 ; xn
Z
si les observations sont groupes, la
moyenne quadratique scrit :
n
1
X
1 +
n
2
X
2 + ........... +
n
n
X
n
n, + n
2
+ ......... + nn


o Q = ^'^p
X
- moyenne quadratique pondre



Z n Z n
Carr de la moyenne = la moyenne des
carrs
n

moyenne quadratique simple
Z n
Application
Z n .x
2
= 664
Z n
8

83
xi Ni
Xi
2

Ni. X2
2 1 4 4
6 2
36 72
10 3 100 300
12 2
144
288
total
8

664
-avecX = x.
2

STATISTIQUE DESCRIPTIVE
Page 20


Gnralisation de la notion moyennes : d.1- moyenne dordre r
on appelle moyenne dordre r la quantit Mr tel que
xi + x
0
+ ............. + x n
n
xi + x
0
+ + x n
n
Si r= 1 Mi=
xi
+
x
2+
x
3 + .... +
x
n ^ Mi = X
n
si r= 2 M
2
2
=
xi
+
x2
+ ...... +
x
" ^ M
2
2
= Q
2
^ M
2

n
si r= -1 M - =
xi
+
x2
+ .......................... +
x
" ^
n

si r=s ^ 0.



d.2- le classement des moyennes : les ingalits entre les moyennes :
On dmontre que les moyennes sordonnent selon la valeur de r c--d
que si : <
2
^ M < M
2
Ce qui nous donne : M^ < M
0
< M
i
<M
2

H<G<X<Q Dans
notre exemple, on trouve : 6,16 <8,2 <8,5 < 9 , 1 1 .
d-3 Le choix dune moyenne :
En thorie, aucune moyenne nest meilleure que lautre. Lutilisation de telle
moyenne dpend du problme pos.
Exemple :
Ex1 : Soit un petit jardin sous forme de rectangle, le propritaire ne peut se souvenir que dun
seul chiffre. 9
Sil veut entourer son champs de fil de fer il a intrt se souvenir de la
moyenne arithmtique car le primtre est li la somme des diffrents cts.
M
M
M
s^0
STATISTIQUE DESCRIPTIVE
Page 21


Sil veut mettre de lengrais son jardin, il a intrt se souvenir de la
moyenne gomtrique
x =
9
+
4
+
9
+
4
= 6,5;G 6 = 4
moyenne arithmtique du primtre =26 =6,5 * 4 + 6 * 4 moyenne
gomtrique : surface =36 =6*6 + 6,5 * 6,5
Gnralits :
Dune manire gnrale, on retient la moyenne arithmtique quand les variables
sadditionnent, et on utilise la moyenne gomtrique lorsque les variables se multiplient.
Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h 80Km/h.
distoncetotale 100 +160 100 +160
Vitessemoy :
tem
p
stotal
100 +160
100

160
+ J_
50 80 50 80
= MH <
1
n
La vitesse moyenne est gale la moyenne harmonique des vitesses pondres par les distances.
Ex3 : Une voiture roule pendant une heure 50 Km/h puis 3h 80Km/h.
distoncetotal (l X 503 + X 80)
Vitessemoy - -
tempstotal 1+ 3

n
i
x
i n
La vitesse moyenne est gale donc la moyenne arithmtique des vitesses pondres
par le temps.
Ex 4 : Une grandeur S
0
a augment sur 3 annes, dabord de 10% puis de 15% et 30% pour
le 3
eme
anne.
Quel est le taux moyenne de croissance ?
1
re
anne : S0 devient Si =S0 + (S0*10/100) * Si =S0(1+0,10 ) = 1,10S0 2me
anne S1 devient S2 = S1 +0,15S1 *S1*1,15* (S1*(1+0,15)) 3me anne S2
devient S3 = S2 +0,3S2 = 1,3S2^ (S2*(1+0,3))
S3 = S01,1 x 1 , 1 5 x 1 , 3
Moyenne gomtrique G = ^1,1x1,15 xl,3 = 1,1804 Remarque:
le taux de croissance moyenne est 18,04%
X
STATISTIQUE DESCRIPTIVE
Page 22


Ex 5 : Un tudiant a obtenu les notes suivantes : 8-10-12 on veut calculer la moyenne des
carts entre les notes et la moyenne arithmtique.
x =
8
+
1 0
+
1 2
= 10
3
Ecart type la moyenne moyenne arithmtique des carts = (-2+0+2)/3
8-10 = -2 10-10
=0
12-10 =2 moyenne arithmtique des carts = 0
On retrouve ici une des proprits des moyennes arithmtiques :
) - x ) = 0
Dmonstraton : - , x = x, - nx = x - n x = 0
Si on veut calculer la moyenne des carts, il vaut mieux calculer la moyenne quadratique
8 =
2
( 2 ( +) 0 ( +) 2 - = ) 2
STATISTIQUE DESCRIPTIVE
Page 23


II. La mdiane (Me)
b-1-Dfinitif :
On appelle mdiane dune srie classe par ordre croissant ou dcroissant,
la valeur du caractre qui partage en deux parties gales les effectifs.
Cest la valeur du caractre telle que la moiti des effectifs lui est
suprieure et lautre lui est infrieure
b-2- Calcul de ME :
Cas dune variable discrte Si la srie a un
nombre impair de terme 75 62 57 12 18
Me =57 Si la srie a un nombre pair
12 25 32 44 52 69 Intervalle Mdian [32-44]
On prend le centre de lintervalle comme la mdiane :
Cas dune srie de classes :


Le calcul de la mdiane se fait en 3 tapes :
1re tape : on repre le rang de la
mdiane. Rang = 82/2 = 41


2me tape : on repre la classe de Me :
Il sagit de trouver la classe laquelle appartient le 41
eme
individu, pour
cela on classe les individus par ordre croissant des salaires, ce qui revient construire la
colonne des effectifs cumuls. .
Me
G
[20-25], on peut calculer avec plus de prcision Me en faisant une interpolation
linaire.
3me tape : linterpolation linaire :
On connat les salaires des 34 individus 20 On connat les salaires des 66 individus
25
Le 41
me
individus cest le 7me individus que je rencontre dans la classe 20 -25, son salaire
sera obligatoirement gal 20 + supplment que lon calcule par interpolation.
En supposant que les 32 individus de la classe 20-25 sont rpartis dune manire uniforme
dans la classe
20-25 puis sont spars par la mme quantit de salaire On raisonne alors de la manire
suivante :
Si pour 32 individus nous avons un cart de salaire de 5 DH
Salaires Effectifs Effectifs cumuls
10-15 9 9
15-20 25 34
20-25 32
66
25-30
16 82
Total
82


STATISTIQUE DESCRIPTIVE
Page 24


Pour 1 individu 5/32
Pour 7 - individus 5/32 * 7 = 1.09 DH
Me=20+1.09 =21.09
La moiti des effectifs gagnent plus de 21,09 DH et lautre moiti gagne (moins de 21,09 DH)
b-3- Dtermination graphique de la mdiane :
Courbe cumulative

b-4-Remarque :


Total Xi =82
Salaire Xi Xi *
10 - 15 9 9
15 - 20 25 34
20 - 25 32 66
25 - 30
16 82
STATISTIQUE DESCRIPTIVE
Page 25


Mthode rapide dinterpolation :
34 41 66

. . :...
25 - 20 66 - 34 32
2. le 41 me individu normalement la mdiane devrait se situer entre le 41 me et
le 42 me, mais on convient lorsque les effectifs sont nombreux de prendre (N
/ 2)
III. Le Mode :
Cest la valeur du caractre le plus frquent.
A- Calcul Mode :
1- Cas dune variable discrte :





Mo =14 Mo = 17
Srie
Uni modal Mo= 39
Srie bimodale
Srie plurimodale (srie plusieurs modes)

Xi ni
3 3
14 18
21
7
42 4
Xi Ni
2 4
17
16
33 15
39 16
51
8
STATISTIQUE DESCRIPTIVE
Page 26


2- Cas dune srie de classe
:

-Nous avons une classe modale : 20 - 25
- On peut prendre comme mode le centre de classe 22,5
- On peut chercher obtenir le mode avec plus de prcision :
1/ Par Mthode graphique : Elle consiste dabord construire lhistogramme

L1

N.B : Ne pas oublier, lorsqu on construit
lhistogramme de corriger les effectifs.
2/ Par la mthode algbrique :
Mo = L1 + [d1. I / (d1 + d2)]


Mo = 20 +
Salaires ni
10 - 15 9
15 - 20 25
20 - 25 32
25 - 30 16
Total
82




32 25
STATISTIQUE DESCRIPTIVE
Page 27


(32-25) + (32 - 16)
STATISTIQUE DESCRIPTIVE
Page 28


L1 : Limite Infrieure de classe modale
d1 : La diffrence entre les effectifs de la classe modale et les effectifs de
classe prcdente
d2 : La diffrence entre les effectifs de classe modale et les effectifs de
classe suivante
i Lintervalle de la classe modale
IV. VI- Le choix dune caractristique de tendance centrale :
A : Les conditions de Yule :
1 r conditions : Une modalit caractristique doit tre : dfinie de faon
objective. (2 personnes diffrentes doivent trouver le mme rsultat)
2 me conditions : Tenir compte de toutes les observations
3 me conditions : tre facile comprendre
4 me conditions : tre facile calculer
5 me conditions : Doit se prter au calcul algbrique
B : Comparaison des diffrentes caractristiques de tendance centrale :
1- La moyenne :
Elle rpond parfaitement aux conditions de Yule ; cest pour cela
quelle est la caractristique la plus utilise, mais il y a des cas ou il faut lui prfrer
la mdiane quand elle risque dtre influenc des valeurs extrmes.
EX:

2- La mdiane :
Elle ne satisfait pas les conditions de yule.
En effet, la valeur de la mdiane ne change pas quand on augmente la valeur
dune observation qui lui est infrieure
15 22 34_ 41 60 122 34 41 110
1 2 34 41 60
X = 154 / 10 = 15,4 X
= 153 / 9 = 17
Notes Xi Ni * Xi
1 1 1
16 2
32
17 5 85
18 2
36

10
154
STATISTIQUE DESCRIPTIVE
Page 29


3- Le mode :
Ne remplit pas les conditions de Yule, mais il y a des cas ou il est
utile, en particulier quand on cherche la valeur la plus typique dune srie :
Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure
moyenne, mais va stocker les chaussures les plus vendues.
SECTION 2 : Les Caractristiques de Dispersion:
Partons de 3 sries
Srie 1 : 9 11 x = 10
Srie 2 : 5 15 X = 10
Srie 3 : 1 19 X = 10
Les 3 sries ont la mme moyenne : 10 et portant ils sont diffrents
lunes des autres.
Dans la 1
ere
srie ; les valeurs du caractre sont proches de la
moyenne. La moyenne est reprsentative.
Dans la 3 me Srie les valeurs du caractre sont loignes de la
moyenne. Il faut donc lorsquon rsume une srie, indiquer par un nombre si les
valeurs sont proches ou loignes de la valeur centrale.
Ce nombre est appel caractristiques de dispersion.
I. Lintervalle de variation ou ltendue :
Cest la diffrence entre la plus grande valeur du caractre et la plus petite.
Lintervalle de variation = Val MAX - Val MIN A = 2 Srie 1
A
= 10 srie 2
A
= 18
Srie 3
Etendu ou intervalle de variation nest pas un indicateur toujours fiable, car il
dpend des valeurs extrmes qui prouvent tre fausses ou aberrantes.
EX :
17 ...................... 18 ...................... 20 ................ 60 ............. Age
1000 tudiants
A = 3
A = 60 -17 = 43
STATISTIQUE DESCRIPTIVE
Page 30


II. Lintervalle inter quartile
A- Dfinition des quartiles :
On appelle I
r
quartile Q1 la valeur du caractre tel que : 25%
des observations lui sont infrieurs et 75% lui sont suprieurs. 25% < ; 75%>
2
me
quartile Q2= Me 50% < 50%>
3
m
quartile Q3= 75%< 25%>
B- Dfinition inter quartile :
On appelle inter quartile : Q3 - Q1 diffrence entre 1r quartile et 3me
quartile.
N.B : Intervalle Inter quartile contient 50% des observations
C- Application :
N= 82
Rang : 82/4 =20 ,5



Interprtation : Si 25 individus Si 01
Individu
Augmentation de 5 DH
Augmentation 5/25 DH
= 1 1 , 5 5/25 * 11,5
Donc Q1 = 15 + 5/25 * 1 1 , 5 = 17,3 DH 2me
Mthode :
(20,5 -








Q1 -15 =
Classe
Interpo
[15-20] ation : 15+ A
Salaires Effectifs Ecart I. Inter quartile Ni Cum
10-15 9

9
15-20 25 Q3 - Q1 34
20-25 32 =24,3 - 17,3
66
25-30
16
= 7DH
82
Total
82

20.5

STATISTIQUE DESCRIPTIVE
Page 31


20.5 2 0 - 1 5 3 4 -
STATISTIQUE DESCRIPTIVE
Page 32


Calcul de Q3 Rang :
82*3/4 =61,5 Classe
= [20-25]
Interpolation : si 32 individus

Augmentation de 5 / 23
(61,5 - 34) = 27,5
individus

Donc Q3 = 20+ [(5/32) *27,5]
Signification : 24,3dh cest le salaire tel que 75% gagnent plus de 24,3 et 25% gagnent
moins de 24,3 DH.
Inter. Inter quartile : 7 DH = Q3-Q1
Signification : pour 50% des effectifs lcart Maximum de salaire est de 7 DH
D - Remarque :
1- Les dciles : valeur du caractre que 10 % des observations ont une valeur qui est
infrieure D1 et 90% des observations ont une valeur qui est suprieure
D1
On appelle 9 me dcile de 9 la valeur du caractre tel que 90% des observations lui
sont infrieures, et 10% des observations lui sont suprieures. Lintervalle inter dcile
D9 - D1 contient 80% des observations
2- Les percentiles :
On appelle percentiles P1 la valeur du caractre telle que un pourcent (1%) des
observations ont une valeur infrieure P1 et 98% ont une valeur suprieure
P1.
Pour le statisticien KELLY pour supprimer les valeurs aberrantes il suffit de calculer
lintervalle inter percentile P
3
-?07 qui contient 86% des observations.

PQ7
augmentation de 5 DH
01 Individu

Augmentation 5/32 *27,5


P93
STATISTIQUE DESCRIPTIVE
Page 33


Lcart absolu moyen :
A- Dfinition : On appelle cart absolu moyen que lon dsigne par la moyenne
arithmtique des carts absolus entre les valeurs du caractre et la moyenne
arithmtique.


Ca= ni


B- Application : soit le tableau suivant :

Signification : Ca = 4.42 Kg signifie quen moyenne, chaque individu
sloigne de la moyenne (67.75 Kg) de 4.42 Kg.
Remarque : Pour dire si une dispersion est grande ou non, pour comparer deux
sries entre elles, on se sert de lindice de dispersion relatif = Ca / X *100 Exemple :
Poids de filles Poids des garons
X =52 Kg X =68 Kg
Ca= 2 Kg Ca = 17 Kg
17/68 * 100 = 25% dispersion plus importante
IV- La variance et lcart type :
A- Dfinition :
On appelle une variance la moyenne arithmtique des carrs des carts entre les
valeurs du caractre et la moyenne arithmtique.
<J
2
= ni(xi - x)' / ni
ni
xi - x
Poids ni xi ni * xi

xi - x

ni xi - x

55-60 12 57,5 690

10,25

123
60-65 17 62,5 1062,50

5,25

89,25
65-70 36 67,5 2430

0,25

9

70-75 24 72,5 1740

4,75

114
75-80 11 77,5 852,50

9,75

107,25

100

6775

442,5
Ca= 442.5 / 100 = = 4.42 Kg X = = 67 75 Kg

2/52 *100= 3.8%
Dispersion Faible
STATISTIQUE DESCRIPTIVE
Page 34



B- Application :
Le mme tableau prcdent

Signification : En moyenne chaque individu scarte du poids moyen (67.5
kg) de 5.76 kg.
C- Remarque :
Si on veut savoir la valeur de dispersion on utilise le cfficient de variation =
a/ X Ex :
X =67.75 Kg a/ X =(5.76/67.75) *100= 8.5%
Ex 2 :
Soient 2 modles dampoules lectrique dont on a relev les dures de
vie
Modle 1 : Dure de vie moyenne 1400 H.
Modle 1 : Dure cart-type =100 H Modle 2 : Dure de vie moyenne 1800
H.
Modle 2 : Dure cart-type = 250 H

On appelle cart-type (ou cart quadratique moyen) la racine carr de 6
2

(xi- X )
2
ni*(xi- X )
2

105,0625 1260,75

27,5625 468,5625

0,0625 2,25

22,5625 541,50

95,0625 1045,6875


3318,75
G
=
- ni(xi - x)
2
/ ni =
^3318.75/100 =5.76

STATISTIQUE DESCRIPTIVE
Page 35


Modle I Modle II
6/ X =100/1400 = 7% 250/1800 *100 = 14%
Le modle I est plus faible que le modle 11
Formule dveloppe :
Donc a = ni xi
2
- x
2

V ni

a = 462325 - (67.75)
2
* 33.19 100
ct = a/33.19=5.76
SECTION III : Les Caractristiques de Concentration
La concentration ne sapplique qu des sries statistiques ou la concentration de la
variable a un sens
EX : on peut parler de la concentration de revenus, concentration foncire
Autres EX : on ne peut pas parler de concentration dge
On peut dterminer la concentration soit algbriquement soit graphiquement
I. La dtermination algbrique de la concentration
Cette dtermination ncessite la connaissance de la mdiale
Notion de la mdiale (Ml)
A- La mdiale
Si dans une srie on dsigne par xi la valeur du caractre, par ni les effectifs, la
mdiale est la valeur du caractre qui partage en deux parties gales le produit
cumul de ni xi.
Si xi dsigne un salaire Ni dsigne le
nombre de salaris
Le produit cumul des ni xi reprsente la totalit des salaires Verss ^ nixi
Poids ni xi
2
xi
ni * xi
2

55-60 12 57,5 330625 39675
60-65 17 62,5 390625 66406,25
65-70 36 67,5 455625 164025
70-75 24 72,5 525625 126150
75-80 11 77,5 600625 66068,75

100

462325
STATISTIQUE DESCRIPTIVE
Page 36


Cest--dire la masse salariale.
La mdiale, cest le salaire tel que la moiti de la masse salariale a servi payer une
partie qui touche moins de cette Mdiale et lautre moiti de la masse s a servi
payer les gens qui touchent plus de cette Mdiale.
B- Mesure de la concentration
AM sert mesurer la diffrence entre ML et ME :
AM=ML- ME
* Si AM = 0 cela veut dire que ML =ME
C'est--dire lindividu qui est au milieu leffectif est en mme temps
celui qui est plac tel que la moiti de la masse salariale a t verse des gens qui
touchent moins que lui, et lautre moiti des gens qui reoivent plus que lui, on a
donc une distribution galitaire concentration est nulle
* Si Am ^ 0 cela indique quil y a une concentration
* Si Am est faible par rapport lintervalle de variation la concentration est
faible
* Si Am est important, la concentration
est forte
Inter variation
C- application

AM= ML - ME
Calcule de la ML :
Rang = 1710/2=855
Classe [20.25]
Interpolation linaire
720 *5dh 1dh *
5/720dh
(855-550) =3055 * 5/720*305dh
Donc ML= 20+5/720*350
ML = 22.12dh ) <==> AM = ML - ME
= 22 , 1 2 - 2 1 , 0 9 1 d h
salaire ni xi nixi nixi
10-15 8 12.5 112.5 112.5
15-20 25 17.5 437.5 550
20-25 32 22.5 720 1270
25-30 16 27.5 440 1710
total
82

1710

STATISTIQUE DESCRIPTIVE
Page 37


AM/inter varia = 1/20=5% ^ concentration faible Lintervalle de variation Etant gale : (30-
10)=20 Signification ML = 22.12 dh
Cest le salaire tel que la moiti de la masse salariale a servi payer des gens qui gagnent moins que
22.12 dh et lautre moiti de la masse salariale a servi payer les gens qui gagnent plus que 22.12 dh
II. La dtermination graphique de la concentration la courbe de Lorentz GINI
A- la graphique de GINI GINI propose de mesurer la concentration en
mettant en abssices les frquences cumules en%, et en ordonnes ni xi
cumuls en %

/ : Diagonal de lgalit

| , | , ; , ,
' : Aire de concentration
1) si 10% de la population touchent 10% du revenu, 20% de la population
touchent 20% du revenu. Dans le cas dune rpartition galitaire du
salaire, laire de concentration serait confondue avec diagonal.
2) Dans le cas dune repartions illgalitaire parfaite des salaires, (comme
dans le cas thorique ou 0.1% de la population toucherait 99.99% de la
masse salariale : la courbe
salaire ni Fi% Fi% *n xi nixi Nixi%
Nixi%cum
10-15 9 11 11 12 5 112.5
66

6.6
15-20 25 30.5 41.5 175 437.5 25 6
32.2
20-25 32 39 80 5 22 5 720 24 1
74.3
25-30 16 13.5 100 27 5 440 25 7
100
tot^l
82 100

1710


STATISTIQUE DESCRIPTIVE
Page 38


B)-Le coefficient de Gini :


Ai re de concentrati
on Aire du triangle
ABC Ai re de G
5000(100*100/2)
On peu estimer laire de concentration de la manire
suivant : Aire de concentration = 5000-(S1+S2+S3+S3)



n/2(a+b)
b
Remarque : 0<c<1
c = 0 Concentration lev
c = 1 Concentration faible
Donc |c=5000-4404/5000 0.l2
C d les gens sont pareils
Gini propose de calculer la concentration laide de coefficient
suivant :

C
=
C
=1/2 a*b
A
A
n
S1 = 1 1 6 . 6 )
2
/

)
S2= (41.5-11)/2(6.6+32.2)
S3= (80.5-
41.5)/2(32.2+74.3) S4 =
(100-80.5)/2(74.3+100) Si
= 4404
STATISTIQUE DESCRIPTIVE
Page 39


CHAPITRE III :LES SERIES A DOUBLE ENTREES :
REGRESSION LINEAIRE (CORRELATION)
I- notion de tableau de contingence :
A. une distribution statistique double
Cest une distribution ou lobservation seffectue selon 2 caractres.
EX : Rpartition des tudiants selon la taille et lge
__________________ Rpartition des logements selon le nbre de pices et
superficie

B. distributions marginales
Ce sont les distributions relatives la seul variable X ou Y

Cette distribution qui concerne la seule variable x est applle distribution marginale
(marginal car on la trouve la marge du tableau statistique)
On peut calculer la moyenne de cette distribution, (et sa signification est le nbre de
pices moyenne par logement)
Moyenne appele moy.marginale note X
b- la rpartition des logements selon la superficie :
nbr de piece''''-^^
10-30 30-50 50-70 70-80 total
1 3 1

2 1 14 3

18
3

1 7 4 12
4

10 7 17
5

6 6 6
total 4 16 20 17 57
Nbre de pices (x)
Nbre de logement
1
4
2 18
3
12
4 17
5
6
total 57
es logements selon le nombre de pices
(X)
i- la rpartition t
STATISTIQUE DESCRIPTIVE
Page 40



Cette distribution qui concerne la seule variable y est appele distribution marginale
on peut calculer la moyenne (qui exprime la surface moy des logements) applle
moy.marginal note
C. Les distributions conditionnelles :
On appelle distribution Conditionnelle la distribution ou lon a pos une condition sur
lune des variables.
Ex : Rparation de logements de 30-50m
Cette distribution est appele Distribution Conditionnelle parce que lon ne sintresse
quaux logements qui satisfont la condition de surface 30-50 m
2
.
On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pices des
logts de 30-50 m
2
) on appelle cette moyenne : moyenne conditionnelle.
Dans cet exercice on calcule
Remarque il existe autant de distributions conditionnelles relatives au caractre x que le
caractre y a de modalits
II- gnralisation du tableau de contingences :


La distribution marginale de y :
superficie y Nbre de logements
10-30 4
30-50 16
50-70 20
70-80 17
total 57

x
1
x
2
. . . x
k
= les modalits de x y
1
y
2
. . . y
k
= les modalits de y
X
1
.effectifs pour la 1
ere
modalits de X et pour toutes les modalits de y La distribution
marginale de X :

STATISTIQUE DESCRIPTIVE
Page 41



Distribution conditionnelle relatif X et Y
Dist. Conditionnelle relative X Dist.Conditionnellerelative Y




III- La rgression linaire
A. Prsentation du problme :

Ce tableau est un tableau de contingence ou les observations sont connues
individuellement, on peut prsenter plus simplement ce tableau de la manire
suivante :
y (xi) Xj.
yi X.i
y2
X
-2
yi X.i
ym Xm.
Total X..
X Xij
Xi Xij
X
2j
X
i Xij
Xk Xkj
Total Xj
y Xij
yi Xii
y2 Xi2
.
yi
.
Xij
y
m
X
im
Total Xi.

STATISTIQUE DESCRIPTIVE
Page 42












X
70 80 90 100
Nous avons un ensemble de points un nuage statistique qui nous indique que les
prix est les quantits voluent selon la mme tendance.
Il est possible de schmatiser ce nuage :
-Par une fonction simple : la fonction linaire (Droite) qui sont inconnus et quil
faudra trouver.
a=pente de droite b=ordonne lorigine Une
telle droite est appelle droite de rgression D(x)
A=coefficient de rgression
La rgression cest le fait de relier y x par une fonction Calcule des paramtres de
la droite de rgression :
B. la mthode des moindres
carrs Notion de moindres carrs :
Partons dun nuage statistique thorique :
Qt
X

I
xi prix
Il sagit de rsumer ce nuage par une droite.
Soit y= ax+b lquation de la droite recherche.
Pour toute valeur de x (xi) nous avons une valeur rellement observe
y. Pour toute valeur xi, nous avons une valeur calcule sur la droite
y.
Pour toute une valeur xi, nous avons une erreur destimation gale yi - y

Qu
100
90
80
70
60
50
40
30
20
10
PRIX
70 42
75 57
77
60
"
74
Total

Prix
STATISTIQUE DESCRIPTIVE
Page 43


La droite de rgression idale doit tre de telle manire que la somme des
erreurs destimation doit tre la plus faible possible, y
i
- y
i
| doit tre
minimum.
Pour viter les valeurs absolues, on convient de calculer les carrs des
erreurs. La droite de rgression doit tre telle que :
(y
i
- y
i
)
2
minimum, et on appelle cela la condition des moindres carrs.
C. Calcul des paramtres de la droite de rgression.
Il sagit de trouver y= ax + b sachant que : (yi - yi)
2
min.
Remplaons yi par sa valeur (y
i
- (axi+b))
2
min.
Posons (yi - ax ; - f)
2
= Z (a , b).
Pour que Z soit minimum, il suffit dannuler (rendre nul) les drivs de ce
polynme par rapport a et par rapport b.
1 - Calcul de b :
Supposons a est connu, et drivons par rapport a b et a.
dZ / db = 2 [ (y
i
- ax ; -b)] (-1) = 0 Z= U
2

Z = 2UU
[yi - ax ; -b) = 0
- axi - nb = 0 U= (y
i
- ax ; -b)
Divisons par n, on obtient (Tyi / n - aXxi / n -b = 0
y
- a
X =
b


La droite de rgression passe donc par le point moyen (
x, y). 2 - Calcul des a :

Le paramtre a Que nous cherchons correspond la pente de la droite de rgression


qui passe par le point moyen M ( x ; y).
Procdons un changement dorigine, et prenons comme nouvelle origine le point
moyen M(x ; y), les nouvelles cordonnes deviennent :
= xi - x

yi - y
Donc :



STATISTIQUE DESCRIPTIVE
Page 44


La droite de rgression a pour quation y = ax
STATISTIQUE DESCRIPTIVE
Page 45


La condition des moindres carre
scrit ; (yi - i)
2
min
(yi - yi)
2
= (yi - axi)
2
min












0 ( = X - ([ ) ax - y ) ] Drivons par rapport a : 2

3- lquation de la droite de rgression :
Dy(x) =
Y = ax + b

D - Application:
Prix(x) Qts(y)
70 72
75 51
77 60
80 62
86 74
33 83
481 372
s x
481
= 62
n
y= 3 7 2

S xi xi S
(
x -
x)(
y - y
)


S x
2

S
(
x
-
x)2

Dy (x) a pour
quation: Y = ax + b
8
0
X
Trouver Dy (x
xi - X y
i -
y - y )

i

i

( x

(xi-X )
2


-10 -20 200 100 a = 606 / 339 = 1.79
-5 -11 55 25 b = 62 - (1.73)80
-3 -2 6 9 b = -81
0 0 0 0 Donc
6 12
72 36 Dy
(x)
a pour quation :
13 21 273 169 y = 1.79x - 81

606 339 La loi de loffre pour ce
bien
STATISTIQUE DESCRIPTIVE
Page 46


IV- la corrlation linaire :
Dans le paragraphe prcdent, nous avions estim y en fonction de x, et nous avions obtenu la
droite de rgression Dy(
x
)
On peut pour le mme nuage statistique estimer x en fonction de y, et trouver la droite de
rgression Dx(y) lui aura pour quation.

. Pour toute yi, nous avons une valeur observe x nous avons une valeur estime sur la droite x
, Pour toute y | x - nous avons une erreur destimation gale | x , Pour toute y
2
minimum
( x - x ) minimum ou encore | x - x | : Dx(y) idale est tel que En procdant de la mme
manire que dans le paragraphe prcdent, on trouve lquation de
Dx(y).
X = ay + b
y x = _ a
? ~
b

Dans le rfrentiel XMY nous obtenons 2 droites Soit y = ax pour Dy(x)
Soit x = ay pour Dx(y)
Ou encore y = 1/a x 4 cas peuvent se produire :
cas : les 2 droites sont confondues

a = 1/a aa

ay



STATISTIQUE DESCRIPTIVE
Page 47


2me cas : les 2 droite font entre elles un angle trs faible :

Dyfc
Dx fy)
a faible corrlation forte

Si on appelle coff de corrlation la Quantit r tel que : r
2
= a . a, on peut crire :
Si r = 1 on a une corrlation parfaite.
Si r = +1 on a une corrlation parfaite
positive.
Si r = -1 on a une corrlation parfaite.
Corr. positive : c d les variables varient dans le mme sens.
Si r = -1 = corrlation parfaite ngative.
C d les deux phnomnes varient en sens inverse.
Par exemple Prix et Quantit
Si 0 < r < 1 = la corrlation est positive, elle est dautant plus forte que lon se
rapproche de 1.
Si -1 < r < 0 = la corrlation est ngative, et elle est dautant plus forte que lon se
rapproche de -1.
Si r = 0 = corrlation nulle.
/

0

3me cas : les 2 droite font entre elles un angle lev :


. Dyt)

/ f l / Dx f y )

y fl lev

corrlation faible
0

4me cas : les 2 variables sont indpendantes lune de lautre



X X


X
\y X

X X carr nulle
STATISTIQUE DESCRIPTIVE
Page 48




Remarque : lorsquon crit r
2
= a. a^ r = racine a .a, nous avons une expression trs
positif. Comment trouver alors le signe dune corrlation ?
Rponse : le sens de la corrlation est donne par le signe de a et a.
Si a et a sont >0^ le produit a.a >0^ corrlation positive.
Si a et a sont <0^ le produit a.a>0 ^corrlation ngative.
On peut dire dune corrlation quelle est trs satisfaisante partir 0.86.
On peut dire dune corrlation quelle parfaite partir de 0.96.
IV - formule facilitant les calculs :
1/ calcul de a :
a
=
(x
i
-
x ) -
(
yi - y) = D >
N
= * yi - y
x
i
- x
yi +
x
y
(xi - x)
2

Or x = ^
1
Tx = n x
N
y=^N
L
* y i = n y
On remplace : N = x
i
y - yn x -pX y + n y
N = ^ x t y t - n x y
D = (x - x )
2
= (x2 -
2
x x + x
2
) = ^ - 2 x x
i
+ n x
2

= ^ - 2n x
2
+ n x
2

D = ^ - n x
2

Application : calculer le coefficient de corrlation dune autre faon
(existe-t-il un lien entre y et x).
Prix Qt x - x y
-
y
- y )

(

(x - x ) 2 (
yi
- y) 2

70 42

75 51

77 60

80 62

86
74

33 83


606
339
1110
r
2
= a. a = x-
606
donc r = 0.98
339 1110

y
x
tyt y
(x
i
-x)(
y
-
y
)
606 _ 1 y x
2
, y ( x - x )2 3
3 9
-

, = y
x
,y, _ y
( x
,
-
x)(
y,
-
y ) = 606 _
0 5 4 5

y
y i
y ( y , - y )
2 1 1 1 0

On a une trs forte corrlation car r = 0.975 tend vers 1
STATISTIQUE DESCRIPTIVE
Page 49


x t y t _ n x y _ 2
x
2
_ n x








n6 x


(yi - y)
2

2
y = *
(
yi
- y) 2
=
n62
y
n

(x
i
-
x
) (
yi -
y)

[(
x _
x)(
y, _ y XT
n
2
.
2
x.
2
y


Si on appelle : covariance de x et de y lexpression

(x
i
-
x
) (
yi
- y)


Donc a
Formule dveloppe
xi yi Xi yi x
i


x y 2 - calcul de r :

x
i yi -
r2= a.a a =
- n x y
xi
2
- n x
2

x
i yi - n x y
y
2
-
Donc r = 4 a * a '
n
2

V - Autre formule de r :
n

*
(x
i
Donc r n.6x.

STATISTIQUE DESCRIPTIVE
Page 50


CHAPITRE IV : ANALYSE DES SERIES
CHRONOLOGIQUES. I - Gnralits :
A. Dfinition :
Une srie chronologique est une srie o les observations de la variable sont faites des
intervalles rguliers de temps.
B. les diffrentes composantes dune srie chronologique.
Soit la srie chronologique suivante : Evolution trimestrielle du chiffre daffaire dune
entreprise


Lexamen dune srie chronologique rvle lexistence de diffrences composantes :
Un mouvement de tendance longue ( long terme), appele trend .
Un mouvement saisonnier qui est les variations saisonnires.
Des variations accidentelles : ce sont des variations imprvisibles dues des circonstances
exceptionnelles.
C. intrt dune analyse dune srie chronologique :
Lanalyse des sries chronologiques permet de sparer le mouvement de long terme du
mouvement saisonnier, ce qui nous permettra de faire des calculs de prvision.
trimtres 1 2 3 4
1998 120 148 155 120
1999 130
162
169 132
2000 144 178 186 145
2001
157 196
210 160
Reprsentation graphique de la srie

STATISTIQUE DESCRIPTIVE
Page 51


II - lanalyse de la tendance longue : trend
Dterminer le trend, cela revient lisser la srie pour liminer les variations saisonnires, cette
technique de lissage de la srie est appele Ajustement. Les 2 mthodes dajustement les plus
utiliss sont :
> La mthode des moyennes mobiles.
> Lajustement analytique.
A. la mthode des moyennes mobiles :
Elle consiste diviser un nuage statistique en sous - nuages comprenant chacune (n-1) donnes
du sous nuages prcdent, et remplacer chaque sous nuage par un point tel que : xi = mdiane
des x
i
- y
i
= moyenne des valeurs y
i
.
B. Oprations sur les matrices :
matrices transposes :
: ; ] a=C ; n





- commutativit
- association
- lment neutre
- lment symtrique
t (a+b) = t
a
+t
b


A
2 - Laddition :
1 3
2 4
+
(aij)
+
(bj)

Proprits :
0 4 3 3
1
1 3 6 5 3
0 1
(a
ij +
bj)

&ii = 0(
n
p) la matrice nulle
3 Multiplication par un rel :

STATISTIQUE DESCRIPTIVE
Page 52


CHAPITRE V :POPULATIONS ET ECHANTILLONS,
RECENSEMENTS ET SONDAGES
Les journaux, la tlvision, les revues nous inondent constamment de graphiques, de tableaux et
de statistiques de toutes sortes, dans diffrents domaines :

Ces prsentations peuvent parfois nous induire en erreur volontairement ou non.
Il nous faut donc dvelopper un esprit critique et savoir interprter ces informations.
I. Quelques termes de base :
La population cible est l'ensemble de tous les objets que l'on tudie.
Une unit statistique est un objet de cette population.
Un chantillon est une partie choisie d'une population.
Le nombre d'objets composant une population ou un chantillon est appel sa taille.
Lorsque l'on veut connatre certaines caractristiques d'une population, on dit qu'on enqute
sur la population.
Une enqute peut tre ralise auprs de toute la population ou sur un chantillon. Un
recensement est une enqute ralise auprs de toute la population.
Politique Sondages, rfrendums, popularit des partis politiques et de leur chef.
Social
Criminalit, suicide, avortement, racisme, pratiques religieuses, orientations
sexuelles, habitudes alimentaires.
conomie
Importations, exportations, prix de vente, taux d'inflation, indice des prix la
consommation (IPC), taux d'intrt, salaires, taux de chmage, cotes boursires,
indices boursiers, dficits gouvernementaux.

Taux de mortalit, taux de natalit, population par province, par nationalit.

Entres au box office, cotes d'coutes.
^tudes
Rsultats scolaires, prts et bourses, cote R et cote Z.
Sports
Meilleurs compteurs, classement des quipes, salaires des joueurs.
i
Page 53


Exemples:
1. tude portant sur la langue maternelle des Qubcois:
la population est l'ensemble des
Qubcois et la caractristique est la
langue maternelle.
2. tude portant sur la dure des ampoules lectriques produites l'usine X.
La population est constitue des ampoules lectriques produites
l'usine X et la caractristique tudie est la dure des ampoules.
3. Une compagnie pharmaceutique veut vrifier un nouveau vaccin contre une certaine
maladie. On administre ce produit 50 patients atteints de la maladie.
La population est forme de tous les gens atteints de la maladie,
l'chantillon est form des 50 patients qui on a administr le mdicament
et la caractristique tudie est la rponse au mdicament.
Les cots levs et les dlais trop longs, relis un recensement, sont les principales
raisons qui nous amnent utiliser un sondage puisque la taille d'un chantillon est
beaucoup plus petite que celle de la population.
Au Canada, il y a un recensement tous les cinq ans. Le dernier date de 1996.
III. tapes d'une enqute statistique :
1. Dterminer la population cible et les caractristiques de cette population que l'on veut
tudier.
2. Dterminer la manire dont l'chantillon va tre prlev.

STATISTIQUE DESCRIPTIVE
Page 54



3. Construire des instruments (questionnaires ou autres).
4. Etablir un pr-test ou tude-pilote.
5. Recueillir les donnes.
6. Compiler les donnes.
7. Mettre en forme les donnes.
8. Analyser les donnes (analyse descriptive ou infrentielle).
9. Interprter les rsultats.
10 Communiquer les rsultats.
STATISTIQUE
DESCRIPTIVE
Page 55


EXERCICES
I OBJ ECTI FS VI SES :
STATISTIQUE DESCRIPTIVE
Page 56


1. construction dun tableau statistique :
2. distinguer une variable quantitative dune variable qualitative
3. reprsentation graphique des variables quantitatives discrtes et continues
4. calcul et interprtation des caractristiques de tendance centrale :
> moyenne.
> mdiane
> mode
> quartiles
5. calcul et interprtation des caractristiques de dispersion :
> variance
> cart type
> coefficient de variation
Exercice 1 :
Dans une entreprise de 80 salaris on a enregistr les salaires mensuels suivants :
54 salaris gagnent 6 000 dirhams ou plus ;
34 salaris gagnent 8 000 dirhams ou plus ;
20 salaris gagnent 10 000 dirhams ou plus ;
8 salaris gagnent 12 000 dirhams ou plus ;
1. Prsenter ces donnes dans un tableau avec des classes de mme amplitude en
sachant quaucun salari ne gagne plus de 14 000 DH.
2. Calculer la moyenne et donner sa signification.
3. Calculer la mdiane et donner sa signification.
4. Calculer le mode graphiquement, algbriquement et donner sa signification.
5. Combien gagnent les 20% des salaris les mieux pays.
Exercice 2 :
La rpartition des salaris dune entreprise de confection selon leurs gains
1. dterminer graphiquement le salaire modal
2. calculer le coefficient de variation
3. cal cul er l tendue
4. calculer algbriquement et graphiquement la mdiane.
Exercice 3 :
Gains mensuels effectifs
[4-6[ 25
[6-8[ 40
[8-12[ 58
[12-18[ 27
[18-20[
6
20 et plus 4
Tams) se prsente comme suit
:
mensuels (en milliers de dir
STATISTIQUE
DESCRIPTIVE
Page 57



1. tracer lhistogramme de cette distribution
2. calculer lcart type et donner sa signification
3. on dsire rajeunir cette population en invitant au centre des vacances des
personnes de la classe [25-35[.combien faudrait-il en faire venir pour que la
moyenne de la population soit de 35 ans.
Exercice 4 :

1. Trouver les valeurs manquantes de ce tableau sachant que la moyenne est gale
11,42
2. tracer la courbe cumulative croissante
3. dterminer graphiquement et algbriquement limpt mdian. donner sa signification
4. quel est le pourcentage des contribuables qui paient un impt annuel suprieur 20
000dh ?cela reprsente combien de personnes ?
Exercice 5 :
Soit la distribution statistique suivante qui donne la rpartition des propritaires
terriens selon la superficie des terres cultivables dans une certaine rgion agricole :

Partie I :
1. prciser le caractre tudi et prciser sa nature.
La rpartition par ge dune population dun centre de vacances est comme suit
:
Classe dage (en annes) effectifs
0-5
16
5-15 42
15-25 44
25-35 40
35-45 30
45-55 32
55-60 15
60-75 36
75-100 15
Dans une commune urbaine, on a relev la rpartition en pourcentages de 10 000
contribuables selon le montant des impts pays. ________________________
Classes dimpts Frquences relatives en pourcentages
1-3
8
3-6
12
6-L2
20
L2-12
26
12-18 F6
18-22
10
22-30
6
Superficie des terres en hectares Nombre de propritaires
2-4 24
4-8 36
8-14
22
14-20
18
20-40 14
40-100
6
STATISTIQUE DESCRIPTIVE
Page 58


2. donner la signification de du centre de la 2
me
classe.
3. dterminer rapidement la mdiane et donner sa signification
4. dterminer algbriquement le mode et donner sa signification
5. calculer la superficie moyenne et lcart type. Que peut on conclure ?
6. dterminer le 1
er
et le 9
me
dcile et donner leurs significations
Partie II :
1. dterminer graphiquement la concentration foncire dans cette rgion agricole,
Calculer lindice de GINI
2. dterminer algbriquement la concentration
3. dterminer graphiquement le pourcentage des propritaires dont la superficie des
terres est infrieure la mdiale.
Exercice 6 :
Pendant 9 annes les bnfices dune entreprise ont augment :
> de4% par an pendant les 3 premires annes.
> de7% par an pendant les 4 annes suivantes.
> De10% par an pendant les 2 dernires annes de la priode considre.
Quelle est laugmentation moyenne des bnfices de cette entreprise sur les 9 annes ?
Exercice 7 :
Le tableau suivant donne la rpartition des salaires mensuels des cadres dune
entreprise :

1. prciser le caractre tudi et sa nature
2. reprsenter graphiquement cette distribution, tracer le polygone des frquences
3. dterminer rapidement :
le salaire mdian des cadres donner sa signification.
Le 3
me
quartile (Q3). donner sa signification.
4. donner graphiquement le salaire modal des cadres.
5. calculer le salaire moyen des cadres.
6. Calculer le coefficient de variation et donner sasignification
7. Pour motiver davantage ses cadres, lentreprise dcide une augmentation gnrale des
salaires de 20%. Calculer la nouvelle moyenne et le nouveau coefficient de variation.
I I OBJ ECTI FS VI SES :
1. Calcul de la fonction linaire
2. calcul et commentaire du coefficient de corrlation
3. interprtation des distributions marginales
Salaires en 1000DH Nombre des cadres
6 - 8

50
8-10 70
10-16
80
16-22 50
22-30 50
30-34
80
34-38
20
total 400
STATISTIQUE
DESCRIPTIVE
Page 59


4. interprtation des distributions conditionnelles
Exercice 8 :
Une entreprise a prsent ses dpenses de publicit et ses chiffres pour les 6
dernires annes dans le tableau suivant (en 10
6
DH) ____________

1. Lentreprise pense qu il ya un lien entre dpenses de publicit (X) et le chiffre
daffaire(Y).pouvez vous le confirmer ?
2. tablir par la mthode des moindres carrs la relation liant le chiffre daffaires et
les dpenses de publicit
3. combien lentreprise peut-elle esprer raliser comme chiffre daffaireS avec des
dpenses de publicit de 30 ?
Exercice 9 :

1. calculer le nombre moyen denfants et lenombre moyen de pices des logements.
2. calculer x2 et donner sa signification
3. calculer y
3
et donner sa signification
4. on se propose de voir sil existe un lien entrele nombre denfants et la surface des
logements. Confirmer
Exercice 10 :
Le tableau suivant donne la rpartition des salaris dune entreprise de btiment selon le
nombre denfants charge X et les salaires mensuels perus y en milliers de DH
Dpenses de publicit Chiffre daffaires
2 10
4
16
10
50
14
120
18
140
24
210
On a observ une population en retenant 2 caractres : le nombre denfants(X) et la
taille du l ogement (Y).les rsultats sont les suivants :
'Nomb.rede^pi^es
Nombre denfants'
2 3 4 Total
1 22 15 9 46
2 7 38 22 67
3 0 7 30 37
Total 29
60 61
150
STATISTIQUE DESCRIPTIVE
Page 60



1. donner la distribution marginale de la variable X
2. donner la distribution conditionnelle de la variable Y lie la modalit 4 de X.
3. que signifient les valeurs 16 et 3 souligne dans le tableau
4. vrifier de deux manires diffrentes que les deux variables sont indpendantes.
Dites dans ce cas est gal le coefficient de corrlation linaire : r (sans le calculer.
5. calculer la variance marginale de Y.

1. complter le tableau sachant quil y a 27 adhrents qui mesurent entre 1.70met
1.75m.
2. quels sont les caractres tudis ? Quelle est leur nature ?
3. que signifient les chiffres 7 et 8souligns dans le tableau
4. quelle est la moyenne du poids des adhrents ? Comment appelle-t-on cette
moyenne ?
5. quelle est la taille moyenne des adhrents ? Comment appelle-t-on cette moyenne
?
6. en dsignant par X la taille et par Y le poids calculer et donner la signification
de
y 2
7. donner sans la calculer la signification de x3
Exercice 12 :
Une entreprise commerciale a prsent ses ventes xi et ses frais de publicit yi au cours du
premier semestre de lanne 2003 comme suit (en 1000 DH)
Nembredepices Y
Nombre denfantsX-^
1-3 3-5 5-9
1
4
8 16
A
3
4
U
3
2
1Z
6
4
H
12
8
Exercice 11 :
Une tude ralise dans un club sportif concernant le poids et la taille de 124 adhrents a fourni
les informations suivantes :
-poidsenKgY taille en
mtres X"---....
50-60 60-65 65-75 75-80
1,60-1,70 12 7 6 4
1,70-1,75 ?
6 8
3
1,75-1,80 9 8 8 4
1,80-1,90 ? 7 5 6
1,90-2,00 3 5 3 3
STATISTIQUE
DESCRIPTIVE
Page 61



1. dterminer une fonction linaire qui donne le montant des ventes lorsquon
connat les frais de publicit.
2. quel serait le montant des ventes si les frais de publicit atteindront
3500DH.
3. dterminer sil y a ou non une liaison entre les ventes et les frais de
publicit.
Mois Ventes Frais de publicit
Janvier 40 1.1
Fvrier 30
0.8
Mars 42 1.2
Avril 46 1.4
Mai 44 1.3
juin 38
1.1