Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 18

LICENCE PROFESSIONNELLE

MANAGEMENT ET ADMINISTRATION DES ORGANISATIONS

POLYCOPIÉ DE COURS ET TRAVAUX DIRIGÉS

STATISTIQUE DESCRIPTIVE
Pr. Mohamed El Omari
Enseignant Chercheur, Spécialité : Statistique et Probabilités
Ancien Inspecteur Pédagogique, AREF Laâyoune-Sakia El Hamra

vf-2, 28 Mars 2024


Université Chouaib Doukkali Licence Professionnelle M.A.O
Faculté Polydisciplinaire de Sidi Bennour Semestre 2 - Automne 2024
Pr. Mohamed El Omari Statistique Descriptive

COURS ET TRAVAUX DIRIGES

Contents

I COURS 2
1 Introduction et terminologie 2
1.1 Population, échantillon et variable statistique . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Types de variable statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Eectif, fréquence et pourcentage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 TRAVAUX DIRIGES 3
2.1 Exercice 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Exercice 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Représentation des données statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3 Caractéristiques numériques d'une série quantitative 5


3.1 Paramètres de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 Moments, moments centrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.4 Paramètres de forme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

4 Distribution statistique à deux variables 8


4.1 Comparaison de deux séries statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.2 Étude de la corrélation entre deux variables statistiques . . . . . . . . . . . . . . . . . . . 8
4.2.1 La droite de régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2.2 Tableau de contingence et tableau des fréquences . . . . . . . . . . . . . . . . . . . 10

5 Théorie des indices 11

II TRAVAUX DIRIGES 12
6 Exercices 12
6.1 Exercice 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
6.2 Exercice 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6.3 Exercice 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6.4 Exercice 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6.5 Exercice 7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6.6 Exercice 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.7 Exercice 9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.8 Exercice 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.9 Exercice 12. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6.10 Exercice 13. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6.11 Exercice 14. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.12 Exercice 15. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.13 Exercice 16. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6.14 Exercice 17. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Part I

COURS
1 Introduction et terminologie

La statistique descriptive a pour but d'étudier une population à partir de données exhaustives. Cette
description se fait à travers

ˆ La collecte des données;

ˆ La présentation et l'analyse des données;

ˆ Le résumé et l'interprétation des données.

1.1 Population, échantillon et variable statistique


ˆ La population statistique est l'ensemble des éléments sur lesquels porte l'étude.

ˆ Les éléments de la population sont appelés individus statistiques ou unités statistiques.

ˆ On parle de recensement lorsque l'on fait une étude exhaustive d'une population.

ˆ Lorsqu'on n'étudie qu'une sous-population dite échantillon, on parle alors d'un sondage.

ˆ Une variable statistique (ou caractère statistique), notée X, est une application dénie sur une
population statistique et à valeurs dans un ensemble M, appelé ensemble des modalités.

ˆ Les modalités correspondent aux valeurs possibles de la variable statistique.

ˆ Une variable statistique dénit une partition sur une population, chaque individu appartenant à
une et une seule modalité.

Exemple 1:

Le personnel d'une entreprise peut être décrit selon divers caractères : .. .... .... ....... ..

Un lot de pièce mécanique peut être décrit suivant : .. .... ....

Exemple 2:
Considérons les données graphiques suivantes :
Source: www.hcp.ma/region-rabat/attachment/775960/

Déterminer la population statistique, le caractère étudié et sa nature.


1.2 Types de variable statistique
1. Variable qualitative : Une variable est dite qualitative quand les modalités sont des catégories
(non mesurables). Par exemple : ...... .... ..

ˆ Variable qualitative nominale : Une variable est dite qualitative nominale quand les
modalités ne peuvent pas être ordonnées.

ˆ Variable qualitative ordinale : Une variable est dite qualitative ordinale quand les modal-
ités peuvent être ordonnées. Le fait de pouvoir ou non ordonner les modalités est parfois
discutable. Par exemple : ..............

2. Variable quantitative : Une variable est dite quantitative si toute ses valeurs possibles sont
numériques.
Par exemple : ...... .... ..

ˆ Variable quantitative discrète : Une variable est dite discrète, si l'ensemble des valeurs
possibles est dénombrable.

ˆ Variable quantitative continue : Une variable est dite continue, si l'ensemble des valeurs
possibles est continu. Par exemple : ..............

1.3 Eectif, fréquence et pourcentage


Soit X une variable statistique dont l'ensemble des modalités est M = {x1 , x2 , · · · , xn }.
On appelle eectif d'une modalité xj , le nombre de fois que cette modalité apparaît. On note
nj l'eectif de la modalité xj .
ˆ La fréquence fj de cette modalité est l'eectif divisé par le nombre d'unités d'observation n(eectif
total).

nj
On écrit: fj = .
n
Le pourcentage pj d'une cette modalité xj est son eectif multiplié par 100. On écrit: pj =
fj × 100.

Remarques.

ˆ La somme des eectifs est égale à : ... ....... .....

ˆ La somme des fréquences est égale à : ... ... .. .......

ˆ La somme des pourcentage est égale à : ... ... .. .......

2 TRAVAUX DIRIGES

2.1 Exercice 1.

Pour évaluer les performances des élèves d'une classe collégiale en mathématiques, une épreuve a été
faite. On a obtenu la série suivante:
8 - 11 - 13 - 5 - 8 - 14 - 6 - 12 - 5 - 10
16 - 7 - 12 - 13 - 8 - 13 - 8 - 7 - 13 - 13
9 - 17 - 10 - 13 - 6 - 13 - 7 - 14

1. Déterminer la population étudiée.

2. Quelle est la variable statistique? De quel type est-elle? Comment peut-on organiser les données?

2.2 Exercice 2.

On interroge 50 personnes sur leur dernier diplôme obtenu. La codication a été faite selon le tableau
suivant:
Dernier diplôme obtenu Modalité xj
Sans diplôme Sd
Primaire P
Secondaire Se
Supérieur non-universitaire Su
Universitaire U

1. Déterminer la population, le caractère étudié ainsi que la nature de ce caractère.

2. compléter le tableau suivant.

Modalité xj Eectif Fréquence Pourcentage

Sd · 0,08 ·
P 11 · ·
Se · · 28
Su 9 · ·
U · 0,24 ·
Total 50 · ·

2.3 Représentation des données statistiques


Pourquoi utiliser un graphique pour présenter les données ?
Les graphiques:

ˆ se lisent et sont compris rapidement,

ˆ montrent les faits les plus importants,

ˆ facilitent la compréhension des données,

ˆ peuvent convaincre le lecteur,

ˆ aident le lecteur à se souvenir des données.

Remarques:

ˆ Comme les tableaux statistiques, les graphiques permettent de réduire, de synthétiser les données
brutes d'une série statistique.

ˆ Les graphiques donnent une synthèse visuelle des données.

ˆ Les types de représentation graphiques sont toutefois diérents selon la nature et le type du carac-
tère étudié, il est donc indispensable, avant de choisir un mode de représentation, de rééchir sur
la nature des modalités.

Règles à retenir lors de la conception d'un graphique:

ˆ Un bon graphique:

1) comporte un titre et des étiquettes,

2) illustre les faits avec précision,

3) attire l'attention du lecteur,

4) complète ou démontre les arguments du texte,

5) est clair et simple,


6) montre les données sans modier leur message,

7) montre clairement toute tendance ou diérence dans les données,

8) est exact en ce qui a trait à l'aspect visuel (par exemple, pour deux valeurs, une de 15 et
l'autre de 30, la deuxième devrait apparaître comme le double de la première).

Choisir le bon graphique:

Selon le type de la variable statistique on choisit le graphique comme suit:

ˆ Variable quantitative:

 Diagramme en bâtons et courbe cumulative (dans le cas discret).


 Histogramme (avec polygone) et courbe cumulative (dans le cas continu).
 Diagramme chronologique ou linéaire par morceaux (dans le cas d'une série temporelle).

ˆ Variable qualitative:

 Diagramme à barres (empilées).


 Digramme circulaire, parfois appelé diagramme en secteurs (préférable pour une variable nom-
inale avec une distribution donnée en pourcentages).

3 Caractéristiques numériques d'une série quantitative

Un paramètre est un nombre qui décrit une caractéristique de la population étudiée. Citons, à titre
d'exemples, le mode et la moyenne. Dans le cas d'un recensement, tous les paramètres peuvent être cal-
culés. Sauf au cas contraire, on considère la série statistique quantitative (brute) X = {x1 , x2 , · · · , , xn }.
On distingue alors trois types de paramètres: paramètres de position, de dispersion et de forme.

3.1 Paramètres de position


Le mode:

Le mode est la valeur distincte correspondant à l'eectif le plus élevé; il est noté Mo .

Remarques:

ˆ Le mode peut être calculé pour tous les types de variable, quantitative et qualitative.

ˆ Le mode n'est pas nécessairement unique. Une série statistique est dite uni-modale (resp. bi-
modale) si elle admet un unique mode (resp. deux modes).

ˆ Quand une variable continue est découpée en classes, on peut dénir une classe modale.

La moyenne:

La moyenne ne peut être dénie que sur une variable quantitative. La moyenne est la somme des
valeurs observées divisée par leur nombre; elle est noté µx ou x :

Pn
xi
i=1
µx = , (1)
Ppn
ni xi
= Pi=1
p , (2)
i=1 ni

où x1 , x2 , · · · , xp sont des valeurs distinctes ayant pour eectifs n1 , n2 , · · · , np , respectivement. n =


n1 + n2 + · · · + np est l'eectif total.
La moyenne n'est pas nécessairement égale à la valeur d'une des données.

La médiane:
La médiane d'une série statistique, dénotée Me , est une valeur telle que 50% des observations lui sont
supérieures et 50% lui sont inférieures. Si x(1) , x(2) , · · · , x(n) sont les données en ordre croissant alors
(
Me = x( n+1 ) , si n est impair,
2

Me = x( n ) , si n est pair.
2

Remarques:

? La médiane peut être calculée sur des variables quantitatives et sur des variables qualitatives
ordinales.

? Formellement, la médiane est la valeur pour laquelle la fréquence relative cumulée est égale à 1/2.
? Dans le cas où les données sont regroupées sous forme de classes, on parle de classe médiane. Pour
obtenir une valeur plus précise de la médiane, on procède à une interpolation linéaire.

Le quantile:

La notion de quantile d'ordre p (où 0 < p < 1) généralise la médiane. Formellement, un quantile est
la valeur xp pour laquelle la fréquence relative cumulée est égale à p.

Quand p = k/4, k = 1, 2, 3 on parle de premier, deuxième et troisième quartiles Q1 ,Q2 et Q3 . La


médiane coïncide avec le deuxième quartile.

3.2 Paramètres de dispersion


ˆ L'étendue : L'étendue est simplement la diérence entre la plus grande et la plus petite valeur
observée.

ˆ L'écart (ou la distance) interquartile : La distance interquartile est la diérence entre le


troisième et le premier quartile. On écrit

IQ = Q3 − Q1 .

ˆ La variance : La variance notée σx2 (ou s2x ) est la somme des carrés des écarts à la moyenne
divisée par le nombre d'observations:
Pn
i=1 (xi − µx )2
σx2 = , (3)
Pp n
ni (xi − µx )2
i=1P
= p , (4)
i=1 ni

où x1 , x2 , · · · , xp sont des valeurs distinctes ayant pour eectifs n1 , n2 , · · · , np , respectivement. La


variance peut aussi s'écrire
Pp
x2i
σx2 = i=1
− (µx )2 . (5)
n
ˆ La variance corrigée : La variance corrigée est dénie par:

n
Sx2 = σ2 . (6)
n−1 x

p
ˆ L'écart-type est la racine carrée de la variance: σx = σx2 .
3.3 Moments, moments centrés
On considère la série statistique {xj , j = 1, 2, · · · , n}. On appelle moment d'ordre k ∈ N∗ par rapport
(k)
à la valeur a la quantité µ [a] dénie par :

n
1X k
µ(k) [a] = (xj − a)
n j=1

ˆ Les moments par rapport à la moyenne µx sont dits centrés.


n
1X k
µ(k)
x := µ
(k)
[µx ] = (xj − µx )
n j=1

3.4 Paramètres de forme


- Deux séries statistiques peuvent avoir la même moyenne et le même écart-type sans pour cela
être identiques. L'un comme l'autre ne rendent pas compte de l'asymétrie de la distribution.

- Une distribution est parfaitement symétrique si le mode, la médiane et la moyenne sont iden-
tiques.

- Divers indicateurs peuvent être utilisés pour examiner l'asymétrie d'une série statistique. Ici, on
choisit le coecient de Fischer γ1 déni par :

(3)
µx
γ1 = , σx ̸= 0,
σx3

où σx et µ(3)
x désignent respectivement l'écart-type et le moment d'ordre 3 de la série statistique
en question.

On distingue les trois cas suivants :

ˆ γ1 = 0 distribution symétrique

ˆ γ1 > 0 distribution étalée à droite

ˆ γ1 < 0 distribution étalée à gauche

- Les coecients d'aplatissement mesurent l'aplatissement d'une distribution ou l'importance


des " queues " d'une distribution. Le coecient d'aplatissementde Fisher, noté γ2 , est ainsi
déni :
(4)
µx
γ2 = − 3, σx ̸= 0,
σx4
où σx et µ(4)
x désignent respectivement l'écart-type et le moment d'ordre 3 de la série statistique
en question.

- Le coecient γ2 est nul pour une distribution normale, positif ou négatif selon que la dis-
tribution est plus ou moins aplatie que la distribution normale de même moyenne et de même
écart-type.
4 Distribution statistique à deux variables

4.1 Comparaison de deux séries statistiques


ˆ Pour comparer deux séries statistiques on compare leur paramètres de position et de dispersion.

ˆ L'écart-type, malgré sa pertinence dans la mesure de la dispersion d'une série statistique, possède
un inconvénient majeur:

(a) Il est exprimé dans l'unité de la variable à laquelle il se rapporte.

(b) Il est alors impossible de comparer les dispersions de deux séries statistiques ayant un lien
entre elles et dont les valeurs s'expriment dans des unités diérentes.

ˆ Pour comparer la dispersion de deux séries qui ne sont pas exprimées dans les mêmes unités, on
utilise le coecient de variation noté CV.

ˆ Le CV d'une série statistique {x1 , · · · , xn } de moyenne µx et d'écart type σx est déni par

σx
CV = .
µx

ˆ Une pratique empirique courante est de considérer que la série possède une variabilité signicative
si CV > 0.15.
ˆ Si CV ≤ 0.15, les données présentent peu de variabilité et on considère que la moyenne empirique
à elle seule est un bon résumé de toute la série.

4.2 Étude de la corrélation entre deux variables statistiques


La statistique bivariée a pour but d'étudier les relations éventuelles entre deux variables statistiques X et
Y observées sur une même population. Les données statistiques forment une série des couples de valeurs
prises par les deux variables X et Y. On écrit

(x1 , y1 ), · · · , (xm , ym ).

Chacune des variables X et Y peut être, soit quantitative, soit qualitative. On examine les deux cas
suivants.

1er Cas: Les deux variables sont quantitatives.

2ème Cas: Les deux variables sont qualitatives.

ˆ La statistique la plus utilisée dans le contexte de deux séries numériques est la corrélation linéaire.
Pour la dénir, la notion de covariance doit être introduite.

ˆ On appelle covariance des séries numériques x1 , · · · , xn et y1 , · · · , yn la valeur


Pn
i=1 (xi − x)(yi − y)
σxy = ,
Pn n
i=1 xi yi
= − (x · y) .
n

ˆ Le coecient corrélation (linéaire) des séries numériques x1 , · · · , xn et y1 , · · · , yn est déni par

σxy
ρxy = .
σx σy

Interprétation du coecient de corrélation

ˆ On a: −1 ≤ ρxy ≤ 1.
ˆ Si ρxy = +1 alors il y a corrélation parfaite (positive) entre les xi et les yi . Les points Mi (xi , yi )
sont alignés sur une droite de pente positive.

ˆ Si ρxy = −1 alors il y a corrélation parfaite (négative) entre les xi et les yi . Les points Mi (xi , yi )
sont alignés sur une droite de pente négative.

ˆ Si ρxy = 0 alors il n'y a pas de corrélation entre les xi et les yi . Les points Mi (xi , yi ) sont distribués
au hasarddans le plan.

4.2.1 La droite de régression linéaire

Le but de la régression simple est d'expliquer une variable Y à l'aide d'une variable X. La variable Y est
appelée variable dépendante, ou variable à expliquer et la variable X est appelée variable indépendante,
ou variable explicative. Remarques:

ˆ Il est indispensable de commencer par l'étude corrélation entre X et Y avant de chercher une ligne
de régression entre X et Y.
ˆ La régression dière de l'analyse de la corrélation où toutes les variables jouent un rôle symétrique
(pas de variable dépendante versus indépendante).

ˆ Toutefois, tout comme dans le contexte de l'analyse de la corrélation, il faut être prudent lorsqu'on
formule des relations de causalité! L'existence d'une relation entre X et Y n'implique pas néces-
sairement une relation de causalité entre elles.

Un modèle de régression linéaire simple est déni par l'équation:

Y = aX + b + Erreur.

ˆ Les paramètres a et b sont inconnus et estimés par la méthode des moindres carrés.

Pn
σXY (x − x)(yi − y)
b
a = 2 =
Pn i
i=1
2
,
σX i=1 (xi − x)
bb = y−b
a x,

où x et y désignent les moyennes des séries d'observations de obtenues à partir des variables X et
Y, respectivement.

ˆ La droite (∆) d'équation ax + bb est


y=b appelée la droite de régression linéaire.

ˆ Le point M (x, y) est appelé point moyen et appartient à la droite (∆).


 
ˆ Le couple ba, bb minimise la somme des carrés des résidus ei :

n
X n
X
e2i = (yi − axi − b)2 , a, b ∈ R.
i=1 i=1

ˆ Un des buts de la régression est de proposer des prédictions pour la variable à expliquer Y lorsque
nous avons de nouvelles valeurs de X.

ˆ Pour une nouvelle valeur x0 , on prévoit la valeur y0 associée

ax0 + bb.
y0 = b

Exemple 1: Le tableau suivant donne l'évolution du nombre de spectateurs (en millions) dans les
salles de cinéma en France sur une période de 7 ans.
Année 1989 1993 1994 1995 1996

Rang (Xi ) 0 4 5 6 7

Nombre de spectateurs (Yi ) 120,9 132,7 124,5 130,2 136,3

ˆ Représenter la série statistique (Xi , Yi ) par un nuage de points, et préciser le point moyen M.
ˆ Donner une équation de la droite de régression (∆) de Y en X par la méthode des moindres carrés.

ˆ Si l'évolution constatée s'est poursuivie jusqu'à la n du XX


e
siècle, donner une estimation du
nombre de spectateurs dans les salles de cinéma en France en l'an 2000.

Exemple 2: On a relevé pour chacune des années t de 1920 à 1929, numérotées de 1 à 10, la
température moyenne X des mois d'été (en degrés centigrades) et la mortalité infantile Y (nombre de
décès d'enfants de moins d'un an pour 1000 naissances vivantes).

t 1 2 3 4 5 6 7 8 9 10
X 15,9 18,8 15,4 18 14,6 16,2 17,9 16,5 18,1 19,8
Y 98 116 87 96 85 89 97 83 91 95

ˆ Étudier la corrélation entre X et Y.


ˆ Déterminer la droite de régression linéaire de Y en X.

4.2.2 Tableau de contingence et tableau des fréquences

On considère deux variables statistiques X et Y. Les données observées obtenues à partir de X et Y


peuvent être regroupées sous la forme d'un tableau croisé (appelé tableau de contingence).

Y
y1 ··· yj ··· yq Eectif marginal
X
x1 n11 ··· n1j ··· n1q n1·
.
.
.
q
X
xi ni1 ··· nij ··· niq ni· = nij
j=1
.
.
.
xp np1 ··· npj ··· npq np·
Xp
Eectif marginal n·1 ··· n·j = nij ··· n·q n = n··
i=1

Prols lignes et prols colonnes

ˆ Le prol ligne i  est la ligne des fréquences conditionnelles

 ni1 nij nq1 


Li f1/i = ··· fj/i = · · · fq/i =
ni· ni· ni·

ˆ Le prol marginal correspondant est:


 n·1 n·j n·q 
M f·1 = ··· f·j = · · · f·q =
n n n

ˆ De même on dénit le prol colonne j  et son prol marginal correspondant.


Remarques:

ˆ On obtient le tableau des prols lignes (resp. colonnes) par la division des lignes (resp. colonnes)
du tableau contingence par leur eectifs marginaux.

ˆ On obtient le tableau des fréquences conjointes et les fréquences marginales par la division
des lignes du tableau contingence par l'eectif total.

ˆ X et Y étaient indépendantes, les prols lignes seraient tous


Si les deux variables qualitatives
identiques, et donc identiques au prol marginal correspondant. On trouve

ni· n·j
nij =
n

ˆ L'indépendance est un cas extrême que l'on rencontre rarement à l'état pur dans la pratique.

ˆ On peut cependant mesurer l'intensité de la dépendance entre deux caractères qualitatifs X et Y.


ˆ On dénit le coecient d'association χ2 par

p X
X q ni· n·j 2
nij −
χ2 = n
ni· n·j .
i=1 j=1 n

ˆ Il est d'autant plus grand que la liaison entre X et Y est forte.

ˆ Le problème du χ 2
est qu'il dépend de la taille de la population n et des nombres de modalités p
et q.
Que peut alors signier grand dans ce cas?

Exercice: Prouver les assertions suivantes:

(a) Si les deux caractères qualitatifs X et Y sont indépendants, alors fj/i = f·j et fij = fi· f·j .

(b) Les caractères qualitatifs X et Y sont indépendants si et seulement si χ2 = 0.


(c)
 
X p X q
n2ij
χ2 = n − 1 et χ2 ≤ n (p − 1 , q − 1) .
n n
i=1 j=1 i· ·j

5 Théorie des indices

Qu'est-ce qu'un indice?

Un indice est la valeur d'une grandeur par rapport à une valeur de référence. Prenons l'exemple du
tableau ci-dessous contenant le prix pt (exprimé en MAD) d'un bien de consommation de 2000 à 2006.

Année 2000 2001 2002 2003 2004 2005 2006


t 0 1 2 3 4 5 6
pt 200 230 240 280 300 350 400

ˆ On dénit l'indice simple par

pt
I(t/t′ ) = 100 × , t, t′ = 0, 1, · · · , 6.
pt′

ˆ L'indice I(t/t′ ) est sans dimension et indépendant du choix des unités.

ˆ Considérons un indice quelconque I(t/0) (avec 0 est le temps le temps de référence). On dit que
cet indice possède les propriétés de
- réversibilité si I(t/0) × I(0/t) = 1002 .
- identité si I(t/t) = 100.
- transitivité si I(t/u) × I(u/s) = 100 × I(t/s).

ˆ Il est facile de montrer que ces trois propriétés sont satisfaites pour un indice simple.

ˆ Un indice synthétique est une grandeur d'un ensemble de biens par rapport à une année de référence.

ˆ On ne peut pas construire un indice synthétique en additionnant simplement des indices simples.

ˆ Il faut, en eet, tenir compte des quantités achetées.

ˆ Il existe deux méthodes fondamentales pour calculer les indices de prix, l'indice de Paasche et
l'indice de Laspeyres.

L'indice de Laspeyres est déni par


Pn
q i pi
L(t/0) = 100 × Pni=1 i0 it ,
i=1 q0 p0

- pit représente le prix du bien de consommation i au temps t.

- qti représente la quantité de bien i consommée au temps t.


L'indice de Paasche est déni par
Pn
q i pi
P (t/0) = 100 × Pni=1 it it ,
i=1 qt p0

- L'indice de Laspeyres et lindice de Paasche ne possèdent ni la propriété de transitivité ni de


réversibilité.

- L'indice de Laspeyres est en général plus grand que l'indice de Paasche.

L'indice de Fisher

Fisher a proposé d'utiliser un compromis entre l'indice de Paasche et de Laspeyres en calculant


simplement la moyenne géométrique de ces deux indices.
p
F (t/0) = L(t/0) × P (t/0).

Part II

TRAVAUX DIRIGES
6 Exercices

6.1 Exercice 3.

On considère la série statique suivante : 2 ; 5 ; 6 ; 7 ; 8 ; 9 ; 10 ; 12 ; 14 ; 16 ; 17 ; 20

1. Calculer la moyenne de cette série.

2. Que vaut la médiane de cette série ?

3. Déterminer les premier et troisième quartiles de cette série.

4. Représenter cette série par un diagramme en boîte.


Nombre de Parts 1 1,5 2 2,5 3 3,5 4 4,5

Nombre de Ménages 48 58 136 184 210 122 62 12

6.2 Exercice 4.

Une population de ménages a été répartie en fonction du nombre de parts familiales permettant le calcul
de l'impôt sur le revenu.

1. Quel est le caractère étudié et quelles sont les modalités?

2. Déterminer l'étendue et le mode de cette série statistique.

3. Donner une représentation graphique de cette population.

4. Représenter la courbe des fréquences cumulées croissantes.

5. Calculer la médiane, la moyenne et l'écart-type de cette variable.

6.3 Exercice 5.

Le responsable des ressources humaines d'une entreprise a relevé la distribution statistique suivante
correspondant à l'ancienneté du personnel cadre dans l'entreprise, exprimée en années:

Classes Eectifs
[6,5 ; 8[ 3
[8 ; 9,5[ 8
[9,5 ; 11[ 12
[11 ; 12,5[ 19
[12,5 ; 14[ 9
[14 ; 15,5[ 5
[15,5 ; 17[ 4
Total 60

1. Quelle est la variable statistique étudiée? De quel type est-elle?

2. Déterminer la classe modale de cette série statistique.

3. Donner une représentation graphique convenable de cette population.

4. Représenter les courbe des fréquences cumulées croissantes et décroissantes, et déterminer leur
point d'intersection.

5. En déduire l'ancienneté médiane du personnel cadre dans l'entreprise.

6.4 Exercice 6.

Dans une salle, 9 personnes sont assises, leur moyenne d'âge est de 25 ans. Dans une autre salle, 11
personnes sont réunies, leur moyenne d'âge est de 45 ans. On rassemble les deux groupes de personnes.
Calculer la moyenne d'âge du groupe ainsi constitué.

6.5 Exercice 7.

Deux tireurs X et Y s'arontent en vue d'une sélection lors d'une épreuve comportant 25 tirs sur cible.
Les résultats obtenus ont été consignés dans le tableau suivant:

Points 50 30 20 10 0

X 5 7 6 5 2
Y 7 4 6 4 4
1. La moyenne par tir permet-elle de départager les deux concurrents? Que se passe-t-il si on élimine
les cinq plus mauvais tirs de chacun.

2. Calculer la médiane des deux série. Peut-on départager les deux concurrents?

3. Représenter par deux histogrammes, l'un sous l'autre les séries obtenues par X et Y. Quel est
d'après vous le tireur le plus régulier.

4. Calculer les écarts types des deux séries.

5. Tracer les boites à moustache correspondant à chacune des deux séries.

6.6 Exercice 8.

Le tableau suivant indique la répartition des familles d'une ville Aselon leur nombre d'enfants:

Nombre d'enfants Nombre de familles


0 31 038
1 54 812
2 51 252
3 26 613
4 ou plus 16 162

1. Déterminer la population et la variable statistique étudiées.

2. Préciser la nature de la variable statistique et ses modalités.

3. Calculer les pourcentages associés aux modalités de cette variable.

4. Représenter cette population par un diagramme circulaire.

5. Proposer un autre graphique convenable.

6. Calculer les eectifs cumulés croissants et décroissants.

7. Combien de familles sont composées de:

a. au moins 1 enfant ?

b. au plus 2 enfants ?

6.7 Exercice 9.

Le tableau suivant donne une partition d'une population en sous groupes selon l'activité et les ressources
matérielles.

Actif occupé Chômeur Inactif Total


Pauvre 200 100 200 500
Moyen 100 200 50 350
Non pauvre 300 100 250 650
Total 600 400 500 1500

1. Préciser la nature des variables statistiques étudiées et leur modalités.

2. Calculer les pourcentages associés aux modalités de cette variable.

3. Représenter cette population par un graphique convenable (À discuter).

6.8 Exercice 10.

Soit X = {x1 , x2 , · · · , xn } une série statistique de moyenne x et de variance s2x . Exprimer la moyenne
et la variance de chacune des séries suivantes en fonction de x et s2x .
Y = {ax1 , ax2 , · · · , axn }, avec a ∈ R,
Z = {(x1 + b), (x2 + b), · · · , (xn + b)}, avec b ∈ R.
6.9 Exercice 12.

Le tableau suivant donne la répartition des salaires moyens mensuels (en MAD) dans deux entreprises,
selon sexe.

Salaires moyens (en MAD) Eectifs


Entreprise Hommes Femmes Hommes Femmes
A 6500 5500 10 90
B 6000 5000 90 10

1. Déterminer les caractères étudiés et leur nature. Puis représenter cette population par un graphique
convenable.

2. Préciser le mode des caractères étudiés dans chacune des entreprises A et B. Quelle entreprise
paraît-elle bonne pour un nouvel employé?

3. Calculer le salaire moyen dans chacune des entreprises A et B. Que peut-on déduire?

6.10 Exercice 13.

Le tableau ci-dessus donne la répartition de 500 ménages d'employés résidant dans des grandes villes de
5
province (10 habitants et plus) suivant la dépense totale X (en francs par personne et par semaine) et
la dépense d'habillement Y (Enquête réalisée en 1951 par l'INSEE).

Table 1: Calot, Gérard.  Cours de statistique descriptive . DUNOD, (1965), p. 360

1. Préciser les variables statistiques étudiées et leur nature.

2. Représenter les données du tableau ci-dessus par un nuage de points, en précisant le point moyen
M (x, y).
3. Calculer ρ le coecient de corrélation entre les deux variables log10 (X) et log10 (Y ), et interpréter
le résultat.

4. Déterminer l'équation de régression linéaire de log10 (Y ) en fonction de log10 (X). En déduire le


modèle de régression (non linéaire) de Y en X.
5. La qualité d'un modèle d'ajustement Y = f (X) est donnée par la quantité suivante.

La variance des données provenant du modèle: ybi = f (xi ), i = 1, 2, · · · , n


Qf =
La variance des données réelles: yi , i = 1, 2, · · · , n
Qf précise la proportion d'information expliquée par le modèle.
Préciser la qualité de modèle de régression de Y en X.

6.11 Exercice 14.

On considère le tableau suivant.

Figure 1: Calot, Gérard.  Cours de statistique descriptive . DUNOD, (1965), p. 360

1. Proposer un graphique convenable pour comparer les durées hebdomadaires du travail des salariés
dans les trois années en question.

2. Quel pays a vu peu de changement dans les durées hebdomadaires du travail des salariés entre 1990
et 2000?

6.12 Exercice 15.

Le graphique suivant donne la distribution des salaires (en MAD) des employés d'une entreprise A.

1. Déterminer la population statistique, le caractère étudié et sa nature.

2. Dresser le tableau d'eectifs cumulés de la série statistique en question. En déduire les quartiles
de cette série.

3. Préciser le mode et la classe modale de cette série statistique.


6.13 Exercice 16.

Dans une entreprise de constructions métalliques, en n d'année, on fait le bilan des diverses formations
suivies par les salariés. On considère uniquement les stages de formation continue et l'on s'intéresse au
nombre de jours de formation selon les catégories de personnel.

Table 2: Source: Argentine, VIDAL. STATISTIQUE DESCRIPTIVE ET INFÉRENTIELLE AVEC EXCEL


Approche par l'exemple .PRESSES UNIVERSITAIRES DE RENNES 2004, p. 47

1. Déterminer la population statistique, les caractères étudiés et leur nature.

2. Préciser le mode et les quartiles de chacun des caractères étudiés.

3. Représenter graphiquement les quatre grandes catégories par boites à moustaches.

4. Comparer la dispersion des quatre catégories en question.

6.14 Exercice 17.

On a questionné 100 ménages sur le nombre d'ampoules électriques utilisées dans leur domicile. Dans le
premier tableau, les données sont regroupées par nombre d'ampoules.

Table 3: Source: Fabrice, MAZEROLLE. Statistique descriptive: Séries statistiques à une et deux variables,
Séries chronologiques, Indices , p. 47

1. Déterminer la population statistique, le caractère étudié et sa nature.

2. Calculer la moyenne et l'écart-type de cette série statistique.

3. Représenter graphiquement cette série statistique.

Vous aimerez peut-être aussi