Vous êtes sur la page 1sur 30

STATISTIQUE

Chapitre 1 : INTRODUCTION A LA METHODE STATISTIQUE


I- CONCEPTS DE BASE DE LA STATISTIQUE DESCRIPTIVE
La statistique est un ensemble de méthodes scientifiques visant le recueil, l’organisation, la
présentation de données, ainsi que la modélisation et la construction de résumés numériques.
On parle de statistique descriptive lorsqu’on décrit et analyse un ensemble sans tirer de conclusion,
de statistique inductive lorsqu’on tire des conclusions sur une partie d’un ensemble et que l’on tente
d’étendre ces conclusions sur tout l’ensemble.
Population
On appelle population un ensemble d'éléments soumis à une étude statistique. C’est l’ensemble de
références sur lequel porte les observations. Il peut s’agir d’un ensemble de personnes, d’animaux ou
de choses. Prenons comme ensemble d’étude statistique, les ordinateurs stockés dans une salle.
L’ensemble des ordinateurs de cette salle est une population : c’est ici la population cible
Individu
Un individu est un élément de la population. C’est l’unité de la population statistique.
Un ordinateur de la salle est un individu.
Caractère
Un caractère est une information dont on recueille (ou observe ou mesure) la valeur sur chaque
individu. C’est en quelque sorte l’objet d’étude sur la population. Sur les ordinateurs de la salle on peut
étudier : la marque, le nombre de touches du clavier, la durée de vie… qui sont des exemples de
caractères. Le caractère est aussi appelé variable parce que la valeur de l’information n’est pas la
même d’un individu à l’autre.
Modalité
Une modalité est une valeur du caractère. Par rapport à un caractère donné, une modalité est la
situation dans laquelle se trouve un individu. Un ordinateur de la salle peut porter la marque DELL.
Si le caractère étudié est la marque, alors DELL est une modalité de ce caractère.
La modalité est généralement notée xi .
Effectif d’une modalité
L’effectif d’une modalité noté ni est le nombre de fois qu’apparait cette modalité. Si trois machines et
trois seulement de la salle portent la marque DELL, alors l’effectif de la modalité DELL est 3
machines. L’effectif est aussi appelé fréquence absolue.
Effectif total
L’effectif « » d’une population est le nombre total d’individus de cette population. Pour notre
exemple, c’est le nombre total d’ordinateurs dans la salle. Si n1 , n2 , n3 , …, nk sont les effectifs des
différentes modalités d’un caractère étudié sur une population, alors n = n1 + n2 + n3 + …+ nk .
k
On écrit plus simplement : n = n
i 1
i

Fréquence relative d’une modalité


C’est le rapport de l’effectif ni de la modalité 𝑖 par l’effectif total .
ni
Elle est notée fi : fi = . On montre que f1 +f2 +f3 +…+ fk =1
n
NB : la fréquence relative peut être donnée en pourcentage.
ni
Dans ce cas : fi = ×100 et f1 + f2 + f3 +…+ fk =100.
n

1
Caractère qualitatif
Un caractère est dit qualitatif lorsque ses modalités ne sont pas quantifiables (mesurables).
Le caractère « marque » par exemple est un caractère qualitatif parce que ses modalités (IBM, DELL,
Samsung, LENOVO, HP…) ne sont pas mesurables.
Caractère quantitatif
Un caractère quantitatif est un caractère dont chaque modalité est une valeur mesurable.
Les caractères nombre de touches du clavier et durée de vie sont des caractères quantitatifs.
Un caractère quantitatif peut être discret ou continu.
Caractère quantitatif discret ou variable discrète
Une variable discrète (ou discontinue) est une variable dont les modalités ne peuvent prendre que des
valeurs bien déterminées ou isolées.
Le caractère nombre de touches est un caractère discret. En effet le nombre de touches d’une machine
est un nombre bien déterminé : 30 touches, 20 touches, 45 touches….
Variable continue
C’est une variable dont les valeurs des modalités décrivent un intervalle de . En d’autres terme, les
modalités d’un caractère quantitatif continu sont susceptibles de prendre toutes les valeurs d’un
intervalle de .
Le caractère « durée de vie » d’un ordinateur est une variable continue.
Quand l’intervalle des modalités est trop grand, on le découpe en plusieurs petits intervalles appelés
classes. Le regroupement d’une série statistique en classe n’est pas unique. Il peut différencier d’un
statisticien à l’autre.
Classe
Une classe statistique est un intervalle de modalités.
Pour l’exemple du caractère « durée de vie », on peut avoir la classe « de 2 à 4 ans ». Dans un tableau
statistique, on choisira très souvent d’écrire [2; 4[ou]2; 4].
De même qu’on parle d’effectif d’une modalité, on parle aussi d’effectif d’une classe qui en fait n’est
rien d’autre que le nombre d’individus dont les modalités sont contenues dans cette classe.
On calcul alors la fréquence relative d’une classe de la même manière que la fréquence relative d’une
modalité

Centre de classe
Le centre ci d’une classe [bi ; bi+1 [ ou ]bi ; bi+1 ] d’origine bi et d’extrémité bi+1 où est un entier naturel
bi  bi 1
est la demi somme des bornes : ci =
2
Amplitude
L’amplitude ai d’une classe d’origine bi et d’extrémité bi+1 est la différence entre la borne supérieure et
la borne inférieure :ai = bi+1 - bi
Enquête
Par rapport à un caractère donné, une enquête est une collecte d’informations. L’enquête peut être
exhaustive ou partielle.
Recensement
Un recensement est une enquête qui porte sur tous les individus de la population. On l’appelle aussi
enquête exhaustive.
Sondage
Le sondage ou enquête partielle porte sur un échantillon ou une portion de la population.
Dépouillement
Le dépouillement d’une enquête sur une population est une opération de décompte des individus en
fonction des modalités ou des classes.

2
Exemple de dépouillement
On a interrogé 20 élèves d’une classe de BTS au sujet du nombre de cours auxquels chacun a pu
assister avant les congés de Noël 2020. Les résultats obtenus sont les suivants :
2 ;2 ;1 ;3 ;5 ;1 ;5 ;3 ;4 ;4 ;2 ;7 ;3 ;5 ;5 ;8 ;9 ;5 ;5 ;10.
Tableau de dépouillement

Nombre de cours (𝑥𝑖 ) Dépouillement Effectif d’élèves (𝑛𝑖 )


2 3
1 2
3 3
5 6
4 2
7 1
8 1
9 1
10 1

II-DISTRIBUTION STATISTIQUE
1. Effectifs cumulés, fréquences cumulées
Soit (xi ; ni) une série statistique dont les modalités sont rangées par ordre croissant :
- on appelle effectif cumulé croissant (respectivement décroissant) de la modalité xk la somme des
effectifs des modalités inférieures ou égales (respectivement supérieures ou égales) à xk.
- on appelle fréquences cumulées croissantes (respectivement décroissantes) de la modalité xk le
quotient de son effectif cumulé croissant (respectivement décroissant) par l’effectif total de la série.
Un tableau statistique est un tableau récapitulatif d’une enquête. On distingue deux types de tableaux :
Exemple 1 : Cas d’une variable discrète :
Tableau donnant la répartition de 40 ouvriers de la société D. A. D. selon le nombre d’enfants
scolarisés.
Nombre Effectifs cumulés Fréquences cumulées
Effectifs
d’enfants Fréquences
i 𝑛𝑖 (nombre
scolarisé 𝑓𝑖 (en %) Croissants Décroissant Croissantes Décroissantes
d’ouvriers)
𝑥𝑖
1 0 3 7,5 3 40 7,5 100
2 1 5 12,5 8 37 20 92,5
3 2 16 40 24 32 60 80
4 3 8 20 32 16 80 40
5 4 6 15 38 8 95 20
6 5 2 5 40 2 100 5
Total 40 100

Interprétation de quelques éléments du tableau.


Questions :
Quelle est la proportion d’ouvriers ayant moins de 3 enfants scolarisés ?
Quelle est la proportion d’ouvriers ayant au plus 1 enfant scolarisé ?
3
Quelle est la proportion d’ouvriers ayant au moins 4 enfants scolarisés ?
Quelle est la proportion d’ouvriers ayant plus de 3 enfants scolarisés ?
Combien d’ouvriers scolarisent plus de 2 enfants ? Au plus 2 enfants ?
Combien d’ouvriers scolarisent 5 enfants ?
Exemple 2 : cas d’une variable continue
La répartition de candidats à un test de présélection suivant le total des points obtenus.
Total Centre de Effectifs Effectifs cumulés Fréquences cumulées(%)
i
obtenu classe 𝑐𝑖 𝑛𝑖 Croissants Décroissant Croissantes Décroissantes
1 [20; 30[ 25 27 27 160 16,875 100,000
2 [30; 40[ 35 43 70 133 43,750 83,125
3 [40; 50[ 45 38 108 90 67,500 56,250
4 [50; 60[ 55 28 136 52 85,000 32,500
5 [60; 70[ 65 21 157 24 98,125 15,000
6 [70; 80[ 75 3 160 3 100,000 1,875
Total 160

Question
Quel est le nombre de candidats dont le total des points obtenu est :
Moins de 40
Au moins 60
Entre 50 et 60.

III- REPRESENTATIONS GRAPHIQUES


III-1 CARACTERE QUALITATIF
1. Diagrammes à secteurs circulaires / Diagrammes à secteurs semi-circulaires :
Exemple :
La bibliothèque d’une école contient dans ses rayons 2.000 livres, ainsi répertoriés :
Genre Manuel scolaire Roman Poésie Document
Effectifs 700 800 100 400
Construire :
le diagramme à secteurs circulaires.
le diagramme à secteurs semi-circulaires.

Solution :
Après avoir calculé les différents secteurs angulaires et éventuellement les fréquences on a le tableau
suivant : (Complétez-le et terminez la résolution).

Genre Manuel scolaire Roman Poésie Document Total


Effectifs 700 800 100 400 2.000
Fréquences (%)
Mesure de l’angle
(diagramme circulaire)
Mesure de l’angle
(diagramme semi-circulaire)

4
a) Diagramme à secteurs circulaires ou Diagramme circulaire
On obtient le diagramme suivant :

b) Diagramme semi-circulaire
On utilise le même procédé que le diagramme circulaire où 100% correspond à 180°.
2- Diagrammes à bandes :
Les modalités sont représentées par des rectangles ayant la même base et des hauteurs proportionnelles
à leurs effectifs (ou fréquences).
Méthode de construction :
On construit les axes du repère qui doivent être perpendiculaires.
On place les différentes modalités sur l’axe des abscisses.
On place les effectifs ou les fréquences des modalités sur l’axe des ordonnées.
On construit pour chaque modalité un rectangle ou une bande dont la hauteur est proportionnelle à son
effectif ou à sa fréquence, la base est représentée par la modalité.
Exemple :
En considérant l’exemple ci-dessus, on a :
Effectif

800
600
400

200
Genre
0 manuel roman poésie document
scolaire

5
III-2 CARACTERE QUANTITATIF
2-1-Caractère quantitatif discret
Diagrammes à bâtons :
Pour des données non groupées en classes, on peut représenter les effectifs ou les fréquences par un
diagramme en bâtons.
Les effectifs ou les fréquences sont marqués sur l’axe des ordonnées et les modalités sur l’axe des
abscisses.
Pour chaque modalité, on construit un segment (bâton) de longueur proportionnelle à son effectif ou à
sa fréquence et parallèle à l’axe des ordonnées
Exemple :
Une enquête portant sur le nombre d’enfants dans chacun des 50 foyers d’un village a donné :

Nombre d’enfants 0 2 3 4 5 6 7 9 10
Effectifs 2 3 5 4 11 11 8 4 2
Représenter le diagramme en bâtons de cette série statistique.
Solution :
Echelle : abscisse : 1 cm un enfant
Ordonnées : 1 cm deux unités (effectifs).

On obtient le diagramme en bâton suivant.

Exemple :
Une enquête portant sur le nombre d’enfants dans chacun des 50 foyers d’un village a donné :

Nombre d’enfants 0 2 3 4 5 6 7 9 10
Effectifs 2 3 5 4 11 11 8 4 2
Représentation du diagramme cumulatif ou diagramme en escalier de cette série statistique
On porte sur l’axe des abscisses les modalités et sur l’axe des ordonnées les effectifs cumulés ou les
fréquences cumulées.
Construisons le diagramme cumulatif des effectifs cumulés croissants de la série suivante :

Modalités 0 1 2 3 4 5 6
Effectifs 2 3 5 10 16 8 6
Effectifs cumulés croissants 2 5 10 20 36 44 50

6
ecc

50
Echelle :

40 Abs : 1 cm 1 unité

Ord : 1 cm 10 unités
30

20

10

0 1 2 3 4 5 6 7 modalités
2.2. Caractère quantitatif continu :
Histogrammes :
Une série statistique groupée est représentée par un diagramme, appelé histogramme.
C’est un diagramme constitué de rectangles juxtaposés.
On a deux cas : les amplitudes sont égales et les amplitudes sont inégales.
Cas des amplitudes égales :
Les rectangles ont la même largeur et cette largeur est proportionnelle à l’amplitude des classes.
Les hauteurs sont proportionnelles aux effectifs ou aux fréquences.
Remarque :
Il peut être tracé sur le même graphique que l’histogramme une ligne brisée, polygonale, joignant les
centres des classes, c’est le polygone des effectifs. Son aire, comprise entre l’axe des abscisses et la
ligne polygonale, doit être égale à l’aire de l’histogramme.
Exemple : Soit la série suivante :
Modalités [15 ;18[ [18 ;21[ [21 ;24[ [24 ;27[ [27 ;30[ [30 ;33[
Effectifs 15 10 14 22 18 11
amplitudes 3 3 3 3 3 3
Les amplitudes étant égales on a le diagramme suivant :
Effectifs

25

20

15

10

5
15 18 21 24 27 30 33 Modalités
La ligne brisée joignant les centres des classes est le polygone des effectifs.

7
Exemple :
Soit la série suivante :
Modalités [15 ;18[ [18 ;21[ [21 ;24[ [24 ;27[ [27 ;30[ [30 ;33[
Effectifs 15 10 14 22 18 11
amplitudes
Les amplitudes étant égales construire l’histogramme :
Cas des amplitudes inégales :
Dans le cas des classes d’amplitudes inégales, on calcule les effectifs corrigés. La méthode est la
suivante : On choisit une amplitude de référence A par exemple.
Pour une classe dont l’amplitude est ai et d’effectif ni, l’effectif corrigé nc est égal à :
A × ni
nc = .
ai
Les largeurs des rectangles sont proportionnelles aux amplitudes des classes, et
Les hauteurs proportionnelles aux effectifs corrigés des classes.
Remarque :
On peut également calculer les densités des différentes classes et dans ce cas les hauteurs des
rectangles sont proportionnelles aux densités de des classes.
Exemple :
Le tableau suivant donne la distribution en janvier 2005 des salaires des cadres d’une multinationale.
Salaires en millions F [4, 5[ [5,6[ [6, 8[ [8, 10[ [10, 13[ [13, 18[
Effectif 5 21 32 40 42 18
Construire l’histogramme de la série statistique.
Solution :
On calcule les amplitudes et les amplitudes des différentes classes.
Les largeurs (bases) des rectangles sont proportionnelles aux amplitudes des classes et les longueurs
(hauteurs) sont proportionnelles aux effectifs corrigés.
On choisit une échelle convenable et on construit l’histogramme.
Salaires [4, 5 [ [5, 6 [ [6, 8 [ [8, 10 [ [10, 13 [ [13, 18 [
Effectif 5 21 32 40 42 18
Amplitudes
Effectifs
corrigés
On obtient ainsi le schéma suivant :

Echelle : Abs : 1 cm 2 unités (salaires millions de F)


Ord : 1cm 5 unités (effectifs)

8
Application 1 :
Soit le tableau suivant donnant les tailles des élèves, compléter.
Classes Amplitude Centres effectifs Fréquences Effectifs
corrigés
[150, 160[ 12
[160, 165[ 20
[165, 170[ 11
[170, 178[ 8
Construire l’histogramme et tracer le polygone des effectifs.

Application 2:
On considère le tableau suivant donnant la répartition les salaires mensuels en milliers de francs CFA
des employés d’une usine située à la zone industrielle de Yopougon.
Classes Amplitudes centres effectifs Effectifs cumulés Effectifs
corrigés
croissants décroissants
[80 ;85[ 10
[85 ;90[ 14
[90 ;100[ 60
[100 ;110[ 44
[110 ;125[ 20
[125;150[ 28
[150;200[ 8
TOTAL
Compléter le tableau.
Indiquer la population étudiée et l’individu.
Quel est le caractère étudié ? donner sa nature.
Quel est le nombre d’employés touchant moins de 100 000 F CFA par mois ?
Quel est le nombre d’employés touchant entre 110 000 F et 200 000 F par mois ?
Construire l’histogramme de la répartition.

TRAVAUX DIRIGES

Exercice 1
80 employés d’une agence de tourisme, répartis suivant le nombre d’enfants à charge sont soumis à la
fin de l’année à une rétribution de prime à fraisons de 2 500F par enfants à charge.
Le tableau incomplet de la répartition se présente comme suit :

Fréquence Fréquence
Nombre d’enfants à
i Effectifs (ni) Fréquence (fi) cumulées cumulées
charge
décroissantes croissantes
1 0
2 1 0,1875 0,95
3 2 29
4 3 0,225
5 4 10
6 5 0,0375
7 6 0,0125

Complétez le tableau.

9
Quel est le nombre d’employés ayant :
0 enfant à charge ? Moins de 4 enfants à charge ? Au moins 3 enfants à charge ?
Quel est le montant global des primes perçues par les employés ayant :
Entre 2 et 5 enfants inclus ? Au plus 2 enfants ? Plus de 4 enfants ?
Exercice 2 :
Une étude statistique porte sur les dépenses annuelles relatives à une équipe de football. On a le
tableau suivant :
Nature des dépenses ( xi ) Montant en milliers de francs ( ni )
Achat équipement 3.500
Entretien équipement 3.000
Frais de déplacement 1.500
Frais d’arbitrage 500
Part des charges du stade (éclairage…) 1.300
Assurances 200
Construire les diagrammes à secteurs circulaires, à secteurs semi-circulaires et à bandes de la série
statistique.
Exercice 3 :
On considère le tableau suivant donnant la répartition les salaires mensuels en milliers de francs CFA
des employés d’une usine située à la zone industrielle de Yopougon.

Classes Amplitudes centres effectifs Effectifs cumulés Effectifs


corrigés
croissants décroissants
[80 ;85[ 10
[85 ;90[ 14
[90 ;100[ 60
[100 ;110[ 44
[110 ;125[ 20
[125;150[ 28
[150;200[ 8
TOTAL
Compléter le tableau.
Indiquer la population étudiée et l’individu.
Quel est le caractère étudié ? donner sa nature.
Quel est le nombre d’employés touchant moins de 100 000 F CFA par mois ?
Quel est le nombre d’employés touchant entre 110 000 F et 200 000 F par mois ?
Construire l’histogramme de la répartition.
Exercice 4 :
On considère le tableau ci-dessous d’une série statistique.
Modalités [0;5[ [5 ;10[ [10 ;15[ [15 ;20[ [20 ;25[ [25 ;30[
Effectifs 17 9 6 5 3 2
Construire l’histogramme et le polygone des effectifs.
Exercice 5 :
Soit le tableau suivant donnant les tailles des élèves, compléter.
Classes Amplitude Centres effectifs Fréquences Effectifs
corrigés
[150, 160[ 12
[160, 165[ 20
[165, 170[ 11
[170, 178[ 8
Construire l’histogramme et tracer le polygone des effectifs.

10
Chapitre 2 : CARACTERISTIQUES D’UNE DISTRIBUTION
I. TENDANCE CENTRALE
1. MODE
1.1 Définition
On appelle mode d’une série statistique, la modalité qui a l’effectif le plus élevé.
On note : Mo
Certaines séries statistiques admettent plusieurs modes.
Pour une distribution statistique dont les classes sont d’amplitudes égales, la classe modale est celle
dont l’effectif est plus élevé. Si les amplitudes des classes sont inégales, la classe modale est celle qui a
le plus grand effectif corrigé.
Le mode, dans ce cas est le centre de la classe modale.
1.2 Détermination du mode
Exemple 1
Déterminer le mode ou les modes des séries statistiques suivantes :
On relève les âges d’un groupe de 15 personnes et on les range par ordre croissant. On a le tableau
suivant :
Age 12 13 15 16 17 18 19
Effectif 2 3 1 2 3 3 1
Le tableau suivant donne en dizaines de francs le salaire horaire des employés d’une entreprise.
Salaires horaires [50, 70[ [70, 90[ [90, 110[ [110, 130[
Effectifs 13 20 10 5
Le tableau suivant donne l’ancienneté des employés d’une entreprise.
Ancienneté [0 ;1[ [1 ;2[ [2 ; 3[ [3 ; 5[ [5 ;10[
Effectif 10 15 5 20 30
2. LA MOYENNE ARITHMETIQUE
2.1 Définition :
La moyenne arithmétique d’une série statistique de N valeurs est le quotient de la somme de ces
valeurs par leur nombre N. On note : x .
La moyenne peut être simple ou pondérée. On a :
1
Moyenne simple : x=  xi
N
1
Moyenne pondérée : x =  ni xi
N
Avec :  (caractère grec sigma majuscule) se lit : Somme de …,
x i : Valeur de la variable ou centre de la classe,
n i : Effectif de la variable ou de la classe,
N= ni : Effectif total.
2-2-Détermination de la moyenne arithmétique
Exemple 2 : cas de variable discrète.
a) A la fin du 1er semestre, les notes sur 20 des devoirs surveillés de mathématiques obtenues par un
élève de 2 BT sont les suivantes : 08 ; 11 ; 14 ; 10 ; 12. Calculer la moyenne de l’élève.
b) Les notes obtenues en économie dans une classe de 10 élèves se répartissent de la façon suivante :
notes 8 11 15 18
Effectifs 4 3 2 1
Calculer la moyenne de la classe.

11
Exemple 3 : cas d’une variable continue.
(Dans ce cas les modalités xi sont les centres des classes).
Les tailles de 500 élèves d’un CBCG sont données dans le tableau statistique suivant :

Taille (cm) Centre des classes Effectif (ni) Produit (nixi)


(xi)
[158, 162[ ……….. 25 ………..
[162, 166[ ……….. 50 ………..
[166, 170[ ……….. 200 ………..
[170, 174[ ……….. 175 ………..
[174, 178[ ……….. 50 ………..
TOTAL …………… ………..

Compléter le tableau et calculer la moyenne de la série.

3-LA MEDIANE
3.1. Définition 1
La médiane d’une série statistique ordonnée est la valeur du caractère qui partage cette série en deux
sous séries de même effectif. On la note Me.
Définition 2
On appelle médiane d’une série statistique d’effectif total N tout nombre réel Me tel que le nombre
d’individus de modalité supérieure ou égale à M et le nombre d’individus de modalité inférieure ou
N
égale à Me soient tous deux au moins égaux à .
2
NB : Lorsque la série est groupée en classes, on détermine la médiane par une interpolation linéaire.
(voir exemple 3).
On peut déterminer graphiquement la médiane d’une série statistique. Dans ce cas, le point
d’intersection des courbes des effectifs cumulés croissants et décroissants a pour abscisse, la valeur de
la médiane.

3.2-Détermination de la médiane
a) Cas d’une variable discrète :
Si l’effectif total est un nombre impair : (N=2p+1)
La médiane est la valeur du caractère de rang (p+1).
Soit : x1  x2  x 3  ........  x p1  x p 2  x p 3  ........ x 2 p1 et la médiane est : x p 1 .
Exemple 3
Considérons la série statistique ordonnée des notes d’une élève : 7, 8, 8, 11, 12, 13, 14.
La médiane de cette distribution est ………car trois notes lui sont inférieures et trois notes lui sont
supérieures.

Si l’effectif total est un nombre pair : ( N = 2p )


La médiane existe lorsque le terme de rang p et le terme de rang p+1 sont identiques. Dans le cas
contraire la médiane n’existe pas. Ainsi par exemple la série suivante :
05, 07, 08, 12, 12, 13, 15, 16 a pour médiane…………… car la 4ème et la 5ème valeurs du caractère
sont identiques.
Par contre la série : 07, 08, 09, 12, 13, 15 n’admet pas de médiane mais un intervalle médian.
Exemple 4 :
On considère le tableau statistique suivant :
Age 12 13 15 16 17 18 19
Effectif 2 3 1 2 3 3 1
Déterminons la médiane.

12
b) Cas d’une variable continue :
Dans ce cas, on calcule les effectifs cumulés croissants et on procède par interpolation linéaire.

Ancienneté [0 ;1[ [1 ;2[ [2 ; 3[ [3 ; 5[ [5 ;10[


Effectif 10 15 5 20 30
Eff. C. C. 10 25 30 50 80

Dans le tableau des effectifs cumulés croissants, le nombre N/2 = 40 se situe entre 30 et 50. Donc la
médiane Me se situe entre 3 et 5. L’interpolation linéaire entre ces deux valeurs donne :

Me - 3 40  30
  …………………………………………………………………………………
5-3 50  30

II-DISPERSION:
1. QUARTILES
Définition
Les quartiles, au nombre de trois, Q1 , Q2 et Q3 sont des valeurs du caractère qui partagent une série
statistique d’effectif total N en 4 séries de même effectif N/4. On a le schéma suivant :

25% 50% 25%

Q1 Q2 Q3
On a : 25% soit le quart de la population étudiée a une modalité inférieure à Q1 et
75% une modalité supérieure à Q1.
50% soit la moitié de la population étudiée a une modalité inférieure à Q2
et la moitié une modalité supérieure à Q2.
75% soit 3/4 de la population étudiée a une modalité inférieure à Q3 et
25% une modalité supérieure à Q3.
Remarque :
Le 2ème quartile Q2 n’est rien d’autre que la médiane.
Détermination pratique des quartiles :
Cas d’une série à variable continue.
Si la variable est continue (regroupement par classes) les quartiles se calculent alors par interpolation
linéaire.
Exemple 5 :
Reprendre les données de la série suivante :

Ancienneté [0 ;1[ [1 ;2[ [2 ; 3[ [3 ; 5[ [5 ;10[


Effectif 10 15 5 20 30
Eff. cumulé 10 25 30 50 80
Calculer et interpréter les quartiles :

Q1 est dans la classe [1 ;2[ car l’effectif cumulé croissant dépasse 25% des valeurs ou le quart
N/4=20 des valeurs.
Q1 -1 20  10 10
  Q1 =1+1   1, 67 Soit : Q1 = 1,67 ans.
2-1 25  10 15
Interprétation : 25% des employés ont une ancienneté inférieure à 1,67 ans.

13
2. L’ETENDUE
Définition
On appelle étendue ou range d’une série statistique, la différence entre la plus grande modalité et la
plus et la petite modalité.
étendue = max(xi)-min(xi).
L’étendue permet de tracer les diagrammes.
Exemple 6
On considère les salaires journaliers en F CFA accordés à leurs ouvriers par deux entreprises A et B,
qui comptent chacun 5 salariés.
Etablissement A : 5 200 5 280 5 480 5 600 5 720
Etablissement B : 4 880 4 920 5 480 5 560 6 440
Calculons l’étendue de chaque série statistique :
A : 5 720 – 5 200 = 5 20 F.
B : 6 440 – 4 880 = 1 560 F.
Ce qui montre que les salaires journaliers accordés par l’entreprise B sont beaucoup plus étalés,
dispersés, que les salaires accordés par l’entreprise A.

3. INTERVALLE INTERQUARTILE ET ECART INTERQUARTILE


Définition
On appelle écart interquartile le nombre : Q3 - Q1 .
Il permet de mesurer la dispersion de série autour de la médiane. L’intervalle interquartile est :
[Q1,Q2]. Il contient 50% des effectifs.
Exemple 7 :
En reprenant les données de la série groupée de l’exemple 1, calculons l’écart interquartile et donnons
une interprétation.

4. ECART MOYEN ARITHMETIQUE OU ECART ABSOLU MOYEN


Définition
On appelle écart moyen arithmétique d’un ensemble de données, la moyenne arithmétique des écarts
de ces données par rapport à la moyenne arithmétique de la série. On la note e.
Si x est la moyenne arithmétique des n valeurs de la série, on a :
1
Cas de moyenne simple, e 
n
 xi  x
1
Cas de moyenne pondérée, e   ni xi  x
n
Exemple 8:
a) Soit 8, 10, 11, 12, 13, 14, 16 les valeurs du caractère d’une série.
Calculer la moyenne et en déduire l’écart moyen absolu.
b) Déterminer l’écart moyen de la série suivante représentant la répartition des élèves d’après leur
taille :

Taille (cm) Centre des classes Effectif


(xi) (ni) xi  x ni xi  x
[158, 162[ 25
[162, 166[ 50
[166, 170[ 200
[170, 174[ 175
[174, 178[ 50
TOTAL
Calculer e

14
5. VARIANCE ET ECART-TYPE
Définition :
On appelle variance, la moyenne arithmétique des carrés des écarts à la moyenne. On notée V. On a:
     n  x -x 
2 2 2
n1 x1 -x +n 2 x 2 -x +....... i i
V= =
n1 +n 2 +....... N
Avec N : l’effectif total,
xi : valeur de la variable,
x : La moyenne des xi,
n i : Effectif de la variable xi.
L’écart type est la racine carrée de la variance. On note :  (sigma) On a :
σ= V
1  2
Propriété : La variance peut s’exprimer par : V= 
N
 n i x i2  -x .

Application :
a) Calculer la variance et l’écart type de la série précédente pour laquelle la moyenne est
x  169,4 cm .
Compléter le tableau ci-dessous.
Taille (cm) Centre des Effectif xi  x  x  x  
2 2
ni xi  x
classes (xi) (ni) i

[158, 162[ 25
[162, 166[ 50
[166, 170[ 200
[170, 174[ 175
[174, 178[ 50
TOTAL
b) On considère le tableau de notes de l’exemple 2, b), avec x=11, 3
Compléter le tableau et calculer la variance et l’écart type de la série en utilisant la formule réduite de
1  2
la variance: V= 
N
 n i x i2  -x .

xi 8 11 15 18 Total
ni 2 3 2 1

ni xi
ni xi2

6. COEFFICIENTS DE VARIATION (OU DE DISPERSION):


Définition :
On appelle coefficient de variation d’une série statistique de moyenne x et d’écart type  , le

moyenne arithmétique x
rapport défini par : , soit : .
écart type 
Lorsqu’il faut comparer les séries statistiques du point vue de leur dispersion, on ne doit pas se limiter
à la comparaison des seuls écarts types mais il convient souvent de comparer les coefficients de
variation. La dispersion d’une série statistique est d’autant plus élevée que si la mesure de son
coefficient de variation est élevée.
Application :
En reprenant les données des séries statistiques de l’exemple 6, calculer les coefficients de variation et
comparer la dispersion des dites séries.

15
TRAVAUX DIRIGES
Exercice 1 :
Déterminer la médiane dans les séries statistiques suivantes :
a) On a un groupe 16 personnes dont on a relevé les âges :
Age 12 13 15 16 17 18 19
Effectif 2 3 1 2 3 4 1
b)Le tableau suivant donne la distribution en janvier 2011 des salaires dans une entreprise en millions
de francs.
Salaires [4 ;5[ [5 ;6[ [6 ; 8[ [8 ; 10[ [10 ;13[ [13 ;18[
Effectif 5 21 32 40 42 18
Exercice 2:
On lance une opération de vaccination des enfants de 0 à 5 ans dans une petite ville de côte d’ivoire.
Le tableau suivant donne la répartition des enfants vaccinés.

Valeurs de X 0 1 2 3 4 5
Effectifs 2 17 29 33 16 3

a) Construire le diagramme en bâtons de la série statistique.


Dresser le tableau des effectifs cumulés.
Déterminer le mode, la médiane, la moyenne et les quartiles de cette série.
Calculer la variance et l’écart type.
Exercice 3:
La distribution des notes sur 50 obtenues, lors d’un test, est donnée par le tableau
suivant :
Notes [10 ; 15[ [15 ; 20[ [20 ; 25[ [25 ; 30[ [30 ; 35[ [35 ; 40[ [40 ; 45[
Effectifs 3 7 16 12 9 5 2
Quel est le caractère étudié?
Quelle est sa nature ?
Quelle est la classe modale ?
d) Quel est le mode ?
e) Calculer les quartiles de la série et les interpréter
f) Calculer la note moyenne
g) Calculer la variance et l’écart type.
Exercice 4 :
Pour une journée de travail, les salaires, en milliers de francs CFA d’une usine se répartissent de la
façon suivante :
Salaires en € Nombre de personne
[30, 40[ 10
[40, 50[ 25
[50, 60[ 65
[60, 70[ 80
[70, 80[ 36
[80, 90[ 21
[90, 100[ 13

Construire l’histogramme des effectifs et le polygone statistique des effectifs.


Déterminer les effectifs cumulés croissants.
Déterminer par le calcul le salaire médian et le salaire moyen.
Calculer les quartiles. Vérifier graphiquement.
Déterminer l’intervalle interquartile.
Calculer l’écart type de la série.

16
Chapitre 3 : SERIES STATISTIQUES A DEUX VARIABLES
I-GENERALITES
1.1. Nuage de points
L’étude porte ici sur deux caractères quantitatifs au sein d’une même population. Le but est de déceler
une corrélation mathématique entre ces deux caractères. Pour cela, on commence par représenter dans
un repère cartésien du plan, chaque élément de la population par un point de coordonnées (xi, yi).
L’ensemble de ces points constitue ce que l’on appelle un nuage de points.
En fonction du nuage de points obtenu, on définit le type de relation qui peut exister entre les deux
caractères.
1-2-Tableau de données :
Exemple 1 :
Au cours du premier trimestre de cette année, une entreprise a lancé la commercialisation d’un
accessoire « C », nécessaire à la pose de son produit « B ».
On dispose des quantités vendues par zones de vente.

Zone Nombre d’unités de B Nombre d’unités de C


vendues : xi vendues : yi
1 2.000 1.200
2 2.500 1.250
3 3.000 1.500
4 4.000 2.400
5 6.000 2.700
6 6.500 2.950

Représentons le nuage de points de la série statistique dans le plan muni d’un repère orthogonal.

Ici l’étude porte sur deux caractères à savoir le produit « B » représenté par x et d’un accessoire
« C » représenté par y .

Abscisse: 1 cm  1.000 unités de B


Echelle :
Ordonnée: 1 cm  1.000 unités de C

0 1 2 3 4 5 6 7 X

II-AJUSTEMENT LINEAIRE :
Il s’agit de trouver l’équation d’une droite qui suive au mieux l’ensemble des points d’un nuage.
Plusieurs méthodes existent pour calculer l’équation d’une droite d’ajustement et on note parmi ces
méthodes :
- la méthode de MAYER,
- la méthode des moindres carrés.

17
2-1-Ajustement linéaire par la méthode de MAYER
a) Point moyen :
Etant donné un nuage de n points de coordonnées (xi, yi), on appelle point moyen du nuage, le point
1
G  x;y  où x est la moyenne des xi et y est la moyenne des yi Avec : x =  xi et
n
1
y=
n
 yi .
b) Droite de MAYER
La méthode de Mayer consiste à partager le nuage en deux ensembles de points d’égal effectif (ou à
peu près, si le nombre de points est impair). Si G1  x1 ;y1  et G 2  x2 ;y 2  sont les points moyens de
chaque ensemble, alors la droite (G1G2) passant par les points G1, G2 et G, est une droite d’ajustement
appelée droite de Mayer.
Exemple 2 :
En utilisant les données de l’exemple 1, calculer les coordonnées du point moyen G et déterminer une
équation de la droite de Mayer puis la construire.
En utilisant l’équation de la droite, calculer le nombre d’unités de C vendues pour 7.000 unités de B
vendues dans une zone donnée.
2-2-Ajustement linéaire par la méthode des moindres carrés
a) Covariance d’une série statistique double
La covariance d’une série statistique double de caractères x et y est le nombre réel cov(x,y) et défini
par :
1
cov(x,y)=
n
  xi -x  y i -y  Avec n : le nombre de points du nuage.

On note aussi cov(x,y) = σ xy et le symbole  est appelé sigma.


Il existe une autre formule plus commode pour les calculs :
1 
σ xy =   xi y i  -x.y
n 

b) Equations des droites de régression


On montre que :
La droite de régression D de y en x a pour équation : y = ax + b .
cov(x,y)
Où le coefficient directeur est a avec a= et où b vérifie : y = ax - b
v(x)
1 2
Soit b = y - ax avec v(x) la variance de x : v(x)=   xi  - x 
2

n 

La droite de régression D’ de x en y a pour équation x = a’y+ b’.


cov(x,y) 1 2
et b’ vérifie x = a'y +b' avec v(y)=   y i  - y  
2
Où a'=
v(y) n 

NB : les droites D et D’ passent par le point moyen G  x;y  du nuage.

18
Exemple 3 :
Le tableau suivant donne pour une année déterminée le nombre de touristes entrant dans les pays
indiqués ainsi que les recettes totales correspondantes.
Pays visités C. I Mali Bénin Togo Niger
Nombre de touristes (en millions) Xi 7,5 4,5 4,2 3,5 3,1
Recettes totales (en millions) Yi 10 4 4,5 3,9 4,3
Déterminer une équation de la droite de régression de Yen X et la représenter dans le plan muni d’un
repère. (Donner les résultats à 10-2 près).
Pays Xi Yi XY X2
Niger 3,1 4,3
Togo 3,5 3,9
Bénin 4,2 4,5
Mali 4,5 4
C.I 7,5 10
Total
Moyennes des Xi et Yi :
Calcul de la variance et de la covariance:
Equation de la droite de régression D de y en x :

1 cm  1.000.000 de touristes
ECHELLE : Abscisse:
Ordonnée: 1 cm  1.000.000 de francs
Y
11 D

10

6 G
5

0 1 2 3 4 5 6 7 8 9 10X

c) Coefficient de corrélation linéaire :


On appelle coefficient de corrélation linéaire d’une série statistique double de variables x et y le
cov(x,y)
nombre r défini par : r= où  (x) et  (y) sont respectivement l’écart type de x et
σ(x)σ(y)
l’écart type de y avec :  (x)= v(x) et  (y)= v(y) .
Propriétés :
r est un nombre réel, qui est du même signe que cov(x,y).
on admet que -1  r  1
Si r2 = 1 alors les droites D et D’ sont confondues et on dit que l’ajustement est parfait.
Si r  0, 87 alors on dit que la corrélation est forte.
Exemple 4 :
Calculons le coefficient de corrélation linéaire de la série statistique de l’exemple précédent.

19
TRAVAUX DIRIGES
Exercice 1 :
Une entreprise fabrique et vend des lots de pompes à injection.
Le tableau ci-dessous donne le pourcentage y de pompes à injection d’un lot de pompes qui ont une
panne au cours de x années d’utilisation.

Nombre xi de semestres 1 2 3 4 5 6 7 8 9 10
Pourcentage yi 0 2 4 8 11 14 17 20 23 27

Représenter le nuage de points à la série statistique.


Calculer les cordonnée du point moyen et le représenter.
Déterminer une équation de la droite de Mayer et la construire.
Calculer le nombre de semestres correspondant à un pourcentage de 30.
a proposé dans cette nouvelle société.

Exercice 2 :

On considère la série statistique double représentée par le tableau suivant:

Année Xi Yi (en millions)


2001 1 13.318,6
2002 2 14.916
2003 3 16.977
2004 4 19.522
2005 5 21.656
2006 6 23.450

Représenter graphiquement le nuage de points dans le plan muni d’un repère orthogonal.
Déterminer par la méthode des moindres carrés une équation de y en x, dans laquelle les coefficients a
et b seront donnés à 10-2 près puis construire cette droite.
En supposant que l’évolution observée entre 2001 et 2006 se poursuive, donner une estimation du
montant de y en 2012.

Exercice 2 :
Dans 10 exploitations agricoles d’une même région, on a mesuré, la taille de
l’exploitation (en dizaines d’hectares) et le bénéfice annuel net (en millier de FCFA) :

Taille xi 1 2 3 4 5 6 7 8 9 10
Bénéfice yi 1200 3000 4200 2600 4800 5400 4200 1800 8100 9600

1 .a) représenter le nuage de points correspondant, ainsi que le point moyen G du


nuage.
b) Ecrire une équation de la droite de Mayer.
2. a) Calculer le cœfficient de corrélation linéaire ; justifier l’existence d’un lien
entre le bénéfice et la taille de l’exploitation.
b) Utiliser la méthode des moindres carrés pour déterminer une équation de la
droite d’ajustement affine sous la forme y = ax + b. Tracer cette droite
c) Si on considère une exploitation de 0.5 ha, quel serait le bénéfice d’après cet
ajustement ? NB : présenter tous les résultats à 10-2 près.
Exercice 3 :
Au centre de protection maternelle et infantile (PMI) de Yopougon on a relevé le poids du bébé de
FATIMA dans les premiers mois de sa naissance. Le tableau suivant présente les résultats :

20
Age en mois (Xi) 1 2 3 4 6 9 10 12
Poids en kg (Yi) 3,6 4,3 5 ,2 5,7 6,6 7,8 8,2 8,6

1. représenter graphiquement le nuage de points de coordonnées (Xi ;Yi) dans le


plan muni d’un repère orthogonal.

2. Calculer les coordonnées du point moyen G puis le représenter.

3. Déterminer une équation de la droite d’ajustement linéaire de Y en X par la


méthode MAYER puis la construire.

4. On suppose que l’évolution du poids du bébé se maintient jusqu’à à l’âge de trois


ans.
a. Calculer le poids que le bébé aura à 18 mois.
b. Calculer l’âge en mois lorsque le bébé aura un poids de 10 kg.

Exercice 4 :
Les dépenses Xi et les chiffres d’affaires Yi annuels de la société ZOUKOU-SPORT ont donné de
2000 à 2006, les résultats suivants après une étude statistique.
Les montants sont exprimés en millions de francs CFA.

Dépenses Xi 7 12 6 8 26 15
Chiffres d’affaires Yi 90 121 83 99 223 141

1. Construire le nuage de points de la série statistique.


2. Déterminer les droites de régression de Y en X et de X en Y par la méthode des
moindres carrés puis les construire.
3. Commentez les positions relatives des deux droites de régression.
4. En utilisant la droite de régression de Y en X, estimez le chiffre d’affaires si la
dépense annuelle est de 60 millions de francs.

21
Chapitre 4 : INDICES STATISTIQUES
Deux catégories d’indices peuvent être distinguées selon le type de grandeur étudiée. Ainsi, si l’on
considère le prix d’un produit, la production d’une entreprise donnée, le cours de l’action d’une société
particulière, il s’agit de grandeurs simples au sens où la grandeur est un nombre ne prenant qu’une
seule valeur dans une situation donnée. Les indices calculés sur la base de ces grandeurs sont appelés
indices élémentaires. En revanche, le niveau général des prix, la production industrielle, le cours des
actions sont des grandeurs complexes dans la mesure où leur calcul nécessite d’agréger un ensemble
de valeurs hétérogènes (prix des différents produits, production de diverses industries, cours de
différentes actions). Les indices calculés sur la base de ces grandeurs sont appelés indices
synthétiques.

I-INDICES ELEMENTAIRES OU SIMPLES :


1-1- Notion et définition :
Exemple :
A une date t0 le prix du litre d’huile dans un pays africain s’élève à 650 F CFA. A une date t1,
postérieure à t0, le prix de cette denrée s’élève à 780 F CFA.
Caractérisons l’augmentation du prix d’huile de la date t0 à la date t1.
Augmentation : 780 - 650 = 130 F CFA.
130
Soit une augmentation de :  100  20% par rapport au prix mesuré à la date t0.
650
780
Par rapport au prix mesuré à la date t1, on a :  1, 20 ce qui signifie que le produit qui coûtait 1 F
650
CFA à la date t0, coûte à la date t1, 1,20 F CFA.
780
En multipliant le rapport précédent par 100, on a :  100  120 qui signifie que, à la date t0 la
650
denrée qui coûtait 100 F CFA coûte 120 F CFA le litre à la date t1
(Soit une augmentation du prix de 120 – 100 = 20 pour 100).
Le nombre 120, est appelé indice du prix de la denrée étudiée à la date t1, calculé sur la base 100 à la
date t0 où t0 est appelé date de base.
Formulation :
Soit, t0 : la date de base,
P0 : la mesure à la date t0,
t1 : date postérieure à t0,
P1 : la mesure à la date t1 de la même grandeur.

L’indice simple de la grandeur, à la date t1, calculé sur la base 100 à la date t0 est noté I1 / 0 et défini
P1
par : I1/ 0   100 .
P0
Remarque :
Cet indice est dit simple, ou élémentaire car il ne porte que sur une seule grandeur.
Application :
Le prix du litre de l’essence auto en Côte d’ivoire est passé de 615 F CFA en 2008 à 765 F CFA en
2010. Calculer l’indice du prix en 2010 sur la base 100, l’année de référence étant 2008.
Solution :
On a : t0 = 2008, t1 = 2010, P1 = 765 F CFA et P0 = 615 F CFA.
1-2. Propriétés des indices simples
a) réversibilité d’un indice:
L’indice simple d’une grandeur, à la date t1, calculé sur la base 100 à la date t0, est :

22
P1
I1/ 0   100
P0
L’indice simple de la même grandeur, à la date t0, calculé sur la base 100 à la date t1, est :
P0
I 0 /1   100
P1
I1/ 0 1 I1/ 0 I 0 /1

On dit que l’indice simple est réversible si : 100 I 0 /1 ou 100  100  1
100
b) Transférabilité d’un indice:
Si on considère les mesures P0 , P1, P2, d’une grandeur aux dates t0, t1, t2 , on peut calculer les indices
simples : I1 / 0 , I 2 / 0 , I 2 / 1 .
I 2 / 0 I1/ 0 I 2 /1 I 2/1
On dit qu’un indice simple est transférable si :   ou I 2/ 0  I1/ 0 
100 100 100 100
Application :
Considérons le salaire horaire minimum interprofessionnel garanti dans une entreprise (année de base
1992).

Année Epoque Salaires horaires (F) Indice horaire


1992 0 168 100
1993 1 180 107,1
1994 2 188 111,9
1995 3 192 114,2
1996 4 200 119,0
Calculer I 4 / 3
1) Directement,
2) En utilisant la Transférabilité et la réversibilité des indices.

II-INDICES SYNTHETIQUES (OU INDICES COMPOSES) :


La détermination d’un indice peut ne pas se limiter à la confrontation des mesures d’une seule
grandeur aux dates t0 et t1.
On peut en effet envisager de caractériser avec un indice unique l’évolution simultanée de plusieurs
grandeurs et de calculer non plus un indice simple, mais un indice synthétique (ou un indice
composé).
Exemple :
Considérons la consommation quotidienne de quatre articles (pain, viande, vin et beurre), d’une
famille de quatre personnes.
Les prix moyens et les quantités consommées de chaque denrée aux dates t0 et t1, sont mentionnées
dans le tableau ci-dessous :

Prix unitaires
Denrées Date t0 Date t1 Consommation
Pain (kg) 80 F 100 F 1,2 kg
Viande (kg) 1 400 F 1 600 F 0,5 kg
Vin (litre) 1 200 F 1 400 F 1 litre
Beurre (kg) 1 000 F 1 100 F 0,2kg
Calculons un indice synthétique des prix à la date t1 (base 100 à la date t0).

23
a) Première méthode : Indice des moyennes arithmétiques pondérées.
Le principe de calcul est de multiplier par 100 le rapport :
du prix total des quantités consommées à la date t1,
au prix total des quantités consommées à la date t0.
100  1, 2  1600  0,5  1400  1  1100  0, 2
I1/ 0   100  115,66
80  1, 2  1400  0,5  1200  1  1000  0, 2
Ainsi on dépense 115,66 F à la date t1 pour se procurer la disposition de ce qui coûtait 100 F à la date
t0. Ou encore, les prix ont augmenté de 15,66% de la date t0 à la date t1.
Expression générale :
Soit P0,i : les prix respectifs des k denrées à la date t0.
P1,i : Les prix respectifs des mêmes denrées à la date t1.
Q i : Les coefficients de pondération (quantité dans la ième denrée consommée).

On a : I1/ 0 
P 1,i  Qi
 100 ou I1/ 0 
 P Q  100 .
1

P 0,i  Qi P Q 0

b) Deuxième méthode : Moyenne arithmétique pondérée des indices simples.


Le principe de calcul est de déterminer d’abord l’indice simple propre à chaque denrée, puis de faire la
moyenne arithmétique pondérée des indices simples obtenus.

100
Le pain : I1/ 0   100 ; La viande : I1/ 0  1600  100 ; Le vin : I1/ 0  1400  100 ;
80 1400 1200
1100
Le beurre : I1/ 0   100
1000
 100   1600   1400   1100 
 80  100  1, 2    1400  100  0,5    1200  100    1000  100  0, 2 
On a : I1/ 0        
1, 2  0,5  1  0, 2
I1/ 0  119, 24
 P1   P1 
 P  100  Q   P Q
Expression générale : I1/ 0   0   0   100
Q Q
Application :
Les mesures de trois denrées A, B, C à deux dates indiquées sont données dans le tableau suivant :
Prix unitaires
Denrées An 2000 An 2011 Quantités
A 200 F 300 F 5
B 300 F 400 F 3
C 500 F 800 F 2

Calculer un indice synthétique des prix en 2011 (base 100 en 2000).

FORMULES DE LASPEYRES ET DE PAASCHE :


1) Dans les calculs d’indices qui viennent d’être envisagés les pondérations retenues étaient celles
constatées à la date t0. Il est possible d’exécuter des calculs similaires en prenant les pondérations de la
date t1, en supposant que les pondérations se soient modifiées entre les deux dates.
Les calculs fondés sur les pondérations de la date de base t0 sont effectués avec la pondération dite
de Laspeyres. On note : L1/0, L2/0, L3/0 …..........

24
Les calculs d’indices exécutés d’après les pondérations de la date de calcul t 1, sont effectués avec la
pondération dite de Paasche. On note : P1/0, P2/0, P3/0……
Forme générale des indices des prix.
Q0, les pondérations à la date t0, et celles à la date t1 sont désignées par Q1. (voir tableau)
Laspeyres (1834-1913) : mathématicien et économiste allemand.
Paasche (1851-1925) : statisticien allemand.

Pondération Laspeyres Pondération Paasche


Indice des moyennes ∑ P1 Q0 ∑ P1 Q1
arithmétiques pondérées L1/0 = × 100 P1/0 = × 100
∑ P0 Q0 ∑ P0 Q1
Moyennes arithmétiques P P
∑ ( 1 × Q0 ) ∑ ( 1 × Q1 )
pondérées des indices simples P0 P0
L1/0 = × 100 P1/0 = × 100
∑ Q0 ∑ Q1

Exemple :
Les mesures en 2002 et en 2005, des prix unitaires et des quantités consommées des articles A, B, C et
D sont données dans le tableau suivant :

2002 2005
Articles Prix P0 Quantité Q0 Prix P1 Quantité Q1
A 500 F 100 700 F 80
B 2000 F 15 3000 F 25
C 1000 F 50 1200 F 90
D 300 F 200 400 F 200

Calculer l’indice synthétique des prix (indice des moyennes arithmétiques pondérations) en 2005,
calculé sur la base 100 en 2002.
avec la pondération Laspeyres,
avec la pondération Paasche.

Remarque :
De même que nous avons jusqu’ici calculé des indices des prix pondérés par des quantités
(pondération Laspeyres ou Paasche) on pourrait calculer des indices des quantités (ou indices de
volume) pondérées par des prix.

Pondération Laspeyres Pondération Paasche


Indice des moyennes ∑ Q1 P0 ∑ Q1 P1
arithmétiques pondérées L1/0 = × 100 P1/0 = × 100
∑ Q0 P0 ∑ Q0 P1
Moyennes arithmétiques Q Q
∑ ( 1 × P0 ) ∑ ( 1 × P1 )
pondérées des indices simples Q0 Q0
L1/0 = × 100 P1/0 = × 100
∑ P0 ∑ P1

Principaux indices :
l’indice des 259 articles, dont le titre officiel est « indice mensuel des prix à la consommation des
ménages urbains dont le chef de foyer est employé ou ouvriers ».

L’indice des prix en gros, fondé sur les produits alimentaires, les produits énergétiques, les produits
industriels.

L’indice du volume du commerce extérieur, portant sur les quantités de marchandises importées et
exportées.

L’indice de la production industrielle.


25
Indice de Fisher
Dans la mesure où il n’existe pas de critère permettant de conclure à la supériorité d’un des deux
indices précédents – Laspeyres et Paasche – par rapport à l’autre, l’idée consiste à construire un indice,
appelé indice de Fisher, représentant une combinaison des indices de Laspeyres et Paasche dont la
valeur se situe « entre » celles de ces deux indices.
Définition
L’indice de Fisher est défini comme la moyenne géométrique des indices de Laspeyres et Paasche, soit
𝐅𝟏/𝟎 = √𝐋𝟏/𝟎 × 𝐏𝟏/𝟎
Il est alors possible de définir un indice des prix de Fisher et un indice de volume de Fisher.

Quel indice synthétique privilégier ?


Ainsi que nous l’avons précédemment souligné, il n’existe pas de critère général permettant de statuer
sur la supériorité d’un indice synthétique par rapport à un autre. Il est cependant possible de présenter
les principaux avantages et inconvénients de ceux-ci. Supposons que l’on étudie l’évolution de la
consommation d’un panier composé de plusieurs biens. Dans le cas de l’indice de Laspeyres, les
coefficients de pondération sont fixes, c’est-à-dire que l’on suppose que la structure de la
consommation ne se modifie pas sur la période étudiée.
En conséquence, si l’on considère que les coefficients de pondération sont fixés à la date de référence,
plus la date courante est éloignée de la date initiale, plus il est probable que la structure du panier de
biens du consommateur se soit modifiée et plus le risque que les coefficients de pondération soient
obsolètes est important. Pour cette raison, le principal inconvénient attribué à l’indice de Laspeyres est
qu’il tend à surestimer l’effet de l’évolution des prix sur le pouvoir d’achat du consommateur dans la
mesure où il ne tient pas compte d’éventuelles substitutions entre les biens du panier considéré. Notons
que cet inconvénient a pour conséquence que les coefficients de pondération de l’indice de Laspeyres
sont révisés de façon périodique.
Dans le cas de l’indice de Paasche, les coefficients de pondération sont ceux de la date courante. Ceux-
ci évoluent donc avec les prix, c’est à- dire que la part des différents biens au sein du panier considéré
évolue en même temps que les prix. Le calcul de l’indice de Paasche nécessite en conséquence de
disposer simultanément des données relatives aux prix et aux quantités à chaque date considérée (et
non plus seulement des prix comme dans le cas de l’indice de Laspeyres). Le principal inconvénient
tient ici en une difficulté de calcul supplémentaire liée à la disponibilité des données, expliquant
pourquoi l’indice de Laspeyres est plus fréquemment utilisé que l’indice de Paasche. Du fait de la
variabilité des coefficients de pondération, l’indice de Paasche tend, au contraire de l’indice de
Laspeyres, à sous-estimer l’effet de l’évolution des prix sur le pouvoir d’achat du consommateur. Il est
important de souligner que les modifications de la structure de consommation ne dépendent
évidemment pas que de l’évolution des prix relatifs des biens composant le panier. Il convient aussi de
tenir compte de l’évolution des élasticités revenu. Ainsi, même si le prix d’un bien diminue, cela
n’implique évidemment pas que sa part dans la consommation va augmenter : pour certains biens dont
le prix relatif a diminué, une hausse de revenu peut se traduire par une baisse de leur consommation
relative (cas des biens inférieurs par exemple).
Au total, il n’existe donc aucun critère théorique permettant de préférer un système de pondération par
rapport à un autre, tout dépend de la façon dont les structures de consommation évoluent. Pour finir,
notons que si les différences entre les pondérations des indices de Laspeyres et de Paasche sont
faibles, on a la relation suivante :
𝐏𝟏/𝟎 ≤ 𝐅𝟏/𝟎 ≤ 𝐋𝟏/𝟎
Cette inégalité s’obtient en notant que (i) sous l’hypothèse de coefficients de pondération égaux entre
les deux indices, les indices de Laspeyres et de Paasche sont respectivement des moyennes
arithmétique et harmonique d’indices élémentaires et (ii) la moyenne harmonique d’une série est
toujours inférieure à la moyenne arithmétique de cette même série. Il est donc important de souligner
qu’en cas de différences non négligeables entre les coefficients de pondération, cette inégalité n’a plus
lieu d’être vérifiée.

26
TRAVAUX DIRIGES
EXERCICE 1 :
Dans une entreprise le personnel se reparti d’après les pourcentages suivants :
Agents d’exécution : 24%
Cadres subalternes : 56%
Cadres moyens : 19%
Cadres supérieurs : 1%
La rémunération mensuelle moyenne par catégorie a évolué de 1998 à 2005 (mesures en francs CFA)
Catégories 1998 2005
Agents d’exécution 64 000 116 000
Cadres subalternes 80 000 128 000
Cadres moyens 96 000 150 000
Cadres supérieurs 200 000 269 000
Calculer l’indice synthétique des rémunérations mensuelles en 2005 par rapport à 1998.
EXERCICE 2 :
En utilisant les renseignements consignés dans le tableau suivant :
Date 0 Date 1
Articles Prix P0 Quantité Q0 Prix P1 Quantité Q1
A 1000 F 30 1400 F 25
B 2000 F 25 2600 F 25
C 5000 F 15 6000 F 30

Calculer : (indices de moyennes arithmétiques pondérées).


1) L’indice synthétique des prix (pondération Laspeyres).
2) L’indice synthétique des prix (pondération Paasche).
3) L’indice synthétique des quantités pondérées par les prix (pondération Laspeyres)
4) L’indice synthétique des quantités (pondération Paasche).
EXERCICE 3 :
A partir du tableau suivant, calculer l’indice des salaires en 2006, en prenant pour base l’année 2000.
On calculera successivement :
- L’indice des moyennes arithmétiques pondérées,
- La moyenne arithmétique pondérée des indices élémentaires.
Salaires Pondérations
Denrées An 2000 An 2006
A 120 000 F 300 000 F 5
B 500 000 F 700 000 F 3
C 1 200 000 F 1 380 000 F 2

SUJETS DE SYNTHESE
Sujet 1

EXERCICE 1 :
Dans une centrale d’approvisionnement, pour chaque livraison faite, on a noté le nombre de Km
parcourus. Les observations faites au cours d’une semaine ont donné le tableau suivant :
Parcours
de 0 à 6 6 à 12 12 à18 18à24 24à30 30à36 36à42 42à48 48à54 54à60
livraison
en Km
Nombre
de 6 36 52 62 71 78 65 60 40 10
livraisons
27
Calculer le nombre moyen de Km par livraison.
Calculer le coût moyen d’une livraison.
Calculer la variance et l’écart type.
EXERCICE 2:
« ROUES-IVOIRE » est une petite usine de montage de bicyclette. Sa production a été la suivante ces
six dernières années :
Années 1998 1999 2000 2001 2002 2003
Nombre de bicyclettes montées ……….. ……. 5650 5400 6240 6600
TRAVAIL A FAIRE :
Le Directeur de l’usine voudrait que l’indice en 2004 base 100 en 2003 soit 110. Combien doit-il faire
monter de bicyclettes en 2004 ? (avec preuves à l’appui).
La production annuelle moyenne de l’usine, calculée sur les 6 années de 1998 à 2003 est 5 717
bicyclettes.
Retrouver la production de 1998 et celle de 1999 sachant qu’en 1999, il a été monté 40 bicyclettes de
plus qu’en 1998. (On pourra désigner par x la production de 1998 et par y la production de 1999).

Sujet 2

Exercice 1 :
Monsieur Konan vend des marchandises sur les marchés de la région. Il vous communique les
statistiques de ses ventes sur les 200 derniers jours de l’année.
Nombre Nombre Les Amplitudes Effectifs ni xi Effectifs Effectifs
d’articles de jours valeurs corrigés cumulés cumulés
vendus ni centrales croissants décroissants
xi
[50 ; 250[ 8
[250; 450[ 14
[450; 650[ 30
[650; 750[ 62
[750; 850[ 48
[850; 1050[ 26
[1050 ;1250[ 12
Pour cette série statistique, préciser : la population, les individus, le caractère, et l’effectif total.
Reproduire et compléter le tableau ci-dessus.
Déterminer le mode.
Construire le diagramme des effectifs cumulé croissants.
Déterminer graphiquement les quartiles Q1, Me , Q3 et les interpréter chaque résultat.
Exercice 2 :
Un tonnage kilométrique d’une entreprise de transport réalisé par des camions de plus de cinq tonnes a
évolué comme suit :
Années 2001 2002 2003 2004 2005 2006 2007 2008
Rang des 1 2 3 4 5 6 7 8
années xi
Tonnage yi 58 60 62 65 68 70 72 74
Déterminer une équation de la droite d’ajustement par la méthode de MAYER.
Quel tonnage l’entreprise peut-elle espérer atteindre en 2009 ?
(On pourra utiliser le rang de l’année (1, 2, 3,….) pour effectuer les calculs).

Sujet 3

Exercice 1 :
Le tableau suivant donne l’évolution des frais de publicité xi (en millions de francs) et du chiffre
d’affaires yi (en millions de francs) de la société KOTOKO entre 2003 et 2010.
28
Années 2003 2004 2005 2006 2007 2008 2009 2010
Frais de 2 2,3 2,6 2,9 3,2 3,5 3,8 4,1
publicité xi
Chiffres 52 59 60 65 70 72 73 75
d’affaires yi
Construire le nuage de points représentant cette série statistique.
 abscisse : 2 cm  1 million
Echelle : 
ordonnée :1 cm  10 millions
NB : utiliser du papier millimétré.
Calculer les coordonnées des points G1 et G2 respectivement point moyen pour les quatre premiers
points et les quatre derniers points.
a) Déterminer une équation de la droite d’ajustement par la méthode de Mayer.
b) Tracer cette droite.
4. En cette année 2011, la société s’est fixée comme objectif un chiffre d’affaires
de 82 000 000 F CFA.
Calculer le montant des frais de publicité pour atteindre cet objectif.

Exercice 2 :
Le tableau ci-dessous donne pour 10 footballeurs d’une équipe de la place :
Le nombre d’années d’expériences (X),
L nombre de buts marqués par saison (Y).

Années d’expérience Xi 1 2 3 4 5 6 7 8 9 10
Nombre de buts marqués Yi 20 22 30 28 38 35 45 49 50 53

Représenter le nuage de points Mi (Xi,Yi) dans le plan muni d’un repère orthogonal.
2. Calculer les coordonnées du point moyen G, puis placer le sur le graphique.
3. Calculer le coefficient de corrélation linéaire.
4. a. Déterminer une équation de la droite d’ajustement linéaire par la méthode de MAYER.
b. En utilisant cette droite, prévoir le nombre de buts d’un joueur qui aura 12 années d’expériences.
Sujet 4

EXERCICE 1 :
Un sondage demandait à tous les visiteurs de donner leur âge sur un site internet. Les résultats de
l’enquête sont consignés dans le tableau ci-dessous :
Age Nombre de personnes
15 - 20 7
20 - 30 13
30 - 35 25
35 - 50 35
50 - 60 25
60 - 70 15

Déterminer le premier quartile Q1 et le troisième quartile Q3.


En déduire les bornes de l’intervalle interquartile et calculer son amplitude Iq.
a) Quel est le pourcentage de visiteurs situés dans l’intervalle
interquartile.
b) Déterminer le nombre de visiteurs de cet intervalle.
Déterminer la moyenne. On considère que la moyenne est 43 ans, calculer l’écart-type d’âge des
personnes ayant visité ce site.

29
EXERCICE 2 :
On donne dans le tableau ci-dessous l’ancienneté et les primes correspondantes de six cadres d’une
entreprise.
Ancienneté Xi 2 6 10 17 20 26
Prime Yi 1,1 2,8 3,3 3,8 4 4,8
(en millions de F)
Représenter graphiquement le nuage de points associé à cette série statistique et montrer que l’on peut
envisager un ajustement linéaire du nuage de points obtenus.
Echelle : 1 cm pour 2 ans en abscisse
cm pour 0,5 (en millions de F en ordonnées).
On fractionne le nuage en deux groupes : le groupe 1 de point moyen G1correspondant aux 3 premiers
couples et le groupe 2 de point moyen G2 correspondant aux 3 derniers couples.
Calculer les coordonnées des points moyens G1 et G2
Déterminer une équation de la droite (G1 G2).
a) En supposant que l’évolution est maintenue, déterminer la prime d’un cadre dont l’ancienneté est
30.
La prime d’un cadre s’élève à 6 000 000 F, quel est le nombre d’années (ou ancienneté)
correspondant ?

Sujet 5

EXERCICE 1 : ( 7 points )
Un technicien dans une entreprise est chargé de contrôler le diamètre des pièces fabriquées. Sur un
échantillon, il effectue les observations suivantes :
Diamètre (en Cm) 8,5-8,7 8,7-8,9 8,9-9,1 9,1-9,3 9,3-9,5 9,5-9,7 9,7-9,9
Nombre de pièces 20 10 30 50 40 20 30
1. Déterminer le mode.
2. Calculer à 10-2 près les paramètres de position suivants
a. la moyenne arithmétique
b. la médiane
c. les quartiles Q1 et Q3 puis les interpréter.
3. Calculer l’écart-type de cet échantillon avec quatre chiffres décimaux.

ERCICE 2 : ( 10 points )
Le tableau suivant donne l’évolution des frais de publicité xi et du chiffre d’affaires yi d’une
entreprise entre 2003 et 2010. xi et yi sont exprimés en millions de francs.
Années 2003 2004 2005 2006 2007 2008 2009 2010
xi 2 2,3 2,6 2,9 3,2 3,5 3,8 4,1

yi 52 59 60 65 70 72 73 75

Représenter graphiquement le nuage de points associé à cette série statistique ( xi en abscisse et yi en


ordonnée).
Echelle : 2 cm pour une unité (en millions de F) en abscisse.
2 cm pour 10 unités (en millions de F) en ordonnées. On placera 50 à l’origine

On fractionne le nuage en deux groupes : le groupe 1 de point moyen G1 correspondant aux 4 premiers
couples et le groupe 2 de point moyen G2 correspondant aux 4 derniers couples.
a) Calculer les coordonnées des points moyens G1 et G2
Déterminer une équation de la droite (G1 G2) et la construire sur le même graphique.
3) En supposant que l’évolution est maintenue entre 2003 et 2010, déterminer le
Chiffre d’affaires si les frais de publicité sont de 4 700 000 F CFA.

30

Vous aimerez peut-être aussi