Vous êtes sur la page 1sur 33

Chapitre 1: Définitions de concepts statistiques

Après avoir compris pourquoi les statistiques sont appréciées en Economie, il faut
comprendre comment elles sont menées.

1.1/ La collecte de l’information statistique

La collecte ou élaboration de données statistiques porte le nom d’enquête.

L’ensemble des unités observées porte le nom de Population


Exemple de population:

• Etude portant sur les pays ayant obtenus des médailles aux JO de Sydney:
Population = les pays concernés
• Etude portant sur les pays faisant de l’exportation de bananes
Population: pays exportateurs de bananes
• Etude portant sur les firmes (dont on ne connaît pas l’origine) faisant de
l’exportation de bananes
Population: firmes exportatrices de bananes
Plusieurs méthodes d’enquêtes:

1.1.1/ Le recensement:

Définition: Enquête exhaustive auprès de toutes les unités de la population statistique


que l’on étudie. L’enquête reporte des données sur les caractéristiques de ces unités
étudiées.
Exemple: Recensement Général de la Population (INSEE) auprès des ménages
français.

Population étudiée: dépend de la question posée.

• Si on veut étudier la population des recensés:

Unité=chaque résident observé dans chaque ménage, dans chaque commune, dans
chaque région en France

Caractéristiques: son âge, sexe, CSP, son adresse, nb. de pièces du logement occupé,
actif ou non, chômeur ou non, nombre d’années d’études, nb. d’années d’expérience
professionnel, etc…
Si on veut se cantonner à la Population des ménages:

Unité= chaque ménage observé dans chaque commune, dans chaque région en France
Caractéristiques observées: Revenu total du ménage, salaire de la personne de
référence dans le ménage, nombre d’enfants dans le ménage, nombre d’actifs dans le
ménage, etc…

Si on veut étudier la Population des communes :


Unité= chaque commune observée dans chaque région en France
Caractéristiques: taux d’actifs, taux de chômage, nombre de personnes en cours
d’études, nombre de ménages sans enfants, etc…
Recensement à ne pas confondre avec Dénombrement: comptage des unités dans un
cadre de référence.

Dans les exemples ci dessus:

Dénombrement dans un ménage=nombre de résidents dans le ménage


Dénombrement des ménages, sans enfants par région: leur nombre par région
Etc…
1.1.2/ Les sondages

Définition: enquêtes partielles menées sur un échantillon représentatif d’une


population exhaustive. Souvent les sondages sont préférés aux recensement car leur
coût est inférieur.
La qualité de l’enquête dépendra du choix de l’échantillon.

Comment définir un bon échantillon?

Il y a plusieurs méthodes pour sélectionner un échantillon.


Règle d’or: L’échantillon est choisi de façon aléatoire, c-à-d chaque unité de la
population statistique étudiée doit avoir la même chance d’être choisie pour faire
partie de l’échantillon.
Exemple connu : L’Élection présidentielle Américaine de 1936

Sondage de la Revue «Literacy Digest» à partir des immatriculations de


voitures et des listes des bottins téléphoniques.
Elle a reçu 2,3 milllions de réponses.
Ses prédictions :
le candidat Landon (Républicain) : 55% des voix
le candidat Roosevelt (Démocrate) : 41% des voix
Même moment: Maison Gallup prélève un échantillon «aléatoire» de 6 500
personnes et obtient comme prédictions :
Landon : 35%
et Roosevelt : 64%.

Les résultats définitifs de l'élection : Landon 37% et Roosevelt 61%.


Pourquoi revue “Literacy Digest” s’est-elle trompée?

Son échantillon, bien que très large, était biaisé: tout le monde n’avait pas
une voiture et un téléphone en 1936! (si on suit la définition d’un bon
échantillon: chaque élément de la population des votants n’avait pas la même
chance d’être concerté)

Quel sont les procédés à entreprendre pour sélectionner un échantillon aléatoire?


Plusieurs méthodes de prélèvement: en possédant la liste complète des individus
étudiés (toute la population), on utilise des tables au hasard, on procède à des tirages
répétés, des tirages en grappe, à plusieurs degrés, etc…
(RDV en deuxième et/ou troisième année).
1.2/ La variable en statistiques

Un sondage ou un recensement implique une étude sur une population donnée.


Il s’agit de recueillir des informations (caractéristiques) sur cette population puis
synthétiser sous forme de tableaux.
Définition de la variable: Une variable est une caractéristique que l’on étudie.

Exemple: Etude sur le recensement général de l’insee

individu code postal (var 1) Age Sexe Salaire fixe Prime


i1 35000 19 1 2000 [200-300]
i2 75000 42 2 3000 [50-100]
Sexe: 1=féminin; 2=masculin
Dans cet exemple: 1 identifiant (individu) et
5 variables: 2 qualitatives (code, sexe) et 3 quantitatives ( Age, Salaire et Prime)
1.2.1/ La variable qualitative (la variable caractère)

Définition: Décrit l’individu étudié.

Ses éléments sont des modalités:


Sexe=2 modalités, féminin (1) ou masculin (2);
Code postal=(plusieurs modalités, tous les codes postaux de France)

Autre exemples: couleur des yeux, type de voiture (Berline, 4x, etc…)
1.2.2/ La variable quantitative

Définition: La variable est dite quantitative quand les modalités (appelés aussi
observations) sont mesurables. Chaque individu est repéré par un nombre.

Sous deux formes: variable discrète et variable continue.

1.2.2.1/ Variables Discrètes

Définition: Une variable est discrète quand elle est mesurée par une valeur bien
définie

Exemples: var. micro: Age, salaire, Nb. de voitures, Nombre d’enfants,


Var macro: PIB, Exportations, etc…;
1.2.2.2/ Variables continues

Définition: Une variable est dite continue quand les observations qui la définissent
prennent des valeurs infinies sur un intervalle bien défini.

Exemple précédent: La Prime est une variable continue

Individu 1 gagne entre 200 et 300 euros de Primes


Individu 2 gagne entre 50 et 100 euros

Bien qu’on connaisse l’intervalle dans lequel se situe la prime, on ne connaît pas le
montant exact de la prime.
Les différentes formes de l’intervalle: L’intervalle peut être fermé, ouvert ou semi-
ouvert

Prime Type d'Intervalle Définition


l'individu concerné gagne
[100-200] Fermé de 100 à 200 euros inclus
l'individu concerné gagne
un salaire allant de plus
de 100 à moins de 200
]100-200[ Ouvert euros
l'individu concerné gagne
un salaire allant de 100 à
[100-200[ Semi-ouvert à droite moins de 200 euros
1.3/ Les pourcentages et leurs applications

Définition: C’est une division par cent des valeurs observés.


Les pourcentages en soi, ne veulent rien dire mais sont des outils pratiques pour
comprendre certains chiffres. En particulier; les pourcentages sont utiles pour:

• 1. Rendre des proportions plus compréhensibles (plus esthétiques). Quick vend


5.000.000 de Giants sur un marché 100.000.000 de burgers vendus. La part de
marché de quick concernant le Giant sur le marché des Burgers est de
5.000 .000
100 .000 .000 =0.05 (Chiffre pas beau)

Alternativment, on peut dire que pour chaque 100 burgers vendus, 5 burgers sont des
Giants (compréhensible mais très long)

Ou aussi, la part de marché du Giant est de 5% (plus joli, plus carré)


• 2. Décrire des évolutions dans le temps. Depuis que le Quick-n-Toast est arrivé sur
le marché, la part de marché des Giants a chuté de 0.01 (Pas beau comme chiffre)

Donc nouvelle part de marché des Giants=0.04


En terme absolue, réduction du nombre de Giants de 0.05-0.04=0.01
En terme relatif (par rapport à la valeur initiale), la réduction est de:
(0.05-0.04)/0.05=0.01/0.05=1/5

Mais 1/5=20/100=20%
Donc, la sortie des Quick-N-Toast a été responsable d’une chute de la part de marché
des Giants de 20%.
1.4/ Règle Générale de calcul des taux de croissance

Soit V valeur observée à la date du départ (date 0)


0

V valeur observée à la date d’arrivée (date t )


t

Croissance (absolue, entre date 0 et t)=V −V


t 0

V −V Vt Val .d ' Arrivée


Croissance (relative)= Taux de croissance= V t

0
0
=
V0
−1= Val .Départ =g
−1

Si g >0 donc acroissement de la valeur V


Si g<0 donc baisse de la valeur V
1.5/ Le multiplicateur

A la date t, la valeur V aura augmenté (ou diminué) par rapport à sa valeur initiale:

Donc: V = V + ε (1)
t 0

ε = croissance absolue (V −V ) avec ε négatif ou positif. Mais ε peut être définie


t 0

comme une fraction d’une valeur plus large


Posons: ε = a.V (2) 0

Avec a<1
Donc (1) devient (1’):

(3)
Vt = V0 + a.V0 = (1 + a )V0

Donc de manière équivalente, on peut dire qu’à la date t, la nouvelle valeur de V (V ) a1

une valeur plus grande (ou plus petite) que V d’une proportion égale à 1 + a
0

V V
(3) donne: V =1 + a et donc a = V −1 = g = Taux de croissance
t

0
t

0
Ainsi, quand la valeur de V n’est pas connue à la date t,
mais qu’on observe la valeur initiale V0

et le taux de croissance g entre les deux dates

alors on peut trouver: V par la formule: V


t t = (1 + g )V0

(1+g) est alors appelé le multiplicateur: grandeur par laquelle on multiplie la valeur
initiale pour trouver la valeur finale.
Exemple :

L’OCDE fournit des données sur le PIB des pays riches en 1990. Il fournit aussi le
taux de croissance entre 1990 et 2003. Peut-on retrouver la valeur de leur PIB en
2003 ?

Réponse : Oui.
Pour chaque pays, le PIB est représenté par Y. Le taux de croissance entre 1990
et 2003 est donné. Il vaut g.

Comme le multiplicateur vaut alors 1+g on peut trouver le PIB en 2003:


Y2003 = (1 + g )Y1990

Pour la France :
Y1990=1.000 Milliards d’euros
g=15%
Y2003=(1+0.15).1.000=1500 Milliards
1.6/ Les évolutions successives

Soit une valeur V à la date 0,


0

A la date 1, elle augmente de 50%


A la date 2, elle augmente de 20%

D’où :

À la date 1 on a : V 1 = (1 + 0.5)V0 (a)


À la date 2 on a : V 2 = (1 + 0.2)V1 (b)

En remplaçant (a) dans (b) on a : V 2 = (1 + 0.2)(1 + 0.5)V0

Résultat important : On peut trouver la valeur de V à la date 2, en multipliant la valeur


2

à la date 0 (V ), par le nouveau multiplicateur composite: (1+0.2)(1+0.5), sans


0

connaître la valeur à la date 1.


Plus généralement,
Soit une valeur V à la date i i

On connaît tous les taux de croissance annuels entre la date i et la date i+n
Problème : On veut savoir quelle est devenue cette valeur à la date (i+n)

Formule : V i +n = (1 + g i +1 )(1 + g i +2 )...( 1 + g i +n ).Vi

Démonstration :
Vi +n = (1 + g i +n )Vi +( n −1)
Vi +( n −1) = (1 + g i +( n −1) )Vi +( n −2 )


Vi +2 = (1 + g i +2 )Vi +1
Vi +1 = (1 + g i +1 )Vi

En remplaçant en cascade les valeurs de V par leur expressions, on peut trouver :


V = (1 + g )(1 + g )...( 1 + g ).V (c.q.f.d)
i +n i +1 i +2 i +n i
Exemple :

Le PIB de la France est de 1.5 Mille Milliards d’euros en 2003. En quelle année, le
PIB de la France double de valeur sachant que le taux de croissance moyen annuel de
son PIB est de 2 % ?

Réponse :

Soit Y = 1.5 ,
2003

Aussi on nous donne un taux de croissance de 2% annuellement.


On nous demande de trouver l’année t à laquelle Y = 2.Y
t 2003
D’abord, d’après la formule des évolutions successives :
Valeur finale est représentée par la valeur initiale multipliée par le multiplicateur
composite. Ainsi,
Y = (1 + g
2003 +t )(1 + g )...( 1 + g ).Y
2004 2005 (a) t 2003

Aussi on sait que : g = g = g = ...g = 0.02


2004 2005 2006 t

D’où (a) devient :


Y2003 +t = (1 + 0.02 )(1 + 0.02 )...( 1 + 0.02 ).Y2003
= (1 + 0.02 ) t Y2003 (b)
Or on nous donne une autre information aussi : à la date t, Y = 2.Y (c)
t 2003

log 2
D’après (b) et (c) : on a alors (1 + 0.02 ) = 2 d’où en transformant en log on a: t = log 1.02 ≈ 35
t

ans. Ainsi, dans 35 ans à partir de 2003, c-à-d en 2038, le PIB de la France aura
doublé. (i.e : log X c’est le ln en base 10 c.a.d Log(X)=ln(X)/Ln(10))
1.7/ Multiplicateurs appliquées aux grandeurs liées

Si une grandeur à la date t (V ) est le produit d’un multiplicateur et de la valeur


t

observée à la date 0 (V ) : 0

Vt = (1 + g )V0
alors on peut trouver deux expressions qui lui sont corollaires :

1.7.1/ La multiplication entre deux grandeurs

Soit deux grandeurs à la date t:


1/ V = (1 + g )V et
t v 0

2/ U = (1 + g )U
t u 0

La grandeur qui représente leur produit sera alors égale à :

Wt = Vt .U t = (1 + g v )(1 + g u )W0 et son taux de croissance g w = (1 + g v )(1 + g u ) − 1

1.7.2/ La division entre deux grandeurs


Soit deux grandeurs à la date t:
1/ V = (1 + g )V et
t v 0

2/ U = (1 + g )U
t u 0

La grandeur qui représente leur division sera alors égale à :


Vt (1 + g v ) (1 + g v )
Wt = = et son taux de croissance g = (1 + g ) −1
U t (1 + g u )
W0 w
u

Exemple : Si salaires augmentent de 50 % et les prix augmentent de 60%, quel est


alors l’évolution du pouvoir d’achat (PA)?

Réponse : PA=Salaire/Prix. En appliquant la formule ci dessus :


1 + 0.5
g =
PA −1 =-0.0625 ou -6.25%
1 + 0.6
1.8/ Taux de croissance moyen

Si on observe deux valeurs d’une grandeur à deux dates différentes (et espacées de
plusieurs années) alors on peut trouver le taux de croissance globale (entre ces deux
dates) mais encore le taux de croissance annuel moyen au cours des années entre ces
deux dates.

On sait que : entre une date 1 et une date t le taux de croissance est :
Vt
g= −1
V0

c’est ce qu’on peut appeler aussi taux de croissance global entre deux dates.
Le taux de croissance annuel moyen est un taux annuel de croissance constant sur la
période entre la date 0 et la date t. Il est calculé par :
1/ t
V 
g =  t 
 V0 
−1 avec t= nombre d’années sur la période entre date 0 et date t
Démonstration : Un taux moyen annuel g est un taux constant sur la période considérée
( g = g1 = g 2 = ... = gt ).
V1 = (1 + g )V0
V2 = (1 + g )V1


Vt = (1 + g )Vt −1 (a)
1/ t
V 
Ainsi en remplaçant dans (a) nous obtenons : V t = (1 + g ) V0
t
et donc g =  t 
 V0 
−1
Exemple :

Les ventes annuelles d’un ouvrage en librairie ont augmenté successivement de 2%,
20% et 28% en 3 ans. Quel est le taux d’accroissement : 1/ global : 2/ moyen
annuel ?

Taux d’accroissement global :

Faux : 2+20+28=50%
V
Vrai : V = (1.02 )(1.20 )(1.28 )V et donc : g=V −1 = (1.02 )(1.20 )(1.28 ) −1=0.566 ou 56.6% >50%
3 0
3

Taux d’accroissement annuel moyen :


Faux : (2+20+28)/3=50/3=16,66%
1/ 3
V 
Vrai : Utiliser la formule Tx. g moyen annuel : g =  t 
 V0 
−1 =16.14%

1.9/ Les opérateurs de « Somme » et de « Produit »


1.9.1/ L’opérateur « Somme »
n
Définition : L’opérateur ∑
i =1
xi représente une somme des valeurs d’une variable x allant

des observations 1 à n.
n
Ainsi, ∑
i =1
xi = x + x + .... + x
1 2 n −1 + xn

Propriétés (Démonstrations : ‘au tableau’)


n n

• Scalaire : ∑
i =1
ax i =a ∑xi
i =1
n

• Cas particulier : pour xi = xi ' = 1 ,∑ +


a =a a +
...a
=n.a
i =1 n fois
n n n n

• Décomposition des sommes : Si xi = y i + z i alors ∑xi = ∑ ( yi + zi ) = ∑ yi + ∑zi


i =1 i =1 i =1 i =1

Exemples d’applications :
n n
-∑
i =1
( xi + a ) = ∑xi +n.a
i =1
n n
- ∑ ( xi + a) 2 = ∑ xi2 + n.a 2
i =1 i =1
+2a ∑xi
n n n
-∑
i =1
( xi + y ) = ∑ x + ∑ yi2 +2 ∑ xi yi
2

i =1
2
i
i =1
1.9.1/ L’opérateur « Produit »
n

Définition : L’opérateur ∏ xi représente le produit (multiplication) des valeurs de x


i =1

allant des observations 1 à n.


n

Ainsi, i =1 xi = x .x ..... x .x
1 2 n −1 n

Propriétés :
n n

• Scalaire : ∏ ∏ xi
n
ax i = a
i =1 i =1
n n n

• Décomoposition : ∏ xi yi = ∏xi
i =1 i =1
∏ yi
i =1
Exemples d’applications

- Pour simplifier la manipulation des fonctions ‘produits’, les produits peuvent


être transformés en sommes en passant par la fonction logarithme
n
Exemple : Soit la fonction ∏
i =1
xi
n n
Ainsi, log( ∏xi )=log ( x1 .x2 .... xn )= log x1 + log x2 + .... + log xn = ∑ log xi
i =1 i =1

Corollaire : Soit ∏x m i , en passant par le log on a :


i =1
n n
log( ∏x mi )=log
i =1
( x m .x m .... x m )=m ∑ log xi
1 2 n
i =1

Vous aimerez peut-être aussi