Vous êtes sur la page 1sur 17

Les statistiques appliquées à l’Economie

et à la Gestion

Chapitre 1 : Rappel de statistiques descriptives


Chapitre 2 : Régression linéaire simple
Chapitre 3 : Régression linéaire multiple

Pr. Abid Ihadiyan


1
Références bibliographiques

1- Giard, Statistique appliquée à la Gestion, Ed. Economica, 2003.

2- Anderson, Sweeney et Williams, Statistiques pour l’Économie et la


Gestion, Ed. De Boeck, 2007.

2
Plan du 1er chapitre

1. Les caractéristiques de tendance centrale


Mode, Moyennes, Quantiles

2. Les caractéristiques de dispersion (ou de variabilité)


Étendue, Écart interquartile, Variance, Moments d’ordre r

3. Les caractéristiques de forme


Mesure de l’asymétrie, Mesure de l’aplatissement

3
1. Les caractéristiques de la tendance centrale
1.1 Le Mode
Valeur(s) observée(s) de fréquence maximale : distribution discrète
Classe modale, classe de fréquence maximale : distribution continue

distribution unimodale si elle admet un mode unique


distribution bimodale si elle admet deux modes
distribution plurimodale si elle admet plusieurs modes

a- Exemple avec variable discrète:

Le mode (Mo) de cette distribution est le département 75.

4
1. Les caractéristiques de la tendance centrale

b- Exemple avec variable continue

i- Classes de même amplitude

La classe modale est la C4

ii- Classes d’amplitudes différentes

La classe C3 a la plus grande densité de fréquence


5
1. Les caractéristiques de la tendance centrale
1.2 Les moyennes
1.2.1 La moyenne arithmétique ou moyenne d’ordre 1
La moyenne d’une série de données x 1,..,xi,.xn est la somme de ces valeurs,

divisées par le nombre n d’observations :

Dans le cas de valeurs xi répétées ni fois :

Remarque : pour une distribution continue, on remplace les x i par les centres des classes ci

Propriétés :

1-
2- Si a et b sont des constantes telles que pour tout x i on a : yi = axi + b, alors :
est minimale en a = moyenne des xI
3- La fonction

6
1. Les caractéristiques de la tendance centrale

1.2.2 La moyenne d’ordre r


La moyenne quadratique ou d’ordre 2 d’une série de données x 1,... xi,…xn est la
racine des moyennes des carrés:

Plus généralement la moyenne d’ordre (r) est définie par:

7
1. Les caractéristiques de tendance centrale
1.3 Les quantiles
1.3.1 La médiane
C’est la valeur de la variable qui se situe au centre de la série statistique
classée par ordre croissant; elle sépare la distribution en deux groupes
de même effectif.

On note x(1),… x(i),… x(n) la série de valeur ordonnée par ordre croissant,

- si n est impair la médiane est : Mé = x((n+1)/2)

- si n est pair : [x(n/2), x(n/2+1)] est un intervalle médian;


la médiane peut être calculée par : Mé = (x(n/2)+ x(n/2+1)) / 2

8
1. Les caractéristiques de la tendance centrale

1.3.2 Généralisation aux quantiles

Quelques quantiles particuliers:


1- Les pourcentiles: {0,01; 0,02;…; 0,99} partagent la série en 100 parties
égales.
2- Les déciles: {0,1; 0,2;…; 0,9} partagent la série en 10 parties identiques.
3- Les quartiles: {0,25; 0,50; 0,75} partagent la série en 4 parties identiques.

Étapes de calcul :
1- classer les données en ordre croissant
2- calculer un index i : i = p n (avec p : valeurs ci-dessus et n : taille de la série)
3- si i n’est pas un nombre entier, l’arrondir. La position du quantile correspondra à l’entier
supérieur à i.
si i est entier, la position du quartile correspondra à la moyenne des valeurs des
observations i et i+1.

9
2. Caractéristiques de dispersion ou variabilité

Les paramètres de dispersion renseignent sur l’étalement de la distribution d’une variable.


Les plus utilisés sont l’écart interquartiles, la variance et l’écart-type.

2.1 L’étendue
Différence entre les valeurs extrêmes de la distribution
Paramètre noté e, peu utilisé :
e = maximum - minimum = x(n) - x(1)

2.2 L’écart interquartile


Différence entre le premier et le troisième quartile.
Cet intervalle englobe la moitié des observations situées au centre de la distribution.
I = Q3 - Q1

2.3 La variance
Moyenne des carrés des écarts des valeurs à leur moyenne:

10
2. Caractéristiques de dispersion ou variabilité
2.3.1 L’écart-type

• Il est également appelé écart quadratique moyen ou déviation standard.

• Il s’exprime dans la même unité que la variable et donne une idée plus précise de la
fluctuation autour de la moyenne.

• Il correspond à la racine carré de la variance


On le note :

11
2. Caractéristiques de dispersion ou variabilité

2.4 Les moments d’ordre r

• Le moment d’ordre 2 est la Variance.

• Le moment d’ordre 3 est le Skewness.

• Le moment d’ordre 4 est le kurtosis.

De manière générale on définit le moment d’ordre r comme suit:

12
2. Caractéristiques de dispersion ou variabilité

2.5 Autres caractéristiques de dispersion


2.5.1 L’écart absolu par rapport à la moyenne arithmétique :

2.5.2 Ecart absolu par rapport à la médiane :

2.5.3 Intervalle interdécile : ID = D9 - D1

2.5.4 Coefficient de variation


C’est le rapport entre l’écart type et la moyenne, il permet de comparer le taux de dispersion entre
différentes distributions, car il est sans unité.

Remarque:
L’étendue, l’intervalle interquartile, l’écart absolu et l’écart type sont des paramètres de dispersion absolue
qui mesurent la dispersion absolue des données. Ils s’expriment dans la même unité de mesure que la
variable.

13
3. Caractéristiques de forme

3.1 l’asymétrie
Les courbes suivantes donnent une idée sur la forme d’une distribution de données :

14
3. Caractéristiques de forme

3.1 Mesure de l’asymétrie


Certains coefficients (indices) permettent de situer la distribution dans un des trois cas
précédents:
3.1.1 Coefficient de Yule :

3.1.2 Coefficient de Pearson:

3.1.3 Skewnes: si négatif implique distribution importante à gauche


si positif implique distribution importante à droite
si égale à 0 implique distribution normale

15
3. Caractéristiques de forme

3.2 l’aplatissement

L’aplatissement d’une distribution de données est définie en fonction de la distribution de la loi normale.
Trois types d’aplatissement sont définis:
° Courbe normale (mésokurtique) : la série de données est issue d’une distribution suivant la loi normale
(cas A).
° Courbe concentrée (leptokurtique) : la courbe est moins aplatie que la distribution normale (cas B).
°Courbe aplatie (platykurtique) : une variation forte de la variable étudiée ne s’accompagne pas de forte
variation de fréquence, par rapport à la loi normale (cas C).

16
3. Caractéristiques de forme

3.2 Mesure de l’aplatissement

La mesure de l’aplatissement peut s’effectuer par l’intermédiaire du Kurtosis (voir formule


précédemment).

17