Vous êtes sur la page 1sur 9

Résumé

2018
Statistique descriptive ;

Statistique inférentielle ;

Econométrie ;

Réalisé par

Fayssel Merraoui
Etudiant à la faculté des sciences juridiques,
économiques et sociales meknàs
Fayssel Merraoui – FSJES Meknès 

Introduction
Le présent document qui est à votre disposition contient un résumé qui

aide à la préparation de certains matières à savoir :

 La statistique descriptive ;
 La statistique inférentielle ;

 l’économétrie ;

il est destiné aux étudiants qui préparent au concours d’accès au cycle

de master: Actuariat et gestion des risques, ou aux autres concours qui

nécessitent la préparations des mêmes matières.

Ce document est préparé sur la base de plusieurs références (cours et

ouvrage) que je vais les annexer vers la fin du travaille pour les personnes qui

veulent développer leurs connaissance.

Au début, et avant de commencer, je présente une définition à chacune


des disciplines pour bien faire distinction entre elles.

Statistique descriptive : Un ensemble de méthodes permettant


de décrire et analyser les données d'une population par le biais des
individus qui la composent. l'analyse se fait sur la base des tableaux
statistiques, graphes et paramètres appropriés

Statistique mathématique ou inférentielle : qui s’intéresse


davantage à extrapoler des résultats issus d’échantillons en vue de
caractériser une population mère inconnue, de faire des prévisions de
comportements basées sur le calcul de probabilités.

Econométrie : C’est une discipline qui s’intéresse à l’explication des


grandeurs économiques et la vérification de l’existence des relations entre
les phénomènes économiques à l’aide de la statistique générale.
Fayssel Merraoui – FSJES Meknès 

A. Statistique descriptive :
1. Terminologie

ensemble des individus (ou unités


Population statistiques) présentant un caractère
commun.
élément de base constitutif de la
Unité statistique (ou individu)
population a laquelle il appartient.
sous-ensemble construit et
Echantillon
représentatif d'une population donnée.
caractéristique(s) de l'individu
Caractère(s)
intégrant la population étudiée.
valeur qualitative ou quantitative que
peut prendre le caractère
Modalité
précédemment défini.

2. Les paramètres de tendance centrale et de position (Une seule


variable)

On distingue trois mesures de tendance centrale :

Interprétation : (Prenant
l’exemple de salaire des
Paramètres Définition/formules
employés dans une
entreprise)

Le mode d'une série est la valeur ou la


Mo= 3000 ; le salaire le
modalité qui revient le plus
Mode : Mo plus fréquent est de 3000
fréquemment dans la série ou la
dhs
distribution.

Me= 3500 ; 50% des


La médiane d’une série est la valeur qui
employés on un salaires
partage cette série, préalablement
Médiane : Me inférieur à 3500 dhs et
classée, en
deux séries aux effectifs égaux. 50% on un salaire
supérieur à 3500 dhs.

C’est la somme des valeurs observées


rapportée au nombre d’observations.
 Moyenne simple 𝐱̄ = 𝟒𝟎𝟎𝟎 salaire
moyenne des employés
Moyenne
dans cette entreprise
s’élève à 4000 dhs.
 Moyenne pondérée
Fayssel Merraoui – FSJES Meknès 

Nb : La comparaison de la moyenne arithmétique, de la médiane et du mode permet


de caractériser la forme d’une distribution. 3 cas sont possibles :
 Distribution parfaitement symétrique : Moyenne = Médiane = Mode
 Distribution étalée vers la droite : Moyenne > Médiane > Mode
 Distribution étalée vers la gauche : Moyenne < Médiane < Mode.

La forme distribution peut être déterminer aussi par le calcule de coefficient S de


𝐱̄ −𝐌𝐨
Pearson S= 𝛔
L’interprétation de la valeur du S de Pearson se fait comme
suit :
 Si S = 0, la distribution est symétrique.
 Si S > 0, la distribution est étalée à droite.
 Si S < 0, la distribution est étalée à gauche.

Les quantiles : Sont des indicateurs de position attachés à une variable aléatoire
réelle. Concrètement le quantile d’ordre p est la valeur qui partage la série des
valeurs en deux parties de fractions p et 1 – p de l’effectif total.

Quantiles Définitions Interprétation


Les quartiles partagent la population ou Q1 est le quantile d’ordre 0,25 : au
l’échantillon en quatre groupes moins 25 % des observations sont
Les quartiles comprenant chacun 25 % des inférieures ou égales à Q1 et au
observations. moins 75 % supérieures ou égales
Q1, Q2 et Q3. à Q1.
Les déciles partagent la population ou D2 est le quantile d’ordre 0,20 :
l’échantillon en dix groupes comprenant au moins 20 % des observations
sont inférieures ou
Les déciles chacun 10 %
égales à D2 et au moins 80 % des
des observations.
observations sont supérieures ou
D1, D2, …, D9. égales à D2.
C99 est le quantile d’ordre 0,99 :
Les centiles partagent la population ou
au moins 99 % des observations
l’échantillon en cent groupes
sont inférieures ou
Les centiles comprenant chacun 1 %
égales à C99 et au moins 1% des
des observations.
observations sont supérieures ou
C1, C2, …, C99.
égales à C99.
Fayssel Merraoui – FSJES Meknès 

3. Les paramètres de dispersion (Une seule variable)

Paramètres Définition/formules Interprétation :

Intervalle de Plus l’étendue est large, plus la


E = valeur maximale – distribution est dispersée.
variation (ou «
Valeur minimale
étendue »)

c'est a dire la différence


L'intervalle interquartile contient
Intervalle entre le troisième quartile
(Q3) et le premier quartile toujours 50 % de la distribution. Plus il
interquartile
(Q1). est large, plus la distribution est
dispersée.
IQ=Q3−Q1
C’est la moyenne des
valeurs absolues des écarts
Écart absolu de chaque observation par Plus l’EAM est élevé, plus la dispersion
moyen rapport à la moyenne élevée. Plus qu’il est faible, plus la
distribution est moins dispersée.

Plus la variance est élevée, plus la


C’est la moyenne des carrés dispersion élevée. Mais comme les
des écarts à la moyenne écarts à la moyenne ont été élevés au
La variance carré, le chiffre obtenu est généralement
assez élevé,
pour ça on utilise l’écart type.


 Si l’écart-type est faible, cela
C’est la racine carrée de la
signifie que les valeurs sont assez
variance
concentrées autour de la moyenne.
L’écart-type  Si l’écart-type est élevé, cela veut
dire au contraire que les valeurs sont
plus dispersées autour de la moyenne.

C’est une mesure de dispersion des


C’est l’écart-type divisé par observations d'une variable qui permet
la moyenne de s'affranchir de la notion d'unité et de
Le coefficient
comparer la dispersion de différentes
de variation
distributions. Plus grand est le
coefficient de variation, plus grande est
la dispersion.
Fayssel Merraoui – FSJES Meknès 

4. Caractéristiques de concentration
Paramètres Définition/formules Interprétation :
C'est la valeur du caractère qui
partage l'effectif cumulé des
ni.xi
en deux parties égales. Elle la valeur du caractère qui
Médiale sert à déterminer la partage en deux parties
concentration de la égales la masse totale du
distribution par comparaison caractère.
avec la médiane et avec
l’étendue.

la différence entre la Plus cet écart est important


médiale et la médiane ∆𝑴 = 𝑴é𝒅𝒊𝒂𝒍𝒆 − 𝑴é𝒅𝒊𝒂𝒏𝒆 par rapport à l’étendue de la
série, plus la concentration
∆𝑴
est forte.

Forte concentration

En abscisse, figurent les


La courbe de fréquences relatives cumulées
LORENZ de la variable et en ordonnée Faible concentration
figurent les ni.xi cumulés

- Si G = 0, la concentration
est nulle.
noté G, égal au double de l'
aire de concentration. - Si G est proche de 0, la
L‘indice de GINI
concentration est faible .
Indice de GINI = 2 aires de
concentration - Si G est proche de 1, la
concentration est forte.
Fayssel Merraoui – FSJES Meknès 

5. Tableaux de contingence (Deux variables)

6. Les caractères d’une série statistique à deux dimensions

Caractères marginaux

Pour X Pour Y

La moyenne marginale

La variance marginale

L’ecart-type marginale

Caractères conditionnels

Pour X Pour Y

Les moyennes
conditionnelles

Les variances conditionnelles

Les écarts-type conditionnels σ(Xj) = √𝑉(𝑋𝑗) σ(Yi) = √𝑉(𝑌𝑖)


Fayssel Merraoui – FSJES Meknès 

Nb : Les moyennes conditionnelles et marginales sont liées par la relation suivante


: la moyenne des moyennes conditionnelles de X est égale à la moyenne marginale
de X.
7. Liens entre deux variables

A ce titre on peut distinguer trois types de liens entre deux variables :

 L’indépendance : lorsque les deux variables ne présentent aucun lien


entre elle c'est-à-dire la variation d' une variable ne s'accompagne pas de la
variation de l' autre variable.
 La liaison fonctionnelle : Un caractère X est lié fonctionnellement au
caractère Y si à chaque modalité de Y correspond à une seule modalité de X. Si
cette relation est réciproque on dit que les deux variables sont totalement
dépendantes.
 La corrélation : Dans la plupart des études pratiques qui concernent les
phénomènes économiques on trouve que les variables ne sont pas indépendantes,
mais ne sont pas non plus parfaitement dépendantes. On parle alors de la
corrélation1 qui peut être soit positive (Une variation dans le même sens) ou
négative (Une variation dans le sens inverse). La détermination de la nature de la
relation et la mesure de son degré se fait par le calcule, respectivement, de la
covariance et le coefficient de corrélation. De même, la relation entre deux
variables peut être analysée à travers l’étude de la régression dont l’objectif est
d’expliquer une variable par une autre variable (la régression simple) ou par
plusieurs autres variables (la régression multiple). L’analyse de régression constitue
aussi l’une des méthodes les plus utilisées en économétrie qu’on va voir par la suite
sur ce document.
Le tableau ci-dessous regroupe les éléments en relation avec la corrélation
entre deux variables :

1 L’existence d’une relation entre les deux variables ne signifie pas qu’il existe un lien de causalité entre
elles c’est à dire, il ne permet pas de déterminer si x cause y ou si y cause x. en d’autre terme, la corrélation
n’implique pas la causalité,
Fayssel Merraoui – FSJES Meknès 

Paramètres Formules Utilités/Interprétation

Simple
Cet indicateur permet de déterminer le sens
de variation d’une variable par rapport à une
autre
 Une covariance positive indique que
La covariance les caractères X et Y varient globalement
Pondérée dans le même sens.
 Une covariance négative indique que
les caractères X et Y varient globalement en
sens contraires.

Ce coefficient permet de
quantifier la corrélation entre  Si r est nul, les variables x et y ne sont
deux variable, il varie entre -1 et pas liées linéairement entre elles.
Le coefficient  Si r est proche de 1, les variables x et y
de corrélation2 +1
évoluent fortement dans le même sens.
 Si r est proche de -1 les variables x et y
évoluent en sens contraire;

Les paramètre a et b de la droite de régression


Elle sert à :
 vérifier l’existence d’une sont estimés par la méthodes MCO 3 :
relation linéaire et la nature de
La droite de celle-ci .
régression  Faire des prévisions .
L'équation de cette droite s’écrit : Si le coefficient a est positif cela signifie que
x et y varient dans le même sens. Au
contraire s’il est négatif les deux variables
varies dans le sens inverse.

Cet indice est compris entre 0 et 1 et mesure


C’est tout simplement le la qualité de l’ajustement de la droite de
coefficient de corrélation au carré
régression aux points du nuage.
Coefficient de
Plus le coefficient R² tend vers 1, plus la
détermination
qualité globale de la régression, est bonne.
Ce coefficient peut être calculé par une autre
formule qui est le rapport entre la variance
expliquée et la variance totale 4.

2 Le coefficient de corrélation n’est valable que dans le cas de deux variables mesurables (quantitatives)
3 La méthode des moindres carrés ordinaires qui permet de minimiser la somme du carré des écarts entre
cette droite et les observations.
𝑽𝒂𝒓𝒊𝒂𝒏𝒄𝒆 𝒆𝒙𝒑𝒍𝒊𝒒𝒖é𝒆 𝑽𝒂𝒓𝒊𝒂𝒏𝒄𝒆 𝒓é𝒔𝒊𝒅𝒖𝒆𝒍𝒍𝒆
4 𝑹² = = 𝟏 − 𝑽𝒂𝒓𝒊𝒂𝒏𝒄𝒆 𝒕𝒐𝒕𝒂𝒍𝒆 Avec Variance totale = Variance expliquée + Variance
𝒗𝒂𝒓𝒊𝒂𝒏𝒄𝒆 𝒕𝒐𝒕𝒂𝒍𝒆
résiduelle. (On aura l’occasion de revoir cette formule au niveau de la méthodes ANOVA en économétrie).

Vous aimerez peut-être aussi