Vous êtes sur la page 1sur 7

Page 1 sur 7

Cours de statistique descriptive


Introduction à l’analyse statistique : méthode et principes

V. TERRAZA
Université de Luxembourg

Rappel :
 Cette note de cours vient en complément des éléments indiqués dans l’ouvrage de référence et
illustrera les définitions et concepts à travers des exemples supplémentaires.
 Il s’agit ici d’un script qui pourrait vous aider à comprendre et surtout à faire les exercices
aisément. L’important est de réaliser les exercices afin de bien fixer les notions abordées.
 Je reste à votre disposition pour des questions via moodle.

Bibliographie : Analyse statistique pour la gestion bancaire et financière.


Applications avec R- V.TERRAZA et C.TOQUE editions de boeck- 2013

Dans cet ouvrage, vous trouverez toutes les notions de votre cours ainsi que des applications
financières concrètes. Les résultats empiriques sont calculés d’une part avec la calculatrice et d’autre
part en utilisant le logiciel R. Les données utilisées proviennent de la base Bankscope, qui regroupe un
certain nombre de caractéristiques des banques du monde entier. Cette base est devenue Orbis Bank
Focus depuis 2017.
L’ouvrage se décompose en quatre chapitres. Ce semestre nous aborderons les deux premiers
chapitres :
- Chapitre 1 : Introduction à l’analyse statistique : méthode et principes
- Chapitre 2 : Caractéristiques d’une distribution statistique
- Chapitre 3 : Les distributions statistiques à deux dimensions
- Chapitre 4 : L’analyse de la régression
1
Page 2 sur 7

Autres Références : Bernard PY : Statistique Descriptive chez Economica (ouvrage de cours et
ouvrage d’exercices )

Présentation du cours
Chapitre 1 : dans un premier chapitre, nous présenterons ce qu’est une analyse statistique au travers
de notions fondamentales (population, variable, modalités d’une variable…). Nous verrons comment
construire le tableau statistique et représenter graphiquement l’information contenue dans ce tableau.
Nous évoquerons également la notion d’indices simple et de taux d’évolution dans l’interprétation de
certains résultats.

Chapitre 2 : dans un second chapitre, nous traiterons des caractéristiques d’une distribution
statistique. Nous distinguerons les caractéristiques de valeur centrale (comme la moyenne), des
caractéristiques de dispersion (comme l’écart type), des caractéristiques de forme et de l’analyse de la
concentration.

Dans ce cours, nous nous limiterons à l’analyse statistique univariée, c’est-à-dire à l’étude d’une seule
variable statistique. L’analyse bivariée et l’analyse de régression se trouvant respectivement dans les
chapitres 3 et 4 de l’ouvrage seront traités au semestre 3 et 4.

L’analyse statistique : définitions générales


est un ensemble de méthodes permettant de décrire et d’analyser de façon quantitative des phénomènes
repérés par des événements, de même nature, susceptibles d’être dénombrés et classés. C’est un
ensemble de méthodes, un outil d’investigation. L’analyse statistique synthétise efficacement les
phénomènes, mais cela revient souvent à gommer les nuances d’une réalité infiniment complexe.

Etape d’une analyse statistique


1. La collecte de l’information :
 Le recensement, ou enquête exhaustive : (instituts statistiques)
 Les sondages
La collecte de l’information est une étape délicate et cruciale dans toute analyse statistique. On
rentre
l’information collectée sous la forme d’un tableau brut de l’information (à ne pas confondre avec
le
tableau statistique).
2. Le classement et la présentation des données collectées à partir de l’analyse d’un ou plusieurs
caractères statistiques (Construction du tableau statistique).
2
Page 3 sur 7

3. Le traitement et l’analyse des données :


Représentations graphiques et calcul d’indicateurs statistiques pertinents pour l’analyse.
4. L’interprétation et la synthèse des résultats.

Avant de rentrer dans l’analyse à proprement dite, il est important de bien comprendre le langage du
statisticien.

Définitions générales
 Une population (ou population mère) désigne tout ensemble étudié par la statistique.
Exemples : les entreprises, les compagnies d’assurances, les ménages.
Un échantillon est un sous ensemble de l’ensemble population. On l’utilise lorsque la
population étudiée est trop élevée ou inconnue.
 Un individu est un élément de la population pouvant être perçu selon différents points de vue :
- Tous ces points de vue portent le nom de caractère
- L’étude d’un seul caractère d’un individu est appelé unité statistique
 Les modalités d’un caractère: sont les différentes situations possibles que peut prendre un
caractère.
 Le caractère qualitatif : est celui qui possède des modalités non mesurables (non chiffrés). On
distingue:
- Le caractère qualitatif nominal: l’ordre des modalités n'a aucune importance.
- Le caractère qualitatif ordinal : dans ce cas, l'ordre des modalités a un sens.
 Le caractère quantitatif : est celui qui possède des modalités mesurables. Comme ces modalités
sont représentées par des nombres, elles appartiennent donc à un ensemble numérique N
(naturels, R (réels). Dans ce caractère quantitatif on distingue :
- Variable statistique discrète : si les modalités du caractère (ou de la variable)
appartiennent à l'ensemble N, elles portent le nom de variables statistiques
discrètes.
- Variable statistique continue : Une variable est continue si ses modalités
appartiennent à R.

Ci-dessous une application permettant de concrétiser les différentes notions abordées.

Application
Le tableau suivant consigne les résultats financiers pour l’année 2010 de 10 banques européennes
domiciliées à Luxembourg privées ou publiques (voir page 5 de l’ouvrage de référence) :

3
Page 4 sur 7

Dans cette application:


1. Quelle est la population étudiée ?
2. Sur quel échantillon porte l’analyse ?
3. Déterminer le nombre de caractères de cette population.
4. Quelle est la nature de chaque variable ?
5. Déterminer le nombre de modalité de chaque variable.

Réponses :
La population est celle des banques. On considère un échantillon de 10 banques dans cette analyse.
Les banques sont étudiées au travers de 8 caractères.

- les caractères ‘Pays d'origine' et ’Pays de domiciliation’ sont qualitatifs


nominaux (4 modalités sans ordre)
- le caractère ‘Spécialisation’ est qualitatif nominal (2 modalités sans ordre)
- le caractère ‘Rang’ (par exemple du pays par titre) est qualitatif ordinal car il
possède des modalités ordonnées
- le caractère ‘Nombre d’employés’ est quantitatif discret
- les caractères ‘Revenu net’ et 'Total des titres' sont quantitatifs continus car ils
possèdent des modalités appartenant à l'ensemble des réels.

Dans cette application le tableau présenté porte le nom de tableau brut de l’information. On peut
extraire de l’information. Par exemple, construire le tableau brut du caractère pays :

4
Page 5 sur 7

Tableau des données du caractère «  Pays”

Lorsque la population est étudiée à partir d’un seul caractère, on dit que l’analyse est univariée
ou unidimensinonelle.

Autre exemple, on peut construire le tableau brut des caractères pays d’origine et spécialisation :

Tableau des données des caractère « le pays d’origine et la spécialisation »

5
Page 6 sur 7

Lorsque la population est étudiée à partir de deux caractères, on parle d’analyse bivariée ou
bidimensionnelle.

On peut vouloir pour simplifier, transformer le tableau brut en tableau dichotomique, qui
présente uniquement les valeurs 0 (lorsque la modalité n’appartient pas au caractère) ou 1
(lorsque la modalité appartient au caractère).

Exemple :

Tableau dichotomique à deux caractères qualitatifs

6
Page 7 sur 7

Afin de résumer les principales notions étudiées, voici un schéma récapitulatif :

Caractère

Quantitatif Qualitatif

Modalités Modalités
(ce sont des nombres) (ce ne sont pas des nombres)

Variable continue, Variable discrète, Avec ordre


R  N, Z Sans ordre
Caractère Caractère
Ex : revenu net Ex : les années qualitatif ordinal qualitatif nominal
Ex : le rang, la Ex : le code pays,
taille (petit,
cons…
moyen, grand)

Vous aimerez peut-être aussi