Académique Documents
Professionnel Documents
Culture Documents
Objectifs.
Moyens :
1
Le but de cette partie est de donner les définitions précises des concepts de base dans
le domaine de la statistique et de l’analyse des données.
Mots clés. Analyse descriptive ‘exploratoire’ des données, Données, Statistique,
Variable, Représentation des données.
1 Introduction
2 Domaines et limitations
Et bien d'autres. On peut faire une distinction entre ces différentes méthodes : celle
relative a la statistique descriptive et celle relative a la statistique inférentielle.
3
Le but principal de la statistique descriptive est de présenter I ‘information d'une
façon compréhensible et utilisable, par exemple en calculant des moyennes, en
construisant des histogrammes, en établissant des tableaux croises, en représentant
graphiquement les données, etc.
On décrit d'abord les données en étudiant chacune des variables séparément, on parle
de statistiques descriptives uni-variées (Partie 2). On peut ensuite étudier deux
variables simultanément, on met alors en œuvre les statistiques descriptives bi-
variées (Partie 3). Il est possible d'analyser conjointement plus de deux variables, on
fait alors appel aux outils de statistiques descriptives multi-variées tels que l'Analyse en
Composantes principales (ACP), l'Analyse des Correspondances Multiples (ACM).
Une population est un ensemble, fini ou non, d’éléments que l'on souhaite étudier. Ces
éléments portent le nom d’individus ou d’unités statistiques. Il peut s'agir par exemple
d’êtres humains (adultes, enfants, chômeurs, salariés, etc.), d’animaux ou encore d’objets
[Cours destiné aux étudiants Licence MRI]
Partie 1 Généralités et Principales Définitions UEM – M512
Population
Echantillon 2
Echantillon 1
Unités
Exemple 1.1
Une usine fabrique des tiges métalliques utilisées dans l'assemblage de certaines 4
structures. Pour étudier la résistance à la traction de ces tiges, on mesure cette
résistance pour un lot de 1OO tiges.
■ Caractères
■ Modalités
Exemple 1.2
Dans le premier cas, les modalités ne sont pas des valeurs chiffrées, elles ne sont pas
mesurables mais uniquement observables (nationalité, catégorie socioprofessionnelle,
etc.). Dans le cas d'une variable quantitative, les modalités sont mesurables : à chaque
modalité est associé un nombre, c’est-à-dire une valeur chiffrée, représentant la mesure
du caractère. Ainsi, la puissance d'un moteur, le nombre de places assises, l'âge, la taille,
etc. sont des variables statistiques dont les modalités sont des nombres.
Les variables qualitatives peuvent être nominales ou ordinales. Dans le premier cas,
les modalités ne peuvent être ordonnées, contrairement au cas de variables ordinales.
Des exemples usuels de variables nominales sont le groupe sanguin, statut d’une entité,
profession, …etc. Des variables comme le niveau d'études (avec, par exemple, comme
modalités : sans diplôme, primaire, secondaire, universitaire) ou le niveau de
satisfaction (peu satisfait, satisfait, très satisfait) sont des variables ordinales.
Les variables quantitatives peuvent être discrètes ou continues. Une variable est dite
discrète lorsque ses valeurs sont des nombres isolés dans son intervalle de variation.
Il s'agit en règle générale de nombres entiers; par exemple le nombre d'enfants par
famille, le nombre de salariés d’une entreprise, le nombre d'automobiles vendues. Une
variable est dite continue lorsqu'elle peut prendre toutes les valeurs au sein de son
[Cours destiné aux étudiants Licence MRI]
Partie 1 Généralités et Principales Définitions UEM – M512
Une variable statistique ou aléatoire est notée par une lettre majuscule , et les
valeurs qu'elle prend par des lettres minuscules , … … , , … …
Variable
Non Oui
Lorsque les valeurs prises par la variable sont soumises au hasard (par exemple, «
pile » ou « face » dans le cas du lancer d’une pièce), on parle de variable aléatoire.
Il convient de ne pas les confondre avec les variables statistiques. La distribution
d’une variable statistique est une distribution empirique.
■ Données
Le terme de données est très utilisé en statistique. Il désigne l’ensemble des individus
observés (ceux de l’´echantillon), l’ensemble des variables considérées et les
observations de ces variables sur ces individus.
Une donnée est le résultat d’une observation faite sur une population ou sur un
échantillon. Le mot « donnée », du latin, est défini comme étant un fait (pas forcément
numérique) à partir duquel on peut tirer une conclusion.
Les données sont liées à la variable étudiée. On dit ainsi, que les données sont
quantitatives, qualitatives, discrètes ou continues, si la variable associée est elle-même
quantitative, qualitative, discrète ou continue.
Exercice
Q D Q D Q Q Q Q Q Q
D Q Q D Q D D Q Q Q
D D D Q Q Q Q Q Q D 7
1) Définir la population.
2) Définir la variable.
3) Préciser les modalités de cette variable.
4) Déterminer de quel type de variables il s'agit (qualitatives, quantitatives discrètes
ou quantitatives continues).