Vous êtes sur la page 1sur 3

TD de statistiques descriptives

Licence 1 de psychologie. Université Savoie Mont Blanc (Michel Guerraz)

Fiche 1 : introduction

La statistique (ou les statistiques …) est un ensemble de


méthodes mathématiques permettant de décrire et d’analyser,
de façon quantifiée, des phénomènes repérés par des éléments
nombreux, de même nature, susceptibles d’être dénombrés et
classés.

Statistique descriptive,
Ensemble des techniques visant à résumer l’information contenue dans un ensemble de
données à l’aide de graphiques, de tableaux et d’indicateurs numériques. Permet de présenter
et résumer un ensemble de données.
Inférence statistique.
Ensemble des méthodes permettant de tirer des conclusions applicables à la population
entière, en se basant sur un sous-ensemble de cette population. Permet donc de généraliser et
étendre les conclusions obtenues.

Quelques définitions de termes statistiques


Population (ou univers): Ensemble d’individus ou d’objets plus ou moins abstraits de même
nature (population des étudiants de l’université de Savoie, population des livres à la
bibliothèque ….)
Individus (ou unité statistique): C’est l’élément de base de la population. La totalité des
individus correspond à la population. L’objet des statistiques va être d’étudier les
caractéristiques des individus. Ce n’est pas à l’individu ou individus que l’on s’intéresse en
tant que tels mais seulement dans la mesure où ils contribuent à une meilleure connaissance
de la population. Dans certains cas, on peut rechercher les caractères de tous les individus
composant une population. C’est ce que l’on appelle un recensement. Toutefois, il est bien
souvent impossible d’évaluer toutes les unités statistiques, on travaillera alors sur un
échantillon, c’est à dire un sous groupe.
Echantillon : Sous ensemble de la population prélevé de manière aléatoire ou par choix
raisonné pour être étudié. On utilise un échantillon lorsque le nombre d'individus est très
important (expl : sondage d'opinion) ….
Un caractère : Un caractère est un phénomène étudié sur une population donnée. Par
exemple, si l’on étudie une population en s’intéressant au caractère « poids », on ne
s’intéressera pas aux caractères « couleur » des yeux ou QI …Dans une population donnée, un
caractère peut varier d’un individu à l’autre. On dira alors que ce caractère présente
différentes modalités.
Par convention, on note bien souvent les caractères par des lettres majuscules, A, B, ..X, Y
Une modalité : On appelle modalités d’un caractère les différentes situations (numériques ou
pas) que peut prendre un caractère. Le caractère « genre » par exemple ne prendra que deux

1
modalités (M & F). Le caractère situation matrimoniale par exemple pourra prévoir quelques
modalités (célibataire, en concubinage, etc.).
On note les modalités avec la même lettre que le caractère mais en minuscule et indicé. Ainsi,
on note généralement xi la i-ème modalité du caractère X ….
Ainsi :
• X = caractère étudié.
• N = nombre d’observations pour cette variable.
• x1,x2,…,xk = ensemble des modalités (valeurs distinctes) prises par le caractère (on les
écrit en ordre croissant si elles sont ordonnables).

I. STATISTIQUES DESCRIPTIVES

Objectifs : Les statistiques descriptives visent à représenter et condenser des données dont
on veut connaître les principales caractéristiques quantifiant leur variabilité. Soit au travers :
 De représentations sous forme de tableaux,
 De représentations graphiques,
 Au travers de paramètres uniques de position & dispersion qui représentent et
résument les données (on reporte généralement l’un et l’autre dans les graphiques).

Nature des observations


Chaque individu, ou unité statistique, appartenant à une population est décrit par un
ensemble de caractéristiques appelées variables ou caractères. Ces variables ou caractères
peuvent être quantitatifs (numériques) ou qualitatifs (non numériques) :
 Observations qualitatives : Se dit d’un caractère qui ne peut ni être mesuré ni
compté. Ces observations sans mesure peuvent être
classées dans une catégorie ou selon un ordre,
o Nominale : Lorsqu'il s'agit du nom d'une caractéristique et que l’on n’a pas la
notion d'ordre. Les modalités associées aux données ne sont qu’un code arbitraire.
Il n’y a pas d’ordre logique, pas d’unité reconnue
Exemple : filière d’étude, nationalité, etc…
o Ordinale : Lorsqu'on associe la notion d'ordre. Dans ce cas, il n’y a pas d’unité
reconnue. On peut donc ordonner les observations mais on ne peut pas comparer
les écarts entre ces observations.
Exemple : Attrait des étudiants en psychologie pour les statistiques (inexistant-
faible – moyen – grand - très grand)
 Observations quantitatives : Observation pouvant être représentée par un nombre
représentatif d’une quantité. On parle d’échelles d’intervalles.
o Discrètes ou discontinues: Valeur entière issue d’un comptage ou
dénombrement. On a un saut entre chaque valeur de la variable.
Exemple : Nombre de point, nombre d’erreurs etc.
o Continues : Valeur continue ou réelle issue d’une mesure. Entre deux
modalités ou valeurs d'une variable continue on peut en placer une intermédiaire.
On a donc une infinité de valeurs possibles à l’intérieur d’un intervalle. Exemple :
Un temps, une longueur, etc.
Pour représenter ce type d’observations, on pourra par exemple les regrouper à
l’intérieur d’intervalles ou classes.

2
Effectifs et fréquences

Notion d’effectif :

Effectif : Nombre d’individus appartenant à la population, à l’échantillon ou encore à la


modalité d’intérêt.

On compte alors le nombre de fois que cette modalité du caractère apparaît

L’effectif total (effectif total de notre population) est noté N.

L’effectif correspondant à la modalité xi du caractère X est noté ni.

Ainsi, n i =N
i =1

Notion de fréquence :

La fréquence d’une modalité xi d’un caractère X est la proportion d’individus de la population


totale qui présentent cette modalité. C’est donc le rapport d’un effectif par un effectif total. On
la notera fi

k
n
f i = i Ainsi la somme des fréquences des différentes modalités = 1  f i =1
N i =1

On peut obtenir l’effectif sous forme d’un pourcentage, en multipliant par 100 la fréquence.

Effectifs et fréquences cumulées :

Les effectifs cumulés croissants (ou décroissants) indiquent combien d’individus ont une
valeur du caractère étudié strictement inférieure (supérieure ou égale) à une valeur donnée.

On définit de la même manière les fréquences cumulées croissantes ou décroissantes. On


calcule l’effectif cumulé en ajoutant chaque effectif d’une modalité particulière à la somme
des effectifs des modalités qui la précède. La dernière valeur sera toujours égale au total des
observations, puisque chaque effectif aura été ajouté au total précédent.

Vous aimerez peut-être aussi