Vous êtes sur la page 1sur 4

CM1 Statistiques

INTRODUCTION

DEFINITIONS
Méthodes statistiques : ensemble des méthodes à partir desquelles on recueil, organise et analyse
des données, et grâce auxquelles on peut représenter et résumer leur propriété.
Données : information à propos de ce phénomène, peuvent concerner une population ou un
échantillon de cette population
Population : ensemble des personnes, objets concernés par la question
Échantillon : partie de cette population
Variable : caractéristique observable chez une unité stat

Statistiques descriptifs : ensemble des méthodes qui permettent d’analyser et décrire les données
Statistiques inférentiels : ensemble des méthodes qui permettent de déduire certaines propriétés
d’une population à partir de données collectées sur un échantillon de cette population

Importance de maitriser les outils statistiques : pour lutter contre ses aprioris et vérifier ses
hypothèses.

Psychométrie : volonté de mesurer une dimension psychologique chez un individu ou un groupe


d’individu (test du QI, mesure de l’attention, de la mémoire, etc.). Permet de quantifier des
phénomènes, reproduire des calculs de mesures…
Binet et Simon : élaborés la première « échelle métrique de l’intelligence » en 1904, moyen pour
déceler les élèves en difficulté scolaire. Prolongement logique de la méthode expérimentale.

1. RECUEILLIR DES DONNÉES

Quels paramètres doit-on mesurer ?


Quelques caractéristiques, choisies de manière à répondre à une question précise et déterminante.
Les données = impartiales et maitrisables.
Il n’y a pas de données naturelles, elles sont construites dans un cadre défini.
Les résultats varient avec : la formulation de la question + déf des termes employés = collecte de
données

Condition : le chercheur doit opérationnaliser le problème pour le rendre « mesurable ». Ce


processus doit être explicite pour être discuté et éventuellement reproduit par d’autres chercheurs.

Difficulté : l’adéquation entre les propriétés des nombres (établies dans le monde mathématique) et
les propriétés de la variable étudiée (établie dans le monde psychologique, sociologique, médical).

Qualité des données : 2 questions à se poser


- La mesure est-elle valide ? notion de validité (résultats mesurent ce que l’étude veut mesurer)
- La mesure est-elle fiable ? notion de fidélité (même résultats dans les mêmes conditions)

Sur qui réaliser la collecte de données ?


Population statistique = but du chercheur est d’établir des conclusions générales, universelles,
valables pour une vaste collection d’éléments, appelée population statistique.
Population constituée :
- d’objets particuliers (HLM, les pièces fabriquées dans une usine)
- d’évènements (les catastrophes naturelles)
- de personnes (les étudiants, les habitants de Paris, les personnes anxieuses)
- d’unités plus grandes (ménages, familles monoparentales).
CM1 Statistiques

Individus ou unités statistiques = chaque élément (objet/sujet) sur lequel on va relever des
informations est appelé individu statistique ou unité statistique.
L’ensemble constituant la population statistique est noté P. On note N le nombre d’éléments de P, le
nombre total d’individus qui compose la population.
Les critères d’inclusion ou d’exclusion qui définissent l’appartenance d’un élément à la population
statistique doivent être stricts.

Echantillon = parce qu’il est souvent difficile de recueillir des données pour l’ensemble des individus
composant une population, on sélectionne un fragment des éléments de cette population, appelé
échantillon.
On note n l’effectif de l’échantillon, le nombre d’individus qui le compose.

Condition :
Sélection d’un échantillon = de manière particulière pour des résultats généralisables.
Les individus composant l’échantillon sont choisi au hasard parmi l’ensemble de la population
(échantillon aléatoire).
En pratique, trop difficile d’utiliser des échantillons aléatoires, on se contente d’échantillons
représentatifs qui reflètent fidèlement la stratification d’une population et sa structure selon un
critère donné.
L’échantillonnage est à réaliser en fonction du problème posé.

- Comme l’échantillon n’est pas aléatoire, nos estimations sont crédibles ou non/reflètent ou
non avec précision l’ensemble de la population => validité externe
- La répartition aléatoire des unités statistiques sélectionnées dans différents groupes est aussi
essentielle => validité interne

A propos de quoi réaliser la collecte données ?


Variable statistique : quantité ou qualité d’une population qui est susceptible de varier d’un individu
à l’autre.
Autrement dit, une variable (attribut ou caractère) = toute caractéristique observable chez chacun
des individus de la population et permettant la description pertinente de cette population dans
l'objectif de l'étude.
Il peut exister plusieurs variables dans une population. L’expérimentateur doit donc choisir la
variable pertinente pour répondre à sa question

Une variable peut prendre plusieurs valeurs appelées des modalités.


Les modalités d’une variable doivent être :
- exhaustives (chaque élément doit recevoir une modalité du caractère considéré)
- exclusives (un élément doit appartenir à une seule modalité).

Une variable peut être discrète ou continue :


- discrète = prend un nombre limité de valeurs (sexe, classe)
- continue = prend n’importe quelle valeur entre les points inférieur et supérieur d’une échelle
de mesure (âge, score d’autosatisfaction)

Une variable peut être indépendante ou dépendante :


- indépendante = manipulable par l’expérimentateur, ses modalités sont décidées avant
l’expérience et ne dépendent pas des réponses des participants à l’expérience. Toujours au
moins deux modalités.
CM1 Statistiques

- dépendante = mesure de la réponse, ou d’une caractéristique des participants à l’étude. Une


bonne variable dépendante doit être sensible à la réponse des participants, aux différentes
modalités de la variable indépendante.

Protocole de recherche : les étapes que nous avons suivi sont typiques d’un protocole de recherche
classique
- Chercheur réfléchis à une manière de bien circonscrire le problème qui l’occupe et émet une
série d’hypothèse  
- Il imagine ensuite des situations expérimentales lui permettant de tester ses hypothèses.
- Parmi ces expériences, on compte les entretiens auprès d’un échantillon de la population
étudiée
- Mais l’acquisition des données n’est que la première étape d’un long processus...

2. ORGANISER LES DONNÉES COLLECTÉES

Pourquoi organiser les données collectées ?


Parce qu’il est rare de pouvoir utiliser des données brutes... l’écriture sur les questionnaires est plus
ou moins lisible, la voix enregistrée durant un entretien plus ou moins audible, plusieurs questions
ont été posées et toutes ne sont pas pertinentes pour l’étude en question, les personnes ont rajouté
des informations importantes qui nous oblige à réorienter la question initiale, les variables sont trop
nombreuses, etc.
Le premier travail de l’expérimentateur consiste donc à sélectionner les variables d’intérêt et à en
ordonner les modalités suivant un critère adapté.

Comment organiser les données collectées ?


Il existe différentes méthodes : la méthode adéquate dépend de la nature du problème et des
variables étudiées.
Échelles de mesure = instruments utilisés pour classer les données. Les « échelons » de ces échelles
de mesure sont constitués par les différentes modalités (états ou valeurs) que peut prendre une
variable.

Les échelles de mesure :


Nominales = une variable est qualitative ou nominale lorsque ses modalités ne sont pas
comparables par des mesures chiffrées
- Souvent des noms ou des étiquettes qui permettent de répartir la population en plusieurs
groupes sans aucune hiérarchie
Les diverses modalités d’une variable mesurée sur une telle échelle font l’objet que d’un listage.
Les règles d’exclusivité et d’exhaustivité s’appliquent toujours ! Chaque donnée ne doit pouvoir être
placée que dans une et une seule catégorie.

Ordinales = lorsqu’on utilise une échelle d’intensité permettant d’établir une mise en ordre entre les
modalités d’une unité statistique.
- Permettent d’ordonner les unités statistiques de la plus petite à la plus grande, etc.
- Peuvent utiliser des classes ordonnées (un peu, beaucoup) ou un classement (premier,
deuxième, troisième, etc.)

Numériques = lorsque les modalités de l’échelle sont séparées par des intervalles égaux.
Une variable est quantitative lorsqu’elle désigne une quantité que l’on mesure, les modalités de la
variable sont des nombres.
CM1 Statistiques

Contrairement aux échelles ordinales, on suppose qu’il existe une relation mathématique
déterminée entre les différentes modalités de la variable.
Une variable quantitative peut être de deux types :
- Variables continues
- Variables discrètes

Nominale

V. qualifiables
Ordinale

V. quantifiables Numérique

Vous aimerez peut-être aussi