Académique Documents
Professionnel Documents
Culture Documents
1 Terminologie
• Une population est un ensemble soumis à une étude statistique.
• Une série statistique est un ensemble de valeurs collectées (sur une
population) portées sur une liste comme la taille des joueurs d’une
équipe, le nombre de voix obtenues par l’ensemble des personnes sur
une liste électorale...
• Un échantillon est un sous-ensemble de la population.
• Un caractère statistique est une propriété étudiée sur la population. Il
peut être qualitatif ou quantitatif comme la taille, le QI ou le revenu
d’une personne...
• Un effectif est le nombre de répétitions d’une des valeurs associée à
un caractère. Par exemple, le nombre d’élèves mesurant 152 cm dans
une école de 1000 élèves. L’effectif total ou cumulé est la taille de la
population.
Un caractère est qualitatif s’il est non mesurable comme la marque d’une
voiture, l’activité professionnelle, la nationalité. Un caractère est quantitatif
s’il peut se mesurer, c’est-à-dire si on peut lui attribuer une valeur numérique
comme l’âge, le poids, le revenu annuel.
Nous nous limiterons à l’étude de séries statistiques quantitatives. Un
caractère quantitatif peut être discret ou continu. Il est discret si le carac-
tère ne peut prendre que des valeurs isolées comme, par exemple, le nombre
d’enfants d’une famille, le nombre de voitures que possède une famille. Il
est continu si le caractère peut prendre toutes les valeurs dans un intervalle
donné partagé en classes comme par exemple la taille d’un être humain.
Nous allons définir, et calculer sur base des deux exemples ci-dessous,
trois valeurs centrales distinctes.
Poids (kg) 1,8 2,6 2,7 2,9 3,0 3,1 3,3 3,5 3,9 4,0 4,1 4,3
Effectif 2 4 1 1 1 3 2 1 1 1 2 1
Durée (min) [0 ;30[ [30 ;60[ [60 ;90[ [90 ;120[ [120 ;150[ [150 ;180[
Durée (min) [180 ;210[ [210 ;240[ [240 ;270[ [300 ;330[ [330 ;360[
Effectif 182 46 7 5 1
1, 8 ∗ 2 + 2, 64 ∗ 4 + 2, 7 + 2, 9 + 3, 0 + 3, 1 ∗ 3
x̄ =
20
3, 3 ∗ 2 + 3, 5 + 3, 9 + 4, 0 + 4, 1 ∗ 2 + 4, 3
+ = 3, 12 kg
20
Pour la table 2 la moyenne des durées est 122 minutes et 40 secondes.
Valeur
Avantages Inconvénients
centrale
Influencée par des valeurs extrêmes.
Moyenne Très largement utilisée.
Peut ne correspondre à aucune valeur
arithmétique Utilise toutes les données.
de la liste.
Est souvent une valeur donnée.
Médiane Utile lorsque des valeurs extrêmes Cible une seule valeur.
peuvent peser sur la moyenne.
Très facile à déterminer.
N’inclut pas toutes les valeurs.
Mode Représente une valeur typique.
Surtout descriptif.
Est toujours une valeur de la liste.
3.1 L’étendue
Dans une série statistique, l’étendue est la différence entre les deux valeurs
extrêmes du caractère observé. Ce paramètre ne tient compte que de deux
valeurs, qui pourraient induire en erreur quant à la distribution des données.
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3