Académique Documents
Professionnel Documents
Culture Documents
} Échantillon:
◦ Toute partie ou sous-ensemble de la population
(n = taille de l’échantillon)
5 à 20 classes
n
Pour obtenir des classes d’amplitude égale :
Trouvons E (l’étendue):
E=Valeur maximale - Valeur minimale
Calculons l’amplitude:
Amplitude=E/nombre de classes
Pour les trois dernières années, le débit mensuel
moyen d'une rivière, exprimé en milliers de
mètres cubes par seconde, a été le suivant :
Calculons l’amplitude:
Amplitude=0,97/6=0,17
} Les classes sont:
[0,08-0,25 [
[ 0,25-0,42 [
[ 0,42-0,59 [
[ 0,59-0,76 [
[ 0,76-0,93 [
[ 0,93-1,1 [
x
i 1
i
N
Lorsque les données à
traiter proviennent d’un
n échantillon
x
i 1
i
x
n
• La statistique la plus utilisée
• Affectée par les valeurs extrêmes
0 1 2 3 4 5 6 7 8 9 10
Moyenne = 5
0 1 2 3 4 5 6 7 8 9 10 12 14
Moyenne = 6
La clinique médicale MD a fait une étude sur tous ses
dossiers de varicelle recensée cette année et on y a
notamment enregistré le nombre de frères et sœurs de
chacun des patients atteints de cette maladie
contagieuse. On relève les données brutes suivantes :
Posons X = la variable statistique représentant le nombre
de frères et sœurs de chacun des patients atteints de
cette maladie contagieuse.
2 1 3 0 6 0 1 2 3 1
3 0 2 0 4 1 0 4 0 2
1 1 3 2 3 3 2 1 1 1
0 1 2 4 1 2 2 7 3 2
0 1 1 2 5 5 3 4 3 0
1 2 2 3 0 1 2 0 2 2
Voir chiffrier Excel: exemple 1 - données non groupées (varicelle)
Pour données non-groupées :
(si on utilise les fréquences absolues)
k
1
x
n f x
i 1
i i
xi fi fi/n Fi/n
Notation
n = le nombre total d’observations
fi = la fréquence absolue de la classe i
Mi = le centre de la classe i
xi = les différentes modalités d’un caractère
ou les différentes valeurs prises par
une variable statistique.
Où Mi est le
Pour données groupées : point milieu de
k la ième classe
fM
i 1
i i
x Lorsque les
n données
proviennent d'un
échantillon
f M
i 1
i i Lorsque les données
proviennent d'une
population
N
Moyenne de données groupées
fM
Rent ($) fi Mi f iM i
420-439 8 429.5 3436.0 i i
440-459 17 449.5 7641.5 i 1
460-479 12 469.5 5634.0 x
480-499 8 489.5 3916.0 n
500-519 7 509.5 3566.5
520-539 4 529.5 2118.0 34, 525
540-559 2 549.5 1099.0
x 493.21
70
560-579 4 569.5 2278.0
580-599 2 589.5 1179.0
600-619 6 609.5 3657.0
Total 70 34525.0
} La médiane est la valeur qui sépare, aussi
exactement que possible, une série
statistique en deux parties égales par rapport
au nombre de données, une fois celles-ci
classées en ordre ascendant
Lorsque les données sont classées en ordre
croissant, la médiane correspond à la valeur
centrale. Si le nombre d’observations est pair, la
médiane est la moyenne des deux observations
centrales. S'il est impair, la médiane est la valeur
de la série dont le rang est n 1 dans le
classement ascendant 2
0 1 2 3 4 5 6 7 8 9 10 11 12
Pas affectée par
les valeurs Médiane = 5
extrêmes
0 1 2 3 4 5 6 7 8 9 10
Médiane = 5
} Le mode d’une série (s’il existe) est la valeur la plus
fréquente.
◦ Pour valeurs non groupées: exemple ci-dessous
◦ Pour valeurs groupées, on parle plutôt de classe modale
◦ Pas affecté par les valeurs extrêmes
◦ Il peut y avoir plusieurs modes
◦ Il peut ne pas y avoir de mode
◦ OK avec données qualitatives et quantitatives
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Aucun mode
Mode = 9
} Elles quantifient les fluctuations des valeurs
observées et leur étalement
Variation
Population: Population:
Variance = Écart type =
Échantillon: Échantillon
Étendue interquartile Écart type=S
Variance=S
C’est la différence entre la plus grande valeur et
la plus petite valeur de la série statistique
E=
x max x min
*Ignore comment les données sont réparties
Étendue = 12 - 7 = 5 Étendue = 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
Cette mesure (la variance) évalue
l’étalement d’une série par rapport à la
moyenne
s2
i
x x 2
2
i
x 2
n 1 N
f i M i x 2
f i M i 2
s2 i
2
i
n 1 N