Vous êtes sur la page 1sur 37

Mathématiques et statistiques

appliquées au domaine
alimentaire
Cours 4-Mesures de dispersion et de position
Marc-Élie Lapointe et Dominic Boire
Collège de Maisonneuve - Hiver 2016
Mesures de dispersion
Les mesures de dispersion permettent de mesurer la dispersion des données
d’une série statistique.
Elles nous indiquent de quelle façon les données sont distribuées les unes par
rapport aux autres. Les mesures de dispersion ont seulement du sens pour les
variables quantitatives.

Dans le pictogramme ci-dessus, les points représente les observations et le


triangle représente la moyenne.
Nous verrons : l’étendue, l’écart-type (et la variance) et le coefficient de variation.
Étendue
L’étendue est la différence entre la plus grande valeur et la plus petite

Étendue = E = xmax – xmin

6 Étendue= 4

6 Étendue= 8

6 Étendue= 8
Remarque : L’étendue tient seulement
compte des valeurs extrêmes...
À la recherche d’une bonne mesure de dispersion…
But: Cherchons un nombre qui pourrait être un bon représentant des écarts
par rapport à la moyenne et un bon représentant de la dispersion des données.

Un étudiant de cégep de 19 ans propose ses services à titre de matelot pendant


les vacances. Il a reçu 2 offres d’emploi avec des conditions de travail
semblables. Il décide de faire son choix en se basant sur l’âge moyen de ses
compagnons de voyage.
Moyenne d’âge
« Le moussaillon » 20 ans
« Les Quatre vents » 24 ans
Son choix s’est donc porté sur le voilier « Le moussaillon ».
A-t-il fait le bon choix?
MOYENNE DES ÉCARTS
4 5 5 6 6 6 7 7 8

0 !!!
MOYENNE DES DISTANCES
4 5 5 6 6 6 7 7 8
= 0,89

= 1,33

= 2,67
VARIANCE ET ÉCART TYPE
4 5 5 6 6 6 7 7 8
= 1,33

=4

=8,44
Remarques sur l’écart-type et la variance
● L’écart type (et la variance) est une mesure de dispersion qui tient compte
de toutes les données.

● Les calculs sont longs, nous utiliserons donc le mode statistique de la


calculatrice pour calculer l’écart-type et la variance.

● La variance est utiliser surtout en statistique plus avancée. L’écart-type est


plus simple à interpréter car elle a les mêmes unités que les observations.

● On peut voir l’écart-type comme la “moyenne” des écarts à la moyenne.

● Les formules de l’écart-type et de la variance sont légèrement différentes


que l’on étudie une population ou un échantillon.
FORMULE POUR UNE
POPULATION

Calculatrice : σ= Alpha 6
FORMULE POUR UN
ÉCHANTILLON

Calculatrice : s= Alpha 5
Exercices
Calculer la variance et l’écart-type des populations suivantes et interpréter l’écart-type.
Exercice A: 1, 2, 2, 3, 3, 3, 4, 4, 7, 10 Exercice C:
Répartition des 50 employés
Exercice B: selon le salaire de l’an dernier

Répartition des 50 employés selon le nombre d’enfants Salaire Nombre


d'employés
Nombre Nombre Pourcentage d'employés
d'enfants d'employés
[39600,46200[ 2

0 7 14% [46200,52800[ 10

1 16 32% [52800,59400[ 15

2 19 38% [59400,66000[ 12

3 7 14% [66000,72600[ 5

4 1 2% [72600,79200[ 4

Total 50 100% [79200,85800[ 2


Total 50
DONNÉES NON GROUPÉES (EX.A) μ = 3,9

variance=

= Variance=
10 N
Calculatrice : Valeur M+ Valeur M+ …

Interprétation :
DONNÉES GROUPÉES PAR VALEURS EX.B
variance = μ = 1,58 enfant

= Variance=
N
5
Calculatrice : Valeur STO Effectif M+ Valeur STO Effectif M+ …

Interprétation :
0
DONNÉES GROUPÉES (EN CLASSES) (EX.C)
Répartition des 50 employés selon le salaire
de l’an dernier
Salaire

42900 [39600,46200[ 2
49500 [46200,52800[ 10
56100 [52800,59400[ 15
62700 [59400,66000[ 12
69300 [66000,72600[ 5
75900 [72600,79200[ 4
82500 [79200,85800[ 2
Total 50
DONNÉES GROUPÉES (EN CLASSES) EX.C μ = 59796 $

variance =

= Variance=
N
50
Calculatrice : Valeur STO Effectif M+ Valeur STO Effectif M+ …

Interprétation :
En résumé
Échantillon Population

La plupart des données de la distribution se trouvent dans l’intervalle :

ou

c’est-à-dire à au maximum un écart-type de la moyenne.


Exercice
Calculer l’écart-type et la moyenne de population suivant et les interpréter.

Pourcentage de Pourcentage
matière grasse de 2 litres

[3,93;3,96[ 13,64%

[3,96;3,99[ 27,27%

[3,99;4,02[ 13,64%

[4,02;4,05[ 13,64%

[4,05;4,08[ 18,18%

[4,08;4,11[ 13,64%
Remarque : le calcul de s ne fonctionne pas
Total 100,00% si on a pas les effectifs!
Comparaison de la dispersion de 2 séries qui ont la même
moyenne

Interprétation : La plupart des garçons de 3 ans dans la population du


Québec en 2000 mesuraient entre 91,4 et 100,6 cm.
Exemple préliminaire
Salaire hebdomadaire de 6 couturières

en 1930 : 30 $ 37$ 44$ 50$ 55$ 60$

en 2006 : 340$ 347$ 354$ 360$ 365$ 370$

Est-ce que les salaires sont plus dispersés en 1930 ou en 2006?


Coefficient de variation
● Le coefficient de variation est un outil permettant de mesurer l’homogénéité
d’une distribution.

● Plus le coefficient de variation est près de 0%, plus la distribution est


homogène, c’est-à-dire que les données sont près les unes des autres.
(Moyenne plus représentative)
● Nous allons considérer qu’une distribution est homogène si le CV est
inférieur à 15%.
Exemple

● En 2006, au Québec, le salaire annuel moyen était de 33 145$


avec un écart-type de 31 751$ tandis qu’au Canada il était 36
520$ avec un écart-type de 58 892$.

● Déterminer à quel endroit, au Québec ou au Canada, le salaire


annuel était le plus stable.
Exemple supplémentaire
Supposons que l’on désire comparer les revenus des médecins de la
Russie à ceux du Québec. Voici la moyenne et l’écart-type respectifs des
revenus:
Russie Québec
Revenu moyen:1623 roubles125 600 $
Écart-type du revenu:65 roubles 20 567$
Coefficient de variation: 4,00
______
%
______
16,38%

À quel endroit observons-nous:


a) la plus grande disparité dans les revenus?
b) la distribution de revenus la plus homogène?
Simard, Christiane, Méthodes quantitatives, 4e édition, page 95
Les mesures de position
Les mesures de position permettent de situer une donnée par rapport
aux autres données d’une série statistique ordonnée.

Comme mesure de position nous verrons :


● les quantiles
● la cote z
Les quantiles
Les quantiles séparent la série de données (ordonnée) en un nombre de
parties égales.

La médiane est le quantile le plus simple car elle sépare la série de


donnée en 2 parties égales. On sait donc que 50% des données se
trouvent en dessous ou au dessus de celle-ci.
Le calcul des quantiles se fait de façon similaire au calcul de la
Les quantiles
Quartiles: séparent la distribution en ___ parties de ___% chacune.

Quintiles: séparent la distribution en ___ parties de ___% chacune.

Déciles: séparent la distribution en ___ parties de ___% chacune.

Centiles: séparent la distribution en ___ parties de ___%


chacune.

Remarque : les quantiles sont surtout utiles pour des grandes distributions.
50%

25%
Q1 Q2 Q3
20%
V1 V2 V3 V4

10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
1%

C1 … C10 C20 C30 C40 C50 C60 C70 C80 C90 … C99
EXERCICES (CALCULER LES QUANTILES)
#1 Nombre d’enfants dans le Document de travail avec les 50 employés de
l’entreprise.
Répartition des 50 employés selon le
nombre d'enfants
Nombre Nombre Pourcentage
d'enfants d'employés d'employés
0 7 14,0%
1 16 32,0%
2 19 38,0%
3 7 14,0%
4 1 2,0%
Total 50 100,00%

D6=____________ Interprétation:
_
C46=____________ Interprétation:
_
#2 Salaire dans le Document de travail avec les 50 employés de l’entreprise.
Répartition des 50 employés selon le salaire
de l'an dernier
Nombre Pourcentages
Salaire ($) d'employés d'employés
[39600,46200[ 2 4,00%
[46200,52800[ 10 20,00%
[52800,59400[ 15 30,00%
[59400,66000[ 12 24,00%
3960 4620 5280 5940 6600 7260 7920 8580
[66000,72600[ 5 10,00% 0 0 0 0 0 0 0 0

[72600,79200[ 4 8,00%
[79200,85800[ 2 4,00%
Total 50 100,00%

Q3=____________ Interprétation:
_
#3 Salaire dans le Document de travail avec les 50 employés de l’entreprise.
Répartition des 50 employés selon le salaire
de l'an dernier
Nombre Pourcentages
Salaire ($) d'employés d'employés
[39600,46200[ 2 4,00%
[46200,52800[ 10 20,00%
[52800,59400[ 15 30,00%
[59400,66000[ 12 24,00%
3960 4620 5280 5940 6600 7260 7920 8580
[66000,72600[ 5 10,00% 0 0 0 0 0 0 0 0

[72600,79200[ 4 8,00%
[79200,85800[ 2 4,00%
Total 50 100,00%

V2=____________ Interprétation:
_
#1 Nombre d’enfants dans le Document de travail avec les 50 employés de
l’entreprise.

Répartition des 50 employés selon le


nombre d'enfants
Nombre Nombre Pourcentage Nombre
d'enfants d'employés d'employés d'employés cumulé
0 7 14,0% 7
1 16 32,0% 23
2 19 38,0% 42
3 7 14,0% 49
4 1 2,0% 50
Total 50 100,00%

D6= 2 enfants Interprétation: Au moins 60% des employés ont 2 enfants ou moins.

C46= 1,5 enfant Interprétation: Au moins 46% des employés ont 0 ou 1 enfant.
#2 Salaire dans le Document de travail avec les 50 employés de l’entreprise.
Répartition des 50 employés selon le salaire
de l'an dernier
Nombre Pourcentages % cumulé
Salaire ($) d'employés d'employés d'employés
[39600,46200[ 2 4,00% 4%
[46200,52800[ 10 20,00% 24%
[52800,59400[ 15 30,00% 54%
[59400,66000[ 12 24,00% 78%
3960 4620 5280 5940 6600 7260 7920 8580
[66000,72600[ 5 10,00% 88% 0 0 0 0 0 0 0 0

[72600,79200[ 4 8,00% 96%


[79200,85800[ 2 4,00% 100%
Total 50 100,00% % ? = 5775

Q3= 59 400+5 775 = 65 175$


Interprétation: 75% des employés ont gagné moins de 65 175$.
#3 Salaire dans le Document de travail avec les 50 employés de l’entreprise.
Répartition des 50 employés selon le salaire
de l'an dernier
Nombre Pourcentages % cumulé
Salaire ($) d'employés d'employés d'employés
[39600,46200[ 2 4,00% 4%
[46200,52800[ 10 20,00% 24%
[52800,59400[ 15 30,00% 54%
[59400,66000[ 12 24,00% 78%
3960 4620 5280 5940 6600 7260 7920 8580
[66000,72600[ 5 10,00% 88% 0 0 0 0 0 0 0 0

[72600,79200[ 4 8,00% 96%


[79200,85800[ 2 4,00% 100%
Total 50 100,00% % ? =3520

V2= 52 800 + 3 520 = 56 320$


Interprétation: 40% des employés ont gagné moins de 56 320$.
Cote Z
La cote Z est le nombre d’écarts-types qui séparent une donnée de la
moyenne.

Cote z = valeur – moyenne


écart-type

Population Échantillon
Exemple : résultats des étudiants au cours de statistique

Cote z = _______

Cote z = ________

Cote z = _______

Cote z = _______
Interprétation de la cote Z
Cote Z négative (<0)?

Cote Z positive (>0)?

Cote Z nulle (=0)?

Normalement, la plupart des données sont entre -1 et 1 de cote Z.


Exemple
Au Québec, en 2010, les femmes ayant complétées des études
post-secondaires de 25 ans et plus avaient un salaire horaire moyen
de 21,69$/h avec un écart-type de 11,33$/h.
a) Calculer la cote Z d’une femme faisant 28$/h et l’interpréter.

b) Si la cote Z d’une femme est de -0,8, quelle est son salaire horaire?

c) Le salaire horaire moyen chez les hommes (dans les mêmes conditions)
était de 24,87$/h. Si un homme avec un salaire de 52,61$/h avait une cote
Z de 2, quel était l’écart-type du salaire horaire chez les hommes?

Vous aimerez peut-être aussi