Vous êtes sur la page 1sur 33

Données variables

et distribution Normale

1
Population ou échantillon
Une population équivaut
Population : à l’ensemble de tous les articles
Toutes les pièces avec
étudiés.
vernis

Un échantillon est un
Échantillon : sous-ensemble d'articles
50 pièces issus d’une population.
avec vernis

2
Statistiques descriptives ou prédictives
En examinant l’échantillon des
Population : 50 pièces, nous pouvons…
Toutes les pièces avec
vernis • décrire et résumer la série
de données des échantillons:
 Statistiques descriptives

Échantillon : • faire des projections sur la


50 pièces population :
avec vernis
 Statistiques prédictives

3
Description de données variables
Les trois caractéristiques suivantes d’une série de données
peuvent fournir beaucoup d’indications :

Forme (histogramme)
Tendance centrale (moyenne, médiane, mode)
Dispersion (étendue, écart-type, variance)

4
Exemple :
Délai de recrutement
Pour chacun des 50 recrutements, le délai (en jours)
qui a été nécessaire pour pourvoir le poste a été enregistré.

22 26 30 19 22 31 34 29 28 18

16 22 31 24 26 36 28 33 36 24
26 27 35 14 26 30 33 26 31 36
28 33 18 26 29 30 22 30 24 31
27 21 28 35 32 28 33 28 23 25

5
Un nuage de points
montre la distribution des données
Un nuage de points est un graphique dans lequel chaque donnée
est représentée sous forme de point sur une échelle de valeurs.

 
 
     
       
       
          
| | | | | | | | | | | | | | | | | | | | | | |
14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 (jours)

6
Histogrammes
Un histogramme est un graphique à barres dans lequel les données sont
regroupées en classes.
La hauteur de chaque barre montre combien de données appartiennent à
chaque classe.

20 20

12
10
10

4
3
1
0
10 15 20 25 30 35 40 jours
7
Les données peuvent avoir des formes variées

Forme en cloche – distribution normale

Asymétrie droite

Asymétrie gauche

Distribution uniforme

Distribution bi-modale

8
nuages de points ou histogrammes

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 (jours)

20

10

0
10 15 20 25 30 35 40 jours
9
Les histogrammes permettent

d’évaluer
Quand on crée un
la forme
histogramme, les Nombre Nombre
données doivent être de données de classes
correctement regroupées < 50 5-7
afin que l’on puisse
comprendre la forme de 50 – 100 6-10
leur distribution. 100 – 250 7-12

> 250 10-20


• Pour un échantillon de
taille donnée, un nombre
adapté de classes doit
être utilisé.

10
Mesures de la tendance centrale

Délais de recrutement pour les emplois techniques (en jours)

22, 26, 26, 31, 33, 37, 37, 42, 52, 52, 52, 57, 59

Moyenne
Somme des valeurs d’une X  moyenne 
22  26  26  31  33  37  37  42  52  52  52  57  59
série de données divisée 13

par le nombre de valeurs :



Y= 40,5 jours

11
Mesures de la tendance centrale
- la moyenne

moyenne

• la moyenne est pour la plupart des processus le meilleur indicateur


de la tendance centrale.
• la moyenne correspond au point d’équilibre des données.

12
Variations autour de la moyenne
Lot 0207 Lot 0815

| | | | | | | | | | | | | | | |
1 2 3 4 5 6 7 1 2 3 4 5 6 7
Diamètre du boulon Diamètre du boulon

Notez que les deux distributions sont centrées


autour d’une moyenne de 4.

Lequel des deux lots préféreriez-vous avoir ? Pourquoi ?

13
Mesures de variation
C K Consulting Délai de recrutement pour des emplois techniques (en jours)
22, 26, 26, 31, 33, 37, 37, 42, 52, 52, 52, 57, 59
1. Etendue
La valeur de la donnée la étendue = 59-22
plus forte moins la valeur de étendue = 37
la donnée la plus faible :

2. Écart(s) type(s)
La racine carrée de la moyenne Écart-type  s 
 ( y  y )2
des carrés des écarts à la
n 1
moyenne :
s= 12,74

Variance = s2 = (12,74)2
3. Variance (s2)
Le carré de l’écart-type :
s2 = 162,67

14
Quel est l’étendue pour chaque
échantillon ?
Les données correspondent au délai de réponse aux plaintes des clients (en heures)

Échantillon 1
• • étendue = _____________
• •
•| •
| | | | |
2 3 4 5 6 7 heures

Échantillon 2
étendue = _____________
• • • • • •
| | | | | | Qu’en déduisez-vous sur l’utilisation
2 3 4 5 6 7 heures de l’étendue comme mesure
de variation ?

15
Écart--type
Écart
L’écart-type est l’écart moyen de toutes les valeurs par rapport à la
moyenne de l’échantillon.

Échantillon 1 Échantillon 2

| | | | | | | | | | | |
2 3 4 5 6 7 heures 2 3 4 5 6 7 heures

Moyenne Moyenne
de l’échantillon de l’échantillon

Lequel de ces deux échantillons a le plus petit écart-type ?

16
Étapes pour calculer un écart-
écart-type
Échantillon 1
y –
y-y –2
(y-y) Formule pour un écart-type :

s 
2 -2,5 6,25
2 -2,5 6,25 ( y  y )2

2
7
-2,5
2,5
6,25
6,25
n 1
7 2,5 6,25
où :  = somme
7 2,5 6,25 –y = moyenne
y = donnée individuelle
Totaux : 27 37,5 n = nombre de données

27 37,5
y  4,5 s  7,5  2,7 heures
6 6 1
17
Exercice – calculer un écart-
écart-type
Calculez l’écart-type pour l’échantillon 2 :

Échantillon 2
– –2 Formule pour un écart-type :
y y-y (y-y)

s 
2 ( y  y )2

3
4 n 1
5
où :  = somme
6
–y = moyenne
7
y = donnée
Totaux : 27 n = nombre de données


y = 4,5
s = 1,87
18
Pourquoi utiliser l’écart-
l’écart-type ?
À l’inverse de l’étendue, l’écart-type prend en compte toutes
les valeurs de l’échantillon.

À l’inverse de la variance, l’écart-type utilise les mêmes unités de mesure


que les données d'origine.

Échantillon 1 Échantillon 2

| | | | | | | | | | | |
2 3 4 5 6 7 heures 2 3 4 5 6 7 heures

Écart-type = 2,7 heures Écart-type = 1,9 heure

19
Écart--type d’un échantillon/population
Écart

Écart-type d’un échantillon Écart-type d’une population

 y  y    
2
 
2
y
s 
n 1 N
où : où :
y = moyenne de l’échantillon  = moyenne de la population
n = nombre de données N = nombre de données
dans l’échantillon dans la population

Dans la mesure où nous traitons en général des données


simples, nous utilisons habituellement la formule de l’écart-
type d’un échantillon.
20
Statistiques d’échantillon ou
paramètres de population
Population
Échantillon
–   2
y s s2

Les statistiques d’échantillon sont Les paramètres de population sont


des mesures descriptives de des mesures descriptives de la
l’échantillon : population :
y = moyenne de l’échantillon  = moyenne de la population
s = écart-type de l’échantillon  = écart-type de la population
s2 = variance de l’échantillon 2 = variance de la population
21
Prédiction statistique

Population
Échantillon

y s s2s s2   2

La prédiction statistique fait des déductions


sur les paramètres de la population (inconnus)
à partir des informations contenues dans l’échantillon (connu).

22
La distribution normale
• La plupart des résultats de process ayant cette forme, les
propriétés de la courbe normale peuvent être utilisées pour
faire des projections sur la population du process.

23
Propriétés de la distribution normale

Écart-type

Moyenne

68%
95%
99,73%
24
Zone située sous la courbe normale
• Lors de l'analyse de la capabilité d’un process,
nous utilisons des zones situées sous la courbe
normale pour estimer le pourcentage de produits
en dehors des limites de spécifications.

LIS - Limite LSS - Limite


inférieure de supérieure de
spécification spécification

3% 12%

25
Projections sur la population

À partir de cet échantillon Nous faisons des projections sur la population


LIS LSS
10 LIS = 10 LSS = 40
9
8
µ = 27,1
7
σ = 8,3
6
5
4
3
2 2% 6%
1
0
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50

Au total, 8% du produit sortent


des limites des spécifications.

26
Distribution Normale Standard
La distribution normale standard, souvent appelée
« distribution z » est définie par les paramètres suivants :

0 y
z
 1 

où z est le nombre d’écarts-types par rapport à la moyenne.

-3σ -2σ -1σ µ 1σ 2σ 3σ

27
Traduisez les unités réelles en unités z
Délai de recrutement pour les postes administratifs
y = 10,.0 jours
σ = 2,5 jours

2,5 5,0 7,5 10,0 12,5 15,0 17,5 Jours

Échelle
-3σ -2σ -1σ µ 1σ 2σ 3σ z

Combien de recrutements en pourcentage


nécessitent 5 à 15 jours de délai ?

28
Détermination des valeurs z
correspondantes
• Quel est le pourcentage des recrutements qui
demandent 12 jours ou plus ?

?
12,0
2,5 5,0 7,5 10,0 12,5 15,0 17,5 Jours
Échelle
-3σ -2σ -1σ µ 1σ 2σ 3σ z

y   12,0  10,0 2,0


z    0,80
 2,5 2,5
29
Utilisation du tableau z

y  10,0 jours
  2,5 jours 21%

12,0
2,5 5,0 7,5 10,0 12,5 15,0 17,5 jours
0.8
échelle z
-3σ -2σ -1σ µ 1σ 2σ 3σ

y   12,0  10,0 2,0


z    0,80
 2,5 2,5

P = 0,2119
z = 0,80
selon le tableau z

30
Exercice : utilisation du tableau z
En vous servant de l’exemple précédent, déterminez le
pourcentage des recrutements qui demandent 14 jours ou plus.

y = 10,0 jours
σ = 2,5 jours
?

2,5 5,0 7,5 10,0 12,5 15,0 17,5 Jours


14,0
Échelle z
-3σ -2σ -1σ µ 1σ 2σ 3σ

y
Z 
 P=
31
Tableau z
Tableau z endécimales au-delàd’unevaleurdonnée (pourdesvaleurs de zallant de 0 à 6)

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,5 0,308537533 0,305025719 0,301531771 0,298055944 0,294598489 0,291159655 0,287739682 0,284338808 0,280957264 0,277595276
0,6 0,274253065 0,270930848 0,267628834 0,264347230 0,261086235 0,257846044 0,254626846 0,251428824 0,248252158 0,245097021
0,7 0,241963578 0,238851994 0,235762424 0,232695018 0,229649924 0,226627280 0,223627221 0,220649876 0,217695369 0,214763817
0,8 0,211855334 0,208970026 0,206107994 0,203269335 0,200454139 0,197662492 0,194894473 0,192150158 0,189429614 0,186732906
0,9 0,184060092 0,181411225 0,178786354 0,176185520 0,173608762 0,171056112 0,168527597 0,166023240 0,163543057 0,161087061
1,0 0,158655260 0,156247655 0,153864244 0,151505020 0,149169971 0,146859081 0,144572328 0,142309686 0,140071125 0,137856610
1,1 0,135666102 0,133499557 0,131356927 0,129238161 0,127143201 0,125071989 0,123024458 0,121000541 0,119000166 0,117023256
1,2 0,115069732 0,113139509 0,111232501 0,109348617 0,107487762 0,105649839 0,103834747 0,102042381 0,100272634 0,098525394
1,3 0,096800549 0,095097982 0,093417573 0,091759198 0,090122734 0,088508052 0,086915021 0,085343508 0,083793378 0,082264493
1,4 0,080756711 0,079269891 0,077803888 0,076358555 0,074933743 0,073529300 0,072145075 0,070780913 0,069436656 0,068112148
1,5 0,066807229 0,065521737 0,064255510 0,063008383 0,061780193 0,060570771 0,059379950 0,058207562 0,057053437 0,055917403
1,6 0,054799289 0,053698923 0,052616130 0,051550737 0,050502569 0,049471451 0,048457206 0,047459659 0,046478632 0,045513949
1,7 0,044565432 0,043632903 0,042716185 0,041815099 0,040929468 0,040059114 0,039203858 0,038363523 0,037537931 0,036726904
1,8 0,035930266 0,035147838 0,034379445 0,033624911 0,032884058 0,032156713 0,031442700 0,030741845 0,030053974 0,029378914
1,9 0,028716493 0,028066539 0,027428881 0,026803350 0,026189776 0,025587990 0,024997825 0,024419115 0,023851694 0,023295398
2,0 0,022750062 0,022215525 0,021691624 0,021178201 0,020675095 0,020182148 0,019699203 0,019226106 0,018762701 0,018308836

32
Ce qu’il faut retenir !
1. Une série de données variables est caractérisée par sa forme,
sa tendance centrale et sa variation.
2. La plupart des séries de données sont distribuées en forme de
cloche, forme que l’on appelle « distribution normale ».
3. Quand les données sont distribuées normalement, les
propriétés de la courbe normale peuvent être utilisées pour
faire des projections.
4. Quand les données ne sont pas normales, il faut essayer de
les transformer pour obtenir une courbe normale.

33