Vous êtes sur la page 1sur 37

DÉMARCHE STATISTIQUES « 

OUTILS D’AIDE
À LA PRISE DE LA DÉCISION »

Pr: Mohamed Nohair


Volume horaire
Evaluation
Contrôle
SOMMAIRE
1. Statistiques descriptives
Organisation des données (tableaux et graphiques)
Indicateurs statistiques (moyenne, variance, coefficient de
variation…..)
2. Approche probabiliste
Notion de variable aléatoire
Lois de probabilités discrètes et continues (loi binomiale et
normale)
3. Statistique inférentielle
Approche de l’Echantillonnage
Estimation par intervalles de confiance
4. Maitrise statistique des procédés MSP
Les Statistiques et le management de la qualité

Documents techniques

Norme ISO 5725- 1 à 6 : Exactitude (justesse et fidélité) des


résultats et méthodes de mesure (1994)
GUM : Guide to the Expression of Uncertainty in
Measurement – Guide pour l’expression de l’incertitude de
mesure (NF X07-020 (1999)

Guide EURACHEM/CITAC : Quantifier l’incertitude dans les


mesures analytiques (2000 –
Documents normatifs

Norme ISO 17025 : 2005 ≪ Prescriptions générales


concernant la compétence des laboratoires d’étalonnages et
d’essais ≫
Norme ISO 15189 : 2003 ≪ Laboratoires d’analyses de
biologie médicale – Exigences particulières concernant la
qualité et la compétence ≫
GBEA Guide de Bonne Exécution des Analyses de Biologie
Médicale
Norme ISO 9001:2000 : Maitrise des dispositifs de
surveillance et de mesure
Pourquoi une démarche statistique pour la prise de
décision

Laboratoire
d’analyse..proces Fiabilité d’une
Mesure
s mesure

ISO 17025
ISO 5725
Système d’assurance GBEA
IS0 9000
qualité ISO 15189
Evénement: variation d’un caractère

Statistique Lois de Statistique


descriptive probabilité inférentielle
• Organiser les • Lois de • Relation entre
données probabilité pop. et échan.
• Descripteurs.. • modélisation • Estimation..

Maitrise stat
des procédés
1. Introduction
C’est un ensemble de méthodes, outils appropriés, servant à
décrire un ensemble d’individus avec un caractère bien
défini

Organisations appropriées (regroupement…)


Des représentations graphiques (histogrammes….)
Calcul algébrique: des indicateurs qui décrivent la
variabilité d’un caractère
2. Nomenclature et définitions
On réalise une analyse statistique sur un ensemble
d’observations sur lesquelles on mesure une quantité
descriptive

Vocabulaire spécifique

Population; Echantillon
Caractère; Propriété; Variable statistique
Modalité d’une variable
a. Population
Un ensemble d’individus ou d’obs
bien définie
Homogène
b. Caractère
Caractère = particularité à étudier dans une population
Caractère = poids et taille d’individus; température et couleur
d’une substance
Caractère : variable statistique

population caractère
Un ensemble d’individus Taille; poids; revenu
Un ensemble de pièces conformité
Un ensemble de familles Nbre d’enfants
Quantitatif : mesurable, discret ou continu
Caractère
Qualitatif : non mesurable, nominal ou ordinal

Nom Sexe Age (années) Sit Familiale Nb d'enfants Salaire men


Omar M 35 Marié 3 1 850
Ahmed M 24 Célibataire 0 2 500
Mohamed M 18 Célibataire 0 20 000
amine M 42 Marié 2 12 600
Said M 33 Mariée 1 4 900
mohamed M 47 Marié 4 8 000
Myriam F 26 Mariée 0 20 300
nadir M 30 Célibataire 0 20 500

Nominal continu nominal discret continu


c. Modalités
Un caractère présente plusieurs modalités: états ou
valeurs

Une unité statistique (obs, individu)  Une seule modalité


nominale ordinale Echelle de rapport

• Région • Pot. Physique • taille


• profession (faible, fort..) • rendement
• Ni. scolaire

qualitatif quantitatif
Exple: distribution des ménages en fonction du nombre d’enfant

Echantillon aléatoire
Population
100 familles

modalités
Nombre
0 1 2 3 4 et +
d’enfants

N° famille 1 2 3 4 …. i 97 98 99 100
Nb enfants 2 0 0 2 3 1 1 4 1
Modalités Fréquences

Nombre d’enfants effectifs


0 42
1 18
2 33
3 5
4 et + 2

Distribution de fréquences absolue


d. Fréquence absolue, relative et cumulée
Fréquence abs: nombre d’obs ayant la même modalité

Pour p modalité

Fréquence relative:

Fréquence cumulée pour une valeur x: nombre d’obs ayant


une valeur du caractère inférieure ou égale à la valeur x
Exple: distribution des ménages en fonction du nombre d’enfant

Population : 100 familles


Variable statistique: nb d’enfants

Nb. d’enfants Fréq. abs Fréq. rel Fréq. Fréq.


(modalités) cumulée cumulée rel
0 42 42/100=0,42 42 0,42
1 18 0,18 42+18=60 0,60
2 33 0,33 93 =60+33 0,93
3 5 0,05 98 0,98
4 et plus 2 0,02 100 1
Somme=100
Exple : une population de 100 individus
Tailles (m ) Effectifs ni Tailles (m ) Effectifs ni

1,53 1 1,76 9
1,58 1 1,77 5
1,59 1 1,78 4
1,62 3 1,79 1
1,63 1 1,8 5
taille 1,64 1 1,81 4
1,66 4 1,82 3
1,67 4 1,83 5
1,68 5 1,84 3
1,69 4 1,85 1
1,7 2 1,86 1
1,71 6 1,88 1
1,72 3 1,89 2
1,73 5 1,92 1
1,74 8 1,93 1
1,75 4 2,01 1

Population : 100 individus


Taille : caractère étudié ou la variable statistique
3. Organisation de données (distribution et tableau
statistique)
a. Introduction

Organiser les données dans des structures


meilleure interprétation

Regroupement de données par modalité


b. Cas d’un caractère quantitatif: groupement par
classe
Exple: nombre de problème d’un système info pendant 40 semaine
15 18 23 26 36 36 36 24
26 26 26 36 39 39 39 27
34 34 35 39 49 51 51 36
38 39 39 49 26 26 26 44
45 45 45 25 28 31 34 52

Population : 40 semaines
Caractère ou variable statistique : nombre de panne
Regrouper les données dans des intervalles:

Exemple: intervalle entre 14 et 20: [14-20[

Nbr de semaine ayant la modalité [14-20[ est 2


Nbr de semaine ayant la modalité [38-44[ est 7

Classes fréquences absolue

14X<20 2
20X<26 3
26X<32 10
32X<38 9
38X<44 7
44X<50 6
50X<56 3
Considérations pratiques

Définir le nbre de classes et leurs amplitudes

Nbr de classe : k= 1+3.322*log10(n)


Amplitude : amplitude = (max –min)/k
1. Le nbre de classe doit être entre 6 et 12
2. Les classes de même amplitude
3. Arrondir le nbre de classe (nbr entier)
4. Définir la valeur initiale < la plus petite valeur

Nbr de classes = 1+3.322*log10(40) = 6,3222


Amplitude = (52-15)/6,322 = 5,854
On commence par 14
Exples
Age moyen des cadres dans
une entreprise
Age moyen
Ancienneté des employés
26 31 34 35 37 38 40 43 44 46
ancienneté
26 31 34 35 37 39 40 43 44 46
7 9,5 10,5 11,4 12,4 14
26 31 34 35 38 39 40 43 45 46
7,1 9,8 10,6 11,5 12,5 14,1
30 32 34 36 38 39 41 43 45 46 7,3 9,8 11 11,6 12,6 14,6
31 32 34 36 38 39 41 43 45 47 8 10 11 11,9 12,6 15
31 32 34 36 38 39 41 44 46 47 8,2 10,2 11 11,9 12,8 15,4
31 32 35 37 38 39 41 44 46 47 8,3 10,2 11,1 12 13,1 15,6
31 32 35 37 38 40 41 44 46 47 8,4 10,3 11,1 12 13,1 16,3
31 32 35 37 38 40 42 44 46 47 9,3 10,3 11,2 12,1 13,2 16,3
31 32 35 37 38 40 42 44 46 47 9,4 10,4 11,2 12,1 13,4 16,8
9,4 10,5 11,4 12,2 13,8   17
c. Cas ou le caractère est discret: distribution de
fréquence absolue ou relative.
Le dépouillement se fait par les valeurs du caractère
Exple : le nombre d’absence pour dans un mois : 22 jours

Nb d’absence Nb de jours Fr. Relatives


Nombre d’absence dans un mois (22 jours) 0 5 0,2273
1 3 0,1364
0 1 9 8 0 0 3 1 0 2 4 0,1818
3 3 0,1364
0 2 5 9 2 4 2 3 8 4 1 0,0455
5 1 0,0455
6 0 0
1 9 3 2          
7 0 0
8 2 0,0909
9 3 0,1364
  Somme =22 1
4. Présentation graphique des résultats
a. Introduction
La représentation graphique permet
Une meilleure visualisation de la distribution
Un résumé et une vue d’ensemble
Comparaison des résultats

Les  graphiques sont:


Diagramme en bâtons
Histogrammes
Polygone de fréq. Abs
Courbes de fréq. Cumulées
b. Diagramme en bâtons
La variable est quantitative et discrète
Exple : le nbre d’erreurs d’assemblage pr des appareils elec
dans une usine (396 appareils)

Nombre Nombre
d’erreurs d’appareils
0 101
1 140
2 92 160
3 42 140
4 18 120 Nombre d’appareils
5 3 100
80
60
40
20
0
0 1 2 3 4 5
c. Histogramme
La variable est continue et présenté suivant une distribution en
classes
1. L’histogramme est un ensemble de rectangles
2. La base est égale à l’intervalle de la classe
3. L’aire est proportionnelle à la fréquence abs ou l’effectif

Exple: résultat au test d’aptitude générale de 62 candidats


Résultat au test
93 104 93 79 78 112 107 100 105 102 107 107
119 94 87 113 98 86 124 93 99 97 83 95
99 98 77 101 104 138 97 74 99 85 93 98
84 110 102 75 104 100 84 101 82 85 85 92
86 101 70 108 89 68 123 63 86 62 90 77
94 96
Regroupement par classe et Représentation graphique

classes Fréquence
absolue
60 ≤ variable < 70 3
70 ≤ variable < 80 7
80 ≤ variable < 90 12
90 ≤variable < 100 18
100 ≤variable < 110 15 20 18
110 ≤ variable < 120 4
16 15
120 ≤ variable < 130 2
12
130 ≤ variable < 140 1 12
8 7
3 4
4 2
0 1 0
0
Les classes n’ont pas le même amplitude

Densité d’effectif Surface du rectangle

Exple: population de locataire d’un quartier et loyer en euros


Loyer annuel Effectif Densité d’effectifs
[5000, 6000[ 50 0,050=50/1000
[6000, 7000[ 120 0,120
[7000, 9000[ 150 0,075
[9000, 11000[ 80 0,040 =80/2000
[11000, 13000[ 60 0,030
[13000, 15000[ 40 0,020
N=400
On peut prendre comme unité la plus petite ou la plus grande
des amplitudes. On divise l’effectif par l’amplitude par
rapport l’amplitude élémentaire
L’unité d’amplitude est égale à 2000

• [5000, 6000[ 50*2=100


• [6000, 7000[ 120*2=240
c. Courbe de fréquence cumulée

Exple: montant investi par 127 personnes dans des dépôts garanti

Montants investi Nombre de


particuliers
1000X<5000 52
5000X<9000 25
9000X<13000 18
13000X<17000 13 Limites Fréquences
17000X<21000 7 supérieures cumulées
6 Moins de1000 0
21000X<25000 Moins de 5000 52
25000X<29000 4 Moins de 9000 77
29000X<33000 2 Moins de 13000 95
Moins de 17000 108
Moins de 21000 115
Moins de 25000 121
Moins de 29000 125
Moins de 33000 127
Courbe de fréquence cumulée croissante:
1. Abscisse: limites supérieures des classes
2. Ordonnée: fréquences cumulées
3. Les points sont rattachés par des portions de droites

Fréquences cumulées
140
125 127
120 121
115
108
100
95
80 77
60
52
40

20

0 0
1000 6000 11000 16000 21000 26000 31000 36000
limite supérieure des classes
Cette courbe permet de répondre à plusieurs questions:

1. Combien de particuliers ont investi moins de 17000  108


2. Combien de particuliers ont investi au moins 17000  127-
108
3. Combien de particuliers ont investi plus de 9000, mais moins
de 25000 (9000 ≤x<25000)  121-77=44

Combien de particuliers ont investi moins de 20000 (17000 ≤x<21000)


F(17000)= 108 et F(21000)= 115
Par interpolation dans la classes:
5. Couple de variables statistiques
Les deux variables sont de nature: qualitatives, quantitatives,
discrets…. Avec  modalités xi et yi
Distributions (X,Y) tableau de contingence

Exple: distributions de deux variables (âge et salaire) de 16 employés dans un


restaurant
Salaire 170-200 200-230 230-260
Age
20-22 3 1 0 4
22-24 2 3 0 5
24-26 1 5 1 7
6 9 1

Le nbre d’employés ayant entre 22 et 24


et gagnant entre 170-200 euros
la valeur 9 représente le nombre d’employés
gagnant entre 200 et 230 euros
a. Fréquence relative
Elle représente la proportion d’individus de modalité (xi, yj) du
couple (X, Y)

b. Fréquence marginale
Pour le couple (X, Y), les lois marginales de X et Y sont :
• La loi de X quelque soit les valeurs de Y
• La loi de Y quelque soit les valeurs de X

Y=Salaire 170-200 200-230 230-260


X=Age
20-22 3 1 0 4
22-24 2 3 0 5
24-26 1 5 1 7
6 9 1
c. Fréquence conditionnelle
Fréquence conditionnelle xi sachant yj est notée fi/j: la
proportion d’individus de modalité (xi, yj) par rapport à yj

Y= Salaire 170-200 200-230 230-260


X=Age
20-22 3 (3/6) 1 (1/9) 0 (0/1) 4
22-24 2 (2/6) 3 0 5
24-26 1 (1/6) 5 1 7
6 9 1

Salaire 170-200 200-230 230-260


Age
20-22 3 (3/4) 1 (1/4) 0 (0/4) 4
22-24 2 3 0 5
24-26 1 5 (5/7) 1 7
6 9 1
d. Indépendance
En général, on cherche l’existence d’une relation entre X et Y

1. Indépendance: taille et salaire


2. Dépendance: relation fonctionnelle (cas de grandeurs
physiques)
3. Dépendance plus au moins marquée:  des indices pour
quantifier cette proximité
X est indépendante de Y si les variations de Y n’entraînent
par de variation de X
Lorsque les fréquences observées pour les distributions
conditionnelles sont toutes identiques, ce qui veut dire que
la distribution de Y sachant que X= x1 est identique à celle
de Y sachant que X=x2…alors X et Y sont indépendantes

Exple : la fréquence conditionnelle de la modalité 170-200 pour


les différentes modalités de X sont les suivantes 3/4, 2/5 et
1/7

Ces valeurs ne sont pas égales ; on peut conclure que X et Y


ne sont pas indépendants
• ne dépend que de j et est indépendant de i donc de X
• Et plus généralement si X et Y sont indépendants si :

Vous aimerez peut-être aussi