Vous êtes sur la page 1sur 47

Université Hassan II de Casablanca Faculté des Sciences Ben M’Sik

DEPARTEMENT DE CHIMIE
Masters GME & VARENAP

Module :
Maîtrise Statistique des Procédés (MSP)
=
Contrôle Statistique des Procédés (CSP)

Pr S. BELOUAFA

Année universitaire 2021-2022


1
Présentation introductive

2
 La maîtrise statistique
des procédés (MSP) est DISPERSION «REGULIERE»

un ensemble de
techniques ayant pour
objectif d’amener un temps

processus dans un état


stable (sous contrôle)
Processus stable
et de le maintenir dans
cet état.
3
DISPERSION «IRREGULIERE»
 Tous les processus • Le processus n’est pas maîtrisé
sont naturellement • Il faut analyser avec MSP
variables et être ???
? ?
sous contrôle n’est ?
?
? ?
?
?
pas un état naturel! ? ?? ?? ?

temps

Processus instable

4
Variabilité

Entrants Sortants

Processus

Variabilité

5
Diagramme Causes-Effet
Milieu Matière Main d'Oeuvre

circuit d'eau couleur


hygiène

circuit d'air odeur


motivation
température texture

formation
propreté propreté

manutentions stérilisation

entreposage débit

lavage température

décongélation entretien

Méthodes Machines

6
Processus amélioré: moins de variabilité à
l’entrée et au cours de la production => moins de
variabilité à la sortie

Entrants Sortants
Processus

MSP
• Optimiser des paramètres
• Éviter les dérives de processus
• Réduire les coûts de non-qualité
• Améliorer la productivité 7
Techniques de la
MSP :
Analyse des données
Plans d’expériences

8
Analyse des données

9
Définition
L’analyse de données (ou le traitement informatique des
données) est une série de processus qui permettent
d’extraire de l’information ou de produire du savoir à partir
de données brutes. Ces processus, une fois programmés,
sont le plus souvent automatisés à l’aide d’ordinateurs.

10
Analyse ?

L’analyse des résultats d’une étude implique la poursuite de trois objectifs :

- Résumer les informations recueillies pour chacune des variables mesurées,

- Découvrir des relations entre certaines de ces variables,

- Généraliser les résultats à la population mère.

11
Analyses possibles
* Suivant le nombre de variables, étudié à la fois, les analyses ne sont pas les mêmes :

Décrire une variable à la fois

Mettre en liaison 2 variables : expliquer

Analyser simultanément plusieurs variables


expliquer

12
Objectifs

– Comprendre les étapes d’une analyse de données.

– Se familiariser avec le logiciel SPSS.

Compétences recherchées

– Comprendre les fondements des méthodes statistiques.

– Savoir interpréter les tables et graphiques issus de ces méthodes.

– Etre capable de mener soi-même une telle étude.


13
Etapes d’une Analyse de données

Encodage
Comment
1e fois quepasser de la matrice
l’on dispose à la base
des données, on de
est données
souvent klk
peu démuni. Comment faire face à cette masse de
variables et de données ? Il faudra disposer d’1 logiciel
Etape nécessaire pour la recherched’an. de données
rapide des erreurs et valeurs aberrantes

Permet de tirer 1 maximum d’information de données par des analyses


descriptives simple

Permet de répondre aux questions posées dans l’étude tout en utilisant des
outils statistiques
Sous forme de textes, tableaux ou de graphiques

Cette écriture sera guidée par les hypothèses de départ


14
Objectifs de l'étude

La première phase consiste à rédiger clairement les objectifs de l'étude en les


décomposant en "domaines d'interrogation".

15
Etapes d’un traitement informatique de données

16
• N variables
• P réponses

L’ «espace d’observation» comme résultats du produit


cartésien entre ces deux ensembles d’éléments :
La matrice

Créer un fichier de données.


Pour cela, il faut élaborer et utiliser un plan de codage

17
Exemple de Tableau de codage

Variable Etiquette de la Etiquette de la Valeur


Variable
id Numéro d’identification
ph pH 1=acide
2=neutre
3=basique
phase 1=solide
2=liquide
3=gaz
V Volume

18
Etapes d’un traitement informatique de données

19
Mise en forme des données et validations de base
Rassembler les données en un fichier rectangulaire et mise en forme du fichier
• Choisir une structure de fichier en accord avec l’analyse qui sera faite.
• Unifier les noms des variables, le codage des variables catégorielles, les unités…
• Choisir des noms explicites pour les variables (8 lettres ou chiffres sans accents)
• Mettre des labels explicites pour les étiquettes de variables (si pas trop longs)
• Coder les valeurs manquantes (blanc, NA, -9999…).

Validations de base
Recherche rapide des erreurs et valeurs aberrantes (intervalle acceptable, relations logiques
entre variables…). Action appropriée dans le fichier mais ne pas “jeter” d’information.
Transformer éventuellement des variables

Outils conseillés
• Excel pour les petits tableaux (manipulations manuelles)
• SPSS pour les grands tableaux et/ou les tâches répétitives et/ou complexes.
Cette étape peut prendre les ¾ du temps de l’étude.
20
Transformation de variables

• Modifier la structure (la forme) d’une variable (recodage) :


modifier la manière dont la variable a été initialement codée pour
satisfaire aux exigences de certaines analyses.
Vous pouvez modifier les valeurs de données en les recodant .
Exemple : fusionner des rendements dans des catégories d’intervalles de
rendement.

• Créer une nouvelle variable : création d’une nouvelle variable


à l’aide d’opérations arithmétiques et/ou d’opérations logiques
sur une ou plusieurs variable(s) d’origine :
Calculer les valeurs d’une variable en fonction des transformations numériques
d’autres variables.

21
Exemple 1 : restreindre l’échelle de pH

a) Passage de 4 modalités à 2 :

Ancienne variable
Très acide faiblement Faiblement Très
Acide basique basique
pH 1 2 3 4

Nouvelle variable
Acide basique
1 2

22
Exemple 2 : l’indice de masse corporelle (IMC)

L’«Indice de masse corporelle» s’obtient en divisant le poids d’un


individu (exprimé en kg) par le carré de sa taille (en mètres).

A partir des variables "Poids" et "Taille" figurant dans un fichier,


on peut donc créer la nouvelle variable "Masse corporelle" :
poids/taille2

23
Exemple 3 : croisement T - pH

Connaissant la T et le pH d’un groupe de réacteurs, on peut créer


une variable composite en définissant 4 modalités :

T = 90°C T = 100°C
pH = 9 1 3
pH = 10 2 4

1 : T de 90°C, pH = 9
2 : T de 90°C, pH = 10
3 : T de 100°C, pH = 9
4 : T de 100°C, pH = 10

24
Etapes d’un traitement informatique de données

25
Analyse exploratoire des données
Objectif
Tirer un maximum d’informations des données par des analyses
descriptives simples. Etudier les distributions des variables et les
relations entre elles.

Méthodes
• Pour chaque variable, dessiner la distribution (histogramme ou
diagramme en barres), la résumer par quelques indices (min,
max, moyenne, médiane, tableau de fréquence),
• Pour chaque couple de variables étudier la relation qui les lie
(graphe X-Y ou table de contingence),
• Quand le nombre de variables est grand, utiliser des techniques
d’analyse de données (composantes principales, …).
26
Les mesures d’association: Quel intérêt ?

 Explorer les liens entre les variables analysées (sont


elles liées? )
 Expliquer une variable par une autre
 Faciliter la prise de décision

27
Relation entre deux variables
Description des caractéristiques d’un ensemble d’observations
à partir de deux variables : étude de la relation entre variables
(statistique bivariée).

• Corrélation (Spermann, Kendall, Pearson)

• Régression linéaire simple

28
Corrélation
La corrélation mesure la relation linéaire entre deux variables.

La corrélation peut prendre des valeurs entre –1 et 1 avec :

• proche de –1 : forte relation négative,

• proche de 0 : pas de relation linéaire,

• proche de 1 : forte relation positive.

29
30
31
Relation entre variables quantitatives
Corrélation de Bravais-Pearson
La corrélation r de Pearson est une mesure d’association
paramétrique pour deux variables aléatoires continues

32
Ex :Relation taille-poids

33
Relation entre variables qualitatives
Deux variables qualitatives de types nominales :
• Tableau croisé (cf. cours d’Excel).
Deux variables qualitatives de types ordinales :
• corrélation de rangs avec les coefficients de corrélation rhô de
Spearman et tau de Kendall.

34
Corrélation rhô de Spearman
Le rhô de Spearman est une mesure d’association non paramétrique
basée sur le rang des valeurs des données.

Il peut être utilisé pour des données qualitatives et pour des valeurs
extrêmes. Pour cela, remplacez les valeurs par des rangs, c’est-à-dire
remplacez xi par Ri et yi par Si

35
Corrélation rhô de Spearman

36
Corrélation tau de Kendall
Le tau de Kendall est une mesure d’association non paramétrique
basée sur le nombre de concordance et de non concordance dans
les pairs d’observations.
La concordance a lieu lorsque les pairs d’observations varient
ensemble et la discordance lorsque les pairs d’observations varient
de manière différente.

On compte combien de segments sont orientés vers le


haut et combien sont orientés vers le bas :

37
Corrélation tau de Kendall :

relation pas de relation

38
Corrélation
Il est primordial de vérifier la linéarité de la relation, car :

• Corrélation linéaire de valeur nulle ne veut pas dire qu’il


n’existe pas de relation entre les variables, p.ex.: relation
quadratique.

• La mesure de la corrélation est très sensible aux données


extrêmes. Il est possible d’obtenir une corrélation linéaire
significative même s’il n’y a pas de relation entre les variables.

39
Régression linéaire simple
Permet de mesurer la relation linéaire entre deux variables, tout comme la
corrélation, mais elle donne une direction à la relation : c’est la VI qui
explique, et qui est la cause de la variation de la VD.

Le but de cette mesure est de savoir :

(1) si cette relation est présente

(2) quelle est sa force (quel pourcentage de la variance de la VD, la VI peut


expliquer)

(3) Comment utiliser ce résultat pour pouvoir prédire la VD sur d’autres


sujets pour lesquels on connaît la valeur de la VI.
40
Régression linéaire simple
Equation de la droite de régression :

Y= a + b.X
Y : la variable dépendante (VD)

X : la variable indépendante (VI)

a : ordonnée à l’origine (intercept) de la droite de régression

b : pente (slope) de la droite de régression

41
Régression linéaire simple : R-deux ajusté
R-deux ajusté : pourcentage de variance expliquée par la

variable indépendante.

R-deux ajusté entre 0 et 1

• proche de 1 : la valeur VI prédit presque exactement la valeur


de la VD.

• proche de 0 : la VI n’arrive pas à prédire la VD.

42
Etapes d’un traitement informatique de données

43
Analyse statistique pour répondre à la question
Objectifs
- Répondre aux questions posées dans l’étude.
- Tirer un maximum d’informations supplémentaires des données.

Méthododologie
• Rechercher les méthodes statistiques utiles pour répondre aux questions et qui soient
adaptées aux variables en jeu (quantitative ou qualitative).
• Effectuer les analyses avec si possible plusieurs méthodes (ex. Test param – non-param)
et tester plusieurs variantes des méthodes (transformer les variables, sélection de variables
dans les modèles…).
• Valider les hypothèses et recherche de points influents (normalité…).
• Comparer, recouper les résultats des différentes analyse à l’aide de graphiques et d’indices
statistiques. Tenter de comprendre la source des différences.

L’analyse statistique est un processus itératif

44
Etapes d’un traitement informatique de données

45
Exportation des résultats, préparation du rapport
Types de résultats : textes, tableaux et graphiques
Mode de sauvegarde de résultats :
Dans un traitement de texte (Word), sous forme HTML, sous forme de fichier
texte ou graphique (EPS, GIF…), sous forme de fichier “intelligent” lié au
logiciel qui l’a produit.
Méthode de transfert des résultats du logiciel de traitement de texte :
Via fichiers ou par copier/coller
Recommandations
• Mettre les résultats (tableaux, graphiques) en forme dans le logiciel statistique.
• Documenter rapidement les analyses liées à chaque sortie.
• Attention aux pertes de qualité dans le copier/coller. Utiliser le “copier special”
dans Word.
46
Définition de l’étude

Collecte des données

Analyse et constat

Durée entre 2 mois et 8 mois


oui
Procédé en
anomalie

Recherche des causes avec


les acteurs du processus

Propositions d’actions
correctives

Contrôle de l’efficacité des


actions correctives
47

Vous aimerez peut-être aussi