Vous êtes sur la page 1sur 23

Méthodes statistiques et

d’échantillonnage

Dr H. Bournine-Amrane

1
Le Programme
Chapitre 1. Rappel sur les éléments d’analyse combinatoire
et les probabilités
1. Éléments d'analyse combinatoire
2. Axiomes du calcul des probabilités
3. Les schémas de tirages probabilistes : Tirage exhaustif,
Tirage de Bernoulli
4. Probabilité de Bayes
5. Les variables aléatoires

2
Introduction :

•Comment peut-on prédire le nombre d’écoles, d’hôpitaux ou même d’habitats à


construire sur les 5 ans à venir si on veut un service adéquat ?

•Comment décider de la durée de vie efficace des équipements dans une usine ?

•Comment dimensionner des pièces qui peuvent survivre leurs environnements


et conditions de travails ?

•Comment prédire les besoins en pièces de rechange pour que la production ne


s’arrête pas de manière efficiente

3
Introduction :

•Comment peut-on prédire le nombre d’écoles, d’hôpitaux ou même d’habitats à


construire sur les 5 ans à venir si on veut un service adéquat ?

•Comment décider de la durée de vie efficace des équipements dans une usine ?

•Comment dimensionner des pièces qui peuvent survivre leurs environnements


et conditions de travail ?

•Comment prédire les besoins en pièces de rechange pour que la production ne


s’arrête pas de manière efficiente

La prise de décisions

4
Introduction

La prise de décision informées

•Le passé, présent •Le future, la prise de décision


• Statistique descriptive •Statistique inférentielle
•Statistique inférentielle •Probabilité

 Analyse de donnée et
interprétation

5
Analyse de données et interprétation
L’objectif de l’analyse statistique est de mettre en évidence les
phénomènes et les comportements d’une population.

De manière élémentaire ceci est fait par des représentations


graphiques et des résumés synthétiques des données récoltées
expérimentalement d’une population ou un échantillon.

6
Analyse de données et interprétation
1
La
6 problématique :
le but de 2
Interprétation l’analyse
des résultats et Collecte de
extrapolation données

5 3
Analyse des Data
données processing :
4 Traitement des
Nettoyage des données
données

7
Analyse de données et interprétation
1. La problématique : le but de l’analyse:

L’analyse se fait pour


 rependre à des questions,
 prouver des hypothèses
 réfuter des théorèmes.

Il est impératif de bien comprendre la problématique


(conditions) pour bien concevoir l’expérience.

Conditions de l’étude Conception d’expérience

8
Analyse de données et interprétation
1. La problématique : le but de l’analyse:
Exemple:
Exemples
1. Mener une étude sur les retard des étudiants aux cours leurs
fréquences et leurs causes

2. Tester une nouvelle série de filtres d’une centrifugeuse à l’huile car


l’ancien modèle a été discontinu. 3 types compatibles avec la machine
sont disponibles sur le marché.Vous êtes sensé mener une étude
technique pour assister le management à choisir.

Conditions de l’étude Conception d’expérience

9
Analyse de données et interprétation
Exemple:
Tester une nouvelle série de filtres d’une centrifugeuse à l’huile car l’ancien
modèle a été discontinu. 3 types compatibles avec la machine sont disponibles
sur le marché.Vous êtes sensé mener une étude technique pour assister le
management à choisir.

Population : filtres
Type d’expérience: Essayer un échantillon stratifié des 3 types de filtres.
Données à récoltées:
Durée de vie des filtres = Magasin/ maintenances
Qualité du produit (l’huile) filtré = Laboratoire de control qualité

Protocole: Tester 10 filtres / types numéroté de manière aléatoire de 1 à 30


Les testes aveugles, le personnel ne doit pas savoir chaque pièce est de quel
type.
Les pièces étiquetées (numérotées) sont placées au magasin.
Chaque pièce doit être accompagnée d’une fiche à renseigner (diapo suivante).
10
Analyse de données et interprétation
Fiche de renseignement des filtres
Exemple: Pièce Numéro : ……….
Date de mise en marche : …………………………………..
Date de fin de fonctionnement : ……………………………………….
Machine : ………
Mesures de Qualité de l’huile filtrée

Date
Densité
Quantité de
particule
Observations :
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
11
Analyse de données et interprétation
2. La collecte des données :

2.1 La source des données peut être divisée en deux catégories :


Monde réel : Observation, Enquêtes ( Surveys), mesures etc.
Simulations théoriques : (données obtenues par modélisation)

12
Analyse de données et interprétation
2. La collecte des données :

2.2 Types de données


Les données peuvent être classifiées en 2 groupes, selon leurs natures et
celles des études qu’on peut leurs imposer: quantitatives et
qualitatives

données quantitatives données qualitatives


Valeurs numériques Détails non numériques qui peuvent
être repartis en groupes bien définis

peuvent être analysées peuvent être observées et non pas


statistiquement évaluées
Exemples: dimensions, poids, Exemple : couleurs, sentiment,
temps, prix, température, apparence, odeurs, etc.
compteur d’unité
13
Analyse de données et interprétation
N° Poids (kg) Sport pratiqué Taille (m)
2. La collecte des données :
1 58 Marche 1,80
2 58 Danse 1,59
2.2 Types de données
3 64 Natation 1,63
exemples: 4 71 Football 1,65
5 94 Football 1,90
6 92 Musculation 1,78
7 94 Marche 1,71
8 52 Natation 1,70
9 86 Football 2,11
10 68 Marche 1,68
11 81 Velo 1,59
12 64 velo 1,57
13 76 Football 1,59
14 72 Marche 1,63
15 72 Football 1,77
Données Données
quantitatives qualitatives
14
Analyse de données et interprétation
2.2 Types de données: Les données qualitatives sont utilisées pour
regrouper les réponses similaires en catégories
identifier les modèles communs
En tirer un sens de ce qui parait non lié.
Elles peuvent être triées (selon un ordre nominal ou ordinal).
mais ne permettent pas d’établir une distance entre les mesures.
Il est seulement possible de vérifier si deux valeurs sont égales.
Processus d’analyse non linéaire : Les données ne sont pas toujours
numériques, interprétation des textes et protocoles, prendre en
considération l’aspect humain

15
Analyse de données et interprétation
2.2 Types de données: Les données quantitatives sont utilisées pour
mesurer l’étendue du changement qui a eu lieu et
pour estimer la consistance des données.
Elles peuvent être triées selon leur valeur numérique.
Elles permettent aussi de définir une distance entre les mesures.
Elles peuvent être continues ou discrètes.
Le processus d’analyse est linéaire: Collecte de données => mettre
les données en format analysable => analyse statistique

16
Analyse de données et interprétation
2.2 Types de données: Les données quantitatives
Compteur : du nombre d’entrée (participants, pièces etc.), ex. Nombre de
pièces qui tombent en panne / temps, Nombre de participant à une étude
etc.

Mesure d’une quantité physique : tout phénomène physique mesurable ex.


dimensions, mass, temps, température, pression, vitesse etc.

Projection de données: une projection dans le futur qui se fait par un


algorithme ou un autre outil mathématique ex. la croissance de la
consommation d’énergie, les besoins en matière première ou pièces de
rechange etc.

Quantification des valeurs qualitatives: ca se fait par l’attribution d’une


échelle (ex. de 0 à 10) à un phénomène non quantifiable ex. couleur,
appréciation.

17
Analyse de données et interprétation
3. Data processing: traitement des données :
Les données sont transférés de l’état expérimental à un regroupement
analysable
Les tableaux à entrées multiples: c’est la méthode préférée en analyse
statistique vu sa simplicité et la facilité de comparer les données

Représentation des données :


La quantité de données à représenter dépend essentiellement du nombre
de paramètres d’intérêt (dimension) et du nombre de mesures à considérer
(domaines).

18
Analyse de données et interprétation
4. Data cleaning : nettoyage des données
Les donnée traitées et structurées à présents peuvent contenir des
erreurs( manque d’information),
Des valeurs erronées
Des valeurs manquantes
Des entrées dupliquées.

Le nettoyage consiste à omettre ou corriger ces erreurs

Ca peut se faire en comparant les enregistrements, identifier les


inexactitudes etc., omettre les duplications et les données
incomplètes, parfois même vérifier des ressources externes,
repérages des valeurs inadmissibles

19
Analyse de données et interprétation
4. Analyse des données:
Analyse des données est le procédés qui prends des donnée crues et les
convertis en série d’information utile dans la prise de décision.
Ca se fait en plusieurs étapes itérative :

Analyse
exploratrice
La collecte Les données Nettoyage des
des données traitées données
crues
Modèles et
Algorithmes

Le produit de Communication
Réalité
l’analyse Rapport

Prise de
décision
20
Analyse de données et interprétation
4. Analyse des données:
On applique des statistiques descriptives pour vérifier la consistance
des données.

Pour chacune des variables, les données peuvent être représentées

graphiquement en utilisant des diagrammes en bâton, histogramme,


diagramme-boite, graphiques cumulatifs, diagrammes en colonnes, en barre ou en
secteurs.

En parallèle les grandeurs suivantes sont définies médiane, mode,


moyenne, fréquence, variance, écart-type etc.

21
Analyse de données et interprétation
4. Modélisation et Algorithme:
Des formules mathématiques peuvent être appliquées pour identifier les
relations entres les différentes variables.

On parle des outils de statistique inférentielle tel que la corrélation,


rapport de corrélation, régression. Ces notions sont associées a différents
graphiques comme le nuage de points (scatterplot), les diagrammes-boites
parallèles, les diagrammes de profiles ou encore en mosaïque.

En général le but est d’évaluer une variable précise et d’étudier


les effets des autres variables

22
Analyse de données et interprétation
5. Produit de l’analyse :
C’est un model mathématique et/ou une application informatique qui prend
data inputs et génère outputs qui peut être utilisé dans le monde réel pour
prédire les comportements.

Pour l’exemple de maintenance c’est la moyenne de durée de vie et la


qualité du filtre qui peuvent être utilisé dans la maintenance systématique
l’approvisionnement

6. Communication :
l’analyste est souvent amené a rédiger des rapports compréhensibles par le
publique en général en forme de graphs, conclusions et des
recommandations

Pour l’exemple de maintenance ce le rapport contenant les résultats en


graphs et en grandeurs statistiques, et les conclusions et recommandations
de l’analyste

23

Vous aimerez peut-être aussi