Académique Documents
Professionnel Documents
Culture Documents
METHODES STATISTIQUES
DE GESTION
MR BENLAMARA HOCINE
I. EXPOSES DE STATISTIQUE DESCRIPTIVE
III.EXERCICES D’ APPLICATION
INTRODUCTION A LA STATISTIQUE
APPLIQUEE
1- DÉFINITION DE LA STATISTIQUE
APPLIQUÉE :
La statistique est la discipline scientifique qui étudie des
phénomènes, en les quantifiant, à travers :
d’abord, l’observation des faits et la collecte des données, très
souvent nombreuses ;
ensuite, leur dépouillement et leurs présentations sous une
forme synthétisée, numérique et/ou graphique ;
enfin, leur traitement et leur compression en un nombre réduit
de paramètres qui facilitent la compréhension et la prise décision
2- COMPOSANTES DE LA
STATISTIQUE :
La statistique fait partie des sciences exactes et constitue une
branche des mathématiques appliquées, avec sa démarche
empirique et son approche inductive, ainsi qu’un ensemble de
techniques qui forment une composante importante du Système
d’Information et d’Aide à la Décision S.I.A.D.
L'avènement de l’informatique et son essor rapide, a permis
de traiter un plus grand nombre de données, mais aussi de
croiser entre elles des séries de données diverses.
Aujourd'hui, elle s'inscrit dans un champ disciplinaire plus vaste
et transverse appelé la Science des Données (Data Science),
et dans laquelle l'ordinateur occupe une place importante.
Le but de la statistique est ainsi d'extraire des informations
pertinentes d'une liste de nombres nombreuse et difficile à
interpréter par une lecture simple et primaire.
DEUX GRANDES FAMILLES DE MÉTHODES : sont alors utilisées
selon les circonstances; on les utilise de façon
complémentaire dans un problème ou un cas concret,
sans omettre qu’ils résolvent des problèmes de natures
distinctes.
Selon la terminologie classique, ce sont ‘LA STATISTIQUE
DESCRIPTIVE’ et ‘LA STATISTIQUE INDUCTIVE’ , appelée
aussi ‘L’INFÉRENCE STATISTIQUE’.
Cette dernière est basée sur la ‘STATISTIQUE MATHÉMATIQUE’ ; car
un changement radical se produit lorsque les données collectées ne
sont plus considérées comme une information complète à
décrypter selon les règles classiques; mais comme une information
partielle à généraliser sur une population plus importante.
Et pour induire des informations sur la population inconnue, il faut
introduire la notion de loi de probabilités : les données collectées
ne constituent, dans ce cas, qu’une réalisation sur un échantillon
représentatif, qui est un sous-ensemble de variables aléatoires,
supposées indépendantes.
LA THÉORIE DES PROBABILITÉS : permet alors :
d'associer les propriétés de l'échantillon à celles qui
sont prêtées à la loi de probabilité, inconnue en toute
rigueur : c'est la Théorie de l‘Echantillonnage ;
de déduire inversement les paramètres de la loi de probabilité
des informations que donne l'échantillon : c'est la Théorie de
l’Estimation, avec son Intervalle de Confiance qui mesurent la
validité de l'estimation et son Degré d’Erreur ;
de procéder à différents tests statistiques : c'est la Théorie des
Tests d’Hypothèses et de la Décision pour confirmer ou infirmer
l’hypothèse étudiée, avec un Seuil de Sécurité ou un Niveau
d’Erreur.
Cette STATISTIQUE APPLIQUÉE est utilisée ainsi dans tous les
divers domaines de l'activité humaine : physique, chimie,
ingénierie, biologie, sociologie, économie, management,
marketing, Audit…
John W. Turkey, grand statisticien américain contemporain,
les classe selon 2 approches statistiques qu’il a dénommées:
‘statistiques exploratoires’ et ‘statistiques confirmatoires’
(exploratory and confirmatory statistics, en anglais) :
• D’abord, on explore les données pour avoir une idée expérimentée
du fonctionnement du système qu'elles représentent ; ce qui va
permettre de formuler des hypothèses cognitives sur les
phénomènes étudiée et leurs propriétés.
• Ensuite, à partir de ces hypothèses de comportement, on élabore
des tests qui permettent de les confirmer ou de les infirmer, en
recourant à d'autres techniques statistiques.
DEMARCHE & CONTENU DE LA STATISTIQUE
1.RECUEIL DES DONNÉES : L'enquête statistique est toujours
précédée d'une phase où sont déterminés les différents caractères
à étudier.
L'étape suivante consiste à choisir la population à étudier. Il se
pose alors le problème de l'échantillonnage : choix de la partie de
la population à sonder; c.à.d., l’échantillon, avec sa taille et sa
représentativité.
- Que ce soit pour un recueil total sur toute la population étudiée,
appelé ‘RECENSEMENT’, rarement utilisé pour le temps et les
moyens qu’il exige.
- Ou un recueil partiel sur une partie réduite de la population,
appelé ‘SONDAGE’ OU ‘ECHANTILLONNAGE’, réalisable et
pertinent.
- Des protocoles sont à mettre en place pour éviter les erreurs de
mesures, qu'elles soient d’ordre accidentel ou répétitif (le biais
statistique).
2.LE PRÉ TRAITEMENT DES DONNÉES : il est important, car une
transformation des données initiales peut considérablement
faciliter les traitements statistiques qui suivront.
3.LE TRAITEMENT DES DONNÉES : Le résultat de l'enquête
statistique se traduira par :
une série de données quantitatives, mesurables, appelées
variables statistiques xi
et/ou de données qualitatives, non mesurables, dénommées
attributs mi.
Pour pouvoir les exploiter, il va être nécessaire d'en faire un
classement et une synthèse numérique. Il sera aussi nécessaire
d'opérer une compression ou résumé des données collectées.
Cette étude sera différente, selon qu’elle porte sur une seule
variable ou sur plusieurs à étudier simultanément.
4. ÉTUDE D'UNE SEULE VARIABLE STATISTIQUE xi :
Le regroupement des données, le calcul des effectifs et des fréquences,
la construction de graphiques permettent un premier résumé visuel
du caractère statistique étudié. Dans le cas d'un caractère quantitatif
continu, l’histogramme, le polygone des fréquences et les courbes
cumulatives… en sont les représentations graphiques les plus
usuelles.
En statistique, on est en général en présence d'un grand nombre de données
collectées. Or, si l'intégralité de ces valeurs forme l'information, il n'est
pas aisé de manipuler plusieurs centaines ou milliers de données, ni d'en
tirer des conclusions : Il faut donc calculer quelques paramètres qui vont
permettre de résumer et analyser ces données ; c'est le rôle des
réductions ou des synthèses statistiques. Celles-ci peuvent être
extrêmement concises et réduites à un seul paramètre : ce sont les
caractéristiques de tendance centrales, de position, de dispersion, de
forme, de concentration …
Certaines d'entre elles sont liées par des lois de probabilités et élaborées
pour permettre une exploitation plus théorique et plus globale des
données.
INTERPRÉTATION ET ANALYSE DES DONNÉES:
??? ??
3- STATISTIQUE
? MATHÉMATIQUE
(LOIS DE PROBABILITÉS)
Échantillon SONDAGE
sur un Echantillon
(peu individus)
Représentatif
Facile à réaliser
2- STATISTIQUE DESCRIPTIVE
‘n’
Individus
Caractère Quantitatif
Exhaustives
& Modalités
Incompatibles
LA PROBLÉMATIQUE DE L’INFÉRENCE STATISTIQUE peut se décliner
à travers par les deux questions ci-après :
Question 1 : Comment choisir un échantillon de façon qu’il soit
représentatif de la population-mère ?
Réponse : Elle est donnée par la théorie de l’Echantillonnage
Question 2 : Comment généraliser les résultats obtenus sur
l’échantillon à toute la population-mère ?
Réponse : Elle est donnée, selon le problème posé, par :
La théorie de l’Estimation
La théorie de la Décision (Tests d’hypothèse)
LES OBJECTIFS DE CETTE STATISTIQUE INDUCTIVE SONT
ALORS DES TROIS (03) TYPES SUIVANTS :
Taille: n≥30 Loi Normale Loi Normale Loi Normale Loi Normale
3. L’Ecart-type : σ = √s2xn/(n-1)
DE STATISTIQUE DESCRIPTIVE
POUR ÉLABORER ET ÉTUDIER L’ÉCHANTILLON
DE STATISTIQUE INDUCTIVE
L’écart-type est plus significatif pour mesurer les écarts entre toutes
les données collectées, car il prend en compte toutes ces données,
sans exception.
Pour une série statistique pondérée, leur formulation est la suivante :
1- V(x) = ∑ ni.(xi-x)2/n = 388,1/37 = 10,5
RECENSEMENT
-Faute de temps &
Population
de moyens
1036 étudiants
Ne peut pas se
réaliser
? STATISTIQUE ?
MATHÉMATIQUE (LOIS DE
PROBABILITÉS)
Échantillon
37 étudiants SONDAGE
sur Echantillon
Représentatif
Peut se réaliser
2- APPROCHE DESCRIPTIVE DE LA
STATISTIQUE
37
Caractère Quantitatif
Individus
Exhaustives
& Modalités
Incompatibles
COMMENT UTILISER LES TABLES STATISTIQUES
1- TABLE DE LA LOI NORMALE
2- TABLE DE LA LOI DE STUDENT
3- TABLE DE LA LOI DU KHI-DEUX
4- TABLE DE LA BINOMIALE
5- TABLE DES NOMBRES ALÉATOIRES
APPLICATION POUR L’ESTIMATION DE L’ETUDE
DE CAS
Problématique : Comment estimer les paramètres de la population
mère sur la base des résultats de l’échantillon ?
1- Etude du caractère quantitatif xi : notes/20
Résultats de l’échantillon: moyenne x=11,7/20 et écart-type s=3,4/20
• Estimation ponctuelle pour la population ? µ = E(x) = 11,7/20
• Estimation avec un intervalle de confiance N.C.=95% ?
N >30 : La loi de probabilité à utiliser est la loi normale. Pour NC=95%, on
lit sur la table statistique de la loi normale, le coefficient critique: z=1,96.
On applique la formule : µ = x ± zxs/√(n-1) = 11,7 ± 1,96x3,4/√36
Soit : µ = 11,7 ± 1,1.
NC = 95% : Je suis sûr à 95% que la moyenne µ ϵ [10,6 ; 12,8]/20
N.B.: De même, on peut trouver avec d’autres niveaux de confiance :
NC = 90% : Je suis sûr à 90% que la moyenne µ ϵ [10,8 ; 12,6]/20
.