Vous êtes sur la page 1sur 28

PROGICIELS DE STATISTIQUE EN GESTION

M2 / ANNÉE : 2022– 2023 TOAMASINA


La logique de notre cours s’articule autour de quatre grands thèmes :
 Connaissance de l’environnement logiciel appliquée à la Statistique
 Lois de la probabilité statistique
 Statistique inférentielle
 Application de progiciel statistique en gestion
Ce cours a pour objectif général de vous familiariser avec le concept d’étude statistique et ses
applications à travers de progiciels
Dr Jean Baptiste RAKOTOARIVELO
Enseignant - Chercheur
Docteur en Informatique
Maître de conférences
E-mail : rjbravelo@yahoo.fr

Dr Jean Baptiste RAKOTOARIVELO / Principes de Gestion : Université Catholique ASJA Antsirabe


22/08/202
année : 2022 3 1
Quelles sont les étapes d'une étude statistique ?

Une étude statistique peut être découpée en plusieurs étapes :


1.Définition des objectifs.
2.Vérification de l'existant (études et données)
3.Faisabilité de l'étude.
4.Définition de la variable à expliquer.
5.Nettoyage, exploration et préparation des données.
6.Présentation des données (Statistiques descriptives)

C'est quoi une Etude statistique ?


L'étude statistique correspond à l'étude d'un fait par le biais de la collecte, de l'analyse, de l'interprétation et
de la représentation de données qui dans la finalité doivent être compréhensible par tous.

Quel est le but d'une étude statistique ?


Le but de la statistique est d'extraire des informations pertinentes d'une liste de nombres difficile à
interpréter par une simple lecture. Deux grandes familles de méthodes sont utilisées selon les
circonstances.
Quels sont les différents types de statistiques ?
Les types de statistiques peuvent être subdivisés en deux grandes branches : descriptive et inférentielle.
•Statistiques descriptives: Désigne les méthodes de collecte, d'organisation, de synthèse et de présentation
d'un ensemble de données. ...
•Statistiques déductives: C'est un pas au-delà de la simple description

C'est quoi un outil statistique ?


A toutes ces questions, l'une des réponses les plus adaptées est sans conteste l'outil statistique : il permet
en effet d'extraire des connaissances à partir d'un ensemble de données et de fournir des éléments
significatifs et opérationnels pour une prise de décision adaptée.

Quelles sont les 3 étapes pour traiter les racines d'un problème ?
•Définir le problème à traiter. La première étape est de bien intégrer les tenants et aboutissants de la
problématique à résoudre. ...
•Identifier les causes. ...
•Trouver une solution. ...
•Lancer les actions : mettre en oeuvre la solution retenue. ...
•Suivre l'efficacité de la solution et de sa mise en oeuvre.
Quel est le meilleur logiciel statistique ?
Les meilleurs logiciels d'analyse statistique gratuits et open source
•DataWrangler.
•Google Refine.
•SPSS.
•Onisa.
•OpenStat.
Meilleurs logiciels de statistiques et analyse de données

Les logiciels de statistique et d’analyse de données sont devenus de nos jours des solutions
indispensables pour toutes les entreprises et les plateformes désireuses de mesurer leurs
performances. Ces dernières années, ces outils se sont au fur et à mesure perfectionnés.
Avec ces logiciels, il est désormais possible pour un grand nombre de développeurs
d’interpréter avec beaucoup plus de précision de nombreux résultats d’analyse et de collecte
de données. Découvrons ici une sélection des meilleurs logiciels de statistiques.
Microsoft Excel est sans aucun doute le logiciel d’analyse et de traitement de données le plus basique,
étant donné qu’il est directement contenu dans le package bureautique de Microsoft Office. Parfaitement
utile tant pour vos besoins professionnels que personnels, ce logiciel vous permet, grâce à des
opérations simples et pratiques, de présenter, d’analyser et d’interpréter à partir de feuilles de calcul, une
multitude de données.

Grâce à ses multiples fonctionnalités, il dispose d’une large palette d’outils de calcul qui vous permet 
d’effectuer de nombreuses opérations comme les moyennes, les écarts types, etc. Microsoft Excel
dispose également d’options plus avancées comme les finances, les graphiques, les diagrammes et bien
d’autres encore pour vous permettre d’aller au-delà de simples analyses. Doté d’une interface simple et
facile à prendre en main. Il est téléchargeable sur les plateformes Windows.

Stata est une solution complète d’analyse, de gestion et d’interprétation de données. Statistiques. Grâce
à ses fonctions complètes, il permet une analyse statistique précise de toutes vos données, grâce à des
outils d’analyses et de visualisation optimisés. Doté d’une interface très simple, il est facile d’utilisation et
dispose d’un répertoire de fonctionnalités absolument à portée de main. C’est un logiciel professionnel
parfaitement adapté aux économistes et aux personnes intervenant dans le domaine de la médecine.
IBM SPSS est un logiciel complet d’analyses de données statistiques. Ce logiciel dispose d’un vaste
répertoire d’algorithmes automatisés qui facilitent les opérations d’analyses descriptives et prédictives.
C’est le logiciel d’analyse de données par excellence, car il dispose de nombreuses fonctionnalités qui
facilitent une étude statistique plus efficace.
Grâce à ce logiciel, vous pouvez aisément effectuer plusieurs opérations comme les calculs de moyennes,
d’écart type, des sommes, des fréquences, etc. Pour une interprétation plus optimale, le logiciel vous
propose plusieurs modèles de graphiques aussi divers que variés. Vous pouvez aussi, grâce à SPSS
exporter toutes vos données vers d’autres logiciels de votre choix.

Le logiciel R est un logiciel statistique open source qui propose à ses utilisateurs un espace de calcul
pour toutes vos opérations statistiques et graphiques. C’est un logiciel totalement libre et gratuit. Doté de
fonctionnalités simples et pratiques, il permet d’effectuer avec aisance une multitude d’opérations
statistiques telles que les clusters, les tests linéaires et non linéaires ainsi qu’une multitude d’opérations
graphiques. Avec le logiciel R, vous avez la possibilité de produire des graphiques très illustratifs avec
la possibilité d’inclure des formules mathématiques et de nombreux symboles.
R dispose d’une interface simple et minimaliste et est facile à prendre en main. Il est entièrement gratuit et
est téléchargeable sur les plateformes de téléchargement courant.
SAS est un logiciel statistique ultra complet qui offre de nombreuses possibilités largement au-delà des
opérations statistiques. Ses fonctionnalités très élargies permettent d’effectuer de nombreuses autres
opérations telles que : l’analyse des nuages de points, la gestion des données, mais également l’analyse de
données hyper volumineuses. Autrefois réservé au domaine forestier, le logiciel SAS a su s’élargir à bien
d’autres domaines comme la médecine.

SAS est une solution statistique ultra complète et dotée de plusieurs outils d’analyses statistiques qui
permettent d’effectuer des calculs et procédures statistiques y compris des procédures d’analyses
graphiques. Véritable outil d’analyse de données, SAS est doté d’une interface très soignée et existe en
version d’essai. Il est idéal pour les professionnels des sciences de la santé et de la nature.

Édité par la maison Statsoft, Statistica est un outil d’analyse statistique qui dispose d’une gamme étendue
d’outils d’étude, d’analyse et de gestion de données. Il propose également des outils de représentation
graphiques qui permettent d’obtenir à partir de données collectées, des illustrations graphiques précises.
C’est un outil très efficace et pratique qui permet une analyse simple de données d’enquêtes et de sondage.
Statistica existe en version gratuite et dispose d’une interface très ludique vous permettant une prise en main
très facile. Avec Statistica, vous pouvez réaliser des créations graphiques en 2D et même 3D. Vous pouvez
également importer vos données dans d’autres logiciels avec une très grande facilité.
Le logiciel Statistix est un super outil d’analyse et de programmation statistiques qui a été mis au point pour
traiter de façon efficace et pratique toutes vos données d’enquêtes, de sondages et d’études. Le logiciel
propose des outils statistiques puissants facile à manipuler. Grâce à ses nombreuses fonctionnalités, il est
possible d’importer des fichiers texte et Excel vers d’autres logiciels. Vous pouvez aussi créer et éditer de
grands sous-ensembles de données et procéder à leurs analyses groupées. Vous pouvez aussi éditer de
nombreuses feuilles de calcul et générer simultanément de nombreux résultats. Statistix est librement
téléchargeable sur les plateformes de téléchargement courantes.

Matlab est une solution informatique qui a été conçue pour répondre aux exigences des férus des
mathématiques et des statistiques. C’est une application idéale pour les amateurs de mathématique.
L’application regorge de nombreuses fonctionnalités qui permettent de réaliser des graphiques en 2 voire 3D
entièrement personnalisables. Réalisez aisément des tableaux et des graphiques de votre choix avec la large
gamme d’outils que propose l’application.

AcaStat met à la disposition de ces utilisateurs une panoplie de fonctionnalités. Si vous êtes statisticien, c’est
sans doute le logiciel qu’il vous faut pour ne pas vous voir limiter dans vos tâches. Grâce à la fonctionnalité de
glisser-déposer de ce logiciel, vous pouvez importer vos fichiers Excel qui comportent des données statistiques
afin de faire vos analyses. Cela vous permet de détecter les valeurs manquantes dans votre fichier et vous
laisse carte blanche pour constituer une nouvelle base de données dans le logiciel et de reprendre vos
analyses.
Jasp Stats se distingue des autres logiciels de statistiques de son rang. Pour la plupart du temps, ce sont
les utilisateurs de la SPSS qui exploite pour le mieux ce logiciel. Les utilisateurs de Jasp ont la possibilité
d’effectuer leurs analyses statistiques par deux approches. La première consiste à lancer l’analyse des
données statistiques via l’approche fréquentiste et la deuxième peut se faire via l’approche bayésienne.

Statwing est le logiciel idéal si vous souhaitez effectuer des analyses statistiques en vous basant sur les
graphiques. C’est un outil très indispensable pour les entreprises qui se doivent d’effectuer des analyses
statistiques pour définir leur politique commerciale, car les graphes sont généralement très faciles à
interpréter. A l’issue de l’analyse des données de ce logiciel, vous pouvez obtenir des tableaux croisés
dynamiques, des graphiques à barres ou bien d’autres. Le tout dépend de la configuration que vous aurez à
mettre en place pour vos analyses.

Le Sphinx, une base de connaissance en méthodes et techniques d'enquêtes


Le Sphinx vous guide vers l’autonomie dans vos projets d’enquêtes. Grâce à nos relations étroites avec le
monde de l’Education et de l’Université, les équipes de Sphinx participent à de nombreux projets de
recherche, publient régulièrement leurs travaux et développent une expertise reconnue. Afin de diffuser et
partager ces compétences et vous permettre d’avancer avec efficacité et intelligence,
Lois de la probabilité statistique
LOI BINOMILE
La loi Binomiale comme le nom l’indique de l’expression « Bi », c’est-à-dire qu’il y a deux (2) issus
 Succès
 Échec
La loi Binomiale concerne un échantillon qu’on a choisi, il est choisi d’une manière aléatoire ou au
hasard, et sur cette échantillon on va effectuer une étude. Cette loi s’intéresse au valeur discrète
tant que .l’échantillon est petit
LOI BINOMILE
SUCCES ECHEC
Et sa probabilité
probabilité d’avoir un échec est
Exemple probabilité d’avoir 0,4 (1 – P)
(0,4) 7 questions à connaitre 0,6
P

7 questions à connaitre
1 justifier la loi étudier, on est en présence de quelle loi, on est en présence Binomiale, justifier cette loi

Réponses : nous en présence de n évènements « Indépendant », chaque événement abouti ou possède 2


issus : succès et échec. Donc nous sommes en présence d’une loi Binomiale qui s’écrit de la forme suivante
La variable aléatoire X suit une loi Binomiale de paramètre n,p : X B (n, p)

P(X = k ) =
2 calculer l’espérance mathématique (calculer la moyenne espérée) ou l’écart type :
l’espérance mathématique :
E(X) = n * p
 (X) = d’où q = 1 - P

3 calculer la probabilité de tomber sur exactement X événements


Exemple P(x = 3)
k c’est le nombre succès
n c’est le nombre d’évènement
P(X = k ) =
4 calculer la probabilité de tomber sur au moins X événements
Au moins (au minimum) : P(X ≥ 3) = 1 – p ( X < 3 )
= P (x = 0) + P (x = 1) + P (x = 2)

5 calculer la probabilité de tomber sur au plus X événements


Au plus (au maximum) : P(X ≤ 3) = 1 – p ( X > 3 ) = P (x = 0) + P (x = 1) + P (x = 2) + P (x = 3)
6 calculer la probabilité d’une variable X comprise entre deux intervalles
Exemple entre 3 et 5
P(X ≤ 3 ≤ 5 ) = P (x = 3) + P (x = 4) + P (x = 5)

7 calculer l’inconnu n, quelle échantillon devons nous choisir


X- B(30, 0,05)
Exemple P(X=0) = 0,1
P(X = 0 ) =
1 * 1 * = 0,1
ln = ln 0,1
n ln 0,95 = ln 0,1
= 44 ou 45

EXERCICE D’APPLICATION
Boulangerie
On prend 25 échantillons du pain, la probabilité de l’échantillon non conforme à la norme du pain est de 7%
Le choix du pain est indépendant
Deux succès et échec , le succès est du pain non conforme et l’échec du pain conforme
P = 0,07
Alors q = 1 – P = 1- 0,07 = 0,93
1 La variable aléatoire X suit une loi Binomiale de paramètre n,p : X B (n, p) où B (25, 0,07)

2 calculer l’espérance mathématique (calculer la moyenne espérée) ou l’écart type :


l’espérance mathématique :

E(X) = n * p = n*p = 25 * 0,07 = 1,75


s (X) = = = 1,27

Variance : l’écart type c’est la racine carré de variance : écart type = 1,27, donc il suffit d’enlever la racine
carrée pour trouver la variance = 1,63

3 calculer la probabilité d’avoir 2 pain non conforme


Exemple P(x = 2)

k c’est le nombre succès


n c’est le nombre d’évènement
P(X = k ) =
P(X = 2 ) =

= * = 0,28
Donc il y 0,28 % de chance de tomber sur du pain non conforme dans un lot de 25 pains

4 calculer la probabilité de tomber sur au maximum 2 pains non conforme

Au moins (au minimum) : P(X ≤ 2) = 1 – P ( X > 2 )= 1- p(x=0) + p(x=1) + p(x=2)


P(X = 0 ) = = 0,16

P(X = 1 ) = = 25 * 0,07 * 0,9524 = 0,31

P(X = 2 ) =

P(X ≤ 2) = p(x=0) + p(x=1) + p(x=2) = 0,16 + 0,31 + 0,28 = 0,75

Il y a 0,75% de chance de tomber sur au maximum (plus) 2 pains non conforme sur un lot de 25 pains
5 calculer la probabilité de tomber sur au moins 2 non conforme
Au moins (au minimum) : P(X ≥ 2) = 1 – P ( X < 2 ) = 1 – P(x=0) + P(x=1)

0 1 2 3 25

P=1
P(X ≥ 2) = 1 – P(x=0) + P(x=1)
= 1 – (0,16 + 0,31) = 0,53
Il y a 0,53 % de chance de tomber sur au minimum (moins) 2 pains non conforme sur un lot de 25 pains

6 calculer la probabilité de tomber entre 3 et 5 du pain non conforme


Exemple entre 3 et 5
P(X ≤ 3 ≤ 5 ) = P (x = 3) + P (x = 4) + P (x = 5)
P(X = 3 ) =

P(X = 4 ) = =

P(X = 5 ) =
P(X = 3 ) = = = =

P(X = 4 ) = =

P(X = 5 ) =

P(X ≤ 3 ≤ 5 ) = P (x = 3) + P (x = 4) + P (x = 5) = 0,25
Il y a 0,25 % de chance de tomber entre 3 et 5 du pain non conforme sur un lot de 25 pains

7 Nous voulons arriver à une probabilité de 0,1 qui correspond à aucun pain non conforme. Déterminer
l’échantillon à étudier
P(X = 0) = 0,1
P(X = 0 ) =
1 * 1 * = 0,1
ln = ln 0,1
n ln 0,93 = ln 0,1
= 32
Si vous augmentez votre échantillon de 6 à 7 pains, vous pouvez attendre la probabilité de 0,1 du qui
correspond à 0 pain non conforme
Exercice 1
Vous êtes responsable qualité dans une usine qui fabrique des confitures.
Vous prélevez au hasard 50 pots sur la ligne de fabrication afin de tester les opercules fermant le
conditionnement (couvercles des boucaux). On appelle X la variable aléatoire associée au nombre de pots
dont l’opercule s’ouvre difficilement.
Une étude antérieure a montré que la proportion des pots dont l’opercule s’ouvre difficilement est de 10%
1. Quelle est la loi suivie par X ? Justifiez. Donnez ses paramètres
2. Déterminer l’Esperance mathématique et l’écart type de cette loi
3. Quelle est la probabilité de :
a) Avoir exactement 2 pots à opercule s’ouvrant difficilement dans l’échantillons ?
b) Avoir au moins 3 pots à opercule s’ouvrant difficilement dans l’échantillon ?
c) Avoir au plus 3 pots à opercule s’ouvrant difficilement dans l’échantillon ?
4. Combien de pots devrait-on prélever pour que la probabilité de n’obtenir aucun pot à opercule s’ouvrant
difficilement dans l’échantillon soit à 0,15,
LOI NORMALE
Loi normale
La loi normale s’intéresse à des valeurs continues, c’est-à-dire on parle souvent des intervalles
Cette loi comblée les lacune de loi Binomiale lorsqu’on demande de calcul assez compliquer.
La loi normale a fait appel à une courbe symétrique, cette courbe qui à la forme d’une cloche est appelé
courbe de Gauss.
Elle est centrée en m c’est qu’on appel la moyenne
P(a<X<b)
P(a<X)
P(X<b)
LOI NORMALE CENTRÉE RÉDUITE
Gauss en inventant sa loi normal par l’intermédiaire de la courbe en cloche, il y a aussi inventé en même
temps c’est qu’on appel la loi centrée réduite, il a centrée cette courbe sur la moyenne 0, et réduit sur
l’écart type. Toute est centrée sur 0 avec un écart type de 1
Le paramètre de la loi centrée réduite : T N(0,1)
Il a créer un modèle standard qui conviendra à toute les situations qui fait appel à la loi normale et ce
modèle standard on appel loi centrée réduite sa moyenne est égale 0, et l’écart type est égal à 1.
A cette effet, il va falloir référer à une table
Lecture de la table de la loi normale centrée réduite
Lecture directe
Exemple : P(X< 1,95) ?
La table est composée des colonne (0,0 à 4,0) et des lignes (0,00 à 0,009), l’intersection de la lecture de
colonne avec la ligne relative à la recherche vaut la valeur de la probabilité X, alors :
1ère colonne = la colonne de X, en suite il y a des valeurs de la deuxième décimale 0,00 à 0,09
D’où 1,95 = 1,9 + 0,05, voir la valeur 1,9 dans la colonne de X en suite projeté avec la valeur de la
deuxième décimale 0,05 donc ‘intersection donne la valeur 0,9744
Lecture inverse
Exemple : calculer X sachant que la probabilité est égale à 0,7324
Chercher dans la table la probabilité P = 0,7324, et puis faire la projection de la colonne de X et la valeur
de la deuxième décimale en haut
Colonne = 0,6, ligne = 0,02 on a 0,62 d’où P(X< 0,62) = 0,7324
Rq si X dépasse de la valeur 4 sa probabilité est égale à 1
Lecture de la valeur négative
Exemple P(X< -1)
La probabilité X< 1 = colonne 1,0 et ligne 0,00, c’est-à-dire 1,0 +0,00 = 1,00 correspond à 0,8413
D’où P(X< -1) = P(X>1) = 1- P(X<1) = 1 – 0,8413 = 0,1587
P(X> 1,96) = 1 – P(X < 1,96) = 1 – 0,9750 = 0,025
Comment utiliser la loi centrée réduite ?
On se base sur 2 paramètres : X N (m, ) (moyenne, écart type)
Nous avons besoins de connaître les 2 paramètres de façons connue ou inconnue
On utilise la loi centrée réduite pour pouvoir utiliser la loi normale T N()
Exemple vous êtes en présence de la loi normale X N (120, 20)

On vous demande de calculer la P(X < 100) :

P(X < 100) P(X < ) = P(X < -1)


D’où P(X< -1) = P(X>1) = 1- P(X<1) = 1 – 0,8413 = 0,1587
Cela nous donne l’expression mathématique
P(X< a) qui se lis  (a)

Théorème :
P(X< a) en sachant que 0 < a < 4 si dépasse le 4 probabilité = 1

Si la probabilité est inférieure à 0, on applique la théorème ci-dessous


P(X< -a) = 1- P(X< a) = 1 - (a)
P(X > a) = 1- P(X< a) = 1 - (a)
P( a < X < b) = P(X<b) – P(X<a) = (a) - (b)
Exercice : Calculer

P(X < 1,5) = 0,9332


P(X < 1,58) = 0,9429
P(X < - 1,5) = 1 – P(X < 1,5)
= 1 - (1,5)
= 1 – 0,9332
= 0,0668
P(X> 1,5) = 1 – P(X < 1,5)
= 1 – P(X < 1,5)
1 - (1,5)
= 1 – 0,9332
= 0,0668
P(X > - 1,5) = 1 – P(X < -1,5)
= 1 – (1 - P(X < 1,5))
= 1 – 1 + P(X < 1,5)) = (1,5) = 0,9332
Exercice 2
On décide d’approcher la loi de l’exercice 1 par une loi normale des paramètres (Esperance mathématique
(m) et Ecart type () calculés précédemment
1. Donner une approximation de la probabilité d’avoir exactement 9 pots à opercule s’ouvrant difficilement
dans l’échantillon
2. Déterminer une valeur approchée de la probabilité de l’évènement d’avoir au moins 9 pots à opercule
s’ouvrant difficilement dans l’échantillon
3. Déterminer une valeur approchée de la probabilité de l’évènement d’avoir des opercules s’ouvrant
difficilement dans l’échantillon compris entre le 4 et 9
Exercice 3
Vous êtes responsable technique dans une coopérative de fruits et légumes
Vous vous intéressez actuellement aux approvisionnements en pêches d’un nouvel adhérent.
Des études statiques ont montré que le calibre des fruits fournis par cet adhérent suit une loi normale de
moyenne 60 mm pour un écart type de 4 mm
1. Calculer la probabilité pour que le calibre du fruit soit supérieur à 63 mm
2. Calculer la probabilité pour que le calibre du fruit soit inférieur à 54 mm
On souhaite commercialiser les fruits de cet arboriculteur en plateaux alvéoles.
3. Afin que les fruits puissent être rangés dans un type de conditionnement un peu spécifique, ils doivent
posséder un diamètre compris entre 54 et 63 mm de pêches. A quel pourcentage de fruits pourra-t-on
s’attendre ?
4. Une centrale d’achat doit se procurer un équivalent de 500.000 pêches auprès de cet adhérent. Les fruits
commercialisés en plateaux alvéolés sont vendus 0,06 euros l’unité. Les fruits plus petits ou plus gros sont
achetés à un prix équivalent à 0,03 euros l’unités pour être vendus en vrac. Calculer le montant de cette
commande
5. Déterminer le calibre maximum des fruits des 5% les moins gros
6. Déterminer le calibre minimum des fruits des 10 % les plus gros
Exercice 4
On poursuit l’étude sur la production de pomme de terre. On s’intéresse cette fois à leur calibre (mesuré en
mm). Le calibre suit une loi normale de paramètre (120, 20)
1) Quelle est la probabilité de prélever une pomme de terre dont le calibre est inférieur à 100 mm ?
2) Quelle est la probabilité de prélever une pomme de terre de calibre supérieur à 140 mm ?
3) En déduire la probabilité de prélever une pomme de terre dont le calibre est compris entre 100 et 140 mm
4) Les pommes de terre sont vendues selon les tarifs suivants

Sachant que la vente porte sur 750 kilogrammes, calculer le chiffre d’affaires réalisé
5) Déterminer le calibre minimum des pommes de terre les 5% les plus grosses
Les faits sont têtus. Il est plus facile
de s’arranger avec les statistiques 

De Samuel Langhorne Clemens, dit Mark Twain 

Vous aimerez peut-être aussi