Vous êtes sur la page 1sur 26

Projet SMDM

12-14-2021

Méthodes statistiques pour la prise
de décision

Énoncé du problème 1 :
Un distributeur en gros opérant dans différentes régions du Portugal dispose d'informations sur les
dépenses annuelles de plusieurs articles dans ses magasins dans différentes régions et canaux. Les
données concernent les dépenses annuelles de 440 grands détaillants pour 6 variétés différentes de
produits dans 3 régions différentes (Lisbonne, Porto, Autres) et sur différents canaux de vente (Hôtel,
Commerce de détail).

Les données sont fournies dans le fichier « Wholesale+Customers+Data.csv » comme indiqué ci-dessous.

EDA de base
 Les données comportent 440 instances avec 9 attributs. 7 types entiers et 2 types d'objet (chaînes dans
la colonne), comme le montre le résultat ci-dessous.

Projet SMDM PAGE 2


 Il n'y a aucune valeur nulle dans aucune des colonnes, comme le montre le résultat ci-dessous.

 L'ensemble de données comporte 9 variables Acheteur/Dépensier », « Canal », « Région », « Frais », «


Lait », « Épicerie », « Surgelé », « Détergents_Papier » et « Charcuterie ». Canal et Région sont tous
deux des colonnes catégorielles tandis que toutes les autres sont de type entier.

1.1 Utiliser des méthodes de statistiques descriptives pour résumer les


données. Quelle Région et quelle Chaîne semble dépenser le plus ? Quelle
Région et quelle Chaîne semble dépenser moins ?

Le tableau suivant est dérivé de statistiques descriptives pour résumer les données.

Projet SMDM PAGE 3


Le tableau ci-dessus représente la répartition par région des dépenses totales de tous les produits
alimentaires. Ici, on peut voir que les dépenses sont réparties entre trois régions : Lisbonne, Porto et
Autre région.

Le graphique à barres ci-dessous représente les dépenses totales de toutes les régions.

À partir du graphique ci-dessus, on peut conclure que la région Autre a les dépenses les plus élevées et que
la région Porto a les dépenses les plus faibles.

Projet SMDM PAGE 4


Le tableau ci-dessus représente la répartition par canal des dépenses totales de tous les produits
alimentaires. Ici, on peut voir que les dépenses sont réparties sur deux canaux : l'hôtellerie et la vente au
détail .

Le graphique à barres ci-dessous représente les dépenses totales des deux canaux.

À partir du graphique ci-dessus, on peut conclure que le Channel Hotel a les dépenses les plus élevées
et que le Channel Retail a les dépenses les plus faibles.

1.2 Il existe 6 variétés différentes d’articles pris en compte. Toutes les variétés
présentent-elles un comportement similaire à travers la Région et la
Manche ? Justifiez votre réponse.

Projet SMDM PAGE 5


En traçant le coefficient de variable dans toutes les régions, il est évident que tous les produits alimentaires ne
se comportent pas de la même manière dans toutes les régions.

 On peut voir que dans la région de Lisbonne , le produit Papier détergent a un coefficient de
variable maximum, il est donc très incohérent à Lisbonne , suivi par l'épicerie . Alors que, comme à
Porto, les produits surgelés présentent un comportement incohérent le plus élevé, suivis par le
papier détergent . En revanche, dans la région Autres épiceries fines, l'incohérence est la plus
élevée, suivie par le papier détergent.

 Dans la région de Lisbonne, le produit Delicatessen a le plus faible coefficient de variable, c'est donc
le produit le plus cohérent à Lisbonne alors qu'à Porto, Fresh et Delicatessan sont les plus
cohérents. En revanche, dans les autres régions, seul le frais est le plus cohérent.

Projet SMDM PAGE 6


En traçant le coefficient de variable sur les deux canaux, il est évident que tous les produits alimentaires ne se
comportent pas de la même manière dans toutes les régions.

 On peut voir que dans le canal Hôtel , le produit Charcuterie a un coefficient de variable maximum, il
est donc très incohérent dans Hôtel suivi de Surgelé . En revanche, dans le canal Retail Detergent
Paper, l'incohérence est la plus élevée, suivie par le lait .

 Dans le canal Hôtel , le produit Papier détergent a le coefficient de variable le plus faible, c'est donc
le produit le plus cohérent dans le canal Hôtel , alors que, comme dans le commerce de détail , les
produits surgelés sont les plus cohérents.

Sur la base de l'analyse ci-dessus, nous pouvons conclure qu'en considérant les 6 variétés
d'articles, toutes les variétés ne présentent pas un comportement similaire à travers la
région et la Manche.

1.3 Sur la base d’une mesure descriptive de la variabilité, quel élément


présente le comportement le plus incohérent ? Quels éléments présentent
le comportement le moins incohérent ?

Projet SMDM PAGE 7


Le tableau ci-dessus représente les statistiques descriptives des six produits alimentaires frais, lait,
épicerie, surgelés, détergents_papier et charcuterie.
Ici, la consistance de n'importe quel aliment peut être calculée à l'aide du coefficient de variance (CV). Plus
le coefficient de variation est élevé, plus le niveau d’incohérence est important et vice versa.

Il est dérivé de la formule suivante :

Coefficient de variance (CV) = μ/σ

où:
σ = écart type
μ = moyenne

Le graphique à barres ci-dessus représente le coefficient de variance de tous les aliments. D'après le
graphique, il est évident que le coefficient de variance est le plus élevé pour les articles de charcuterie et le plus
bas pour les articles frais.
On peut donc conclure que l'article qui présente le comportement le plus incohérent est l'épicerie fine et que
l'article qui présente le comportement le moins incohérent est le produit frais.

Projet SMDM PAGE 8


1.4 Y a-t-il des valeurs aberrantes dans les données ?

Pour déterminer la présence de valeurs aberrantes dans les données, la meilleure méthode consiste à créer
un box plot de toutes les variables, comme indiqué ci-dessous.

Projet SMDM PAGE 9


À partir des diagrammes en boîte de toutes les variables ci-dessus, on peut conclure que oui, il y a des valeurs
aberrantes dans les données.
Des valeurs aberrantes sont présentes dans les variables Frais, Lait, Épicerie, Surgelé,
Détergents_Papier et Delicatessen.

1.5 Sur la base de votre analyse, quelles sont vos recommandations pour
l’entreprise ? Comment votre analyse peut-elle aider l’entreprise à
résoudre son problème ? Réponse du point de vue de l'entreprise.

Sur la base de l'analyse, les recommandations suivantes peuvent être formulées :

 Sur la base de l'analyse, on peut voir que la région Autre et le canal Vente au détail ont des dépenses
plus élevées que les autres canaux et régions. Par conséquent, du point de vue commercial, si une
nouvelle entreprise doit être ouverte, elle devrait être ouverte dans l' autre région avec Channel
Retail , car l'autre région absorbe le maximum de ventes, ce qui peut augmenter les revenus par
rapport à l'ouverture d'une nouvelle entreprise à Lisbonne ou Porto et avec le Channel Hotel.

Projet SMDM PAGE 10


 Dans toutes les régions, les articles frais pour les pieds génèrent les dépenses les plus élevées, suivis
par l'épicerie et le lait. Il est donc fortement recommandé que ces produits alimentaires soient
disponibles simultanément dans tous les commerces, la priorité de disponibilité étant les produits
alimentaires frais .

 Le secteur alimentaire Delicatessen présente également un comportement le moins incohérent dans


toutes les régions et tous les canaux. Il est donc également recommandé que l'épicerie fine soit
disponible à tout moment dans tous les Commerces.

Problème 2 :

Le service de presse étudiant de la Clear Mountain State University (CMSU) a décidé de recueillir des données
sur les étudiants de premier cycle qui fréquentent la CMSU. La CMSU crée et distribue une enquête de 14
questions et reçoit les réponses de 62 étudiants de premier cycle.
Les données sont stockées dans l'ensemble de données d'enquête comme suit :

2.1 Pour ces données, construisez les tableaux de contingence suivants


(Conserver le sexe comme variable de ligne)

2.1.1 Sexe et majeure

Projet SMDM PAGE 11


2.1.2 Sexe et intention de diplômé

2.1.3 Genre et emploi

2.1.4 Genre et ordinateur

Projet SMDM PAGE 12


2.2 Supposons que l'échantillon soit représentatif de la population de la
CMSU. En vous basant sur les données, répondez à la question suivante :

2.2.1. Quelle est la probabilité que un étudiant de la CMSU sélectionné au


hasard sera un homme ?

De tous les tableaux de contingence créés, on peut le constater.

Nombre total d'étudiants = 62


Nombre total d'hommes = 29
Probabilité qu'un élève sélectionné au hasard soit un homme = Nombre total d'hommes / Nombre total
d'hommes
Ainsi des calculs effectués en Python nous concluons que :

La probabilité qu'un étudiant de la CMSU sélectionné au hasard soit un homme est de


46,77 %.

2.2.2. Quelle est la probabilité qu’un étudiant de la CMSU sélectionné au


hasard soit une femme ?

De tous les tableaux de contingence créés, on peut le constater.

Nombre total d'étudiants = 62


Nombre total de Femelle = 33
Probabilité qu'un élève sélectionné au hasard soit un homme = Nombre total d'hommes / Nombre total
de femmes

Ainsi des calculs effectués en Python nous concluons que :

La probabilité qu'un étudiant CMSU sélectionné au hasard soit une femme est de 53,23
%.

2.3. Supposons que l’échantillon soit représentatif de la population de la


CMSU. En vous basant sur les données, répondez à la question suivante :

2.3.1. Trouvez la probabilité conditionnelle de différentes spécialisations


parmi les étudiants masculins de la CMSU.

Tableau de contingence Pour le Genre et la Majeure :

Projet SMDM PAGE 13


De tous les tableaux de contingence créés, on peut le constater.

Probabilité de comptabilité parmi les étudiants de sexe masculin = 4/29


Probabilité de CIS parmi les étudiants de sexe masculin = 1 / 29
Probabilité d'Economie/Finance parmi les étudiants de sexe masculin = 4 /29
Probabilité de faire des affaires internationales parmi les étudiants masculins = 2/29
Probabilité de Gestion parmi les étudiants masculins Gestion = 6/29
Probabilité de Autre parmi les étudiants de sexe masculin Autre = 4/29
Probabilité de vente au détail/marketing parmi les étudiants de sexe masculin = 5/29
Probabilité d'indécis parmi les étudiants de sexe masculin = 3/29

Ainsi des calculs effectués en Python nous concluons que :

La probabilité de comptabilité parmi les étudiants de sexe masculin est de 13,79 %

La probabilité de CIS parmi les étudiants de sexe masculin est de 3,45 %

La probabilité de l'économie/finance parmi les étudiants masculins 13,79%

La probabilité de commerce international parmi les étudiants masculins 6,9%

La probabilité de gestion parmi les étudiants masculins en gestion est de 20,69 %

La probabilité d'Autre parmi les étudiants de sexe masculin Autre 13,79%

La probabilité de vente au détail/marketing parmi les étudiants masculins 17,24 %

La probabilité d'indécis parmi les étudiants masculins 10,34%

2.3.2 Trouver la probabilité conditionnelle de différentes spécialisations


parmi les étudiantes de la CMSU.

Tableau de contingence Pour le Genre et la Majeure :

Projet SMDM PAGE 14


De tous les tableaux de contingence créés, on peut le constater.

Probabilité de Comptabilité parmi les étudiantes = 3/33


Probabilité de CIS parmi les étudiantes = 3/33
Probabilité d'Economie/Finance parmi les étudiantes = 7/33
Probabilité de faire des affaires internationales parmi les étudiantes = 4/33
Probabilité de Gestion parmi les étudiantes Management = 4/33
Probabilité de Autre parmi les étudiantes Autre = 3/33
Probabilité de vente au détail/marketing parmi les étudiantes = 9/33
Probabilité d'indécis parmi les étudiantes = 0/33

Ainsi des calculs effectués en Python nous concluons que :

La probabilité de comptabilité parmi les étudiantes est de 9,09 %

La probabilité de CIS parmi les étudiantes est de 9,09 %

La probabilité de l'économie/finance parmi les étudiantes 21,21%

La probabilité de commerce international parmi les étudiantes 12,12%

La probabilité de gestion parmi les étudiantes en gestion est de 12,12%

La probabilité d'Autre parmi les étudiantes Autre 9,09%

La probabilité de vente au détail/marketing parmi les étudiantes 27,27 %

La probabilité d'indécis parmi les étudiantes 0%

2.4. Supposons que l’échantillon soit représentatif de la population de la


CMSU. En vous basant sur les données, répondez à la question suivante :

2.4.1. Trouvez la probabilité qu'un étudiant choisi au hasard soit un


homme et ait l'intention d'obtenir son diplôme.

Projet SMDM PAGE 15


Tableau de contingence pour le sexe et l'intention de diplômé :

Probabilité qu'un élève choisi au hasard soit un homme = 29/62


Probabilité d'un homme qui a l'intention d'obtenir son diplôme = 17/29

Probabilité qu'un étudiant choisi au hasard soit un homme et ait l'intention d'obtenir son diplôme
= Probabilité qu'un élève choisi au hasard soit un homme * Probabilité qu'un élève choisi au
hasard soit un homme

Ainsi des calculs effectués en Python nous concluons que :

La probabilité qu'un étudiant choisi au hasard soit un homme et ait l'intention


d'obtenir son diplôme est de 27,42 %.

2.4.2 Trouvez la probabilité qu'un élève sélectionné au hasard soit une


femme et n'ait PAS d'ordinateur portable.
Tableau de contingence pour le genre et l'ordinateur :

Probabilité qu'un étudiant choisi au hasard soit une femme = 33/62


Probabilité d'une femme sans ordinateur portable = 1-(29/33)

Probabilité qu'un étudiant sélectionné au hasard soit une femme et ne possède PAS d'ordinateur portable
= Probabilité qu'un étudiant choisi au hasard soit une femme * Probabilité qu'une femme n'ait
pas d'ordinateur portable

Ainsi des calculs effectués en Python nous concluons que :

Projet SMDM PAGE 16


La probabilité qu'un étudiant sélectionné au hasard soit une femme et ne possède PAS
d'ordinateur portable est de 6,45 %.

2.5. Supposons que l’échantillon soit représentatif de la population de la


CMSU. En vous basant sur les données, répondez à la question suivante :

2.5.1. Trouvez la probabilité qu'un étudiant choisi au hasard soit un


homme ou ait un emploi à temps plein ?

Tableau de Contingence Genre et Emploi :

Probabilité qu'un étudiant soit un homme = 29/33


Probabilité qu'un étudiant ait un emploi à temps plein = 10/62
Probabilité qu'un homme ait un emploi à temps plein = 7/29

Probabilité qu'un étudiant choisi au hasard soit un homme ou ait un emploi à temps plein
= Probabilité qu'un étudiant soit un homme + Probabilité qu'un étudiant ait un emploi à temps
plein - Probabilité qu'un homme ait un emploi à temps plein

Ainsi des calculs effectués en Python nous concluons que :

La probabilité qu'un étudiant choisi au hasard soit un homme ou ait un emploi à temps plein
79,87 %

2.5.2. Trouvez la probabilité conditionnelle que, étant donné qu’une


étudiante est choisie au hasard, elle se spécialise en commerce
international ou en gestion.

Tableau de Contingence Genre et Emploi :

Projet SMDM PAGE 17


Probabilité de faire des affaires internationales étant donné Femme = 4/33
Probabilité de prise en charge donnée Femme = 4/33

Puisque le commerce international et la gestion sont indépendants les uns des autres

Probabilité de faire des affaires ou de gérer des affaires internationales étant donné Femme
= Probabilité de faire des affaires à l'international étant donné Femme + Probabilité de gestion
étant donné Femme

Ainsi des calculs effectués en Python nous concluons que :

La probabilité conditionnelle qu'une étudiante choisie au hasard se spécialise en commerce


international ou en gestion est de 24,242 %.

2.6. Construire un tableau de contingence du genre et de l'intention


d'obtenir un diplôme à 2 niveaux (Oui/Non). Les étudiants indécis ne sont
pas pris en compte pour le moment et le tableau est un tableau 2x2.
Pensez-vous que l'intention d'être diplômée et le fait d'être une femme
sont des événements indépendants ?

Tableau de contingence 2X2 du sexe et de l'intention d'obtenir un diplôme sans tenir compte
des étudiants indécis

Deux événements A et B peuvent être prouvés comme étant des événements indépendants lorsqu'ils satisfont à
la condition :

P(UNE ∩ B) = P(UNE) * P(B)

Projet SMDM PAGE 18


Dans ce cas, si le fait d'être une femme et l'intention d'être diplômée sont indépendants, cela peut être
prouvé en vérifiant la condition :

P(F ∩ Oui) = P(F) * P(Oui)

Où F = Femme
Oui = L'intention du diplômé est Oui

Ainsi des calculs effectués en Python nous concluons que :

P(F ∩ Oui) ≠ P(F) * P(Oui)

Par conséquent, l’intention d’obtenir un diplôme et le fait d’être une femme ne sont pas
des événements indépendants.

2.7. Notez qu'il existe quatre variables numériques (continues) dans


l'ensemble de données : GPA, Salaire, Dépenses et Messages texte.

Répondez aux questions suivantes en vous basant sur les données

2.6.1. Si un élève est choisi au hasard, quelle est la probabilité que sa


moyenne soit inférieure à 3 ?

Étant donné que GPA est une variable continue, la probabilité d'un étudiant dont la GPA est inférieure à 3 peut
être calculée à l'aide de la distribution de Poisson.

Pour calculer la probabilité de GPA 3 ou moins, nous ajouterons la probabilité de 0,1,2 et 3 GPA obtenue dans
la distribution de Poisson.

Ainsi des calculs effectués en Python nous concluons que :

Si un étudiant est choisi au hasard, quelle est la probabilité que sa moyenne cumulative
soit inférieure à 3 est de 39,49 %

2.6.2. Trouvez la probabilité conditionnelle qu'un homme sélectionné au


hasard gagne 50 ou plus. Trouvez la probabilité conditionnelle qu'une
femme sélectionnée au hasard gagne 50 ou plus.

Probabilité conditionnelle qu'un homme sélectionné au hasard gagne 50


ou plus :

Projet SMDM PAGE 19


Le diagramme de distribution ci-dessus représente le salaire de tous les hommes de la population.

Comme nous pouvons le voir, la distribution est normale, c'est pourquoi la probabilité conditionnelle qu'un
homme sélectionné au hasard gagne 50 ou plus peut être calculée à l'aide de la distribution normale.

Pour calculer cela, nous calculerons la probabilité cumulée de moins de 50 en utilisant la distribution normale,
puis soustrairons de 1.

Ainsi des calculs effectués en Python nous concluons que :

La probabilité conditionnelle qu'un homme sélectionné au hasard gagne 50 ou plus est


de 83,04 %.

Probabilité conditionnelle qu'une femme sélectionnée au hasard gagne 50


ou plus :

Projet SMDM PAGE 20


Le diagramme de répartition ci-dessus représente le salaire de toutes les femmes de la population.

Comme nous pouvons le voir, la distribution est normale, c'est pourquoi la probabilité conditionnelle qu'une
femme sélectionnée au hasard gagne 50 ou plus peut être calculée à l'aide de la distribution normale.

Pour calculer cela, nous calculerons la probabilité cumulée de moins de 50 en utilisant la distribution normale,
puis soustrairons de 1.

Ainsi des calculs effectués en Python nous concluons que :

La probabilité conditionnelle qu'une femme sélectionnée au hasard gagne 50 ou plus


est de 86,09 %.

2.8. Notez qu'il existe quatre variables numériques (continues) dans


l'ensemble de données : GPA, Salaire, Dépenses et Messages texte. Pour
chacun d’eux, indiquez s’ils suivent une distribution normale. Écrivez une
note résumant vos conclusions.

Projet SMDM PAGE 21


À partir des histogrammes ci-dessus pour les variables continues GPA, Salaire, Dépenses et Messages
texte, nous pouvons voir que :
 GPA est presque normalement distribué avec une légère asymétrie vers la gauche.
 Le salaire est également normalement distribué avec une légère asymétrie vers la droite.
 Les dépenses ne sont pas normalement distribuées et sont fortement asymétriques à droite
 Le message texte n'est pas normalement distribué et est fortement asymétrique à droite.

Le tableau suivant comprend la valeur d'asymétrie des variables.

Projet SMDM PAGE 22


Comme mentionné précédemment dans le tableau, il est évident que :
 GPA a très moins d’asymétrie et il est négatif, donc vers la gauche.
 Le salaire est également très moins asymétrique mais positif, il est donc vers la droite.
 Les dépenses sont fortement asymétriques à droite
 Le message texte est fortement asymétrique à droite.

Problème 3
Une caractéristique de qualité importante utilisée par les fabricants de bardeaux d’asphalte ABC est la
quantité d’humidité que les bardeaux contiennent lorsqu’ils sont emballés. Les clients peuvent avoir
l’impression d’avoir acheté un produit de mauvaise qualité s’ils trouvent de l’humidité et des bardeaux
mouillés à l’intérieur de l’emballage. Dans certains cas, une humidité excessive peut faire tomber les
granules attachés aux bardeaux à des fins de texture et de coloration, ce qui entraîne des problèmes
d'apparence. Pour surveiller la quantité d’humidité présente, l’entreprise effectue des tests
d’humidité. Un bardeau est pesé puis séché. Le bardeau est ensuite pesé à nouveau et, en fonction de
la quantité d'humidité extraite du produit, le nombre de livres d'humidité par 100 pieds carrés est
calculé. L'entreprise souhaite démontrer que la teneur moyenne en humidité est inférieure à 0,35 livre
par 100 pieds carrés.

Le fichier (bardeaux A & B.csv) comprend 36 mesures (en livres par 100 pieds carrés) pour les
bardeaux A et 31 pour les bardeaux B.

3.1 Pensez-vous qu'il existe des preuves indiquant que la teneur en


humidité des deux types de bardeaux se situe dans les limites permises ?
Énoncez vos conclusions en montrant clairement toutes les étapes.

Pour les bardeaux A, l'hypothèse nulle et alternative pour tester si la teneur en humidité moyenne de la
population est inférieure à 0,35 livre par 100 pieds carrés est donnée :

Projet SMDM PAGE 23


H0 : teneur en humidité moyenne <=0,35
HA : teneur en humidité moyenne > 0,35

Niveau de signification : 0,05

Nous disposons d'échantillons et nous ne connaissons pas l'écart type de la population.

L'échantillon n'est pas un grand échantillon. Vous utilisez donc la distribution t et la statistique
du test tSTAT

Puisque nous testons uniquement l’échantillon A, nous utilisons le test T sur un échantillon.
Également comme python par défaut dans Python, ttest_1samp affiche le résultat du recto
verso, il est divisé par 2 car notre test est !_Sided.

Ainsi des calculs effectués en Python nous concluons que :

Notre valeur p du test t sur un échantillon = [0,07477633]

Nous n'avons aucune preuve pour rejeter l'hypothèse nulle puisque valeur p > Niveau
de signification

Pour les bardeaux B, l’hypothèse nulle et alternative pour tester si la teneur en humidité moyenne de la
population est inférieure à 0,35 livre par 100 pieds carrés est donnée :

H0 : teneur en humidité moyenne <=0,35


HA : teneur en humidité moyenne > 0,35

Niveau de signification : 0,05

Nous disposons d'échantillons et nous ne connaissons pas l'écart type de la population.

L'échantillon n'est pas un grand échantillon. Vous utilisez donc la distribution t et la statistique
du test tSTAT

Puisque nous testons uniquement l’échantillon A, nous utilisons le test T sur un échantillon. .
Également comme python par défaut dans Python, ttest_1samp affiche le résultat du recto
verso, il est divisé par 2 car notre test est !_Sided.

Ainsi des calculs effectués en Python nous concluons que :

Notre valeur p du test t sur un échantillon = [0,0020904774003191826]

Nous avons des preuves pour rejeter l'hypothèse nulle puisque la valeur p < Niveau de
signification

3.2 Pensez-vous que les moyennes de population pour les bardeaux A et B


sont égales ? Formulez l’hypothèse et effectuez le test de l’hypothèse.

Projet SMDM PAGE 24


Quelle hypothèse devez-vous vérifier avant d’effectuer le test d’égalité des
moyennes ?

Hypothèses théoriques pour le test d'hypothèse :

Pour effectuer un test d'égalité de la moyenne de la population des bardeaux A et des bardeaux B, l'hypothèse
nulle et alternative pour tester si la teneur en humidité moyenne de la population est égale est donnée :

H0 : teneur en humidité moyenne de A = teneur en humidité moyenne de B


HA : teneur en humidité moyenne de A ≠ teneur en humidité moyenne de B

Niveau de signification : 0,05

Nous avons deux échantillons A et B et nous ne connaissons pas l’écart type de la population.

Les échantillons ne sont pas de grande taille. Vous utilisez donc la distribution t et la statistique
du test tSTAT

Puisque nous testons l’égalité entre les échantillons A et B, nous utilisons le test T à deux
échantillons.

Ainsi des calculs effectués en Python nous concluons que :

Valeur p du test t à deux échantillons = 0,2017496571835306

Nous n'avons pas suffisamment de preuves pour rejeter l'hypothèse nulle en faveur d'une
hypothèse alternative puisque valeur p > Niveau de signification

Par conséquent, on peut conclure que la moyenne de la population pour les bardeaux A et B est
égale.

Projet SMDM PAGE 25


Merci

Projet SMDM PAGE 26

Vous aimerez peut-être aussi