Vous êtes sur la page 1sur 10

SUSS

BUS 105
Janvier 2021 TOA

Question 1
(a)
2019 Jul
Moyenne 54.48888889
Erreur standard 3.149734993
Médiane 50
Mode 80
Écart-type 21.12906467
Variance de
l'échantillon 446.4373737
-
Kurtosis 0.985252425
-
Asymétrie 0.035217992
Gamme 75
Minimum 15
Maximum 90
Somme 2452
Compter 45

La mesure de localisation est une valeur unique qui englobe la tendance centrale d'une
collection de données. Ils peuvent être décrits comme la moyenne, la médiane et le
mode (Zheng, F., Soh, I., & Tan, C., 2021).
La mesure de la dispersion montre l'intensité de l'étalement d'un ensemble de données.
Une faible valeur de dispersion indique que les données sont étroitement regroupées,
tandis qu'une valeur élevée indique que la moyenne n'est pas fiable et ne représente pas
les données de manière efficace (Zheng, F., Soh, I., & Tan, C., 2021). Les trois mesures
de dispersion peuvent être décrites comme l'étendue, la variance et l'écart-type.
Les statistiques descriptives pour le semestre de juillet 2019 et le semestre de juillet
2020 sont les suivantes :

2019 Juillet
La moyenne, la médiane et le mode sont respectivement de 54,489, 50 et 80.
L'étendue, la variance et l'écart-type sont respectivement de 75, 446,437 et 21,129.

2020 Juillet
La moyenne, la médiane et le mode sont respectivement de 54,96, 58 et 65.
L'étendue, la variance et l'écart-type sont respectivement de 78, 400,61 et 20,015.

(b)
i. L'échantillon risque fortement d'être biaisé, car ces échantillons (45 - statistiques
notes globales en juillet 2019 et 50 - statistiques notes globales en juillet 2020) sont
constitués d'étudiants ayant suivi des cours en présentiel en juillet 2019 et
d'étudiants ayant suivi des cours en ligne en juillet 2020. Il est possible que les
étudiants qui ont suivi les cours en face à face en juillet 2019 aient une meilleure
compréhension du module que les étudiants qui ont suivi les cours en ligne en
juillet 2020, et vice versa. En outre, la taille de l'échantillon peut être insuffisante,
étant donné que 45 notes statistiques globales en juillet 2019 et 50 notes statistiques
globales en juillet 2020 peuvent ne pas être suffisantes pour permettre une
interprétation fiable des données.
ii. La question du caractère aléatoire des échantillons se pose également. Ce problème
peut être résolu en vérifiant que l'échantillon est aléatoire à l'aide d'une méthode
d'échantillonnage telle que l'échantillonnage aléatoire simple ou l'échantillonnage
aléatoire systémique.

iii. Enfin, le fait que les échantillons de juillet 2019 et de juillet 2020 soient des
échantillons indépendants, la différence de facteurs tels que le mode d'évaluation
(par exemple, évaluation en ligne ou sur papier) et la démographie peut contribuer à
des différences dans les scores globaux.

Si j'avais l'occasion de mener cette étude, je m'assurerais qu'une large population de


répondants soit échantillonnée dès le départ. Je m'assurerais en outre que les
échantillons sont collectés auprès d'étudiants qui suivent le même mode (en ligne ou en
face-à-face, il ne peut s'agir d'un mélange des deux) de cours et d'évaluation finale.

Question 2
(a)
(i)
P(pas de problème au cours du prochain trimestre) = 0,8*0,5 + 0,7*0,3 + 0,6*0,2 = 0,73

(ii)
P(engagé C / Pas de problème) = 0.8219

(iii)
P(A choisira pour les deux prochains trimestres) = 0,73*0,8 + (1-0,73)*0,5 = 0,719

(b)
μ = 266
σ = 16
(i)
Soit X la durée de la grossesse.
Réponse à partir d'Excel en utilisant norm.dist.
P(260<X<270) = P(X<270) - P(X<260)
= 0.024 – 0.023
= 0.0009
= 0.09%

(ii)
n = 20
erreur standard = 16/ √20 = 3,578
Réponse à partir d'Excel en utilisant norm.dist
P(X>265) = 1 - 0,107236 = 0,892764 = 89,28%

Question 3
(a)
(i)
Homme

Moyenne 69.9
Erreur standard 0.24140394
Médiane 70
Mode 70
Écart-type 1.322223832
Variance de
l'échantillon 1.748275862
-
Kurtosis 0.005748394
-
Asymétrie 0.475645301
Gamme 5
Minimum 67
Maximum 72
Somme 2097
Compter 30
Niveau de confiance
(90,0%) 0.410175958
Homme
Limite inférieure de l'intervalle de confiance = 69,9 - 0,41 = 69,49 (2 d.p.)
Limite supérieure de l'intervalle de confiance = 6,99 + 0,41 = 70,31 (2 d.p.)

L'intervalle de confiance à 90 % pour le niveau de stress moyen des étudiants est


compris entre 69,49 et 70,31. Cet intervalle de confiance est une estimation de
l'intervalle du score de stress de la population pour les étudiants masculins. La
signification de 90% signifie que même si la moyenne de la population n'est pas
toujours comprise entre 69,49 et 70,31, dans la plupart des cas, si nous répétons les
calculs, nous trouverons la moyenne de la population dans l'intervalle.

Femme
Limite inférieure de l'intervalle de confiance = 72,93 - 1,46 = 71,47 (2 d.p.)
Limite supérieure de l'intervalle de confiance = 72,93 - 1,46 = 74,39 (2 d.p.)

L'intervalle de confiance à 90 % pour le niveau de stress moyen des étudiantes se situe


entre 71,47 et 74,39. Cet intervalle de confiance est une estimation de l'intervalle du
score de stress de la population pour les étudiantes. La signification de 90 % signifie
que même si la moyenne de la population n'est pas toujours comprise entre 71,47 et
74,39, dans la plupart des cas, si nous répétons les calculs, nous trouverons la moyenne
de la population dans l'intervalle.

(ii)
Test t : Deux échantillons appariés pour
les moyennes
Homme Femme
Moyenne 69.9 72.93333333
Variance 1.748275862 22.13333333
Observations 30 30
-
Corrélation de Pearson 0.167409675
Différence moyenne
hypothétique 0
df 29
-
t Stat 3.260557689
P(T<=t) à une queue 0.001420712
t Critique à une queue 1.311433647
P(T<=t) à double queue 0.002841425
t Critique à deux fois 1.699127027

Étape 1 :
H0 : μd = 0
H1 : μd différent de 0

où μd est la différence de contrainte moyenne entre les hommes et les femmes.

Étape 2 : Sélectionner le niveau de signification.


Le niveau de signification retenu est α = 0,10.

Étape 3 : Choisir une statistique de test.


Nous utiliserons le test t par paires puisque l'écart-type de la population est inconnu et
que les échantillons ne le sont pas.
indépendants, et parce qu'il s'agit d'une situation consécutive.

Étape 4 : Élaborer une règle de décision.


Si la valeur p est inférieure à 0,10, nous rejetons H0 et acceptons H1.

Étape 5 : calculer la valeur de la statistique de test, prendre une décision concernant


l'hypothèse nulle et interpréter les résultats.
D'après le tableau de sortie d'Excel, il s'agit d'un test bilatéral.
La valeur p de 0,002841 étant < 0,10, nous rejetons H0.
Par conséquent, nous pouvons conclure que les scores de stress entre les étudiants et les
étudiantes ne sont pas similaires.
(b)

SUSS

Moyenne 67.8
Erreur standard 2.727636339
Médiane 66
Mode #N/A
Écart-type 6.099180273
Variance de
l'échantillon 37.2
Kurtosis 2.86463753
Asymétrie 1.53951589
Gamme 16
Minimum 62
Maximum 78
Somme 339
Compter 5
Niveau de confiance
(95,0%) 7.573132563

NUS NTU

Moyenne 73.2 Moyenne 72


Erreur standard 3.839270764 Erreur standard 3.987480407
Médiane 76 Médiane 71
Mode #N/A Mode #N/A
Écart-type 8.584870413 Écart-type 8.91627725
Variance de Variance de
l'échantillon 73.7 l'échantillon 79.5
- Kurtosis 1.155096713
Kurtosis 1.078909142 Asymétrie 1.061587537
- Gamme 23
Asymétrie 0.696691247 Minimum 63
Gamme 21 Maximum 86
Minimum 61 Somme 360
Maximum 82 Compter 5
Somme 366 Niveau de confiance
Compter 5 (95,0%) 11.07102046
Niveau de confiance
(95,0%) 10.65952452

Étape 1 :
H0 : μi = 0
H1 : au moins un μi différent de 0

où μi est la contrainte moyenne pour SUSS, SIM, NUS et NTU

Étape 2 : Sélectionner le niveau de signification.


Le niveau de signification retenu est α = 0,05.

Étape 3 : Choisir une statistique de test.


Nous utiliserons le test t par paires puisque l'écart-type de la population est inconnu et
que les échantillons ne le sont pas.
indépendants, et parce qu'il s'agit d'une situation qui se répète.

Étape 4 : Élaborer une règle de décision.


Si la valeur p est inférieure à 0,05, nous rejetons H0 et acceptons H1.

Étape 5 : calculer la valeur de la statistique de test, prendre une décision concernant


l'hypothèse nulle et interpréter les résultats.
D'après le tableau de sortie d'Excel, il s'agit d'un test bilatéral.
La valeur p de 0,002841 étant < 0,05, nous rejetons H0.
Par conséquent, nous pouvons conclure que n'importe lequel des scores de stress USS,
SIM, NUS et NTU ne sera pas égal à zéro.

Question 4

(a)
SOMMAIRE
SORTIE

Statistiques de régression
Multiple R 0.862776744
Carré R 0.744383711
R carré ajusté 0.676219367
Erreur standard 10.30414179
Observations 20

ANOVA
Signification
df SS MS F F
Régression 4 4637.92 1159.48 10.9204266 0.000237317
Résiduelle 15 1592.63 106.1753
Total 19 6230.55

Erreur Inférieur à Supérie


Coefficients standard t Stat Valeur P 95% 95%
-
Interception 129.3986876 65.11146 1.987341 0.06546009 9.383114154 268.180
Expérience 10.82184778 3.599151 3.006778 0.00884973 3.150439754 18.4932
-
L'âge -3.268778436 1.8103 -1.80566 0.09107787 7.127341439 0.58978
- -
Déplacement -17.56720195 4.746842 -3.70082 0.0021355 27.68485585 7.44954
-
Genre 6.195458179 7.99367 0.775045 0.45035887 10.84264676 23.2335

L'équation linéaire est la suivante


ŷ = 129,398 + 10,821X1 - 3,268X2 - 17,567X3 + 6,195X4

où X1 est l'expérience, X2 l'âge, X3 le poste et X4 le sexe.


Autres points inchangés

Pour chaque expérience supplémentaire de 1, la production augmentera de 10,821.


Pour chaque tranche supplémentaire de 1 âge, la production diminuera de 3,268.
Pour chaque équipe supplémentaire, la production diminuera de 17,567.
Pour chaque personne supplémentaire (sexe), la production augmentera de 6,195.

(b)
ŷ = 129.398 + 10.821*(6) - 3.268*(30) - 17.567*(1) + 6.195*(0)

= 78.717

(c)

Le tableau de sortie Excel correspondant est présenté ci-dessus dans la partie (a).
Le coefficient de détermination multiple est de 0,7443.

Le coefficient de détermination multiple ajusté est de 0,6762. Cela signifie que 74,43 %
(ou 67,62 % respectivement) de la variation de la productivité peut être expliquée par la
variation des variables indépendantes, à savoir l'expérience, l'âge, le poste et le sexe.

Le coefficient de détermination multiple ajusté est une mesure plus appropriée dans ce
scénario, car il tient compte à la fois de la simplicité du modèle et de la capacité de
prédiction. Le modèle non ajusté tient simplement compte de la capacité de prédiction
et l'augmente donc en ajoutant des variables indépendantes supplémentaires au modèle.

Cependant, il y a déjà trois variables indépendantes dans cet exemple. Ainsi,


l'utilisation du coefficient de détermination multiple ajusté empêcherait les variables
indépendantes d'être surchargées, car après avoir ajouté des variables indépendantes
supplémentaires une par une, le coefficient de détermination multiple ajusté
commencerait à diminuer, ce qui indiquerait que le modèle est devenu plus complexe.

(d)

Étape 1 : Énoncer l'hypothèse nulle et l'hypothèse alternative.


H0 : β1 = 0
H1 : β1 différent de 0
Où β1 est le coefficient du montant dépensé pour la nourriture (X1)
H0 : β2 = 0
H1 : β2 différent de 0
Où β2 est le coefficient d'occupation totale de la chambre (X2)
H0 : β3 = 0
H1 : β3 différent de 0
Où β3 est le coefficient de l'existence de performances (X3)

Étape 2 : Sélectionner le niveau de signification.


Le niveau de signification est α = 0,05

Étape 3 : Choisir une statistique de test.


Nous effectuerons les tests t individuels.

Étape 4 : Élaborer une règle de décision.


Rejeter H0 si la valeur p est inférieure à 0,05.

Étape 5 : calculer la valeur de la statistique de test, prendre une décision concernant


l'hypothèse nulle et interpréter les résultats.

Valeur P pour (X1) = 0,0088


La valeur P étant < 0,05, rejeter H0.

Valeur P pour (X2) = 0,0910


La valeur P étant > 0,05, ne pas rejeter H0.

Valeur P (X3) = 0,00213


P-value < 0,05, rejet de H0.

Valeur P (X4) = 0,77


P-value > 0,05, ne pas faire H0.

Par conséquent, les deux variables indépendantes (X1, X3) sont significatives, tandis
que la variable indépendante (l'existence de performances) n'est pas significative et doit
donc être supprimée du modèle.

Référence

Zheng, F., Soh, I. et Tan, C. (2021). BUS105 Statistics (guide d'étude). Singapour :
Singapour
Université des sciences sociales.

Vous aimerez peut-être aussi