Vous êtes sur la page 1sur 10

30-600-17 Rapport 2 Automne 2017

Statistique
30-600-17

Membres de l’équipe :

Nom de famille Prénom Matricule


1. EZZIANI MOHAMED 11201477

2.

3.

4.

5.

Nom de l’enseignant : Dalila Hafsi

Groupe : S02

30-600-17 Rapport 2 page 1


30-600-17 Rapport 2 Automne 2017

1. (8 points)
i.

Paramètre à estimer La proportion des écoles dont le coût annuel par étudiant est
supérieur à 5000$
Formule utilisée
^p ±t n−1 ;α / 2 ×
√ ^p (1− ^p )
√n
0.26 ± 1.97769× √
Éléments de la formule 0.26 ×(1−0.26)
√ 136
Borne inférieure 0.1856

Borne supérieure 0.3344

ii. Estimation adéquate?

La taille de l’échantillon n est suffisamment grande > 30, donc le théorème central limite
s’applique. Donc l’intervalle d’estimation est adéquat selon une population d’aujourd’hui.

iii. Interprétation

Au niveau de confiance 95%, on estime la proportion des écoles dont le coût annuel est
supérieur à 5000 varie entre 18,56% et 33,44%.

2. (8 points)
Test :

Test d’hypothèse entre deux moyennes appariées

Paramètre(s) à l’étude :

μ1=¿ Coûts moyens annuels par étudiant dans les écoles privées
μ2=¿ Coûts moyens annuels par étudiant dans les écoles publiques

Hypothèses :

30-600-17 Rapport 2 page 2


30-600-17 Rapport 2 Automne 2017

H 0 : μ1=μ2 ; H 1 : μ1 ≠ μ2 (Teste bilatéral)

Méthodologie (indiquer s’il y a lieu les étapes nécessaires à l’analyse)

Utiliser le gabarit StatistiquesDescriptives.xls pour aller chercher la moyenne de l’échantillon


(4597.84) et l’écart type (672.89)

Utiliser le gabarit test_et_intervalles_moyennes.xls, cas : données appariées, avec taille


échantillon = 136

Conditions de validité

N=136>30

Estimations

Moyenne = 4597.84
Écart-type=672.89

Seuil expérimental

2.1631E-115 < alpha = 0.05, donc on rejette H0

Conclusion

Au niveau de signification de 5%, les données observées nous permettent de rejeter H0. Donc
nous pouvons conclure que les coûts moyens annuels par étudiants dans les écoles privées est
différente des coûts moyens annuels par étudiants dans les écoles publiques.

3. (8 points)

Test :

Puisque nous avons deux variables à comparer, nous allons faire un test de corrélation et linéarité

Paramètre(s) à l’étude :

Code Pub: privée=0 ou publique=1


Code Langue : anglais=0 ou français=1

Hypothèses :

30-600-17 Rapport 2 page 3


30-600-17 Rapport 2 Automne 2017

H 0 : p=0 ( absence de relation linéaire ) ;


'
H 1 : p ≠ 0( présence d une relation linéaire)(test bilatéral)

Méthodologie (indiquer s’il y a lieu les étapes nécessaires à l’analyse)

En utilisant le gabarit test_sur_le_coefficient_de_correlation.xls on pour calculer le coefficient, et


ensuite faire un test d’hypothèse sur le coefficient de corrélation pour vérifier la linéarité de la
relation.

Coefficient de corrélation = 0.11137345

Conditions de validité

n>136>30

Seuil expérimental

Alpha étoile = 0.196752955 > alpha = 0.05, donc on ne rejette pas H0.

Conclusion

Au niveau de signification 5%, les données observées ne nous permettent pas de rejeter H0, c’est-
à-dire qu’il n’y a pas de relation linéaire entre le type de l’école et la langue d’enseignement.

4. (15 points)
i.
Test :

Le test de Welch

Paramètre(s) à l’étude :

μ1=coût moyen des écoles de taille petites


μ2=coût moyen des écoles de taille moyennes
μ3=coût moyen des écoles de taille grandes

30-600-17 Rapport 2 page 4


30-600-17 Rapport 2 Automne 2017

Hypothèses :
H 0 : μ1=μ1=μ1 ; H 1: au moins deux moyennes sont différentes

Méthodologie (indiquer s’il y a lieu les étapes nécessaires à l’analyse)

En utilisant le gabarit ANOVA_Welch_Holm.xlsx,

Conditions de validité

1. Puisque les 3 groupes ont une taille d’échantillon plus grande que 15, les variables
étudiées obéissent à la loi normale dans chacune des populations de référence.
2. Les 3 échantillons sont indépendants

Nos deux conditions sont respectées.

Seuil expérimental

Alpha = 2.5198E-09 < 0.05, donc on rejette H0.

Conclusion

Au seuil de signification 5%, les données nous permettent de rejeter H0, donc il y a un lien entre
la taille de l’école et les coûts annuels par étudiant.

ii.

Au seuil de signification 5%, nous avons le classement suivant, suivant leur seuil
expérimental respectif:

Petit =1.015E-09< Moyen = 9.072E-06 < Grand = 0.0013179

Voir solution tp3, problème 2, e)

30-600-17 Rapport 2 page 5


30-600-17 Rapport 2 Automne 2017

5. (17 points)
i. Le modèle est-il globalement significatif? Oui X Non

Justification :

Selon le gabarit régression, nous avons le seuil expérimental 3.69679 E-11, ce qui est inférieur à
5%.

H 0 :B 1=0
H 1 : B 1≠ 0
Donc on rejette H0.

ii. Intervalle de confiance pour β 0: [3260.99 ; 3861.93]

Interprétation :
On estime que le coût annuel moyen pour une école avec 0 professeur est situé entre
[3260.99 ; 3861.93]

Intervalle de confiance pour β 1: [5.972 ; 10.49]

Interprétation :
On estime que le coût moyen annuel d’un professeur de plus sera entre [5.972 ; 10.49].

iii. Valeur du coefficient de détermination : 0.2795

Interprétation :
Le modèle de régression considéré permet d’expliquer seulement 27.95% la variabilité du
coût annuel. Le modèle n’est donc pas vraiment performant.

iv. Intervalle de confiance de niveau de confiance 95 % pour le coût moyen par étudiant,
pour l’ensemble des écoles ayant un effectif de 90 professeurs. :

Selon le gabarit, à la page Prévision, Nb Profs = 90, nous avons que le coût moyen par
étudiant est dans l’intervalle [4175.60 ; 4428.82].

30-600-17 Rapport 2 page 6


30-600-17 Rapport 2 Automne 2017

6.
i. Le modèle est-il globalement significatif? Oui X Non

Justification :

Selon le gabarit régression, nous avons le seuil expérimental 3.05361 E-83, ce qui est inférieur à
5%.

H 0 :B 1=B 2=B 3=B 4=B 5=B 6=B 7=0


H 1 : au moins un coefficient B ≠0
Donc on rejette H0.

ii. Variables significatives :

Variable Significative? Justification


NbÉtud Oui Seuil expérimental (5.46296E-72 ) < 5%
NbProfs Oui Seuil expérimental (2.77078E-71 ) < 5%
Nbadmin Oui Seuil expérimental (0.016769855) < 5%
CodePub Oui Seuil expérimental (0.006372402) < 5%
NbSoutien Oui Seuil expérimental (2.42838E-07 ) < 5%
CodeLangue Non Seuil expérimental (0.085214203 ) > 5%
CodeSpéc Non Seuil expérimental (0.119674115 ) > 5%

iii. Équation de régression estimée :

Coûts/Ét = 4648,1 – 1.81NbÉtud + 25.77NbProf + 21.36NbAdmin + 116.36CodePub +


31.39NbSoutien + 11.86ProgSpec + 39.83CodeLangue

Interprétations des coefficients significatifs :

B0 = 4648.1$ : On estime que le coût annuel moyen de base est de 4648.1 lorsqu’il n’y a pas
d’étudiant, pas de prof, pas d’admin, pas d’employé de soutien, pour une école privée anglaise
avec aucun programme spécial.

NbÉtud : Toute chose étant égale par ailleurs, on estime qu’un étudiant supplémentaire entraine
une baisse de 1.81$ du coût moyen annuel par étudiant.

NbProf : Toute chose étant égale par ailleurs, on estime qu’un prof supplémentaire supplément
entraine une hausse de 25.77$ du coût moyen annuel par étudiant.

NbAdmin : Toute chose étant égale par ailleurs, on estime qu’un employé admin supplémentaire

30-600-17 Rapport 2 page 7


30-600-17 Rapport 2 Automne 2017

entraine une hausse de 21.36$ sur le coût moyen annuel par étudiant.
CodePub : Toute chose étant égale par ailleurs, on estime qu’une école publique entraine une
hausse de 116.36$, par rapport à une école privée, sur le coût moyen annuel par étudiant.

NbSoutien : Toute chose étant égale par ailleurs, on estime que le nombre d’employés de soutien
supplémentaire entraine une hausse de 31.39$ sur le coût moyen annuel par étudiant.

7. (18 points)
i. Expliquez les étapes

1. On enlève les valeurs non significatives dans le gabarit (CodeLangue et CodeSpec) dans la
page Données.

2. En revenant dans la page Rapport, on obtient les nouveaux coefficients pour les variables
significatives.

ii. Équation de la droite de régression 

Coûts/Ét = 4713.18 – 1.81NbÉtud + 25.72NbProf + 24.08NbAdmin + 101.13CodePub +


31.20NbSoutien

iii. Ce modèle est-il meilleur que le modèle 1? Oui X Non

Justification :

Pour le modèle 1, nous avons obtenu r2 ajusté = 0.2741


Pour le modèle 3, nous avons obtenu r2 ajusté = 0.9515

Le degré de corrélation du modèle 3 est de 95.15%, comparativement à seulement 27.41% pour


le modèle 1. Le modèle 3 est donc meilleur que le modèle 1.

iv. Intervalle de confiance de niveau 95 %, le coût annuel par étudiant pour une école publique
dont la langue d’enseignement est le français, qui compte 1390 étudiants, 75 professeurs,
5 programmes spéciaux, et 4 employés de soutien :

Avec toutes les variables : [4053.89 ; 4744.59]


Sans la variable NbAdmin : [4124.79 ; 4889.99]
30-600-17 Rapport 2 page 8
30-600-17 Rapport 2 Automne 2017

8. (8 points)

Test :
Puisque nous avons deux variables à comparer, nous allons faire un test de corrélation et linéarité
Paramètre(s) à l’étude :

NbÉtud:
NbProf :

Hypothèses :
H 0 : p=0 ( absence de relation linéaire ) ;
'
H 1 : p ≠ 0( présence d une relation linéaire)(Test bilatéral)

Méthodologie (indiquer s’il y a lieu les étapes nécessaires à l’analyse)

En utilisant le gabarit test_sur_le_coefficient_de_correlation.xls on pour calculer le coefficient, et


ensuite faire un test d’hypothèse sur le coefficient de corrélation pour vérifier la linéarité de la
relation.

Coefficient de corrélation = 0.8474

Conditions de validité

n>136>30

Seuil expérimental

Alpha étoile = 1.12269E-38 < alpha = 0.05, donc on rejette H0.

Conclusion

Au niveau de signification 5%, les données observées nous permettent de rejeter H0, c’est à dire
qu’il y a une relation linéaire entre la variable NbÉtud et la variable NbProfs. Il est donc justifié de
ne pas utiliser simultanément les deux variables cars ils ont une forte corrélation de 84.74%.

Des deux variables, celle qui a la plus grande corrélation avec avec le coût moyen par étudiant est
NbProf, soit un coefficient de corrélation de 0.5286, comparativement à seulement 0.0218 pour
la variable NbÉtud. Donc nous proposons NbProf.
30-600-17 Rapport 2 page 9
30-600-17 Rapport 2 Automne 2017

30-600-17 Rapport 2 page


10

Vous aimerez peut-être aussi