Vous êtes sur la page 1sur 17

Ce travail est PROJE effectué par :



Ouahmane
Sdadi Mouhsine
T Mohamed

 Saaidou Wiam STATIS


 Rakini Salma
 Ouadani Latifa TIQUE
 Samri Bilal


Mourchid
Hamdan Imane
2022 / Dounia

 Zizi El mahdi 2023


 Kashi Abdelwhed

INTRODUCTION :
Afin de procéder à l’étude de notre projet en utilisant les deux méthodes (simple
et multiple) nous avons choisi comme étude : nombre des étudiants des encg (Y)
en fonction de trois variables explicatives: seuil(X1), nombre d’école (X2) et
nombre de bachelier(X3) , afin de déterminer si l’une ou toutes ces variables
influencent la variation du nombre de étudiants pour cela, nous avons collecté
les données et nous les avons présenter dans le tableau, pour faciliter le suivi de
la démarche de la régression qui consiste par la suite (après avoir posé le modèle
et collecté les données) à estimer les paramètres suivants par la méthode de
moindre carré ordinaire, puis réaliser des tests qui prouvent la validité du
modèle (Test de Fisher, Test Student, tableau ANOVA, coefficient de
corrélation et coefficient de détermination).

PRESENTATION :
La statistique appliquée est une pratique qui consiste à analyser des données
pour aider à définir et à déterminer les besoins opérationnels. En effet, deux
méthodes sont développées pour l’analyse des données en statistique appliquée,
celle de la régression linéaire simple et celle multiple.

La régression linéaire simple est une méthode statistique permettant de trouver


une relation linéaire entre une variable explicative (X) et une variable à
expliquer (Y). Alors que la régression multiple est une méthode statistique
utilisée lorsque le modèle est composé d’au moins deux variables
indépendantes. À l’inverse, un modèle de régression linéaire simple ne contient
qu’une seule variable indépendante. Comme il est excessivement rare, voire
impossible, de prédire un phénomène à l’aide d’une seule variable. Les résultats
de ces deux méthodes peuvent être facilement obtenus à travers un logiciel
appelé SPSS ; c’est un logiciel utilisé par des chercheurs en économie, en
science de la santé, par des compagnies d’études, par le gouvernement et par les
chercheurs de l’éducation nationale dans notre projet, nous allons essayer
d’utiliser les deux méthodes pour étudier la variable endogène (à expliquer)
choisie et savoir s’il y’a une relation entre cette variable et les variables
exogènes (explicatives) choisies. Pour ce faire, le rapport suivant est divisé en
3parties principales :

1ère partie: Présentation du projet

2ème partie: Etude par régression simple

3ème partie: Etude par régression multiple (à l’aide de SPSS)

I. Présentation du projet :
(Données collectés) :

X2 X3
N Y (nbr des X1
(Nombre des écoles (Nbr des
Années candidats) (seuil)
chaque année) bacheliers)
2007 1500 13 9 99186
2008 1580 13 9 95242
2009 1630 13 9 104112
2010 1680 14 9 78277
2011 1701 14 9 181153
2012 1990 14 9 163506
2013 1990 13,5 9 146979
2014 2000 13 9 205739
2015 2030 13,8 9 229782
2016 2130 13 10 206062
2017 2330 13 10 205524
2018 3195 12,55 10 238550
2019 3790 12,55 12 253808
2020 3940 14 12 292745
2021 4040 12 12 269031
2022 4040 12 12 273000

II. Etude par régression simple :

1. Explication par la variable X1


REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Nombre_des_candidats_accepté
/METHOD=ENTER Seuil.

Régression
[Ensemble_de_données0]
b

Variables introduites/supprimées
Variables Variables
Modèle introduites supprimées Méthode
a
1 Seuil . Entrée
a. Toutes variables requises saisies.
b. Variable dépendante :
Nombre_des_candidats_accepté

Récapitulatif des modèles


Erreur
standard de
Modèle R R-deux R-deux ajusté l'estimation
a
1 ,530 ,281 ,230 848,60229
a. Valeurs prédites : (constantes), Seuil

b
ANOVA
Somme des Moyenne des
Modèle carrés ddl carrés D Sig.
a
1 Régression 3941391,842 1 3941391,842 5,473 ,035
Résidu 10081761,908 14 720125,851
Total 14023153,750 15
a. Valeurs prédites : (constantes), Seuil
b. Variable dépendante : Nombre_des_candidats_accepté

Coefficients a

Coefficients non standardisés


Erreur
Modèle A standard
1 (Constante) 12386,382 4242,778
Seuil -753,879 322,241

Coefficientsa
Coefficients 95,0% % intervalles de
standardisés confiance pour B
Borne Limite
Modèle Bêta t Sig. inférieure supérieure
1 (Constante) 2,919 ,011 3286,528 21486,236
-,530
Seuil -2,339 ,035 -1445,017 -62,740

- Tableau ANOVA :
On constate que la variation expliquée par le modèle est inférieur à la
variation non expliquée, donc le modèle n’est pas valable.
- Coefficient de corrélation
r ( x , y ) =0,530. Le coefficient de corrélation tend vers 1 ce qui signifie que la

relation entre X1 (Seuil) et Y(nombre des candidats acceptés) est linéaire.


Coefficient de détermination : R2=0,281
28% de la variation de Y est expliquée par le modèle par rapport à la variation
totale.
Test de student :

{
On pose : H :â ≠ 0
1
H 0 : â=0

On Te=-2,339 et Tt=2,145, donc |Te| est supérieur à Tt, alors X1 explique


significativement Y.
On a la signification est égale à 3,5% est inférieur à 5%, donc on accepte H1,
alors X1 explique significativement Y.
- L’intervalle de confiance : D’après l’intervalle de confiance, on constate que
la valeur de â a une probabilité de 95% de chance d’être comprise entre -
1445,017 et -62,740. Elle est donc différente de zéro. Par conséquent X1
explique significativement Y
- Test de Fisher :
D’après le tableau ANOVA, on a le seuil de signification p=0,035 et α =0 , 05
On constate p<α donc on rejette H 0 et on accepte H 1, le modèle de régression
est validé.

2. Explication par la variable X2 :


REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Nombre_des_candidats_accepté
/METHOD=ENTER Nombre_des_écoles.

Régression
[Ensemble_de_données0]
b

Variables introduites/supprimées
Variables Variables
Modèle introduites supprimées Méthode
1 Nombre_des_ . Entrée
écoles
a. Toutes variables requises saisies.
b. Variable dépendante :
Nombre_des_candidats_accepté
Récapitulatif des modèles
Erreur
standard de
Modèle R R-deux R-deux ajusté l'estimation
a
1 ,962 ,926 ,920 272,86826
a. Valeurs prédites : (constantes), Nombre_des_écoles
b
ANOVA
Somme des Moyenne des
Modèle carrés ddl carrés D Sig.
a
1 Régression 12980754,527 1 12980754,527 174,339 ,000
Résidu 1042399,223 14 74457,087
Total 14023153,750 15
a. Valeurs prédites : (constantes), Nombre_des_écoles
b. Variable dépendante : Nombre_des_candidats_accepté

a
Coefficients
Coefficients non standardisés
Erreur
Modèle A standard
1 (Constante) -4696,820 547,273
Nombre_des_écoles 721,479 54,642

a
Coefficients

Coefficients
standardisés
Modèle Bêta t Sig.
1 (Constante) -8,582 ,000
Nombre_des_écoles ,962 13,204 ,000

a
Coefficients
95,0% % intervalles de
confiance pour B
Borne Limite
Modèle inférieure supérieure
1 (Constante) -5870,604 -3523,036
Nombre_des_écoles 604,283 838,674

a. Variable dépendante : Nombre_des_candidats_accepté

 Le modèle estimé : Ŷ =721 , 47 X 2−4696 ,82

- Tableau ANOVA :
On constate que la variation expliquée par le modèle est largement supérieur à
la variation non expliquée, donc le modèle peut être valable.
- Coefficient de corrélation : r ( x , y ) =0,962. Le coefficient de corrélation tend
vers 1 ce qui signifie qu’il y a une forte relation entre X2 (seuil) et Y(nombre
des candidats acceptés).
- Coefficient de détermination : R2=0,926
92,6% de la variation de Y est expliquée par le modèle par rapport à la
variation totale.
- Test de student :

{
On pose : H :â ≠ 0
1
H 0 : â=0

On a T e =13,204 et d’après la table student on a T t=2,145


On constate que T e >T t donc on accepte H 1, càd X2 explique significativement
Y.
- L’intervalle de confiance : D’après l’intervalle de confiance, on constate que
la vraie valeur de â a d’une probabilité de 95% de chance d’être comprise
entre 604,283 et 838,674. Elle est donc différente de zéro. Par conséquent X2
explique significativement Y
- Test de Fisher :
D’après le tableau ANOVA, on a le seuil de signification p=0,00 et α =0 , 05
On constate p<α donc on rejette H 0 et on accepte H 1, le modèle de régression
est validé.

3. Explication par la variable X3:


REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Nombre_des_candidats_accepté
/METHOD=ENTER Nombre_des_bachelier.

Régression
[Ensemble_de_données0]
b

Variables introduites/supprimées
Variables Variables
Modèle introduites supprimées Méthode
1 Nombre_des_ . Entrée
bachelier
a. Toutes variables requises saisies.
b. Variable dépendante :
Nombre_des_candidats_accepté

Récapitulatif des modèles


Erreur
standard de
Modèle R R-deux R-deux ajusté l'estimation
a
1 ,860 ,740 ,721 510,42809
a. Valeurs prédites : (constantes), Nombre_des_bachelier

b
ANOVA
Somme des Moyenne des
Modèle carrés ddl carrés D Sig.
a
1 Régression 10375637,988 1 10375637,988 39,824 ,000
Résidu 3647515,762 14 260536,840
Total 14023153,750 15
a. Valeurs prédites : (constantes), Nombre_des_bachelier
b. Variable dépendante : Nombre_des_candidats_accepté

a
Coefficients
Coefficients non standardisés
Erreur
Modèle A standard
1 (Constante) 192,622 383,206
Nombre_des_bachelier ,012 ,002

a
Coefficients

Coefficients
standardisés
Modèle Bêta t Sig.
1 (Constante) ,503 ,623
Nombre_des_bachelier ,860 6,311 ,000
a
Coefficients
95,0% % intervalles de
confiance pour B
Borne Limite
Modèle inférieure supérieure
1 (Constante) -629,272 1014,517
Nombre_des_bachelier ,008 ,016

a. Variable dépendante : Nombre_des_candidats_accepté

 Le modèle estimé : Ŷ =162 , 62+0,012 X 3


- Tableau ANOVA :
On constate que la variation expliquée par le modèle est largement supérieure
à la variation non expliquée, donc le modèle peut être valable.
- Coefficient de corrélation : r ( x , y ) =0,860. Le coefficient de corrélation tend
vers 1 ce qui signifie qu’il y a une forte relation entre X3 (nombre des
bacheliers) et Y (nombre des candidats acceptés). on parle donc d’une relation
linéaire entre X3 et Y.
- Coefficient de détermination : R2=0,740.
74% de la variation de Y est expliquée par le modèle par rapport à la variation
totale.
- Test de student :

{
On pose : H :â ≠ 0
1
H 0 : â=0

On a T e =6,311 et d’après la table student on a T t=2,145


On constate que T e >T t donc on accepte H 1, càd X3 explique significativement
Y.
- L’intervalle de confiance : D’après l’intervalle de confiance, on constate que
la vraie valeur de â a d’une probabilité de 95% de chance d’être comprise
entre 0,008 et 0,016. Elle est donc différente de zéro. Par conséquent X3
explique significativement Y
- Test de Fisher :
D’après le tableau ANOVA, on a le seuil de signification p=0,00 et α =0 , 05
On constate p<α donc on rejette H 0 et on accepte H 1, le modèle de régression
est validé.

III. Etude par régression multiple :


REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Nombre_des_candidats_accepté
/METHOD=ENTER Seuil Nombre_des_écoles Nombre_des_bachelier.

Régression
[Ensemble_de_données0]
b

Variables introduites/supprimées
Variables Variables
Modèle introduites supprimées Méthode
1 Nombre_des_ . Entrée
bachelier,
Seuil,
Nombre_des_
écoles

a. Toutes variables requises saisies.


b. Variable dépendante :
Nombre_des_candidats_accepté

Récapitulatif des modèles


Erreur
standard de
Modèle R R-deux R-deux ajusté l'estimation
a
1 ,976 ,953 ,941 234,49981
a. Valeurs prédites : (constantes), Nombre_des_bachelier,
Seuil, Nombre_des_écoles

b
ANOVA
Somme des Moyenne des
Modèle carrés ddl carrés D Sig.
a
1 Régression 13363271,834 3 4454423,945 81,004 ,000
Résidu 659881,916 12 54990,160
Total 14023153,750 15
a. Valeurs prédites : (constantes), Nombre_des_bachelier, Seuil, Nombre_des_écoles
b. Variable dépendante : Nombre_des_candidats_accepté

a
c. Coefficients
Coefficients non standardisés
Erreur
Modèle A standard
1 (Constante) -2694,482 1844,460
Seuil -69,882 106,649
Nombre_des_écoles 539,785 86,445
Nombre_des_bachelier ,004 ,001

a
Coefficients

Coefficients
standardisés
Modèle Bêta t Sig.
1 (Constante) -1,461 ,170
Seuil -,049 -,655 ,525
Nombre_des_écoles ,720 6,244 ,000
Nombre_des_bachelier ,272 2,623 ,022

a
Coefficients
95,0% % intervalles de
confiance pour B
Borne Limite
Modèle inférieure supérieure
1 (Constante) -6713,216 1324,251
Seuil -302,250 162,485
Nombre_des_écoles 351,437 728,132
Nombre_des_bachelier ,001 ,007

a. Variable dépendante : Nombre_des_candidats_accepté

 Le modèle estimé : Ŷ =−2694 , 48−69 , 88 X 1+ 539 ,78 X 2+ 0,004 X 3


- Tableau ANOVA :
On constate que la variation expliquée par le modèle est largement
supérieure à la variation non expliquée, ce qui signifie que le modèle peut
être valable.
- Coefficient de détermination ajusté : R2=0,941
94,1% de la variation de Y est expliquée par les trois variables X1, X2 et X3.
- Test de Fisher : D’après le tableau ANOVA, on a le seuil de signification
p=0,00 et α =0 , 05 . On constate p<α , ce qui signifie qu’il y’a au moins une
variable qui explique Y
- Test de Student :
 La constante n’est pas justifiée dans le modèle car sa signification est
inférieure à α =0 , 05 (modèle sans constante).
 Pour X1 : on a p=0,525 et α =0 , 05 . On constate que p>α donc X1
n’explique pas significativement Y (variable à rejeter)
 Pour X2 : le seuil de signification p=0,00 et α =0 , 05
On constate p<α donc on rejette H 0 et on accepte H 1, donc X2 explique
significativement Y, le modèle est donc valable (au moins une variable
explicative).
 Pour X3 : le seuil de signification p=0,022 et α =0 , 05
On constate p<α donc on rejette H 0 et on accepte H 1, donc X3 explique
significativement Y, le modèle est donc valable (au moins une
variable explicative).
Le modèle définitif : Ŷ =539 ,78 X 2 +0,004 X 3

CONCLUSION :
Dans notre projet « la hausse des candidats à Les ENCG ».Nous avons essayé
d’expliquer la cause à l’aide des outils statistiques ‘’la régression simple, la
régression multiple et le logiciel SPSS’’.

D’après tous nos efforts Nous avons conclus que la régression simple n’est pas
suffisante pour expliquer un phénomène socioéconomique, c’est pour ça on
s’appuie sur la méthode de la régression multiple et le logiciel SPSS pour les
calculs compliqués.

On se basant sur les interprétations de notre travail on peut déduire que ce


phénomène est bien expliqué par les deux variables explicatives X2(les
nombres des écoles), X3(les nombres de personne en branche économique).

D’où le modèle définitif est : Ŷ =539 ,78 X 2 +0,004 X 3

Vous aimerez peut-être aussi