Vous êtes sur la page 1sur 25

Université Mohamed I Filière : Economie & Gestion

Faculté Pluridisciplinaire Module : Informatique appliquée

NADOR Semestre VI (2022/23)


Module Informatique appliquée
TPM3 SPSS S6 SEG

PARTIE A :

1) Faire une analyse descriptive univariée (résumés numériques, graphiques) des variables nivform et
revenu. (Chap3)
POUR nivform :
Tableau d’effectif :

Niveau de formation

Effectifs Pourcentage Pourcentage Pourcentage


valide cumulé

sans formation 85 8,5 8,6 8,6

Primaire 465 46,5 46,9 55,4

collège 79 7,9 8,0 63,4


Valide
Lycée 275 27,5 27,7 91,1

Fac 88 8,8 8,9 100,0

Total 992 99,2 100,0


DK 5 ,5
Manquante NA 3 ,3
Total 8 ,8
Total 1000 100,0

Diagramme en Baton :
Commentaire :
On remarque que le pourcentage de niveau de formation (primaire) est le plus élevés suive les
lycéens et les autres catégories ils sont minoritaires et presque égales.

Diagramme en secteur :

« On peut faire aussi le diagramme en secteur dans ce cas »


Commentaire :
On remarque que le pourcentage de niveau de formation (primaire) est le plus élevés suive les
lycéens et les autres catégories ils sont minoritaires et presque égales.

Pour revenu :

Descriptives :

Statistiques descriptives

N Minimum Maximum Moyenne Ecart type

le revenu 1000 5027 148830 14563,44 7985,628


N valide (listwise) 1000

Histogramme :
Commentaire :
La courbe de lavariable de revanu semble proche une loi normale.
La Boite a moustache :
D’apres le graphe on a 50% des personnes qui ont un revenu entre 8500 et 20000 , mais ces constat peut
n’est pas etre exact 100% , car vu l’existence des valeurs extremes dans la variable revenu.

2) Pour étudier la variable revenu déterminer une autre variable revenuspb en éliminant les valeurs
extrêmes(Chap2) .
Calculer la variable :
IF (revenu < 36259) revenuspb=revenu.
VARIABLE LABELS revenuspb 'revenu déterminer une autre variable revenuspb en éliminant les '+
'valeurs extrêmes'.
EXECUTE.
Que remarquez vous alors ?
La boite a moustache :
(ndiroha bach nchofo lfar9 binha obin lwla on3tiw lremarque dyalna)
Commentaire :

En éliminant les valeurs extrêmes, la moyenne de la boite a moustache de revenu a passé par 14563 à 14178,
et la boite a moustache représentant maintenant plus mieux que avant.

Puis faire une analyse descriptive pour la variable revenuspb des individus suivant leur niveau de
formation et la region de leur habitation.(Chap3)
Commentaire :

D’après la boite a moustache on constat que les personnes qui ont le niveau de formation « FAC » est la plus
haut revenu par rapport les autres niveaux de formations, et également les personnes qui ont le niveau de
formation « FAC » n’habite pas dans la zone1 , et donc en générale on peut dire aussi que les personnes qui
habite dans les zones 2 et 3 ont les revenus la plus importants dans tous les niveaux de formation par rapports
aux autres zones.

3) Faire une analyse descriptive de la variable agecat en fonction de celui de marital, notamment la
modalité : veuf.(chap3)

Tableu croséés :
Tableau croisé Age category * MARITAL STATUS
Effectif

MARITAL STATUS Total

celebataire marié separé divorcé veuf

18-29 128 40 9 5 3 185

30-39 72 114 28 14 1 229

Age category 40-49 42 112 48 14 6 222

50-59 16 88 40 6 7 157

60-89 19 84 38 4 62 207
Total 277 438 163 43 79 1000

Diagramme en baton :

Commentaire :

D’après le diagramme en bâtons juxtaposée on constat que l’effectif des veufs dans la catégories d’Age
les plus jeunes est très bas (3.7% dans la catégorie d’Age de 18-29 et 1.2% dans la catégorie d’Age de
30-39), et commence à accroitre dans la catégorie la plus âgées (de 60-89).
Que peut on conclure de la situation financière (ya3ni kay9sdo lrevenu dyal al2aramil li
charfin) des personne agées qui sont veuves?
La boite a moustache :

(On9dro ndiro hta diagramme en baton juxtaposées autre stati)


Commentaire :
La moyenne de revenu des personnes agées qui sont veuves est :12738.9.
4) Déterminer la modalité de l'état civil dont la répartition du budget (revenu) sur la consommation est
la plus désordonnée ?
Commentaire :
La modalité de l’etat civil la plus désordonnees est celle des « divorcé ».

Comparer alors la répartition de budget des femmes et celui des hommes sur cette modalité pour
probablement expliquer se désordre (chap 2 et 3)
Calculer la variable :
(tout d’abord il faut créer une variable qui présent seulement les revenus des personnes
divorcé)
Commentaire :

On a la répartition des revenus sur la consommation des femmes et des hommes très désordre , car
premièrement les femme n’épargnent pas par contre les hommes ont été épargner, et également il y a des
différenciation entre les femmes et les hommes dans tous les catégories des consommation .

5) Quelle est la modalité de la variable couleur dont le revenu des ménages est le plus élevé. Donner
alors l'effectif de l'échantillon de cette modalité.
La boite a moustache :
Commentaire :
D’après le graphique la modalités des couleurs des personnes sera élevés est « blanc ».

Déterminer ensuite, une nouvelle variable revenumoy (chap 2et 3) qui contient pour chaque
individu la moyenne de la variable revenuspb correspondant à sa couleur de peau.
Explorer : ch3

Avant de créer le nouvelle variable revenumoy on utilise la procédure explorer pour déterminer la
moyenne de revenu de chaque modalité de couleur

Récapitulatif du traitement des observations


colleur de peau de Observations
répondant Valide Manquante Total

N Pourcent N Pourcent N Pourcent

Blan 810 99,4% 5 0,6% 815 100,0%


revenu déterminer une autre variable revenuspb en
noire 121 98,4% 2 1,6% 123 100,0%
éliminant les valeurs extrêmes
autre 61 98,4% 1 1,6% 62 100,0%

Descriptives

colleur de peau de répondant Statistique Erreur


standard

Moyenne 14184,0630 215,00099

Borne
13762,0374
Intervalle de confiance à inférieure
95% pour la moyenne Borne
14606,0885
supérieure

Moyenne tronquée à 5% 13984,5233

Médiane 13407,0000

Blan Variance 37442593,443

Ecart-type 6119,03534

Minimum 5027,00

Maximum 29727,00

Intervalle 24700,00

Intervalle interquartile 10438,25

revenu déterminer une autre variable Asymétrie ,379 ,086

revenuspb en éliminant les valeurs Aplatissement -,963 ,172


extrêmes Moyenne 13853,2479 502,48109

Borne
12858,3704
Intervalle de confiance à inférieure
95% pour la moyenne Borne
14848,1255
supérieure

Moyenne tronquée à 5% 13611,7075

Médiane 13397,0000
noire
Variance 30550956,355

Ecart-type 5527,29195

Minimum 5942,00

Maximum 28510,00
Intervalle 22568,00

Intervalle interquartile 9264,00

Asymétrie ,525 ,220


Aplatissement -,654 ,437

Moyenne 14756,2295 700,99042

Borne
13354,0399
Intervalle de confiance à inférieure
95% pour la moyenne Borne
16158,4191
supérieure

Moyenne tronquée à 5% 14579,3506

Médiane 14367,0000

autre Variance 29974642,113

Ecart-type 5474,91024

Minimum 6477,00

Maximum 27963,00

Intervalle 21486,00

Intervalle interquartile 8334,50

Asymétrie ,324 ,306

Aplatissement -,694 ,604

Moyenne des blanc : 14184,0630

Moyenne des noires : 13853,2479

Moyenne des autres : 14756,2295

La syntaxe :ch2

Pach ncreew wahd lvariable jdid smito revenumoey fih lmoyenne dyal revenue dyal kol chakhs
lbyd lk7l olkhrin khasna ndiro synatxe;

DO IF (colleur = 1).

COMPUTE revenumoy = 14184.0630.

ELSE IF (colleur = 2).

COMPUTE revenumoy = 13853.2479.

ELSE IF (colleur = 3).

COMPUTE revenumoy = 14756.2295.

END IF.

EXECUTE.
6) a) Donner une représentation graphique de la variable nivform qui ne contient pas la modalité :
sans formation.(chap3)
Diagrame en secteur :
Double clique et un clique et entre dans modalité et va supprimer la modalité de « sans
formation ».

b) Déduire dans ce cas la variable nivformexl en déclarant la modalité sans formation comme
manquante (chap2)
Création de variable :
Pour créer une nouvelle variable nivformexl il faut utiliser la création des variable
RECODE nivform (0=-9) (MISSING=SYSMIS) (ELSE=Copy) INTO nivformexl.
VARIABLE LABELS nivformexl 'la variable nivformexl en déclarant la modalité sans formation '+
'comme manquante '.
EXECUTE.
Et après il faut déclarer que -9 est un valeur manquante au niveau de affichage de variable, et
aussi on éliminer les anciennes valeur manquant (8et9).
Diagramme en secteur :

. Représenter graphiquement cette variable en faisant apparaitre les valeurs manquantes. ( ya3ni nbayno ta
les valeurs manquant mayt7ydoch : entrer dans les options et en coucher « l’affichage des groupes
comme valeurs manquantes ») chap3)

D’après le diagramme en secteur on a le pourcentage des valeur manquants dans l’échantillon est 9.30%.

PARTIE B :

1) Pouvez vous confirmer (chap4) que fraifix des individus de peau blanc est identique à celui de
peau noir?
Teste d’indeépendances :
Hit 3ndna ghir 2 modalités f lcouleur

T-TEST GROUPS=colleur(1 2)
/MISSING=ANALYSIS
/VARIABLES=fraifix
/CRITERIA=CI(.95).
Test d'échantillons indépendants

Test de Levene Test-t pour égalité des moyennes


sur l'égalité des
variances

F Sig. t ddl Sig. Différence Différence Intervalle de confiance


(bilatérale) moyenne écart-type 95% de la différence

Inférieure Supérieure

Hypothèse de
variances ,691 ,406 ,602 936 ,547 151,997 252,468 -343,472 647,466
frais égales
fixes Hypothèse de
variances ,693 180,597 ,489 151,997 219,429 -280,978 584,972
inégales

Pour le teste d’égalité des variances on a :


(p=0.406) c’est-à-dire que le p > 0.05 , donc on accepte H0 et on refuse H1 , alors les variances des frais
fixe des personnes qui ont la peau blanc est egal lavariance des personnes qui ont la peau noire.
Pour le teste d’égalité des moyenne on a :
(p=0.489) c’est-à-dire que le p > 0.05 , donc on accepte H0 et on refuse H1, alors les moyennes des frais
fixe des personnes qui on la peau blanc est égale la moyenne des personnes qui ont la peau noire.
par conséquent on peut confirmer que fraifix des individus de peau blanc est identique à celui de peau
noir

2) Même question pour les trois modalités de couleur, ont elles fraifix identique?

Teste Anova :

Hit 3nda 3 dyal lmodalités flcouleur , okhasna nt2kdo wach had lvariable fraisfixe rah tab3 wahd la
loi normal fga3 les modalités dyal lvariable couleur b3 bihom ; 3an tari9 l Histogramme .

* Donc tout d’abord, on doit vérifier que la variable frais fixe suit une loi normale sur toutes les modalités
des variables couleur par l’Histogramme

GRAPH

/HISTOGRAM=fraifix

/PANEL ROWVAR=colleur ROWOP=CROSS.


D’après le graphique on constat que les trois échantillons suit une loi normale.

* Alors maintenant on peut faire le test d’Anova :

manansawch ncochiw fiha 3la test d’homogeneté et teste de welch.

ONEWAY fraifix BY colleur

/STATISTICS HOMOGENEITY WELCH

/MISSING ANALYSIS.

Test d'homogénéité des variances


frais fixes

Statistique de ddl1 ddl2 Signification


Levene

,462 2 997 ,630

ANOVA à 1 facteur
frais fixes
Somme des ddl Moyenne des F Signification
carrés carrés

Inter-groupes 2680919,391 2 1340459,695 ,199 ,819


6705374218,58
Intra-groupes 997 6725550,871
4
6708055137,97
Total 999
5

Tests d'égalité des moyennes


frais fixes
a
Statistique ddl1 ddl2 Sig.

Welch ,263 2 134,963 ,769

a. Distribution F asymptotique.

Pour le teste d’égalité des variances on a :

(p =0.630) c’est-à-dire que p > 0.05 donc on accepte H0 et on rejette H1, alors les variances des trois
échantillon sont égaux.

Pour le teste d’égalitédes moyennes on a :

(p=0.769) c’est-à-dire que p > 0.05 donc on accepte H0 et on rejette H1, alors les moyennes des trois
échantillons sont égaux.

 Par conséquent on peut confirmer que la fraifix des individus des trois échantillons sont identiques.

3) Effectuer un test statistique convenable entre les variables Region et consom.


Teste de Chi-2 :
Hit 3ndna 2 variables qualitatifes li homa region w consom.
CROSSTABS
/TABLES=region BY consom
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT
/COUNT ROUND CELL.
Tests du Khi-deux

Valeur ddl Signification asymptotique (bilatérale)


a
Khi-deux de Pearson 15,719 12 ,204
Rapport de vraisemblance 15,657 12 ,207
Association linéaire par linéaire ,983 1 ,321
Nombre d'observations valides 1000

a. 0 cellules (0,0%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 17,47.

Pour le teste de khi-2 on a :


(p=0.204) c’est-à-dire que p > 0.05, donc on accepte H0 et on rejette H1 , alors les deux variables
sont indépendants.
4) a) Faire une analyse préliminaire (chap3) pour comparer le revenuspb des Région1 et Région5.
La boite a moustache :
On doit faire une analyse graphique antre revenu(quant) et region (qualit)
EXAMINE VARIABLES=revenuspb BY region
/PLOT=BOXPLOT
/STATISTICS=NONE
/NOTOTAL.
Commentaire :
D’après le graphique les personnes qui habitant dans la zone 1 qui ont le revenuspb est inférieur
au revenuspb des personnes qui habitant dans la zone 5.
b) Pouvez-vous généraliser votre conclusion à la population toute entière.
Teste-t d’une échantillon d’indépendance :
pour généraliser une conclusion à la population toute entière, il faut faire une teste d’indépendance
à la population toute entière.

T-TEST GROUPS=region(1 5)
/MISSING=ANALYSIS
/VARIABLES=revenu
/CRITERIA=CI(.95).

Test d'échantillons indépendants

Test de Levene Test-t pour égalité des moyennes


sur l'égalité des
variances

F Sig. t ddl Sig. Différence Différence Intervalle de confiance


(bilatérale) moyenne écart-type 95% de la différence

Inférieure Supérieure

Hypothèse de
-
variances 2,744 ,098 395 ,661 -377,121 858,217 -2064,364 1310,123
,439
le égales
revenu Hypothèse de
-
variances 229,438 ,680 -377,121 911,808 -2173,707 1419,466
,414
inégales

Pour le teste d’égalité des variances on a :

(p=0.098) c’est-à-dire p > 0.05 donc on accepte H0 et on rejette H1, alors les variances des 2 échantillon
sont égaux.

Pour le teste d’égalité des moyennes on a :

(p=0.680) c’est-à-dire p > 0.05 donc on accepte H0 et on rejette H1, alors les moyennes des 2 échantillon
sont égaux.
5) a) Faire une analyse descriptive de la variable fraifix suivant la variable revenuspb. Peut-on
prédire fraifix d’un individu suivant son revenuspb ?
dispersion point :
hit 3ndna fraifix o revenu bjoj bihom quantitatives kandiroha 3adi (simple).
GRAPH
/SCATTERPLOT(BIVAR)=revenuspb WITH fraifix
/MISSING=LISTWISE.

Commentaire :
Il exixte une relation liniéaire positive entre les deux variables.
Oui, on peut prédire fraisfix en fonction de revenuspb en utilisant la regression liniére.
b) Si oui donnez l'équation de la droite de régression.
Régression linière :
Pour faire cette équation de la droite de régression en utilise la régression linière ;
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT fraifix
/METHOD=ENTER revenuspb.

Récapitulatif des modèles

Modèle R R-deux R-deux ajusté Erreur standard


de l'estimation
a
1 ,881 ,777 ,776 956,857

a. Valeurs prédites : (constantes), revenu déterminer une autre


variable revenuspb en éliminant les valeurs extrêmes

* On a R²=77% , alors le revenuspb explique 77% des variation de fraisfix.

a
Coefficients

Modèle Coefficients non standardisés Coefficients t Sig.


standardisés

A Erreur standard Bêta

(Constante) -436,505 77,885 -5,604 ,000

revenu déterminer une autre


1 variable revenuspb en
,297 ,005 ,881 58,664 ,000
éliminant les valeurs
extrêmes

a. Variable dépendante : frais fixes

* On a (p=0.000) c’est-à-dire p < 0.05 donc on accepte H1 et on rejette H0, alors les variables sont
dépendants.

 La droit de régression linière est la suivante : Y= aX + b.

On a : b = constante (tableau)=-436.505 et a = extremes (li te7t constante) =0.297

Donc : Y= 0.297 X - 436.505

Vous aimerez peut-être aussi