Vous êtes sur la page 1sur 5

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION

UCAD-CREFDES-ASEF 2
TP SPSS 2019 A RENDRE AU PLUS TARD LE MERCREDI 20/03/2019

Il s’agit d’un travail individuel. Chaque question doit faire l’objet d’un petit commentaire. A
rendre :

- un fichier word comportant les sorties commentées (tableaux mis en forme,


graphiques, etc) ;
- les fichiers des syntaxes ;
- les bases de données finales.

Tous ces fichiers doivent être compressés en un seul dossier, et chaque étudiant est tenu de
m’envoyer son travail avant 00h du 20 mars 2019.

NB : chaque partie est indépendante de l’autre

PARTIE A 12 pts

1. Importer le fichier base_donnee dans SPSS (délimiteur de variables « ; » et labelliser


les variables suivantes. 1pt
Variable Libellé (étiquette)
sexe Sexe de l’agriculteur
statut_m Situation matrimoniale de l’agriculteur
semence_qte Quantité de semence en Kg
recolte_kg Quantité récoltée en Kg
cooperative Appartenance à une coopérative
vente_cfa Montant de la quantité de récolte
vendue
Distance_champ_a Distance de la maison par rapport au
champ
assurer Disposition d’une assurance agricole
Off_farm_inc Revenu hors ferme
2. Labéliser les modalités des variables « sexe », « alphabetise » en se référant aux
tableaux ci-dessous. Renommer la variable sexe en « genre » en utilisant la syntaxe.
0,5pt

Sexe
Homme 1 Femme 0
alphabetise
1 Oui 0 Non

3. Quelle est la proportion de femmes assurée qui sont membre d’une coopérative 0,5pt
4. La récolte en Kg est-elle plus élevée chez les agriculteurs ayant une assurance que
chez les non assurés ? Confirmer votre réponse par un test sur la moyenne 1pt
5. Y-a-il des agriculteurs qui ne vivent que des revenus agricoles ? (ceux qui ne disposent
pas de revenu hors ferme) ? Combien sont-ils et quelle est leur proportion par rapport
à l’ensemble des agriculteurs ? 1pt
6. Nous voulons comparer la récolte des personnes qui habitent à moins de 2 km de leur
maison par rapport à ceux qui habitant à une distance strictement supérieure à 2 km.
Pour cela, recoder la variable distance_champ_a en une nouvelle variable appelée
distance_recod qui prendra la valeur 1 si la distance est supérieure à 2 km et 0 Si non.
Faites ensuite un tableau montrant la récolte total en kg selon la nouvelle variable
(distance_recod). Quelle conclusion peut-on tirer ? 0,75pt

7. Existe-t-il des agriculteurs qui ont une école inférieure à la quantité semée ? Si oui
quelle est leur proportion ? 0,5pt
8. On veut savoir la proportion des agriculteurs qui auraient un revenu agricole inférieur
à ce qu’ils ont dépensé. Pour cela :
a. Calculer pour chaque agriculteur, le prix de la quantité vendue au Kg
(vente_cfa/vente_kg) 0,25 pt
b. Calculer le montant total qu’aurait gagné chaque agriculteur s’il avait vendu toute
sa récole au prix du Kg calculé précédemment. 0,25pt
c. Quelle est la proportion d’agriculteurs qui auraient un revenu agricole inférieur à la
dépense totale (hired_cfa + semence_cfa) 0,5pt
9. Y-a-t-il une corrélation statistiquement significative entre la surface cultivée
(sup_parcelle) et la quantité récolté (recolte_kg) ? Quelle est sa nature (positive ou
négative)? 0,5pt
10. a) Le niveau de fertilité du sol explique pourrait-il expliquer la quantité de récolte ?
(Autrement dit ? Peut-on dire que plus le sol est fertile plus la quantité récoltée
augmente ?) 0,75 pt
b) Quelle est la part de la récolte totale des agriculteurs ayant un niveau de fertilité
supérieur ou égale à 3 dans la quantité totale récoltée par l’ensemble des agriculteurs.
0,75 pt
11. Recoder la variable âge en age_recod comportant les tranches d’âge d’amplitude 10.
Quelle classe d’âge possède la récolte totale la plus élevée ? 0,5 pt
12. A l’aide d’une boîte à moustache, identifier les individus qui présentent des ventes
atypiques, selon le sexe de l’agriculteur. 0,5 pt
13. Faites une représentation graphique de la vente totale (vente_cfa) des agriculteurs
selon le sexe (homme, femme), en fonction de leur distance par rapport au champ. On
aura un graphique qui ressemble à ceci. 0.75pt

14) a) Créer un fichier de données comportant la vente moyenne, la vente totale et l’écart type
de la vente, selon le statut_m de l’agriculteur. Nommer ce fichier stat_vente et enregister la
dans votre dossier de travail. 1pt

b) En utilisant comme clé la variable statut_m, fusionner la base stat_vente à votre base
de données initiale (base_donnee) et enregistrer la base complète dans le dossier de travail.
0,5pt

PARTIE B 3,5pts

15) Importer la base de données TP_ASEF2_2019_suite dans SPSS. A l’aide des syntaxes,
labelliser les variables suivantes. 0,5pt
Variable Etiquette
Inco1 Private support (partner, family, friends)
Inco2 Public support (unemployment insurance,
social benefits)
Inco3 Drug dealing
Inco4 Housebreaking, theft, robbery
Inco5 Prostitution
Inco6 Mischeln/beggin
Inco7 Legal occupation

16) Dresser une répartition des individus de la base selon le nombre de sources de revenu.
Quel est le nombre maximal de source de revenu chez les femmes ? Chez les femmes de
Berne ? 1,5 pts

17) Quelle est la proportion de personnes qui vivent de ces deux sources de revenu : inco3 et
inco5 ? Quelle est la proportion de femmes ? Quelle est la proportion de femmes mariée ? 1pt

18) Quelle est la proportion des personnes qui tirent leur revenu du soutien privé (inco1) ou
public (inco2) ? 0,5pt

PARTIE C 4,5 pts

19. a) Importer la base de données Projet_ASEF2_2019_Suite.sav dans SPPS. 0,25pt

b) Corriger la variable revenu suivant cette consigne : Si le revenu de l’individu n’appartient


pas à l’intervalle [revenu-1,96*ecart-typecsp/√𝑛 ; revenu+1,96*ecart-typecsp/√𝑛] alors revenu
de l’individu n’a qu’à être égale au revenu moyen de la catégorie socioprofessionnelle (CSP).
NB : ecart_typecsp est l’écart type du revenu de chaque catégorie socioprofessionnelle. 1,25
pts

20) Après avoir fusionné cette base Projet_ASEF2_2019_suite.sav avec la base la base
S1Q2.sav en utilisant comme clé la variable numero_id, créer une variable S1Q2_new qui
représente S1Q2_1 et S1Q2_2 seulement. Sur cette base, dresser une répartition des
réponses de la nouvelle variable S1Q2_new. 0,75pt

21) a. Quelle est la proportion des individus qui regardent TV1 ou TV5 ou TV10. 0,5pt

b. Quelle est cette proportion chez les femmes ? 0,5pt

22) a. A quelle heure de la journée les femmes regardent le plus la télé ? 0,5 pt

23) a. Quelle est la proportion des femmes qui regardent la télé entre 10h et 14h ? 0,25 pt
b. Quelle est proportion des étudiants qui regardent la télé au-delà de 20h ? 0,5 pt
06H-07H

07H-08H
08H-09H
09H-10H

10H-11H

11H-12H

12H-13H

13H-14H

14H-15H

15H-16H

16H-17H

17H-18H

18H-19H

19H-20H

20H-21H

21H-22H

22H-23H

23H-00H

00H-06H
HEURET
V_1_1

10

11

12

13

14

15

16

17

18

19
2
3
4

9
CSP Niveau_instruction
Agriculteur, Eleveur, Pêcheur 1 Primaire 1
Artisan, Vendeur, Petits Commerçant 2 Moyen (6ème - 3ème) 2
Ouvrier, Manœuvre, Gens de service 3 Secondaire 2 (Seconde - Terminale) 3
Chauffeur, Transporteur 4 Supérieur (BAC +) 4
Employé 5 Autre Formation 5
Militaire, Fonctionnaire 6 Enseignement arabe 6
Elève, étudiant 7 Aucune 7
Cadre 8
Retraité 9
Chômeur 10
Ménagère 11

Chaines de Télévision Codes Chaines de Télévision Codes

TV1 1 TV9 8
TV2 2 TV10 9
TV3 3 TV11 10
TV4 4 TV12 11
TV5 5 TV13 12
TV6 6 TV14 13
TV7 7 TV15 14
TV8 8 TV16 15

BONUS : En utilisant le fichier Excel « Bonus_Pyramide », construire une pyramide des âges bien
soignée pour les individus qui sont représentés après avoir labellisé les modalités de la variable sexe
en 1 (Homme) et 2 (Femme). 1pt

BON TRAVAIL !

Enseignant : Komlan Amen DOGBE, Ingénieur Statisticien Economiste (ENSAE)

Vous aimerez peut-être aussi