Vous êtes sur la page 1sur 2

TD 3 - Partie 1 : Statistiques de dispersion

Préparation : recopiez la base pays dans la librairie temporaire work, enregistrez l’éditeur
dans le dossier W:\bureau\sas\cycle1\ et appelez-le td3.sas.

1. Indicateurs de dispersion du PIB par habitant en 2012


a. Construisez la variable de PIB par habitant comme lors du TD précédent.
b. Effectuez une PROC UNIVARIATE et repérez dans les sorties l’ensemble des statis-
tiques de dispersion mentionnées dans le cours. En commentaire dans votre code,
synthétisez ces statistiques en une ou deux phrases.
c. Recommencez le traitement précédent en pondérant par la taille de la population
d’abord sans puis avec l’option VARDEF = WGT. Comparez avec les traitements non-
pondérés selon que l’option VARDEF est renseignée ou non.
d. Exportez le nombre d’observations et la valeur des quartiles non-pondérés dans la
base work.resultats. Vérifiez que la table est bien créée et que les valeurs qu’elle
contient correspondent à celles affichées dans les sorties.

2. Fonction de répartition empirique du PIB par habitant en 2012


À l’aide des outils présentés dans ce TD et des précédents, construisez la fonction de
répartition empirique du PIB par habitant en 2012. Ajoutez un titre à votre graphique
(instruction TITLE) et sauvegardez-le.

Indication : Utilisez les commandes PROC SORT, RETAIN et PROC GPLOT.

3. Construction de boîtes de Tukey


a. À l’aide de la PROC BOXPLOT, construisez la boîte de Tukey du PIB par habitant en
2012.
b. Recherchez des informations sur l’option BOXSTYLE = de la PROC BOXPLOT et
utilisez-là pour construire une boîte de Tukey qui mette en évidence les valeurs
extrêmes.
c. Après avoir trié la table pays par code_cont, comparez les boîtes de Tukey du PIB
par habitant selon les continents. Que pensez-vous du graphique dans le cas de
l’Océanie ?

TD 3 partie 2 : Mesures d’inégalités et introduction au macro-


langage

1. Intervalle inter-quartiles et rapport inter-déciles du PIB par habitant en 2012


a. Déterminez le premier décile, le neuvième décile ainsi que les quartiles non-pondérés
du PIB par habitant en 2012.
b. À l’aide de l’instruction %LET, créez les macro-variables d1, q1, q3 et d9 stockant
respectivement la valeur du premier décile, du premier quartile, du troisième quartile
et du neuvième décile de la distribution du PIB par habitant en 2012.
c. À l’aide de la fonction %SYSEVALF() et de l’instruction %PUT, calculez l’intervalle
inter-quartiles et le rapport inter-déciles du PIB par habitant en 2012 et affichez-les
dans le journal.
d. En vous appuyant sur l’instruction OUTPUT de la PROC UNIVARIATE et sur la CALL
SYMPUT de l’étape DATA, automatisez le calcul du rapport inter-déciles du PIB par
habitant en 2012.
e. À l’aide de l’instruction %MACRO, construisez le macro-programme %interdeciles(VAR=)
qui, pour une variable &VAR donnée de la table work.pays, calcule automatiquement
son rapport inter-déciles. Appliquez-le au PIB par habitant en 2012.

2. Courbe de Lorenz et indicateur de Gini du PIB par habitant en 2012


À l’aide d’une instruction %INCLUDE, soumettez le code contenu dans le fichier gini.sas
et utilisez la macro %gini(DATA=, VAR =) pour calculer l’indice de Gini relatif au PIB
par habitant en 2012.

Travail à rendre : Analyse des émissions de CO2 par habitant


→ La variable co2_09 renseigne les émissions de CO2 en 2009 des différents pays. En
utilisant les outils vus lors des TD 2 et 3, étudiez le niveau d’émission de CO2 par habitant
et rédigez un commentaire d’une page maximum comportant au moins un graphique
(correctement présenté). Envoyez le commentaire en format Word et votre code commenté
à votre chargé de TD.

Vous aimerez peut-être aussi