Vous êtes sur la page 1sur 25

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

Introduction au logiciel Stata Version 11 Windows Notes de cours de M. Menndez Prsentation du logiciel ...................................................................................................... 2 1.1. Commentaires prliminaires ...................................................................................... 2 1.2. Linterface .................................................................................................................. 3 1.3. Les fichiers ................................................................................................................. 4 1.4. Structure dun programme Stata................................................................................. 4 2. Grer une base de donnes ................................................................................................. 6 2.1. Lecture et enregistrement dune base de donnes ...................................................... 6 2.1.a. Ouverture des donnes : la commande use............................................................... 6 2.1.b. Importation des donnes : commandes insheet, infile, infix. ................................... 7 2.1.c. Enregistrement des donnes ..................................................................................... 8 2.2. Gestion des variables .................................................................................................. 8 2.2.a. Slection des donnes ............................................................................................... 8 2.2.b. Analyse du contenu dun fichier .............................................................................. 8 2.2.c. Gnrer de nouvelles variables ................................................................................. 9 2.3. Gestion de plusieurs bases........................................................................................ 10 2.3.a. Rorganisation des bases ........................................................................................ 10 2.3.b. Concatnation (append).......................................................................................... 10 2.3.c. Appariement (merge).............................................................................................. 11 2.3.d. Transformation (collapse) ...................................................................................... 11 2.3.e. Transposition (reshape) .......................................................................................... 11 3. Elments de programmation............................................................................................. 12 3.1. Oprateurs dans STATA .......................................................................................... 12 3.2. Quelques bases de programmation ........................................................................... 13 4. Statistiques descriptives ................................................................................................... 13 4.1. Synthse des donnes et statistiques descriptives .................................................... 13 4.2. Corrlations et tests de comparaison ........................................................................ 15 4.3. Graphiques ............................................................................................................... 17 4.3.a. Graphiques unidimensionnels (graph) .................................................................... 17 4.3.b. Graphiques bi-dimensionnels (twoway)................................................................. 19 4.3.c. Sauvegarde des graphiques..................................................................................... 20 5. Economtrie ..................................................................................................................... 20 5.1. Rgression linaire ................................................................................................... 20 5.1.a. La commande regress ............................................................................................. 21 5.1.b. La cration des variables indicatrices ..................................................................... 21 5.1.c. Commandes de post-estimation .............................................................................. 22 5.2. Modlisation des variables qualitatives dichotomiques (logit et probit).................. 22 6. Bibliographie .................................................................................................................... 23 7. Annexe ............................................................................................................................. 25 7.1. Prsentation de la base Vietnam98.dta ..................................................................... 25 1.

Version Septembre 2011

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

1. Prsentation du logiciel
1.1. Commentaires prliminaires Stata est un logiciel statistique apparu dans les annes 80, et quaujourdhui se positionne comme un logiciel de pointe dans les domaines de lanalyse et de la reprsentation graphique des donnes, de la statistique et de lconomtrie applique de bon niveau. Stata est dvelopp sur les plates-formes Windows, Macintosh et Unix en plusieurs versions selon la capacit de traitement des donnes (nombre dobservations, nombre de variables, taille des matrices). Ainsi les versions disponibles sont : Nombre dobservations Small Stata 1000 Stata/IC 2 147 483 647 Stata/SE et Stata/MP 2 147 483 647 Source: Cahuzac et Bontemps (2008). Nombre de variables 99 2047 32767 Taille des matrices 40 40 800 800 11 000 11 000

o Sur la mmoire: Attention : ces limites sont conditionns par la capacit de la machine utilise puisque Stata travaille en mmoire vive. De plus, la mmoire vive alloue au logiciel Stata louverture dune session (qui est de 1000K ou 1M par dfaut) peut tre insuffisante quand on travaille avec des gros fichiers ( ce moment l vous obtenez le message derreur : no room for more observations ). Il suffira daugmenter lespace de travail de Stata en utilisant la commande set memory : set memory 30m (pour attribuer, par exemple, 30M Stata) Cependant cette opration ne peut-tre ralis que si la mmoire est vide, c'est--dire quaucun fichier nest utilis. o Sur o trouver de laide pour lutilisation du logiciel Stata: Stata dispose dune srie de manuels officiels o lon peut trouver de laide sur lutilisation du logiciel et une description dtaille des commandes disponibles (voir bibliographie). Le logiciel dispose aussi dune version abrge de ces manuels en ligne. Ainsi, si vous souhaitez obtenir des informations sur une commande vous pouvez lancer la commande help suivi du nom de la commande : help regress Lorsque vous ignorez le nom prcis de la commande, il est pratique dutiliser la commande search (ou net search) suivie dun mot-cl en anglais qui prcise ce que lon cherche, pour trouver des suggestions de commandes (ou des programmes Stata et sites rfrencs sur internet) : search regression net search regression

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

1.2. Linterface o Les fentres de Stata: Lenvironnement informatique STATA comprend quatre fentres visibles en permanence: - La fentre Stata Results (en haut droite): affiche les commandes soumises et les rsultats des oprations effectus par Stata. - La fentre Review (en haut gauche): rcapitule les commandes soumises pendant toute la session ouverte de Stata. - La fentre Variables (en bas gauche): liste les variables de la base des donnes avec leur label . - La fentre Stata Command (en bas droite): permet de taper des commandes qui peuvent tre excutes immdiatement au moyen de la touche Entre . A ces 4 fentres sajoutent les fentres suivantes : - La fentre Viewer : apparat lors dune demande daide ou lors de la visualisation de fichiers log , qui enregistrent les commandes soumises et les rsultats obtenus (voir plus bas). - La fentre Do-file Editor : diteur de texte de Stata. - Les fentres Data Editor ou Data Browser : diteurs de donnes ; le premier permet lobservation et la modification des donnes, et le deuxime permet seulement lobservation des donnes mais pas leur modification.

o La barre doutils (Toolbar) Elle permet de grer facilement et rapidement les actions de base. De gauche droite les icones reprsentent: ouverture dun fichier de donnes Stata, sauvegarde du fichier, impression des rsultats/graphiques, cration/ouverture dun fichier log, affichage de la fentre Viewer, affichage du dernier graphique command, ouverture de la fentre Dofile Editor, ouverture des fentres du Data Editor et du Data Browser, le bouton go qui permet dviter de faire de pauses au milieu de lexcution dune commande longue et

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

finalement un bouton pour stopper la commande en cours (si elle est trop longue ou si on a commis une erreur de programmation, par exemple).

1.3. Les fichiers Il existe 4 principaux fichiers avec des extensions spcifiques : - les fichiers de donnes au format Stata (identifis par le suffixe .dta), - les fichiers gnrs par lditeur de texte et qui contiennent les commandes (ou programmes) ncessaires pour un traitement (identifis par le suffixe .do), - les fichiers .ado, qui sont des procdures fournies ou tlcharger-, c'est--dire de routines crites dans le langage Stata et qui permettent de raliser des traitements spcifiques. - Les fichiers qui servent enregistrer les rsultats du travail effectu dans Stata au cours dune session (identifis par le suffixe .log). Dautres types de fichiers Stata connatre: - les fichiers daide en ligne (.hlp), - les graphiques (.gph) et - les fichiers texte contenant le dictionnaire des variables ncessaires pour la lecture des donnes au format fixe (.dct). A son installation, Stata cre de faon automatique un rpertoire appel ado dans C:\, qui nest que la bibliothque des procdures (les .ado) qui sont mises jour rgulirement, ayant t corriges, homognises ou compltes par le groupe industriel StataCorp (aids par la communaut des utilisateurs). Pour assurer une bonne organisation du reste des fichiers gnrs par nous, il est utile de crer un ensemble structur de rpertoires. Voici un exemple de cration et dorganisation des rpertoires pour ce cours. Rpertoire de base : P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata Les bases de donnes (ex. : la base Vietnam98.dta) sont stockes dans le rpertoire : P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata\data Les programmes que nous allons dvelopper seront stocks dans : P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata\dofiles Et nos rsultats (graphiques, logfiles, ) dans : P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata\results

1.4. Structure dun programme Stata Si vous utilisez de faon rpte la mme srie de commandes, vous pouvez sauvegarder ces commandes dans un fichier do-file (.do). Pour crer un do-file ou un programme on utilise lditeur intgr de Stata, le Do-file Editor. Une fois les commandes saisies dans 4

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

lditeur, elles peuvent tre excutes en les slectionnant et en utilisant licne de lditeur .do (sur la barre des menus, deuxime icne partir de la droite, correspondant la commande do current file ). Un do-file doit tre clair afin de pouvoir tre utilis longtemps aprs sa ralisation ou par des tiers. Pour cela il est utile davoir en mmoire quelques bons reflexes de programmation. Voici certaines recommandations. - Bien crire : Indiquer la date de cration du do-file ainsi que toutes les dates de rvision, avec ventuellement un bref descriptif des changements apports. - Les commentaires : Stata traite chaque ligne qui commence par un astrisque (*) comme un commentaire. Vous pouvez crire des commentaires de plusieurs lignes en plaant une barre oblique et un astrisque (/*) au dbut de ce commentaire et un astrisque et une barre oblique la fin (*/). - Les dlimiteurs : Stata estime par dfaut que chaque commande est termine au bout dune ligne. Si, toutefois, une commande est trop longue pour tenir sur une seule ligne, vous pouvez la rpartir sur plusieurs lignes en indiquant STATA quel sera le sparateur de commande (par exemple, le point-virgule, en crivant la commande #delimit ;). Si vous voulez que la ligne redevienne le dlimiteur de commande, il faudra r-crire : #delimit cr. Une alternative est dcrire simplement 3 slashes /// en fin de ligne et de ne rien mettre en dbut de ligne. - Conserver les rsultats : pour conserver toute la trace des rsultats (et des commandes) il faut ouvrir un fichier .log au dbut de la session. On pourra donc cliquer sur licne de lditeur de log, soit en crivant : log using P:\Home\...\Stata\results\exemple.log, replace La commande log dispose de loption replace, qui permet dcraser un ancien fichier log du mme nom, ou de loption append, pour coller les nouvelles sorties la fin dun ancien fichier. -Bien se situer : il est utile de se situer ds le dpart dune session de travail avec Stata sur le rpertoire de travail que nous avons cre avant sur notre ordinateur. La commande cd (synonyme de chdir) nous permet de changer de rpertoire de travail. Pour savoir dans quel rpertoire on est, il suffit de taper la commande pwd (de langlais path of current working directory ). Voici un exemple de fichier .do :

* Date: 01/08/2012

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

/* Ce dofile nous montre comment crer un fichier .log dans un fichier .do et quelques commandes de base de STATA. Afin de rendre les programmes lisibles, il est utile de les commenter, mais attention : trop des commentaires peuvent nuire la lisibilit ! */ clear capture log close cd P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata #delimit ; log using P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata\results\exemple, replace; #delimit cr use P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata\data\Vietnam98.dta /* Raccourci possible : use .\data\Vietnam98.dta Car une fois quon a indiqu Stata le chemin vers notre rpertoire de travail (grce la commande cd ), au lieu de devoir le rcrire chaque fois, il est possible de rsumer et substituer le chemin connu du rpertoire par un point */ describe list in 1/3 ; summarize hhsize su hhsize, detail bysort region: su hhsize sum hhsize eduhh [w=weight], d tabulate sexhh tabulate educhhgr sexhh, col row chi label define sexhhlbl 1 man 2 woman label values sexhh sexhhlbl label variable sexhh "Gender of head" sort totinc save .\data\exemple, replace log close

2. Grer une base de donnes


2.1. Lecture et enregistrement dune base de donnes La base Vietnam98.dta est stocke dans le rpertoire : P:\Home\Prof\Menendez\Etud\M1\CoursStataSAS\Stata 2.1.a. Ouverture des donnes : la commande use Si vous disposez de donnes sous format Stata (.dta) alors vous pouvez ouvrir votre base de donnes en saisissant la commande use dans la fentre Stata Command, ou dans votre dofile: use P:\Home\Prof\...\Stata\data\Vietnam98.dta Vous pouvez ventuellement vous placer dabord dans le rpertoire choisi (avec la commande cd) et ouvrir ensuite la base : cd P:\Home\Prof\...\Stata\data use Vietnam98.dta

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

Il faut parfois rajouter loption clear, afin de vider les donnes en mmoire avant louverture dun nouveau fichier (les options en Stata sont gnralement situes aprs les commandes et aprs une virgule) : use Vietnam98.dta, clear Vous pouvez galement cliquer sur licne Open de la barre doutils et rechercher le fichier dont vous avez besoin. 2.1.b. Importation des donnes : commandes insheet, infile, infix. Stata nest pas un logiciel de transfert de donnes (voir pour cela Stata/Transfer ou DBMS Copy), aussi ne peut-il que lire des fichiers des donnes au format Stata ou au format texte (ASCII). Plusieurs commandes sont disponibles afin dimporter des donnes ASCII provenant dautres sources en fonction de leur format. - La commande insheet : lit des fichiers ASCII o il y a une seule observation par ligne et ou les variables sont spares par des tabulations ou des virgules. La premire ligne du fichier peut contenir les noms des variables. Exemple : insheet using dataTP1a.txt insheet using dataTP1b.cvs - La commande infix : sert importer des donnes dans un format fixe (les variables ne sont pas dlimites par un sparateur mais occupent toujours une mme position). On peut utiliser infix soit en indiquant leur position aprs chaque variable (et le type de variable avant): infix str5 var1 1-4 var2 6-7 var3 9-11 using dataTP1c.txt soit en indiquant un fichier (dictionnaire de variables) o sont spcifies les positions : infix using dicoTP1c.dct Dans ce cas, lcriture du dictionnaire (le fichier dicoTP1.dct) a une forme particulire : infix dictionary using dataTP1c.txt { str5 var1 1-4 var2 6-7 var3 9-11 } - La commande infile : lit des fichiers ASCII complexes o il peut y avoir plusieurs observations par ligne et o les variables sont spares par des tabulations, des virgules ou des espaces. Elle est la commande la plus volue pour importer des donnes mais aussi la plus complexe manipuler. Elle peut tre utilise avec ou sans dictionnaire. - Les logiciels de transfert de donnes : Enfin, si vous avez accs aux logiciels de transfert de donnes Stat/Transfer, DBMS Copy, etc., vous pouvez facilement convertir nimporte quel format des donnes (SAS, Excel, SPSS, Gauss, ASCII, ) en format Stata et inversement. Attention : il faut toujours vrifier que le transfert a correctement pris en compte toutes les variables de la base.

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

2.1.c. Enregistrement des donnes Si vous effectuez des changements dans un fichier de donnes STATA ouvert et que vous souhaitez sauvegarder ces changements, vous pouvez utiliser la commande save (il faut ajouter loption replace sil existe dj une base de donnes avec le mme nom, que lon veut remplacer par cette nouvelle base) : save P:\Home\Prof\...\data\dataTP1.dta, replace Si vous tes dj dans le bon rpertoire, il suffit d'crire : save dataTP1.dta, replace Attention : pour prserver les donnes initiales, on noublie pas de donner un nom diffrent la base sur laquelle on va effectuer les traitements de celui de la base initiale.

2.2. Gestion des variables 2.2.a. Slection des donnes Il est possible de slectionner des variables et des observations dun fichier de donnes en utilisant les commandes keep ou drop, et laide de la clause if : keep agehh totinc drop agehh totinc drop if hhsize>=5 keep in 1/20

2.2.b. Analyse du contenu dun fichier Afin de visualiser toutes les variables dans un fichier de donnes, utilisez la commande describe (abrge comme des). Pour visualiser seulement une variable ou une liste de variables, utilisez la commande describe ou codebook suivie des noms des variables. Utilisez la commande count pour connatre le nombre dobservations dans la base de donnes. Exemples : des codebook region count count if region==1 Pour visualiser les donnes effectivement enregistres dans les variables, utilisez la commande list suivie de la liste des variables (ventuellement assortie d'un ensemble de conditions) qui vous intressent :

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

list hhsize eduhh if (sexhh==0 & agehh<45) Stata peut galement afficher les donnes sous forme de feuille de calcul. Les deux icnes Data Editor (pour diter) et Data Browser (simplement pour afficher) se trouvent dans la barre doutils. Les commandes edit et browse permettent galement dafficher les donnes sous forme de feuille de calcul. 2.2.c. Gnrer de nouvelles variables La commande generate (abrg gen) cre de nouvelles variables, tandis que la commande replace modifie les valeurs dune variable existante : gen eduhhgr=0 if eduhh==1 replace eduhhgr=1 if eduhh>=2 & eduhh<=5 Un grand nombre de fonctions utiles peuvent tre obtenues partir des commandes generate et replace, par exemple mean(.) ou max(.). Voir help generate. Une extension de la commande generate est egen ( extended generate , voir help egen). Il est possible aussi de renommer et recoder des variables avec les commande rename et recode. Pour amliorer la comprhension et la lisibilit des fichiers, il est parfois utile de joindre des labels, i.e., des intituls, aux fichiers, aux variables et aux modalits des variables. On utilise alors la commande label. - Pour assigner un label lensemble d'un fichiers de donnes : label data Enquete Vietnam, 1998 - Pour assigner un label aux variables : label variable eduhhgr Education level of head - Pour assigner des labels aux modalits dune variable "catgorielle", il faut, tout dabord, dfinir les valeurs du label, puis assigner ce label la ou aux variables. label define sexlbl 0 "Woman" 1 "Man" label values sexhh sexlbl - Pour rendre les labels encore plus explicites en rajoutant le code de la variable au label, une fois les labels definis par la commande label define, tapez : numlabel sexhhlbl, add - Pour visualiser les labels, tapez : label list - Pour supprimer un label, tapez: label drop sexhhlbl

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

2.3. Gestion de plusieurs bases Dans lanalyse des donnes il faut souvent runir et combiner diffrents fichiers de donnes. Stata dispose dune srie de commandes, selon le type de combinaison souhaite. 2.3.a. Rorganisation des bases Il est gnralement ncessaire de rorganiser les variables et les observations des diffrentes bases de donnes avant de les combiner. Stata permet de le faire laide des commandes suivantes : - Les commandes order / aorder / move : permettent de trier les variables de la base de donnes. La commande order est suivie de la liste de variables ordonner. La commande aorder rorganise toutes les variables (ou bien uniquement celles cites aprs la commande) par ordre alphabtique. La commande move intervertit la place dans le fichier des deux variables cites. Exemples : order country year urban region aorder move popw hhsize - Les commandes sort / gsort : permettent de trier les observations de la base de donnes. La commande sort classe les variables par ordre ascendant, c'est--dire, du plus petit au plus grand (les valeurs manquantes tant places la fin pour les variables numriques et au dbut pour les variables de type chane). La commande gsort permet de trier les variables bien par ordre ascendant (nom de la variable prcd du signe +) bien par ordre descendant (nom de la variable prcd du signe -). Exemples : sort idh region gsort agehh +eduhh 2.3.b. Concatnation (append) La commande append permet dajouter des observations la fin dun fichier en mmoire (concatnation). Les variables doivent avoir le mme nom dans les diffrents fichiers pour un empilage parfait. Exemple : use VNM_yc_urb.dta append using VNM_yc_rur.dta NB: dans cet exemple, si la variable permettant une distinction des donnes urbaines et rurales navait pas t disponible dans les fichiers avant la concatnation, et cette information est retenir dans notre analyse, le premier soin est de crer cette variable avec le mme nom et des codes diffrents dans les deux fichiers runir.

10

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

2.3.c. Appariement (merge) La commande merge permet dajouter des variables, c'est--dire, de faire de jointures de fichiers selon un mot cl ou identifiant dappariement commune aux deux fichiers, qui peut tre une variable ou liste de variables de la base de donnes. Par exemple, vous avez deux fichiers pour les mmes mnages, lun avec des informations sur les caractristiques dmographiques des mnages, lautre avec des donnes de revenus et consommation. Il est indispensable que les deux fichiers apparis (le fichier master ou base principale et le fichier using ou base ajoute) soient ordonns selon lidentifiant choisi et ne pas oublier de prciser cet identifiant dans la commande merge. Exemple : * Notre identifiant est la variable du code du mnage : idh use VNM_demog.dta sort idh save VNM_demog.dta, replace use VNM_yc_rur.dta sort idh merge 1:1 idh using VNM_demog.dta tab _merge NB: la commande merge cre la variable _merge, qui permet dvaluer si lappariement a t ralis correctement. Il faut toujours vrifier que lopration dappariement sest bien droule laide des commandes telles que codebook (section 2.2.b) ou tabulate (section 4 plus bas). La variable _merge prendra les valeurs : 1- pour les observations de la base principale non retrouves dans la base ajoute. 2- pour les observations de la base ajoute non retrouves dans la base principale. 3- pour les observations retrouves dans les deux bases et parfaitement apparies. 2.3.d. Transformation (collapse) La commande collapse transforme la base de donnes en mmoire en statistiques essentielles sur celle-ci (sommes, moyennes, mdianes, etc.). Exemple : collapse (mean) totinc totcons, by(region urban) collapse (mean) totinc, by(eduhh urban) cw NB1 : la commande collapse traite les observations manquantes comme des zros dans le calcul des statistiques. Linclusion de loption cw (daprs casewise deletion ) permet de ne pas utiliser ces donnes manquantes. Mais il est donc prfrable de toujours sassurer du nombre dobservations rellement utiliss dans le calcul des moyennes. NB2: la commande collapse remplace les donnes en mmoire. Il faut donc bien vrifier que le fichier de donnes utilis jusqu cette commande a bien t sauvegard avant. 2.3.e. Transposition (reshape)

11

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

La commande reshape permet de transformer un fichier organis en colonnes (format long ) en fichier organis en lignes (format wide ou large) et vice-versa. Exemple :
Donnes format long
Urban Urban Rural Urban Rural Urban Rural Urban Rural Urban Rural eduhh no education no education Primary Primary Secondary Secondary vocational vocational Higher Higher Totinc 1660.313 940.5851 2175.329 1095.858 2454.21 1174.587 1842.458 1020.062 2607.869 1039.866

Donnes format wide ou large


Eduhh no education primary secondary vocational higher totinc1 1660.313 2175.329 2454.21 1842.458 2607.869 totinc2 940.5851 1095.858 1174.587 1020.062 1039.866

Et les commandes utilises pour passer de lun lautre : reshape wide totinc, i(eduhh) j(urban) (pour passer du wide au long) reshape long totinc, i(eduhh) j(urban) (pour passer du long au wide) NB : les labels des valeurs des variables se perdent au passage dun format lautre (dans notre exemple, urban correspond la valeur 1 et rural 2).

3. Elments de programmation
3.1. Oprateurs dans STATA Liste des oprateurs relationnels et logiques utiliss dans STATA :
Arithmtiques Logiques Relationnels (Numriques et chanes) + * / ^ addition soustraction multiplication division puissance ~ ! | & non, nest pas non, nest pas ou et > < == >= <= suprieur infrieur gal suprieur ou gal infrieur ou gal

12

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

!= + concatnation de chanes (string concatenation) ~=

diffrent de diffrent de

3.2. Quelques bases de programmation Si un dofile peut tre considr comme un long programme, il est parfois utile lintrieur dun dofile dutiliser un programme pour effectuer une procdure rptitive en conomisant des lignes de programmes. Stata dispose dj dune srie de procdures (les .ado), mais nous pouvons crer nos propres programmes (en modifiant des adofiles dj existants ou en crant des nouveaux) pour effectuer certaines taches.

4. Statistiques descriptives
4.1. Synthse des donnes et statistiques descriptives o Commande summarize: Cette commande summarize (abrge comme sum ou su), calcule et affiche certaines statistiques de synthse, comme les moyennes et les carts types. Exemple : sum hhsize Pour obtenir les mdianes et les centiles dune variable, il faut ajouter loption detail (abrge par d) . Exemple : sum hhsize, d Si on veut connatre ces informations en fonction dune autre variable "catgorielle", il est possible d'utiliser loption by (les donnes doivent avoir t pralablement ordonnes avec la commande sort, sinon il faut utiliser directement loption bysort). Exemple : sort urban by urban : sum hhsize, d ou directement, bysort urban : sum hhsize, d
FENETRE RESULTS: . sum hhsize Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------hhsize | 5968 4.624832 1.943608 1 18 . sum hhsize, d Household size ------------------------------------------------------------Percentiles Smallest 1% 1 1 5% 2 1

13

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

10% 25% 50% 75% 90% 95% 99%

2 3 4 6 7 8 10

1 1

Obs Sum of Wgt. Mean Std. Dev. Variance Skewness Kurtosis

5968 5968 4.624832 1.943608 3.77761 .6814886 4.40378

Largest 14 14 16 18

. bysort urban : sum hhsize, d ---------------------------------------------------------------------------------------------> urban = urban Household size ------------------------------------------------------------Percentiles Smallest 1% 1 1 5% 2 1 10% 2 1 Obs 1711 25% 3 1 Sum of Wgt. 1711 50% 75% 90% 95% 99% 4 5 7 8 10 Largest 13 14 16 18 Mean Std. Dev. Variance Skewness Kurtosis 4.383402 1.935282 3.745315 1.163849 6.581378

---------------------------------------------------------------------------------------------> urban = rural Household size ------------------------------------------------------------Percentiles Smallest 1% 1 1 5% 2 1 10% 2 1 Obs 4257 25% 3 1 Sum of Wgt. 4257 50% 75% 90% 95% 99% 5 6 7 8 10 Largest 13 14 14 14 Mean Std. Dev. Variance Skewness Kurtosis 4.72187 1.938717 3.758622 .4977546 3.692073

La synthse complte de la commande summarize est (tapez help summarize) : [bysort varlist: ] summarize [varlist] [weight] [if exp] [in range] [, [detail|meanonly] format separator(#)

o Commandes tabulate et table: Pour les variables "catgorielles", il faut utiliser la commande tabulate (abrge en tab). Exemples : tab urban tab eduhh if urban==1 La commande tabulate est aussi utilise pour crer un tableau double entre. Exemples : tab eduhh sexhh tab eduhh sexhh, row ou col (si lon souhaite visualiser les pourcentages par lignes ou par colonnes).

14

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

Lautre commande trs utile est table, qui associe les fonctions des commandes sum et tab. En outre, elle permet d'afficher les rsultats sous une prsentation claire (voir help table). Exemple : table urban, c(mean hhsize mean totinc)
FENETRE RESULTS: . tab urban Urban/Rural | dummy | Freq. Percent Cum. ------------+----------------------------------urban | 1,711 28.67 28.67 rural | 4,257 71.33 100.00 ------------+----------------------------------Total | 5,968 100.00

. tab sexhh urban Gender of | Urban/Rural dummy hh head | urban rural | Total -----------+----------------------+---------male | 1,008 3,222 | 4,230 female | 703 1,035 | 1,738 -----------+----------------------+---------Total | 1,711 4,257 | 5,968

. tab sexhh urban, row +----------------+ | Key | |----------------| | frequency | | row percentage | +----------------+ Gender of | Urban/Rural dummy hh head | urban rural | Total -----------+----------------------+---------male | 1,008 3,222 | 4,230 | 23.83 76.17 | 100.00 -----------+----------------------+---------female | 703 1,035 | 1,738 | 40.45 59.55 | 100.00 -----------+----------------------+---------Total | 1,711 4,257 | 5,968 | 28.67 71.33 | 100.00

. table urban, c(mean hhsize mean totinc) -------------------------------------Urban/Rur | al dummy | mean(hhsize) mean(totinc) ----------+--------------------------urban | 4.38 1958.557 rural | 4.72 1024.507 --------------------------------------

4.2. Corrlations et tests de comparaison o Commandes correlate et pwcorr:

15

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

La commande correlate (abrege en corr) permet dobtenir le coefficient de corrlation (ou la covariance, avec loption cov aprs virgule) entre deux ou plus variables. Ainsi : corr totinc totcons corr totinc totcons, covariance
FENETRE RESULTS : . corr totinc totcons (obs=5968) | totinc totcons -------------+-----------------totinc | 1.0000 totcons | 0.4704 1.0000

. corr totinc totcons, cov (obs=5968) | totinc totcons -------------+-----------------totinc | 4.8e+06 totcons | 1.1e+06 1.1e+06

La commande pwcorr permet de faire de tests de significativit des coefficients de correlation et de nafficher que les coefficients significatifs un certain niveau indiqu par nous. Lhypothse teste est H0 : {absence de corrlation}. Exemple : pwcorr hhsize totinc totcons agehh, star(0.01) print(0.05) Dans cet exemple Stata affichera les corrlations significatives au seuil de 5% et marquera avec une toile celles significatives au seuil de 1%.
FENETRE RESULTS: . pwcorr hhsize totinc totcons agehh, star(0.01) print(0.05) | hhsize totinc totcons agehh -------------+-----------------------------------hhsize | 1.0000 totinc | 0.1483* 1.0000 totcons | 0.2513* 0.4704* 1.0000 agehh | -0.0851* 1.0000

o Commandes ttest et sdtest: La commande ttest permet de faire un test dgalit de moyennes et la commande sdtest un test dgalit de variances (cart types). Les hypothses testes sont H0 : {la diffrence des moyennes -ou cart types- de chaque groupe dune variable es nulle}. Exemples : ttest totinc, by(urban) sdtest totinc, by(urban)

FENETRE RESULTS: . ttest totinc, by(urban)

16

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

Two-sample t test with equal variances -----------------------------------------------------------------------------Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------urban | 1711 1958.557 86.19206 3565.269 1789.504 2127.61 rural | 4257 1024.507 17.84908 1164.576 989.5138 1059.501 ---------+-------------------------------------------------------------------combined | 5968 1292.295 28.32601 2188.264 1236.766 1347.825 ---------+-------------------------------------------------------------------diff | 934.0495 61.46487 813.5561 1054.543 -----------------------------------------------------------------------------diff = mean(urban) - mean(rural) t = 15.1965 Ho: diff = 0 degrees of freedom = 5966 Ha: diff < 0 Pr(T < t) = 1.0000 . sdtest totinc, by(urban) Variance ratio test -----------------------------------------------------------------------------Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------urban | 1711 1958.557 86.19206 3565.269 1789.504 2127.61 rural | 4257 1024.507 17.84908 1164.576 989.5138 1059.501 ---------+-------------------------------------------------------------------combined | 5968 1292.295 28.32601 2188.264 1236.766 1347.825 -----------------------------------------------------------------------------ratio = sd(urban) / sd(rural) f = 9.3724 Ho: ratio = 1 degrees of freedom = 1710, 4256 Ha: ratio < 1 Pr(F < f) = 1.0000 Ha: ratio != 1 2*Pr(F > f) = 0.0000 Ha: ratio > 1 Pr(F > f) = 0.0000 Ha: diff != 0 Pr(|T| > |t|) = 0.0000 Ha: diff > 0 Pr(T > t) = 0.0000

4.3. Graphiques Les graphiques avec le logiciel Stata peuvent se faire : (i) de faon interactive, en utilisant le menu droulant correspondant en haut de lcran ou (ii) en crivant les instructions ncessaires pour leur cration dans une ligne de commande. Cette deuxime option, une fois maitrise est plus pratique et plus rapide, car elle permet plus facilement la rplication des diffrents graphiques sur de nouvelles variables ainsi que les modifications la marge des graphiques obtenus. Toutefois, il y a une telle multitude de commandes et doptions pour prsenter de graphiques, que nous allons ici seulement les dcrire de faon trs sommaire. Tout dabord, il faut distinguer entre les reprsentations graphiques dune seule variable et pour lesquelles on utilise la commande graph, et celles mettant en relation deux (ou plus) variables dont la ligne de commande commence par le mot twoway. La syntaxe gnrale de tout graphique sera : graph type_graphe Y, options pour un graphique unidimensionnel twoway type_graphe Y1 X, options pour un graphique bi-dimensionnel Les options incluses la fin de la commande aprs la virgule ( title(), ytitle(), xtitle(), legend(), note(), xlabel(), ylabel(), ) nous permettent dorganiser et dembellir les reprsentations de base (voir help graph). 4.3.a. Graphiques unidimensionnels (graph)

17

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

Les diagrammes en secteurs ou camemberts (commande pie) : pour reprsenter des variables qualitatives nominales. Exemple :
. graph pie, over(sexhh) title(Population par sexe du chef de mnage) plabel(_all percent, size(*1.5) color(white))
Population par sexe du chef de mnage

29.12%

70.88%

male

female

Les diagrammes en tuyaux dorgues (commandes graph bar, graph hbar, histogram) : pour reprsenter des variables qualitatives ordinales. Exemple :
. graph bar (count) idh, over(eduhh) blabel(bar) title(Effectifs par niveau d'education du chef de menage)
2,000

Effectifs par niveau d'education du chef de menage


1947

count of idh 1,000

1,500

701

500

450 335 205

0 no education

primary

secondary

vocational

higher

. histogram eduhh, discrete percent fcolor(navy) gap(16) addlabel xlabel(, labels valuelabel) title(Distribution par niveau d'education du chef de menage)
Distribution par niveau d'education du chef de menage
60
53.52

Percent

40

20

19.27 12.37 9.208 5.635

0 0

no education

primary secondary vocational Education of hh head

higher

Les diagrammes btons (commandes graph bar, graph hbar, histogram) : pour reprsenter des variables quantitatives discrtes. Exemple :

18

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

. graph bar (count) idh, over(hhsizegr, gap(800)) blabel(bar) title(Effectifs par taille du menage)
2,000

Effectifs par taille du menage

1676

1,500

1401 1284

count of idh 1,000

819

561

500
227

0 1

6 ou plus

. histogram hhsizegr, discrete percent gap(90) addlabel xlabel(#6, labels title(Distribution par taille du menage)

fcolor(navy) valuelabel)

Distribution par taille du menage


30
28.08

23.48 21.51

Percent

20

13.72

10

9.4

3.804

0 0

3 hhsizegr

6 et plus

Les histogrammes (commande histogram, abrege hist) : pour reprsenter des variables quantitatives continues. Exemples :
. hist totcons, kdensity title(Distribution de la consommation du menage)
Distribution de la consommation du menage
8.0e-04 0 0 2.0e-04 Density 4.0e-04 6.0e-04

5000

10000 15000 household consumption

20000

4.3.b. Graphiques bi-dimensionnels (twoway) Les nuages de points : ce type de plot est le graphique de base pour la reprsentation de deux variables continues. La commande de base sous Stata est : twoway scatter Y X

19

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

o Y est la variable reprsenter en ordonnes et X celle reprsenter en abscisses.


. twoway (scatter totinc totcons) (lfit totinc totcons), title(Nuage de points: revenu vs consommation)
50000

Nuage de points: revenu vs consommation

-100000

-50000 0

5000

10000 15000 household consumption Fitted values

20000

household income

Des options sont disponibles si on veut reprsenter, par exemple, non plus des points mais une courbe qui relie ces points (utile lorsque seule une observation de Y est disponible pour chaque valeur de la variable X). Exemples : twoway line Y X, sort twoway connect Y X, sort Il est aussi possible de reprsenter plusieurs courbes sur un mme graphique. Par exemple, si on veut reprsenter Y1 vs X et Y2 vs le mme axe X, on crira : twoway (line Y1 X) (line(Y2 X) 4.3.c. Sauvegarde des graphiques Pour sauvegarder un graphique aprs lavoir cr on utilisera soit linterface graphique, soit les commandes : graph save Nom, replace Le graphique sera sauvegard au format Stata .gph graph export Nom.ext, replace Le graphique sera sauvegard au format indiqu par lextension .ext. Si le graphique est destin apparatre dans un document Microsoft word, il est prfrable de lenregistrer au format .wmf ou au format .pdf.

5. Economtrie
5.1. Rgression linaire On cherche estimer le vecteur de paramtres dans lquation suivante :
y = X +

20

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

o y est le vecteur des observations de la variable expliquer, X la matrice de variables explicatives (x1, x2, xp) et un vecteur dalas ou rsidus. 5.1.a. La commande regress La commande regress (abrge en reg) permet destimer un modle linaire par la mthode des moindres carrs ordinaires (MCO). La syntaxe de la commande regress est telle que la variable expliquer est donne aprs la commande et les variables explicatives sont indiques la suite. Exemple : regress totcons totinc agehh hhsize
FENETRE RESULTS: . regress totcons totinc agehh hhsize Source | SS df MS -------------+-----------------------------Model | 1.6033e+09 3 534448953 Residual | 4.6656e+09 5964 782286.961 -------------+-----------------------------Total | 6.2689e+09 5967 1050595.99 Number of obs F( 3, 5964) Prob > F R-squared Adj R-squared Root MSE = = = = = = 5968 683.19 0.0000 0.2558 0.2554 884.47

-----------------------------------------------------------------------------totcons | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------totinc | .2072075 .0052916 39.16 0.000 .196834 .217581 agehh | 38.00879 14.8112 2.57 0.010 8.973479 67.0441 hhsize | 99.2231 5.979392 16.59 0.000 87.50132 110.9449 _cons | 338.4092 53.34313 6.34 0.000 233.8373 442.981 ------------------------------------------------------------------------------

5.1.b. La cration des variables indicatrices Dans une rgression en Stata, les variables qualitatives doivent tre pralablement transformes en variables indicatrices (dummy variables en anglais). Pour effectuer cette transformation il y trois mthodes possibles sous Stata : - Avec les commandes generate et replace, la main. Exemple : gen agehh1=0 replace agehh1=1 if agehh==1 gen agehh2=0 replace agehh2=1 if agehh==2 gen agehh3=0 replace agehh3=1 if agehh==3 gen agehh4=0 replace agehh4=1 if agehh==4 - Avec la commande tabulate, suivie de loption gen. Exemple : tab region, gen(reg) - Automatiquement au moment de la rgression avec le prfix xi. Exemple : 21

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

xi: regress totcons totinc i.agehh hhsize


FENETRE RESULTS: . xi: regress totcons totinc i.agehh hhsize i.agehh _Iagehh_1-4 (naturally coded; _Iagehh_1 omitted) Source | SS df MS -------------+-----------------------------Model | 1.6276e+09 5 325529985 Residual | 4.6413e+09 5962 778473.058 -------------+-----------------------------Total | 6.2689e+09 5967 1050595.99 Number of obs F( 5, 5962) Prob > F R-squared Adj R-squared Root MSE = = = = = = 5968 418.16 0.0000 0.2596 0.2590 882.31

-----------------------------------------------------------------------------totcons | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------totinc | .206196 .0052819 39.04 0.000 .1958416 .2165503 _Iagehh_2 | 130.0495 88.24568 1.47 0.141 -42.94399 303.0429 _Iagehh_3 | 274.3446 87.96982 3.12 0.002 101.8919 446.7973 _Iagehh_4 | 161.8748 89.22405 1.81 0.070 -13.03666 336.7862 hhsize | 93.32891 6.072769 15.37 0.000 81.42408 105.2337 _cons | 278.9191 88.13267 3.16 0.002 106.1472 451.6911 ------------------------------------------------------------------------------

5.1.c. Commandes de post-estimation Il est possible de rcuprer les valeurs prdites et les rsidus dune rgression en utilisant la commande predict aprs le lancement dune rgression. Exemple : xi: regress totcons totinc i.agehh hhsize predict consohat predict consoresid, resid Il est aussi possible deffectuer des tests de coefficients aprs lestimation de la regression xi: regress totcons totinc i.agehh hhsize test totinc=0 test _Iagehh_2 = _Iagehh_3

5.2. Modlisation des variables qualitatives dichotomiques (logit et probit) Si lon dispose dune variable binaire (qui prend les valeurs 0 et 1) et que lon veut expliquer ses ralisations par une srie de variables, Stata dispose de commandes spcifiques pour lestimation par maximum de vraisemblance des modles logit et probit. Mise part des coefficients diffrents, les modles logit et probit donnent les mmes rsultats en termes de significativit des paramtres estims et en termes de prdiction. Exemples : gen wagewk=0 replace wagewk=1 if ocuhh==3 xi: logit wagewk i.urban i.eduhh i.agehh xi: probit wagewk i.urban i.eduhh i.agehh

22

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

(on utilise ici le prfix de commande xi, mais on pourrait aussi dichotomiser les variables qualitatives discrtes ou quantitatives ordinales groupes avec la commande tabulate)
FENETRE RESULTS : . xi: logit wagewk i.urban i.eduhh i.agehh i.urban _Iurban_1-2 (naturally coded; _Iurban_1 omitted) i.eduhh _Ieduhh_1-5 (naturally coded; _Ieduhh_1 omitted) i.agehh _Iagehh_1-4 (naturally coded; _Iagehh_1 omitted) Iteration Iteration Iteration Iteration 0: 1: 2: 3: log log log log likelihood likelihood likelihood likelihood = = = = -2403.5515 -2154.9408 -2152.7006 -2152.6983 Number of obs LR chi2(8) Prob > chi2 Pseudo R2 = = = = 3638 501.71 0.0000 0.1044

Logistic regression

Log likelihood = -2152.6983

-----------------------------------------------------------------------------wagewk | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------_Iurban_2 | -1.034229 .082948 -12.47 0.000 -1.196804 -.8716544 _Ieduhh_2 | -.3389062 .1029163 -3.29 0.001 -.5406185 -.1371939 _Ieduhh_3 | .3080292 .1220292 2.52 0.012 .0688564 .547202 _Ieduhh_4 | .428798 .1317354 3.25 0.001 .1706013 .6869946 _Ieduhh_5 | 1.464484 .1785387 8.20 0.000 1.114554 1.814413 _Iagehh_2 | -.478753 .3269252 -1.46 0.143 -1.119515 .1620086 _Iagehh_3 | -.4460626 .3229714 -1.38 0.167 -1.079075 .1869496 _Iagehh_4 | .6156379 .323699 1.90 0.057 -.0188003 1.250076 _cons | .1948308 .3268723 0.60 0.551 -.4458272 .8354888 ------------------------------------------------------------------------------

. xi: probit wagewk i.urban i.eduhh i.agehh i.urban _Iurban_1-2 (naturally coded; _Iurban_1 omitted) i.eduhh _Ieduhh_1-5 (naturally coded; _Ieduhh_1 omitted) i.agehh _Iagehh_1-4 (naturally coded; _Iagehh_1 omitted) Iteration Iteration Iteration Iteration 0: 1: 2: 3: log log log log likelihood likelihood likelihood likelihood = = = = -2403.5515 -2154.1152 -2152.3443 -2152.3438 Number of obs LR chi2(8) Prob > chi2 Pseudo R2 = = = = 3638 502.42 0.0000 0.1045

Probit regression

Log likelihood = -2152.3438

-----------------------------------------------------------------------------wagewk | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------_Iurban_2 | -.632264 .050468 -12.53 0.000 -.7311794 -.5333486 _Ieduhh_2 | -.1982264 .0608276 -3.26 0.001 -.3174464 -.0790065 _Ieduhh_3 | .1861652 .073739 2.52 0.012 .0416394 .330691 _Ieduhh_4 | .2601348 .0805621 3.23 0.001 .1022359 .4180336 _Ieduhh_5 | .8958218 .1063479 8.42 0.000 .6873838 1.10426 _Iagehh_2 | -.2828481 .1977141 -1.43 0.153 -.6703607 .1046644 _Iagehh_3 | -.2660231 .1954462 -1.36 0.173 -.6490907 .1170444 _Iagehh_4 | .3789974 .1962227 1.93 0.053 -.005592 .7635867 _cons | .1113511 .1980834 0.56 0.574 -.2768851 .4995873 ------------------------------------------------------------------------------

6. Bibliographie
Cahuzac E. et Bontemps C. (2008), Stata par la pratique : statistiques, graphiques et lements de programmation. College Station, TX : Stata Press.

23

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

Mitchell M.N. (2008), A Visual Guide to Stata Graphics (Second Edition). College Station, TX : Stata Press. StataCorp (2007), Getting Started with Stata for Windows. College Station, TX : Stata Press. ________ (2007), Stata Users Guide. College Station, TX : Stata Press. ________ (2007), Stata Base Reference Manual. College Station, TX : Stata Press. ________ (2007), Stata Multivariate Statistics Reference Manual. College Station, TX : Stata Press.

24

Universit Paris Dauphine - Cours M1 Initiation STATA et SAS - Sandrine Dufour-Kippelen, Marta Menndez

7. Annexe
7.1. Prsentation de la base Vietnam98.dta Donnes provenant de lEnqute de 1997-1998 sur les niveaux de vie au Vietnam (Vietnam Living Standard Survey).
Idh Wgt Hhsize Popw Urban Region Numro didentification du mnage Poids du mnage dans lchantillon Taille du mnage (rang : de 1 18) Pondration (compte tenue du poids du mnage dans lchantillon et de la taille du mnage) Code zone urbaine/rurale (1- urbaine / 2- rurale) Code rgion 1 Nord-Est (Northern Uplands) 2 Delta du fleuve Rouge (Red River Delta) 3 Centre-Nord (North Central) 4 Rgion littorale du Centre (Central Coast) 5 Hauts-plateaux du Centre (Central Highlands) 6 Rgion du Nam Bo oriental (Southeast) 7 Delta du Mkong (Mekong River Delta) Sexe du chef de famille (1-homme / 2-femme) Occupation du chef de famille 1. Travailleur indpendant agricole 2. Travailleur indpendant non agricole 3. Travailleur salari Age du chef de famille (annes) 1. Jusqu 25 2. ]25, 40] 3. ]40, 60] 4. plus de 60 Niveau dducation du chef de famille 1. Aucune (no education) 2. Primaire (primary) 3. Secondaire (secondary) 4. Secondaire technique et professionnel (vocational) 5. Universitaire (higher) Consommation total du mnage (en milliers de dongs) Revenu total du mnage (en milliers de dongs)

Rgions du Vietnam

Sexhh Ocuhh

Agehh

Eduhh

Totcons Totinc

25

Vous aimerez peut-être aussi