Académique Documents
Professionnel Documents
Culture Documents
-2-
-3-
-4-
-5-
-6-
-7-
-8-
SAS/BASE (*) AF: Desarrollo de aplicaciones ACCESS (*): Acceso datos ASSIST CONNECT: PC-Host EIS
IML: Clculo matricial QC (*): Control de calidad SHARE: Compartir libreras SAS STAT (*) intrNET: Aplicaciones WEB Enterprise Miner (*): Data Mining. Modelos Predictivos ETS (*): Series temporales Enterprise Guide FSP (**) OLAP Server (On Line Analytical Process) GIS: Sistema Inf. Geogrfica Warehouse Administrator GRAPH (*) OR: Control de proyectos, Optimizacin Modelos de Frontera (*) Mdulos que se ven en el curso (**) Se ven en la documentacin
-9-
Formacin en SAS
SAS 9: Introduccin Nuevas caractersticas Administracin del sistema SAS Gestin de datos: Introduccin Tratamiento de datos Tcnicas avanzadas de programacin Macro lenguaje SAS Macro lenguaje SAS avanzado Data-Warehouse: Utilizacin de SQL con SAS Gestin de un D-W (SAS ETL Studio) Desarrollo de aplicaciones: Desarrollo de aplicaciones (SAS/AF) Desarrollo de aplicaciones WEB (SAS/IntrNet) Data Mining: Tcnicas de D-M utilizando SAS/Enterprise Miner Modelos Predictivos Arboles de Decisin Anlisis estadstico: Estadstica con SAS (Anova, Regresin y Regresin Logstica) Estadstica con SAS Enterprise Guide (Anova, Regresin y Regresin Logstica) Modelos Predictivos utilizando Regresin Logstica Modelos Lineales Generalizados Series Temporales con SAS/ETS Mtodos de Estadstica Multivariante Tcnicas de Clustering con SAS/STAT Soluciones de Negocio SAS: Gestin Financiera, Gestin de Recursos Humanos, Diseo y Ejecucin de Campaas de Marketing, Anlisis de riesgo de crditos de mercado
- 10 -
SAS 9.1 Companion for Windows. SAS 9.1.3 Language Reference: Concepts SAS 9.1.3 Language Reference: Dictionary SAS 9.1 Macro Language Reference Base SAS 9.1.3 Procedures Guide SAS/ETS 9.1 Users Guide SAS/STAT 9.1 Users Guide
- 11 -
SAS en Internet Direcciones tiles http://www.sas.com/ http://support.sas.com/ http://support.sas.com/documentation/onlinedoc/ind ex.html http://www.sas.com/offices/europe/spain/sas/sasespan a.html http://support.sas.com/documentation/onlinedoc/sas 9doc.html http://www.lexjansen.com/sugi/ http://support.sas.com/events/sasglobalforum/previo us/online.html
- 12 -
- 13 -
- 14 -
- 15 -
Principales ventanas
- 16 -
17
SAS en castellano?
Existe muy poca documentacin en castellano (referencias en la bibliografa) En la versin 9 estn traducidas al castellano la mayor parte de las ventanas, iconos, los mensajes del LOG con las incidencias de la ejecucin de los programas etc. Tanto la sintaxis del lenguaje, que es muy rgida, como toda la documentacin necesaria est en ingls Los trabajos presentados en el SUGI y SEUGI estn en ingls Una gran cantidad de libros especficos escritos por usuarios con gran experiencia, estn en ingls Los documentos tcnicos White papers etc estn en ingls Que cada uno decida.
- 18 -
- 19 -
SASUSER: Librera permanente que define SAS por defecto al arrancar la sesin WORK : Librera temporal que define SAS por defecto al arrancar la sesin Libreras que define el usuario en cualquier momento de la sesin de trabajo. Se definen con la sentencia LIBNAME Los ficheros de datos temporales que se almacenan en la librera temporal WORK tienen un nombre sin ninguna extensin
- 20 -
IEFDSAS es una carpeta de Windows que ya existe Si no existiese, SAS escribe un mensaje en el LOG La librera DATO no existe A partir de la ejecucin de la sentencia LIBNAME queda asociada el rea de trabajo DATO de SAS con el rea de almacenamiento del PC e:\Curso-SAS-2009\IEFDSAS"
- 21 -
Un fichero de datos temporal tiene un nombre sin ninguna extensin y se almacena en la librera temporal WORK. Ejemplo IMILOG es equivalente a WORK.IMILOG Todos los ficheros almacenados en esa librera se pierden al cerrar la sesin Es muy til almacenar ficheros intermedios en el rea temporal. Lo importante es almacenar en libreras permanentes los ficheros de datos originales y los programas que los transforman
- 23 -
Los ficheros de datos SAS se crean y modifican con SAS. Son ficheros especficos de SAS. Tanto los temporales como los permanentes. Para Windows tienen extensin sas7bdat. Los ficheros de programa no son ficheros SAS, pueden escribirse con cualquier editor o procesador de texto e incluirlos en el editor del DMS de SAS. Para Windows tienen extensin sas.
- 24 -
- 25 -
- 26 -
- 27 -
- 28 -
- 29 -
Ejercicios apartado I
Comprobar el contenido de la librera SASUSER Crear una carpeta para los ficheros de datos SAS que se creen durante el curso y definirla como librera permanente SAS con la sentencia LIBNAME Incluir el programa de la librera de ejemplos de SAS BIORYHTM en la ventana PGM, ejecutarlo y ver los resultados en la ventana OUTPUT y las incidencias de la ejecucin en la ventana LOG Ejecutar todos los programas de ejemplo de las transparencias anteriores que crean ficheros de datos temporales Comprobar que se han creado correctamente los ficheros de datos anteriores y almacenarlos de forma permanente en la librera definida en el apartado 2 Importar ficheros externos a travs del men y almacenarlos de forma permanente en la librera definida por cada usuario con la sentencia LIBNAME
- 30 -
- 31 -
- 33 -
- 34 -
title1 'Compara la tension sistolica antes y despues de un estimulo'; title2 'Muestras emparejadas de tamao 12. Se asume distribucin normal'; data tension; input Tantes Tdespues @@; datalines; 120 128 124 131 130 131 118 127 140 132 128 125 140 141 135 137 126 118 130 132 126 129 127 135 ; run; proc ttest; /* Test el cambio medio en la tension es significativamente distinto de cero */ paired Tantes*Tdespues; /* Se rechaza la hiptesis nula */ run;
- 35 -
/* Ejemplo 11 */ PROC TABULATE DATA=SASUSER.CARS; var nkids; class origin; table origin, nkids*(max='Maximo' min='Minimo' mean std)/ box="Numero de hijos"; label origin="Lugar de origen"; /* Etiqueta */ /* Etiqueta para palablas clave */ keylabel mean="Media aritmtica" std="Desviacin tipica"; RUN;
- 36 -
Aplicacin cliente de Microsoft Windows Proporciona un sistema guiado para explotar el poder analtico de SAS Es un interface de SAS para analistas , estadsticos y programadores Puede ser una ayuda para comenzar a programar en SAS Grande posibilidades para realizar grficos y tareas analticas complejas Acceso visual a todo tipo de datos soportados por SAS via ODBC , OLE DB para OLAP, y de servidores MS Exchange
37
- 38 -
- 39 -
- 40 -
- 41 -
- 42 -
- 43 -
- 44 -
Ejercicios apartado II
Utilizando los ficheros de datos creados y definidos en el apartado I, en particular ARTRITIS y BEVERAGE : - Estudiar el contenido, tipos de variables cualitativas, cuantitativas, categricas, dummies - Utilizar alguno de los procedimientos citados para estudiar la distribucin de frecuencias, ver los valores extremos, calcular las medidas de posicin y dispersin. Hacer un grfico descriptivo - Utilizar PROC TABULATE para disear tablas de resultados relevantes para describir los datos - Utilizar Graph-N-Go para hacer algn grfico. Ver el cdigo SAS generado
- 45 -
BIBLIOGRAFA
Schlotzhauer, Sandra D. and Littell, Ramon C. (1991), SAS System for Elementary Statistical Analysis, Second Edition, Cary, NC:SAS Institute Inc. Stokes, Maura E., Davis, Charles S., and Koch, Gary G. (1995), Categorical Data Analysis Using the SAS System, Cary, NC: SAS Institute Inc. SAS Institute Inc. (2004), SAS Procedures Guide, Version 9-1-3, Cary, NC: SAS Institute Inc. SAS Institute Inc. (2004), SAS/STAT Users Guide, Version 9-1-3, Cary, NC: SAS Institute Inc. U.S. Bureau of the Census (1995), Statistical Abstract of the United States, Washington SAS Institute Inc. (1990), SAS Programming Tips: A Guide to Efficient SAS Processing, Cary, NC: SAS Institute Inc. Ayala Can, L., Rodrguez Coma, M. "La utilizacin de registros administrativos como base para la investigacin de polticas sociales. Seminario Internacional de Estadstica: "El papel de los registros administrativos en relacin con el anlisis econmico y el desarrollo del Sistema Estadstico Nacional. Madrid 30 y 31 de enero de 2006. Instituto de Estudios Fiscales
- 46 -
- 47 -
Cuando se especifica el modelo, a continuacin de la sentencia MODEL se coloca la variable dependiente seguida por un signo = y a continuacin todas las variables que se incluyen como regresores. Las variables incluidas deben ser numricas. Si se quiere especificar un trmino cuadrtico para la variable p en el modelo se debe definir previamente en un PASO DATA en lugar de incluir en la sentencia MODEL p*p El nivel de significacin para la estimacin de los parmetros por defecto es del 95%. Puede modificarse mediante opciones de la sentencia PROC REG
- 48 -
- 49 -
Se pueden dibujar los residuos frente a una variable en particular o frente a los valores que predice el modelo
PLOT residual.*Q; PLOT predicted.*residual.; residual es una palabra clave de SAS debe ir seguida de punto (.) predicted es una palabra clave de SAS debe ir seguida de punto (.)
- 50 -
- 51 -
Para contrastar la hiptesis nula conjunta de que el coeficiente de la variable p es 1.5 (p=1.5) y la de la variable t es 0.8 (t=1.5) se escribe el cdigo
proc reg data=test; model q=p t; test p=1.5, t=0.8;; run;
- 52 -
proc glm; /* Estimar un modelo cuadrtico */ model mpg=mph mph*mph / p clm; /* Por el mtodo de MCO */ output out=pp p=mpgpred r=resid; /* OPCIONES GRFICAS */ axis1 minor=none major=(number=5); axis2 minor=none major=(number=8); symbol1 c=black i=none v=plus; symbol2 c=black i=spline v=none; proc gplot data=pp; /* Dibujar el modelo estimado y los datos originales */ plot mpg*mph=1 mpgpred*mph=2 / overlay haxis=axis1 vaxis=axis2; /* EL GRAFICO MUESTRA LA EVIDENTE RELACIN CUADRTICA */ run; - 53 -
- 54 -
Ejercicios apartado III Utilizando el sistema de ayuda on line de SAS, buscar el procedimiento GLM (mtodo MCO) Ver que tipos de anlisis pueden realizarse con PROC GLM Ver otros procedimientos de SAS que permiten lograr los mismos o parecidos objetivos y cuales son mas eficientes para cada tema Elegir el ejemplo 32.2 y estudiar los resultados Repetir los mismos pasos para el procedimiento PROBIT (mtodo de mxima verosimilitud)
- 55 -
Regresin. Bibliografa
Freund, Rudolf J. and Littell, Ramon C. (1991), SAS System for Regression, Second Edition, Cary, NC: SAS Institute Inc. Stokes, Maura E., Davis, Charles S., and Koch, Gary G. (1995), Categorical Data Analysis Using the SAS System, Cary, NC: SAS
Allison, Paul D.(1999) Logistic Regression Using the SAS System: Theory and Application Cary, NC:SAS Institute Inc.
Littell, Ramon C. and Freund, Rudolf J. and Spector, Philip C.(1993), SAS System for Lineal models, Second Edition, Cary, NC: SAS Institute Inc. Allison, Paul D. (2005), Fixed Effects Regression Methods for Longitudinal Data Using SAS,Cary, NC: SAS Institute Inc. Allison, Paul D. (2006), Fixed Effects Regression Methods In SAS. SUGI 31. S. Francisco.California
- 56 -
- 57 -
Modelos de duracin
Junto a los modelos de datos de panel es una de las reas de ms amplio desarrollo en microeconometra en los ltimos tiempos. La metodologa y terminologa se han importado de otras disciplinas cientficas (ciencias biomdicas, epidemiologa, control de calidad, ingeniera) que llevaban mucho tiempo utilizndolos. Las tablas de vida han sido utilizadas habitualmente por los demgrafos y los actuarios de seguros A partir de finales de los setenta es cuando se incorporan a las ciencias econmicas y sociales fundamentalmente en estudios de mercado de trabajo, evaluacin de tratamientos y polticas. La literatura economtrica sobre datos de duracin es reciente. Entre las referencias de mayor utilidad se encuentran Kalbfleisch y Prentice (1980), Heckman y Singer (1984a), Kiefer (1988) y Lancaster (1991).
- 58 -
Conceptos fundamentales
Variable a explicar en el modelo: Tiempo transcurrido hasta que ocurre un evento Evento: resultado de cualquier acontecimiento que ocurre en la biografa de un individuo, empresa. Sinnimos: suceso, acontecimiento. Duracin de un suceso: duracin del intervalo temporal entre los instantes en que empieza la observacin y ocurre el evento Datos de duracin: aquellos que suministran informacin sobre la duracin de un suceso. Los datos de duracin se obtienen de un seguimiento longitudinal de los individuos o colectivos y se extraen, generalmente, bien de encuestas de panel, bien de registros administrativos (caso del IMI, seguro de desempleo)
- 59 -
Conceptos fundamentales
Datos de supervivencia: miden el tiempo que transcurre hasta que se produce un determinado evento (datos de duracin, tiempo de vida) Fenmenos en los que el tiempo no es slo su rasgo distintivo sino el que suscita el inters de los investigadores. Ej. tiempo transcurrido en desempleo, en bsqueda de un primer empleo, en un programa de asistencia social (IMI), mientras se percibe el seguro de desempleo La variable tiempo no suele tener una distribucin normal, tiene una distribucin asimtrica (ver distribuciones empricas de la siguiente transparencia) Estudio de los fenmenos de dependencia de los programas asistenciales
- 60 -
- 61 -
- 62 -
- 63 -
- 64 -
2.
- 65 -
- 66 -
- 67 -
TEST ED EMPLEA PROBLEMAS ESTUDIOS /* CONTINUAS */ SEXO MONOPA PESOLA MINOET PROBLEM2 PROBLEM3 PROBLEM6 PROBLEM9 PROBLEM12 TOTAL; /* Utilizacin de la sentencia TEST */ /* Exploracion de los posibles regresores para modelos paramtricos */ TITLE1 "COVARIANZAS CON EL TIEMPO DE SUPERVIVENCIA DE DISTINTAS VARIABLES"; title2 "ESTIMACIONES NO PARAMTRICAS MTODO DE KAPLAN-MEIER"; RUN;
- 68 -
- 69 -
- 70 -
- 71 -
- 72 -
- 73 -
- 74 -
- 75 -
- 76 -
- 77 -
- 78 -
- 79 -
- 80 -
- 81 -
- 82 -
- 83 -
Exigen un cambio en la estructura del fichero de datos Identificacin del hogar (variable EXPE en el ejemplo ) Cada hogar tendr tantos registros como semestres est en el estudio (en el caso de controles semestrales) Debe identificarse la secuencia de semestre en el estudio (variable PERIODO en el ejemplo) Debe identificarse la continuidad o censura semestral (Variable QUIT en el ejemplo) En el caso de las variables dinmicas, en el ejemplo la tasa de paro, identificar el valor que toma cada semestre (variable FECHAT para hacer el MERGE con el fichero de paro trimestral)
- 84 -
fechat=compress(aent)||compress(trim); if tparo=. then tparo=11.94; /* Tasa de paro el 4 trim. de 1990 */ sem=sum(of s1-s23); /* nmero de semestres en el programa */ do periodo=1 to sem; if periodo=sem and censura=0 then quit=1; /* Sale */ else quit=2; /* No sale */ output; end; run; proc sort data=discre; by fechat; run;
- 85 -
- 87 -
- 88 -
- 89 -
- 90 -
Ejercicios apartado IV
Utilizando el sistema de ayuda on line de SAS, buscar el procedimiento PHREG Elegir el ejemplo 54.1, para estimar un modelo semiparamtrico de COX por el mtodo de verosimilitud parcial, realizando una regresin paso a paso (STEPWISE) Ejecutarlo y estudiar los resultados Ver la interpretacin en el propio sistema de ayuda de SAS
- 91 -
- 92 -
- 93 -
- 94 -
- 95 -
- 96 -
NOTAS
- 97 -