Académique Documents
Professionnel Documents
Culture Documents
GUATEMALA
124 Metodologa para la integracin de bases...
NDICE
Pgina
Presentacin.................................................................................................................................... 125
Esquema General de Procesamiento de Datos - ENEI ................................................................... 125
Cpitulo I ........................................................................................................................................ 126
1. Aspectos Metodolgicos Aplicados en la Captura de la Informacin en Campo ......... 126
1.1 Etapas de captura en campo .................................................................................. 126
Captulo II....................................................................................................................................... 129
2. Etapas de Trabajo en Oficina ........................................................................................ 129
Captulo III...................................................................................................................................... 131
3. Aspectos Relacionados con la Integracin de la Base de Datos
para la Generacin de resultados................................................................................... 131
3.1 Etapa s de generacin de indicadores.................................................................... 131
Metodologa para la integracin de bases... 125
Presentacin
El Instituto Nacional de Estadstica -INE- de Guatemala, es una institucin descentralizada, y
semiautnoma que tiene por objeto formular y realizar la poltica estadstica nacional as como planificar,
dirigir, coordinar y supervisar las actividades del Sistema Estadstico Nacional SEN; entre sus
principales atribuciones, se encuentra la de ejecutar los Censos y Encuestas Nacionales (Ley Orgnica,
Decreto Ley 3-85, articulo 28),.
El INE presenta este documento como un aporte a la discusin de la temtica programada en el marco del
Undcimo Taller Regional de MECOVI.
Cabe mencionar que en el contexto del MECOVI, el Gobierno de Guatemala y el INE, realizaron en el
ao 2000 la primera encuesta sobre Condiciones de Vida ENCOVI; y en el 2002 y 2003, la primera ronda
de cuatro encuestas trimestrales sobre empleo e Ingreso ENEI-, encuestas que han permitido generar
informacin socioeconmica integral y detallada sobre los niveles de empleo, subempleo, desempleo e
ingresos de los hogares y personas, segn reas y etnias del pas.
El esfuerzo de realizar ENCOVI y ENEI, (como parte principal del Sistema Nacional Integrado de
Encuestas de Hogares), vino a llenar un vaco manifiesto en la produccin de informacin sobre el tema
del mercado laboral en Guatemala, al mismo tiempo de posibilitar el estudio de las tendencias,
mecanismos y dinmicas relacionadas con los procesos de produccin y empleo, analizar las causas y
factores que determinan el desempleo y subempleo y establecer los alcances e impactos de los
programas de generacin de puestos de trabajo y monitorear los avances y logros de las acciones sociales
del estado en el campo de la poltica laboral.
La ENEI est diseada como respuesta a la necesidad de garantizar la caracterizacin y anlisis integral
de las variables relacionadas con los temas de actividad econmica e ingresos de la poblacin de
Guatemala.
Para su mejor comprensin, este documento esta dividido en tres captulos: el primer captulo se
presenta el esquema relacionado con la captura de informacin en campo; el segundo captulo contiene
las especificaciones del trabajo de oficina y el ltimo captulo el proceso de la generacin de resultados.
Se espera que este documento sirva de insumo y como medio de compartir la informacin de Guatemala
con los colegas reunidos en el Undcimo Taller sobre Metodologas para la Integracin de las Bases de
Datos a realizarse en la histrica y bella ciudad de Lima, Per del 16 al 18 de julio del 2003.
La segunda fase, da inicio al momento de contar con el formulario definitivo, a partir del cual se
desarrollan los programas respectivos y otros proceso que se describen a continuacin:
El proceso del levantamiento de la encuestas se inicia con la recoleccin de los datos por parte del
encuestador. La aplicacin de la metodologa aplicada en MECOVI, implica la conformacin de equipos
de campo, constituidos por tres encuestadores, un supervisor, un digitador y el piloto. El supervisor de
grupo tiene como tarea central el control de cobertura, calidad, oportunidad, digitacin, consistenciacin
y comportamiento de los encuestadores a su cargo. A este equipo se une una figura que se le denomina
como Monitor.
Los monitores son los representantes de la Direccin Tcnica quienes tendrn a su cargo la supervisin y
el monitoreo permanente de los trabajos de la ENEI en el campo. Tienen como funcin principal
ASEGURAR la correcta aplicacin de la metodologa ENEI; ASEGURAR que las metas semanales de
cobertura se cumplan; APOYAR el trabajo tcnico de supervisores, encuestadores y digitadores;
UNIFICAR la recoleccin a nivel nacional en trminos de procedimientos, tcnicas y normas acordadas.
La etapa de ingreso de datos al computador y su posterior verificacin se realiza en el campo, y est a
cargo de los Digitadores. Estas personas, al igual que los encuestadores y supervisores, son
cuidadosamente seleccionados y capacitados, terica y prcticamente, para el correcto desempeo de sus
labores. En adicin los digitadores son los responsables de la administracin y cuidado del equipo de
procesamiento.
Captulo I
1. Aspectos Metodolgicos Aplicados en la Captura de la Informacin en Campo
1.1 Etapas de captura en campo
a) Codificacin
Con el propsito de facilitar el procesamiento de los datos en la boleta han sido codificada la mayora
de variables investigadas; para algunas que incluyen la categora otros necesariamente se debe
realizar un proceso de codificacin igual situacin se presenta para otras preguntas abiertas de los
formularios, para las que debe determinar la clase a la que pertenecen y asignar el cdigo que las
identifica.
Este proceso se realiza en la mayora de los casos por el supervisor durante la revisin de los
formularios, antes de su entrega al digitador para su procesamiento. El supervisor es el responsable
de la codificacin de los temas: Departamento y municipio, Rama de Actividad Econmica y
Ocupacin y otros que se consideren pertinentes. Se ha implementado en el sistema la captura de las
descripciones texto de las preguntas abiertas para luego hacer una recodificacin semi-automtica.
b) Captura de datos
La captura de los datos de la encuesta se hace utilizando el paquete Centry de IMPS, que permite
capturar la informacin correspondiente a cada uno de los hogares del sector, y al interior de cada
hogar la informacin especifica de cada persona. Para ello al momento de la captura se distribuye la
informacin de un hogar en varios archivos independientes, cada uno de ellos constituir un Batch y
en general cada parte de la informacin del hogar se constituye en un Formulario.
El programa de captura realiza, en una secuencia de pantallas, un barrido de todos los tems
investigados, en el orden en que aparecen en el formulario de hogares ENEI, respetando los flujos
establecidos.
Durante el proceso de captura se realiza una verificacin de rangos de todas las preguntas del
formulario para establecer que se encuentren dentro de los lmites establecidos. Dada la
Metodologa para la integracin de bases... 127
Captulo II
2. Etapas de Trabajo en Oficina
a) Integracin de archivos
La integracin de la captura y consistencia bsica de los datos al proceso de campo, implica una
captura descentralizada de los datos, lo que hace necesario un proceso de integracin de archivos en
dos etapas, la primera al interior de cada sector, que integra los datos de los hogares (desagregados
para la captura), en un nico archivo del sector y la segunda que integra todos los sectores trabajados
durante la comisin en un nico archivo del proyecto. Para ello se ejecuta en la primera etapa, un
proceso que concatena y reordena los datos al interior del sector y dentro de estos al interior del
130 Metodologa para la integracin de bases...
hogar y en la segunda etapa un proceso que une y reordena los datos al interior del pas y dentro de
este al interior de cada dominio de estudio.
b) Reestructuracin de los datos
Los datos se capturan respetando el orden en que aparecen en el formulario y la secuencia de
recoleccin y con el propsito de facilitar su captura, cada formulario se desagrega en distintos
archivos; para ejecutar con los datos los procesos de consistencia y actualizacin; se realiza una
primera reestructuracin de los datos, que convierte los archivos planos en bases de datos, y los
organiza para facilitar su almacenamiento, recuperacin y proceso.
c) Generacin de cifras de control
Durante el procesamiento se produce un conjunto de resultados parciales que permite realizar el
seguimiento de los procesos de integracin y reestructuracin de archivos, de manera que se puede
garantizar la no ocurrencia de omisiones y/o duplicaciones derivadas de procesos mal aplicados. Para
ello se producen listados de distribucin de frecuencias simples, antes y despus de los procesos
sealados, para las variables que se definen como bsicas para el seguimiento de los procesos.
d) Relaciones entre variables
La validacin de la coherencia de una respuesta, valida individualmente, con otra tambin
igualmente vlida de manera individual, es sin duda la tarea ms compleja y delicada del proceso
de consistencia de los datos de ENEI; para efectos de facilitar la comprensin de esta fase de la
consistencia que se da entre las variables, se agrupan de la siguiente manera:
! Control de flujos
La revisin de flujos establece la integridad temtica al interior de cada hogar, persona, revisa que se
cumplan los universos (sexo y edad) y pases (condicionales e incondicionales) que se especifican en
el formulario de hogares. Para ello se verifica que no exista informacin en las preguntas que no son
aplicables en funcin del universo.
! Cuadre de totales
Una revisin importante es la que se refiere a la consistencia de los totales de los distintos tem de
valores del formulario; se verifica en algunos casos que los valores parciales estn comprendidos en
el total y en otros que la suma de los parciales cuadre con el total.
! Relacin lineal
La revisin lineal establece la coherencia bsica de las respuestas individuales, dentro de un hogar,
persona. Para ello se verifica el cumplimiento de las pautas de relacin lineal (simple) de una
respuesta con otra u otras respuestas, normalmente de una misma rea temtica.
! Relacin estructural
La revisin de estructural establece la coherencia global de las respuestas individuales al interior del
hogar en su conjunto. Relacionando las respuestas de un rea temtica con los de otra u otras reas
temticas. Para ello se verifica el cumplimiento de las pautas de relacin estructural (compleja) de
una respuesta con otra u otras respuestas, normalmente de distintas reas temticas.
Posteriormente y en la medida en que se completa el proceso de integracin, los datos son objeto de
otro proceso de reestructuracin, que comprende entre otras cosas, la construccin de variables
derivadas, la incorporacin del factor de expansin y la preparacin de las bases de datos para
anlisis de resultados, por parte de los especialistas sustantivos, en ambiente SPSS.
Metodologa para la integracin de bases... 131
Captulo III
3. Aspectos Relacionados con la Integracin de la Base de Datos para la Generacin de Resultados
3.1 Etapa de generacin de indicadores
La ENEI desarrolla un amplio conjunto de indicadores del mercado laboral a partir de la base de datos de
cada encuesta como principal fuente de informacin estadstica del pas, elaborados mediante mtodos
comparables internacionalmente y sujetos a un cuidadoso control de calidad.
El proceso de clculo es sistemtico: empieza con la utilizacin de las definiciones y conceptos de la
Organizacin Internacional del Trabajo -OIT- y concluye con la presentacin de los indicadores del
mercado laboral en un formato de fcil interpretacin para los usuarios en general.
Para elaborar los indicadores del mercado laboral se siguen los siguientes pasos:
a) Definicin.
El primer paso en la elaboracin de un indicador del mercado laboral es la consideracin de su
definicin conceptual (OIT) como una aproximacin o una medida de un fenmeno o variable, as
como la aplicacin de criterios nacionales. Para obtener una medida correcta se delimita de manera
precisa el fenmeno que interesa estimar.
b) Fuentes de informacin
La fuente primaria de investigacin la constituye la ENEI misma y como fuente secundaria de
comparacin las ENEI anteriores u otra encuesta anterior, as como los censos de poblacin y
registros administrativos que contienen informacin relacionada con esta materia. En ocasiones se
utilizan tambin fuentes provenientes del Acuerdos Ministeriales y de otras instituciones del sector
pblico y privado.
c) Poblacin de referencia.
Es importante indicar que todo indicador debe referirse a una determinada poblacin que se define
segn su propsito de medicin; para la ENEI, se obtiene informacin de personas de 7 aos y ms
de edad.
La mayora de los indicadores del mercado laboral tienen como base a la poblacin en edad de
trabajar (PET) del pas; otros indicadores como los de educacin y empleo, consideran a grupos
especficos (por ejemplo, grupos de edad u ocupacin, rama de actividad, categora ocupacional,
etc.).
d) Tabulacin bsica
An cuando la naturaleza del procesamiento no se enfoca a la obtencin tradicional de plan de
tabulaciones, se realiza un proceso de tabulacin para un conjunto de cruces considerados bsicos
para la evaluacin y difusin de resultados. Este proceso se efecta con valores muestrales y
expandidos.
e) Limpieza de la base de datos primaria
Se denomina bases de datos primarias al conjunto de datos contenidos en un formato generado
posteriormente al proceso de digitacin de los datos en el campo y su respectiva consistencia.
Esta base de datos preliminar por ser generada inicialmente con propsitos de utilizarla como insumo
bsico para el clculo de los resultados finales de la ENEI es objeto de un tratamiento especial y de
riguroso cuidado que se inicia por verificar y cuadrar universos de variables por captulos, as como
estructuralmente la completitud de la base de datos.
132 Metodologa para la integracin de bases...
Se presume que la base de datos preliminar puede contener errores de digitacin y de codificacin as
como inconsistencias, por lo que se efectan procesos de verificacin y limpieza exhaustiva de las
variables utilizadas, aspecto que incluye: el examen de la distribucin de cada variable, la generacin
de listados y su verificacin en boleta as como la correccin de la misma; tambin se observan los
errores de digitacin y el tratamiento de casos atpicos denominados (outliers) y de valores
faltantes (falta de respuesta ) o informacin no aplicable y casos agrupados en clasificaciones como
otro cual?, etc, para la obtencin de la limpieza de la base de datos final.
f) Generacin de los expansores para la base de datos final
Para el clculo de los factores de expansin se aplican los recprocos de las probabilidades de
seleccin en la muestra ( fracciones de muestreo). Este proceso se vincula con la base de datos final a
la cual se incorporan los expansores respectivos.
g) Ingreso a la base de datos final
El indicador resultante y los expansores correspondientes se ingresan en una base de datos terminal
en su mximo nivel de desagregacin. Esta base de datos es a su vez, manejada por el paquete
informtico Statistical Package for the Social Sciences (SPSS).
h) Generacin de indicadores
Con la base de datos final se procede a programar las frmulas de clculo de los indicadores del
mercado laboral y agregados de ingreso o consumo segn se requiera. Para estos procesos se utiliza
el paquete SPSS.
i) Control de calidad de los indicadores
Consiste en la revisin cuidadosa del programa de clculo y los resultados. En esta etapa se
verifican:: a) la creacin de tablas y cruces especficos de variables por ocupacin, rama de
actividad, categora ocupacional, grupos de ocupacin, educacin, etc.) b) los resultados del clculo
de los indicadores segn las distintas fuentes existentes y con resultados publicados c) el indicador
para distintos grupos de poblacin con diferentes desagregaciones.
j) Control de calidad final de la base de datos
El INE valida los indicadores provenientes de informacin de sus bases de datos. Este proceso
termina con la revisin de la fidelidad de la base de datos, corroborando en pantalla de salida los
indicadores del mercado laboral utilizando SPSS.
k) Control de calidad final de la presentacin de los resultados
Esta fase considerada como la culminacin del dato que se presentar a los usuarios y por
representar la imagen del proyecto, requiere de una revisin cuidadosa previa a emitirse el visto
bueno para la generacin de la base y la publicacin respectiva.
l) Presentacin y difusin de resultados
Con el propsito de que los resultados de la encuesta puedan ser de fcil difusin, recuperacin y
consulta, se realiza un proceso de preparacin de bases de datos que permitan y viabilicen la
recuperacin y consulta de los resultados de la encuesta en sus diferentes reas temticas.
De igual forma se prepararan los productos que se definan como objeto de difusin, utilizando las
vas de internet: www.ine.gob.gt, as como Intranet y la disponibilidad de bases y resultados para los
diferentes usuarios.