Académique Documents
Professionnel Documents
Culture Documents
DISEOS MUESTRALES
ALFREDO ALIAGA
CEPAL
476
Diseos muestrales
NDICE
Pgina
1.
Diseo de la Muestra...........................................................................................................477
1.1
Marco de la encuesta..................................................................................................477
1.2
1.3
Estratificacin............................................................................................................ 478
2.
3.
4.
5.
5.2
5.3
Rural.......................................................................................................................... 482
6.
Estimadores......................................................................................................................... 483
7.
Diseos muestrales
477
1. Diseo de la Muestra
El Diseo Muestral se caracteriza por ser probabilstico, por lo cual los resultados obtenidos de la encuesta se
generalizan a toda la poblacin. A su vez es polietpico, estratificado y por conglomerados, donde la unidad ltima
de seleccin es la vivienda y la unidad de observacin es la persona.
1.1 Marco de la encuesta.
El Marco de muestreo de la ENE-2001 es el marco muestral de propsitos mltiples del INEGI, constituido a partir
de la informacin demogrfica y cartogrfica obtenida durante el Conteo de Poblacin y Vivienda de 1995.
Al interior de cada entidad federativa se tiene una primera estratificacin, conformando zonas que agrupan a las
localidades de la siguiente forma:
Zona
Urbano Alto
Descripcin
Complemento
Urbano de alta
densidad
478
Diseos muestrales
Puede formarse con una manzana que tenga un mnimo de 40 viviendas habitadas.
Puede estar formada por dos o ms manzanas contiguas con al menos 40 viviendas habitadas.
USM en el resto de las zonas.
La Unidad Secundaria de Muestreo (USM) est constituida por las viviendas particulares, habitadas
permanentemente o aptas para habitarse.
Unidades Terciarias de Muestreo (UTM):
Las Unidades Terciarias de Muestreo (UTM) se tienen solamente en la zona urbano alto ENEU y estn
constituidas por las viviendas particulares, habitadas permanentemente o aptas para habitarse en el
momento de la elaboracin de los listados.
1.3Estratificacin.
Al interior de cada entidad y zona las UPM se sometieron a una estratificacin socioeconmica utilizando
las siguientes variables:
Porcentaje de poblacin de 6 a 14 aosquesabeleeryescribir.
Porcentaje de poblacin de 15 aos ymsalfabeta.
Porcentaje deviviendas con drenaje conectado a la red pblica.
Porcentaje deviviendas con agua entubada dentro de la vivienda.
2. Esquema de Muestreo.
La ENE-2001 fue diseada bajo un esquema de muestreo probabilstico, polietpico, estratificado y por
conglomerados:
a) Probabilstico.
Esto significa que las unidades de seleccin tienen una probabilidad conocida y distinta de cero de
entrar en la muestra para cada miembro de la poblacin, lo cual, permite conocer la precisin de los
resultados muestrales.
b) Estratificado.
Porque las unidades de seleccin son agrupadas por caractersticas similares de tipo geogrficas y
socioeconmicas.
c) Polietpico.
Porque la unidad ltima de seleccin (vivienda) es seleccionada despus de varias etapas.
d) Por conglomerados.
Porque previamente se conforman conjuntos de unidades muestrales de los cuales se obtiene la
muestra.
Diseos muestrales
479
3. Tamao de la Muestra.
El tamao de muestra est calculado para dar estimaciones a los siguientes niveles de desagregacin:
Nacional.
Entidad federativa.
El tamao de muestra para estos dominios se calcula para la tasa de desempleo abierta, considerada la
variable principal de la encuesta, y la que requiere los tamaos de muestra mayores. Esto garantiza que
las estimaciones del resto de las variables de inters queden cubiertas con ese tamao.
La expresin empleada para el clculo es la siguiente:
2
z q DEFF
n 2
PHV
r p 1 - TNR
TNP
Donde:
n
Tamao de la muestra.
Estimacin de la proporcin.
(1-p).
DEFF
TNR
TNP
PHV
=
=
Tomando como base un nivel de confianza de 90% y un efecto de diseo de 4.756 observado en las
experiencias anteriores, as como una tasa neta de participacin de 57%, un promedio de 3.59 habitantes
por vivienda y un error relativo mximo esperado de 4.49% para una TDA de 2.2%, y la tasa de no
respuesta es de 15%, se determin una muestra a nivel nacional de 163,160 viviendas.
480
Diseos muestrales
129,460
6,750
9,100
Rural
17,850
Total
163,160
4. Afijacin de la Muestra.
La afijacin de la muestra se realiza dentro de cada entidad entre los diferentes estratos de manera
proporcional a su tamao, para lo cual se emplea la siguiente expresin:
'
gh
N'gh
N
'
n'
gg
Donde:
'
n gh
n
'
g
entidad.
'
N gh
'
g
5. Seleccin de la Muestra.
La seleccin de la muestra de la ENE-2001, se realiz de manera independiente en cada entidad-estrato, el
procedimiento de seleccin vara dependiendo de la zona.
5.1
Diseos muestrales
481
ngh mghi
P Vghijk
mgh
6
mghij
mghi
6k ngh mghij
6 mghij
mgh mghij
Donde:
gh
mghi
mgh
=
m ghij
=
Nmero total de viviendas en la j-sima USM de la i-sima UPM en el h-simo
estrato de la g-sima entidad.
Nmero total de USM seleccionadas para la ENE-2001.
=
Nmero total de viviendas en la j-sima USM de la i-sima UPM en el h-simo
estrato para la g-sima entidad al momento del levantamiento ENE-2001.
m ghij
Fghi
5.2.
mgh mghij
ngh mghij k6
1. Entre las ngh UPM que se seleccionaron en el marco con probabilidad proporcional a su tamao,
se
seleccionaron
gh
482
Diseos muestrales
PV
ghij
mghi
Donde:
n gh
n*gh 50
ngh m*
ghi
ngh
mgh
mghi
mgh
m*
ghi
n *gh
=
=
mgh
Fghi
5.3.
1.
m*ghi
mghi n*gi 50
Rural.
Entre las ngh UPM que se seleccionaron en el marco con probabilidad proporcional a su tamao, se
*
seleccionaron
V
Donde:
n gh
mghi
mgh
ghij
ghi
n gh m
m gh
n*gh 50
n gh m*
ghi
=
N
me
ro
de
UP
M
sel
ecc
ion
ada
s
en
el
hsi
mo
estr
ato
en
la
gsi
ma
enti
dad
.
Diseos muestrales
*
ghi
n *gh
483
Nmero total de viviendas en la i-sima UPM en el h-simo estrato para la gsima entidad al momento del levantamiento ENE-2001.
Nmero de UPM seleccionadas para la ENE-2001 en el h-simo estrato para la
g-sima entidad.
mgh m *ghi
Fghi
u
Fghijk
X
l
u
ghijkl
F
i
R
ghik
X ghikl
R
Donde:
Fghij
u
Xu
ghijkl
Fghi
R
k
XR
ghijkl
A nivel nacional:
V NAL
32
X
g 1
484
Diseos muestrales
R NAL
NAL
NAL
g 1
32
g 1
Donde, la variable
Y
NAL
NAL
V R
NAL
32
Lg
2
NAL
gh
gh
gh
n i
RNAL
X ghi
-
1
X
n gh
es la siguiente:
R
-
gh
NAL
ghi
1
Y
n
gh
gh
Donde:
X ghi
Total ponderado de la variable de estudio X para la i-sima UPM en el h-simo
= estrato de la g-sima entidad.
Y gh
Total ponderado de la variable de estudio X para el h-simo estrato en la g-sima
= entidad.
ngh
= Nmero de UPM en el h-simo estrato para la g-sima entidad.
Estas definiciones son anlogas para la variable de estudio
Y.
La estimacin de la precisin del estimador del total, se calcula con la frmula siguiente:
V X
32
Lg
gh
NAL
g1 h1
1
2
ngh
X
X
ghi
gh
n gh -1
n
gh
i1
Diseos muestrales
485
DEFF
V
V
mas
Donde:
mas
I1-
V ,
1.645
1.645
= 0.10.