Vous êtes sur la page 1sur 8

Departamento Administrativo

Nacional de Estadstica

Direccin de Regulacin, Planeacin,


Estandarizacin y Normalizacin
-DIRPEN-

Especificaciones de Coeficiente y Varianza


Encuesta de Consumo Cultural
-ECC-

Julio 2008
ESPECIFICACIONES DE COEFICIENTE Y VARIANZA CDIGO: ME-ECC-ECV-01
VERSIN: 02
ENCUESTA DE CONSUMO CULTURAL PGINA: 1
-ECC- FECHA: 08-07-08
ELABOR: METODOLOGA REVIS: COORDINADOR DE ESTUDIOS
APROB: DIRECTOR DIRPEN
ESTADSTICA ESTADSTICOS

TABLA DE CONTENIDO

1. ESPECIFICACIONES DE COEFICIENTE Y VARIANZA .................................................. 2


1.1 Factores de expansin ..................................................................................................... 2
1.2 Factor de expansin final ................................................................................................. 3
1.3 Estimadores de Totales y Razones ................................................................................. 4
1.4 Programa de Estimacin .................................................................................................. 7

RUTA DE ARCHIVO: DIRPEN\ECC\DOCUMENTACIN BSICA\METODOLOGAS\DISEO MUESTRAL\ME-ECC-ECV-01.doc


ESPECIFICACIONES DE COEFICIENTE Y VARIANZA CDIGO: ME-ECC-ECV-01
VERSIN: 02
ENCUESTA DE CONSUMO CULTURAL PGINA: 2
-ECC- FECHA: 08-07-08

1. ESPECIFICACIONES DE COEFICIENTE Y VARIANZA

1.1 Factores de expansin

De acuerdo a la teora de muestreo el factor de expansin es la capacidad que


tiene cada individuo seleccionado en una muestra probabilstica para representar
el universo en el cual esta contenido. Es decir, es la magnitud de representacin
que cada seleccin posee para describir una parte del universo de estudio.
Cuando el diseo es MAS se asume que individuos dentro de una misma unidad
de muestreo tienen la misma capacidad de representar al universo en
consideracin, en tanto que diferentes unidades de muestreo deben reflejar lo
mejor posible la densidad y distribucin del universo estudiado.

Todas las pautas anteriores se logran con la construccin u obtencin de marcos


mustrales que deben proveer informacin fiel sobre las caractersticas
demogrficas principales del universo que se pretende estudiar; adems debe
permitir de alguna forma, ubicar a todos y cada uno de los individuos
pertenecientes a dicho universo.

Un diseo muestral MAS se traduce como un diseo de muestreo aleatorio simple


y se dice que dicho diseo es probabilstico porque asigna una probabilidad de
seleccin a todas y cada una de las unidades del universo o la unidad muestral
(cuando el diseo es en etapas); es decir, todos los individuos en consideracin de
los que se pretende inferir tienen una probabilidad de ser seleccionados; en
particular esta probabilidad es la misma con el diseo MAS.

El factor de expansin por teora para un diseo MAS sobre k unidades de


muestreo esta definido por:

N k
k
n k

Donde
N k Denota el tamao total de elementos en la unidad de muestro.
nk Denota el nmero de elementos a ser seleccionados dentro de la unidad
de muestreo.

Es decir, para el diseo en consideracin de la encuesta de consumo cultural


ESTMAS MAS MASC y de acuerdo a los diagramas presentados anteriormente,
se tienen los factores de expansin por etapas de la siguiente manera:

ETAPA 1: Seleccin de municipios dentro de los estratos

RUTA DE ARCHIVO: DIRPEN\ECC\DOCUMENTACIN BSICA\METODOLOGAS\DISEO MUESTRAL\ME-ECC-ECV-01.doc


ESPECIFICACIONES DE COEFICIENTE Y VARIANZA CDIGO: ME-ECC-ECV-01
VERSIN: 02
ENCUESTA DE CONSUMO CULTURAL PGINA: 3
-ECC- FECHA: 08-07-08

N (i )
f exp I (i ) para i 1,2,3,4
n ( i )
con
N (i ) : Cantidad de municipios en el estrato i
n (i ) : Numero de municipios seleccionados en el estrato i

ETAPA 2: Seleccin de conglomerados dentro de municipios

N II ( j )
f exp II ( j ) para j 1,..., nI (i )
n II ( j )
con
N II ( j ) : Cantidad de conglomerados en el municipio j
n II ( j ) : Cantidad de conglomerados seleccionados en el municipio j

ETAPA 3: Seleccin de hogares dentro de conglomerado

N III ( k )
f exp III ( k ) para k 1,..., nII ( j )
n III ( k )

con
N III (k ) : Cantidad de hogares dentro del conglomerado k
nIII (k ) : Cantidad de hogares seleccionados dentro del conglomerado k

Nota: El factor de expansin correspondiente a cada individuo dentro de un hogar


seleccionado es igual a la unidad ( f exp individuo 1 ), puesto que se eligen todas las
personas de cinco aos y ms, es decir, esta parte del diseo es la que se conoce
como muestreo por conglomerados.

1.2 Factor de expansin final

El factor de expansin final se define como el producto de los factores de


expansin de las tres etapas de diseo:

F exp f exp I (i ) f exp II ( j ) f exp III ( k )

RUTA DE ARCHIVO: DIRPEN\ECC\DOCUMENTACIN BSICA\METODOLOGAS\DISEO MUESTRAL\ME-ECC-ECV-01.doc


ESPECIFICACIONES DE COEFICIENTE Y VARIANZA CDIGO: ME-ECC-ECV-01
VERSIN: 02
ENCUESTA DE CONSUMO CULTURAL PGINA: 4
-ECC- FECHA: 08-07-08

Este factor se aplica a cada uno de los individuos pertenecientes a los hogares
seleccionados en la ltima etapa del diseo. La suma de los factores de expansin
de todos los individuos de la muestra provee una estimacin del tamao del
universo de estudio.

1.3 Estimadores de Totales y Razones

Con los factores de expansin calculados se define el estimador del total de una
variable de estudio X ( t x ) en el universo, en funcin de los valores observados
con la muestra, de la siguiente manera:

tx t ( x) ( F exp) * x
ks
k

Donde s es una muestra del universo de estudio con valores particulares medidos
xk .
Y el estimador de la varianza para la anterior expresin es:

N (1 f ) 2
2 (x k xs ) 2
n
Var (tx ) S xk Con S 2 xk ; f
s

n (n 1) N

con N y n tamaos de universo y muestra respectivamente; siempre que el diseo


de muestreo sea MAS.
ty
Si Y es otra variable de estudio, en general el estimador de la razn Z se
tx
define por
t ( y )
Z
t ( x)

El cual no es un estimador lineal, luego el clculo de la estimacin de su varianza


difiere de los mtodos convencionales. Aplicando el mtodo de linearizacion de
Taylor y construyendo una nueva variable que recoge dicho termino de varianza,
se obtiene un estimador de la varianza del estimador.

El estimador de la varianza para el estimador de razn es

1

Var ( z) 2 V (ty ) z 2V (tx ) 2 zCov(ty ; tx )
t

RUTA DE ARCHIVO: DIRPEN\ECC\DOCUMENTACIN BSICA\METODOLOGAS\DISEO MUESTRAL\ME-ECC-ECV-01.doc


ESPECIFICACIONES DE COEFICIENTE Y VARIANZA CDIGO: ME-ECC-ECV-01
VERSIN: 02
ENCUESTA DE CONSUMO CULTURAL PGINA: 5
-ECC- FECHA: 08-07-08

o calculndose directamente con la frmula comn de varianza en el diseo MAS,


a travs de la construccin de una nueva variable U para cada uno de los
elementos de la muestra
1 ty
u k y k 2 xk
tx t x

Los promedios y las proporciones se trabajan como casos particulares del


estimador de razn cuando los numeradores y los denominadores cambian en
concepto, y estos pueden pasar de ser variables continuas a categricas.
Una forma de generar estimaciones para diferentes proporciones o promedios
(dependiendo del requerimiento de investigacin) es mediante la formacin de
variables indicadoras de dominio que toman el valor de 1 si un individuo de la
muestra pertenece a un dominio de inters y 0 en caso contrario.
Entindase al dominio de un universo como un conjunto de individuos contenido
en ste, que presentan una caracterstica discriminatoria Z que los ubica dentro de
una categora particular observada.

La variable indicadora se establece como

1 si el individuo k tiene la caracteris tica Z


I zk
0 en caso contrario

Es as que el estimador del total para la variable I z k se convierte en el estimador


del total de individuos del universo pertenecientes a un dominio Z; y en particular,
si I z k siempre es 1 para cualquier individuo de la muestra, es simplemente el
estimador del total de individuos en el universo.

Las proporciones y los promedios solicitados en cuadros de salida, se construyen


formando cocientes de diversos estimadores de dominios y de totales. Las
formulas no varan.

Para el diseo multietpico ESTMAS MAS MASC las formulas de estimacin por
etapas estn definidas como sigue

N I (i )
Etapa 1: tI (i ) x (tII (i )( j ) x ) con estimador de varianza
jsI n I (i )

N I (i ) 2 n N I (i )
VI (tI (i ) x )
1 I (i ) S 2 (t
sI II ( i )( j ) x ) VII (tII (i )( j ) x )
n I (i ) N 2 n
I (i ) jsI I (i )

RUTA DE ARCHIVO: DIRPEN\ECC\DOCUMENTACIN BSICA\METODOLOGAS\DISEO MUESTRAL\ME-ECC-ECV-01.doc


ESPECIFICACIONES DE COEFICIENTE Y VARIANZA CDIGO: ME-ECC-ECV-01
VERSIN: 02
ENCUESTA DE CONSUMO CULTURAL PGINA: 6
-ECC- FECHA: 08-07-08

(t II ( i )( j ) x tII (i ) x ) 2
S sI2 (tII (i )( j ) x ) sI
donde
n I (i ) 1

N II ( j )
Etapa 2: tII (i )( j ) x n
ksII
(tIII (i )( j )( k ) x ) con estimador de varianza
II ( j )

N II ( j ) 2 n N II ( j )
VII (tII (i )( j ) x )
1 II ( j ) S 2 (t
III ( i )( j )( k ) x ) VIII (tIII (i )( j )( k ) x )
n II ( j ) N 2 sII
n
II ( j ) ksII II ( j )

2
(t III ( i )( j )( k ) x tI (i )( j ) x ) 2
(t II (i )( j )( k ) x ) sII
donde S sII
n II ( j ) 1

N III ( k )
Etapa 3: tIII (i )( j )( k ) x n
lsIII
(tIV (i )( j )( k )( l ) x ) con estimador de varianza
III ( k )

N III ( k ) 2 n N III ( k )
VIII (tII (i )( j )( k ) x )
1 III ( k ) S 2 (t
IV ( i )( j )( k )( l ) x ) VIV (tIV (i )( j )( k )( l ) x )
n III ( k ) N 2 sIII
ksIII n III ( k )
III ( k )

(t IV ( i )( j )( k )( l ) x tI (i )( j )( k ) x ) 2
2
(tIV (i )( j )( k )( l ) x ) sIII
donde S sIII
n III ( k ) 1

Finalmente, para obtener la estimacin general a la que se quiere llegar, se tiene:


3
tx (tI (i ) x )
i 1
Con estimador de varianza
3
VI (tI (i ) x ) VI (tI (i ) x )
I 1

Si el estimador resulta ser de razones, las formulas para el calculo de la varianza


no se alteran si se emplean en lugar de xl los valores de u l .

RUTA DE ARCHIVO: DIRPEN\ECC\DOCUMENTACIN BSICA\METODOLOGAS\DISEO MUESTRAL\ME-ECC-ECV-01.doc


ESPECIFICACIONES DE COEFICIENTE Y VARIANZA CDIGO: ME-ECC-ECV-01
VERSIN: 02
ENCUESTA DE CONSUMO CULTURAL PGINA: 7
-ECC- FECHA: 08-07-08

1.4 Programa de Estimacin

El programa de estimacin es una rutina en SAS que ayuda a realizar los clculos
anteriores, con base en las observaciones de la base de datos de la encuesta.

El programa est compuesto por una macro principal que se encarga de estimar
una sola etapa agrupando por llaves especiales a los individuos sobre los cuales
deben realizarse las sumas y las varianzas de la respectiva etapa. Es decir, la
base de datos debe llevar una llave que le permita al programa discriminar los
individuos que van en la etapa a trabajar; y estas llaves se construyen haciendo
mencin a la unidad muestral que se debe trabajar en cada etapa.

Finalmente, la salida es otra base de datos que contiene los estimativos de total y
de varianza de la etapa trabajada, que a su vez retroalimenta la misma macro para
trabajar la etapa siguiente con otra llave. La macro se itera tres veces con tres
llaves diferentes (una vez por cada etapa), hasta obtener los resultados de la
primera etapa en donde mediante el empleo de consultas y pasos data, se
recalculan las frmulas para obtener la estimacin final, teniendo en cuenta la
estratificacin.

En la generacin de cuadros de salida se emplean tres macro que a su vez utilizan


la macro principal de estimacin por etapas, para generar cuadros de salida
cruzados en dos variables y calcular la proporcin por dominio respecto al total
estimado. Los cuadros salen del programa con todos los dominios de una variable
enfrentados con todos los dominios de la otra.

RUTA DE ARCHIVO: DIRPEN\ECC\DOCUMENTACIN BSICA\METODOLOGAS\DISEO MUESTRAL\ME-ECC-ECV-01.doc

Vous aimerez peut-être aussi