Vous êtes sur la page 1sur 21

Contenido 1- Definicin. Aplicacin. Seleccin de una muestra por Conglomerados. Etapas. Notacin.

2- Muestreo monoetpico con conglomerados de igual tamao. Estimacin de la media, el total y la proporcin. Coeficiente de correlacin intra-conglomerados. Descomposicin de la varianza. Eleccin del tamao del conglomerado. 3- Muestreo monoetpico con conglomerados de tamao desiguales. Estimadores insesgados y de razn para la media y el total. Tamao de muestra. Estimacin de la proporcin y tamao de muestra. 4- Muestreo por conglomerados con probabilidad proporcional al tamao y con restitucin. Mtodo de Hansen y Hurwitz y de Lahin de seleccin. Estimadores ppt del total y de la media. Exavtitud relativa de los 3 estimadores. 5- Muestreo con probabilidades diferentes de seleccin y sin restitucin. Estimador de Horvitz-Thompson. 6- Muestreo estratificados de conglomerados desiguales.
Muestreo I 134

TEMA 6 MUESTREO POR CONGLOMERADOS MONOETPICO

Muestreo por conglomerados


Definicin: El muestreo por conglomerados es un muestreo aleatorio donde cada unidad de muestreo (conglomerado) comprende a varias unidades elementales. El muestreo por conglomerados es en muchos casos, un diseo efectivo para obtener la informacin deseada reduciendo los costos. El diseo por conglomerados no requiere de marco muestral completo de las unidades elementales. El muestreo por conglomerados es diferente al estratificado, donde todos los estratos tienen representacin en la muestra y cuyo objetivo es reducir la varianza de los estimadores.

Muestreo I

135

Muestreo por conglomerados


Se aplica conglomerados porque:

i. No se dispone de marco muestral de las unidades ltimas pero si de conglomerados y el costo de construir un marco sobrepasa los del estudio. ii. Se minimizan costos al limitar los traslados entre conglomerados iii. Es difcil fijar con acuracidad los lmites de las unidades ltimas. iv. Consideraciones de: los objetivos de estudio, estructura de la poblacin o administrativas definen la necesidad de conglomerados. A diferencia del estratificado en el conglomerado la varianza del estimador se hace pequea al hacer cada conglomerado heterogneo dentro de s y semejantes entre si.
Muestreo I 136

Muestreo por conglomerados


Cmo seleccionar una muestra por conglomerados. 1. Definir el conglomerado. Tamao: igual o diferente Tamao apropiado: estructura de la poblacin, costos, variabilidad del estimador e informacin disponible. 2. Formar el Marco Muestral (directorio de conglomerados) 3. Seleccin aleatoria de muestra de conglomerados. 4. Encuesta u observacin (Etapas) - Monoetpico: Se observan todas las unidades de los conglomerados de la muestra. - Bietpico: Se seleccionan muestras aleatorias dentro de los conglomerados seleccionados en la primera etapa. - Polietpico: Se seleccionan conglomerados que a su vez estn formados por conglomerados, donde a su vez se muestrea y as sucesivamente.
Muestreo I 137

Muestreo por conglomerados


Notacin. El estudio del diseo por conglomerados requiere de una notacin un poco mas compleja (un subndice por etapa) Poblacin P N = nm de conglomerados en P Mi = nmero de unidades en el conglomerado i N M o = M i = nmero total de unidades en la poblacin M = M o N = tamao medio del conglomerado Yij y ij observacin j-sima del i-simo conglomerado
Muestreo I

Muestra m n = nm de conglomerados en m mi = nmero de unidades del conglomerado i en la muestra

138

Muestreo por conglomerados


Notacin. Poblacin P Yi Total del conglomerado i
Yi = Yij
N

Muestra m yi Total muestral del N y = yij i conglomerado i


y i = yi mi Media muestral del conglomerado i

Y i = Yi M i Media del
conglomerado i
Yi =

Y
i

ij

M o Media Poblacional

Y Total Poblacional Y = Y N Media del total por


ij

Y=

yi Media muestral

Y Total estimado

y Media muestral del total por


conglomerado

conglomerado

Muestreo I

139

Muestreo por conglomerados


Estudiaremos ahora diferentes casos del muestreo por conglomerados monoetpico Si el muestreo es monoetpico, observamos todas las unidades ltimasde los n conglomerados seleccionados y mi = Mi, yi = Yi,

y i = Y i . Distinguiendo dos casos: cuando los conglomerados son


de igual tamao y cuando son de diferente tamao. Monoetpico con conglomerados de igual tamao. M i = M para todo i (todos los Mi son iguales) Estimacin de Y i

Y= y=
n

yij

nM

Y =
n

Yi y = =y= n nM M
i,
140

Muestreo I

Muestreo por conglomerados


En el monoetpico de igual tamao, la varianza de y de la media muestral del total por conglomerado, es semejante a la varianza de la media muestral en el aleatorio simple

como

N n Yi Y V y = Nn N 1 n M n y Yi ij y y= = = nM nM M

()

N 1 M M n y por igual razn que en el m.a.s.


luego
2 2

V y =

()

V y =

()

1 f

(Y Y )
N i
n

1 f = n
y

(Y Y )
i

N 1

N n V y = Nn

()

(y

n 1
141

Muestreo I

Muestreo por conglomerados


Estimacin del total
El total poblacional en el conglomerado monoetpico de igual tamao Y =

yij = Yi = N Y = N M Y

su estimador es Y = N M y = N y con varianza


N n Y i Y V (Y ) = N V y = N M Nn N 1
2

()

y su estimador insesgado de V (Y ) es
n 2 2

N n yi y N ( N n ) yi y = V (Y ) = N M Nn n 1 Nn n 1 Estimacin de la proporcin Basndose en lo visto para la media proponga un estimador para la proporcin, determine la varianza y la varianza estimada.
2 n 2

Muestreo I

142

Muestreo por conglomerados


Coeficiente de correlacin intra-conglomerados.

Definido por:

E Yij Y Yil Y E Yij Y

[(

)(

)]

el numerador esta formado por

N M ( M 1) 2 pares de unidades, as:


=
2 yij Y yil Y N M ( M 1)

)(

2 2 y Y y Y = ( M 1 )( N M 1 ) s il as ij

)(

2 yij Y yil Y ( M s 2 ( N M 1)

)(

Al expresar la varianza de y

en funcin del coeficiente de y

correlacin y aproximar N M 1 = N M

N 1 = N se obtiene

1 f s2 V ( y) 1+ M 1 M n

( (

))
Muestreo I 143

Muestreo por conglomerados


Coeficiente de correlacin intra-conglomerados (cont.). Esta expresin va a permitir hacer comparaciones entre el muestreo aleatorio simple y el muestreo por conglomerados. Sean na y nc los tamaos de la muestra en la misma poblacin para el m.a.s. y el conglomerado

s2 V (a ) = (1 f ) na

s2 V (c ) (1 f ) 1 + M 1 y nc M

( (

))

Si la precisin en ambos diseos es igual

V (a ) = V (c) nc = na 1 + M 1

( (

))
144

Luego

(1 + (M 1) ) esta expresin la denomina Kish efecto de diseo


Muestreo I

Muestreo por conglomerados


Coeficiente de correlacin intra-conglomerados (cont.). 1. por el hay que multiplicar na para obtener nc 2. decrece mientras aumenta M , pero su tasa de decrecimiento suele ser inferior a la del crecimiento de M 3. El trmino M 1 expresa el aumento de la varianza debido a

la seleccin de n conglomerados de tamao M en lugar de n M unidades en el m.a.s.


1 f s2 V y = 1+ M 1 n M 4. De

()

( (

))

Para > 0 existe un incremento en V y para el muestreo por conglomerados en relacin al m.a.s. de tamao n M , y el caso mas favorable al conglomerado es cuando = 1 /(M 1) que la

()

varianza es nula. En el caso = 0 ambos mtodos proporcionan igual precisin. 145


Muestreo I

Muestreo por conglomerados


Descomposicin de la varianza. Es necesario determinar la variacin entre y dentro de los conglomerados por ser la poblacin finita se puede establecer el ANAVA para la muestra y para la poblacin

(y

S2
2 Sw

) (y Y ) = (y Y ) =
ij

Y
ij i

) = (y
2
2

ij

Y i + Y i Y
2
2

( y =

ij

ij Y i

)
2

N M 1

cuasivarianza poblacional

2 b

( Y =

N ( M 1)
i

cuasivarianza dentro de los conglomerados cuasivarianza entre los conglomerados

N 1

Muestreo I

146

Muestreo por conglomerados


as

( N M 1) S = ( N 1) S + N ( M 1) S
2 2 b

2 w

( N 1) 2 N ( M 1) 2 S = Sb + Sw ( N M 1) ( N M 1)
2

( N M 1) 2 N ( M 1) 2 S = S Sw ( N 1) ( N 1)
2 b

2 Sw =

( N M 1) 2 ( N 1) 2 S Sb N ( M 1) N ( M 1)

Muestreo I

147

Muestreo por conglomerados


Anlisis de Varianza
Poblacin Fuente de variacin Conglomerados Elementos Total Muestra Fuente de variacin Conglomerados Elementos Total Grados de libertad Suma de cuadrados
i

N 1

N ( M 1)

N M 1
Grados de libertad

(Y Y ) (Y Y ) (Y Y )
ij i
ij

Cuadrados medios

Sb2
2 Sw

S2
Cuadrados medios
2 sb 2 sw

n 1

n( M 1)

(y y ) (y y )
2 i

Suma de cuadrados

nM 1

(y y )
ij

ij

s2
148

Muestreo I

Muestreo por conglomerados (ejemplos)


Poblacin Ciudad A Ciudad B Aeropuerto Escuela Gente de pueblo Variables Caracterstica de la vivienda Compras de ropa Informacin acerca de viajes Notas Elementos Viviendas Personas Pasajeros que salen Estudiantes Conglomerados o unidades de muestreo Manzanas Viviendas Vuelos Salones Pueblos

Trnsito anual en Intervalos de 40 puente minutos Archivo de propiedad Informacin Propiedades Pginas de registro (o de terrenos en ciudad sobre impuestos de terreno libros) Granja Caractersticas Naranjas Arboles de las naranjas
Muestreo I 149

Actitudes Adultos sociales Origen y destino Vehculos

Muestreo por conglomerados


Eleccin del tamao del conglomerado En el muestreo por conglomerados, con conglomerados de igual tamao es importante determinar el tamao apropiado del conglomerado ( M ). El tamao depende entre otros de los siguientes factores: tipo y estructura de la poblacin, posibilidad de cambiar la estructura de agrupamiento, informacin disponible de la poblacin, variabilidad de la poblacin y de los conglomerados y la estructura de costos. La bibliografa presenta diversas metodologas para determinar el tamao optimo de los conglomerados, por ejemplo tres mtodos (cochran) 1. Si se dispone de informacin poblacional para diferentes tamaos de conglomerados. 2. Si la comparacin de la precisin se hace a partir de datos mustrales. 3. Hiptesis de la existencia de una ley que regula el comportamiento
2 S dentro de los conglomerados w y se relaciona con el tamao del

conglomerado.
Muestreo I 150

Muestreo por conglomerados


Tamao del conglomerado, en base a: 1. Informacin poblacional para diferentes tamaos Un principio general para seleccionar el tamao del conglomerado es el criterio de menor varianza para un costo dado, o equivalente, el menor costo para una varianza prefijada. Este criterio se basa en que la precisin relativa es proporcional
2 2 a M u / Cu S u , donde Cu es el costo de encuesta por unidad, M u
2 S es el tamao relativo de la unidad, u varianza entre los totales de unidades, por lo cual disponemos de un criterio para seleccionar el tamao de conglomerado adecuado. Cuando hay mas de una caracterstica a considerar se requiere tomar decisiones que estudien las diferentes alternativas.

Muestreo I

151

Muestreo por conglomerados


Tamao del conglomerado, en base a: 2. Precisiones en base de datos mustrales Para una encuesta con unidades de tamao M, si se registran los datos para cada una de las M unidades menores, se puede hacer comparaciones entre las precisiones de los diferente tamao de conglomerados, un instrumento de utilidad en este mtodo es el anlisis de varianza acompaado de un anlisis de costo. 3. Funciones de varianza En este enfoque se considera M como una variable continua y all encontrar el optimo. Este mtodo tambin utiliza el anlisis de 2 g 2 2 S = AM S S y varianza para predecir b y w relacionando w ajustando por
2 log( S w ) = log( A) + g * log( M ) ,

necesitando

al

2 S menos tres valores de w y M para estimar A y g, y apreciar la linealidad del ajuste.

Muestreo I

152

Muestreo por conglomerados


Muestreo por conglomerados monoetpico de tamaos desiguales. En la mayora de las aplicaciones los conglomerados son de tamao diferente (poblaciones naturales) Estimacin del total poblacional: Y = yij Dos estimadores diferentes de Y Estimacin insesgada Un estimador insesgado de Y en el muestreo por conglomerados N n monoetpico es: Y = n yi Mi y = y donde i es el total del conglomerado i-simo, i j = yij
N Mi

Y=

Tambin por conglomerado.

N n

yi = N y

donde y es la media muestral del total


Muestreo I 153

Muestreo por conglomerados


1 f V ( y ) = Sabemos que en el m.a.s. n

(Y Y )
i

2 2 ( Y Y ) ( ) N f 1 i 2 V Y N V y ( ) = ( ) = As n N 1

N 1

(note que yi = Yi )

Y es la media poblacional del total por conglomerado

A pesar de ser Y un estimador insesgado puede ser poco preciso, debido a que no toma en cuenta las ponderaciones Mi, fundamentalmente cuando los y i (media del conglomerado i) varan poco y los Mi varian considerablemente, y en este caso los

yi = M i y i varian considerablemente y la varianza V (Y ) es grande.


N n Y = yi cada yi es ponderado por el mismo peso. Note que en n Una forma de corregir esta impresin es tomar en cuenta los valores

Mi

Muestreo I

154

Vous aimerez peut-être aussi