Vous êtes sur la page 1sur 23

Definiciones:

Muestreo en estudios estadísticos


• Universo (U): Conjunto de elementos susceptible de ser estudiados.
Individuos, aldeas, pueblos, acontecimientos (nacimientos, fallecimientos, …)
Precisión en la definición
• Unidades muestrales (UM): Elementos que componen el Universo.
Individuos, aldeas, pueblos, manzanas, hogares, …
Un mismo U puede descomponerse en distintos tipos de UM.
• Muestra (m): Subconjunto de UE extraídas del U. .
Los resultados de la muestra se van a “extrapolar” (estimación)
Población Diana (N)

Unidades
muestrales

Muestra (n)
Unidades
Muestrales seleccionadas
Representatividad en estudios estadísticos

m = Imagen reducida pero “fiel” del U

Características a evaluar

Grupos de estudio “sobre-representados”

Ponderación en la estimación
Muestreo Aleatorio Simple (MAS) (Azar Simple):
Extraer m de tamaño n donde cada UM tiene la misma
probabilidad de ser extraída. Puede realizarse con o sin
reposición.

Los pasos a seguir son:


• Listar todos los elementos
• Calcular el tamaño muestral necesario
• Listado de números aleatorios
• Extraer las unidades muestrales del universo
poblacional.

Ventajas:
• Sencillez.
• Se basa en métodos probabilísticos
• Sirve de base para otros métodos más complejos.

Inconvenientes:
•Todas las unidades poblacionales han de ser listadas.
• No unifica las distintas características de los elementos.
•Algún grupo poblacional puede no ser representado
Muestreo Aleatorio Sistemático (MAST)
(Azar Sistemático):

Los pasos a seguir son:


Listar todos los elementos
Calcular el tamaño muestral necesario
Seleccionar una primera unidad, calculando N/n=CE (coeficiente de
Elevación)
Seleccionar el resto de unidades a partir de la 1º sumando el CE
correlativamente.

Ventajas:
Las mismas que en MAS

Inconvenientes:
Una cierta ordenación puede dar lugar a un sesgo.
El CE puede no ser entero.
La sustitución de las unidades vacías produce otro CE y este a su vez
puede producir un nuevo sesgo.
Muestreo Estratificado:

Se eligen unas características de la población diana y se


realizan subgrupos de la misma a partir de éstos, intentando que sea un
fiel reflejo del universo muestral.

Estrato: Subconjunto de la población agrupado por una o


más características.
Ventajas:
Consigue una mayor precisión que el MAS y el MAST.
Se puede obtener información de cada estrato.
Es más beneficioso logística y administrativamente hablando.

Inconvenientes:
Es más complejo que el MAS.
Es más costoso económicamente y de recursos utilizados.
Muestreo Aleatorio Estratificado (MAE):

En este proceso se divide la población en estratos o subconjuntos


disjuntos y exhaustivos para la posterior extracción de una MAS
en cada uno de ellos, con el objeto de conseguir una
representación de cada uno de ellos. Se debe conseguir una
homogeneidad intra-estrato y heterogeneidad inter-estrato.

Podemos elegir dos tipos de reparto al realizar los estratos:

Simple.- Cada estrato contiene el mismo número de unidades


muestrales.
ne 
nm uestral
L
L = nº de estratos

Proporcional.- Cada estrato es proporcional en la muestra a la


proporción que le corresponde en la población diana.
N
ne  e


N población
nm uestra
Ejemplo de muestreo aleatorio estratificado

N=600 n=60

Camas/Hospitales Ne Simple Proporcional


60/3=20
>1000 50 20 5 (50/600)x60
1000-500 200 20 20 (200/600)x60
<500 350 20 35 (350/600)x60
N=600 n=60 n=60
Simple L=nº de estratos=3

ne n
m uestral
L
 60 3
 20
Proporcional
N
ne  e


N población
nm uestra
Muestreo por Conglomerados:

Se utiliza cuando no se pueden listar los elementos de la población


diana, entonces definimos unidades más complejas, que denominamos
conglomerados, que reunan en sí misma un conjunto amplio de unidades
“elementales”.
Muestreo Polietápico: Se realiza en 2 o más etapas.
Los pasos que sigue son:
Identificar los conglomerados a estudiar.
Seleccionar al azar los conglomerados.
Seleccionar las unidades muestrals en cada conglomerado.
Ejemplo:
Para realizar un estudio epidemiológico, se desea diseñar una muestra estratificada
en función de tres factores de riesgo. Siendo la población total de 1.000.000 de
habitantes:
Hábitat:

Rural-300.000 h.
Urbana-700.000 h.
Sexo: En el medio rural el % de varones es del 40% y en el urbano de 55%.

Edad: Se estratifica en 3 categorías, siendo su distribución igual en varones


que en mujeres y en cada uno de los hábitat
<20 años-30%
20-50 años-50%
>50 años-20%.

El grupo con menor muestra debe tener un mínimo de 48 individuos.


Diseñar el árbol de estratificación y el valor mínimo de muestra necesario.
0,3
Población (1.000.000)
0,7

Rural (300.000) Urbano (700.000)


0,4 (0,12)

120.000
0,6 (0,18)

180.000
0,55 (0,385)

385.000
0,45 (0,315)

315.000
Hombres Mujeres Hombres Mujeres

<20 20-50 >50 <20 20-50 >50 <20 20-50 >50 <20 20-50 >50
0,3 0,5 0,2 0,3 0,5 0,2 0,3 0,5 0,2 0,3 0,5 0,2
36.000 60.000 24.000 54.000 90.000 36.000 115.500 192.500 77.00 94.500 157.500 63.000
0

0,036 0,06 0,024 0,054 0,09 0,036 0,115 0,192 0,077 0,094 0,157 0,063
72 120 48 108 180 72 231 385 154 189 315 126

Ejercicio 1.
Se desea determinar la mortalidad por cierta cardiopatía en una población de
2.000.000 de habitantes.
Para ello diseñamos un estudio cuyo muestreo será estratificado teniendo en
cuenta diversos factores que nos distribuyen a la población en Alto y Bajo
Riesgo, y sabiendo que el sexo y la edad influyen en esa enfermedad.
Teniendo en cuenta que en la Población total, tenemos 200.000 personas en
el grupo definido como de Alto Riesgo, que en este grupo el porcentaje de
varones es del 55% mientras que en el grupo de bajo riesgo es del 50% y
que en los varones tenemos un 20% menores de 10 años, un 60% entre 10 y
50 años y un 20% mayores de 50, mientras que en las mujeres este porcentaje
es de 40, 40 y 20% respectivamente para cada grupo de edad.

Realizar el árbol de estratificación y el número de muestra necesario en cada


uno de ellos sabiendo que en total necesitamos 2.000 personas.

Ejercicio 1.

0,1

Muestra
(2000)
0,9

0,55

Alto Riesgo

0,45

0,5

Bajo Riesgo
0,5
0,20
0,20

0,4

Mujeres 10-50 0,018 – 36


0,4

0,2

0,20

0,20

0,4

0,2
<10

>50

<10

>50

<10

>50

<10

>50
0,60
Varones 10-50 0,033 – 66
0,011 – 22

0,011 – 22

0,018 – 36

0,009 – 18

0,60
Varones 10-50 0,27 – 540
0,09 – 180

0,09 – 180
0,4
Mujeres 10-50 0,18 – 360
0,18 – 360

0,09 – 180

Encuesta transversal
sobre una muestra de 4000
sujetos
representativa de la “población
general” de España
no institucionalizada
de 60 y más años de edad
Muestreo probabilístico por conglomerados y polietápico (~NHANES)

CC.AA.
y tamaño del
municipio

Secciones del
Censo

Hogares

Individuos
Formación de los Conglomerados
Distribución de la población (residentes) >59 años según CCAA y tamaño de hábitat
Menos De 5.000 De De Mas de Total
de 5000 a 50.000 50.001 a 100.001 a 500.000
100.000 500.000
Andalucía 107 243 47 118 108 623
Aragón 57 27 0 0 64 148
Asturias 15 46 23 53 0 137
Baleares 11 34 0 28 0 73
Cataluña 97 172 57 120 200 646
Canarias 8 51 5 52 0 116
Cantabria 18 15 6 21 0 60
Castilla León 162 48 28 79 0 317
Castilla La
Mancha 94 65 28 12 0 199
Extremadura 54 41 11 9 0 115
Galicia 83 146 35 62 0 326
La Rioja 9 5 0 12 0 26
Madrid 14 29 18 50 341 452
Murcia 2 45 7 45 0 99
Navarra 18 10 0 18 0 46
País Vasco 26 80 18 93 0 217
País
Valenciano 60 170 37 55 78 400
Total 835 1227 320 827 791 4000
Datos elaborados a partir del Censo de Población (INE)
Distribución proporcional de la muestra (entrevistas) según
CCAA y tamaño de hábitat
Menos De 5.000 De De Mas de Total
de 5000 a 50.000 50.001 a 100.001 a 500.000
100.000 500.000
Andalucía 219164 499579 96565 243206 222758 1281272
Aragón 117154 55860 131894 304908
Asturias 30871 94705 46633 109591 281800
Baleares 21904 69863 58611 150378
Cataluña 198728 354033 117387 247527 411379 1329054
Canarias 15553 105423 9711 107977 238664
Cantabria 36391 31402 12399 42521 122713
Castilla León 333645 98468 57193 163326 652632
Castilla La 193273 132712 58313 23848 408146
Mancha
Extremadura 112111 84308 21648 19164 237231
Galicia 171552 299365 70983 127619 669519
La Rioja 17779 9635 25194 52608
Madrid 27966 60073 36013 102029 702514 928595
Murcia 3853 92487 14002 93349 203691
Navarra 37398 19761 37933 95092
País Vasco 53749 164391 36424 191329 445893
País 122421 350419 75731 112388 161076 822035
Valenciano
Total 1713512 2522484 653002 1705612 1629621 8224231
Fuente: Censo de Población. INE

–1º. Formación de Conglomerados (clusters) por estratificación de región de


residencia (CCAA) y tamaño de hábitat, seleccionados con probabilidad
proporcional al tamaño.

Tal que obtengamos la distribución de las encuestas a realizar en cada cluster, respetando las proporciones que representan en
el conjunto nacional: muestra representativa proporcional.
La muestra es proporcional y representativa de la población >59 años residente en hogares en España.

Selección de las Secciones Censales

-Zona geográfica delimitada,


dentro de un municipio

-El callejero de la SC delimita


su mapa

-Numeración de cada vía:

*Específica (C/Pez nº50 al nº70)


*0001-9999 (todos los nºs impares
de esa calle constan en la CS)
*0002-9998 (todos los nºs pares de
esa calle están incluidos en la CS)

–2º. Selección ® de Secciones Censales (“callejero”) para cada conglomerado,


según su tamaño proporcional
•280 SC (4000Q/14-15Q per SC)

Selección de los hogares, viviendas o domicilios


Cadencia = 6
Oficina

ílNº 32ij
Calle Sevilla

Pto de partida ®
(selección ® dentro de la SC)
3° PISO
2° PISO
1°PISO

Sustitución por causa justificada (local no dedicado a vivienda, deshabitada,


rechazo, ausencia prolongada...): sustitución por vivienda contigüa

O Vivienda seleccionada

O
Q Viviendasustituta
Encuesta realizada

–3º. Selección ® de los Hogares (domicilios) en las listas de las SC


•15H/SC (10 H titulares y 5 H
sustitutos) por rta esperada de la muestra
•Se parte del individuo: selección de sujetos >59 años residentes en cada SC
No entrevista, o tomar composición
de sexo y edad del hogar
Cadencia = 8

Deshabitada

3°PISO
Academia
2° PISO

1° PISO
BAJO

Pto de partida ® (negativa)


Vivienda
Unifamiliar
t
Selección del individuo entre residentes en el hogar

-Tabla de números aleatorios (a la dcha)

-Preguntar sexo y edad de todos los miembros


de interés (>59 años)

-Ordenar de mayor a menor edad


-Usar la Tabla de números aleatorios para
seleccionar un solo miembro

-Cruzar nº de censados en el hogar (a la izda)


con nº de orden de la entrevista (nº hogar en la SC)

–4º. Selección ® de los Sujetos por sexo y edad, en los hogares (si >1 sujeto
>59a en H)

•1 S/H, por el método de Kish

>59
70 1
65 2

Nº ancianos en el H

Supuesto de 10 H/SC

Vous aimerez peut-être aussi