Vous êtes sur la page 1sur 24

INTRODUCCIÓN AL MUESTREO

1. 1 INTRODUCCIÓN.
Muestreo es el proceso por el cual se realiza inferencias a la población examinando una
parte de ella; este proceso es aplicable en nuestra vida personal y cotidiana. Así por
ejemplo una pareja contrae matrimonio en base a un corto enamoramiento, con un simple
grano de arroz el ama de casa prueba si todo el arroz esta cocinado en un recipiente,
probando el café contenido en una cucharadita se determina la calidad de la marca del
café, los dosajes y análisis clínicos (sangre, orina, etc.) Se realizan en base a muestras,
una muestra de roca lunar proporcionan información científica sobre el origen de la luna,
una zona turística de un país muestra lo atractivo de una parle turística de dicho país y así
diferentes aspectos de la vida, cultura y ciencia son investigados en base a muestras.

El propósito del muestreo es proporcionar diferentes tipos de información estadística de


naturaleza cuantitativa y cualitativa del todo mediante el examen o análisis de un poco de
unidades seleccionadas.

El método muestral: es el procedimiento científico de selección de unidades muestrales,


las cuales proveerán los estimadores requeridos con cierto margen de seguridad, toda vez
que son obtenidos en base a una parte y no del todo.

1.2 CENSO Y MUESTRA


El censo o enumeración completa, es una técnica que permite determinar el valor de
parámetros que existen en un conjunto de elementos o unidades en consideración,
mediante una revisión de todos ellos.
Ejemplos:
En las industrias de tranformacion de una determinada región gografica del país y en un
periodo de tiempo determinado es necesario determinar el valor del parámetro numero de
obreros y empleados en dicha industria
El numero medio de miembros por familia en la ciudad de Huaraz en el mes de enero de
2017.
El valor total de la producción agrícola en las cooperativas agrarias del norte en el año
2017.
El porcentaje de aportes al seguro social no pagados por los empresarios a nivel nacional
en los últimos cinco años.
Relación entre el número de familias en un sector de la ciudad al número de familias en
el mismo sector y que cuentan con seguro social.
Las técnicas de muestreo permiten estimar los mismos parámetros que aquellos en el caso
de un censo, es decir, permiten obtenerlos aproximadamente a través de una muestra. Si
esa muestra se obtiene de manera probabilística, se le llama muestra probabilística y al
conjunto de estas técnicas se le denomina TECNICAS DE MUESTREO
PROBABILISTICO.
La muestra es una es una pequeña porción representativa y adecuada de la población
REPRESENTATIVA.- Porque debe reflejar fielmente las características de la población
de la cual procede y diferir de ella, solo en el número de unidades incluidas.
ADECUADA.- Porque debe incluir un número óptimo y mínimo de individuos. Este
número se determina mediante el empleo de fórmulas estadísticas.
Los aspectos referentes a la representatividad o calidad de la muestra, son más
importantes que los referentes a su cantidad y no debe pensarse que la representatividad
de la muestra depende de su cantidad.
Si quisiéramos estudiar las características del pueblo peruano y estudiamos solo los
habitantes de la costa, aunque estudiáramos a todos ellos, nuestra muestra no seria
representativa de todo el país.

1. 3 VENTAJAS DE MUESTREO:
El estudio de una muestra tiene ventajas potenciales en los diferentes campos de la
actividad humana e investigación científica. Las ventajas del muestreo son:
a). Costo reducido; una muestra requiere relativamente mejores recursos para procesarla
y diseñarla adecuadamente, así el costo de unidad de observación es alto en comparación
con un censo, pero el costo total del estudio por muestreo en mucho menor cubriendo los
mismos objetivos y propósitos de la encuesta o cuestionario, debido a que los datos se
obtiene únicamente de una pequeña fracción del total de datos u observaciones en estudio
o investigación.
b). Mayor Rapidez; Un número pequeño de observaciones puede recolectarse y
procesarse más rápido que la información de un censo y dar resultados más oportunos.
c). Mayor Alcance; El muestreo tiene un mayor alcance frente al censo con relación a la
variedad de información dado su flexibilidad adaptabilidad, y posibilidad de estudiar la
interrelación de varios factores en un estudio.
d). Mayor Exactitud; Los datos obtenidos con un censo o una muestra están sujeto a
diferentes tipos de errores y sesgos, la magnitud de las cuales depende del procedimiento
particular del estudio. Sin embargo, si el mismo procedimiento se le asigna para la
muestra y el censo, la exactitud de una muestra será la misma, pero comparativamente
con una pequeña escala de proporciones un estudio muestral posibilita mayor exactitud
por practicarse un mejor control sobre la recolección y procedimiento de datos, empleo
de mejor estándar con intensidad entrenamiento y mejor equipo a los encuestadores.
e). Único Método de Estudio; Se emplea en estudios donde el examen de las unidades
implican su destrucción, tales como: El estudio de la calidad de alimentos envasados,
estudio de la calidad de cohetes, granadas y municiones, etc.

1. 4 DESVENTAJAS DEL MUESTREO:


1. Cuando se requiere información básica para cada unidad, obviamente tiene que
realizarse un censo.
2. En algunos estudios de tabulaciones cruzadas donde el número de observaciones
muestrales que caen en una cierta celda son muy pequeños y no satisfacen los
requerimientos de ciertas pruebas.
3. El error debido al muestreo tiende a ser alto en áreas administrativas pequeña y de
gran variabilidad, como las observaciones en la población son muy variables, las
muestras que se seleccionan difieren unas de las otras como se estudia una sola
muestra para generalizar a la población, la diferencia entre el valor dado por una
muestra y valor poblacional constituye el error por muestro en cual puede medirse
estadísticamente según el aumento del tamaño de la muestra

1. 5 RELACION ENTRE LA MUESTRA Y EL CENSO


Muestra y censo en general no son competitivos en muchos casos son
complementarios.
En programación se emplea a menudo estimaciones gruesas, estas estimaciones serian
adecuadas si frente a la falta de datos o deficiencia en los disponibles esto se obtiene
mediante estudios muéstrales integrados, donde se interrelacionan la demografía sectores
económicos y sociales, en la etapa de implementación de dicha programación se requieren
datos seguros y en detalle, estos se obtendrán en base aren un censo.

En operaciones tales como: Prueba de procedimientos censales, ordenamientos de ítems,


evaluación y control de datos procesados, tabulaciones de variables seleccionadas o
ampliadas, se aplica en muestreo como parte integral de un censo.

1. 5 METODOS MUESTRALES.

1. Muestreo Probabilística; Es un proceso muestral donde cada elemento de la


población tiene una probabilidad perfectamente conocida de ser incluida en la
muestra, solo una muestra probabilística proporciona estimaciones con medida de ser
precisión.

2. Muestreo no Probabilística; Es un proceso por el cual se pueden asignar


objetivamente probabilidades a los elementos seleccionados y por consiguiente no se
puede determinar la precisión de los resultados muestrales en términos de
probabilidades.
Este muestreo puede ser: muestreo ajuicio o criterio, muestreo por cuotas y también
puede ser muestreo por correo (cuestionarios).
3. Muestreo a criterio o juicio; es un proceso por el cual la selección de las muestras
depende del criterio humano (experiencia) y no de la rigurosa aplicación de la teoría
de probabilidades por ejemplo un experto puede coger una muestra de arroz de la
parte de su cosecha para examinar su calidad puede ser físicamente imposible
seleccionar muestras aleatoriamente dentro del montón de su cosecha y aplicar la
teoría de probabilidades sin embargo el experto puede conocer ciertos hechos
relacionados con la calidad del arroz este puede ser que todo los granos de arroz sean
uniformes es decir todos los granos de arroz presenten el mismo peso o grosor lo cual
es suficiente para conocer su calidad

4. Muestreo por cuotas; Es otro forma de muestreo a juicio en que los sesgos que
surgen del método no probabilística de selección de la unidades muéstrales se
controlan hasta cierto punto por la estratificación y el establecimiento de cuotas a
cada estrato, es decir que la población se divide en grupos o estratos.
5. Muestreo o Cuestionario por Correo; Se emplea por ser de bajo costo y facilita la
administración, el principal objetivo a este muestreo es el sesgo causado por el no
retorno de cuestionarios, lo cual para superarlo se propone combinar el cuestionario
por correo con la entrevista personal, en los estudios de opinión y de mercado se
emplea estos tipos de muestreo generalmente. También en investigaciones turísticas.

1.6. DEFINICIÓN DE TERMINOS.

2. Unidad Elemental o simplemente unidad; es el elemento del cual se requiere


información (persona, familia, vivienda, etc.).
3. Unidad de registro.- Es el elemento o grupo de elementos para el cual se registra
información. En una encuesta si se requiere información sobre el sexo y edad de las
personas, la unidad de registro lo constituye las personas.
4. Unidad de análisis.- Es la unidad para la cual se realiza el análisis. En una encuesta
de presupuestos familiares, la unidad de análisis puede ser la familia o familias de un
cierto nivel de ingresos. La unidad de análisis se denomina frecuentemente como
elemento de la población.
5. Población; es el conjunto de todas las unidades de análisis cuyas características se
van a estimar. La población debe definirse en términos de su contenido, extensión y
tiempo. Si se trata de diseñar una encuesta sobre el consumo familiar en el distrito de
Huaraz en el presente año tenemos:
Contenido: Personas. Unidad: Familias
Extensión: Distrito de Huaraz. Tiempo: año 2017
La población en estudio debe estar definida si ambigüedades, de manera que no dé
lugar a confusiones.
Para realizar inferencias o generalizaciones se debe distinguir dos tipos de
poblaciones:
Población Objetivo.- Está constituida por todos los elementos sin límites atravez del
tiempo y del espacio, que constituye el objetivo final de la generalización inferencial
científica.
Población Muestral.- Está constituida por una parte o un sub conjunto de la
población objetivo. Está determinada y delimitada en el tiempo y en el espacio y de
cuyas componentes en la práctica se obtienen la muestra para realizar el estudio.

Algunas veces, ambas poblaciones son idénticas y no existe dificultades para


generalizar a partir de la muestra; pero cuando, difieren no siempre puede aplicarse
las generalizaciones con igual fuerza o exactitud a una y otra población.
Generalmente, cuando esto ocurre, las conclusiones sacadas de la muestra se aplican
a la población muestral. El juicio de si el alcance de estas conclusiones se aplicara
también a la población objetivo debe depender de otras fuentes de información. Puede
ser de utilidad cualquier información suplementaria que se tenga acerca de la
naturaleza de las diferencias entre la población muestral y la objetivo
6. Marco Muestral; es el documento (lista, fichero, libreta, etc.). Donde se consigna
individualmente la unidades muéstrales, de modo que se puedan sortear todo los
elementos de la muestra este documento es indispensable cuando se aplica muestreo
probabilístico. El marco muestral debe estar perfectamente actualizado sin omisiones
de ningún tipo Ejemplo para los ciudadanos los registros electorales son importantes
para seleccionar los miembros de las cedulas electorales, para hogares y viviendas en
el ministerio de vivienda existen cedulas especiales que sirven de información para
el Instituto Nacional de Estadística.

Para las empresas turísticas, empresas de producción y establecimientos industriales


el marco para la muestra a este respecto lo da el registro que lleva al día las
características de la razón social (SUNAT, Registro Públicos).
7. Unidad de Muestreo.- Es una unidad seleccionada del marco muestral. Puede ser la
unidad de análisis, aun cuando no es necesario
8. Plan Muestral.- Conjunto de reglas o especificaciones para seleccionar una muestra.
9. Diseño Muestral.- Comprende el método de selección y estimación, el cual debe ser
indicado en todo estudio muestral

1.8. TIPOS DE MUESTREO PROBABILISTICO.

1. Muestreo Aleatorio Simple. Es un procedimiento de selección de una muestra


por el cual todos y cada uno de los elementos de la población tienen una
oportunidad igual e independiente de ser incluidos en la muestra. Además si se
toma la muestra de tamaño “n” cualquier muestra posible de “n” elementos tiene
la misma probabilidad de ser extraída que cualquier otra combinación de “n”
elementos, ya sea que la muestra se seleccione con o sin reposición.
Una muestra aleatoria simple se extrae por selección aleatoria empleando números
aleatorios o colocando los elementos de la población numerados del 1 a N en una
urna y mezclándolos perfectamente, este proceso ofrece la oportunidad de que
todos los elementos que no han sido extraídos previamente tengan igual
probabilidad de selección.
Este tipo de muestreo es eficiente si la población no es grande y heterogénea, así
es relativamente fácil y barato seleccionar las unidades muestrales. El
inconveniente en poblaciones grandes es la enumeración de todos sus elementos.

2. Muestreo Aleatorio Estratificado.


Es un método que trata de diseñar una muestra más eficiente que la que se obtiene
por un procedimiento aleatorio simple. El proceso de estratificación requiere que
la población este dividida en grupos homogéneas o clases llamadas estratos. Se
toma luego una muestra de cada estrato por el método aleatorio simple; la muestra
que resulta se denomina MUESTRA ESTRATIFICADA.
Una muestra estratificada puede ser proporcional al tamaño de los estratos u
óptima donde en la representación de la muestra se considera la variación y el
tamaño de cada estrato y/o costo en cada uno de ellos.
3. Muestreo Sistemático:
El muestreo sistemático es otra forma de seleccionar “n” elementos de una
población de tamaño “N”, donde se seguirá un orden pre establecido es decir
tomando elementos cada cierto número constante de espacios o cada cierto
número de elementos, puesto que las unidades para este tipo de muestreo deben
estar ordenadas o factibles de ser ordenados, su aplicación generalmente es en
estudio de archivos, estudio de clientes, etc.

4. Muestreo de Conglomerados.
Se refiere al procedimientos de dividir a la población en grupos o conglomerados
de unidades o elementos de la población y se extrae muestras de conglomerados
que representen a la población cuando se observan todas las unidades elementales
en las agrupaciones muéstrales se conoce como el nombre de muestreo
monoetapico, cuando se extrae una muestra de todas las agrupaciones se conoce
con el nombre de bietapico en ambos procedimientos también se muestrea
aleatoriamente.

5. Muestreo por Áreas.


El muestreo por áreas es un procedimiento práctico por áreas de listado que
proporciona buenos marcos para seleccionar diferentes zonas: viviendas, zonas
turísticas, zonas residenciales, etc. El muestreo por áreas también se emplea para
seleccionar muchas clases de muestras: tiendas, granjas, flora, fauna, cosechas,
otras; Aunque que por su movilidad agrega nuevas complicaciones.
El muestreo por áreas constituye un marco conveniente y efectivo para las
viviendas y las personas, esto se debe a varias razones.
a) El empleo de mapas permite identificar claramente a toda la población de
viviendas (conglomerados).
b) Esta identificación posee permanencia, durante el periodo de encuesta a partir
del momento de listado.
c) El trabajador de campo ubica con rapidez y claridad las fronteras de manzanas
y segmentos, y a las viviendas dentro de ellos.
d) La vivienda sirve de medio conveniente para el muestreo de personas, puesto
que se identifica con facilidad, es relativamente estable, suele contener pocas
personas, y se pueden identificar, de manera única, a toda persona con una sola
vivienda. En consecuencia, la vivienda sirve de unidad de muestreo única e
identificable para un conglomerado pequeño de personas, y de otras
poblaciones que puedan asociarse fácilmente con las viviendas.
TÉRMINOS BÁSICOS
1.9.PARAMETROS POBLACIONALES
El PARAMETRO es una función de los valores de todas las N unidades de la
población. Este valor es único, constante y por lo general desconocido.
Entre los parámetros más usuales tenemos:
1. TOTAL POBLACIONAL
Es la suma de todos los valores de la variable en estudio definida en la población. Así,
si los valores de la variable se denotan por Yi o Xi, el total poblacional denotado por
Y o X es

𝑌 = 𝑌1 + 𝑌2 + 𝑌3 +. … … . + 𝑌𝑁 = ∑ 𝑌𝑖
o
𝑋 = 𝑋1 + 𝑋2 + 𝑋3 +. … … . + 𝑋𝑁 = ∑ 𝑋𝑖

2. MEDIA POBLACIONAL
Es la media aritmética de los valores de la variable poblacional en estudio. Se obtiene
dividiendo el total poblacional por el número de unidades de la población. Se denota
por Y o X . Así:

1N 2 1 2
S2Y = (Yi-Y)
N-1 i=1
S2Y =
N-1
σY

3. VARIANZA POBLACIONAL
Llamamos varianza poblacional a la variabilidad de los valores de la variable en
estudios en la población y es medida por la media aritmética del cuadrado de las
desviaciones de las observaciones poblacionales con respecto a su media.
Se denota por  y así:
2

1 N
σ 2y =  (Yi-Y)2
N i=1

A esta varianza se le denomina VARIANZA TEORICA por su empleo en demostraciones


de tipo teórico, pero como su estimador es SESGADO se ha creído conveniente
modificarla a fin de obtener un estimador INSESGADO, resultando así la VARIANZA
PRÁCTICA, denotada y definida por:

Y
Y=
N

La diferencia con la varianza teórica está en el denominador, luego:

X
X=
N
La raíz cuadrada positiva de la varianza se denomina DESVIACIÓN ESTANDAR
POBLACIONAL y se denota por  Y ó sY .
4. COEFICIENTE DE VARIACIÓN
Para medir la variabilidad poblacional independiente de las unidades de medición. Se
obtiene al dividir la desviación estándar poblacional por la media poblacional. Se
denota por CV. Así:
Y Y
R= =
X X

Generalmente se expresa como porcentaje. El cuadrado del CV se denomina VARIANZA


RELATIVA.
Con el CV es posible comparar la variabilidad de diferentes unidades. Ejemplo,
variabilidad del consumo familiar en diferentes áreas y países.

5. RAZÓN POBLACIONAL
Se obtiene dividiendo los totales o medias poblacionales correspondientes a dos
variables estudio, se denota por R,
Así:
σ XY
ρ XY =
σYσX

Donde X, Y, X,Y son totales y medias poblacionales de las variables en estudio.

6. COVARIANZA POBLACIONAL ENTRE DOS VARIABLES ESTUDIO


Mide la variabilidad conjunta de dos variables y se obtiene tomando la media de los
productos de las desviaciones de las observaciones con respecto a su media. Se denota
por σ YX o C(X, Y). Así:

1 N
C(X,Y)=σ YX =  (Yi -Y)(Xi -X)
N i=1

7. COEFICIENTE DE CORRELACIÓN LINEAL POBLACIONAL ENTRE


DOS VARIABLES ESTUDIO
Mide la relación entre dos variables y se obtiene dividiendo la covarianza por el
producto de las desviaciones estándar correspondientes a las variables estudio. Se
denota por  XY .
σY
CV(Y)=
Y

El coeficiente de correlación es un número puro que varía desde -1 (perfecta correlación


negativa) a través de 0 (No existencia de correlación lineal) a + 1 (Perfecta correlación
positiva).
8. PROPORCIÓN POBLACIONAL
Si “A” unidades del total N poseen un cierto atributo o pertenecen a una cierta
categoría (tal como N° de viviendas que no poseen desagüe), la proporción
poblacional P de tales unidades es:
A
P=
N
Los valores de los parámetros generalmente son desconocidos y el primer objetivo del
muestreo es obtener estimaciones de dichos paramentos en base a datos muestrales, con
medición de la precisión correspondiente.

1.10. ESTIMADORES MUESTRALES

Un estimador es una regla o método de estimación de un parámetro poblacional,


generalmente expresado como función de los valores muestrales.
El valor particular producido por un estimador para una muestra dada se denomina
ESTIMACION o estimador muestral (o simplemente estimación) Observe que
puede existir más de un estimador muestral para un mismo parámetro; por lo que
debemos usar el mejor estimador, el cual debe cumplir ciertas propiedades
deseables.
Un acento circunflejo ( ^, que se lee sombrero) sobre 𝜃 significa que se trata de
un estimador; así, 𝜃̂ se lee el estimador de 𝜃.

Si una muestra aleatoria simple de n unidades es seleccionada desde una población


de N unidades; si, 𝑦𝑖 ( 𝑖 = 1, 2, 3, 4, … … . , 𝑛) denota el valor de la variable en
estudio para la i-esima unidad muestral puede ser cualquiera de las N unidades
poblacionales; tenemos los siguientes estimadores.

1. ESTIMADOR DE LA MEDIA POBLACIONAL


El estimador de la media poblacional 𝑌̅ es la media muestral 𝑦̅ definida por:

1 1
𝑌̂ = 𝑦̅ = (𝑦1 + 𝑦2 + 𝑦1 + 𝑦3 + ……. + 𝑦𝑛 ) = ∑𝑛𝑖=1 𝑦𝑖
𝑛 𝑛

2. ESTIMADOR DEL TOTAL POBLACIONAL


El estimador del total poblacional es dado por el producto del tamaño poblacional
y la media de la muestra seleccionada. Es decir:

𝑌̂ = 𝑁𝑦̅
3. ESTIMADOR DE LA VARIANZA POBLACIONAL
Si 𝜎𝑌2 es desconocido, su valor tiene que estimarse en base a los datos
muestrales. Dada una muestra aleatoria simple de n unidades, el estimador
muestral insesgado de la varianza poblacional es:

𝑛
1
𝜎𝑌2 = 𝑠𝑌2 = ∑(𝑦𝑖 − 𝑦̅)2
𝑛−1
𝑖=1

4. ESTIMADOR DE LA COVARIANZA POBLACIONAL


Un estimador de la covarianza de dos variables en estudio, obtenido de una
muestra aleatoria es: :

𝑛
1
𝐶̂ (𝑋, 𝑌) = 𝑆𝑋𝑌 = ∑(𝑦𝑖 − 𝑦̅)(𝑥𝑖 − 𝑥̅ )
𝑛−1
𝑖=1

5. ESTIMADOR DE LA RAZON POBLACIONAL


Un estimador de la razón poblacional R es la razón de los estimadores de sus
respectivos totales, es decir:
𝑌̂ 𝑦̅
𝑅̂ = =
𝑋̂ 𝑥̅

6. ESTIMADOR DEL COEFICIENTE DE CORRELACION POBLACIONAL


Un estimador del coeficiente de correlación poblacional 𝜌𝑌𝑋 es el coeficiente de
correlación muestral 𝑟𝑦𝑥
𝑠𝑦𝑥
𝜌̂𝑌𝑋 =
𝑠𝑦 𝑠𝑥

PROPIEDADES DE LOS BUENOS ESTIMADORES


Entre otras tenemos:
1. INSESGAMIENTO.- (es decir no existe sesgo)
Un estimador es insesgado si el valor promedio de los estimadores muestrales para
todas las muestra posibles del mismo tamaño es matemáticamente idéntico con el
valor del parámetro poblacional; este promedio sobre todas las muestras posibles
se conoce como la esperanza matemática o valor esperado. Simbólicamente: sea
𝜃 un parámetro y 𝜃̂ su estimador diremos que 𝜃̂ es insesgado si 𝐸(𝜃̂ ) = 𝜃.
Ejemplo: la media de la muestra es un estimador insesgado de la media
poblacional. Esto es: 𝐸(𝑦̅) = 𝑌̅ = 𝜇
Demostración
2. CONSISTENCIA
Un estimador es consitente si tiende al valor poblacional cuando se aumenta el tamaño
de muestra. La media, el total, la razón y el coeficiente de correlacion muestral son
estimadores consistentes.
3.- PRECISION O EFICIENCIA
De dos estimadores para el mismo parámetro, uno es más eficiente que el otro si la
varianza del primero es menor que la del otro es dedir,
4.- SUFICIENCIA
Un estimador es suficiente cuando proporciona toda la información que contiene la
muestra acerca del parámetro, de manera que no existe otro estimador que
proporcione más información.
ESTIMACION INTERVALICA
La estimación puntual no proporciona medida del posible error que se comete al tomar
un solo valor de un conjunto de posibles valores, motivo por el cual es conveniente
dar intervalos acerca de la estimación puntual, junto con una medida de seguridad de
que tal intervalo abarca el parámetro que se estima. Este intervalo recibe el nombre
de INTERVALO DE CONFIANZA O ESTIMACION INTERVALICA.
El intervalo de confianza posee limites que son función de variables aleatorias
observada, de tal modo que con una probabilidad predeterminada 1−∝, el parámetro
estimado siempre se encuentra entre ellos.
En forma general un intervalo de confianza para el parámetro 𝜃 será:

𝑃 [𝜃̂ − 𝑍∝ 𝜎𝜃̂ < 𝜃 < 𝜃̂ + 𝑍∝ 𝜎𝜃̂ ] = 1− ∝


2 2

Donde:
Límite superior: 𝜃̂ + 𝑍∝ 𝜎𝜃̂
2

Límite inferior: 𝜃̂ − 𝑍∝ 𝜎𝜃̂


2
Desviación estándar del estimador: 𝜎𝜃̂
Nivel o coeficiente de confianza: 1− ∝
Nivel de significación. ∝
Valor de la distribución normal al conocer la probabilidad predeterminada: 𝑍∝
2
A continuación damos algunos valores de 𝑍∝ ,
2

∝ 1−∝

0,10 0,9 1,64


0,05 0,95 1,96
0,02 0,98 2,33
0,01 0,99 2,58
MUESTREO ALEATORIO SIMPLE
FORMAS DE SELECCIONAR UNA MUESTRA
1.1 MUESTRAS SIN REEMPLAZO.- Se obtiene una muestra sin reemplazo cuando los
elementos de la población no se repiten en la muestra y esto se debe a que una unidad
seleccionada para integrar la muestra no es devuelta a la población.
1.2 MUESTRAS CON REEMPLAZO.- Cuando los elementos de la población se repiten
en la muestra y esto se debe a que la unidad seleccionada es devuelta a la población antes
de extraer otro elemento muestral.
NUMERO DE MUESTRAS
Si el muestreo es con reemplazo
Dada una población de N elementos hay Nn formas posibles de seleccionar una muestra
de tamaño n.
Ejemplo: sea N = 3 hogares de los cuales seleccionamos muestras de tamaño n = 2, con
reemplazo.
El número de muestras posibles es: Nn = 32 = 9
Si denotamos por A, B y C a los tres hogares, las muestras serían:
AA, AB; AC; BA; BB; BC; CA; CB; CC
Si el muestreo es sin reemplazo:
a) Considerando el orden es:
N!
N(N-1)(N-2)...(N-n+1)= = N Pn
(N-n)!
En nuestro ejemplo anterior, el número de muestras sería:
3!
P2 = =3x2=6
3
(3-2)! Muestras

Las muestras serían:


AB; AC; BC
BA; CA; CB
Note que AB  BA por el orden de los elementos
b) Sin considerar el orden:
Dada una población de tamaño N, el número de muestras de tamaño n que pueden
seleccionarse sin reemplazo y sin considerar el orden es:
N!  N
= 
n!(N-n)!  n 

En nuestro ejemplo, muestras


 3
  =3
 2

Las muestras serían:


AB, AC, BC
PROBABILIDAD DE SELECCIÓN DE UNA MUESTRA DE TAMAÑO “n”
a) En muestreo con reemplazo:
La probabilidad es igual a: 1/Nn
b) En muestreo sin reemplazo:
b.1) considerando el orden

La probabilidad es igual a: 1 1
=
N Pn N(N-1)...(N-n+1)

b.2 Sin considerar el orden:


La probabilidad es igual a:
1 n!(N-n)!

 N N!
 
 n 

PROBABILIDAD DE QUE UN ELEMENTO SE ENCUENTRE EN LA


MUESTRA.
a) Si el muestreo es con reemplazo:
La probabilidad es con reemplazo:
La probabilidad de seleccionar un elemento específico en la primera ocasión es 1/N; como
el 1er elemento es devuelto a la población, la probabilidad de seleccionar el 2do elemento
también es 1/N y así para cualquier elemento específico en cada una de las n ocasiones.
Luego.
La probabilidad de que un elemento sea incluido en una muestra de tamaño n será:
1/N + 1/N + … +1/N = n/N
b) Si el muestreo es sin reemplazo
La probabilidad de seleccionar un elemento específico en la 1era extracción es 1/N.
En la segunda extracción, la probabilidad será igual a la probabilidad que sea
seleccionado en la 2da extracción; esto es:
 N-1   1  1
  =
 N   N-1  N

La probabilidad que un elemento específico sea seleccionado en la 3era extracción es


igual a:
Prob. que no sea Prob. que no sea Prob. que sea
seleccionada en la 1ra x seleccionada en la 2da x seleccionada en la 3ra

 N-1   N-2   1  1
=    =
 N  N-1  N-2  N

y así sucesivamente para n extracciones. Por consiguiente: la probabilidad de que un


elemento sea incluido en una muestra de tamaño n será n/N.
Nota: La probabilidad de que un elemento de la población se encuentra en la muestra es
igual a n/N tanto para muestreo con y sin reemplazo.
Ejemplo considere la población hipotética de 6 viviendas, las cuales denotamos por a, b,
c, d, e, f, de donde se desea seleccionar muestras de tamaño 2, determinar el número de
muestras con y sin reemplazo y enumere los elementos posibles de todas las muestras
posibles empleando un diagrama tabular.
Solución
Numero de muestras para:
Muestreo con reemplazo 62 = 36
Muestreo sin reemplazo
Considerando el orden
6!
P2 = = 30
(6 − 2)!
Sin considerar el orden

6!
C26 = = 15
2! (6 − 2)!
Muestras de tamaño 2 en diagrama tabular
a b c d e F
a aa ab ac ad ae af
b ba bc bb bd be Bf Muestras sin
c ca cb cc cd ce Cf reemplazo y sin
d da db dc dd de Df considerar el orden
e ea eb ec ed ee Ef
f fa fb fc fd fe Ff

Las muestras que se presentan en el diagrama corresponden al muestreo con reemplazo


(36 muestras), en la diagonal se ubican las muestras con elementos iguales.

Las muestras ubicadas en el triángulo superior e inferior a la diagonal corresponden al


muestreo sin reemplazo y considerando el orden, (30 muestras)

Las muestra ubicadas en un solo triangulo (superior o inferior) corresponden al


muestreo sin reemplazo y sin considerar el orden (15 muestras)

La probabilidad de seleccionar una muestra cuando usamos el muestreo con reemplazo


es: 1/36
Muestreo sin reemplazo:
Considerando el orden: 1/30
Sin considerar el orden: 1/15
La probabilidad de seleccionar un elemento 2/6 = 1/3
6. ESTIMADORES DE VARIABLES CUANTITATIVAS
A. MUESTREO SIN REEMPLAZO B. MUESTREO CON REEMPLAZO
1. Estimador de la media poblacional 𝑌̂
1
Media muestral 𝑦̅ = 𝑛 ∑ 𝑦𝑖
2. Estimador del total poblacional

𝑌̂ = 𝑁 𝑦̅

3. Estimador de la razón poblacional

𝑦 𝑦̅
Razón muestral 𝑅= =
𝑥 𝑥̅
Donde y, x son totales muestrales

4. Estimador de la varianza poblacional

1
Varianza muestral 𝑆̂𝑌2 = 𝑠𝑦2 = 𝑛−1 ∑(𝑦𝑖 − 𝑦̅)2

5. Estimador de la varianza de la media muestral

2
𝑠𝑦 2
𝑠𝑦
𝑆𝑌2̂ = 𝑠𝑦2̅ = (1 − 𝑓) 𝑆𝑌2̂ = 𝑠𝑦2̅ =
𝑛 𝑛

Donde f = n/N es la fracción muestral

6. Estimador de la varainza del estimador del total poblacional


𝑆̂𝑌2̂ = 𝑠𝑦2̂ = 𝑉(𝑁𝑦̅) 𝑆̂𝑌2̂ = 𝑠𝑦2̂ = 𝑉(𝑁𝑦̅)
= 𝑁 2 𝑉(𝑦̅) = 𝑁 2 𝑉(𝑦̅)
2
𝑠𝑦 2
𝑠𝑦
= (1 − 𝑓)𝑁 2 = 𝑁2
𝑛 𝑛

7. Estimador del coeficiente de variación de la media muestral

𝑠𝑦 𝑠𝑦
𝐶𝑉 (𝑦̅) = 𝐶𝑉 (𝑦̅) =
𝑦̅ 𝑦̅

𝑠𝑦 𝑁−𝑛 𝑠𝑦
= ̅̅̅̅̅̅ √ = ̅̅̅̅̅̅
𝑦 √𝑛 𝑁 𝑦 √𝑛

8. Estimador de la Varianza del Estimador de la Razón Poblacional

Ejemplo
Si a los elementos de nuestra población: viviendas, a, b, c, d, e, f, le asociamos la
característica tamaño familiar (número de personas que habitan en la vivienda), con los
valores 8, 6, 3, 5, 4, 4, respectivamente, entonces para muestras de tamaño dos (n= 2)
tenemos
a) Los valores muestrales (y1, y2 )
a=8 b=6 c=3 d =5 e=4 f=4
a=8 8,8 8,6 8,3 8,5 8,4 8,4
b=6 6,8 6,6 6,3 6,5 6,4 6,4
c=3 3,8 3,6 3,3 3,5 3,4 3,4
d=5 5,8 5,6 5,3 5,5 5,4 4,5
e=4 4,8 4,6 4,3 4,5 4,4 4,4
f=4 4,8 4,6 4,3 4,5 4,4 4,4

Estimadores posibles de la media poblacional

8 6 3 5 4 4
8 8,0 7,0 5,5 6,5 6,0 6,0
6 7,0 6,0 4,5 5,5 5,0 5,0
3 5,5 4,5 3,0 4,0 3,5 3,5
5 6,5 5,5 4,0 5,0 4,5 4,5
4 6,0 5,0 3,5 4,5 4,0 4,0
4 6,0 5,0 3,5 4,5 4,0 4,0

A cada muestra corresponde una media muestral


Las medias de cada uno de los triángulos, inferior y superior a la diagonal, se obtienen
por simetría, toda vez que las muestras tienen elementos iguales

1 1
𝑌=𝑦= ∑ 𝑦𝑖 = ∑ 𝑦𝑖
𝑛 2

Estimadores posibles de la varianza poblacional


Conocemos que:
2
1 (∑ 𝑦)
𝑠𝑦2 = [∑ 𝑦𝑖2 − ]
𝑛−1 𝑛
Lugo para n = 2,

1 (𝑦1 + 𝑦2 )2
𝑠𝑦2 = [(𝑦12 + 𝑦22 ) − ]
2−1 2

1
𝑠𝑦2 = [(2𝑦12 + 2𝑦22 − 𝑦12 − 𝑦22 − 2𝑦1 𝑦2 )]
2

1
𝑠𝑦2 = [(𝑦 2 + 𝑦22 − 2𝑦1 𝑦2 )]
2 1
1
𝑠𝑦2 = [𝑦 − 𝑦2 ]2
2 1

Expresión que facilita el cálculo de los estimadores de la varianza poblacional, así los
estimadores para todas las muestra posibles son:
8 6 3 5 4 4
8 0,0 2,0 12,5 4,5,5 8,0 8,0
6 0,0 4,5 0,5 2,0 2,0
3 0,0 2,0 0,5 0,5
5 0,0 0,5 0,5
4 0,0 0,0
4 0,0

Distribución de frecuencias de la media muestral


i) Para el muestreo si reemplazo y sin considerar el orden: ( o simplemente muestreo
sin reemplazo
Se tiene:
𝑦̅ fi 𝑃(𝑦̅) 𝑦̅𝑃(𝑦̅)
3,5 2 2/15 7/15
4 2 2/15 8/15
4,5 3 3/15 13,5/15
5 2 2/15 10/15
5,5 2 2/15 11/15
6 2 2/15 12/15
6,5 1 1/15 6,5/15
7 1 1/15 7/15
1,00 75715

Frecuencia
3,5

2,5

1,5

0,5

0
3,5 4 4,5 5 5,5 6 6,5 7

ii) Para muestreo con reemplazo


Considerando todos los elementos tenemos
𝑦̅ fi 𝑃(𝑦̅) 𝑦̅𝑃(𝑦̅)
3 1 1/36 3/36
3,5 4 4/36 14/36
4 6 6/36 24/36
4,5 6 6/36 27/36
5 5 5/36 25/36
5,5 4 4/36 22/36
6 5 5/36 30/36
6,5 2 2/36 13/36
7 2 2/36 14/36
8 1 1/36 8/36
36 1.00 180/36

Frecuencia
7

0
3 3,5 4 4,5 5 5,5 6 6,5 7 8

Ejemplo 2:
Población hipotética de 30 sectores.

Sector Vivienda Población


1 17 76
2 18 82
3 26 116
4 18 76
5 24 112
6 17 77
7 20 88
8 24 109
9 24 111
10 22 88
11 15 78
12 22 112
13 17 80
14 19 93
15 20 105
16 19 93
17 19 95
18 23 114
19 25 127
20 23 113
21 18 94
22 15 83
23 21 121
24 18 105
25 21 129
26 20 114
27 21 121
28 21 116
29 17 109
30 16 105

MUESTREO DE PROPORCIONES O DE VARIABLES CUALITATIVAS


Con mucha frecuencia se requieren estimadores del número total o de la proporción de
unidades que `poseen cierta característica cualitativa o atributo o que caen en cierta
clase así, por ejemplo en un estudio de viviendas se desea conocer la proporción de
familias que viven en casa propia.
PARAMETROS
a) Si “A” es el número de unidades poblacionales que poseen cierto atributo,
entonces la proporción “P” del número de unidades con el atributo es:
𝐴
P=
𝑁
Donde N es el número de unidades poblacionales
b) Si definimos nuestra variable estudio de manera que tome el valor:
Yi = 1 si la unidad tiene el atributo SI
Yi = 0, si la unidad no tiene el atributo NO
Entonces
b.1 el número de unidades poblacionales con el atributo:

A = ∑ 𝑌𝑖
𝐼=1

b.2 Promedio de unidades que tienen el atributo o proporción


∑𝑁
𝐼=1 𝑌𝑖 A
̅=
Y = =P
𝑁 𝑁

b.3 Varianza por unidad (de las unidades que poseen el atributo)
1 ∑ 𝑌𝑖2
𝜎 2 = ∑(𝑌𝑖 − 𝑌̅)2 = − 𝑌̅ 2
𝑁 𝑁

𝜎 2 = 𝑃 − 𝑃2 = 𝑃(1 − 𝑃) = 𝑃𝑄

Donde.
𝑁

∑ 𝑌𝑖2 = ∑ 𝑌𝑖 = 𝐴
𝐼=1

Al ser los Yi = 1 o 0 tenemos 12 =1 ; 02 = 0

COEFICIENTE DE VARIACION POR UNIDAD (o de los Yi elementos que


poseen el atributo)

𝜎 𝑃(1 − 𝑃) 1−𝑃
= √ 2
= √
𝑃 𝑃 𝑃
Estimadores.

Para muestre sin reemplazo para muestreo con reemplazo


1. ESTIMADOR DE LA PROPORCION POBLACIONAL
Si en una muestra aleatoria simple de n unidades, “a” unidades poseen el
atributo, entonces el estimador de la proporción poblacional es la proporción o
media muestral “p”

∑𝑛𝑖=1 𝑦𝑖 𝒂
𝑃 = 𝑦̅ = = =𝒑
𝑛 𝒏

2. ESTIMADOR DE LA VARAINZA POR UNIDAD (o de las unidades que


tienen el atributo

∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅ 𝑖 )2
(𝒏𝒑 − 𝒏𝒑𝟐 ) 𝒏𝒑(𝟏 − 𝒑)
𝑠2 = = =
𝑛−1 𝒏−1 𝒏−1
3. VARIANZA DEL ESTIMADOR DE LA PROPORCION POBLACIONAL
𝜎𝑝2 = 𝜎𝑦2̅

PQ 𝑁−𝑛 PQ
𝜎𝑝2 = ( 𝑛−1 ) 𝜎𝑝2 =
𝑛 𝑛
Donde Q = 1-P
4. COEFICIENTE DE VARIACION DEL ESTIMADOR DE LA PROPORCION
POBLACIONAL 𝜎𝑃/𝑃

Q 𝑁−𝑛 1−P Q
𝜎𝑃/𝑃 = √𝑛𝑃 ( 𝑛−1 ) 𝜎𝑃/𝑃 = √ 𝑛𝑃 = √𝑛𝑃

5. ESTIMADOR DE LA VARIANZA DEL ESTIMADOR DE P: 𝑉̂ (𝑃̂)


p(1−p) 𝑁−𝑛 p(1−p)
𝑠𝑝2 = ( 𝑛−1 ) 𝑠𝑝2 =
𝑛−1 𝑛−1

6. ESTIMADOR DEL COEFICIENTE DE VARIACIÓN DEL ESTIMADOR DE


P

̂ (𝑃̂) = √ (1−p) (𝑁−𝑛)


𝐶𝑉 ̂ (𝑃̂) = √ (1−p)
𝐶𝑉
(𝑛−1)𝑝 𝑛 (𝑛−1)𝑝

7. ESTIMADOR DEL TOTAL DE UNIDADES QUE POSEE EL ATRIBUTO O


TOTAL POBLACIONAL.
𝑎
𝐴̂ = 𝑁𝑝 = 𝑁
𝑛
8. VARIANZA DEL ESTIMADOR DEL TOTAL

𝑃𝑄 𝑁−𝑛 𝑃𝑄
𝑉(𝐴̂) = 𝑁 2 𝑛 ( 𝑁−1) 𝑉(𝐴̂) = 𝑁 2 𝑛

9. ESTIMADOR DE LA VARIANZA DEL ESTIMADOR DEL TOTAL

̂𝑉 (𝐴̂) = 𝑁 2 𝑝𝑞 (𝑁−𝑛) ̂𝑉 (𝐴̂) = 𝑁 2 𝑝𝑞


𝑛−1 𝑁 𝑛−1

3. ESTIMACIÓN INTERVALICA

1
𝑝 ± [𝑍∝/2 𝜎𝑝 + ]
2𝑛
𝑛
Donde: 𝑓 = 𝑁
𝑍∝/2 Valor correspondiente a la probabilidad del nivel de confianza
𝜎𝑝 Desviación estándar de la proporción
1/2𝑛 Factor de corrección por continuidad
4. CARACTERISTICAS:
1.- La proporción muestral es un estimador insesgado de la proporción poblacional, es
decir, 𝐸(𝑝) = 𝑃, Entonces p es insesgado de P.
𝑁−𝑛
2.- Cuando la población es muy grande con relación a la muestra; tiende a la
𝑁
𝑝𝑞
unidad, luego ̂𝑉 (𝑝) = 𝑛−1
Es decir, cuando el muestreo es sin reemplazo, pero la muestra es pequeña con respecto
a la población se asume el muestreo como si fuera con reemplazo a manera de
simplificar los cálculos.
Además, en la práctica se emplea como estimador de la varianza del estimador de P a la
𝑝𝑞
expresión anterior pero con denominador el tamaño de muestra, es decir, ̂𝑉 (𝑝) = 𝑛

EJERCICIOS EN VARIABLES CUALITATIVAS


Ejemplo: De un marco muestral de N= 600 viviendas distribuidas en los 30 sectores de
nuestro ejemplo anterior; se selecciona una muestra aleatoria de n = 20 viviendas,
encontrándose que solo algunas viviendas disponían de baño para visitas. Las viviendas
correspondientes se dan en el siguiente cuadro:

Sector Nº 2 5 6 8 9
Vivienda Nº 1 5 14 18 13
Tamaño Yi 6 4 5 5 5
a. Estime la proporción de viviendas con baño para visitas
b. Estimar el numero de viviendas que tienen baño para visitas
c. Estimar la desviación estándar de los estimadores anteriores.
d. Estimar el Intervalo de confianza del 95% de seguridad para la proporción
poblacional
Solución
a. Proporción de viviendas con baño para visitas.

𝑎 5
̂=p=
P = = 0.25 = 25%
𝑛 20
Es decir, que de cada 4 viviendas 1 tiene baño para visitas.
b. Numero de viviendas que tienen baño para visitas.

𝐴̂ = 𝑁𝑝 = 600(0.25) = 150 viviendas


c. De la Proporción:
𝑛 20
𝑓= = = 3.3% < 10% , 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠:
𝑁 600

𝑝𝑞 (0.25)(0.75)
̂𝑉 (𝑝) = = = 0.00986842
𝑛−1 19
De donde:

𝑠(𝑝) = √0.00986842 = 0.099339


c.2 Del total de unidades o total poblacional:
𝑝𝑞
̂𝑉 (𝐴̂) = ̂𝑉 (𝑁𝑝) = 𝑁 2 ̂𝑉 (𝑝) = 𝑁 2 = (600)2 (0.00986842) = 3,552.6312
𝑛−1
De donde:
𝑠(𝐴̂) = √3,552.6312 = 59.6 = 60 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎𝑠
d. Intervalo de confianza:
Como f, tiende a cero, entonces:

𝑝𝑞 1
𝑝 ± [𝑍∝/2 √ + ]
𝑛 − 1 2𝑛

1
0.25 ± [1,96(0.099339) + ]
40

0.25 ± 0.2197
Luego:
3% < 𝑃 < 47%

Vous aimerez peut-être aussi