Vous êtes sur la page 1sur 116

Mtodos Estadsticos Varela/Llanos/Asnate

CAPITULO I
INTRODUCCIN AL MUESTREO
1. 1 INTRODUCCIN.
Muestreo es el proceso por el cual se realiza inferencias a la poblacin
examinando una parte de ella; este proceso es aplicable en nuestra vida
personal y cotidiana as por ejemplo una pareja contrae matrimonio en
base a un corto enamoramiento, con un simple grano de arroz el ama de
casa prueba si todo el arroz esta cocinado en un recipiente, probando el
caf contenido en una cucharadita se determina la calidad de la marca
del caf, los dosajes y anlisis clnicos (sangre, orina, etc.) Se realizan
en base a muestras, una muestra de roca lunar proporcionan informacin
cientfica sobre el origen de la luna, una zona turstica de un pas
muestra lo atractivo de una parle turstica de dicho pas y as diferentes
aspectos de la vida, cultura y ciencia son investigados en base a
muestras.

El propsito del muestreo es proporcionar diferentes tipos de


informacin estadstica de naturaleza cuantitativa y cualitativa del todo
mediante el examen o anlisis de un poco de unidades seleccionadas.

El mtodo muestral es el procedimiento cientfico de seleccin de


unidades muestrales las cuales proveern los estimadores requeridos con
cierto margen de seguridad.

1. 2 VENTAJAS DE MUESTREO:
El estudio de una muestra tiene ventajas potenciales en los diferentes
campos de la actividad humana e investigacin cientfica. Las ventajas
del muestreo son:

a). Costo reducido; una muestra requiere relativamente mejores


recursos para procesarla y disearla adecuadamente, as el costo de
unidad de observacin es alto en comparacin con un censo, pero el
costo total del estudio por muestreo en mucho menor cubriendo los
mismos objetivos y propsitos de la encuesta o cuestionario, debido
a que los datos se obtiene nicamente de una pequea fraccin del total
de datos u observaciones en estudio o investigacin.

1
Mtodos Estadsticos Varela/Llanos/Asnate

b). Mayor Rapidez; Un numero pequeo de observaciones puede


recolectarse y procesarse ms rpido que la informacin de un censo y
dar resultados ms oportunos.

c). Mayor Alcance; El muestreo tiene un mayor alcance frente al censo


con relacin a la variedad de informacin dado su flexibilidad
adaptabilidad, y posibilidad de estudiar la interrelacin de varios
factores en un estudio.

d). Mayor Exactitud; Los datos obtenidos con un censo o una muestra
estn sujeto a diferentes tipos de errores y sesgos, la magnitud de las
cuales depende del procedimiento particular del estudio. Sin embargo, si
el mismo procedimiento se le asigna para la muestra y el censo, la
exactitud de una muestra ser la misma, pero comparativamente con
una pequea escala de proporciones un estudio muestral posibilita
mayor exactitud por practicarse un mejor control sobre la recoleccin y
procedimiento de datos, empleo de mejor estndar con intensidad
entrenamiento y mejor equipo a los encuestadores.
d). nico Mtodo de Estudio; Se emplea en estudios donde el examen
de las unidades implican su destruccin, tales como: El estudio de la
calidad de alimentos envasados, estudio de la calidad de cohetes,
granadas y municiones, etc.

1. 3 DESVENTAJAS DEL MUESTREO:


1. Cuando se requiere informacin bsica para cada unidad,
obviamente tiene que realizarse un censo.
2. En algunos estudios de tabulaciones cruzadas donde el numero de
observaciones muestrales que caen en una cierta celda son muy
pequeos y no satisfacen los requerimientos de ciertas pruebas.
3. El error debido al muestreo tiende a ser alto en reas
administrativas pequea y de gran variabilidad, como las
observaciones en la poblacin son muy variables, las muestras que
se seleccionan difieren unas de las otras como se estudia una sola
muestra para generalizar a la poblacin, la diferencia entre el valor
dado por una muestra y valor poblacional constituye el error por
muestro en cual puede medirse estadsticamente segn el aumento

2
Mtodos Estadsticos Varela/Llanos/Asnate

del tamao de la muestra

1. 4 RELACION ENTRE LA MUESTRA Y EL CENSO

Muestra y censo en general no son competitivos en muchos casos son


complementarios.
En programacin se emplea a menudo estimaciones gruesas, estas
estimaciones serian adecuadas si frente a la falta de datos o deficiencia
en los disponibles esto se obtiene mediante estudios mustrales
integrados, donde se interrelacionan la demografa sectores econmicos
y sociales, en la etapa de implementacin de dicha programacin se
requieren datos seguros y en detalle, estos se obtendrn en base aren un
censo.

En operaciones tale como: Prueba de procedimientos censales,


ordenamientos de tems, evaluacin y control de datos procesados,
tabulaciones de variables seleccionadas o ampliadas, se aplica en
muestreo como parte integral de un censo.

1. 5 METODOS MUESTRALES.
1. Muestreo Probabilstica; Es un proceso muestral donde cada
elemento de la poblacin tiene una probabilidad perfectamente
conocida de ser incluida en la muestra, solo una muestra
probabilstica proporciona estimaciones con medida de ser
precisin.

2. Muestreo no Probabilstica; Es un proceso por el cual to se


pueden asignar objetivamente probabilidades a los elementos
seleccionados y por consiguiente no se puede determinar la
precisin de los resultados muestrales en trminos de
probabilidades.
Este muestreo puede ser: muestreo ajuicio o criterio, muestreo por
cuotas y tambin puede ser muestreo por correo (cuestionarios).

3. Muestreo a criterio o juicio; es un proceso por el cual la


seleccin de las muestras depende del criterio humano

3
Mtodos Estadsticos Varela/Llanos/Asnate

(experiencia) y no de la rigurosa aplicacin de la teora de


probabilidades por ejemplo un experto puede coger una muestra de
arroz de la parte de su cosecha para examinar su calidad puede ser
fsicamente imposible seleccionar muestras aleatoriamente dentro
del montn de su cosecha y aplicar la teora de probabilidades sin
embargo el experto puede conocer ciertos hechos relacionados con
la calidad del arroz este puede ser que todo los granos de arroz
sean uniformes es decir todos los granos de arroz presenten el
mismo peso o grosor lo cual es suficiente para conocer su calidad

4. Muestreo por cuotas; Es otro forma de muestreo a juicio en que


los sesgos que surgen del mtodo no probabilstica de seleccin de
la unidades mustrales se controlan hasta cierto huerto por la
estratificacin y el establecimiento de cuotas a cada estrato, es
decir que la poblacin se divide en grupos o estratos.

5. Muestreo o Cuestionario por Correo; Se emplea por ser de bajo


costo y facial administracin, el principal objetivo a este muestreo
es el sesgo causado por el no retorno de cuestionarios, lo cual para
superarlo se propone combinar el cuestionario por correo con la
entrevista personal, en los estudios de opinin y de mercado se
emplea estos tipos de muestreo generalmente. Tambin en
investigaciones tursticas.

1.6. DEFINICIN DE TERMINOS.


1. Unidad Elemental o simplemente unidad; es el elemento del
cual se requiere informacin (persona, familia, vivienda, etc.).

2. Poblacin; es el conjunto de todas las unidades que se van


analizar o estudiar; la poblacin debe ser definido en su extensin
y tiempo.

3. Marco Muestral; es el documento (lista, fichero, libreta, etc.).


Donde se consigna individualmente la unidades mustrales, de
modo que se puedan sortear todo los elementos de la muestra esta
documento es indispensable cuando se aplica muestreo

4
Mtodos Estadsticos Varela/Llanos/Asnate

probabilstica. El marco muestral debe estar perfectamente


actualizado sin omisiones de ningn tipo Ejemplo parco los
ciudadanos los registros electorales son importantes para
selecciono- los miembros de las cedillas electorales, para hogares
y viviendas en el ministerio de vivienda existen cedillas especiales
que sirven de informacin para el Instituto Nacional de Estadstica.

Para las empresas tursticas, empresas de produccin y


establecimientos industriales el melar marco para la muestra a este
respecto lo da el registro que lleva al da las caractersticas de la
razn social (SUNAT, Registro Pblicos).

1.7. TIPOS DE MUESTREO PROBABILISTICO.


1. Muestreo Aleatorio Simple. Es un procedimiento de seleccin de
una muestra por el cual todos y cada uno de los elementos de la
poblacin tienen una oportunidad igual e independiente de ser
incluidos en la muestra adems si se toma la muestra de tamao
n cualquier muestra posible de n elementos tiene la misma
probabilidad de ser extrada que cualquier otra combinacin de n
elementos.

Ya que la muestra se selecciona con o sin reposicin, una muestra


aleatoria simple se extrae por seleccin aleatoria empleando
nmeros aleatorios o colocando los elementos de la poblacin
numerados del 1 a N elementos

2. Muestreo estratificado.
Es un mtodo que trata de disear una muestra ms eficiente que la
que se tiene por un procedimiento simple, el muestreo estratificado
requiere que la poblacin este dividida en grupos homogneas o
clases llamadas estatus. Para seleccionar muestras se toman de
cada uno de los estratos y hacer las respectivas estimaciones de los
parmetros mas usados: Promedio, Desviacin estndar o
desviacin tpica, o error tpico, coeficientes de variacin y otros.

3. Muestreo Sistemtico:

5
Mtodos Estadsticos Varela/Llanos/Asnate

El muestreo sistemtico es otra forma de seleccionar n


elementos de una poblacin de tamao N, donde se seguir un
orden pre establecido es decir tomando elementos cada cierto
nmero constante de espacios o cada cierto nmero de elementos,
puesto que las unidades para este tipo de muestreo deben estar
ordenadas o factibles de ser ordenados, su aplicacin generalmente
es en estudio de archivos, estudio de clientes, etc.

4. Muestreo de Conglomerados.
Se refiere al procedimientos se refiere al procedimiento de dividir a
la poblacin en grupos o conglomerados de unidades o elementos
de la poblacin y se extrae muestras de conglomerados que
representen a la poblacin cuando se observan todas las unidades
elementales en las agrupaciones mustrales se conoce como el
nombre de muestreo monoetapico, cuando se extrae una muestra
de todas las agrupaciones se conoce con el nombre de bietapico en
ambos procedimientos tambin se muestrea aleatoriamente.

5. Muestreo por reas.


El muestreo por reas es un procedimiento practico por reas de
listado que proporciona hueros marcos para seleccionar diferentes
zonas: viviendas, zonas tursticas, zonas residenciales, etc. El
muestreo por reas tambin se emplea para seleccionar muchas
clases de muestras: tiendas, granjas, flora, fauna, cosechas, otras;
Aunque que por su movilidad agrega huevas complicaciones.
El muestreo por reas constituye un marco conveniente y efectivo
para las viviendas y las personas, esto se debe a varias razones.
a) El empleo de mapas permite identificar claramente a toda la
poblacin de viviendas (conglomerados).
b) Esta identificacin posee permanencia, durante el periodo de
encuesta a partir del momento de listado.
c) El trabajador de campo con rapidez y claridad las fronteras de
manzanas y segmentos, y a las viviendas dentro de ellos.
d) La vivienda sirve de medio conveniente para el muestreo de
personas, puesto que se identifica con facilidad, es relativamente
estable, suele contener pocas personas, y se pueden identificar, de

6
Mtodos Estadsticos Varela/Llanos/Asnate

manera nica, a toda persona con una sola vivienda. En


consecuencia, la vivienda sirve de unidad de muestreo nica e
identificable para un conglomerado pequeo de personas, y de
otras poblaciones que puedan asociarse fcilmente con las
viviendas.

1.8. MUESTREO E INVESTIGACIONES MUESTRALES.


Las pginas anteriores se han dedicado a la variedad de tcnicas que
pueden aplicarse en la descripcin y anlisis de las observaciones. En el
presente capitulo nos interesamos por algunos de los problemas que se
presenten en la recogida de informacin estadstica, hablamos que los
grandes avances efectuados en las ltimas dcadas en cuando a la
cantidad y alcance de las informaciones (datos a investigarse en los
diferentes aspectos: Negocios, problemas sociales, problemas pblicos y
gubernamentales). El conocimiento estadstico proporciona los mejores
bases para tomar las muestras en las investigaciones y luego tomar ti
respectivas decisiones.
Por eso muestro inters tambin es en el campo demogrfico de las
poblaciones humanas. Por eso el proceso del analices estadstico
descansa en la inferencia estadstica, muestreo estadstico e
investigacin cientfica. Al exponer la teora de las distribuciones en el
muestreo y de los errores de muestreo los cientficos e investigadores
sientan las condiciones de las probabilidades y sus aplicaciones en el
muestreo. Como la aplicacin de los mtodos de la probabilidad para
optimizar las investigaciones.

7
Mtodos Estadsticos Varela/Llanos/Asnate

TRMINOS BSICOS
PARAMETROS POBLACIONALES
El PARAMETRO es una funcin de los valores de todas las N unidades
de la poblacin. Este valor es nico, constante y por lo general
desconocido.
Entre los parmetros ms usuales tenemos:

MEDIA POBLACIONAL
Es la media aritmtica de los valores de la variable poblacional en
estudio. Se obtiene dividiendo el total poblacional por el nmero de
unidades de la poblacin. Se denota por Y o X . As:
Y X
Y= X=
N N
VARIANZA POBLACIONAL
Llamamos varianza poblacional a la variabilidad de los valores de la
variable en estudios en la poblacin y es medida por la media aritmtica
del cuadrado de las desviaciones de las observaciones poblacionales con
respecto a su media.
Se denota por y2 as:
1 N
2y = (Yi-Y) 2
N i=1

A esta varianza se le denomina VARIANZA TEORICA por su empleo


en demostraciones de tipo terico, pero como su estimador es
SESGADO se ha credo conveniente modificarla a fin de obtener un
estimador INSESGADO, resultando as la VARIANZA PRCTICA,
denotada y definida por:

1 N
S2Y = (Yi-Y) 2
N-1 i=1

La diferencia con la varianza terica est en el denominador, luego:

1
La raz S2Y = 2Y cuadrada positiva de la varianza se denomina
N-1
8
Mtodos Estadsticos Varela/Llanos/Asnate

DESVIACIN ESTANDAR POBLACIONAL y se denota por


Y sY .
COEFICIENTE DE VARIACIN
Para medir la variabilidad poblacional independiente de las unidades de
medicin. Se obtiene al dividir la desviacin estndar poblacional por la
media poblacional. Se denota por CV. As:
Y
CV(Y)=
Y

Generalmente se expresa como porcentaje. El cuadrado del CV se


denomina VARIANZA RELATIVA.
Con el CV es posible comparar la variabilidad de diferentes unidades.
Ejemplo, variabilidad del consumo familiar en diferentes reas y pases.

RAZN POBLACIONAL
Se obtiene dividiendo los totales o medias poblacionales
correspondientes a dos variables estudio, se denota por R,
As:
Y Y
R= =
X X

Donde X, Y, X,Y son totales y medias poblacionales de las variables


en estudio.

COVARIANZA POBLACIONAL ENTRE DOS VARIABLES


ESTUDIO
Mide la variabilidad conjunta de dos variables y se obtiene tomando la
media de los productos de las desviaciones de las observaciones con
YX o C(X, Y). As:
respecto a su media. Se denota por
1 N
C(X,Y)= YX = (Yi -Y)(X i -X)
N i=1

9
Mtodos Estadsticos Varela/Llanos/Asnate

COEFICIENTE DE CORRELACIN LINEAL POBLACIONAL


ENTRE DOS VARIABLES ESTUDIO
Mide la relacin entre dos variables y se obtiene dividiendo la
covarianza por el producto de las desviaciones estndar
correspondientes a las variables estudio. Se denota por XY .
XY
XY =
YX

El coeficiente de correlacin es un nmero puro que vara desde -1


(perfecta correlacin negativa) a travs de 0 (No existencia de
correlacin lineal) a + 1 (Perfecta correlacin positiva).

PROPORCIN POBLACIONAL
Si A unidades del total N poseen un cierto atributo o pertenecen a una
cierta categora (tal como N de viviendas que no poseen desage), la
proporcin poblacional P de tales unidades es:
A
P=
N

FORMAS DE SELECCIONAR UNA MUESTRA


1.1 MUESTRAS SIN REEMPLAZO.- Se obtiene una muestra sin
reemplazo cuando los elementos de la poblacin no se repiten en la
muestra y esto se debe a que una unidad seleccionada para integrar la
muestra no es devuelta a la poblacin.
1.2 MUESTRAS CON REEMPLAZO.- Cuando los elementos de la
poblacin se repiten en la muestra y esto se debe a que la unidad
seleccionada es devuelta a la poblacin antes de extraer otro elemento
muestral.
NUMERO DE MUESTRAS
Si el muestreo es con reemplazo
Dada una poblacin de N elementos hay Nn formas posibles de
seleccionar una muestra de tamao n.
Ejemplo: sea N = 3 hogares de los cuales seleccionamos muestras de
tamao n = 2, con reemplazo.
El nmero de muestras posibles es: Nn = 32 = 9
10
Mtodos Estadsticos Varela/Llanos/Asnate

Si denotamos por A, B y C a los tres hogares, las muestras seran:


AA, AB; AC; BA; BB; BC; CA; CB; CC
Si el muestreo es sin reemplazo:
Considerando el orden es:
N!
N(N-1)(N-2)...(N-n+1)= = N Pn
(N-n)!

En nuestro ejemplo anterior, el nmero de muestras sera:


3!
P2 = =3x2=6
3
(3-2)! Muestras

Las muestras seran:


AB; AC; BC
BA; CA; CB
Note que AB BA por el orden de los elementos
b) Sin considerar el orden:
Dada una poblacin de tamao N, el nmero de muestras de tamao n
que pueden seleccionarse sin reemplazo y sin considerar el orden es:
N! N
=
n!(N-n)! n
En nuestro ejemplo, muestras
3
=3
Las muestras seran: 2
AB, AC, BC

PROBABILIDAD DE SELECCIN DE UNA MUESTRA DE


TAMAO n
a) En muestreo con reemplazo:
La probabilidad es igual a: 1/Nn
b) En muestreo sin reemplazo:
b.1) considerando el orden

La probabilidad es igual a: 1 1
=
N Pn N(N-1)...(N-n+1)

b.2 Sin considerar el orden: 1



n!(N-n)!
N N!


11n
Mtodos Estadsticos Varela/Llanos/Asnate

La probabilidad es igual a:

PROBABILIDAD DE QUE UN ELEMENTO SE ENCUENTRE


EN LA MUESTRA.
a) Si el muestreo es con reemplazo:
La probabilidad es con reemplazo:
La probabilidad de seleccionar un elemento especfico en la primera
ocasin es 1/N; como el 1er elemento es devuelto a la poblacin, la
probabilidad de seleccionar el 2do elemento tambin es 1/N y as para
cualquier elemento especfico en cada una de las n ocasiones. Luego.
La probabilidad de que un elemento sea incluido en una muestra de
tamao n ser:
1/N + 1/N + +1/N = n/N
b) Si el muestreo es sin reemplazo
La probabilidad de seleccionar un elemento especfico en la 1era
extraccin es 1/N.
En la segunda extraccin, la probabilidad ser igual a la probabilidad
que sea seleccionado en la 2da extraccin; esto es:
N-1 1 1
=
N N-1 N

La probabilidad que un elemento especfico sea seleccionado en la 3era


extraccin es igual a:
Prob. que no sea seleccionada en Prob. que no sea Prob. que no sea
la 1ra x seleccionada en seleccionada en
la 2da x la 3ra

N-1 N-2 1 1
= =
N N-1 N-2 N

y as sucesivamente para n extracciones. Por consiguiente: la


probabilidad de que un elemento sea incluido en una muestra de tamao
n ser n/N.
Nota: La probabilidad de que un elemento de la poblacin se encuentra
en la muestra es igual a n/N tanto para muestreo con y sin reemplazo.

12
Mtodos Estadsticos Varela/Llanos/Asnate

MUESTREO ESTRATIFICADO
1. INTRODUCCION.
En ocasiones la poblacin que se va a investigar se fracciona o
subdivide en grupos de caractersticas similares, En cada subdivisin la
poblacin tiende a ser ms homognea que en la poblacin original y
esto contribuye a la exactitud del proceso de muestreo. Las
subdivisiones de la poblacin forman una particin, de manera que cada
unidad pertenece a una y slo una subdivisin y la unin de todas ellas
conforman la poblacin..En cuanto al mtodo de seleccin y en parte al
de estimacin, a cada una de las subdivisiones se le trata en forma
independiente, aunque el mtodo de estimacin las unir en forma
global. A un esquema de este tipo se le conoce como MUESTREO
ESTRATIFICADO y a cada subdivisin trabajada de manera
independiente se le denomina ESTRATO.

Para obtener bases para la estratificacin, la poblacin original


a investigarse debe de ser estudiada cuidadosamente; una buena
estratificacin ayuda aumentar la precisin de la investigacin realizada
con una muestra. As, por ejemplo, la poblacin del Per se compone de
hombres, mujeres y nios de diferentes edades, grupos sociales y
ocupaciones. Estas caractersticas pueden influir en los puntos de vista
de las personas acerca del objeto de la investigacin y es posible por lo
tanto, formar estratos con personas de caractersticas similares, de tal
manera que su opinin pueda evaluarse con mayor precisin.

Si seleccionamos una muestra aleatoria dentro de los estratos


definidos ,el muestreo se denomina MUESTREO ALEATORIO
ESTRATIFICADO(st) y tiende a ser ms seguro que el muestreo
aleatorio simple ya que las caractersticas significativas de la. Poblacin
quedan representadas adecuadamente en los diferentes estratos.

Una muestra aleatoria simple puede de hecho, convertirse en la


composicin correcta de unidades de muestreo, tomadas de los diversos
estratos de una poblacin pero esto NO puede suponerse en todos los
casos. Los ERRORES DE MUESTREO, que, resultan de una muestra
aleatoria-simple sern mayores que los de una muestra-aleatoria

13
Mtodos Estadsticos Varela/Llanos/Asnate

estratificada del mismo tamao .Esto sucede porque cuando se toma una
muestra por el mtodo aleatorio simple hay que considerar dos clases de
errores: los que se encuentran DENTRO de cada estrato y los que hay
ENTRE dos estratos diversos. Por ejemplo, la gente que se halla en
determinado grupo socioeconmico puede tener perfectamente otro
punto de vista diferente del que tienen los que estn en otro grupo.
Adems, es probable que haya algunas diferencias de opinin DENTRO
de cada grupo socio econmico

Dado que las caractersticas de los estratos de la muestra


corresponden a las de la poblacin, la variacin entre los estratos ya se
tiene en cuenta cuando usamos. El muestreo aleatorio estratificado.

Como se anot antes, el proceso de seleccin aleatoria slo


tiene lugar despus de la estratificacin; por eso, los errores de muestreo
slo pueden surgir de una fuente, esto es, de dentro de los estratos. Por
lo tanto la estratificacin es ms efectiva cuando la-MAYOR PARTE DE
LA VARIACION de la poblacin es causada por la variacin entre los
estratos. Los estratos deben por consiguiente, disearse de tal manera
que difieran significativamente uno de otro y la poblacin dentro de
cada estrato debe ser tan homogneo como sea posible. De esta manera
los beneficios de la estratificacin se explotan completamente.

2. RAZONES RARA ESTRATIFICAR


El muestreo estratificado es ampliamente empleado por varias razones,
entre ellas tenemos:
a) Cuando se desea estimaciones por separado para cada
subdivisin de la poblacin, tales como cuando en una investigacin
sobre viviendas se requiere informacin para grupos sociales diferentes
o para grupos econmicos tambin diferentes.
b) Por conveniencias de tipo administrativo. As por ejemplo:
i) Un Centro de Investigacin que tiene a cargo una encuesta y
que cuenta con filiales en los diferentes departamentos del Pas, puede
subdividir la poblacin de manera que cada una de ellas pueda
supervisar la encuesta en el mbito correspondiente.

14
Mtodos Estadsticos Varela/Llanos/Asnate

ii) Para una investigacin gubernamental, el Pas puede


estratificarse por razones de costo y otras conveniencias, en regiones
geogrficas, tal como Costa, Sierra y Selva para las cuales el gobierno
tiene una determinada infraestructura administrativa.
c) Cuando para cada tipo de subpoblacin hay problemas
muestrales especficos. As por ejemplo, s se desea estimar las ventas
de los establecimientos comerciales, se pueden estratificar de acuerdo al
volumen de ventas, o rea que ocupa el local o nmero de empleados.
d) Para lograr ganancia en precisin en los estimadores de las
caractersticas poblacionales. Una poblacin heterognea se subdivide
en subpoblaciones homogneas, en donde las unidades varan muy poco
de una unidad a otra, logrando de esta manera decisin con una muestra
muy pequea en cada estrato. La ganancia en precisin es superior a la
del muestreo aleatorio simple.

3 . NOTACIONES:
h : Denota el estrato ( h = 1, ... L)
i : Denota la unidad dentro del estrato
L : Denota el nmero de estratos.
Nh: Nmero de unidades en el estrato h o tamao de estrato.
nh : Nmero de unidades de la muestra seleccionada en el estrato h o
tamao de muestra en el estrato h.
yhi: indica el valor de la i-sima unidad observada en el estrato h

Nh
Wh = : Ponderacin del estrato h en la poblacin
N

nh
fh = : Fraccin de muestreo en el estrato h
Nh
Nh

Y
i=1
hi
Yh = : Media del estrato "h"
Nh

15
Mtodos Estadsticos Varela/Llanos/Asnate

nh

y hi
yh Meda de la muestra del estrato h (Estimador
nh
insesgado de Yh )
Nh

(Y hi Y h )2
Sh2 Varianza Prctica del estrato h
Nh 1
nh

(y hi y h )2
sh2 Varianza de la muestra en el estrato h.
nh 1
Y h Nh y h Estimador insesgado del Total del Estrato h

4. ESTIMADORES
A.-ESTIMADOR DE LA MEDIA POBLACIONAL ( y st )
El estimador de la media poblacional en el muestreo estratificado es:
L L

Y h N h yh
y st
N N
Donde:
yh : Media de la muestra en el estrato "h"

N = Nl +.+ NL : Tamao de la poblacin

st : denota Muestreo Estratificado.


B. ESTIMADOR DEL TOTAL POBLACINAL
Si se desea estimar el valor total de una caracterstica usando muestreo
estratificado, empleamos la siguiente expresin:
Yst N y st

16
Mtodos Estadsticos Varela/Llanos/Asnate

C. ESTIMADOR DE LA RAZON POBLACIONAL


Si el valor de dos variables estudio para la i-sima unidad (i=
l,..N ) en el h-simo estrato es denotada por Yhi y Xhi respectivamente, el
estimador de la razn poblacional es dado por:
Y
R st
NOTA. X st
1) Los estimadores del. Total y de la medid poblacional son insesgados.
2) El estimador de razn poblacional es consistente pero sesgado.
3) Los estimadores del total, la media y la razn son los mismos para
muestreo sin y con remplazamiento.
A medida de resumen presentamos el cuadro siguiente:
TOTAL, MEDIA Y RAZON DE DOS TOTALES POBLACIONALES Y
SUS; ESTIMADORES
Para el h-simo estrato Para la poblacin
Parmetro Parmetro Estimador
Estimador (c) (d)
(a) (b)
Para una
variable Nh L L
estudio
i 1

Yh Yhi ; Yh N h y h Y Yh ; yst Yh Yst
h 1

h 1
TOTAL

MEDIA Yh Y
Yh ; yh Y ; yst / N Yst / N
Para una Nh N
variables
estudio Yh y
RAZON Rh ; rh h R
Y
; R st Yst / X st rst
DE Xh xh X
TOTALE
S

17
Mtodos Estadsticos Varela/Llanos/Asnate

PROBLEMAS RESUELTOS
1.- En una poblacin con N = 6, A = 4 y A = 2, calcular el valor de a
para todas las posibles muestras simples aleatorias de tamao 3.
a) Verificar los teoremas dados para la media y la varianza.
b) Verificar que:
N n
pq Es un estimador insesgado de la varianza de p.
( n 1) N
Solucin
a) Si el muestreo es sin reemplazo el nmero total de muestras a
seleccionar ser:
N 6
20
n 3
A 2 A
P ; Q 1/ 3
N 3 N
Ahora, sea A1, A2, A3, A4 los elementos de A y B1, B2 los elementos de
A, entonces tenemos:
Muestras a p q Pq (p
P2)
(1) A1A2A3 3 1 0 0 1/9
(2) A1A2A4 3 1 0 0 1/9
(3) A1A2B1 2 2/3 1/3 2/9 0
(4) A1A2B2 2 2/3 1/3 2/9 0
(5) A1A3A4 3 1 0 0 1/9
(6) A1A3B1 2 2/3 1/3 2/9 0
(7) A1A3B2 2 2/3 1/3 2/9 0
(8) A1A4B1 2 2/3 1/3 2/9 0
(9) A1A4B2 2 2/3 1/3 2/9 0
(10) A1B1B2 1 1/3 2/3 2/9 1/9
(11) A2A3A4 3 -1 0 0 1/9
(12) A2A3B1 2 2/3 1/3 2/9 0
(13) A2A3B2 2 2/3 1/3 2/9 0
(14) A2A4B1 2 2/3 1/3 2/9 0
(15) A2A4B2 2 2/3 1/3 2/9 0
(16) A2B1B2 1 1/3 2/3 2/9 1/9
(17) A3A4B1 2 2/3 1/3 2/9 0
(18) A3A4B2 2 2/3 1/3 2/9 0
(19) A3B1B2 1 1/3 2/3 2/9 1/9
(20) A4B1B2 1 1/3 2/3 2/9 1/9
40/3 32/9 8/9

18
Mtodos Estadsticos Varela/Llanos/Asnate

b) b.1.-
E( p) pi Pr ob( pi) (40 / 3)(1/120) 2 / 3 P
Luego: E (p) = P
b.2.-
V ( p) ( pi P)2 Pr ob( pi) ( pi P)2 (1/ 20)
= (8/9) (1/20) =
2/45
Por otra parte:
PQ N n (2 / 3)(1/ 3) 6 3
(2 / 27)(3 / 5) 2 / 45
n N 1 3 5

Luego: PQ N n

n N 1
N n (6 3)
c) E ( s 2p )
(n 1) N
E ( pq)
(3 1)6
pi qi Pr ob( Pq
i i)

(3/12) pi qi (1/ 20)


= (3/12) (1/20) (32/9) = 2/45 = V(p)
2
Luego, s p es un estimador insesgado de V (p).

2.- En una muestra simple aleatoria de 200 obtenida de una poblacin


de 2000 colegios, 120 de stos estuvieron a favor de una propuesta, 57
se opusieron y 23 se abstuvieron de opinar. Estimar los lmites de
confianza al 95% para el nmero de colegios en la poblacin que
favorecieron la propuesta.
Solucin:
Proporcin de colegios a favor de la propuesta:
p = a/n = 120/200 = 0.6
Lmites de confianza para P, usando la aproximacin normal:
p Z ( N n) / N pq / n 1 1/ 2n

0.6 1.96 (1 200) / 2000 0.6(0.4) /199 1/ 400


0.6 0.0669
19
Mtodos Estadsticos Varela/Llanos/Asnate

De donde: LSp = 0.6669 LIp = 0.5331


Luego los lmites de A en la poblacin sern:
LSA = NLSp = 2000(0.6669) = 1334
LSA = NLSp = 2000(0.5331) = 1066
Por consiguiente, con el 95% de confianza, el nmero de colegios a
favor de la propuesta se encuentra entre 1,066 y 1334.

3.- En los resultados de la muestra anterior se obtiene una evidencia


contundente de que la mayora de los colegios en la poblacin
favorecieron la propuesta.
Solucin:
a. Hiptesis Estadstica:
Ho P = 0.5
Ha P = 0.5
b. Nivel de significancia:
= 0.05
c. Distribucin para la prueba: Distribucin normal
d. Funcin Pivotal:
pP
z
sp
e. Valor Experimental:
0.6 0.5
zo 3.039
0.0329
Donde:
N n
s 2p pq
(n 1) N
2000 200
(0.6)(0.4)
(200 1)2000
= 0.00108
Luego: sp = 0.0329
f.- RR y RA de Ho
RA/Ho: Si z < 1.64 se acepta Ho
RA/Ho: Si z > 1.64 se acepta Ho
g. como zo pertenece a la RR/Ho, entonces se acepta H1

20
Mtodos Estadsticos Varela/Llanos/Asnate

h. Conclusin: La mayora de los colegios estn a favor de la


propuesta.
Nota: Z = 3.039 le corresponde una probabilidad de 0.0012, o sea que la
prueba es casi concluyente; pues se acepta Ha con el 0.12% de
participacin del azar.

4.- Una poblacin con N = 7 consiste de los elementos de M 1, C1, C2,


C3, D1, D2 y D3. Se toma una muestra simple aleatoria de tamao 4 con
el fin de estimar la proporcin de C respecto a C + D.
a) Calcule las distribuciones condicionales de esta proporcin, p.
b) Verifique la frmula de su varianza condicional.
Solucin:
a)
Clase Ai Unidades
1 1 M1
2 3 C1, C2, C3
3 3 D1, D2, D3
Donde: N = 7 y N = C + D = 3 + 3 = 6
Ahora, con n = 4 deseamos estimar:
A2 C 3 1
P
A2 A3 C D 3 3 2
7
En general existen 35 muestras diferentes de tamao 4 y las
4
cuales son:
M1C1C2C3 M1C1C2D1 M1C1C2D2 M1C1C2D3 M1C1C3D1
M1C1C3D2 M1C1C3D3 M1C2C3D1 M1C2C3D2 M1C2C3D3
M1C1D1D2 M1C1D1D3 M1C2D1D2 M1C2D1D3 M1C3D1D2
M1C3D1D3 M1C1D2D3 M1C2D2D3 M1C3D2D3 M1D1D2D3
C1C2C3D1 C1C2C3D2 C1C2C3D3 C1C2D1D2 C1C2D1D3
C1C2D2D3 C1C3D1D2 C1C3D1D3 C1C3D2D3 C2C3D1D2
C2C3D1D3 C2C3D2D3 C1D1D2D3 C2D1D2D3 C3D1D2D3

Distribucin condicional, para n = 3:

21
Mtodos Estadsticos Varela/Llanos/Asnate

A2 A3 A2 A3
P (a2/A2, A3, n, n) = /
a2 a3 a2 a3
3 3 6
P (3/3, 3, 4, 3) = / = 1/20
3 0 3
3 3 6
P(2/3, 3, 4, 3) = / = 9/20
2 1 3
3 3 6
P(1/3, 3, 4, 3) = / = 9/20
1 2 3
3 3 6
P(0/3, 3, 4, 3) = / = 1/20
0 3 3
Distribucin condicional para n = 4
3 3 6
P(3/3, 3, 4, 4) = / = 1/5
3 1 4
3 3 6
P(2/3, 3, 4, 4) = / = 3/5
2 2 4
3 3 6
P(1/3, 3, 4, 4) = / = 1/5
1 3 4
b) Para n = 3 y donde
a2 = N de elementos muestrales que pertenecen a C
a3 = N de elementos muestrales que pertenecen a D
P = 3 / (3+3) = 1/2
b.1.- E ( p) 1x10 (2 / 3)(9 / 20) (1/ 3)(9 / 20) (0)(1/ 20)
1/2
Luego, E(p) = P
b.2.- p2 ( p P)2 Pr ob. Cond.
= (1/2)2 (1/20) + (1/6)2 (9/20) + (-1/6)2 (9/20) + (-1/2)2
(1/20)
= 1/20

22
Mtodos Estadsticos Varela/Llanos/Asnate

Por otra parte,


N ' n ' PQ 6 3 (3 / 6)(3 / 6)
1/ 20
N 1 n ' 6 1 3
Por consiguiente se cumple la formula:
N ' n ' PQ
p2
N ' 1 n '

CUADRO DE CALCULOS PARA n = 3


Muestras

Cond.
Prob.

(p-P)
a2

a3

M1C1C2C3 3 0 1 1/20 1/2 M1C1D1D2 2 1 1/3 -1/6


M1C1C2D1 2 1 2/3 1/6 M1C1D1D3 1 2 1/3 -1/6
M1C1C2D2 2 1 2/3 1/6 M1C2D1D2 1 2 1/3 -1/6
M1C1C3D3 2 1 2/3 1/6 M1C2D1D3 1 2 1/3 -1/6
M1C1C3D1 2 1 2/3 9/20 1/6 M1C3D1D2 1 2 1/3 9/20 -1/6
M1C1C3D2 2 1 2/3 1/6 M1C3D1D3 1 2 1/3 -1/6
M1C1C3D3 2 1 2/3 1/6 M1C1D2D3 1 2 1/3 -1/6
M1C1C3D1 2 1 2/3 1/6 M1C2D2D3 1 2 1/3 -1/6
M1C2C3D2 2 1 2/3 1/6 M1C3D2D3 1 2 1/3 -1/6
M1C2C3D3 2 1 2/3 1/6 M1D1D2D3 0 3 0 1/20 -1/2

Cuadro de clculos para n = 4


Muestras

Cond.
Prob.

(p-P)
a2

a3

C1C2C3D1 3 1 3/4 1/5 C1D1D2D3 1 3 1/4 1/5 -1/4


C1C2C3D2 3 1 3/4 1/4 C2D1D2D3 1 3 1/4 -1/4
C1C2C3D3 3 1 3/4 1/4 C3D1D2D3 1 3 1/4 11/4
C1C2D1D2 2 2 2/4 1/4
C1C2D1D3 2 2 2/4 0
C1C2D2D3 2 2 2/4 0
C1C3D1D2 2 2 2/4 3/5 0

23
Mtodos Estadsticos Varela/Llanos/Asnate

C1C3D1D3 2 2 2/4 0
C1C3D2D3 2 2 2/4 0
C2C3D1D2 2 2 2/4 0
C2C3D1D3 2 2 2/4 0
C2C3D2D3 2 2 2/4 0

Para n=4:
b.1.- E( p ) pi Pr ob. Cond . pi
= (1/5)(3/4)+(2/4)(3/5)+(1/4)(1/5) = 1/2
Luego se cumple la relacin:
E (p) = P
b.2.- V( p ) ( p P)2 Pr ob. Cond . pi
= (1/4) (1/5) + (0) (3/5) + (-1/4) (1/5) =
= 1/40
Por otra parte,

N ' n ' PQ 6 4 (1/ 2)(1/ 2)


1/ 40
N ' 1 n ' 6 1 4
Luego, la relacin:
N ' n ' PQ
V( p ) Se cumple
N ' 1 n '

5.- Se eligi una muestra aleatoria simple de 290 familias de un rea de


la ciudad conteniendo 14,828 familias. A cada familia se le pregunt si
la casa era suya o rentada y tambin si tenan el uso exclusivo de un
bao interior. Los resultados fueron como sigue.

Propietario Rentada Total


Uso exclusivo
Si No Si No
de bao
141 6 109 34 290

a) Para familias que rentan, estimar el porcentaje en el rea de


familias que cuentan con un bao interior de uso exclusivo y
24
Mtodos Estadsticos Varela/Llanos/Asnate

dar el error estndar de su estimador.


b) Estimar el nmero total de familias que rentan casa en el rea y
que no tienen un bao interior para uso exclusivo y da el error
estndar de este estimador.

Solucin
a) Estimador del porcentaje de familias en el rea, que cuentan
con bao interior de uso exclusivo:

p p a / n ' 109 /143 76.2% Con:

n ' pq 143 (0.762)(0.238)


V ( p) 1 1 0.0012648
N n ' 1 14828 142

y DE ( p ) 0.0012648 3.6%

b) Como el nmero de familias en el rea que rentan casas no es


conocido, el estimador ser:
N 14,828
A a (34) 1738 familias
n 290
Con un error estndar de:
S

A N (1 n / N )
pq
n 1
donde; p a / n 34 / 290 0.1172

(0.1172)(0.8828)
(14,828) (1 290 /14828)
289
= 14,828 (0.018735)
= 278 familias

6.- Si en el ejercicio anterior el nmero total de familias que rentan casa


en el rea de la ciudad es de 7,526, construya un nuevo estimador del
nmero de arrendatarios que no cuentan con la facilidad de un bao
exclusivo y dar el error estndar de este estimador.
25
Mtodos Estadsticos Varela/Llanos/Asnate

Solucin:
Estimador de la proporcin:
p p = 34/143 = 0.237762237 = 0.2378
Estimador del total:
A Np = 7526(0.2378) = 1,789 familias
Error estndar del estimador:
pq
sA N (1 n / N )
n 1
(0.2378)(0.7622)
= 7,526 (1 143/ 7526)
142
= 7,526 (0.99045) (0.03573) = 276.6
Luego, DE ( A ) = 268 familias

7.- En la muestra de 30 familias dada en el cuadro siguiente, se refiere al


nmero de visitas al dentista realizadas en el ltimo ao. Estimar la
varianza de la proporcin de personas que vieron a un dentista y
comparar sta con el estimador de la varianza Binomial.
Solucin:
Sea
ai, N de personas que visitaron al dentista
mi N de integrantes por familia
Luego, la proporcin de personas que visitaron al dentista ser:

p
a i
= 22/104 = 0.21154 = 21.15%
m i

Con una varianza de:


(1 f ) ai 2 p ai mi p mi
2 2 2

V ( p)
nm 2 n 1
Donde: n es el tamao de muestra de conglomerados (familias)
m es el tamao familiar promedio = m/n = 104/30
= 3.4667 personas
Como N es desconocido, asumimos que n/N tiende a 0
Luego:
26
Mtodos Estadsticos Varela/Llanos/Asnate

1 32 2(0.21154)(87) (0.21154(404)
V ( p) 2 0.00184
30(3, 46667) 29

Ahora varianza Binomial:


pq
V( p ) Donde n es el nmero de personas que consultaron al
n
dentista
(0.21154)(0.7884)
0.001603
104
Por consiguiente podemos concluir que la varianza Binomial es menor
que la hipergeomtrica.
INFORMACIN DE UNA MUESTRA SIMPLE ALEATORIA DE 30
FAMILIAS
N de N de Dr. Visto No miai a 2 mi2
i
familia persona en el ao
s s Si (ai)
mi
1 5 1 4 5 1 25
2 6 0 6 0 0 26
3 3 1 2 3 1 9
4 3 2 1 6 4 9
5 2 0 2 0 0 4
6 3 0 3 0 0 9
7 3 1 2 3 1 9
8 3 1 2 3 1 9
9 4 1 3 4 1 16
10 5 0 4 0 0 16
11 3 1 2 3 1 9
12 2 0 2 2 0 4
13 7 2 5 14 4 49
14 4 1 3 4 1 16
15 3 0 3 0 0 9
16 5 1 4 5 1 25
17 4 4 0 16 16 16
18 4 1 3 4 1 16
27
Mtodos Estadsticos Varela/Llanos/Asnate

19 3 1 2 3 1 9
20 3 0 3 0 0 9
21 4 1 3 4 1 16
22 3 0 3 0 0 9
23 3 1 2 3 1 9
24 1 0 1 0 0 1
25 2 0 2 0 0 4
26 4 0 4 0 0 16
27 3 1 2 3 1 9
28 4 1 3 4 1 16
29 2 0 2 0 0 4
30 4 0 4 0 0 16

8.- Supongamos que el coeficiente de variacin del ingreso monetario


de las granjas de pollos del lugar es del 100%. De que tamao se
requiere una muestra de granjas; si se desea un error tolerable de 5%
con una confianza del 95%; para una zona con 2,000 granjas; b) una
zona con 200, 000; c) una zona con 5000,000 granjas.
Solucin:
Z 2S 2 Z 2
Si CV = 100%, entonces S = X; luego: no
(dx)2 d 2
= (1.96)2 / (0.05)2 = 1,536.64
Ahora como no/N es mayor que el 5%, entonces corregimos. Esto es:
1,536.64
n 869 granjas
1536.64
1
2, 000
b.- Para una zona con 200,000:
no/N = 1536.64/200,000 = 0.768% que es menor del 5%
Por consiguiente n ptimo es igual a:
n = 1,537
c.- Para una zona con 5000,000 de granjas
no/N = 0.03073% que es menor del 5%
Por consiguiente, el tamao de muestra ptimo, ser igual a:
n = 1,537

28
Mtodos Estadsticos Varela/Llanos/Asnate

Nota: A mayor tamao de poblacin no corresponde mayor tamao de


muestra; esto se puede apreciar en el ejercicio. El tamao de muestra
est en relacin con el coeficiente de seguridad y la precisin.

9.- En un distrito conteniendo 4,000 casas va a ser estimado el


porcentaje de propietarios con un error estndar no mayor de 2% y el
porcentaje de familias con dos carros con un error estndar de no mas
del 1% (las cifras 2 y 1% son valores absolutos, no coeficientes de
variacin). Se piensa que el verdadero porcentaje de propietarios est
entre el 45 y el 65% y el porcentaje de familias con dos carros entre el 5
y el 10%. Que tan grande se necesita tomar la muestra para satisfacer
los dos objetivos?

Solucin
a) Para propietarios:
N n PQ
V( p ) (0.02) 2
N 1 n
Luego, el tamao de muestra ser:

i) Para P = 45%
(4000 n) (0.45)(0.55)
0.0004
3999 n
De donde
n = 535.945

ii) Para P = 65%


(4000 n) (0.65)(0.35)
0.0004
3999 n
de donde
n = 498.057

b) Para famlias de dos carros:


N n PQ
V( p ) (0.01) 2
N 1 n

29
Mtodos Estadsticos Varela/Llanos/Asnate

i) Para P = 5% = 0.05
(4000 n) (0.05)(0.95)
0.0001
3999 n
de donde
n = 424.67
ii) Para P = 10% = 0.10
(4000 n) (0.10)(0.90)
0.0001
3999 n
de donde
n = 734.84
Por consiguiente, para satisfacer los 2 objetivos se necesita tomar una
muestra de 735 casas; este tamao corresponde a familias con dos
carros y P = 10%.
10.- En una poblacin de 676 hojas de solicitud. Que tan grande debe
ser la muestra si se va a estimar el nmero total de firmas con un
margen de error de 1000 y una probabilidad de 1 en 20. se cont el
nmero de firmas por hoja en una muestra previa de 50 hojas
seleccionadas al azar (muestra del 7% aproximadamente); obteniendo
los siguientes resultados:
N de 2 2 2 1 1 1 1 1 1
42 41 36 32 9
firmas yi 9 7 3 9 6 5 4 1 0
Frecuenc
23 4 1 1 1 2 1 1 2 1 1 1 1 1
ia fi

7 6 5 4 3
1 3 2 1 1

Solucin
La varianza de la muestra es:

s2
1
fi yi2
fi yi 2 (1/ 49) 54, 497 (1471)2
50
n 1
fi

= 229

30
Mtodos Estadsticos Varela/Llanos/Asnate

Suponiendo que el valor de s2 es el valor de s2 en la poblacin, entonces


el tamao de muestra previa para el total de firmas ser:
N 2 Z 2 S 2 N 2 Z 2 S 2 (676)2 (2)2 (229)2
no 418.59
d2 d2 (1000)2
n 418.59
Ahora, como o 0.5947 0.05
N 676
Entonces, el tamao de muestra para el total ser:
no 418.59
n 258.51 259 hojas
no 1 0.5947
1
N
Por consiguiente, para estimar el nmero total de firmas se necesita una
muestra de 259 hojas.

11.- Se va a realizar una encuesta para determinar la existencia de


enfermedades comunes en una poblacin grande. Para cualquier
enfermedad que afecte cuando menos al 1% de los individuos en la
poblacin, se desea estimar el nmero total de casos, con un coeficiente
de variacin de no ms del 20%.
a) Que tamao de muestra simple aleatoria es necesaria,
suponiendo que la presencia de la enfermedad puede ser
reconocida sin equivocacin?
b) Que tamao de muestra se necesita si se desea obtener el
nmero total de casos separadamente para hombres y mujeres,
con la misma precisin.

a) El coeficiente de variacin del total es igual al coeficiente de


variacin de p; luego:

p PQ / n Q
CV( p )
P P n P
de donde:
Q 0.99
n 2
2, 475 Individuos
CV( p ) P (0.20) 2 (0.01)

31
Mtodos Estadsticos Varela/Llanos/Asnate

b) Cuando se requieren estimadores no slo para la poblacin como un


todo; sino para subdivisiones, tales como reas geogrficas, sexo o
grupos etareos de la poblacin, el tamao de muestra obtenido para
estimar los valores poblacionales con una precisin dada, debe
incrementarse dado a que se requieren estimadores para las
subdivisiones con la misma precisin como los obtenidos para la
poblacin.
Como regla general, tenemos:
Si se requieren estimadores con varianza V en cada una de las k
subpoblaciones, el tamao de muestra ser:
n' = kn
Donde n es el tamao de muestra para toda la poblacin con la misma
varianza V.
En nuestro caso, K = 2 y asumiendo que el nmero de hombres y
mujeres son aproximadamente iguales en la poblacin, obtenemos:
N = 2(2475) = 4,950 individuos.

12.- Los siguientes coeficientes de variacin fueron obtenidos en una


encuesta de predios agrcolas en la unidad fue una rea de una milla
cuadrada
Coeficiente de
Caractersticas Variacin
Estimado %
Acres en predios agrcolas 38
acres de maz 39
Acres de Avena 44
N de trabajadores de la familia 100
N de trabajadores contratados 110
Nmero de desempleados 317
Se planea una encuesta para estimar caractersticas de rea con un
coeficiente de variacin de 2,5% y -nmero de trabajadores (excluyendo
a los desempleados) con un coeficiente de variacin del 5%. Con una
muestra simple aleatoria. Cuantas unidades se necesitan? Que tambin
se supone que esta muestra estime el nmero de desempleados?
Solucin
32
Mtodos Estadsticos Varela/Llanos/Asnate

a) Conocemos que:
y / n /y CV ( y )
CV ( y ) De donde:
y y n n
2
CV ( y )
n=
CV ( y )
Luego:
i) Tamao de muestra para trabajadores:
El mximo coeficiente de variacin para trabajadores corresponde al
nmero de contratados (excluyendo a desempleados), para los cuales
CV (y) = 1.10 y como se desea CV ( y ) = 0.05; entonces:

2
1.10
n=
0.05
= 484 trabajadores

ii) tamao de muestra segn rea:


El mximo coeficiente de variacin en reas corresponde a acres en
avena con un CV (y) = 0.44 y como se desea CV (y) = 0.025, entonces:
2
0.44
n=
0.025
= 310

De i) y ii) podemos concluir que el tamao de muestra requerido, ser


de n = 484, tamao determinado por el nmero de trabajadores

b) El coeficiente de variacin para el N de trabajadores sin empleo y


para un tamao de muestra de n = 484, es:
y CV ( y ) 3.17
CV ( y ) 0.144 14.40%
y n 484
13.- Por muestreo experimental, el valor promedio de una variable
aleatoria va a ser estimado con una varianza V = (0.0005) 2. Los valores
de la variable aleatoria para las primeras 20 muestras se muestran a
continuacin. Cuntas muestras adicionales se necesitan?
N de muestra Valor de la V.A.
1 0.0725
33
Mtodos Estadsticos Varela/Llanos/Asnate

2 0.0755
3 0.0759
4 0.0739
5 0.0732
6 0.0843
7 0.0727
8 0.0769
9 0.0730
10 0.0727
11 0.0712
12 0.0748
13 0.0878
14 0.0710
15 0.0754
16 0.0712
17 0.0757
18 0.0737
19 0.0704
20 0.0723

Solucin
Sea yi el valor de la variable aleatoria, entonces:
n1 = 20 y 1.4941
i y 2
i 0.11197099
1 yi
2
2

s2 yi
2
1 0.11197099 (1.4941)
n1 1 n1 19 20

= 1.8644736 x 10-5
Luego:
s2 2 1.8644736 x105 2
n 1 7 1 82
v n1 2.5 x10 20
y por consiguiente, se necesitarn:
n n1 = 82 20 = 62 observaciones ms

34
Mtodos Estadsticos Varela/Llanos/Asnate

14.- Los colegios con programas de estudios de cuatro aos, fueron


divididos en clases de 4 tamaos diferentes de acuerdo con el nmero de
matriculados. Las desviaciones estndar de cada clase se muestran a
continuacin:
Clases
1 2 3 4
N de estudiantes < 1000 1000 - 3000 - + de
3000 10000 10,000
S 236 625 2008 10,023
Si conoce los lmites de clase pero no los valores de S, Qu tambin
puede estimar los valores de S usando cifras matemticas simples?
Ningn colegio tiene menos de 200 estudiantes y el ms grande tiene
cerca de 50,000 estudiantes.

Solucin
La relacin entre el rango (R) y la varianza de la distribucin
matemtica puede utilizarse para estimar la varianza. Deming (1,960)
dio las siguientes reglas para estimar la varianza dado el rango y si la
forma de la distribucin era conocida o supuesta.

Tipo de Desviacin Coeficiente de


Media Varianza
Distribuc. Estndar variacin
R
Binomial (p) (R) p(1-p)/R2 (1 p) / p
Rectangular (1/2)R R2/12
p(1 p)
0.58
Triangular I (1/3)R R2/18 0.29R
0.71
Tringulo II (2/3)R R2/18 0.24R
0.35
Normal (1/2)R R2/36 0.24R
1/3
R/6

Si asumimos una distribucin rectangular en cada estrato, el rango (R) y


la desviacin estndar = 0.29 R se dan a continuacin:

Tamao de clase de colegios


1 2 3 4
N de estudiantes 200 - 1000 - 3000 10,000-
35
Mtodos Estadsticos Varela/Llanos/Asnate

1000 3000 10000 50000


Rango (R) 800 2,000 7,000 40,000
A) Actual 236 625 2,000 10,023
B) Estimada 232 580 2,030 11,600
(0.29R)

Si asumimos una distribucin normal en cada estrato la desviacin


estandar ser:

Tamao de clase de colegios


1 2 3 4
N de estudiantes 200 - 1000 - 3000 10,000-
1000 3000 10000 50000
Rango (R) 800 2,000 7,000 40,000
A) Actual 236 625 2,000 10,023
B) Estimada (R/6) 133 333 1,167 6,667
Si asumimos una distribucin tringulo en cada estrato la desviacin
estndar ser:

Tamao de clase de colegio


1 2 3 4
N de estudiantes 200 - 1000 - 3000 10,000-
1000 3000 10000 50000
Rango (R) 800 2,000 7,000 40,000
A) Actual 236 625 2,000 10,023
B) Estimada (R/6) 192 480 1,680 9,600
Nota. La distribucin tringulo es de tipo I y Tipo II

APLICACION DEL MUESTREO ALEATORIO SIMPLE.

Se desea estimar la remuneracin promedio de las Trabajadores del


Sector Educacin-provincia de Huaraz-con 10 a 20 aos de servicios
institucionales a Diciembre de 2007.Determinar:
i) El tamao de muestra adecuado.
ii) Seleccionar los elementos muestrales
36
Mtodos Estadsticos Varela/Llanos/Asnate

iii) Obtener las Estimaciones correspondientes a la poblacin descrita.


Solucin
I.- DETERMINACION DEL TAMAO DE MUESTRA
ADECUADO.
Asumiendo que la poblacin es grande, debemos aplicar la frmula
Sgte:
2 2
ZS ZS
no = Tamao de muestra preliminar o
d %X
correspondiente al muestreo con REMPLAZO

Donde X y S son el promedio .y la desviacin estndar de las


remuneraciones a Diciembre de 1,987; datos que pueden obtenerse en
las tres formas Sgtes:

1.1. EN BASE A DATOS ANTERIORES:


En la Oficina de Planeamiento, segn documento interno de trabajo se
tiene que la remuneracin promedio de los elementos de la poblacin, a
JULIO de 1,987 fue aproximadamente de:
X J = 3,209 Intis con SJ = 242 Intis
Conocedores que a Diciembre del mismo ao el gobierno ha otorgado
aumento de haberes en aproximadamente el 30% de la remuneracin
total; el promedio y. la desviacin estndar necesarios para determinar
el tamao de muestra seria:
X D =M (1.30 XJ ) = 1.30 M(XJ) = 1.30(3209) = 4172 Intis
SD = DE (1.30 XJ). = 1.30 DE (XJ) = 314.6 = 315 Intis.
donde XJ : Remuneracin a Julio ; M(XJ) :Promedio de las
remuneraciones a Julio.
Luego, el TAMAO DE MUESTRA PRELIMINAR para una
seguridad' del 95% (Z=1.96) y una precisin del 5% de la remuneracin
promedio (error relativo) sera:
2 2
1.96 x315 617.4
n0 9
0.05 x 4172 208.6
para una precisin del 3% de la remuneracin promedio sera:

37
Mtodos Estadsticos Varela/Llanos/Asnate

2 2
1.96 x315 617.4
n0 24
0.03 x 4172 125.16
para una precisin del 2% de la remuneracin promedio sera:
2 2
1.96 x315 617.4
n0 55
0.02 x 4172 83.44
Ahora, suponiendo que dispongo aproximadamente de una semana para
presentar el informe y que por lo limitado de los recursos econmicos,
solo dos personas pueden dedicarse a recolectar los datos; no queda otra
alternativa que asumir la muestra de tamao n = 24 esto es, con una
precisin o error tolerable del 3%.
NOTA.- Si asumiera el tamao de muestra n = 55; esto es con un error
tolerable del 2%, el tiempo para presentar el informe sera rebasado.
Veamos:
1 persona como mximo realiza 4 encuestas diarias; luego 55 encuestas
se realizar en 14 das aproximadamente. S se emplean dos
encuestadores, se realizarn en 7 das.
Como podemos apreciar slo el recojo de, datos, abarca la semana
disponible, faltando el procesamiento de datos y la confeccin del
informe final.
La confrontacin del tiempo disponible y el de ejecucin de encuesta
me conduce a descartar la precisin del 2% de la remuneracin.

I.2.- CRITERIO DEL RANGO


Bajo el supuesto que la poblacin es grande, las observaciones
poblacionales seguirn una distribucin normal con:
X = R/2 y S = R/6, donde R = LS - Li
NOTA: Para obtener los lmites es conveniente recurrir a algunos
elementos de la poblacin o a personal que trabaja muy cerca de los
individuos de los cuales se requiere informacin.
En nuestro ejemplo; consultando a profesores comprendidos en nuestra
poblacin, se obtuvo:
Remuneracin Mnima: Li = 4,000 soles
Remuneracin mxima: Ls = 6,000 soles
Datos, que aproximadamente fueron muy prximos a los
proporcionados por el personal de pagadura.

38
Mtodos Estadsticos Varela/Llanos/Asnate

Luego:
6, 000 4, 000
X 5, 000
2
6, 000 4, 000
S 333
6
Por consiguiente, para una seguridad del 95% (Z = 1.96) y un error
relativo del 3% obtenemos:
2 2
no = ZS 1.96 x333 19

d 0.03 x5000
(Tamao muy prximo al calculado anteriormente)

1.3.- SELECCION DE MUESTRA PILOTO:


La muestra piloto adems de servirnos para probar la, bondad o
exactitud de la encuesta principal, sus resultados nos pueden servir para
estimar la varianza poblacional, sobre todo cuando sta muestra por s
misma es una muestra aleatoria simple.
Para obtener un tamao de muestra adecuado se recomienda ajustar la
muestra piloto, mediante la expresin:
S12 2
n 1
V n1
2
Donde; S1 y n1 son la varianza y tamao de muestra, piloto.
V = (d/Z)2

II.- SELECCION DE OBSERVACIONES MUESTRALES.


Para determinar las observaciones poblacionales que pasan a constituir
la muestra usamos la tabla de nmeros aleatorios. En nuestro ejemplo:
1. Seleccionamos como arranque aleatorio la Fila 15 y Columna
25. Esto es A(15,25)
2. Como el tamao de poblacin (N = 600) est constituido por
tres dgitos, en la tabla trabajamos con tres columnas; la 25, 26
y 27. As; nuestra primera observacin muestral ser la
observacin poblacional, con el nmero 149; la segunda ser la
nmero-186 y as.
3. Al encontrar en la tabla un nmero superior al tamao de
poblacin, empleamos cualquiera de los procedimientos que

39
Mtodos Estadsticos Varela/Llanos/Asnate

permiten su empleo. Para nuestro ejemplo construimos los


intervalos:
(1) 1 600
(2) 601 1,200
Como el lmite superior del segundo intervalo supera al tamao
poblacional deja de ser til, reducindose nuestro trabajo a restar 600 a
todo nmero de tres cifras mayor al tamao poblacional. As,
obtenemos:

Fila Columnas Observaciones


25-26-27
15 149 X149
16 186 X186
17 782 X782 600 = X182
18 767 X767 600 = X167
19 702 X702 600 = X102

4.- As, las observaciones poblacionales que pasan a constituir la


muestra (n = 24); esto es, los elementos del marco muestral de los
cuales se requiere informacin sern:
Observ Muestr X1 X2 X3 X4 X5 X6 X7 X8
acin o al N
elemen Poblaci X149 X186 X182 X167 X102 X46 X439 X329
to onal N

X9 X10 X11 X12 X13 X14 X15 X16 X17 X18 X19
X234 X354 X143 X276 X169 X76 X191 X32 X190 X467 X48

X20 X21 X22 X23 X24


X14 X15 X67 X231 X122
III.- ESTIMACIONES
3.1 PUNTUALES:

i) Remuneracin media: X x 4, 622.29
ii) Total de remuneraciones:

X N x 600(4, 622.29) 2 '773, 374
40
Mtodos Estadsticos Varela/Llanos/Asnate

iii) Varianza y desviacin Estndar de las remuneraciones:


Sx2 sx2 103,111.87
S 2 s 2 321.11
x x

3.2.- INTERVALICAS
Para la construccin de los intervalos de confianza para la media y el
total es necesario el clculo de las varianzas de los estimadores y para
ello se requiere determinar el tipo de muestreo a trabajar.
1) El tipo de muestreo se determina mediante la fraccin muestral. As
en nuestro ejemplo:
f = n/N = 24/600 = 0.04 < 5%
Luego, para obtener las varianzas asumimos el muestreo con reemplazo.
2) Estimador de la varianza del Estimador:
De la media:

s 2 103,111.87
V (X ) 4296.33
n 24
luego; s 65.55
x

Del total:
V ( X ) N 2 ( s 2 / n) (600) 2 (4296.33) 1546678.800
Luego;
sx 39,327.84
Nota: Al trabajar con los estimadores de los estimadores, slo
requerimos del tamao de poblacin; el resto, es informacin muestral
lo cual constituye una gran ventaja.

Intervalos de confianza:
Para la Media:

X t( / 2n1 ) s X

4,487 x 4758

41
Mtodos Estadsticos Varela/Llanos/Asnate

As, la remuneracin promedio de los docentes con 10 a 20 aos de


servicio a diciembre de 1987 y con una probabilidad del 95% flucta
entre 2692.004.7 y 2854,743.3
Nota: Se emplea el coeficiente de confianza t( / 2;n 1) por ser la muestra
menor de 30.

IV.- APLICACIONES
Suponiendo que el 3% de la remuneracin se destina al pago de
alimentos del mes vencido, entonces, la disponibilidad promedio para el
prximo mes, aproximadamente fluctuar entre 3,141 y 3,331

1. En una muestra de 40 familias de 6 miembros, se encontr que el


consumo promedio mensual es de 5 kg. con una desviacin estndar de
2.2 kg. si se conoce que el total de familias en el sector es de
aproximadamente de 4,000. Determinar con una seguridad del 95% el
nmero de sacos de arroz necesarios para abastecer el consumo de
dichas familias.
Solucin:

A. Estimador del total de kilos de arroz


X 4, 000(5) 20, 000kg
B. Desviacin estndar del estimador:
Como n/N = 40/4,000 = 1% < 5%, entonces aplicamos el muestreo con
reemplazo.
As,
s2 2(2.2)2
V ( X ) N 2 (4, 000) 1'936, 000
n 40
Luego; s 1,391.4 kg
x

C. Estimacin Intervlica
X Z / 2 sx
20,000 1.96 (1391.4)
17,272.86 X 22,727.14 kg

42
Mtodos Estadsticos Varela/Llanos/Asnate

El total de kg de arroz consumidos en el mes por familias de 6


miembros, con una seguridad del 95% flucta entre 17,272.86 y
22,272.14 kg.
Ahora, como cada saco de arroz contiene 50 kg; el nmero de sacos
necesarios por mes fluctuar entre 346 y 455 sacos aproximadamente.
Si cada saco de arroz costara 500, entonces, la cantidad total de dinero
que importara el abastecimiento fluctuar entre 173,000 y 227,500
mensuales.

2.- En un determinado hospital se llevan estadsticas de los recin


nacidos. En una semana nacieron 2,000 nios con una talla promedio de
46 cm. A los siete meses de edad se elige aleatoriamente a 30 de ellos
obtenindose su talla correspondiente (yi), registrndose tambin su talla
inicial (xi) a partir de sus fichas de nacimiento. Si los datos son los que
se indican a continuacin:

y 5 6 7 5 6 5 5 5 6 7 7 7 5 5 7
i 2 2 3 7 8 4 3 1 3 0 0 1 5 9 1
x 3 4 5 4 4 4 4 3 4 4 5 5 4 4 4
i 8 3 0 5 5 2 0 8 6 8 3 0 0 7 7

5 7 7 6 5 5 5 5 6 5 7 4 5 5 7
8 2 4 3 3 2 6 7 0 8 4 8 2 7 0
4 4 4 4 4 3 4 4 4 4 5 3 3 4 4
4 8 9 6 0 9 2 1 6 4 0 7 9 4 8
Estimar:
a) La talla media de los nios a los 7 meses de edad.
b) El error estndar del estimador.
c) Calcule el intervalo de confianza del 95% para la talla media
de los nios, en base:
c.1 La media muestral
c.2 La razn muestral
Solucin:

Clculos previos

43
Mtodos Estadsticos Varela/Llanos/Asnate

y i y 11391; s 8.1467
1,833; 2
i y

s 2
y 66.368965; x 1,329; x 59, 403;
i
2
i sy 4.2681
sx2 18.217241
a) Talla media de los nios a los 7 meses de edad:
Y y 1,833/ 30 61.1cm.
b) Error estndar del estimador de la media:
Como n/N < 0.05, se emplea las formulas para las poblaciones
finitas.
c) Intervalo de confianza para la talla media de los nios:
LI: 61.1 (1.96) (1.48) = 58.1992
LS: 61.1 + (1.96) (1.48) = 64.008
Luego: 58cm y 64cm.
La talla media de los nios a los 7 meses de haber nacido,
flucta entre los 58 y 64cm; con una probabilidad del 95%.
C.2.Intervalo de confianza para la razn de crecimiento de los
nios.
LI: 1.3792 (1.96) (0.0130)
Luego: 1.352 R 1.4062
LS: 1.3792 + (1.96) (0.0130)
El incremento de la talla de los nios a los 7 meses, con una seguridad
del 95%, flucta entre el 35 y 41% con respecto a sus tallas al nacer.
Ni pi qi ci
=n L

N
k 1
k pk qk ck

Donde:
N, denota el tamao del i-simo estrato
pi , denota la proporcin poblacional para el i-simo estrato
ci , denota el costo por obtener una reservacin individual de i-simo
estrato.

44
Mtodos Estadsticos Varela/Llanos/Asnate

03.- una muestra irrestricta aleatoria de n = 9 registros del hospital es


seleccionada para estimar la cantidad promedio de la deuda sobre N =
484 cuentas abiertas.
Los valores de la muestra para estos nueve registros estn listados en la
tabla.
Estime, la cantidad promedio de la deuda, y establezca un limite para
el error de estimacin.
Cantidad de
dinero adeudado
y1 33.50
y2 32.00
y3 52.00
y4 43.00
y5 40.00
y6 41.00
y7 45.00
y8 42.50
y9 39.00
Solucin:
Es conveniente presentar los datos y clculos de la muestra
como se indica en la tabla.
Al sumar las cantidades en la columna y, obtenemos:
9

y
i 1
i = 368.00

De la columna de y 2 , tenemos
9

y
i 1
i
2
= 15,332.50

Datos y clculos para el ejemplo


y y2
33.50 1,122.25
32.00 1,024.00
45
Mtodos Estadsticos Varela/Llanos/Asnate

52.00 2,704.00
43.000 1,849.00
40.00 1,600.00
41.00 1,681.00
45.00 2,025.00
42.50 1,806.25
39.00 1,521.00
y 368.00
i y 2
i 15,332.50

Necesitamos estas dos cantidades para calcular Y y S2. Nuestra


estimacin de es:
9

y 1
368.00
y i 1
40.39
9 9
Para encontrar un lmite para el error de estimacin, debemos calcular:
2
n 9
9
( yi y )2 y yi / 9
2
i
i 1
S2 = i 1 i 1
n 1 8
= 1 15,332.50 (368) 1 15,332.50 15, 047.11
2

8 9 8
= 35.67
Utilizando la ecuacin, obtenemos el lmite para el error de estimacin.
s2 N n 35.67 484 9
2 V ( y) 2 2
n N 9 484

=2 3.890 = 3.944 = S/ 3.94

4.- Una empresa industrial est interesada en el tiempo por semana que
los cientficos emplean para ciertas tareas triviales. Las hojas de control
del tiempo de una muestra irrestricta aleatoria de n = 50 empleados
muestran que la cantidad promedio de tiempo empleado en esas tareas
es de 10.31 horas, con una varianza muestral s2 = 2.1. La compaa
emplea N = 750 cientficos. Estime el nmero total de horas-hombre
que se pierden por semana en las tareas insignificantes y establezca un
lmite para error de estimacin.
46
Mtodos Estadsticos Varela/Llanos/Asnate

Solucin:
Sabernos que la poblacin consiste de N = 750 empleados, de los cuales
una muestra aleatoria de n = 50 hojas de control del tiempo fue
obtenida. La cantidad promedio de tiempo que se pierde por los 50
empleados fue y = 10.31 horas por semana. La estimacin de es:
= Ny = 750(10.31) = 7732.5 horas
A fin de establecer un lmite para el error de estimacin, aplicamos la
Ecuacin, para obtener:
2.25 750 50
2/ V( ) 2 (750) 2
50 750
= 2 23, 625 = 307.4 horas.

Por lo tanto la estimacin del tiempo total perdido es = 7732.5 horas.


Estamos razonablemente confiados de que el error de estimacin es
menor que 307.4 horas.

5.- La cantidad promedio de dinero para las cuentas por cobrar de un


hospital debe ser estimada. Aunque no se cuenta con datos anteriores
para estimar la varianza poblacional 2, se sabe que la mayora de las
cuentas caen dentro de una amplitud de variacin de $ 100. Existen N
=1000 cuentas abiertas. Encuentre el tamao de muestra necesario para
estimar con un lmite para el error de estimacin de B = $ 3.
Solucin
Necesitamos una estimacin de 2, la varianza poblacional. Ya que la
amplitud de variacin es aproximadamente igual a 4 desviaciones (4),
un cuarto de tal amplitud proporcionar un valor aproximado de y Por
lo tanto,
rango 100
25
4 4
y 2 (25)2 625
Al usar la Ecuacin, obtenemos:
N 2
n
( N 1) D 2

47
Mtodos Estadsticos Varela/Llanos/Asnate

B 2 32
Donde D 2.25
4 4
1000(625)
As, n 217.56
999(2.25) 625

Esto es, necesitamos aproximadamente 218 observaciones para estimar


, la media de las cuentas por cobrar, con un lmite para el error de
estimacin de $ 3.00

6. Los dirigentes del consejo estudiantil en un colegio desean realizar


una encuesta para determinar la proporcin de estudiantes que est a
favor de una propuesta de cdigo de honor. Ya que entrevistar a N =
2000 estudiantes en un lapso razonable es casi imposible, determine el
tamao de muestra (nmero de estudiantes a entrevistarse) necesario
para estimar p con un lmite para el error de estimacin de magnitud 13
= 0.05. Suponga que no hay informacin previa disponible para estimar
p.
Solucin:
Cuando no se cuenta con informacin previa, podemos aproximar los
tamaos de muestra requeridos, estableciendo p = 0.5 en la Ecuacin.
Tenemos que:
B2 (0.05) 2
D 0.000625
4 4
Npq
n
( N 1) D pq
= (2000)(0.5)(0.5) 500

(1999)(0.000625) (0.5)(0.5) 1.499
= 333.56
Esto es, 334 estudiantes deben ser entrevistados para estimar la
proporcin de estudiantes que est a favor de una propuesta de cdigo
de honor, con un lmite para el error de estimacin de B = 0.5.

7.- Con referencia al Ejemplo, supngase que adems de estimar la


proporcin de estudiantes que apoya la propuesta de cdigo de honor,
los dirigentes del consejo estudiantil tambin desean estimar el nmero
48
Mtodos Estadsticos Varela/Llanos/Asnate

de estudiantes que considera que la organizacin del consejo estudiantil


funciona de acuerdo a sus necesidades. Determine el tamao de muestra
combinado que se requiere en una encuesta para estimar p, la
proporcin de quienes estn a favor de la propuesta de cdigo de honor,
y 11 2, la proporcin de los que opinan que el consejo estudiantil
funciona de acuerdo con sus necesidades, con lmites para los errores de
estimacin de magnitud B1 = 0.05 y B = 0.07. Aunque no se dispone de
informacin anterior para estimar p2 aproximadamente el 60% de los
estudiantes opin que el consejo satisfizo adecuadamente sus
necesidades en una encuesta similar llevada a cabo el ao anterior.
Solucin:

En este ejemplo debemos determinar un tamao de muestra que nos


permita estimar p, con un lmite B1 = 0.05 y p2 con un lmite B2 = 0.07.
Primero determinamos los tamaos de muestra que satisfacen cada
objetivo separadamente. Luego, el mayor de los dos ser el tamao de
muestra combinado para una encuesta que satisface ambos objetivos.
Del ejemplo el tamao de muestra requerido para estimar p1 con un
lmite para el error de estimacin de B1 = 0.05, fue n = 334 estudiantes.
Podemos usar los datos de la encuesta del ao anterior para determinar
el tamao de muestra necesario para estimar p2. Tenemos que:
B 2 (0.07)2
D 0.001225
4 4
Y por lo tanto, con p2 = 0.60
n= Npq
( N 1) D pq
= (2000)(0.6)(0.4) 480

(1999)(0.001225) (0.6)(0.4) 2.68877
= 178.52
Esto es, 179 estudiantes deben ser entrevistados para estimar p 2, la
proporcin de N = 2000 estudiantes que considera que el consejo
estudiantil satisface sus necesidades, con un lmite para el error de
estimacin igual a 0.07. El tamao de muestra requerido para lograr
ambos objetivos en una encuesta es 334, el mayor de los dos tamaos de
muestra.

49
Mtodos Estadsticos Varela/Llanos/Asnate

8.- Una empresa publicitaria est interesada en determinar qu tanto


debe enfatizar la publicidad televisiva en un determinado municipio, y
decide realizar una encuesta por muestreo para estimar el nmero
promedio de horas por semana que se ve la televisin en los hogares del
municipio. Este comprende dos pueblos, pueblo A y pueblo B, y un rea
rural, El pueblo A circunda una fbrica, y la mayora de los hogares son
de trabajadores fabriles con nios en edad escolar. El pueblo B es un
suburbio exclusivo de una ciudad vecina y consta de habitantes ms
viejos con pocos nios en casa. Existen 155 hogares en el pueblo A, 62
en el pueblo B y 93 en el rea rural. Analice los mritos de usar
muestreo aleatorio estratificado en esa situacin.
Solucin:

La poblacin de hogares se ubica en tres grupos naturales, dos pueblos y


un rea rural, de acuerdo con su localizacin geogrfica. Entonces la
poblacin dividida en tres estrato, bastante natural, simplemente por
conveniencia administrativa para seleccionar las muestras y para
ejecutar el trabajo de campo. Adems, los elementos de cada estrato
deben presentar tendencias similares de comportamiento entre ellos
mismos. Se espera relativamente poca variabilidad en el nmero de
horas que se ve televisin en los hogares de cada grupo, y este es
precisamente el caso en que la estratificacin produce una reduccin en
el lmite para el error de estimacin.
La empresa publicitaria puede desear producir estimaciones
por separado, del nmero promedio de horas que se ve televisin en
cada pueblo. El muestreo aleatorio estratificado permite estas
estimaciones.
Para la muestra aleatoria estratificada, tenemos N1 =155, N2 =
62 y N3 = 93, con N = 310.

9.- Suponga que se lleva a cabo la encuesta planteada en el ejemplo. La


empresa publicitaria tiene tiempo y dinero suficientes para entrevistar n
= 40 hogares, y decide seleccionar muestras aleatorias de tamao n1 =
20 del pueblo A, n2 = 8 del pueblo B y n5 = 12 del rea rural. (Despus
analizaremos la eleccin de los tamaos de muestras). Se seleccionan
las muestras irrestrictas aleatorias y se realizan las entrevistas. Los

50
Mtodos Estadsticos Varela/Llanos/Asnate

resultados, con mediciones del tiempo que se ve la televisin en horas


por semana, se muestran en las tablas. Estime el tiempo promedio que
se ve televisin, en horas por semana, para (a) todos los hogares en el
pueblo A y (b) todos los hogares en el pueblo B. En ambos casos fije un
2 2 2
lmite para el error de estimacin. Los trminos s1 , s2 , s3 en la tabla
son las varianzas mustrales para estratos 1, 2 y 3, respectivamente:
fueron obtenidos mediante la frmula:

ni ni

( yi j yi )2
j 1
y
j 1
2
ij ni yi2
si2
ni 1 ni 1

Para i = 1, 2, 3 donde yij es la observacin j-sima en el estrato i. Estas


varianzas estiman las correspondientes varianzas verdaderas en los
estratos 12 , 22 , 32
Solucin:
a) De la tabla y ecuacin:
1
yst N1 y1 N 2 y2 N 3 y3
N
1
(155)(33.900) (62)(25.125) (93)(19.000)
310
= 27.7
es la mejor estimacin del nmero promedio de horas por semana en
que en todos los hogares del municipio se ve televisin. Tambin,
1 3
Ni ni si2
V ( y st )
N2
N 2
1
i 1 Ni ni
=
1 (155)2 (0.871)(35.358) (62) 2 (0.871)(232.411) (93)2 (0.871)(87.636)

(310)2 20 8 12

La estimacin de la media poblacional, con un lmite para el error de


estimacin aproximadamente dos desviaciones estndar, est dada por:

yst 2 V ( y st ), 27.675 2 1.97, 27.7 2.8


51
Mtodos Estadsticos Varela/Llanos/Asnate

Entonces estimamos que el nmero promedio de horas por semana que


se ve televisin en los hogares del municipio es de 27.7 horas. El error
de estimacin debe ser menor que 2.8 horas, con una probabilidad
aproximadamente igual a 0.95
(b) Las ni = 8 observaciones del estrato 2 constituyen una muestra
irrestrictamente aleatoria; por ello podemos aplicar las formulas del
capitulo anterior.
Tiempo que se ve televisin en horas por semana

Estrato 1, pueblo A Estrato 2, pueblo B Estrato 3, rea rural


35 28 26 41 27 4 49 10 8 15 21 7
43 29 32 37 15 41 25 30 14 30 20 11
36 25 29 31 12 32 34 24
39 38 40 45
28 27 35 34

Clculos para la tabla


Estrato 1 Estrato 2 Estrato 3
N1 = 20 n2 = 8 n3 = 12
Y1 = 33.900 Y2 = 25.125 Y3 = 19.000
s12 35.358 s22 232.411 s32 87.636
N1=155 N2=62 N3 = 93
Tiempo promedio de ver televisin para el pueblo B, con un lmite de
aproximadamente dos desviaciones estndar para el error de estimacin,
est dada por:
N n2 s22 62 8 232.411
y2 2 osea 25.1 2
N2 n2 68 8

o sea 25.1 10.1


Esta estimacin tiene un lmite grande para el error de estimacin
2
porque s2 es grande y el tamao de muestra n2 es pequeo. Entonces la

estimacin y st de la media poblacional es bastante buena, pero la

estimacin y2 de la media del estrato 2 es deficiente. Si se desea una

52
Mtodos Estadsticos Varela/Llanos/Asnate

estimacin para un estrato particular, la muestra del estrato debe ser lo


suficientemente grande para proporcionar un lmite razonable para el
error de estimacin.

10.- Remtase al ejemplo anterior y estime el nmero total de horas por


semana que las familias del municipio dedican a ver televisin. Fije un
lmite para el error de estimacin.
Solucin:
Con los datos de la tabla:
N y st = 310 (27.7) = 8587 horas
La varianza estimada de Nyst est dada por:
V ( N y st ) N 2V ( yst ) (310)2 (1.97) 189.278.560
La estimacin del total de la poblacin, con un lmite para el error de
estimacin, est dada por:

N y st 2 V ( N y st ) o sea 8587 2 189, 278.560


o sea 8587 870
De esta manera estimamos que el tiempo semanal total que en los
hogares del municipio se ve televisin es de 8587 horas. El error de
estimacin debe ser menor que 870 horas.

11.- Una encuesta anterior sugiere que las varianzas de los estratos para
el ejemplo, aproximadamente s2 25, 2 225 y 32 100 .
2 2

Deseamos estimar la media poblacional mediante yst. Seleccione el


tamao de muestra para obtener un lmite para el error de estimacin
igual a 2 horas, si las fracciones asignadas son w1 = 1/3, w2 = 1/3 y w3 =
1/3. en otras palabras, se debe tomar un nmero igual de observaciones
de cada estrato.
Solucin:
Un lmite para el error de estimacin de 2 horas significa que:
2 V ( yst ) 2 o sea V(yst) = 1
Por tanto D = 1
En el ejemplo anterior N1 = 55, N2 = 62 y N3 = 93. Por eso:

53
Mtodos Estadsticos Varela/Llanos/Asnate

3
Ni2 i2 N 22 12 N 22 22 N32 32

i 1 wi

w1

w2 w3
(155)2 (25) (62)2 (225) (93)2 (100)

(1/ 3) (1/ 3) (1/ 3)
= (24,025) (75) + (3844)(675) + (8649) (300)
= 6,991.275
3

N
i 1
i i
2
N1 12 N 2 22 N 3 32

= (155) (25) + (62) (225) + (93) (100) = 27,125


N2D = (310)2 (1) = 96,100
De la ecuacin tenemos que:
3

N i
2
i
2
/ wi
6, 991.275 6, 991.275
n i 1
56.7
3
96.100 27.125
N 2 D N i i2
123.225
i 1

Entonces el experimentador debe tomar n = 57 observaciones con


n1 = n(w1) = 57(1/3) = 19
n2 = 19
n3 = 19

12.- Una investigacin quiso estimar el peso promedio de 90 ratas (50


machos y 40 hembras) que han sido alimentados con cierta dieta. Las
ratas fueron separadas por sexo; por lo que el uso de, muestreo aleatorio
estratificado con dos estratos pareci apropiado. Para aproximar la
variabilidad dentro de cada estrato, la investigadora seleccion la rata
ms pequea y la ms grande en cada estrato y las pes. Ella encontr
que la amplitud de variacin fue de 10 gramos para los machos y 8 para
las hembras. Qu tan grande debi tomarse la muestra para estimar el
promedio poblacional con un lmite de 1 gramo para el error de esti-
macin? Suponga que el costo de muestreo fue el mismo para ambos
estratos.
Solucin:

54
Mtodos Estadsticos Varela/Llanos/Asnate

Denotemos los machos como el estrato 1 y las hembras como el estrato


2. Para usar la Ecuacin primero debemos aproximar 1 y 2. La
desviacin estndar debe ser alrededor de un cuarto de la amplitud de
variacin, suponiendo que los pesos tienen una distribucin normal.
Entonces
10 8
1 2.5 y 2 2.0
4 4
De la ecuacin:

ni = n N i i
2

N i i
i 1
2
Donde: N
i 1
i i (50)(2.5) (40)(2.0) 125 80 205

Entonces:

ni = n N i i
n
125
0.61n

2

Ni i
205

i 1
80
y n2 n 0.39n
205
Entonces w1 = 0.61 y w2 = 0.39
Debemos calcular las siguientes cantidades para poder encontrar n:
2

N
i 1
i i
2
(50)(2.5) 2 (40)(2.0) 2 472.50

B 2 (1)2
D 0.25
4 4
Usando la ecuacin tenemos:

55
Mtodos Estadsticos Varela/Llanos/Asnate

2
3
Ni i
n i 1
2
N 2 D N i i2
i 1

(205)2
n 16.83
(90)2 (0.25) 472.50
n1 = n w1 = (17) (0.61) = 10
n2 = nw2 = (17) (0.39) = 7

V.- VARIANZAS MUESTRALES Y SUS ESTIMADORES


PARA MUESTREO SIN REEMPLAZO PARA MUESTREO CON
REEMPLAZO

a) Varianza del Estimador de la media poblacional:


1 L
Sh2
V ( y st )
N2
Nh( Nh nh )
h 1 nh
L
Sh2
V ( y st ) Wh2
h 1 nh
L 2
S
= W
h 1
h
2 h

nh
(1 f h )

b) Varianza del estimador del total poblacional: v(yst) = v(n yst)

L
S2
V (Yst ) N 2 Wh2 h (1 f h )
h 1 nh
L
S2
V (Yst ) N 2 Wh2 h
h 1 nh

L
Sh2 L
Sh2
= Nh ( Nh nh )
h 1 nh
= Nh2
h 1 nh

56
Mtodos Estadsticos Varela/Llanos/Asnate

c) Estimador de la varianza del estimador de la media poblacional


L
S2
V ( y st ) Wh2 h (1 f h )
h 1 nh
L 2
2 Sh
V ( y st ) Wh

h 1 nh

2 2
Donde sh es el estimador insesgado de S h

d) Estimador de la varianza del estimador del total poblacional


L
S2
V (Yst ) N 2 Wh2 h (1 f h )
h 1 nh
L
S2
V (Yst ) N 2 Wh2 h
h 1 nh

L
Sh2 L
Sh2
= Nh ( Nh nh )
h 1 nh
= Nh2
h 1 nh

Nota: El muestreo sin reemplazo tambin se le conoce como muestreo


para poblaciones finitas, y al muestreo con reemplazo como muestreo
para poblaciones infinitas no olvidar, que cuando f = n/N es menor del
10% se considera a la poblacin como INFINITA.

VI.- INTERVALOS DE CONFIANZA

st Z / 2 V (st )
PARA POBLACIONES FINITAS PARA
POBLACIONES INFINITAS

a) Intervalo de confianza para la media poblacional (u , Y)

57
Mtodos Estadsticos Varela/Llanos/Asnate

L
sh2
y st Z / 2 Wh2 nh
(1 f h )

L
sh2
y Z / 2 Wh2 nh

b) Intervalo de confianza para el total poblacional (Y)


L
sh2
y st Z / 2 N Wh2 nh
(1 f h )

L
sh2
Y Z / 2 N Wh2 nh

PROBLEMAS
1.- Sea la poblacin hipottica de 6 familias (N = 6), clasificadas en N 1
= 3 familias del sector I y N2 = 3 familias del sector II; para las cuales
presentamos los siguientes datos correspondientes al ingreso familiar.
FAMILIAS
DEL SECTOR I DEL SECTOR II
N1 = 3 N2 = 3
Y1i Y2i

58
Mtodos Estadsticos Varela/Llanos/Asnate

Y11 = 2 Y21 = 8
Y12 = 4 Y22 = 12
Y13 = 6 Y23 = 16
Y1 = 12 Y2 = 36
Y1 4 Y 2 12
a. Nmero de estratos: L = 2
L2
b. N N
h 1
h N1 N 2 3 3 6

c. Total de ingreso en el estrato: Yh = Yhi


3
En estrato I: Y1 Y1i Y11 Y12 Y13 2 4 6 12
i 1
3
En estrato II: Y2 Y2i Y21 Y22 Y23 8 12 16 36
i 1
d. Total Poblacional
L L Nh
Y Yh Yhi Y1 Y2 12 36 48
h 1 h 1 i 1

e. Media en el estrato o ingreso medio por sector


Yh
Yh
Nh
Y1 12
En sector I Y1 4
N1 3
Y2 36
En sector II Y2 12
N2 3
f. Media poblacional o ingreso familiar promedio
Y (Y1 Y2 ) (12 36)
Y 8
N ( N1 N 2 ) 33

ESTIMADORES DEL TOTAL Y LA MEDIA POBLACIONAL


Ejemplo

59
Mtodos Estadsticos Varela/Llanos/Asnate

Obtener muestras sin reemplazo de tamao 2 en cada estrato de nuestra


poblacin hipottica y demostrar que:
E( Yst ) = Y y E( y st ) Y
Demostracin:
3
a) N de muestras en cada estrato: De estrato I 3
2
3
De estrato II 3
2
b) N de muestras posibles a seleccionar de la poblacin:
3 3
9
2 2
c) Muestras y estimadores
Estratos
I II
y1 y2 y1 y2 N1 y1 N1 y 2 Y st y st
2,4 8,12 6 20 3 10 9 30 39 39/6
8,16 24 12 36 45 45/6
12,16 28 14 42 51 51/6
2,6 8,12 8 20 4 10 12 30 42 42/6
8,16 24 12 36 48 48/6
12,16 28 14 42 54 54/6
10 20 5 10 15 30 45 45/6
24 12 36 51 51/6
28 14 42 57 57/6

a)
M 9
E (Yst ) Y st P(Yst ) 39 / 6(1/ 9) 45 / 6(1/ 9) ... 57 / 6(1/ 9)

= (1/9)(432) = 48
Como Y = Y1 + Y2 = 12 + 36 = 48
Entonces: E(Yst ) Y 8 y
60
Mtodos Estadsticos Varela/Llanos/Asnate

Por consiguiente, Yst es INSESGADO de Y


b)
E ( y st ) y st P( yst ) 39 / 6(1/ 9) 45 / 6(1/ 9) ... 57 / 6(1/ 9)
= (1/9)(432/6) = 8
Como Y = Y/N = 48/6 = 8
Entonces: E( y st ) Y 8 y

Por consiguiente, y st es INSESGADO de Y


Ejemplo:
En el ejercicio anterior, encontrar M = 9 posibles estimadores de
V ( y st ) y demostrar que:

E V ( y st ) V ( y st )
Demostracin
Estratos
I II s12 s22 V ( y st )
2,4 8,12 2 8 15/36
8,16 32 51/36
12,16 8 15/36
2,6 8,12 8 8 24/36
8,16 32 60/36
12,16 8 24/36
4,6 8,12 2 8 15/36
8,16 32 51/36
12,16 8 15/36
2
a) Varianzas muestrales en los estratos sh

sh2 ( yh1 yh 2 ) 2 / 2

En estrato I En estrato II
s (2 4) / 2 2
2
1
2
s22 (8 12) 2 / 2 8
= (2 6)2/2 = 8 = (8 16)2/2 = 32
= (4 6)2/2 = 2 = (12 16)2/2 = 8

61
Mtodos Estadsticos Varela/Llanos/Asnate

b) Estimador de la varianza de y st
Se obtiene para cada muestra de tamao n = 4
Para muestra: (2, 4, 8, 12) obtenemos:
2 2
S
V ( y st ) Wh2 (1 f h ) h
h 1 nh
N1 ( N1 n1 ) s1 N2 ( N2 n2 ) s2
2 2 2 2

=
N N1 n1 N N2 n2

= 3 (3 2) 2 3 (3 2) 8 15
2 2


3 3 2 6 3 2 36

y de esta manera obtenemos todos los valores de la columna V ( y st )


c) Valor esperado de V ( y st )
M
E V ( y st ) V ( y st )P V ( y st )

= (1/9) (15/36 + 51/36 + +15/36)


= 30/36
d) Varianza de y st
2
N h nh Sh2
V( y st ) = wh2
h 1 N h nh

N1 n1 S12 N n S2
= W12 W22 2 2 2
N1 n1 N 2 n2

= (3/6)2 (3-2/3) + (3/2)2 (3-2/3) (16/2) = 30/36


De c) y d) concluimos que V ( y st ) es INSESGADO de V ( y st )

MUESTREO ESTRATIFICADO PARA PROPORCIONES:


62
Mtodos Estadsticos Varela/Llanos/Asnate

NOTACIONES
Ah : N de unidades del estrato h que poseen el atributo.
ah : N de unidades muestrales del estrato h que poseen el atributo.
Ph : Proporcin en la muestra en el estrato h: P h = ah / nh

ESTIMADORES Y VARIANZAS MUESTRALES


1. Estimador de la proporcin poblacional:
L
Pst pst N h ph / N
h 1
2. Varianza del estimador de la proporcin poblacional:
Para poblaciones finitas Para poblaciones infinitas
1 N h2 ( N h nh ) PhQh
L
V ( pst ) 2
N
( N 1)n
h h

1 L N h2 PhQh
V ( pst )
N2
n
h
3. Estimador de la varianza del estimador de la proporcin poblacional
2 1
L
N ( N n )P Q
V ( pst ) s p 2 h h h h h

N h1 nh
L 2
W PQ
V ( pst ) h h h
h 1 nh
L
Wh2 PhQh (1 f h )

h 1 nh
Nota: No olvidar que:

VARIANZA DE LA PROPORCIN MUESTRAL EN EL


ESTRATO h

Para muestreo sin reemplazo Para muestreo sin


reemplazo

63
Mtodos Estadsticos Varela/Llanos/Asnate

PhQh ( N h nh ) PhQh
V ( ph ) V ( ph )
nh nh 1 nh
ESTIMAR DE LA VARIANZA DEL ESTIMADOR DE LA
PROPORCIN DEL ESTRATO h
PhQh ( N h nh ) PhQh
V ( ph ) V ( ph )
nh nh 1 nh
Ejemplo:
1.- Supongamos que tenemos los siguientes datos correspondientes a
familias que usan cierto detergente.
a. Encontrar P, Ph
b. Extraer muestras de tamao n1 = 2, n2 = 3 de los estratos I y II y
estimar Ph
Solucin:
Datos:
Estratos
I II
Y11 = 1 Y21 = 1
Y12 = 0 Y22 = 0
Y13 = 1 Y23 = 1
Y14 = 0 Y24 = 1
Y15 = 0 Y25 = 1
2/5 4/5

a. Encontrar P, ph
5

Y 1i
2
P1 40%
N1 5
5

Y 2i
4
P2 80%
N2 5
La proporcin poblacional es:

64
Mtodos Estadsticos Varela/Llanos/Asnate

10

Y 1i
6
P 60%
N1 10
Que se puede obtener tambin como:
L

N P h h
N1 P1 N 2 P2 5(2 / 5) 5(4 / 5)
P 6 /10 60%
N N 10

3.- Sean las observaciones, para n1 = 2 y n2 = 3, las que se dan en el


cuadro siguiente:
N1 n2
y11 = 1 y21 = 1
y12 = 0 y22 = 0
y23 = 1
p11/2 p2 = 2/3
Proporciones muestrales en cada estrato
n1

y 1i
1
p1 50%
n1 2
n2

y 2i
2
p2 66.7%
n2 3
P1 = p1 = 50% = 1/2
P2 = p2 = 66.7% = 2/3

3. Estimador de P:

pst =
N h ph

(5)(1/ 2) (5)(2 / 3)
7 /12
N 10
Por consiguiente: P pst 7 /12 58.3%

65
Mtodos Estadsticos Varela/Llanos/Asnate

4.- Dada la siguiente poblacin con dos estratos, seleccionar muestras


de n1 = 2 y n2 = 2 desde cada estrato y demostrar que:
E(pst) = P
Demostracin
1) Nmero de muestras posibles:
3 3
3x3 9 Muestras
2 2
2) Las muestras son de tamao n = n1 + n2 = 4
3) Estimadores de P.
I II
1 1
0 0
1 0

Estratos
I II p1 p2 pst
1, 0 0.5 0.50
1, 0 1, 0 0.5 0.5 0.50
0, 0 0.0 0.25
1, 0 0.5 0.75
1, 1 1, 0 1.0 0.5 0.75
0, 0 0.0 0.50
1, 0 0.5 0.50
0, 1 1, 0 0.5 0.5 0.50
0, 0 0.0 0.25
4.50

Luego, E(pst) = ( 1/9) (4.5) = 0.50


Pero, p = (2+1)/6 = 1/2 = 0.50 y por consiguiente p st es
INSESGADO de p.

5.- Segn datos obtenidos en el ltimo censo agropecuario el nmero de


cabezas de ganado vacuno de acuerdo a la extensin de Hras de tierras
de cultivo y nmeros de establos se distribuyen de acuerdo a lo indicado
en el cuadro siguiente. As mismo en el figuran el nmero de establos en
66
Mtodos Estadsticos Varela/Llanos/Asnate

el presente ao. Si se desea estimar el nmero total de cabezas de


ganado en el presente ao, as como su varianza tomando una muestra
de 500 establos.
a) Determine la afijacin de la muestra segn:
Afijacin de Neyman, proporcional al nmero total de cabezas de
ganado en cada estrato.
b) calcular las varianzas para cada afijacin
Cuadro N 1
Nmero de cabezas de ganado obtenido desde un censo previo y N
total de establos en cada estrato para el presente ao.

Estrato Censo N promedio Desv. N total


h N total de de cabezas Estandar de
establos de ganado estimada establos
Nh sh en el
yh
presente
ao
Nh
I: 0 15 625 3.91 4.5 635
II: 16 30 564 10.38 7.3 570
III: 31 50 476 14.72 9.6 475
IV: 51 75 304 21.99 12.2 303
V: 76 - 100 86 27.38 15.8 89
Total Nh = 2055
N = 2072

a) Afijacin de Neyman Afijacin Proporcional

Nh sh Nh
nh (500) nh (500)
Nh sh N

Afijacin proporcional al total


Yh'
nh (500)
Yh'
67
Mtodos Estadsticos Varela/Llanos/Asnate

Las afijaciones as como los clculos correspondientes para su


obtencin se encuentran contenidos en el Cuadro N 2
Calculo de las afijaciones de una muestra de 500 establos

A
fijacione
' s (nh)
Estrat
N h' ss' Y h Nh' y h
o Proporcion
Proporcion al al total
Neyman
al
Yh'
I 2812.5 2444 84 153 50
II 417.2 5854 125 138 120
III 4569.6 7007 138 115 144
IV 3708.8 6685 112 73 137
V 1358.8 2355 41 21 49
TOTA 16566.9 24345 500 500 500
L

b) Para encontrar la varianza para cada afijacin, reemplazamos el


tamao de muestra que corresponde a cada una de ellas en la formula
general de varianza del estimador del total para muestreo estratificado.
N 2s2 N n
V (Yst ) h h h h
nh N h
As, varianza para la afijacin de Neyman:
(635)2 (4.5)2 635 84 (570)2 (7.3)2 570 125
V (Yst )
84 635 125 570

(475)2 (9.6)2 475 138 (303)2 (12.2)2 303 112



138 475 112 303

68
Mtodos Estadsticos Varela/Llanos/Asnate

(89)2 (15.8)2 89 41
84374 + 108136 + 106902 + 76960 +
41 89
26011 = 402356

Las varianzas de cada estrato de acuerdo a esta afijacin, as como la


varianza para el estimador del total se encuentran en el cuadro N 3
Varianza para la afijacin proporcional al total

(635)2 (4.5)2 635 50 (570)2 (7.3)2 570 120


V (Yst )
50 635 120 570

(475)2 (9.6)2 475 144 (303)2 (12.2)2 303 137



144 475 137 303

(89)2 (15.8)2 89 49
150447 + 113908 + 100624 + 54645 +
49 89
18137 = 437761
Cuadro N 3
Varianzas del N total de cabezas de ganado de acuerdo a las diferentes
afijaciones
Estrato Neyman Proporcional Proporcional a Y
'
h

I 84347 40509 150447


II 108236 95088 113908
III 106902 137038 100624
IV 76960 142679 54645
V 2011 71944 18137
402356 487258 437761
V (Y )

6.- Se ha diseado una encuesta para estimar la proporcin de familias


que poseen radios a transistores, en dos ciudades diferentes.
Estimaciones del nmero total de familias, la proporcin que posee
69
Mtodos Estadsticos Varela/Llanos/Asnate

radios y el costo de muestrear un familia sin dadas en cuadro N 1


tratndose cada ciudad como estrato y sumiendo un muestreo aleatorio
con reemplazo en cada estrato; obtener el tamao optimo de muestra y
afijarla a los estratos si el costo total (excluyendo gastos generales) se
fija en: 20,000 dlares.

Cuadro N 1
Estimaciones del N total de familias, proporcin con radios a
transistores y costo de muestrear una familia en cada ciudad.

Ciudad h N de familias Proporcin con Costo de


Nh radio Ph muestreo Ch
I 140 000 0.10 2.25
II 30 000 0.25 1.00
170 000

Afijacin para un costo fijo:


CN h PhQh / Ch
nh =
N h PhQh / Ch
Los clculos correspondientes figuran en cuadro N 2
Tamao de muestra: n = n1 + n2 = 7,369 + 3419
Luego el tamao ptimo de muestra es n = 10,788
Las cuales cubren el costo establecido o especificado.
Observamos: C = n1 c1 + n2 c2 = 7369 (2.25) + 3419(1) = 19,999.25 =
20,000
Cuadro N 2
Clculos para la fijacin optima

H
PhQhCh N h PhQhCh PhQh / Ch Nh PhQh / Ch nh
PhQh
I 0.450 63 000 0.20 28 000 7 369
II 0.4330 12 990 0.4330 12 990 3 419

70
Mtodos Estadsticos Varela/Llanos/Asnate

75 990 10 788

7.- Diferencia los siguientes pares de trminos:


a) Error de muestreo y error no de muestreo
b) Muestreo probabilstico y muestreo a juicio
c) Precisin y exactitud
d) Unidades de muestreo, elementales y primarias
Solucin:
a) Error de Muestreo.- Las estimaciones de un muestreo se
ven afectadas inevitablemente por el error de muestreo, el
cual debe ser recorrido y cuantificado; la magnitud de
este error deber ser objeto de permanente anlisis con
el fin de minimizarlo.

Error de no Muestreo.- Son los errores que se cometen


fuera del muestreo es decir en clculo, tabulaciones, etc.
b) Muestreo Probabilstico.- Es un proceso en donde cada
elemento de la poblacin tiene una misma probabilidad
de ser seleccionada (probabilidad perfectamente
conocida e igual).

Muestreo a juicio.- Es el proceso por el cual la


seleccin de la muestra depende del juicio humano y
no de la rigurosa aplicacin de la teora de las
probabilidades, una muestra obtenida por este mtodo
no es representativa.

c) Precisin.- La precisin es la obligacin o necesidad de


hacer una cosa.

Exactitud.- La exactitud es la puntualidad y fidelidad


en la ejecucin de una cosa.

d) Unidad de Muestreo.- Las unidades de muestreo:

71
Mtodos Estadsticos Varela/Llanos/Asnate

Unidad elemental .- Es el elemento o conjunto


de elementos sobre la cual se requiere
informacin.
Unidad de registro.- Es un elemento comn o
grupo de elementos por los cuales se registra
informacin.
Unidad de Anlisis o de estudio.- Es la unidad
por la cual se realiza el anlisis.

8.- Se extrae una muestra aleatoria de 36 elementos de una poblacin,


Cuntos elementos debe contener otra muestra de la misma
poblacin, para que el error estndar de la media de la segunda
muestra sea 2/3 del error estndar de la media de la primera muestra?
Solucin:
x
n 1 36 x
2
1

n1
2
n2 ? x x
3
1 2

2 2
x x (n 2 ) 1 / 2 (n 1 ) 1 / 2
3 3
2 1

n 2 (6 x3) / 2
2

n 2 81 Rpta.
9.- Se extrae dos muestras aleatorias de una misma poblacin y si el
error estndar de una de ellas es k veces el error estndar de la
media de la otra Cul es la relacin entre los tamaos de ambas
muestras?
Solucin:
x
n1 n 2 ? x 1
n1
x k. x
1 2
.n 1 1 / 2 k. .n -1/2

72
Mtodos Estadsticos Varela/Llanos/Asnate

n1 1 n1 1
Rpta.
n2 k2 n2 k2
10.- Una firma constructora de canales desea estimar la residencia
promedio de las barras de acero utilizadas para dichas
construcciones. Qu tamao de muestra se requiere para
garantizar que habr un riesgo solo del 0.001 de sobrepasar un
error de 5Kg o ms en la estimacin? La desviacin estndar de
la resistencia de este tipo de barras se estima en 50 libras.
Solucin:
50 lb.

E Z 1 x z . .......... .....(*)
n
0.4536
E 50 lb.( ) 22.68 kg
1 lb,
0.001 1 - 0.999

Por tablas: Z1 2 3.085


En (*):

5
3.08522.68 n 195.8 196 Rpta.
n
11.- Se desea investigar sobre el nmero de unidades defectuosas en
4000 cajas y la proporcin de cajas que contienen unidades
defectuosas, se realiza una encuesta preliminar de 80 cajas,
obtenindose el siguiente resultado:

de unidades 0 1 2 3 4 5 10 12
defectuosas
de cajas 37 16 8 8 4 2 2 13
examinadas

73
Mtodos Estadsticos Varela/Llanos/Asnate

Determine el tamao de muestra que con las dos condiciones: un


error del 6% para el promedio; y un error del 12% para la
proporcin con una confianza del 95% para ambos casos.
Solucin:
N = 4000
E1=0.06
E2= 0.12
n=80
80
P 0.02 5% sin reemplazo
4000
Y 1.725
S 2 7.95
95% Z 1.96
Z 2 SN
n
d 2 N S2 Z 2
Z 2 S 2y N
n1 2
d 1 N Z 2S 2y
(1.96) 2 (7.95)(4000)
n1
(0.06) 2 (4000) (1.96) 2 (7.95)
n 1 2718 Rpta.
Z 2 S 2y N
n 2

d 22 N Z 2S 2

Z 2S 2y N (1.96) 2 (7.95)(4000)
n2
d 22 N Z 2S 2y (0.12) 2 (4000) (1.96) 2 (7.95)
n 2 1386 Rpta.

12.- El departamento de trnsito y transporte requiere estimar la


proporcin de conductores con experiencia de 1 ao o menos,
que puede clasificarse como conductores descuidados Cul ser

74
Mtodos Estadsticos Varela/Llanos/Asnate

el tamao de muestra para que los resultados estn dentro de un


2%, con una confianza del 95%?. Se espera observar que
aproximadamente del total de los conductores sea de cuidado,
si el nmero de conductores a investigar fuera de 10000. Cul
ser el tamao de muestra?
Solucin:
1
P 0.25
4
Z 2 PQ (1.56) 2 (0.26)(0.75)
a) n 1800.75 1801
d2 (0.02) 2
n 1801 Conductore s, un experiment o de un ao o menos.
b) Si N 10000 Poblacin finita M.C.R.
PQ (0.25)(0.75)
n
d 2
PQ 0.02
2
(0.25)(0.75)

2 N 1.96 10000
n 1526 Conductore s con experienci a de un ao o menos.

Z 2 NPQ (1.96) 2 (10000)(0.25)(0.75)


n 1526 Conductore s

Nd 2 Z 2 PQ
(10000)(0.02) 2 (1.96) 2 (0.25)(0.75)
2
Z PQ
n0 1800.75
d2
n0 1800.75
n
n 0 1800.75
1 N 1 10000

n 1526

13.- Una muestra de fierro para construccin de canales es tomada al


azar para la estimar el grosor promedio, el error debe de hallarse
dentro de un rango de 0.30 mm., con un nivel de confianza del
95. Cul deber ser el tamao de muestra? Suponga que el error
estndar es 1.2 mm.
Solucin:
75
Mtodos Estadsticos Varela/Llanos/Asnate

Z 2S (1.96) 2 (1.2) 2
n 61.4656
E2 (0.3) 2
n 62 Rpta.
14.- Cuntos alumnos deben encuestarse para estimar el nmero
total de lapiceros anuales que consumen los 1500 alumnos de la
especialidad con una precisin de 500 lapiceros y una seguridad
del 95%?. En una encuesta preliminar se obtuvo que la desviacin
estndar fuera de 3 lapiceros.
Solucin:
N 1500
Z 2 95% 1.96
i 3 i2 9
d 500
N 2 Z 2S 2
n
d2
(1500) 2 (1.96) 2 (9)
n
(500) 2
n 311.16 312

n 312
5%
N 1500
312
n 258.278
312
1
1500
n 259 Rpta.

15.- Se tiene 120 hoteles en la ciudad de Huaraz estratificados segn


su categora se requiere estimar el promedio el promedio y la
varianza proporcional de sus ingresos en miles de soles al da,
los datos se muestran en el siguiente cuadro:
76
Mtodos Estadsticos Varela/Llanos/Asnate

Estrato h Nh nh Xh S2h Nhxhi


I. categora 30 6 5 2 150
II. categora 40 8 3 4 120
III. categora 50 10 2 6 100

Solucin:
N
X1t w h x h X1t h ( x h )
370
N 120
X1t 3.083
1 Nh 2 520 520
V (X1t )prop ( h i2 h) (S h)
n Nn (24)(120) 2880
V (X1t )prop 0.18

16.- La siguiente informacin correspondiente a las edades de 5 nios


6,8,10,12,14:
a) Extraiga muestras tamao 2 con y sin reemplazo.
b) Encuentre la medida de cada muestra y determine E(x), V(x),
E(S2), usando el resultado del punto a.
c) Encuentre la distribucin de frecuencias para la media
caso(a) y para la varianza poblacional, grafique cada caso.
d) Encuentre los estimadores posibles de la varianza de la media
muestral.
Solucin:

6 8 10 12 14
6 6,6 6,8 6,10 6,12 6,14
8 8,6 8,8 8,10 8,12 8,14
10 10,6 10,8 10,10 10,12 10,14
12 12,6 12,8 12,10 12,12 12,14

77
Mtodos Estadsticos Varela/Llanos/Asnate

14 14,6 14,8 14,10 14,12 14,14

Diagonal superior
Diagonal inferior
Para muestra de tamao 2:
Con reemplazo
Nn=52=25 todos
Sin reemplazo:
Considerando el orden:
5!
P25 20 parte diagonal superior e inferior
(5 2)!
Sin considerar el orden:
5!
C 52 10 diagonal superior
(2!)(3!)

17.-Con el fin de evaluar la viabilidad de aserrar y procesar una


plantacin total de 2000 rboles de cedro, se extrae una muestra
aleatoria simple de 200 rboles encontrndose que 120 de ellos
estaban listos para su proceso forestal 57 estaban deteriorados y
23 no tenan an las condiciones para ser procesados.
a) Estimar el nmero de rboles disponibles para ser
procesados y los lmites de confianza de la estimacin con
un 95% de confianza.
b) Se puede considerar que la mayora de rboles de la
plantacin son susceptibles de ser procesados de
inmediato.
Solucin:
a) yi 120

78
Mtodos Estadsticos Varela/Llanos/Asnate

n 200
f 0.1
N 2000
a 120
NP N 2000 1200
n 200
Lmites de confianza usando Z 1.96
pq N
L.C( ) NP NZ (1 - f )
n 2n
(0.9)(0.6) (0.4) 2000
L.C( ) 1200 2000(1.96) 400
2000
L.C( ) 1333.8243; 1066.1756
L.C( ) 1334 :1066 rboles de cedro disponible s

b)
L.C(P) P Z 1 - f pq n 1 2n

L.C(P) 0.6 1.96( (0.9)(0.6)(0.4)(12000) 1 400
L.C(P) (0.667; 0.533)

18.-En una zona forestal se cree que la proporcin de rboles de


cedro es de 40%, cual sera el error de muestreo que se esperara
alcanzar si deseramos estimar dicha proporcin seleccionando
una muestra simple aleatoria de 500 rboles de la zona, sabiendo
que el total de rboles de la zona forestal es de 10.000. Cul
sera la interpretacin que debera darse a dicho resultado?
Solucin:
N=10000; n=500
P=0.4 Q=0.6

79
Mtodos Estadsticos Varela/Llanos/Asnate

( N - n) PQ
V ( P) N n

(10000 500) (0.4)(0.6)
2

V ( P)
10000 500
V ( P) 0.000456
Luego el error estandar sera :
S(e) (0.000456) 0.021

La probabilidad con que una muestral de 500 rboles obtengamos


estimadores de P comprendidos entre los lmites PKS(p),
K=1,2,...

Lmite
PKS(p) Probabilidad
Superior Inferior
0.41(0.021) 0.421 0.379 68%
0.42(0.021) 0.442 0.358 95%
0.43(0.021) 0.463 0.337 99.7%

Por lo tanto que aproximadamente el 68% de muestras


estimaciones sufre la proporcin de rboles de cedro en la zona
(P=/N) hechas por nuestras simples aleatorias de 500 rboles,
estarn comprendidas entre 42% y 37.9% asumiendo la
posibilidad de realizar muestras repetidas.

19.- En una ciudad de 16000 hogares se tom una muestra aleatoria


simple de 1000 familias dichas familiares fueron visitadas y se
encontraron los resultados siguientes:

80
Mtodos Estadsticos Varela/Llanos/Asnate

Nmero
Tipo de Familia
Hogares Personas
IMIGRANTES: 766 2442
- Propietarios de vivienda 350 1177
- Inquilinos 416 1265
NATIVOS DEL PAIS: 234 881
- Propietarios de su 57 245
vivienda 177 636
- Inquilinos
Total 1000 3323

Solucin:
a) Proporcin de familias nativas:
a 234
P 0.234 23.4%
n 1000
pq 1000 0.766
V ( P) (1 - f) 1
N 16000 1000
V ( P) 0.0001682
El error estndar ser :
S(P) 0.0001682 0.013

b) Proporcin de las familias nativas -inquilinos:

d1 177 177
P1 0.298
n1 416 177 593
n1 n
Como se conoce N 1 , reemplazam os f 1 por f
N N
p1q1 p1q1 1 (0.298)(0.702)
V(P) (1 - f 1 ) V(P) (1 - f) 1
n1 n1 6 593

81
Mtodos Estadsticos Varela/Llanos/Asnate

V ( P ) 0.0003312
El error estndar ser :
S(P) 0.0003312 0.0182
c) El tamao medio de una familia inmigrante:

Yi 2442
Y1 3.188
n1 766
Como no se conoce , reemplazam os f 1 por 1 16
(1 - f1 ) S12 (1 f)S12
V (Y1 )
n1 n1
(17.785 (2442) 2 ) 1
Donde : S12 13.072
766 (766 1)

1 13.072
V (Y ) 1 0.016
16 766
Error estndar ser :
S(Y) 0.016 0.1265
El coeficiente de variacin es :
S(Y) 0.1265 3.188
CV(Y) (100) 3.97%
Y 100
N
d) Y1 Y1 16(245) 3920

Varianza estimada es:

82
Mtodos Estadsticos Varela/Llanos/Asnate

N(1 - f)S12
V (Y1 ) donde :
n1


S Y1
Y1 1
2


(215) 2 1

2 2
(n 1)
1053
1000 999
1
n

1 0.994
V (Y1 ) (16000) 2 1 238540.8
6 1000
Su error estndar ser :
S(Y) 238540.8 488.41
S(y) 488.41
La C.V(y) es : C.V(y) ( )(100) 12.46 Rpta.
y.100 3920

20.-Se desea realizar una encuesta familiar en una gran ciudad para
estimar la proporcin de familias que poseen ciertos atributos,
para las principales caractersticas, el valor de Pi=Ai/N se espera
oscile entre el 30% y el 70% Cul deber ser el tamao de
nuestra necesaria para estimar los parmetros siguientes con un
error estndar no mayor al 3%?
a) La proporcin global de P
b) Las proporciones individuales de P 1 para las familias.
c)
Clase Rango de ingresos anuales
1 De menos de 5000
2 De 5000 a menos de 10 000
3 De 10 000 a ms

d) La diferencia entre las proporciones (P i-Pj) para cada para de


clase de familias segn sus ingresos anuales.
Las estadsticas de la ciudad sobre distribuciones de ingresos
indican que las proporciones de familias segn las tres
clases de ingresos definidos anteriormente son: 50%, 38% y
12% respectivamente.
83
Mtodos Estadsticos Varela/Llanos/Asnate

Solucin:
a) La proporcin global P.
Si 130% P70% asumiremos que P=0.50 pues en ste valor
se esperara el mximo error estndar(pesimista), adems si
S(p) 0.03 la varianza deseada sera V0=(0.05)2
consideramos que el valor 1/N, es muy pequeo y se omite.
Entonces:
(0.5)(0.5)
n 278 Deberan ser encuestada s
(0.03)2
b) Para estimar las proporciones individuales P i:

Rango de
Clase Pi (1/Pi) N=(PQ/V0Pi)
ingresos
1 De <5000 0.50 2 556
2 De 5000 a 0.38 2.6316 732
3 <100000 0.12 8.333 2317
De 10000 a ms

Luego: n=Max[PQ//V0Pi]=2.317 sern necesarios visitar.

c) Las diferencias entre las proporciones (P i-Pj)

Pi - Pj [(1/Pi) (1/Pj)] n=(PQ/V0) [(1/Pi) (1/Pj)]


P1 P2 4.6316 1288
P1 P3 10.3330 2873
P2 P3 10.9649 3048

Luego: el mx. n= mx(PQ/V0) [(1/Pi) (1/Pj)]


n= 3048.

21.- A fin de estimar la proporcin de apoyo que dan los 10 000


empleados de una fbrica a una circular emitida por la gerencia ,
se enviar un cuestionario a una muestra al azar de empleados;
se cree que dicho apoyo fluctuar entre 10% y 60%.

84
Mtodos Estadsticos Varela/Llanos/Asnate

a) Encuentre el error estndar del estimador que se esperara


lograr enviando el cuestionario a 400 empleados.
b) Cuntos cuestionarios bebern ser remitidos para que el error
estndar del estimador, no supere el 2%?.
d) Determine el tamao de muestra necesaria para que el
coeficiente de variacin del estimador sea menor al 10% en
cuanto se estimar con dicho coeficiente de variacin de 250
se desea estimar a la proporcin verdadera.
Solucin:
a) El error estndar del estimador que se espera lograr
enviando el cuestionario a 400 empleados:

pq
S ( p ) 1 - f si p 0.1
n
400 (0.10)(0.90)
S(p) 1
10000 400
S(p) 0.0147

en tal caso el error estndar fluctuar entre 1.5%


Si p 0.5 (el error estndar mximo esperado)
400 (0.5)(0.5)
S(p) 1
10000 400
S ( p ) 0.0245

En tal caso el error estndar fluctuar entre 2.5%


b) Asumiendo un apoyo del 50% por ser el de mayor varianza:

85
Mtodos Estadsticos Varela/Llanos/Asnate


n0 Z 2 PQ PQ PQ PQ
n n0
n0 d 2
d
2
V0 S ( P)2
1 N
Z
(0.5)(0.5)
n0 625
(0.02) 2
625
n 588 cuestionarios
625
1
10000

86
Mtodos Estadsticos Varela/Llanos/Asnate

MUESTREO SISTEMTICO

Partimos de una poblacin de tamao N, y agrupamos sus elementos en


n zonas (filas) de tamao k(N=nk). Podramos representar la poblacin
como sigue:
i\j 1 2 3 j k

1 u11 u12 u13 u1 j u1k

2 u 21 u 22 u 23 u2 j u 2k

i u i1 ui 2 ui 3 u ij uik

n u n1 un2 u n3 u nj u nk
A continuacin se muestra los elementos de la tabla anterior de
izquierda a derecha empezando por la primera unidad de la primera fila
y pasando a la primera unidad de la fila siguiente cuando se agota
cualquier fila. Tendremos la siguiente estructura:
i \ j1 2 3 j k

1 u1 u2 u3 u j uk
2 u k 1 u k 2 u k 3 u k j u k k
3 u 2 k 1 u 2 k 2 u 2 k 3 u 2 k j u 2 k k

i u ( i 1) k 1 u (i 1) k 2 u (i 1) k 3 u (i 1) k j u (i 1) k k

n u ( n 1) k 1 u ( n 1) k 2 u ( n 1) k 3 u ( n 1) k j u ( n 1) k k

Para extraer una muestra de tamao n se elige al azar una unidad en la


primera zona, y para seleccionar las n-1 unidades restantes para la

87
Mtodos Estadsticos Varela/Llanos/Asnate

muestra se toma en cada zona la unidad que ocupa el mismo lugar


dentro de su zona que el que ocupaba la primera unidad seleccionada
para la muestra al azar en la primera zona es la tercera, se elegirn las n-
1 unidades restantes para la muestra tomando la tercera unidad de cada
zona. Las muestras sistemticas as obtenidas (columnas de la tabla
anterior) suelen denominarse muestras 1 en k.

La probabilidad de seleccionar cualquier muestra ser la probabilidad de


elegir la unidad que la originaria en la primera fila por muestreo
aleatorio simple, es decir, 1/k. Por tanto, el muestreo sistemtico
proporciona muestras equiprobables. Por otro lado, la probabilidad que
tiene cualquier unidad de la poblacin (de N unidades) de pertenecer a
la muestra (de tamao k) es k/N=k/nk=1/n.; por lo tanto, el muestreo
sistemtico es un tipo de muestreo con probabilidades iguales. Las
muestras del espacio muestral pueden representarse como sigue:

u~1 u1 , u1 k ,, u1n 1k

u~ j u j , u j k ,, u j n1k

u~k u k , u k k ,, u k n 1k
El muestreo sistemtico extiende la muestra a toda la poblacin,
recoge el posible efecto de estratificar debido al orden en que figuran las
unidades de la poblacin (cada fila se puede considerar como un
estrato), permite la consideracin de conglomerados en la poblacin
(cada columna se puede considerar como un conglomerado), es fcil de
aplicar y comprobar.

No representa problemas de clculo algebraico y no precisa distincin


entre aleatoria, la seleccin sistemtica equivale a un muestreo aleatorio

88
Mtodos Estadsticos Varela/Llanos/Asnate

simple. Por ultimo, el error de muestreo suele ser menor que en


muestreo aleatorio simple o incluso que en estratificado.
Por otro lado, hay que tener presente la posibilidad de aumento de
la varianza si existe periodicidad en la poblacin y el problema terico
que se presenta en la estimacin de varianzas debido a que no hay
independencia en la seleccin de unidades en las distintas zonas, ya que
la unidades extradas en cada zona dependes de la seleccionada en la
primera zona. En general solo hay seleccin aleatoria para la primera
unidad de la muestra

ESTIMADORES Y VARIANZAS

Se utilizarn el estimador lineal insesgado de Horwitz Thompson por


que el muestreo sistemtico es sin reposicin. En general sabemos que:
n
Yi
HT Estima insesgadamente el parmetro poblacional:
i i
n
Yi .
i

En muestreo sistemtico la poblacin i de seleccin de un elemento


poblacional cualquiera para la muestra ser igual a la probabilidad de
que resulte elegida la zona que lo contiene, esto es,
i 1 k n (nk ) n N , luego podemos utilizar la forma general
del estimador de Horwitz Thompson para asegurar lo siguiente:
n 1
Yi
estima insesgadamente el parmetro poblacional
i j 1
k
n 1
Yij .
i j
Si aplicamos la expresin anterior a las estimaciones del total, media,
proporcin y total de clase poblacionales, se obtienen los siguientes
estimadores:

89
Mtodos Estadsticos Varela/Llanos/Asnate

n 1 X ij n 1 n
Total X Yij X ij X k X ij N X ij Nx j
i j 1 1 i 1 n n i 1
k N

X ij
X ij n
1 n 1
Media X Yij X nk X ij x j
N
i j 1 1 n i 1
nk
k

Aij
Aij n 1
1 n
proporcin P Yij P nk Aij P j
nk i j 1 1 n i 1
k
n 1 A n
1 n
Totaldeclase X Yij Aij A k Aij N Aij NP j
ij

i j 1 1 i 1 n n i 1
k N

Hemos demostrado que un estimador lineal insesgado para la media


poblacional es la media de la muestra sistemtica obtenida, para la
proporcin poblacional es la proporcin de la muestra sistemtica, para
el total poblacional es N veces el total de clase maestral. Es decir,
podemos escribir lo siguiente:
Total X Nx j

Media X x j
proporcin P P j
Totaldeclase A NP j
VARIANZAS DE LOS ESTIMADORES
Definimos la cuasivarianza entre las k muestras posibles o cuasivarianza
intermuestral como:

90
Mtodos Estadsticos Varela/Llanos/Asnate

S bs2
1 n k
x j X 2
k 1 i j
Y la cuasivarianza dentro de las muestras o cuasivarianza intramuestral
como:
2
S ws
1 n k
X ij x j 2
N k i j
Con lo que la descomposicin de la suma de cuadrados para el anlisis
de la varianza poblacional permite escribir lo siguiente
2 2 2

X X X ij x j x j X N 1S 2 N k S ws2 k 1S bs2
n k n k n k

ij
i 1 j 1 i 1 j 1 i 1 j 1

N 1S 2 ( N k ) S ws
2
( k 1) Sbs2

A partir de la tabla del anlisis de la varianza para la poblacin que se


presenta a continuacin. Puede calcularse los errores de los estimadores.
Fuente Grados de Cuadrados
Suma de cuadrados
variacin libertad medios

Entre n k 2
S bs
( x X )
k-1 2
muestras
i j
n k
Dentro de
muestras
N-k ( X x )
i j
2
S bs
2

n k
total
k-1+(N-k) =
N-1 ( X X )
i j
2
S ws
2


V X V x j 1 f bs ,
2
S
n

V X V Nx j N 2V x j N 2 1 f bs
2
S
n

91
Mtodos Estadsticos Varela/Llanos/Asnate

1 k
k j

1 n k
nk i j
1 n k
N i j
2
1 k

V P V P j P j P P j P P j P PQ P j Q j
2 2

k j

1 k


n k
1 k
V A V NP j N 2V P j N 2 P j P N P j P N 2 PQ P j Q j
2 2

k j i j k j

Un concepto interesante en muestreo sistemtico es el coeficiente de


correlacin intramuestral w , que mide la interrelacin entre las
unidades dentro de las muestras. Lgicamente, esta interrelacin debe
ser lo mas pequea posible, ya que en el muestreo sistemtico interesa
la heterogeneidad intramuestral, con la finalidad de que una nica
muestra sistemtica represente lo mejor posible a toda la poblacin.
Para que una muestra sistemtica aspire a ser fiel espejo de toda la
poblacin ha de ser heterognea, y la interrelacin entre sus unidades ha
de ser baja. Por lo tanto, inicialmente parece lgico que interesen
valores muy pequeos del coeficiente de correlacin intramuestral. La
expresin matemtica de w es la siguiente:

2 X ij X X zj X
k n

i z
w
j
,
N n 1 2
2

X ij X var ianzapobla cional


1 k n

2

nk j i

La varianza de los estimadores pueden expresarse en funciones de w .


Para la medida tenemos:
2 N 1 S 2
V x j 1 n 1 w 1 n 1 w
n N n

2
V X V Nx j N 2V x j N 2 1 n 1 w N N 1 1 n 1 w
n
S2
n

92
Mtodos Estadsticos Varela/Llanos/Asnate


V P j
PQ
n

1 n 1 w V A N 2 PQ 1 n 1 w
n
Segn esta expresin, la precisin del muestreo sistemtico puede
analizarse en funcin del coeficiente de correlacin intramuestral, de tal
modo que la precisin mxima se produce para w 1 /( n 1) , y la
mnima para w 0 , igualndose la precisin del muestreo

sistemtico con la del muestreo aleatorio simple para w 0 . De esta


forma, para valores de w entre 1 /( n 1) y 0, el muestreo
sistemtico es mas precis que el aleatorio simple, y para valores de
w entre 0 y 1, el muestreo sistemtico es menos preciso que el
aleatorio simple. Por lo tanto, en cuanto a precisin, convienen valores
negativos del coeficiente de correlacin intraconglomerados w .

RELACIN ENTRE MUESTREO SISTEMTICO Y


MUESTREO ALEATORIO SIMPLE

El muestreo sistemtico se ideo con la finalidad de mejorar el muestreo


aleatorio simple pero habr ocasiones en que esta mejora es mxima. Se
2
demuestra mas supera la cuasivarianza intramuestral S ws a la
2
cuasivarianza poblacional S el muestreo sistemtico ms gana e
precisin al muestreo simple.

El prrafo anterior puede interpretarse diciendo que le muestreo


sistemtico es ms preciso que el aleatorio simple cuando la
variabilidad dentro de muestras es superior a la coincide con la del
2 2
aleatorio simple cuando S ws = S , es decir, cuando la variabilidad
dentro muestras es similar a la variabilidad dentro de las unidades de la
poblacin, y esto se da cuando la disposicin de los elementos en la
poblacin es aleatorio.
RELACIN ENTRE MUESTREO SISTEMTICO Y
MUESTREO ESTRATIFICADO

93
Mtodos Estadsticos Varela/Llanos/Asnate

En el muestreo sistemtico puede considerarse cada zona de k


elementos consecutivos a partir del primer como un estrato ; es decir se
puede dividir la poblacin en n estratos constituidos cada uno de ellos
por una finalidad de la tabla (k unidades ) del cuadro en que hemos
representado los elementos de al poblacin numerados
consecutivamente.

1 j k

1 X1 Xj Xk
2 X 1 k X jk X k k

i X 1 ( i 1) k X j ( i 1) k X k ( i 1) k

n X 1 ( n 1) k X j ( n 1) k X k ( n 1) k
Obtener una muestra sistemtica seria entonces seria entonces
equivalente a obtener une muestra estratificada con la finalidad con
unidades por estrato. debe tenerse en cuenta ,sin embargo ,que en el
muestreo estratificado aleatorio la seleccin se efecta
independientemente en cada estrato ,mientras que en el muestreo
sistemtico todos los elementos seleccionados ocupan el mismo lugar
o numer de orden dentro de cada zona de k elementos , con la que no
hay aleatoriedad de seleccin .adems ,seria conveniente que a las zonas
sistemticas de k elementos cada una (estratos) sean lo mas
homogneas posible dentro de ellas y heterogneas entre ellas .estas
clasificaciones de los elementos de la poblacin en n filas de k
unidades cada una origina la siguiente tabla del anlisis de la varianza
poblacional:

F de V G.L. + de Cuadr. Cuad. Med.


n k
Entre estratos n 1 ( X
i j
i X )2 2
S bst

94
Mtodos Estadsticos Varela/Llanos/Asnate

n k
Dentro de estratos N n ( X
i j
ij X i )2
2
S wst

n k
Total n 1 ( N 1) N 1 ( X ij X j ) S2
i j

Si definimos la cuasivarianza entre la n estratos posibles, o el


cuasivarianza intraestratal como:
1 n k
2
S bss ( X i X ) 2
n 1 i j
Y la cuasivarianza dentro de los estratos o cuasivarianza intraestratal
como:

1 n k
( X ij X i ) 2
2 2
S wss
N n i j
Tenemos:

n k n k n k

( X ij X ) 2 ( X ij X i ) 2 ( X i X ) 2 (N 1)S 2 (N n)S wst2 (n 1)Sbst2


i 1 j 1 i 1 j 1 i 1 j 1

( N 1)S 2 ( N n) S wst
2
(n 1) S bst
2

Tenemos entonces que la varianza de la media puede expresarse como:

h i
n
1
i n
S2 1 1 n
V X V X st Wh2V X h Wi 2V X i 2 1 f i i 2 1 S i2
L n

ni n k i

N n 2
2

X ij X i n 2 k X ij X i S wst 1 f
1 1 n 1 k 1 n k 2
S wst
1
2

n2 k i k 1 j i j Nn n

95
Mtodos Estadsticos Varela/Llanos/Asnate

( N n) S wst
2

Si definimos el coeficiente de correlacin intraestratal wst como el


coeficiente de correlacin lineal entre las desviaciones respecto de las
medias de los estratos de todos los pares de valores que estn en la
misma muestra sistemtica, su expresin puede calcularse de la
siguiente forma:

X ij X i X Zj X z k n
1 k n
n j i z
k 2 X ij X i X zj X z
covX ij ; X zj 2 j i z
wst
nn 1k 1S wst2
1 k n
X ij X i 2
k n
1
ij i
2
X X
N j i 1 N j i 1

( N n) S wst
2

Se demuestra que la varianza del estimador de la media en funcin de


wst y S wst tiene la forma siguiente:


V X V X j 1 f wst 1 n 1 wst
2
S
n
Y lo mismo se calcular las varianzas del resto de los estimadores en
funcin del coeficiente de correlacin intraestratal wst .
La precisin mxima, que evidentemente se da cuando el error de
muestreo es cero V X 0, se produce si n 1
j wst 1 , luego
se puede asegurar que la precisin mxima si:

V X j 0 wst
1
n 1
La precisin mnima, que evidentemente se da cuando la varianza es
mxima, se produce si wst 1 (valor mximo de wst que ser el

que efectivamente hace mxima V X j ), luego se puede asegurar que


PRECISN MNIMA wst 1 . Por otra parte:

96
Mtodos Estadsticos Varela/Llanos/Asnate

wst 0 V X j 1 f
2
S wst
n
Como lo que el muestreo sistemtico coincide en precisin con el
muestreo aleatoria independiente en cada estrato. De esta forma, wst
es en cierta forma una medida de la falta de aleatoriedad en la seleccin
de unidades para la muestra en las distintas zonas sistemticas (filas o
estratos).

ESTIMACIN DE LA VARIANZA
No podemos decir que en muestreo sistemtico haya un mtodo directo
para la estimacin de varianzas a partir de una muestra sistemtica.
Tenemos las siguientes situaciones:
a. prximo a cero o S
2
ws S2
Si el coeficiente de correlacin intramuestral se aproxima a cero puede
suponer la poblacin y si S ws S la precisin del aleatorio simple y
2 2

el estratificado coinciden, con lo que la estimacin de ka varianza puede


realizarse con la misma expresin que en muestreo aleatorio simple, es
decir:
S 2
V x (1 f )

n
Siendo S 2 la cuasivarianza de la muestra sistemtica
b. st prximo a cero

Si st se aproxima a cero se puede utilizar el muestreo sistemtico


como muestreo estratificado considerando cada zona sistemtica como
un estrato y seleccionando una muestra estratificada con una unidad por
estrato. La razn de esta utilizacin es que la precisin del muestreo
sistemtico se iguala con la del muestreo aleatorio estratificado para
st =0. En la practica, lo que se hace es mezclar antes de la seleccin,
las 2k unidades de dos zonas en una nica zona, con lo que se
transforman las n zonas de k unidades cada una en n/2 zonas de 2k
unidades cada una (si n s impar, para la zona que queda suelta se repite
97
Mtodos Estadsticos Varela/Llanos/Asnate

aleatoriamente un elemento de la muestra). Con este mtodo se


transforman las n zonas de k unidades de 2k unidades. Con ello se
dispone de dos unidades mustrales por zona. Aplicando las formulas de
muestreo estratificado tenemos:

n n n
S 2 2 2
2
x x 2 2 1 f
V xst Wh2 1 f h h 1 f h1 h 2 x xh 2
2 2
2
2
h1
h nh h n 2 n h

c. Ni ni st estn prximos a cero:


En este caso utilizaremos alguno de los mtodos especiales generales
para la estimacin de varianzas. Concretamente podemos utilizar el
mtodo de las muestras interpenetrantes, que se utiliza cuando tenemos
un conjunto de dos o ms muestras, elegidas con el mismo esquema de
muestreo (independientes o no) y tales que cada una proporcione una
estimacin vlida del parmetro que se pretenda estimar con el mismo
error de muestreo. Si las muestras son independientes es fcil obtener un
estimador in sesgado de la varianza del estimador. Para aplicar el
mtodo de las muestras interpenetrantes al muestreo sistemtico
supongamos que en vez de elegir una muestra sistemtica de tamao n
para un solo valor j, j k, es decir, con un solo arranque aleatorio,
obtenemos t muestras de tamao n/t utilizando t arranques aleatorios.
Estas muestras pueden considerarse independientes, ya que la eleccin
del arranque es aleatoria en la primera zona sistemtica.

Podemos formar un estimador combinado de la media poblacional


basado en las medias de la t muestras (cada media muestral es un
estimador insesgado de la misma media poblacional) definido como:

1 t
xc xt
t 1
Siendo el estimador in sesgado de su varianza mediante la aplicacin
del mtodo de las muestras interpenetrantes:

98
Mtodos Estadsticos Varela/Llanos/Asnate

1 t 2 t 2
V xc
1 t 2
t t 1 i
x tx 2
x x
1 t 2
i c t t 1 i i i c t t 1 i xi xc2

La frmula puede multiplicarse tambin por (1-f) En particular para t =
2 tenemos:
x x x x x x x x
2 2 2

xc 1 2 V xc x12 1 2 x22 1 2 1 2
2 2 2 4

Se observa que al aumentar el nmero de arranques aleatorios,


manteniendo el mismo tamao de muestra, la precisin obtenida se
aproxima a la del muestreo aleatorio simple.

RELACIN ENTRE MUESTREO SISTEMTICO Y POR


CONGLOMERADOS
En el muestreo sistemtico puede considerarse cada columna de n
elementos como un conglomerado; es decir, se puede dividir la
poblacin en k conglomerados constituidos cada uno de ellos por una
columna de la tabla (n unidades). Obtener una muestra sistemtica sera
entonces equivalente a obtener una muestra por conglomerados de
tamao l.

1 j k

1 X1 Xj Xk 2

X 1 k X jk X k k

i X 1 ( i 1) k X j ( i 1) k X k ( i 1) k

n X 1 ( n 1) k X j ( n 1) k X k ( n 1) k

PROBLEMAS RESUELTOS
99
Mtodos Estadsticos Varela/Llanos/Asnate

1.- En un proceso de fabricacin de automviles se trata de analizar la


produccin de piezas en serie de trece robots. Para ello se controlaron
las piezas en de trece robots en la primera hora de su funcionamiento y
se obtuvo la siguiente distribucin
N de 1 2 3 4 5 6 7 8 9 10 11 12 13
robots
N de 5 5 4 2 5 4 5 4 3 4 4 3 2
piezas
producidas

Con la finalidad de estimar el numero de piezas defectuosas en el


proceso de fabricacin, se realiza un muestreo sistemtico 1 en 5, es
decir, se selecciona una de cada cinco piezas, para pasar a continuacin
la primera pieza del segundo robot hasta que se agoten sus piezas, y as
sucesivamente hasta que se agoten todas las piezas de todos los robots.
Suponiendo que la primera pieza producida por cada robot es defectuosa
y que todas las dems son correctas, se pide lo siguiente:

a) Calcular la varianza del estimador de la produccin de piezas


defectuosas producidas por los robots y el valor del coeficiente de
correlacin intramuestral. Existir ganancia en presin respecto de
un muestreo irrestricto aleatorio con fraccin de muestreo del 20%?
Por qu? Cuantificarla. realizar la tabla del anlisis de la varianza
para la produccin total.
b) Estimar l varianza para cada muestra sistemtica posible segn
nuestro procedimiento de muestreo. Con qu muestra sistemtica
nos quedaremos que presente mejor a toda la produccin? Existir
ganancia en precisin si se estima las varianzas utilizando
estatificacin? Dar la estimacin de la proporcin de piezas
defectuosas producidas por los robots.
Solucin:

Si definimos una variable dicotomica A a la que asignamos el valor


1 para las piezas defectuosas y el valor de 0 para las piezas
correctas, y clasificamos las 50 piezas en la 10 filas de 5 piezas
100
Mtodos Estadsticos Varela/Llanos/Asnate

cada una (muestreo sistemtico 1 en 5) siguiendo el orden del


enunciado del problema, tendremos la tabla
1 0 0 0 0 1/5
1 0 0 0 0 1/5
1 0 0 0 1 2/5
0 1 0 0 0 1/5
0 1 0 0 0 1/5
1 0 0 0 0 1/5
1 0 0 0 1 2/5
0 0 1 0 0 1/5
0 1 0 0 0 1/5
1 0 0 1 0 2/5
6/10 3/10 1/10 1/10 2/10 13/50

A continuacin, se construye la tabla del anlisis de la varianza


para la poblacin (produccin total) utilizando Ecxel. Como
estamos clasificando los datos en 5 grupos (columnas), utilizaremos
una variable G, que clasificara los valores de A (ceros o unos) por
grupos (por columnas). Introducimos los valores de g en columnas
de la hoja de clculo de Excel y elegimos Anlisis de varianza de
un factor en la opcin Anlisis de datos del men Herramienta,
rellenando su pantalla de entrada como indica en la Figura presenta
los resultados.

101
Mtodos Estadsticos Varela/Llanos/Asnate

Con la notacin que utilizamos habitualmente, la tabla ANOVA


ser:

Grado
Fuent s de
Sumas de Cuadrados Cuadrados Medios
e Libert
ad
n k _ _

Entre
k-1=5-
1=4
i
j ( x j X ) 2 1.72 S bs2 1.72 / 4 1.43

n k _

(X
N-
x j ) 2 7.9 S ws 7.9 / 45 0.1755
2
Dentr
k=50- ij
o i j
5=45

n k _

( X ij X j ) 2 9.62S 9.62 / 49 0.1963


N- 2
Total 1=50-
1=49 i j

Conocida esta tabla, pueden realizarse ya todos los clculos. La


varianza del estimador de la proporcin puede calcularse como:

n S BS 1 0.43
2 2
S BS
V P V PJ 1 (1 f ) 1 0.0344
N n n 5 10

102
Mtodos Estadsticos Varela/Llanos/Asnate

La varianza para el estimador del total de clase ser:


2
S
V A V NPJ N 2V PJ N 2 (1 f ) BS 50 2 * 0.0344 86
n

Del valor de la varianza puede deducirse el valor del coeficiente de


correlacin intramuestral a travs de la frmula
2
V x J (1 ( N 1) ) .Tenemos:
n
49
0.1963
0.0344 50 (1 (10 1) 0.0875
10
Se observa un valor de muy cercano a cero. Lo que indica que el
muestreo sistemtico va a tener una precisin muy cercana a la del
aleatorio simple en la estimacin de la proporcin de piezas
2 2
defectuosas. Esto concuerda con el hecho S y S ws tambin tienen
2 2
valores muy cercanos. Concretamente S = 0.1963 > S ws =0.1755, lo
que indica que es mas preciso el muestreo aleatorio simple. La varianza
del estimador de la proporcin en el muestreo aleatorio simple es ((1-
1/5)0.1963)/10 = 0.0157, lo que indica que la ganancia en precisin del
aleatorio simple ser (0.0344-0.0157)/0.0344 = 54.3%.

Dado el valor del coeficiente de correlacin intramuestral, muy cercano


a cero, podemos estimar varianzas mediante la formula del muestreo
aleatorio simple. Se tiene:

6 6
Q 1

2
S P 10 10
V P1 1 f 1 (1 f ) 1 1 1 1
1
0.0213
n n 1 5 10 1

103
Mtodos Estadsticos Varela/Llanos/Asnate

3 3
1
1 10 10
2
S PQ
V P2 1 f 2 (1 f ) 2 2 1 1 0.0186
n n 1 5 10 1

1 1
1
P Q 1 10 10
2
S
V P3 1 f 3 (1 f ) 3 3 1 1 0.008
n n 1 5 10 1


V P4 V P3 0.008
2 2
1
1 10 10
2
S PQ
V P5 1 f 5 (1 f ) 5 5 1 1 0.0142
n n 1 5 10 1

Segn estos resultados las muestras ms precisas son la tercera y la


cuarta
Tambin podemos estimar la varianza a partir del muestreo
estratificado, agrupando las 10 filas (estratos) de la poblacin en grupos
de 2, y considerando cada 2 filas como un estrado del que
seleccionamos 2 unidades para la muestra. Tendremos:

1 f 1 0.2

n/2
V P1 2 x xh 2 (1 1) 2 (1 0) 2 (0 1) 2 (1 0) 2 (0 1) 2 0.032
2
h1 2
n h 10

1 f 1 0.2

n/2
V P2 2 x xh2 (0 0) 2 (0 1) 2 (1 0) 2 (0 0) 2 (1 0) 2 0.024
2
h1 2
n h 10


V P3 0.008(0 1) 2 0.008 V P4
V P 0.008(1 0)
5
2

(1 0) 2 0.016
Las mejores segn el mtodo del muestreo estratificado tambin
resultan ser la tercera y la cuarta, y adems coinciden en varianza con el

104
Mtodos Estadsticos Varela/Llanos/Asnate

mtodo anterior. Para las restantes muestras se observa ganancia en


presin del mtodo de estimacin utilizando la formula del muestreo
aleatorio simple. La proporcin estima de de piezas defectuosa
producidas ser la derivada de la 3 o 4 muestra, esto es
P P3 P4 1 / 10 ; es decir que estima 10% de produccin
defectuoso

2.- Una manzana de casas de una ciudad contiene 36 hogares


numerados del 1 al 36. Los hogares con ingresos mensuales superiores a
1500 soles son las que tienen los nmeros 3, 5-7, 11-13, 15-16, 20-22,
25-26, 28 y 30-34.
a) Se trata de estimar la proporcin de hogares con sueldo mensual
superior a 1500 soles utilizando muestre sistemtico. Comparar la
precisin de una muestra sistemtica 1en 4 con una muestra aleatoria
simple del mismo tamao para estimar la proporcin de hogares con
sueldo mensual superior a 1500 soles. Justificar la respuesta en
funcin del valor del coeficiente de correlacin intramuestral y en
funcin de la cuasivarianza intramuestral.
b) Halle el tamao de la muestra necesaria para estimar la proporcin
de viviendas en las que los ingresos mensuales son superiores a 1500
euros para un error de muestreo de 16 centsimas. Hallar ese mismo
tamao para muestreo aleatorio simple y comentar el resultado.
Solucin:
Si definimos una variable dicotmica A, a la que asignamos el valor 1
para los hogares en que los ingresos mensuales superan los 1500 soles y
el valor de 0 para el resto de los hogares, y clasificamos los 36 hogares
en 9 filas de 4 viviendas cada una(muestreo sistemtico uno en 4)
siguiendo el orden del enunciado del problema, tendremos la siguiente
tabla:

0 0 1 0
1 1 1 0
0 0 1 1
1 0 1 1
0 0 0 1

105
Mtodos Estadsticos Varela/Llanos/Asnate

1 1 0 0
1 1 0 1
0 1 1 1
1 1 0 0
5 5 5 5 5
9 9 9 9 9

Para calcular la varianza del estimador sistemtico de la proporcin


hacemos:

1 5 5 5 5 5 5 5 5

2 2 2 2

V P 0
4 9 9 9 9 9 9 9 9
Tambin podemos calcular la varianza del estimador de la proporcin
como

1 k
k j 1
20 20 1 5 4 5 4 5 4 5 4
V P PQ P j Q j 1 0
36 36 4 9 9 9 9 9 9 9 9

A continuacin se construye la tabla de anlisis de la varianza para la


poblacin (Produccin total) utilizando Excel. Como estamos
clasificando los datos en 4 grupos (columnas), utilizamos una variable
G, en columnas de la hoja de clculo de Excel y elegiremos anlisis de
varianza de un factor en la opcin Anlisis de datos del men
Herramientas.

106
Mtodos Estadsticos Varela/Llanos/Asnate

Por lo tanto, la tabla del anlisis de la varianza para la poblacin es la


siguiente:

107
Mtodos Estadsticos Varela/Llanos/Asnate

Grados de
Fuente Sumas de Cuadrados Cuadrados Medios
Libertad

n k _ _
Entre k-1=4-1=3
i
(x j X )2 0
j
S bs2 0 / 3 0

n k _ 2
S ws 8.88 / 32 0.277
( X ij x j ) 2 8.88
N-k=36-
Dentro
4=32
i j

n k _
Total
N-1=36-
1=35 i
( X ij X j ) 2 8.88
j
S 2 8.88 / 35 0.254

Conocida esta tabla pueden realizarse ya todos los clculos. Por


ejemplo, la varianza del estimador de la proporcin tambin podra
calcularse como:


n S bs2
V P V Pj 1 1 f
S bs2 1 0
1 0
N n n 49
Del valor de la varianza puede deducirse el valor del coeficiente de
correlacin intramuestral a travs de la formula:
2
V (x j ) (1 (n 1) )
n
Tendremos:
35
0.254
36 1 1
0 (1 (9 1) ) 0.125
9 8 n 1
Estamos ante el caso de mxima precisin del muestreo sistemtico, ya
1
que la varianza es nula, o lo que es lo mismo, .
n 1

108
Mtodos Estadsticos Varela/Llanos/Asnate

2 2
Este hecho concuerda con los valores que toman S y S ws .

Concretamente S
2
0.254 S ws
2
0.277 , lo que indica que es
ms preciso el muestreo sistemtico que el aleatorio simple.
La varianza del estimador de la proporcin en el muestreo aleatorio
simple es (1 - 1/4) * 0.254/9 0.021 .
Para resolver la segunda parte del problema consideramos ahora cada
una de las 9 zonas (filas) como un estrato de 4 unidades. Tenemos
entonces dividida la poblacin en 9 estratos de 4 unidades cada uno, de
modo que la muestra sistemtica consta de una unidad por estrato que
de forma general no es elegida aleatoriamente dentro del mismo. Esta
clasificaron de los elementos de la poblacin en 9 filas y 4 unidades
cada una origina una tabla del anlisis de la varianza que se puede
calcular con Excel.
Como estamos clasificando los datos en 9 filas (estratos), utilizamos las
variables G5 a G13 , que recogen los valores de las 9 filas. A
continuacin elegimos anlisis de varianza de un factor en la opcin
anlisis de datos del men herramientas.

109
Mtodos Estadsticos Varela/Llanos/Asnate

El cuadro de anlisis de la varianza por estrato es entonces el siguiente:


Grados de
Fuente Sumas de Cuadrados Cuadrados Medios
Libertad
n k _ _

Entre n-1=9-1=8 (x
i j
j X ) 2 1.388 S bs2 1.388 / 8 0.1735

n k _

(X x j ) 2 7.5 S ws 7.5 / 27 0.2777


2
Dentro N-n=36-9=27 ij
i j

n k _

(X X j ) 2 8.888S 8.888 / 35 0.254


2
Total N-1=36-1=35 ij
i j

110
Mtodos Estadsticos Varela/Llanos/Asnate

Calculamos ahora el valor del coeficiente de correlacin st como


sigue:
k n
2 ( X ij X i )( X zj X z )
j i z
st
n(n 1)(k 1)S wst2
2 1 3 1 1 3 1
(0 )(1 ) (0 )(0 ) ... (1 )(0 ) 0.125
9 * 8 * 3 * 0.277 4 4 4 2 4 2
Para calcular el tamao de la muestra necesario para cometer un error de
muestreo igual a 0.16 despejamos n en la expresin que define la

varianza de la proporcin en funcin de st tenemos:


S2 n 0.277
V Pst 1 f wst (1 (n 1) st ) 0.16 2 1 (1 (n 1)(0.125))
n 36 n
n5

Para calcular el tamao de muestra anterior en muestreo aleatorio


simple despejamos n en la expresin que define la varianza de la
proporcin de ese tipo de muestreo. Tenemos:


V Pst 1 f
S2 n 0.254
0.16 2 1 n8
n 36 n
Obviamente el tamao de muestra necesario para cometer el mismo
error de muestreo es mayor en muestreo aleatorio simple que en
muestreo sistemtico, ya que en este problema el muestreo sistemtico
es ms preciso que el muestreo aleatorio simple.

RECOMENDACIONES Y SUGERENCIAS
111
Mtodos Estadsticos Varela/Llanos/Asnate

Las muestras sistemticas son de extraccin y ejecucin conveniente.


En la mayora de estudios sobre poblaciones artificiales y poblaciones
naturales pudieron compararse favorablemente en lo que a la preedicin
respecta con las muestras aleatorias estratificadas. Sus desventajas son
que pueden dar una precisin mediocre cuando se presenta una
periodicidad insospechada, y que no se conoce an un mtodo confiable
para estimacin de V Ysy a partir de los datos de la muestra.
A la luz de estos resultados podemos recomendar el muestreo
sistemtico en las situaciones siguientes.

1. Cuando el ordenamiento de la poblacin es esencialmente


aleatorio o contiene a lo mas un estratificacin dbil. Aqu, el
muestreo sistemtico se usa por conveniencia y se esperan
pocas ganancias de precisin. Se cuenta con estimaciones
mustrales de error que son razonablemente insesgadas.

2. cuando se emplea una estratificacin con numerosos estratos y


se toma una muestra sistemtica independiente en cada estrato.
Los efectos de la periodicidades ocultas tienen tendencia a
neutralizar en esta situacin y puede obtenerse una estimacin
del error que se sabe es una sobreestimacin. En forma
alternativa, podemos usar la mitad de los estratos y tomar dos
muestras sistemticas, con inicios aleatorios independientes en
cada estrato. Este mtodo da una estimacin insesgada del
error.

3. para unidades conglomerados de sub muestreo. En este caso


puede obtenerse una estimacin casi insesgada o insesgada del
error de muestreo en la mayora de las situaciones practicas.

4. para muestrear poblaciones que tienen una variacin de tipo


continuo a condicin de que no se requiera regularmente una
estimacin de error del muestreo. Si se hace una serie de

112
Mtodos Estadsticos Varela/Llanos/Asnate

encuestas de ese tipo, ser suficiente una verificacin ocasional


de los errores de muestreo.

Observacin

El mtodo tal como se ha definido anteriormente es sesgado si N


n
no es entero, ya que los ltimos elementos de la lista nunca pueden ser
escogidos. Un modo de evitar este problema consiste en considerar la
lista como si fuese circular (el elemento N+1 coincide con el primero)
y:

Sea k el entero ms cercano a N ;


n
Se selecciona un nmero al azar m, entre 1 y N;
Se toma como muestra los elementos de la lista que consisten
en ir saltando de k elementos en k, a partir de m, teniendo en
cuenta que la lista es circular

VENTAJAS RESPECTO AL MUESTREO ALEATORIO SIMPLE

1. Es ms fcil sacra una muestra y a menudo, hacerlo sin


cometer errores. Esta es una ventaja particular cuando la
extraccin se hace en el rea. Aunque la extraccin se haga en
una oficina este mtodo, puede ahorra mucho tiempo.

2. Intuitivamente, el muestreo sistemtico parece ser ms preciso


que el aleatorio simple. En efecto, estratifica la poblacin en n
estratos, que consisten de las primeras k unidades, las
segundas k unidades, etc. Por lo tanto, podemos esperar que la
muestra sistemtica sea tan preciso como la muestra aleatoria
estratificada correspondiente con una unidad por estrato.

113
Mtodos Estadsticos Varela/Llanos/Asnate

GLOSARIO
Cuasivarianza: Caracterstica de una muestra o poblacin que
cuantifica su dispersin o variabilidad. La cuasivarianza se obtiene
multiplicando la varianza por
n / (n-1). La cuasivarianza muestral es un estimador centrado (no
sesgado) de la varianza poblacional.
Estimador Insesgado: Es un estimador cuyo promedio es el valor
del parmetro desconocido. Su valor esperado es el valor del
parmetro poblacional. Un estimador insesgado es uno que tiene la
propiedad de exactitud.
Insesgadez: Se denomina sesgo de un estimador a la diferencia
entre la esperanza (o valor esperado) del estimador y el verdadero
valor del parmetro a estimar. Es deseable que un estimador sea
insesgado o centrado, es decir, que su sesgo sea nulo por ser su
esperanza igual al parmetro que se desea estimar.
Intramuestra: Es la variacin que se da dentro de cada muestra.
Estratal: Son las diferentes operaciones que se da entre estratos.

114
Mtodos Estadsticos Varela/Llanos/Asnate

BIBLIOGRAFIA:

1.- Azorn, F; Snchez-Crespo, J. L. (1986) Mtodos y aplicaciones


del muestreo Alianza Universidad textos, Alianza editorial.
2.- Cochran, W. G. (1971) Tcnicas de muestreo
Compaa editorial continental
Lislv, L. (1972) Muestreo de encuestas, Editorial Trillar.
3.- Miras, J. (1985) Elementos de muestreo para poblaciones finitas
INE.
4.- Silva Ayaguer, L. C. (1993) Muestreo para la investigacin en
ciencias de la salud, Editorial Daz Santos.
5.- Scheaffer, R. L.; Mendenhall, W; Ott, L. (1987) Elementos de
muestreo, Grupo editorial Iberoamrica
6.- Cristobal Exebio C. - Univercidad Nacional de Trujillo - muestreo
y aplicaciones.
7- Csar Prez Lpez Universidad Complutense de Madrid -
Muestreo estadstico.
8.- Sharon l. Lohr Arizona State University muestreo, diseo y
anlisis.
9.- www.elestadistico.com

115
Mtodos Estadsticos Varela/Llanos/Asnate

116

Vous aimerez peut-être aussi