Vous êtes sur la page 1sur 27

CONCEPTOS DE MUESTREO

1. CONCEPTOS PREVIOS
POBLACIN.
Conjunto de elementos que gozan de algunas caractersticas o propiedades comunes,
las que permiten identificarlos y definir su comportamiento.
Usando

la

teora

de

conjuntos,

una

poblacin

se

representa

por

el

conjunto .................
Al hablar de los Nmeros Naturales, de los Nmeros Reales; vemos que cada uno de
ellos tiene su conjunto .................... A este conjunto le podramos llamar Poblacin
de nmeros naturales, enteros o poblacin de nmeros reales.

Poblacin de nmeros Reales

Poblacin de nmeros Enteros


Poblacin de nmeros naturales

Una determinada poblacin est contenida o es parte de una poblacin ms grande.


Entre otros ejemplos de poblaciones, podemos citar:
1.

Los ingresos mensuales de Todos los trabajadores de la PEA.

2.

Los ingresos mensuales de los trabajadores del Sector Textil.

3.

Los ingresos mensuales de los trabajadores del Sector de Construccin Civil de


Lima Metropolitana.

4.

El nmero de horas de estudio adicionales que tiene cada uno de los alumnos de
la Universidad de Lima.

5.

El tiempo de vida de las bacterias contenidas en una determinada sustancia.

6.

El rendimiento acadmico de los alumnos de los colegios secundarios de Lima


Metropolitana.

7.

La tendencia electoral de la poblacin electoral de una regin del Per, dividida


por sectores de la PEA.

8.

Niveles de preferencia de la poblacin del Per por los ltimos modelos de


Ferrari.

9.

El nmero de viajes semanales que realiza una persona por la Avenida Tupac
Amaru.
etc.

La poblacin puede ser Finita o Infinita.


Cuando su tamao no sea conocido se supondr que es ....................
Cuando se trate de realizar un estudio se debe distinguir dos tipos de poblacin: una
Poblacin Terica: Conjunto total de los elementos que conforman su universo y una
Poblacin Real o Estudiada: Una parte de la poblacin terica (puede ser toda) capaz
de ser sometida a estudio o experimento.
Ejemplo explicativo:
En cierto distrito de Lima Metropolitana, la poblacin terica est compuesto por
95,458 ciudadanos mayores de 18 aos. La poblacin, sujeta a estudio, es la poblacin
electoral de dicho distrito, formada por 65,536 ciudadanos electores mayores de 18 aos
(que tienen documento de identidad). En algunos otros libros de Estadstica, a la
poblacin, sujeta a estudio, se le conoce tambin como Poblacin Muestral.
Describa otro ejemplo explicativo

CENSO
Es el estudio realizado sobre TODOS los elementos de la poblacin. Dependiendo de la
naturaleza del censo, esta se podr realizar sobre la poblacin terica o la poblacin
sujeta a estudio. Si de preferencia electoral se trata, el censo realizado sobre la
poblacin terica arrojar resultados no tan realistas ni significativos, lo que s se
obtendra, si se realiza un censo sobre el consumo de alimentos o necesidades de
vivienda. Toda la poblacin no puede elegir, pero toda ella s consume.

ENCUESTA
Es la consulta que se puede realizar a travs de un censo. Una encuesta est formada por
un conjunto de preguntas cuidadosamente diseadas, seleccionadas y distribuidas; a las
cuales se somete a los elementos de la poblacin. Muchas veces el resultado de un censo
depende fundamentalmente de la encuesta y de la forma cmo est diseada. Una
encuesta es tambin una consulta realizada a una parte representativa de la poblacin.
Entre las modalidades de llevar a cabo una encuesta se tiene las entrevistas por telfono,
personales, por correo, etc. El trabajo que significa encuestar a la poblacin o a una
parte de ella se conoce como trabajo de campo.

MUESTRA
Es una parte de la poblacin sujeta a estudio. Cuando no es posible, o no conviene
realizar un estudio sobre la poblacin, se realiza sobre una parte de ella, sobre una
muestra. La realizacin de un censo no siempre es posible. El censo poblacional se
realiza cada 10 o ms aos, de ser posible.

No se puede realizar un censo mensual sobre la aprobacin o desaprobacin de la


gestin presidencial a toda la Gran Lima conformada por ms de 6 millones de
electores.
Por qu? ...................................................................................................................
Se puede realizar un estudio sobre la muestra, mensualmente? ..............................

Podramos realizar un censo mensual sobre el dinero que lleva en sus bolsillos los
alumnos de la Escuela de Negocios de la Universidad de Lima; pero tal vez sea
suficiente realizar el estudio a una parte de los alumnos de dicha escuela; es decir,
sobre una muestra.

La muestra, que es parte de la poblacin, debe ser, ante todo, representativa. Ella
debe reflejar el sentir de la poblacin de la cual se ha extrado, debe recoger sus
caractersticas, debe ser capaz de transmitir y reflejar el comportamiento de la
poblacin.
Es importante la forma cmo se escoge, selecciona o se elige los elementos de la
poblacin que van a conformar la muestra.
El estudio sobre la preferencia del ltimo modelo de Ferrari realizado en Comas no slo
sera sesgado, sino generara resultados no esperados (?).
Si slo se encuesta por sus ingresos medios a los congresistas, personal de confianza y
directivos de todas las dependencias estatales podemos tener resultados errneos,
respecto a los ingresos promedios de todos los trabajadores del sector estatal.
Veamos esto con un ejemplo.
Ejemplo:

Ejecute el programa Minitab. Abra el archivo Ejemplo mal muestreo.mtw. En el


siguiente esquema se muestran algunos de los datos.
C1
Empleados
1377.32
2047.90
2214.82
860.12
1427.85

C2
Altos puestos
17154.1
16706.1
22436.7
20911.9
12876.4

C3
Congresistas
51593.5
51061.1
51866.5
51252.9
51345.9

C4
Todos

Con la ayuda del comando <Data>, apile (Stack) las columnas C1, C2 y C3 en la
columna C4 (Todos). Luego construya un grfico de puntos (DotPlot). Para ello use la
siguiente secuencia:
Para apilar las columnas:
<Data> - <Stack> - <Columns>. Seleccione las tres columnas y haga clic en <Select>.
Active <Column of current WorkSheet>. Digite C4 y clic en <Ok>
Para el grfico:
<Graph> - <DotPlot>. En <One Y> haga clic en <Simple> - <Ok>. A continuacin, en
Dotplot of Todos

7000

14000

21000

28000
Todos

35000

42000

49000

Each symbol represents up to 4 observations.

<Graph variables> ingrese C4 (Todos) - <Ok>


En el grfico anterior se muestra los posibles resultados que se obtendran si se lleva a
cabo este tipo de estudio.

Es pues imprescindible y requisito fundamental, elegir una muestra representativa de la


poblacin a ser estudiada.

2. CONCEPTO DE MUESTREO
La seleccin de los elementos de la poblacin para conformar una muestra, genera el
concepto definido como marco o espacio muestral.
Y puesto que el proceso de seleccionar constituye un experimento, ensayo o
fenmeno, entonces es lgico que los resultados de dicho proceso generen el espacio
muestral.
As lo dijimos al inicio.
Queda claro entonces que, cuando hemos dicho Sea X1, X2, ..., Xn, un conjunto de
n variables ... , implica que dichos elementos han sido extrados de una poblacin
para formar la muestra de tamao n.
Abra el archivo ExtraerMuestra.ppt y realice la presentacin.
Este procedimiento de extraer elementos de una poblacin, siguiendo algn mtodo,
regla o algoritmo determinado, se conoce como Muestreo.
Haga clic aqu para ver otro ejemplo y si no es posible, abra el archivo Pob01.xls.

En consecuencia, muestrear una poblacin, significa extraer una parte de ella para
conformar una muestra, cuyo tamao, ser n, mientras que el tamao poblacional
ser definido como N.

Ejemplos:
1.

Supongamos que se desea estudiar el porcentaje de pasajeros que viajan de pie


en los colectivos durante las horas punta. Aqu N es el total de pasajeros que viajan

de pie en todos los vehculos de transporte pblico (operativos durante el estudio de


campo) y n ser el nmero de pasajeros tomados en cuenta para realizar el estudio.
2.

El Gerente de produccin de una empresa est interesado en evaluar el


porcentaje de pernos defectuosos elaborados por cinco mquinas, obtenidos al final
de cada da. Si de la produccin total de un da, N, se decide examinar a n de ellos,
diremos que N es el total de pernos fabricados y n es el nmero de pernos
examinados.

3.

Un grupo de economistas est interesado en analizar el comportamiento que


sigue el valor de las acciones de todas las empresas que se encuentran registradas en
la Bolsa de Valores de Lima. Para esto ellos disponen de un listado de 1300
empresas. En base a la informacin en detalle que se tiene de cada empresa, se
decide estudiar el caso de 30 de ellas. Aqu N = .............. y n = ............... .

4.

Supongamos que se desea estudiar el ingreso medio de los trabajadores del


sector textil que se encuentran registrados en el Ministerio de Trabajo. Si suponemos
que el listado que proporcione el ministerio no es el 100% confiable, s servir en
gran medida para saber el tamao poblacional N, definida como el total de empresas
pertenecientes a este sector, aunque el nmero de trabajadores y sus ingresos no
sean vlidos totalmente. Aqu n ser el nmero de ....................... que se seleccionen
para realizar el muestreo.

Ejercicio
1.

Si se desea realizar un muestreo en cada uno de los casos mencionados en los 9


ejemplos iniciales, defina N y n, de manera adecuada.

2.

Busque en Internet los conceptos de Muestreo Probabilstico y No


probabilstico.

ERROR DE MUESTREO
Antes de presentar la definicin de Error de muestreo, veamos el siguiente caso:

Abra el archivo Muestreo MAS.xls o haga clic Aqu


En la hoja MAS se dispone de los ingresos mensuales de 336 empleados del
Supermercado San Carmelo. Se desea hacer un estudio sobre los ingresos de estos
trabajadores. Para ello se desean seleccionar muestras de tamao 30. Para propsitos de
comparacin de resultados, hemos decidido obtener 5 muestras del mismo tamao, a
partir de la misma poblacin.
Usando la secuencia <Herramientas> - <Anlisis de datos> - <Muestreo> obtenga dos
muestras de 30 elementos hacia las columnas Muestra4 y Muestra5.
Calcule el promedio de cada muestra

) as como la media (

) de la

poblacin.
Para calcular la media de la muestra2: En G36: =Promedio(Muestra2)
Tambin lo puede copiar de la celda de la izquierda.
Para calcular la varianza de la muestra2: En G37: =Var(Muestra2)
Para calcular la media de la poblacional (aunque ya esta calculada): =Promedio(Ingreso)
Hay alguna diferencia? ...................................................................................................
Podra sospechar a qu se debe? ....................................................................................

Definicin de Error de Muestreo


Es la diferencia entre el parmetro poblacional ( X ) y el estadstico de la muestra ( X ),
utilizado para estimar el parmetro.
Los errores de muestreo surgen como consecuencia de la utilizacin de una parte de la
poblacin, para estimar el comportamiento de toda ella. En el caso de la Muestra1: En
F45: =F36-F39
Obtenga los errores de muestreo en cada de las muestras y complete la siguiente tabla:

Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5


Error hallado
EJERCICIO COMPLEMENTARIO
Busque en Internet alguna pgina en donde se explique el concepto de Errores no
Muestrales, o haga clic en el siguiente texto (Errores ajenos al muestreo)

EJERCICIO DE LECTURA MUY IMORTANTE

3. TAMAO DE MUESTRA
Se recomienda que lo lea, ms tarde volveremos al mismo tema.

TIPOS DE MUESTREO
En la introduccin de sobre muestreo hemos precisado claramente que no se puede
elegir los elementos de la muestra de la misma forma para todo trabajo de estudio.
Entre los tipos de muestreo ms conocidos, tenemos
3.1.
3.2.
3.3.
3.4.

Muestreo simple al azar


Muestreo estratificado
Muestreo por conglomerados
Muestreo sistemtico

4. MUESTREO SIMPLE AL AZAR


Muestreo Simple al Azar (MAS).
El muestreo simple al azar consiste en disponer de un listado de los elementos de la
poblacin y elegir de ella, aleatoriamente, a todos los elementos que deben
conformar la muestra. Slo que para seleccionar la muestra se debe usar una tabla de
nmeros aleatorios. Estos nmeros se caracterizan por ser estadsticamente
independientes; es decir, no hay ninguna dependencia de entre la emisin de uno u
otro.

Se pueden generar usando una computadora. Los nmeros aleatorios se

emplean en muchos casos de simulacin, de pronstico, de inventario, teora de


juegos, fenmenos de espera, etc.
El siguiente cuadro, es un ejemplo de nmeros aleatorios que fue generado a las
9:35 A.M. de un da que no recuerdo.
Nota para que Ud. mismo genere los nmeros aleatorios que desee:
Nmeros

aleatorios

en

MS

Excel6989422792764774186914318336920
218580287197139736114973942458763723
182889280858631975702424359997880489
972162181875532835401702051073109483
791772804986003955532218475214076243
551495598386493611980262507272256491
610671794484728887619136346959285225
22786156787338903080248193

Cmo se usan los nmeros aleatorios para obtener


una muestra a partir de los elementos de la
poblacin:
Ordenar a los elementos de la poblacin en forma
creciente.
Supongamos que son 680.
De cada uno de los nmeros de la tabla, elegiremos
los tres ltimos dgitos.
Elegimos el elemento 431 de la lista, luego a los
elementos: 197, 489, 540, 218, 559, 507, 346, 369,
etc. hasta completar el tamao de la muestra.
Otras veces simplemente se elige de uno en
uno, indistintamente, de un grupo, hasta
completar el tamao n. Esto se hace por lo
general en grandes concentraciones o en
lugares por los que circulan los elementos (en
este caso personas).

Estando en MS Excel, en una hoja vaca digite en A1: =Entero(Aleatorio()*100) y


presione <Enter>. Luego copie esta frmula (si desea 30 nmeros) hacia A1:A30.
Se olvid de copiar y pegar? Bueno aqu va:
Haga clic en A1; use <Edicin> -<Copiar>; Ahora seleccione el rango A1:A30 y
pegue presionando <Enter>. Si quiere que estos nmeros no cambien, en lugar de
presionar <Enter>, clic con el botn derecho y elija la opcin <Pegado Especial> <Valores>.
En la frmula multiplique por 1000 si desea nmeros de 3 dgitos.

En conclusin, una muestra obtenida mediante el mtodo de Muestreo Aleatorio


Simple recibe el nombre de muestra aleatoria.

5. MUESTREO ESTRATIFICADO
El muestreo estratificado consiste en particionar a la poblacin, en un conjunto de

Estrato A

Poblacin estratificada

Estrato C

partes, cada una de las cuales recibe el nombre de Estrato, de tal manera que los
elementos que la conforman posean ciertas propiedades que las define, las que por
supuesto no las poseen los otros estratos.
Entonces, para seleccionar una muestra basado en este tipo de muestreo se debe
dividir a la poblacin en estratos, de tamao Nh, cada uno. Al interior de cada uno de
los estratos, se elige una sub muestra de tamao n h. Para elegir estos elementos s se
puede usar el muestreo simple al azar.

Ejemplos en los cuales se puede usar Muestreo por Estratos:


a)

Se desea estudiar el promedio de alumnos de la U de L, que acceden a la

biblioteca.
b)

Se desea obtener los niveles de aceptacin del TLC (Tratado de Libre

Comercio)
c)

Se decide evaluar los niveles de aceptacin o rechazo a la gestin

presidencial
d)

Se desea subsidiar a los agricultores que sufrieron prdidas por sequa

Complete el siguiente cuadro para cada uno de estos ejemplos.

Lista de estratos separados por comas


a)

b)
c)
d)

6. MUESTREO POR CONGLOMERADOS


Antes de describir este tipo de muestreo veamos algunos ejemplos:
i) Un determinado laboratorio de perfumera desea conocer la preferencia de sus
productos en cada familia.
ii) El departamento de investigacin del Instituto de Estadstica desea conocer el
promedio de los ingresos por familia
iii) Un vendedor de frutas desea conocer el promedio y el total de frutas no aptas
para ser vendidas en un determinado precio. Vende naranja, manzana, papaya y
pia.
iv) Un centro laboral de permanente modernizacin, est interesado en conocer el
nmero promedio de charlas de actualizacin tcnico-profesional que han tenido
los empleados en cada una de sus 400 grandes oficinas, distribuidas en 12
sucursales a nivel nacional.
En cada uno de estos ejemplos no se puede elegir el muestreo aleatorio, ni tampoco
el muestreo por estratos.
El muestreo aleatorio tomara un nico dato de cada grupo, seccin o familia; el
muestreo por estratos juntara a todos los elementos y los clasificara de acuerdo a
alguna propiedad comn.
Sin embargo, ninguno de los dos resolvera el problema que interesa: en el primer
ejemplo no interesa la preferencia de la familia, nos interesa la preferencia de cada
uno de los integrantes de la familia. Puede ser que la madre prefiera una colonia

suave, y las hijas una del mismo tipo, pero fuerte; definitivamente la preferencia de
los varones no puede ser mezclada con el de las mujeres en la familia.
En el caso del ejemplo iv), teniendo en cada oficina diversos profesionales, se
supone que la capacitacin se da de acuerdo a la profesin que tengan; mal
podramos hacer si solo se registra datos por oficina. Aqu tambin interesa la
opinin de los miembros de la oficina y la opinin de la oficina como unidad.
Por estas razones el tipo de muestreo que se acostumbra a elegir en estos casos
constituye un muestreo por conglomerados.

El muestreo por conglomerados utiliza a la familia, a la clula, al grupo; es decir,


al conglomerado de elementos de la poblacin, como medio de acceso para llegar a
cada uno de los miembros de dicha familia, grupo o conglomerado. Cada unidad
muestral seleccionada (una familia, un grupo) est formada por elementos de la
poblacin y son ellos los que interesan, ellos son los que poseen la caracterstica en
estudio. Sin embargo estos miembros de la familia o grupo no fueron sorteados
(designados o seleccionados) para ser consultados, resultaron elegidos en virtud de
formar parte de la familia, grupo o conglomerado que es el que fue seleccionado.

7. MUESTREO SISTEMATICO
El Muestreo Sistemtico consiste en listar a la poblacin de 1 a N. Si desea obtener
una muestra de tamao n, determinar k = N/n; elegir aleatoriamente un nmero r
llamado arranque aleatorio, de tal forma que 1 r k. Este ser el primer
elemento de la poblacin que se seleccione para conformar la muestra.
Es este el nico que caso en el que se selecciona aleatoriamente.

El siguiente elemento de la muestra consiste en seleccionar al elemento que ocupa la


posicin r+k de la lista.
Cada uno de los siguientes elementos se elige de la misma manera: el anterior +
k. Una vez elegido al primero, aleatoriamente, todos los dems elementos ya estn
determinados.
Ejemplos
a) De una lista de 420 candidatos del partido Me fajo por Ti, que desean postular
al congreso, se decide seleccionar una muestra (los que ms pagan al partido) de
18 candidatos, se me pide obtener a los congresistas usando el muestreo
sistemtico.
Procedimiento:
N= 420; n= 18; k = 420/18. Entonces el arranque aleatorio, r debe estar en 1 r
23
Elemento 1: 10; elemento 2: 10 + 23; los siguientes: 33+23, 56+23, ...., 378+23
b) De una lista de 600 postulantes se debe seleccionar para cubrir 60 vacantes
Defina: N, n, k y r y luego determine los elementos de la muestra.
c) Se desea obtener 10 productos para ser analizados de un lote de produccin del
da de 1200 productos. Aplique el muestreo sistemtico para obtener la muestra.
d) Abra el archivo Muestreo MAS.xls y vaya a la hoja Sistematico. Observe y
analice

EJERCICIOS
1.

Analice cada uno de los ejemplos planteados en las pginas 1, 2, 7 y 11.


Qu tipo de muestreo se puede aplicar en cada uno de ellos? Se puede aplicar ms
de un tipo de muestreo?

2.

Describa dos ejemplos adicionales para cada uno de los tipos de


muestreo

3.

Qu otros tipos de muestreo existen?. Consulte en

http://www.geocities.com/inforice.

DISTRIBUCIONES MUESTRALES
8. ESTADSTICO DE UNA MUESTRA
DEFINICIN
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n, extrada de una poblacin en
donde se define la variable aleatoria X. Sean x 1, x2, ..., xn los valores que toman
dichas variables en la muestra. Diremos que Y = H(X1, X2, ..., Xn ) es un estadstico
de la muestra, que toma el valor y = H(x1, x2, ..., xn ).

Poblacin

H
muestra
(x1 , x2, ..., xn )
y = X(x1 , x2, ..., xn )

Figura 93

Comentarios:
1. El estadstico de una muestra se conoce tambin como estadgrafo de la muestra.
2. El valor de un estadstico de una muestra es un nmero real, como se explica en
el siguiente esquema.
3. Dada una muestra aleatoria X1, X2, ..., Xn de tamao n, podemos definir ciertos
estadsticos en ella a los cuales se les conoce como Estadsticos de la muestra.
4. Un estadstico muestral se calcula con los datos pertenecientes a la muestra.
5. Un determinado parmetro poblacional, como la media X no se calcula en una
muestra de la poblacin, tampoco se calcula la varianza poblacional, .
6. El valor de un parmetro poblacional puede ser estimado a partir del estadstico
que le haga referencia. Por ejemplo el estadstico para

es la media

aritmtica X .
7. Por la forma cmo se define a un estadstico podemos decir que un
estadstico o estadgrafo es una variable aleatoria. Siendo as, podemos tratar
de encontrar su distribucin de probabilidad. Podemos buscar su esperanza y
su varianza.
8. Conociendo su distribucin de probabilidad, y conociendo su valor esperado y
desviacin estndar del estadstico, podemos identificar el comportamiento de
los miembros de la muestra y a partir de ella, tener una aproximacin, sujeto a
los errores y niveles de confianza supuestos, del comportamiento de la
poblacin, de la cual fue extrada la muestra. Recuerde esta afirmacin para la
siguiente seccin, que nos ser de gran utilidad.
9. Tomando en cuenta el numeral 3 de este comentario y el anterior (8), debemos
suponer que dichos estadsticos muestrales deben tener una distribucin

conocida o por conocer, que ser oportuno conocer. Pero antes de pasar a
estudiar esto en la prxima seccin aclaremos lo que queremos decir en este
numeral: En los diferentes tipos de muestreo hablamos de dos tipos de variable
S: Aquella que representa la suma de todos ellos, es decir, S X i y aquella
que representa el promedio

S X

una proporcin muestral, S =

. Podemos tambin haber definido a S como

o coma la varianza muestral S = s.

En conclusin, podemos decir que en el estudio de una muestra contamos con los
siguientes estadsticos muestrales:
La ..............................................
La .............................................
La .............................................
La .............................................

ERROR ESTNDAR DE UN ESTADISTICO


Como bien sabemos, la raz cuadrada de la varianza se llama ........................................
Como la media aritmtica, la varianza y la desviacin estndar son estadsticos de una
muestra,

estos

se

llaman

tambin

media

muestral,

varianza

.....................

y ...........................
Se dijo tambin que a la desviacin estndar constituye un desvo o error estndar
respecto a un estadstico. Y como hay varios estadsticos, entonces podemos hablar de
Error estndar de la media
Error estndar de la ....................................
.....................................................................
...................................................................
Ms adelante veremos otros tipos de errores estndares.

Sabe cul es la frmula del error estndar de la media muestral? ............................


Vuelva a abrir el archivo Muestreo MAS.xls
En la fila 37, calcule la varianza de cada una de las muestras
En la fila 38, calcule la desviacin estndar de cada una de las muestras
En la celda F40, calcule la varianza poblacional
En la celda F41, calcule la desviacin de la poblacional.
Observe ahora la diferencia entre los errores estndares de cada muestra y comprelos
con respecto al error estndar o desviacin estndar poblacional.

LA PREGUNTA DEL AO
Si el comportamiento de una poblacin se conoce a travs de sus parmetros, el
comportamiento de una muestra se debe conocer determinando sus estadsticos.
En el caso de una poblacin binomial, exponencial, normal, etc., podemos saber su
comportamiento conociendo la distribucin de probabilidad de la variable poblacional.
Y cmo conocer el comportamiento de una muestra? Conociendo la distribucin de
probabilidad de la variable o del estadstico. Lo mismo ocurre en poblaciones en las
cuales no se conoce su distribucin de probabilidad.
Cmo entonces podemos plantearnos preguntas probabilsticas o calcular su esperanza o
varianza? Cmo podemos cumplir con lo que se dijo en el curso de Estadstica
Descriptiva en el sentido de estudiar la muestra para estimar comportamientos
poblacionales?

Oiga amigo:

Abra el archivo Musetreo MAS.xls y vaya a la hoja Distr Conocida y responda a las
siguientes preguntas:
Con los datos que se encuentran en dicha hoja, complete la siguiente tabla:

N=

n=
p=
Parmetros poblacionales

m=

Binomial
Hipergeomtrica
Poisson
Exponencial
Normal
Estadsticos de la muestra
Binomial
Hipergeomtrica
Poisson
Exponencial
Normal
Observacin:
Como puede Ud. apreciar, en las columnas ocultas se encuentran las probabilidades de
ocurrencia de cada valor de la variable. De suerte que podramos calcular E(X), E(Y),
etc., as como V(Z), V(U), etc. Del mismo modo podemos preguntarnos as: Cul es la
probabilidad de que el ingreso semanal de un trabajador del Sector Y sea mayor que
200?. La respuesta la daramos encontrando P(Y > 200) = 1 P(Y 200). Y esto por
Minitab mediante el uso de la distribucin Hipergeomtrica, H(N = 3370, m = 840, n =
800).
Completando la pregunta del Ao:
Y cmo vamos a resolver este tipo de cuestiones en el caso de que no se conozca la
distribucin de los ingresos semanales de los trabajadores de estos sectores, que es lo
ms comn que ocurra en la vida real?
El siguiente teorema, importante por eso, nos dar la respuesta y mucho ms.

9. TEOREMA DEL LIMITE CENTRAL


Sea X1, X2, ..., Xn ... un conjunto de variables aleatorias independientes con E[Xi] =
i y V[Xi] = i para i = 1, 2, ..., n, .... Sea S la variable aleatoria definida como la
n

suma de todas las Xi tal que S = X1+ X2 +...+ Xn =

X
i 1

Luego, para un tamao de n, suficientemente grande, la variable Zn definida por


n

S
Zn

i 1
n

,
2

i 1i

Gn ( z ) ( z ) donde Gn
tendr una distribucin normal N(0, 1), para el cual nLim

representa la distribucin acumulada de Zn y representa la acumulada de


ZN(0, 1).
Observaciones
1. En el presente teorema (TLC) nada se dice de la distribucin de las X i . Slo
necesitamos que sus medias y varianzas existan y sean finitas.
2. Un tamao de n, suficientemente grande que adoptaremos ser n 30.
Las siguientes figuras, que muestra la grfica de la distribucin de Poisson y
Exponencial.. Poisson con n = 50,

p = 0.1

0.25
0.2
0.15
0.1
0.05
0
0

10

20

30

40

50

60

Exponencial con = 1/5

(n = 50, p = 0.1)

0.2
0.15
0.1
0.05
0
0

10

20

30

40

50

60

En ellos se puede apreciar que, para n > 20, las probabilidades son
insignificantes
3. Ahora abra el archivo CompDistrib01.xls
Observe la grfica de las tres distribuciones que se toma en cuenta.
Ahora vaya a la hoja Comparar.
Aumente el valor de n haciendo clic en el botn para n y observe la grfica.
Disminuya el valor de p usando el botn correspondiente y observe la grfica.
Pase a la hoja Incluyendo la Normal y modifique los valores de n.
Finalmente vaya a la hoja TLC para observar la grfica de una variable con
distribucin desconocida, pero en donde el tamao de muestra es
suficientemente grande (n 30).
4. La importancia de ese teorema radica en que podemos utilizar la distribucin
Normal para resolver todo tipo de problema, con la nica condicin de que n sea
mayor o igual a 30.
5. No se requiere trabajar con todos los elementos de la poblacin; es suficiente
disponer de informacin de un subconjunto de ella, llamada muestra, cuyo
tamao sea por lo menos de 30, para aplicar la distribucin normal.
6. Es mas, gracias a este teorema podemos utilizar los resultados obtenidos en una
muestra de tamao n, e inferir resultados sobre el comportamiento de la
poblacin.

Por esta razn las diversas firmas encuestadoras, con un mnimo gasto, un
tamao adecuado de muestra y con una pareja de supuestos, puede pronosticar el
vencedor de una contienda electoral si maana fueran las elecciones
presidenciales.
7. No se requiere conocer el tipo de distribucin de los elementos que conforman la
muestra, repetimos lo dicho en el numeral 1.
En el siguiente teorema todas las Xi provienen de la misma poblacin y por tanto
tienen el mismo comportamiento, por ello es que las medias y varianzas
poblacionales son iguales para todas ellas. En el teorema anterior, cada Xi tiene su
media y varianza particulares (o pueden tenerla).
TEOREMA
Sea X1, X2, ..., Xn ... un conjunto de variables aleatorias independientes que tienen la
misma distribucin; es decir E[Xi] = y V[Xi] = para i = 1, 2, ..., n, ....
Definamos tambin a S como S = X1+ X2 +...+ Xn Luego, para un n suficientemente
grande, la variable Zn definida por
Zn

S n
n

Gn ( z ) ( z ) donde Gn
tendr una distribucin normal N(0, 1), para el cual nLim

es la distribucin acumulada de Z con Z N(0, 1).


Observaciones
1.

Segn este teorema, si las Xi provienen de poblaciones que tienen la misma


distribucin, podemos usar la distribucin normal toda vez que n sea
suficientemente grande (n 30).

2.

Se puede usar cualquiera de las versiones del TLC.

Ejemplo 1
En navidad, el gasto que realizan las familias en la compra de regalos es
significativo e importante para los comerciantes. En un distrito limeo, se ha

estimado que este gasto familiar se distribuye normalmente, con un promedio de $


150 y una desviacin estndar de $ 40.
a) Cul es la probabilidad de que una familia gaste ms de $140 en navidad?
b) Cul es la probabilidad de que 100 familias gasten en total, ms de $14200 en
navidad?
Solucin
Definamos a X como El gasto que realiza una familia en navidad.
Segn los datos:
X = .............

X = .........................

a) Qu debemos encontrar aqu? ..............................................


Use Minitab: <Calc> - <Probability distributions> - <Normal> - <Acumulative
> - <Mean> .. <Standard desviation> <Input constant>
<Ok>.
b) En este caso se trata de la misma variable? ........
Cmo se definira a esta nueva variable? ...............................................
Qu debemos encontrar? P( .................> 14200 ) = ?
Esta nueva variable tiene alguna distribucin conocida? ..............
Si no es conocida, cmo evaluar dicha probabilidad? .........................................
Aplquelo entonces usando el Minitab.
Ejemplo 2
Se ha determinado que el tiempo de servicio que se requiere por persona en una
caja bancaria, tiene distribucin normal con = 130 segundos y = 45 segundos.
a) Cul es la probabilidad de que una persona elegida al azar, requiera menos de
100 segundos para terminar sus transacciones?
b) De un total de 9 personas que llegan, cul es la probabilidad de que el tiempo
total que se tarden sea menos de 1340 segundo?
c) De un total de 500 personas, cuntas personas se espera que demoren menos
de 2 minutos en la caja?
Solucin
Sea X: .................................................

X N(............., ..........)
a) Se pide encontrar P(X ................) . Evaluando por Minitab: P(X ........)
= .............
b) Definimos a T como el tiempo total empleado por las 9 personas.
Segn esto, se nos pide que encontremos P(T < 1340)
Para usar Minitab se necesita T y V[T] = Tv
Aquesigual T=........
ValordeV[T] = Tv=......
AhorayapuedeusarMinitabparaencontrarP(T<1340)=.......
c) Ahorasetratade500personas.Encuntaspersonasseesperardemorarmenos
de2minutos(120segundos)
Como se pide un nmero esperado de personas de un total de 500, slo
necesitamosencontrarlaprobabilidaddequeunapersonasedemoremenosde120
segundos.
Luegoelnmerodepersonasser500P(X<120)
EncuentreP(X<120)yluegomultipliquepor500paradarrespuestaalapregunta
Ejemplo 3
Un conjunto de artculos cuyo peso promedio es de 10 gramos y una desviacin
estndar de 2 gramos, son empacados en cajas de 50 unidades. Se sabe que las cajas
vacas pesan en promedio 500 gramos, con una desviacin de 25 gramos.
Suponiendo que el peso del producto y el de las cajas son independientes, calcular la
probabilidad de que una caja llena pese ms de 1050 gramos.
Solucin
Defina a Xi : .................. tal que = i = ..... y = i = .......
Sea W el peso de una caja vaca con = ........ y = ..............
Defina a T como El peso de una caja llena.
Entonces, de acuerdo al problema T = ..............................1
De donde, reemplazando valores tenemos
50

X
i 1

T = 50.... + 500 = ...... y


T = ....(4) + 625 = 825.
Luego debemos encontrar P( T > 1050) Es correcto esto? ..........
Pasemos a Z N(0, 1)

1050 1000
1 (1.74) 1 0.9591 0.0409
P (T 1050) P Z
825

Usando Minitab pero con una Normal con = 0 y = 1 y en <Input constant> 1.74
Ejemplo 4
Al inspeccionar la calidad de un producto se han determinado dos tareas claves, las
cuales se realizan una despus de otra. El tiempo que se emplea para la primera tarea
es una variable normal con = 10 minutos y =1.5minutos.Paralasegundatarea,
seempleauntiemponormalcon = 15 minutos y =2minutos.
a) Culeslaprobabilidaddequeenlainspeccinseempleemsdehora?
b) Enqutiempomximoseconcluirlainspeccinconunaprobabilidadde0.995
Solucin
Sea X: Tiempo (en minutos) que se emplea en una tarea clave..
Primera tarea: X1 N(10, 1.5)
Segunda tarea: X2 N(15, 4)
a) Como las dos tareas se realiza una despus de la otra, la probabilidad de que se
emplee ms de hora en la inspeccin (tomando en cuenta las dos tareas) que
debemos definir otra variable tal como T / T: Tiempo total empleado en las dos
tareas.
Esto significa que debemos encontrar P(T > 30) y para ello necesitamos T y
V[T] = Tv Segn el problema, T = X1 + X2: Por ello
T = E(X1 + X2 ) = E(X1) + E(X2) = X1 + X2 = 10 + 15 y
V[T] = T= V(X1 + X2) = V(X1) + V(X2) = X1 + X2 = 1.5 + 2 = 6.25 de
donde T = 2.5
Luego P(T > 30) lo resolvemos por Minitab

b) Sea K el tiempo mximo para concluir la inspeccin. Segn el problema se


tiene: P(T K ) = 0.995. Usando la opcin Inverse .... hallaremos K.
Ejemplo 5
Se empacan piezas a razn de 250 por cada caja de madera. Los pesos de las partes
son variables independientes normales con = 0.50 libras y = 0.10 libras. Se
colocan 20 cajas en una plataforma de transporte. Calcule la probabilidad de que las
partes en la plataforma pesen ms de 2510 libras.
Ejemplo 6
Las ventas diarias de una empresa comercializadora de productos medicinales se
distribuye exponencialmente con una media de 1500 dlares. Si se observan las
ventas de los ltimos 40 das y se desea calcular la venta total del perodo, cul
debe ser el valor de esta venta total si queremos que la probabilidad de no
sobrepasarla sea de 95%?
Solucin
Sea Xi el monto de venta del

i-simo da. Puesto que X i se distribuye

exponencialmente con una media de 1500 dlares entonces = 1500 dlares.


40

Si definimos a V como el monto total de las ventas del perodo, entonces

i 1

cuya distribucin es V = 40(1500) = 60000 y V =

1500 40 9486.83

De acuerdo al problema, se tiene P( V K) = 0.95


Resolviendo por normal, tenemos

K 60000
K 60000
0.95 De esto obtenemos
1.645
P (V K ) P Z
1500 40
1500 40

Resolviendo esta ltima ecuacin encontramos K = 75605.0585


Problema 1
Un camin de distribucin de mercaderas transporta cajones cargados de artculos
varios. Si el peso de cada cajn est normalmente distribuido con una media de 50 kilos
y una desviacin de 5 kilos, cuntos cajones deben ser transportados en el camin si la
probabilidad de que la carga total exceda a una tonelada sea slo de 0.1?
Sugerencia
Sea Xi el peso del i-simo cajn tal que

= i = 50 y = i = 5.

Definamos tambin a T como el peso de los n cajones transportados por el camin.


Debemos encontrar
1000 50n
1000 50n

P (T 1000) P Z
) 0.10 .
1 P(Z
5 n
5 n

De donde P( Z

1000 50n
) 0.90
5 n

Lo que debemos resolver usando Minitab: <Calc> - <Probability Distributions> <Normal>. Activamos <Inverse...>, ingresamos 0 en <Mean>; 1 en <Standard Desv.>;
Activamos <Input constant> y luego <Ok>. As obtenemos 1.2816 lo que igualamos a
1000 50 n
y resolvemos la ecuacin.
5 n
De esto obtenemos 1000 50n = 6.41n0.5 . De donde n = 20.589; es decir n 21.
OBSERVACION
Abra al archivo Muestra MAS.xls.
Ha calculado la media aritmtica de cada una de las cinco muestras? .............. Si no lo
tuviera, por favor proceda a calcularlas (en la fila 36).
Escriba el valor de dichas medias aqu: .............................................................................
Ellas de por s, podran formar otra variable? ...........
Por qu? ...................................................................................................
Estas medias reciben el nombre de medias muestrales.
Este conjunto de medias muestrales pueden ser variables aleatorias? ..........................
Podran formar una nueva distribucin? ............
Qu nombre le dara a esta nueva distribucin?
...................................................................
Por lo que sabemos y hemos dicho antes, podemos conocer su esperanza y su varianza.
Si definimos a esta nueva variable como X , entonces podemos hallar su media

E (X ) y su varianza

2
X

V (X )

Y si el tamao de muestra fuera suficientemente grande (n 30), podemos aplicar el


TLC para resolver cualquier problema de probabilidades.
Luego hemos ingresado al terreno de nuevas distribuciones, pero en este caso, a las
distribuciones muestrales, que as como hemos planteado el caso de la media muestral,
X , podemos hablar tambin de la varianza muestral s o de la proporcin muestral p .
Por ello empezamos a estudiar las distribuciones muestrales

Vous aimerez peut-être aussi