Vous êtes sur la page 1sur 7

Facultad de Ciencias Econmicas y Sociales

Escuela de Estadstica

Estadstica I - Tema 6 - Distribuciones en el Muestreo


Produccin y Muestras Aleatorias
En una planta donde se procesan alimentos para animales, se llenan miles de
bolsas de alimento diariamente. Si la maquinaria utilizada en el proceso de
llenado no opera de manera adecuada, habr bolsas con mayor o menor
cantidad de alimento. Se requerira mucho tiempo, dinero y sera poco eficiente
supervisar y pesar cada caja, por lo que la gerencia de operaciones y los
ingenieros de proceso deben planear la toma de muestras de bolsas de
alimento y tomar decisiones sobre la posibilidad de que el proceso de llenado
est o no fuera de control.
Cada vez que se selecciona una muestra de bolsas de alimento para pesarlas,
se debe tomar una decisin en cuanto a la posibilidad de que esa muestra con
peso promedio X se haya obtenido al azar de una poblacin cuyo peso
promedio verdadero sea por ejemplo 5 kilogramos. Con base a esa
evaluacin, se tomar una decisin respecto a continuar el proceso de llenado
o detener el equipo y buscar las causas atribuibles a las fallas.
Introduccin a la Teora del Muestreo
La formulacin de los procedimientos de decisin depende del conocimiento
que se tenga de las consecuencias que pueden resultar de las diferentes
acciones tomadas en una situacin particular (por ejemplo detener el proceso
de llenado de las bolsas de alimento) y del estado natural predominante
(modelos asociados a la poblacin) al momento de llevar a la prctica al
momento de llevar a cabo la decisin. El anlisis de fenmenos aleatorios,
requiere de modelos de probabilidad ideales. Sin embargo, a menudo se
encuentra que las propiedades precisas del modelo no se conocen. Para tomar
decisiones razonables, se debe conocer el modelo por lo menos en forma
aproximada. Un mtodo de aproximas las caractersticas de un modelo de
probabilidad es por el muestreo directo de la poblacin.
Si se toma una muestra mediante un proceso aleatorio, las estadsticas
muestrales son variables aleatorias que se pueden usar para estimar los
correspondientes parmetros poblacionales. Los mtodos estadsticos que
permiten inferir a partir de los datos recolectados en la muestra aleatoria el
comportamiento de la poblacin, se llaman estadsticas inductivas e
inferenciales. En el proceso de realizacin de la inferencia estadstica se
pueden cometer errores respecto al modelo asociado a la poblacin, estos
errores deber ser tomados en cuenta para tener una medida de confianza en
las conclusiones arrojadas. Estos errores son el resultado de perturbaciones
aleatorias, se les debe evaluar en trmino de probabilidades.
Conceptos Preliminares
-

Poblacin Objetivo: Es la coleccin completa de todos los elementos


que podran ser analizados. Evidentemente, el anlisis de una
caracterstica poblacional sera exacto si se pudieran analizar todos los

Estadstica I

Prof. Anna Gabriela Prez de Rivas

Facultad de Ciencias Econmicas y Sociales


Escuela de Estadstica

elementos de la poblacin, sin embargo factores como tiempo,


factibilidad y costos inducen a seleccionar una muestra y llevar a cabo
en ella el anlisis.
-

Muestreo: Es el proceso mediante el cual se selecciona un nmero


relativamente pequeo de elementos de una poblacin con la finalidad
de analizarlos.

Muestra: Es un subconjunto de la poblacin. Una muestra se dice que


es aleatoria, si cualquier subconjunto posible de tamao n (n elementos)
de la poblacin tienen la misma probabilidad de ser seleccionados para
componer la muestra, y se dice que es una muestra aleatoria simple.
Una muestra debe ser representativa de la poblacin de la poblacin de
origen, esta representatividad est relacionada con la calidad de la
informacin que se est recolectando (diversificar el proceso de
recoleccin) y el tamao de la muestra. Mientras ms informacin se
recoja ms confiable ser el anlisis que se realice.

Ejemplos Extremos
-

Un investigador desea determinar


la proporcin de merideos
aficionados a los toros, el investigador NO debe realizar la encuesta a la
salida de una corrida de toros en la Feria del Sol.
Se desea estimar el ingreso familiar promedio del Estado Mrida, NO se
podr realizar la encuesta nicamente en el casco central de la ciudad,
se tendr que recolectar informacin de los Municipios rurales y urbanos
del Estado Mrida.

Otros Diseos Muestrales


-

Muestreo Estratificado
Muestreo por conglomerados
Muestreo Sistemtico
Muestreo por Etapas

Muestreo Aleatorio Simple: Este tipo de muestreo selecciona a las muestras


por mtodos que le permiten a cada muestra posible tener igual probabilidad de
ser seleccionada y a cada elemento de la poblacin tener un chance igual de
ser incluido en la muestra.
Muestreo Estratificado: Para usar este tipo de muestreo, es necesario dividir
a la poblacin en grupos o estratos homogneos. Luego de cada estrato se
selecciona al azar un grupo especfico de elementos proporcional al tamao del
estrato. Este tipo de muestreo tambin garantiza que cada elemento tiene un
chance de ser seleccionado, y es apropiado cuando la poblacin est dividida
en grupos de diferentes tamaos y se desea reconocer o resaltar este hecho.
Muestreo por conglomerados: En esta clase de muestreo, se divide a la
poblacin en grupos o conglomerados, con la particularidad de que los
conglomerados son heterogneos (dentro) y son homogneos entre s. Luego

Estadstica I

Prof. Anna Gabriela Prez de Rivas

Facultad de Ciencias Econmicas y Sociales


Escuela de Estadstica

de cada conglomerado se selecciona al azar un grupo especfico de elementos


proporcional al tamao del mismo. Este tipo de muestreo tambin garantiza
que cada elemento tiene un chance de ser seleccionado.
Tanto el muestro estratificado como el muestreo por conglomerados, la
poblacin se divide en grupos bien definidos, con la particularidad de que se
usa el muestreo estratificado cuando cada grupo es homogneo pero existe
una gran variacin entre grupos. Se usa el muestreo por conglomerados en el
caso en el que los grupos presentan grandes variaciones dentro de ellos, es
decir son heterogneos, pero los grupos son esencialmente similares entre s.
Muestreo Sistemtico: En este tipo de muestreo los elementos de la
poblacin se seleccionan a un intervalo uniforme que es medido en tiempo,
orden o espacio. Es muestreo sistemtico difiere del muestreo aleatorio simple
en que cada elemento tiene igual probabilidad de ser seleccionado pero no as
cada muestra. Para utilizar este tipo de muestreo se requiere tener un listado
completo de los elementos de la poblacin. Es inapropiado cuando los
elementos de la poblacin presentan un patrn secuencial, sin embargo este
mtodo es menos costoso en tiempo y recursos que el muestreo aleatorio
simple.

Estadstico: Es una medida de resumen que se calcula para describir una


caracterstica a partir de una sola muestra de la poblacin. Un estadstico es
una funcin de las variables aleatorias observables X1, X2, ..., Xn, es una
variable aleatoria que no depende de , siendo el parmetro poblacional.
Distribucin de Muestreo: Un estadstico es una variable aleatoria, y por ser
una variable aleatoria debe tener una distribucin de probabilidad propia, la
cual recibe el nombre de distribucin muestral. La distribucin de muestreo de
un estadstico depende de la distribucin de la poblacin, del tamao de la
muestra y del mtodo utilizado para seleccionar sta.
Distribucin Muestral de la Media
Suponga que se tiene una muestra aleatoria de tamao n, esto es X1, X2,...,Xn
de una poblacin normal con media y varianza 2. Cada Xi i = 1,2,..., n
representa una variable aleatoria con distribucin normal con media y
varianza 2, es decir, E(Xi) = y Var(Xi) = 2 y adems las Xi son
independientes.
1
n

Si se define la media muestral como X

X
i 1

, entonces el valor esperado y


n
la varianza de la media muestral estn dados por:

Prof. Anna Gabriela Prez de Rivas

Estadstica I

Distribuciones Muestrales

Prof. Anna Gabriela Prez de Rivas

Buy Now to
Create
PDF without
Trial Watermark!!
Facultad
de Ciencias Econmicas
y Sociales
4
Escuela de Estadstica
Valor Esperado
n
Xi
E ( X ) E i 1
n

1 n

E X i
n i 1

n
1
E X E ( X i )
n i 1
1
E X n
n
E X

E(X )

Varianza

n
Xi

Var ( X ) Var i 1
n

1
n

Var ( X ) 2 Var X i
n
i 1
1 n
Var ( X i ) por independencia de las X i
n 2 i 1
1
Var ( X ) 2 n 2
n
2
Var ( X )
n
Var ( X )

As, la distribucin muestral de la media es Normal con parmetros y


2/n, lo que se puede escribir de la siguiente forma:
X N , 2 / n
Nota Importante: Si se muestrea una poblacin que tiene una distribucin de
probabilidad desconocida, la distribucin de muestreo de la media muestral X
seguir siendo aproximadamente normal con media y varianza 2/n si el
tamao de la muestra es grande.
Teorema del Lmite Central: Sea X1, X2, ..., Xn una muestra aleatoria de
tamao n tomada de una poblacin (finita o infinita) con media y varianza 2,
si X es la media muestral, entonces la forma lmite de la distribucin de

Created by eDocPrinter
PDF
Pro!!
Prof. Anna
Gabriela
Prez de Rivas

Estadstica I

Buy Now to
Create
PDF without
Trial Watermark!!
Facultad
de Ciencias Econmicas
y Sociales
5
Escuela de Estadstica

X
es normal estndar cuando n (tiende a infinito)
( 2 / n)

Error Estndar: El error estndar de un estadstico se define como la


desviacin estndar de su distribucin de muestreo. El error estndar da una
medida sobre la precisin de la estimacin. El error estndar de la media

. Si se desconoce se
muestral se denota X y se obtiene como X
n
sustituye por la desviacin estndar muestral S.
Ejemplo: Dada una distribucin normal con media = 100, = 10 y n = 25
Cul es la probabilidad de que X ?
a) Sea menor que 95
b) Que se encuentre entre 95 y 97,5
c) Que sea mayor que 106
Aplicando el teorema del lmite central y sabiendo la distribucin muestral de la
media se tiene lo siguiente:
-

P( X <95) = P Z 2,5 = 0,0062 y -2,5 se obtiene al estandarizar de la


95 100 5
siguiente forma: Z 0

2,5
(10 / 5)
2
P (95 X 97,5) P (2,5 Z 1,25) =0,1056 0,0062 = 0.0994. Los
valores -2,5 y -1,25 se obtienen al estandarizar tal como se hizo en al
apartado anterior
P ( X 106) 1 P ( X 106)
P( Z 3) 1 P( Z 3)
P( Z 3) 1 0,9987 0.0013

Definicin: Si se tienen dos poblaciones independientes con medias 1 y 2, y


varianzas 12 y 22 , y si X 1 y X 2 corresponden a las medias muestrales de
dos muestras aleatorias independientes de tamaos n1 y n2 de estas
X X 2 1 2
poblaciones, entonces la distribucin de muestreo de Z 1
12 22

n1
n2
es aproximadamente normal estndar, si se aplican las condiciones del
teorema del lmite central. Si las dos poblaciones son normales, entonces la
distribucin de muestreo de Z es de manera exacta normal estndar.

Created by eDocPrinter
PDF
Pro!!
Prof. Anna
Gabriela
Prez de Rivas

Estadstica I

Buy Now to
Create
PDF without
Trial Watermark!!
Facultad
de Ciencias Econmicas
y Sociales
6
Escuela de Estadstica
Ejercicios
1. Dada una distribucin normal con media = 50, = 5, si se selecciona
una muestra de n = 100 Cul es la probabilidad de que X ?
a. Sea mayor que 47
b. Se encuentre entre 47 y 49
c. Sea mayor que 51
d. Existe una probabilidad de 0,35 de que X est arriba de qu
valor?
2. El tiempo que se usa el correo electrnico por sesin tiene una
distribucin aproximadamente normal con = 8 minutos y = 2 minutos.
Si se selecciona una muestra aleatoria de 25 sesiones:
a. Calcule X
b. Cul es la probabilidad de que la media muestral se encuentre
entre 7,8 y 8,2 minutos
c. Cul es la probabilidad de que la media muestral sea menor que
7,5 minutos
3. El tiempo que tarda un cajero en atender a un cliente tiene una media
poblacional = 3,15 minutos con una desviacin estndar = 0,40
minutos. Si se selecciona una muestra aleatoria de 16 clientes:
a. Cul es la probabilidad de que el tiempo promedio de atencin
sea al menos 3 minutos
b. Cul es la probabilidad de que el tiempo promedio de atencin
sea a lo ms 4 minutos
c. Existe una probabilidad de 0,85 de que el tiempo promedio de
atencin sea menor a cuntos minutos?
d. Si se obtiene una muestra aleatoria de 64 clientes, existe una
probabilidad de 0,85 de que el tiempo promedio de atencin sea
menor a cuntos minutos?
e. Qu suposicin debe hacerse para realizar los apartados a, b, c
y d?
4. Una poblacin normal tiene una media de 100 y varianza de 25. De
qu tamao debe ser la muestra aleatoria de esta poblacin para que el
error estndar del promedio de la muestral sea 1,5?
5. La resistencia a la compresin del concreto tiene una media de 2500 psi
y una varianza de 1000 psi. Encuentre la probabilidad de que la media
muestral de una muestra aleatoria de 25 especimenes se encuentre en
el intervalo 2499 a 2510 psi
6. Se toma una muestra aleatoria de tamao n1=16 de una poblacin
normal con media 75 y desviacin estndar 8. De otra poblacin normal
se toma una muestra aleatoria de tamao n2 =18; esta poblacin tiene
media de 70 y desviacin estndar 12. Sean X 1 y X 2 las medias
muestrales. Encuentre las siguientes probabilidades:
b. 3,5 < X 1 X 2 < 5,5
a. X 1 X 2 > 4

Created by eDocPrinter
PDF
Pro!!
Prof. Anna
Gabriela
Prez de Rivas

Estadstica I

Buy Now to
Create
PDF without
Trial Watermark!!
Facultad
de Ciencias Econmicas
y Sociales
7
Escuela de Estadstica
Aproximacin de las Distribuciones Binomial y Poisson a la Normal
Esta aproximacin se presenta como una herramienta til cuando se est
estudiando una variable aleatoria binomial o una variable aleatoria Poisson con
un nmero grande de ensayos, la distribucin normal se utiliza para aproximar
probabilidades binomiales o Poisson utilizando el teorema del lmite central.
Definicin: Sea X una variable aleatoria binomial, tal que E(X) = np y
V(X) =np(1-p), entonces, si se define una nueva variable
aleatoria
X np
Z
tiene de manera aproximada distribucin normal estndar, es
np(1 p)
decir N(0,1) . Sin embargo si el valor de np n(1-p) es pequeo (< 5) la
distribucin binomial tiene mucho sesgo y la distribucin normal no es buena
aproximacin en ese caso.
Definicin: Si X es una variable aleatoria Poisson con E(X) = y V(X) = ,
X
entonces si se define una nueva variable aleatoria Z
tiene de manera

aproximada distribucin normal estndar. Esta aproximacin es eficiente para


> 5.

Created by eDocPrinter
PDF
Pro!!
Prof. Anna
Gabriela
Prez de Rivas

Estadstica I