Vous êtes sur la page 1sur 13

DISTRIBUCIONES MUESTRALES

ESTADSTICA II
AUTOR: Rogelio Alvarado Martinez
NDICE
NDICE

Introduccin

1. Distribucin muestral para la media

2. Teorema del lmite central

3. Distribucin muestral de X en una poblacin normal

Acceso rpido
4. Distribucin muestral de X cuando se desconoce la distribucin de la poblacin

5. Distribucin muestral de X en una poblacin normal con varianza poblacional desconocida

6. Distribucin de la proporcin de una muestra

GENERALIDADES DESARROLLO
7. Distribucin muestral para la diferencia entre dos medidas muestrales X1-X2

GLOSARIO REFERENCIAS

Este material pertenece al Politcnico


Grancolombiano y a la Red Ilumno. Por ende, son
de uso exclusivo de las Instituciones adscritas a
la Red Ilumno. Prohibida su reproduccin total
o parcial.
01 -------
INTRODUCCIN DISTRIBUCIONES MUESTRALES
02 -------
El propsito del muestreo es indagar algo sobre la poblacin de estudio. Cuando se disea una
muestra, es importante considerar la informacin que se va a obtener y el grado de exactitud de
lo que se encuentre acerca de la poblacin. Con este propsito es importante que se analice 1. Distribucin muestral para la media
claramente la obtencin de la muestra y los resultados obtenidos a partir de ella, utilizando los
A partir de las distribuciones muestrales es importante diferenciar si estamos hablando de
conceptos probabilsticos ya vistos. elementos de la poblacin o de la muestra y esto lo haremos teniendo en cuenta la siguiente
notacin:
Una distribucin muestral es una distribucin de probabilidad de un estadstico muestral
calculado a partir de todas las muestras posibles de tamao n, elegidas al azar en una poblacin
determinada. En trminos generales, estamos interesados en conocer una o ms de las siguientes Caracterstica Poblacin Muestra
caractersticas:
Total de elementos N n
Su forma funcional

Su media Media o promedio

Su desviacin estndar Varianza S2

Antes de comprender la inferencia estadstica, tenemos que entender claramente el concepto de


distribucin muestral. Con esto se pretende dar a conocer la naturaleza de tales distribuciones y Proporcin o probabilidad
P
su papel en la inferencia estadstica, sin detenernos mucho en este tema, ya que por regla general de xito
en las aplicaciones estadsticas no se construyen distribuciones mustrales. Para emplear los
mtodos de la inferencia estadstica, necesitamos conocer solamente las caractersticas de la
distribucin muestral del estadstico apropiado al problema que se est resolviendo. Tabla 1: Elementos de una distribucin

Fuente: Elaboracin propia

Ejemplo 1

Consideremos una poblacin conformada por 4 personas (N=4). La variable de inters es el gasto
mensual en transporte (en miles de pesos). Los datos de la poblacin son: {78, 67, 83, 56} y vamos
a responder a cada literal teniendo en cuenta la notacin utilizada.

a. Calcular la media y la desviacin estndar de la poblacin

3 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 4


La media poblacional se obtiene con

78 + 67 + 83 + 56 284 c. Dichas muestras son de tipo aleatorio simple para poblacin finita o infinita?
&' = = = 71
= , 4 4
(
Y la desviacin estndar es
Como cada una de estas muestras tiene la misma probabilidad de ser elegida, entonces la
probabilidad de escoger una muestra estara dada por:
(X ).
=
N

(78 71)2 + (67 71)2 + (83 71)2 + (56 71)2 Muestra X 1 X 2 X 3 X 4 X 5 X 6


= 10.4163
4
1 1 1 1 1 1
Probabilidad
6 6 6 6 6 6
Tenemos entonces una poblacin con media = 71 y desviacin estndar = 10,4163

Tabla 2: Probabilidad de los grupos observados

Fuente: Elaboracin propia


b. De la poblacin vamos a seleccionar todas las muestras posibles de tamao n =2 sin orden
y sin repeticin. Cuntas muestras de dos elementos de la poblacin pueden formarse? Y, por ende, estamos en presencia de muestreo aleatorio simple para poblacin finita.

Como hay 4 elementos en la poblacin y queremos formar grupos de dos sin importar su orden Como X es una variable aleatoria, vamos a calcular la media en cada muestra, entonces X 1 : el
tenernos que calcular una combinacin:
promedio de la primera muestra, X 2 : el promedio de la segunda muestra, etc. Veamos:


4 4!
= =6
2 2!(4 2)!
78 + 67 78 + 83 78 + 56
X1 = = 72.5 X2 = = 80.5 X3 = = 67
2 2 2
Es decir, que podemos formar 6 grupos de dos elementos cada uno. Observmoslos 67 + 83 67 + 56 83 + 56
X4 = = 75 X5 = = 61.5 X6 = = 69.5
2 2 2
X 1 : (78, 67) X 2 : (78,83) X 3 : (78,56)
X 4 : (67,83) X 5 : (67,56) X 6 : (83,56)

5 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 6


d. Ahora vamos a calcular la media de estas medias, es decir

Con los datos del ejemplo se tiene que:

1 1 1 1 1 1
E ( X ) = X1 + X 2 + X 3 + X 4 + X 5 + X 6
6 6 6 6 6 6
(10,4163). 4 2
X + X 2 + X 3 + X 4 + X 5 + X 6 72.5 + 80.5 + 67 + 75 + 61.5 + 69.5 426 .9 =
= 1 = = = 71 2 41
6 6 6
.9 = 36,1664

9 = 6,013
Ntese que el promedio de las medias muestrales es igual a la media poblacional, entonces
podemos decir que X es una buena estimacin de .

Podemos decir entonces, que si se seleccionan todas las muestras posibles de tamao n de una
poblacin dada entonces se tiene:

=
Calculamos ahora la desviacin estndar de para las seis muestras posibles:
y

(72.5 71) 2 + (80.5 71) 2 + (67 71) 2 + (75 71) 2 + (61.5 71) 2 + (69.5 71) 2
X =


=
6
6.013

Observamos que la varianza poblacional es diferente a la varianza de , por lo tanto, es necesario


trabajar con una varianza corregida, esto se logra de la siguiente forma:
(DE
El factor se denomina factor de correccin por finitud y en los casos de poblaciones infinitas
(DF
GH
este factor se hace igual a 1, es decir que queda como: .9 =
. E
5. =
1

7 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 8


2. Teorema del lmite central Ejemplo 2

Se realiz una prueba a un grupo de 80 aspirantes al cargo de administrador de cierta empresa y


se obtuvo que las calificaciones siguen una distribucin normal con calificacin promedio de 300
Al seleccionar muestras simples de tamao n de una poblacin, la distribucin puntos y desviacin estndar de 20. Cuando se toma una muestra de 16 calificaciones de las
muestral de la media muestral se puede aproximar con una distribucin de pruebas.
probabilidad normal, cuando el tamao de la muestra es grande: de tamao mayor
que 30. a. Cul es el error tpico de la media de muestral.

Otra manera de presentar el teorema es la siguiente: b. Cul es la probabilidad de que la media muestral sea superior a 280 puntos.

Si F , . , , J son un conjunto de variables aleatorias independientes que se


distribuyen idnticamente con media y varianza . , entonces la variable
aleatoria Para responder cada literal utilizaremos la teora dada.

LP DQ
5 =
IR
S
a. La varianza muestral es ( X )2 , luego el error tpico de la media muestral es.
Para la cual JUVF U es la suma de dichas variables aleatorias y P es el promedio de
las mismas, se distribuye normal estndar cuando n tiende a aumentar
L =

Con lo anterior, estamos preparados para estudiar las distribuciones muestrales y las 20
L = =5
caractersticas de los estimadores puntuales ms usados en la inferencia estadstica. A 16
continuacin, se expondrn las variables aleatorias (con sus distribuciones de probabilidad) que
ms se utilizan para estimar los parmetros poblacionales media, varianza y proporcin y hacer b. Con base al enunciado debemos calcular P ( X > 280) y esto lo logramos estandarizando la
inferencias de los mismos. variable aleatoria X .


3. Distribucin muestral de en una poblacin normal
X 280 280 280 300 20
P > = P Z > = P Z > = P Z > = P ( Z > 4 )
Si X es la media de una muestra aleatoria de tamao n sacada de una poblacin distribuida 5 5
X X X
I
normalmente con media y desviacin 5 = ; y por lo tanto la estandarizacin L es:
J
Veamos la representacin grfica de la probabilidad solicitada:

5 =
5

9 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 10


Vamos a identificar los datos que nos dan en el problema y a plantear la probabilidad:

X: Gastos semanales en transporte

=$16500

=$1500

n = 25
LD X F[\]^DF][^^
P (>15760) = P >
I/ J F[^^/ .[

Figura 1. Representacin grafica de la probabilidad ejemplo 2.


= P L > 2.47 = 1- P L 2.47
Fuente: Elaboracin propia
=1 - 0.0068

=0.9832

Cabe resaltar que como la normal estndar es una distribucin para la cual los valores de la
probabilidad de una cantidad negativa son igual al valor de la probabilidad de la cantidad, pero
positiva, es decir, 4. Distribucin muestral de cuando se desconoce la distribucin de la poblacin
Cuando la muestra no proviene de una distribucin normal, el tamao de la muestra desempea
un papel muy importante. Cuando n es pequea, la forma de la distribucin depende
P( Z > 4) = 1 P( Z < 4) 1 0.9999 = 0.0001
principalmente de la forma de la poblacin. Sin embargo, cuando n crece, uno de los teoremas
ms importantes de la inferencia estadstica establece que la forma de la distribucin muestral se
aproxima a una distribucin normal, independientemente de la distribucin que tenga la
Con lo cual decimos que la probabilidad de que la media muestral sea superior a 280 en una poblacin de origen. (Teorema del lmite central).
muestra de tamao 16 es casi nula. En otras palabras, no es muy probable que en una muestra de
16 calificaciones la media muestral sea mayor a 280 puntos. La diferencia entre este enunciado y el anterior est en que no se requiere que la poblacin de
origen tenga distribucin normal cuando n es grande (n se considera grande si es mayor o igual
que 30).

Ejemplo 3

Ejemplo 4
En cierta ciudad los gastos semanales en transporte para los habitantes, estn distribuidos
normalmente con media de $16500 y una desviacin estndar de $1500. Cul es la probabilidad
de que una muestra de 25 personas, tengan un gasto promedio semanal superior a $15750. La duracin de cierta marca de bombillas tiene una media de 900 horas y la desviacin estndar
de 70 horas. Si se selecciona una muestra de 36 bombillas, determine la probabilidad de que dure
entre 870 y 925 horas.

11 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 12


Observe que no se hace ninguna mencin de la forma funcional de la distribucin, pero como el La tabla de la distribucin t tiene la siguiente tabla:
tamao de muestra es grande (n30), por el teorema del lmite central entonces la distribucin
es aproximadamente normal.

X: tiempo de duracin de las bombillas

=900 = 70 n = 36

c\^Dd^^ LD X d.[Dd^^
P (870 925) = P ef i ef
gh j gh

= P 2.57 L 2.14 = 0.9838-0.0051=0.9787


5. Distribucin muestral de en una poblacin normal con varianza poblacional


desconocida

Es muy comn el hecho de que en la prctica de que la varianza de la poblacin . es


desconocida. En estos casos se trabaja con la varianza de la muestra . como una estimacin
de . , dando lugar a una variable T, tal que:


=
/
Figura 2. Tabla t Studente
Conocida como la distribucin t Student o simplemente con el nombre de la distribucin t. Esto
quiere decir, que para hacer inferencias sobre medias poblacionales cuando no se conoce la Fuente: Elaboracin propia
varianza de la poblacin, se utiliza la distribucin t en lugar de la distribucin normal.

La distribucin t, de la misma manera que la distribucin normal estandarizada, tiene forma de
campana y tiene media igual a 0, alrededor de la cual es simtrica. La varianza de la distribucin La columna de la izquierda de la tabla contiene diversos valores de (n 1) grados de libertad. Cada
t, en cambio, es mayor que 1, es por esto que la distribucin es ms aguda en el centro y ms alta encabezamiento en las columnas indica la proporcin del rea superior bajo la curva de la
en las colas, como lo muestra la siguiente figura. distribucin t. Si estamos interesados, por ejemplo, en la distribucin t para 10 grados de libertad,
para un rea superior de 0,05 el valor es t = 1,8125.
El rea total bajo la distribucin t es igual a 1 y esta distribucin se encuentra tabulada para cada
valor (n-1) o grados de libertad denominados gl.

13 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 14


6. Distribucin de la proporcin de una muestra N n P(1 P) N n
Var ( P) = respectivamente a se le conoce como factor de
N 1 n N 1
En la prctica, son muy utilizadas las inferencias sobre proporciones poblacionales. Por lo tanto,
correccin de poblaciones finitas.
la distribucin muestral de una proporcin es de gran inters. En un estudio de mercados se puede
estar interesado en la proporcin o porcentaje de consumidores que estaran dispuestos a
comprar algn producto nuevo que se piensa lanzar al mercado. El jefe de personal puede estar
interesado en conocer el porcentaje de empleados que se ausentan en horas de trabajo.

Sea A el nmero total de elementos que presentan cierta caracterstica en una poblacin,
entonces la proporcin de aquellos que cumplen y no cumplen con dicha caracterstica est dada
A NA Ejemplo 5
por la expresin P = y 1 P = respectivamente.
N N
Se sabe que el 60% de los adultos de una zona del pas compran determinado producto. Se obtiene
Obsrvese que cada observacin de este experimento es de tipo Bernoulli xito (cumple con la una muestra de 150 adultos de esta rea. Cul es la probabilidad de que la proporcin muestral
caracterstica) y fracaso (no cumple con la caracterstica) y como se repite cierto nmero de veces est entre el 50% y el 70%?
se convierte en una Binomial para la cual el valor esperado de la variable aleatoria proporcin de
individuos con la caracterstica es P y la varianza es P (1 P ) . Si el tamao de muestra es grande u = = 0,6 v =
(^,])(^,w)
= 0,04
F[^
por el teorema del lmite central, esta binomial puede aproximarse a una normal con media P y
varianza P (1 P ) .
Recordemos que como P es aproximadamente normal, se requiere estandarizar la variable
aleatoria para poder utilizar las tablas de probabilidades.

^,[^D^,] vDt ^,\D^,]
P(0,5 < P < 0,7) = < < = 2,5 < v < 2,5
^,^w Iz ^,^w
Si P es la variable aleatoria proporcin de individuos de una poblacin que presentan
determinada caracterstica, entonces la proporcin muestral se distribuye de la = 0,9938 0,0062 = 0,9876
siguiente manera:

(1 )
~ o, q r

t(FDt)
proporcin poblacional y s J
es el e rror estndar de la proporcin.





Para tamao de muestra pequeo, es decir, que cumpla que np < 5 o n(1 p ) < 5 se tiene que la
N n P(1 P)
varianza y desviacin estndar estn definidas de la siguiente manera Var ( P) = y
N 1 n

15 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 16


Ejemplo 6
7. Distribucin muestral para la diferencia entre dos medidas muestrales F .

Muchas veces el inters se centra en dos poblaciones de las cuales vamos a ver si las medias La produccin diaria de una primera fbrica de envases de plstico tiene una distribucin normal
poblacionales no son iguales o podemos estar interesados en la magnitud de cualquier diferencia con una media de 50 unidades y una desviacin estndar de 8 unidades. La produccin de una
que se pueda presentar, por ejemplo, se podra estar interesado en conocer si dos lneas de segunda fbrica est distribuida normalmente con una media de 40 unidades y una desviacin
produccin sacan en promedio el mismo nmero de unidades o si son diferentes dos mtodos de estndar de 12. Para comparar el rendimiento en el trabajo en dos fbricas de envases plsticos,
entrenamiento utilizados en el personal de produccin. se saca de la primera fbrica una muestra aleatoria de 100 obreros y de la segunda una muestra
de 400. Encontrar la probabilidad de que los obreros de la primera fbrica produzcan 8 unidades
Como una generalizacin de la distribucin muestral para la media se puede decir lo siguiente: ms que los de la segunda.

1. La diferencia muestral para la diferencia entre dos medias muestrales a partir de muestras
independientes de tamao n1 y n2, extradas de dos poblaciones distribuidas normalmente,
estar distribuida normalmente y tendr una media igual a (1 - 2) y una varianza igual a: Solucin:

I|H IH
( + H ) Primera fbrica n1 = 100 = 50 =
J| JH

2. Si n1 y n2 son grandes, la distribucin muestral de la diferencia entre las dos medias muestrales
Segunda fbrica n2 = 400 . = 40 =
ser aproximadamente normal sin tener en cuenta la forma funcional de las poblaciones
originales.

Para encontrar las posibilidades asociadas a (F . ) se deben transformar los valores de (F


. ) en los valores de la distribucin normal estandarizada, mediante la frmula: F . > 8 =?

L| DLH D (Q| DQH ) cD ([^ Dw^ )


= = h |
= 2
iH H
F . (F . ) | iH |ff ff
= j| jH

F. ..
+ P [Z > -2] = 1 P [Z -2] = 1 0,0228 = 0,9772
F .

Figura 3. Represantacin grafica ejemplo 6

Fuente: Elaboracin propia

17 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 18


Ejemplo 7 GLOSARIO DE TRMINOS
03 -------
El rendimiento de los autos de la marca Solucin:
A es de 20 kilmetros por galn de POBLACIN: Es un conjunto de medidas o recuento posible de todas las unidades que tienen una
gasolina (k.p.g.), con una desviacin MARCA A MARCA B o varias caractersticas en comn. Segn el nmero de unidades o elementos que la constituyen,
estndar de 6 k.p.g. L as cifras la poblacin puede ser finita o infinita.
comparables para los autos B son de 25 y MUESTRA n1 = 10 n2 = 9
5,5 k.p.g., respectivamente, se supone La poblacin debe estar perfectamente definida en el tiempo y en el espacio. Por lo tanto, al
que el rendimiento de cada una de ambas MEDIA 1 = 20 2 = 25 definir una poblacin, se debe cuidar que el conjunto de elementos que la integran quede
marcas est normalmente distribuido. delimitado. Si, por ejemplo, para hacer un anlisis de las pequeas empresas, se debe especificar
Cul es la probabilidad de que, en un DESVIACIN 1 = 6 2 = 5,5 cules son y en qu perodo de tiempo se analizan: pequeas empresas de la capital del pas en
concurso, el rendimiento medio para 10 el ao 2012.
ESTNDAR
autos de la marca A sea mayor que el de 9
autos de la marca B? PARMETRO: Un parmetro es un nmero determinado que describe un aspecto de la poblacin
y para determinar su valor es necesario utilizar la informacin poblacional completa. Por ejemplo,
para determinar si los hombres o las mujeres tienen ms aptitud para desempear un puesto, es
La probabilidad que se busca se plantea de la siguiente forma: necesario conocer el puntaje promedio de una prueba de aptitud. Para determinar el porcentaje
de productos defectuosos en la produccin diaria en una empresa, se debe conocer el porcentaje
F . > 0 =? de productos que no cumplen las especificaciones en toda la produccin del da. El promedio del
puntaje y la proporcin de productos defectuosos son parmetros.
L| DLH D (Q| DQH ) ^D (.^ D.[ )
= = = 1,81
iH
| iH
H gh

gf,H MUESTRA: Una muestra es un subconjunto de la poblacin que ha sido seleccionada con una
|f
j| jH tcnica llamada diseo de muestreo para garantizar que la muestra sea representativa de la
poblacin, es decir, que las unidades sean seleccionadas aleatoriamente, en tal forma que cada
P [Z > 1,81] = 1 P [Z 1,81] = 1 0,9649 = 0,0351 una de ellas tenga la misma probabilidad de ser seleccionada.

ESTADISTICA: Un estadstico es un nmero determinado que describe un aspecto de la muestra


y para encontrar su valor es necesario utilizar la informacin muestral. En los ejemplos
enunciados en la definicin de parmetros, los estadsticos correspondientes son: puntaje medio
obtenido en la prueba de aptitud en las muestras seleccionadas de hombres y mujeres y
porcentaje de productos defectuosos en una muestra seleccionada de la produccin diaria.

CENSO: Es una tcnica para obtener los datos por medio de la cual se cuentan todos los elementos
que conforman la poblacin y se registran sus caractersticas.


Figura 4. Represantacin grafica ejemplo 7

Fuente: Elaboracin propia


La probabilidad de que el rendimiento medio para 10 autos de la marca A sea mayor que el de 9
autos de la marca B es de 0,0351

19 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 20


04 ------- B
REFERENCIAS

GUTIERREZ, H. y. (2005). Control estadstico de Calidad y Seis Sigma. McGrawHill.

FREUND John E., M. I. (2000). Estadstica Matemtica con aplicaciones (6 ed.). Prentice
Hall.

WALPOLE Ronal E., M. R. (1998). Probabilidad y Estadstica para Ingenieros (6 ed.).


Prentice Hall.

KENNET, R. S. (2000). Estadstica Industrial Moderna. Thomsom.

Paul, N. (1988). Estadstica para los Negocios y la Economa (4 ed.). Prentice Hall.

C MONTGOMERY, D. C. (2002). Probabilidad y Estadstica aplicadas a la Ingeniera (2 ed.).


Limusa Wiley.

REMISIN A FUENTES COMPLEMENTARIAS

Surez Ibujs, M. O. (2012). Interaprendizaje de Probabilidades y Estadistica Inferencial


con Excel, WinStats, Graph. Ecuador, South America:

LISTA DE FIGURAS

Figura 1. Representacin grafica de la probabilidad ejemplo 2. .................................................................................. 10

Figura 2. Tabla t Studente ............................................................................................................................................ 13

Figura 3. Represantacin grafica ejemplo 6 ................................................................................................................. 17

Figura 4. Represantacin grafica ejemplo 7 ................................................................................................................. 18

LISTA DE TABLAS

Tabla 1: Elementos de una distribucin .......................................................................... Error! Marcador no definido.

Tabla 2: Probabilidad de los grupos observados ............................................................. Error! Marcador no definido.

21 POLITCNICO GRANCOLOMBIANO ESTADSTICA II 22


POLITCNICO GRANCOLOMBIANO - 2016

Vous aimerez peut-être aussi