Académique Documents
Professionnel Documents
Culture Documents
Muestras Aleatorias:
Algunas de las principales razones por las que el muestreo es necesario son:
1.
2.
3.
4.
Poltica: las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.
Gobierno: una muestra de opiniones de los votantes se usara para determinar los
criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
Errores en el Muestreo:
Cuando se utilizan valores muestrales, o estadsticos para estimar valores poblacionales, o
parmetros, pueden ocurrir dos tipos de errores:
1.
Cuando una muestra no es una copia exacta de una poblacin, incluso si se ha tenido mucho
cuidado para asegurar que dos muestras del mismo tamao sean representativas de una
cierta poblacin, no se puede esperar que las dos sean idnticas en todos sus detalles. El
error muestral es un concepto muy importante que nos ayudar a entender mejor la
naturaleza de la inferencia estadstica.
2.
Errores no muestrales: son los errores que surgen al tomar las muestras
Ejemplo:
Un mtodo para lograrlo es asignarle a cada uno un nmero, escribir cada nmero en un
papel, y realizar en una urna un sorteo justo con ellas. Un mtodo alternativo consiste en
recurrir a una tabla de nmeros aleatorios que viene en todos los libros de estadstica
especialmente construida para tal efecto. Como su nombre lo indica, estos nmeros han
sido generados por un proceso aleatorio (en este caso, por una computadora). Para cada
dgito de un nmero, la probabilidad de 0, 1, 2, ., 9 es la misma. As, la probabilidad de
que una persona con nmero 011 sea elegido, es la misma que la de otra persona con el
nmero 722, o el 356. Por lo tanto, quedan eliminados as los sesgos en el proceso de
seleccin.
En este procedimiento de muestreo, y en los restantes que veremos, se supone que el
muestreo se realiza sin reemplazo. Esto es, un elemento que se selecciona para la muestra
no se devuelve a la poblacin para ser, quizs, seleccionado de nuevo. Existen otros casos
en los que el muestreo se realiza con reemplazo, donde cada elemento elegido se devuelve
a la poblacin antes de hacer la siguiente seleccin.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado. Aunque sera deseable usar muestras aleatorias simples para las
encuestas nacionales de opinin sobre productos o sobre elecciones presidenciales, sera
muy caro y demoroso.
2.
Ejemplo:
Suponga que nos interesa obtener una muestra de los docentes de Inacap. Puede ser
difcil obtener una muestra con todos los docentes, as que supongamos que elegimos
una muestra aleatoria de cada sede, entonces los estratos vendran a ser las sedes.
3.
Ejemplo:
Supngase que Metrpolis, una compaa de servicio de televisin por cable est
pensando en abrir una sucursal en una ciudad grande. La compaa planea realizar un
estudio para determinar el porcentaje de familias que utilizaran sus servicios, como no es
prctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al
azar, la cual forma un conglomerado.
En el muestreo por conglomerado, stos se forman para representar, tan fielmente como
sea posible, a toda la poblacin, por lo que se usa una muestra aleatoria simple de
conglomerados para estudiarla. Este tipo de muestreo se usa frecuentemente para
reducir el costo de muestrear una poblacin dispersa en un rea geogrfica grande y son
utilizados especialmente por instituciones sociales como iglesias, hospitales, escuelas y
prisiones.
4.
Ejemplo:
Para obtener una muestra de suscriptores telefnicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los nmeros de las pginas de la gua
telefnica. Al elegir dcimo nombre de cada pgina obtendramos un muestreo
sistemtico. Tambin podemos escoger un nombre de la primera pgina de la gua
telefnica y despus escoger cada nombre del lugar nmero cien a partir del ya escogido.
Por ejemplo, podramos seleccionar un nmero al azar de entre los primeros cien.
Supongamos que el elegido es el 40, entonces escogimos los nombres de la gua
telefnica que corresponden a los nmeros 40, 140, 240, 340, 440 y as sucesivamente.
Error Muestral:
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por ejemplo,
supongamos que se ha obtenido una muestra aleatoria de tamao 22 en una poblacin con
media 13 ; si la media de la muestra es x 10 , entonces a la diferencia observada
x 3 se le denomina error muestral. Una media muestral x puede pensarse como la
suma de dos cantidades, la media poblacional y el error muestral. Si e denota el error
muestral, entonces:
xe
Ejemplo:
Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y 6, para
simular una poblacin grande de manera que el muestreo pueda realizarse un gran nmero
de veces, supondremos que este se hace con reemplazo, es decir, el nmero elegido se
reemplaza antes de seleccionar el siguiente, adems, se seleccionan muestras ordenadas.
En una muestra ordenada, el orden en que se seleccionan las observaciones (datos) es
importante, por tanto, la muestra ordenada (2,6) es distinta de la muestra ordenada (6,2). En
la muestra (6,2), primero se seleccion el 4 y despus el 3. A continuacin mostraremos una
tabla que contiene una lista de todas las muestras ordenadas de tamao 2 que es posible
seleccionar con reemplazo y tambin contiene las medias muestrales y los correspondientes
errores muestrales. Observemos que la media poblacional es igual a 2 4 6 3 4 .
Muestras ordenadas
(2,2)
(2,4)
(2,6)
(4,2)
(4,4)
(4,6)
(6,2)
(6,4)
(6,6)
x
2
3
4
3
4
5
4
5
6
Error muestral e x
2 4 = -2
3 4 = -1
44=0
3 4 = -1
44=0
54=1
44=0
54=1
64=2
Hay 3(3) = 9 muestras de tamao 2 que se pueden tomar con reemplazo de la poblacin (por
que cualquiera de los tres nmeros de la primera extraccin puede asociarse con uno
cualquiera de la segunda).
Ntese de las interesantes relaciones contenidas en la tabla:
X 2 3 4 3 4 5 4 5 6 9 4
e1 e 2 e3 ....... e9 2 1 0 1 0 1 0 1 2 0
La suma de los errores muestrales es cero.
En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de
todos los errores muestrales es cero.
Consideremos todas las posibles muestras de tamao n en una poblacin dada (con o sin
reposicin). Para cada muestra, podemos calcular un estadstico (tal como la media o la
desviacin estndar) que variar de muestra a muestra. De esta manera obtenemos una
distribucin del estadstico que se llama muestral.
Dependiendo del estadstico, es como se llamar la distribucin muestral. Para cada
distribucin muestral podemos calcular la media y la desviacin estndar, etc. As pues,
podremos hablar de la media y la desviacin estndar de la distribucin muestral que
corresponda.
Distribuciones Muestrales:
Las muestras aleatorias obtenidas de una poblacin son por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de
la misma poblacin tengan la misma media muestral o que sean completamente parecidas.
Puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello se quiere
estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones
sern muy importantes en el estudio de la inferencia estadstica, porque las inferencias sobre
las poblaciones se harn usando estadsticas muestrales. Con el anlisis de las
distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de
un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro
poblacional desconocido.
En otras palabras, analizaremos la exactitud de este proceso de inferencia. Una vez que se
infiere que la poblacin posee las mismas caractersticas de la muestra, el analista debe
determinar la magnitud de los errores posibles inherentes a este proceso. Como el muestreo
es algo comn en la mayora de las reas u organizaciones, es vital para todos ustedes
conocer como medir y entender este error inherente. Evaluar un posible error supone la
comprensin cabal del concepto ms importante de la estadstica: la distribucin muestral.
Como los valores de un estadstico, tal como x , varan de una muestra aleatoria a otra, se le
puede considerar como una variable aleatoria con su correspondiente distribucin de
frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral.
En general, la distribucin muestral de un estadstico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamao.
Ejemplo:
X1
Muestra 1
Muestra 2
X2
X2
Muestra 3
Muestra K
X1
X3
X3
XK
..
.
Poblacin
XK
Distribucin muestral
de medias
S1
Muestra 1
S2
Muestra 2
Muestra 3
S3
Muestra K
..
.
Poblacin
SK
Distribucin muestral de
desviacin estndar
Ejemplo:
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0. 2,
4 y 6. Encuentre:
a) , la media poblacional.
b) , la desviacin estndar poblacional.
c) X , la media de la distribucin muestral de medias.
d) X , la desviacin estndar de la distribucin muestral de la media.
Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias
Respuesta:
a) la media poblacional es:
X 0 2 4 6 4 3
Distribucin poblacional
b) la desviacin estndar de la poblacin es:
0 3 2 2 3 2 4 3 2 6 3 2
4
2,236
x
0
1
2
3
1
2
3
4
Muestra
(4,0)
(4,2)
(4,4)
(4,6)
(6,0)
(6,2)
(6,4)
(6,6)
x
2
3
4
5
3
4
5
6
Distribucin de frecuencias de x
x
f
0
1
1
2
2
3
3
4
4
3
5
2
6
1
Grfica de frecuencias para las medias de las muestras x
Distribucin muestral
La media de la distribucin muestral de medias es:
X
f x 01 1 2 2 3 3 4 4 3 5 2 61 48 3
16
16
f
f X X
f
1 0 3 21 3 3 2 3 4 3 3 3 4 3 2 5 3 1 6 3
1,58
16
2
De aqu que podamos deducir que la desviacin estndar de la distribucin muestral es:
n
2,236
1,58
2
X
X
Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o
valor esperado, una varianza y una desviacin estndar, se puede demostrar que la
distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:
X E x 3
Conclusin:
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin
muestral se genera extrayendo todas las posibles muestras del mismo tamao de la
poblacin y calculndoles a stas su estadstico.
Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de
medias ser normal sin importar el tamao de la muestra.
Poblacin
Distribucin muestral de medias
generada con muestras de
tamao
Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la
muestra debe ser a 30, para que la distribucin muestral tenga forma de campana.
Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin de ser normal.
Para muchos propsitos, la aproximacin normal se considera buena si se cumple n = 30. La
forma de la distribucin muestral de medias sea aproximadamente normal, inclusive en casos
donde la poblacin original es bimodal, es realmente notable.
Poblacin
Exponencial
. La aproximacin ser
Ejemplo:
Para la distribucin muestral de medias del ejercicio pasado, encuentre:
a) El error muestral de cada media.
b) La media de los errores muestrales.
c) La desviacin estndar de los errores muestrales.
Respuesta:
a) En la siguiente tabla se ven las muestras, las medias de las muestras y los errores
muestrales:
Muestra
(0,0)
(0,2)
(0,4)
(0,6)
(2,0)
(2,2)
(2,4)
x
0
1
2
3
1
2
3
Error muestral ( e x )
0 3 = -3
1 3 = -2
2 3 = -1
33= 0
1 3 = -2
2 3 = -1
33= 0
(2,6)
(4,0)
(4,2)
(4,4)
(4,6)
(6,0)
(6,2)
(6,4)
(6,6)
4
2
3
4
5
3
4
5
6
43= 1
2 3 = -1
33= 0
43= 1
53= 2
33= 0
43= 1
53= 2
63= 3
3 2 1 0 2 1 0 1 1 0 1 2 0 1 2 3 0
16
f e e 2
N
1 3 0 2 2 0 3 1 0 4 0 0 31 0 2 2 0 1 3 0
16
e 1,58
Por lo tanto,
Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar
la siguiente frmula para encontrar X :
X
N n
N 1
donde
1. El despacho de abogados Gonzlez & Asociados tiene cinco socios. En su junta de socios
semanal cada uno informa el nmero de horas que cobraron a los clientes por sus servicios
la semana anterior.
Socios
1. Castro
2. Donoso
3. Figueroa
4. Gonzlez
5. Molina
Horas
22
26
30
26
22
a) Si se seleccionan al azar dos socios, cuntas muestras diferentes son posibles sin
reemplazo? Adems calcule las horas media de cobro para cada muestra.
b) Calcule la media de la distribucin muestral y comprela con la media poblacional.
c) Calcule el error estndar, o la desviacin estndar de la distribucin muestral y comprela
con la poblacional.
Respuesta:
a) Para determinar la distribucin de muestreo de las medias muestrales, se seleccionan
todas las muestras posibles de tamao 2 sin reemplazo en la poblacin, de la siguiente
manera:
N
Cn
N!
5! 10
n! N n ! 2! 3!
Las 10 medias de todas las muestras posibles de tamao 2 que pueden tomarse a partir de
la poblacin son:
Socios
1,2
1,3
1,4
1,5
2,3
2,4
2,5
3,4
3,5
4,5
Total
22+26 = 48
22+30 = 52
22+26 = 48
22+22 = 44
26+30 = 56
26+26 = 52
26+22 = 48
30+26 = 56
30+22 = 52
26+22 = 48
Media muestral
24
26
24
22
28
26
24
28
26
24
22 26 30 26 22
25,2
5
25,2
10
10
Fijmonos que X .
c)
La desviacin estndar poblacional es:
2,99
1,83
Si utilizamos la frmula del error estndar sin el factor de correccin tendramos que:
X
2,99
2,114
n
2
Por lo que observamos que este valor no es el verdadero. Pero agregando el factor de
correccin obtendremos el valor correcto
n
antes.
X
N n 2,99
N 1
2
5 2
5 1
El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del
error estndar:
Inicio
Si
Es la poblacin
infinita?
No
Si
Se muestrea
con reemplazo?
No
Si
Es n/N>0,05?
N n
N 1
En donde Z es una variable estandarizada con media igual a cero y desviacin estndar
igual a uno. Con esta frmula se pueden hacer los clculos de probabilidad para cualquier
ejercicio, usando la tabla de reas bajo la curva normal.
Sabemos que cuando se extraen muestras de tamao grande ( n 30 ) o bien de cualquier
tamao de una poblacin normal, la distribucin muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la frmula de la distribucin normal
estndar con X y X , entonces la frmula para calcular la probabilidad del
comportamiento del estadstico, en este caso la media de la muestra, quedara de la
siguiente forma:
N n
N 1
Ejemplos:
1.
Una empresa fabrica pilas alcalinas tipo D que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 19 horas y desviacin estndar de 1,2
horas. Encuentre la probabilidad de que una muestra aleatoria de 9 pilas tenga una vida til
promedio de menos de 18 horas.
Respuesta:
18 19
2,5
1,2
9
0,0062
18
19
Este valor se busca en la tabla de reas bajo la curva normal
P x 18 P Z 2,5 0,0062
2. Las estaturas de 1000 estudiantes de Inacap estn distribuidas aproximadamente en
forma normal con una media de 1,745 metros y una desviacin estndar de 0,069 metros. Si
se extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin,
determine:
a)
El nmero de las medias muestrales que caen entre 1,725 y 1,758 metros.
b)
Respuesta:
En este ejercicio se cuenta con una poblacin finita y un muestreo sin reemplazo, por lo que
se tendr que agregar el factor de correccin.
a)
0,7607
N n
n N 1
1,725 1,745
1000 25
25 1000 1
1,758 1,745
0,069
0,069
1000 25
25 1000 1
1,47
0,96
P1,725 x 1,725
1,758 1,745
0,7607
1,758
Por lo tanto,
b)
Z
0,0336
x
N n
n N 1
1,72 1,745
1,83
1000 25
0,069
25 1000 1
P x 1,72 0,0336
px
donde
p: estadstico proporcin
x: es el nmero de xitos en la muestra
n : es el nmero total muestreado
p1
Muestra 1
p2
Muestra 2
Muestra 3
p3
Muestra K
..
.
Poblacin
pK
Distribucin muestral de
Proporciones
Termostatos malos
Proporcin de
termostatos
defectuosos
4/5 = 0,8
Nmero de manera
en las que se puede
obtener la muestra
8 C1 4 C 4 8
2
3
4
5
3
2
1
0
8 C 2 4 C3
112
8 C 3 4 C 2 336
8 C 4 4 C1 280
8 C 5 4 C 0 56
Total:
792
3/5 = 0,6
2/5 = 0,4
1/5 = 0,2
0/5 = 0
Por lo que podemos decir que la media de la distribucin muestral de proporciones es igual a
la proporcin de poblacin, o sea p P
Tambin podemos calcular la desviacin estndar de la distribucin muestral de
proporciones:
8 0,8 1 / 3 112 0,6 1 / 3 336 0,4 1 / 3 280 0,2 1 / 3 56 0 1 / 3
792
0,1681
2
p
p
P 1 P
1 / 3 2 / 3
5
falta agregar el factor de correccin para una poblacin finita y un muestreo sin reemplazo:
p
1 / 3 2 / 3
5
12 5
0,1681
12 1
Por lo tanto,
p
P 1 P
n
N n
N 1
pP
P 1 P
n
N n
si se cumple con las
N 1
condiciones necesarias.
Ejemplo:
Se ha determinado que el 60% de los alumnos de Inacap fuman cigarrillos. Se toma una
muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporcin de la
muestra de los alumnos que fuman cigarrillos sea menor que 0,55.
Respuesta:
Hay dos mtodos para resolver este ejercicio:
1 Utilizando la aproximacin de la distribucin normal a la binomial. (visto en la
Unidad II)
P: 0,60
x : 0,55 800 400 alumnos
n : 800
p x 440 ?
Media =
x nP
nP1 P
p x 440 0,0017.
0,0017
439,5
480
439,5 480
2,92
4801 0,40
440-0,5=439,5
0,0017 significa que existe una probabilidad del 0,17% de que al extraer una muestra de 800
alumnos, menos de 440 fuman cigarrillos.
2 Usando la Distribucin Muestral de Proporciones
n = 800 alumnos
P = 0,60
p = 0,55
p p 0,55 ?
0,0017
Z
pP
P1 P
n
0,549375 0,60
0,60 0,40
2,92
800
0,55-(0,5/800) = 0,549375
0,549375 0,60
Como podemos darnos cuenta este valor es idntico al obtenido en el mtodo anterior, por lo
que si buscamos en la tabla de reas bajo la curva normal nos da la misma probabilidad de
0,0017. Tambin se debe tomar en cuenta que el factor de correccin de 0,5 se est
dividiendo entre el tamao de la muestra, ya que estamos hablando de una proporcin.
Por lo tanto, al interpretacin en esta solucin, estara enfocada a la proporcin de la
muestra, por lo que diramos que la probabilidad de que al extraer una muestra de 800
alumnos de Inacap, la proporcin de alumnos que fuman cigarrillos sea menor al 55% es
0,17%.
x11
x12
Muestra 1
Muestra 2
x11 x 21
x12 x 22
Muestra 3
Muestra K
x 21
x13
x13 x 23
x1K x 2 K
x1K
Poblacin 1
x 22
Muestra 1
Muestra 2
Muestra 3
MuestraK
x 23
x2K
Distribucin muestral de
diferencia de medias
Poblacin 2
, por lo que no es
12 22
.
n1 n 2
La formula que utilizaremos para el clculo de probabilidad del estadstico de diferencia de
medias es:
difcil deducir que X 1 X 2 1 2 y que X 1 X 2
x1 x 2 1 2
12 22
n1 n 2
Ejemplo:
Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a dos
compaas. Los tubos de la compaa A tienen una vida media de 7,2 aos con una
desviacin estndar de 0,8 aos, mientras que los de la compaa B tienen una vida media
de 6,7 aos con una desviacin estndar de 0,7 aos. Determine la probabilidad de que una
muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao
ms que la de una muestra aleatoria de 40 tubos de la compaa B.
Respuesta:
A 7,2 aos
B 6,7 aos
A 0,8 aos
B 0,7 aos
n A 34 tubos
n B 40 tubos
p( x A x B >1) = ?
x A xB A B
A2 B2
n A nB
1 7,2 6,7
0,8 2 0,7 2
34
2,84
40
0,0023
A B 0,5 x A x B 1
p 21
p11
p12
Muestra 1
p11 p 21
Muestra 2
p 22
p12 p 22
Muestra 3
p 23
p1K p 2 K
p1K
Poblacin 1
Muestra 2
Muestra 3
p13 p 23
p13
Muestra K
Muestra 1
MuestraK
p2K
Distribucin muestral de
diferencia de proporciones
Poblacin 2
p1 p 2
P 1 P
, por lo que no es difcil deducir que p1 p 2 P1 P2
n
y que
P1 1 P1 P2 1 P2
.
n1
n2
p1 p 2 P1 P2
P1 1 P1 P2 1 P2
n1
n2
Ejemplo:
Los hombres y mujeres adultos radicados en Iquique difieren en sus opiniones sobre la
promulgacin de la pena de muerte para personas culpables de asesinato. Se cree que el
15% de los hombres adultos estn a favor de la pena de muerte, mientras que solo el 12%
de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y
100 mujeres su opinin sobre la promulgacin de la pena de muerte, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 4% mayor que el de las
mujeres
Respuesta:
PH 0,15
PM 0,12
n H 100
n M 100
p p H p M 0,04 ?
Recordemos que debemos incluir el factor de correccin de 0,5 por ser una distribucin
binomial y se est utilizando la distribucin normal
p H p M PH PM
PH 1 PH PM 1 PM
nH
nM
100
0,10
100
0,4602
PH PM 0,03 0,035
Ahora se ver un nuevo concepto necesario para poder utilizar las distribuciones que
veremos. Este concepto es grados de libertad.
Para definir grados de libertad haremos referencia a la varianza muestral:
s2
x x 2
n 1
Fjense que esta frmula est basada en n-1 grados de libertad. Esta terminologa resulta
del hecho de que si bien s 2 est basada en n cantidades x1 x , x 2 x ,......, x n x , stas
suman cero, as que especificar los valores de cualquier n 1 de las cantidades determina el
valor restante.
Por ejemplo, si n = 4 y x1 x 8; x 2 x 6 y x 4 x 4 , entonces automticamente
obtenemos x 3 x 2 , as que slo tres de los cuatro valores de x x est libremente
determinados. Es decir, n 1 4 1 3 por lo tanto hay 3 grados de libertad.
Entonces, aqu la frmula de grados de libertad ser n 1 y su simbologa es (se lee nu).
Distribucin t de Student:
Supongamos que se toma una muestra de una poblacin con media y varianza 2 . Si x
es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la
x
Z
distribucin
es una distribucin normal estndar. Supongamos que la varianza de
n
2
la poblacin es desconocida. Qu sucede con la distribucin de esta estadstica si se
reemplaza por s ? La distribucin t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucin t son 0
2 2
para 2 ,
respectivamente.
El siguiente diagrama nos presenta dos distribuciones t. La apariencia general de la
distribucin t es similar a la de la distribucin normal estndar, ya que ambas son simtricas y
unimodales, y el valor mximo de la ordenada se alcanza en la media 0 . Sin embargo, la
distribucin t tiene colas ms amplias que la normal, es decir, la probabilidad de las colas es
mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma del lmite de la distribucin t es la distribucin normal estndar.
Distribucin Z
15 Distribucin
t
0,025
Si observan la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se
tiene que hacer la resta de 1 . La manera de encontrar el valor t es buscar el valor de
en la primera fila de la tabla y luego buscar los grados de libertad en la primera columna y
donde se intercepten y ( gl.) se obtendr el valor de t.
rea
de una cola
t gl ,
0
Porcin de la tabla de distribucin t
gl
Cantidad de en una cola
..
0,025
..
:
:
:
14
2,145
2.
Respuesta:
Como t 0,05 deja un rea de 0,05 a la derecha, y t 0, 025 deja un rea de 0,025 a la
izquierda, encontramos un rea total de 1 0,05 0,025 0,925
0,025
Por lo tanto,
0,05
3.
Suponga que de una poblacin normal con una media de 14 se toma una muestra de
tamao 11. Si la media muestral es 18 y la desviacin estndar muestral 14,3, calcule el valor
del estadstico t.
Respuesta:
El valor t es:
Distribucin ji-cuadrada
x 18 14
0,93
s
14,3
n
11
X :
2
n 1 s 2
2
tiene una distribucin muestral que es una distribucin ji-cuadrada con gl n 1 grados de
libertad y se denota X 2 ( X es la minscula de la letra griega ji). El estadstico ji-cuadrada
esta dado por:
X2
n 1 s 2
2
donde
n:
es el tamao de la muestra
s : es la varianza muestral
2 : es la varianza de la poblacin de donde se extrajo la muestra.
2
x x 2
gl 3
gl 5
gl 10
X2
gl 6
12,592
0,05
X2
El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber
como se va a comportar la varianza o desviacin estndar en una muestra que proviene de
una distribucin normal.
Ejemplo:
Supongamos que los tiempos requeridos por una cierta micro para alcanzar uno de sus
destinos en Santiago forman una distribucin normal con una desviacin estndar 1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.
Respuesta:
Primero encontraremos el valor de ji- cuadrada correspondiente a s 2 2 de la siguiente
manera:
X2
n 1 s 2
17 1 2
32
1 2
0,01
X 2 =32
Distribucin F de Fisher:
La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos
poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea
comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un
proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para
calificar de un profesor universitario de otro.
Intuitivamente, podramos comparar las varianzas de dos poblaciones, 12 y 22 , utilizando la
razn de de las varianzas muestrales
s12
s 22
. Pero si
s12
s 22
evidencia para indicar que 12 y 22 no son iguales. Por otra parte, un valor muy grande o
muy pequeo para
s12
s 22
poblaciones.
La variable aleatoria F se define como el cuociente de dos variables aleatorias ji, cuadrada
independientes, cada una dividida entre sus respectivos grados de libertad. Esto es:
U
F
1
2
s12
F
s 22
12
22
s
F 1
s2
s12 12
s 22 22
2
1
Tambin se puede trabajar con tablas de Distribucin F que aparecen en los libros de
Estadstica.
Como podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de
dos variables que son los grados de libertad ( gl )
Ejemplos:
1. Encontrar el valor de F, en cada uno de los casos:
a) El rea a la derecha de F, es de 0,10 con 1 4 y 2 9
b) El rea a la izquierda de F, es de 0,95 con 1 15 y 2 10
Respuesta:
a) Como el rea de la tabla es de cero a F, se tiene que localizar primero el rea F0,90 , es
decir, 0,10 y luego la interseccin de los grados de libertad del denominador ( gl 2 9 )
con los grados de libertad del numerador ( gl1 4 ), lo que nos da un valor de F = 2,69
0,10
F=2,69
b) En este caso, tenemos que localizar primero el rea F0,95 , es decir, 0,05 y luego la
interseccin de los grados de libertad del denominador ( gl 2 10 ) con los grados de libertad
del numerador ( gl1 15 ), lo que nos da un valor de F = 2,85
0,05
F=2,85
2. En una prueba sobre la efectividad de dos tipos distintos de pldoras para dormir, A y B, se
utilizarn dos grupos independientes de personas con insomnio. A un grupo de tamao 41 se
le administrar la pldora A y al otro grupo, de tamao 121, se le administrar la B,
registrndose el nmero de horas de sueo de cada individuo participante en el estudio. Si
se supone que el nmero de horas de sueo de quienes usan cada tipo de pldora se
distribuye normalmente y que A2 B2 . Calcule el valor estadstico F y determine gl A y gl B
si
s 2A
9 y
s B2
s A2
6 y encuentre P
2 1,5 .
sB
Respuesta:
El valor estadstico F es:
s
F A
sB
9
B
= 1 1,50
6
A
s A2
P
2 1,5 0,95
sB
P=0,95
0,05
F=1,5