Académique Documents
Professionnel Documents
Culture Documents
2.1.1 Concepto.
La inferencia estadstica es el conjunto de mtodos y tcnicas que permiten inducir, a
partir de la informacin emprica proporcionada por una muestra, cual es el comportamiento de
una determinada poblacin con un riesgo de error medible en trminos de probabilidad.
2.2.2 Muestreo.
Seleccin de un conjunto de personas o cosas que se consideran representativos del
grupo al que pertenecen, con la finalidad de estudiar o determinar las caractersticas del grupo.
"para hacer una buena encuesta se necesita antes hacer un buen muestreo"
Introduccin
Caractersticas de un estimador
Puesto que los estimadores son variables aleatorias, uno de los problemas clave de la
estimacin puntual es estudiar las distribuciones muestrales. Por ejemplo, cuando estimamos la
varianza de una poblacin con base en una muestra aleatoria, difcilmente podemos esperar
que el valor de S 2 que obtenemos ser realmente igual a 2 , pero nos tranquilizara, al menos,
saber si podemos esperar que est cerca. Tambin, debemos decidir si usar una media de la
muestra o una mediana de la muestra para estimar la media de una poblacin, sera importante
saber, entre otras cosas, si X o X es ms probable que nos d un valor que sea en realidad
cercano.
As, se pueden usar diversas propiedades estadsticas de los estimadores, para decidir que
estimador es ms apropiado en una situacin dada, cual nos expone a un riesgo ms pequeo,
cul nos dar la mayor informacin al costo ms bajo, y as sucesivamente.
Las propiedades de los estimadores ms conocidas son insesgabilidad, varianza mnima,
eficiencia, consistencia, suficiencia y robustez.
Estimacin por intervalos
La estimacin puntual es una forma comn para expresar las estimaciones, deja espacio
para muchas preguntas. Por ejemplo, no nos dice en cunta informacin se basa la
informacin, ni nos dice nada sobre el tamao posible del error.
Como en el caso de la estimacin puntual, los mtodos de estimacin de intervalo se juzgan
por sus diversas propiedades estadsticas. Por ejemplo, una propiedad deseable es que la
longitud de un intervalo de confianza de 1 100% sea tan corta como sea posible; otra
propiedad deseable es que la longitud esperada, sea tan pequea como sea posible.
Confiabilidad y Significancia
Confiabilidad: Cuando hablamos de confiabilidad, hablamos de nivel de confianza y lo expresamos como
porcentaje. Por ejemplo, establezca con un nivel de confianza del 95 %, que la proporcin de productos
defectuosos, no pasa de 30, .
Significancia: Cuando hablamos de significancia, hablamos de nivel de significancia y lo expresamos
como una fraccin. Por ejemplo, de acuerdo a la evidencia mostrada, podemos decir, con un nivel de
significancia de 0.05, que los datos muestreados, tienen una distribucin normal
Ejemplo: En una fbrica, el supervisor ha percibido que el nivel del caf en los envases
Pag. 315-321
Potencia de la prueba
Cuando se toma una decisin, sera bueno siempre tomar la decisin correcta. Esto, sin embargo, no
es posible en estadstica porque tomamos nuestras decisiones con base en informacin muestral. Lo mejor
que podemos esperar es controlar la probabilidad con la que ocurre un error. Ya dijimos que la
probabilidad asignada al error tipo I es . La probabilidad del error tipo II es .
Para controlar estos errores asignamos una pequea probabilidad a cada uno de ellos. Los valores de
probabilidad para y que se usan con ms frecuencia son 0.01 y 0.05 La probabilidad asignada a cada
error depende de su gravedad; cuando ms grave sea el error, menos dispuestos estamos a hacer que
ocurra, y, por tanto, se asignar un probabilidad ms pequea. y son probabilidades de errores, cada
una bajo condiciones separadas, y no se pueden combinar. En consecuencia, no es posible determinar una
sola probabilidad para tomar una decisin incorrecta. Del mismo modo, las dos decisiones correctas estn
claramente separadas y cada una tiene su propia probabilidad; 1 es la probabilidad de una decisin
correcta cuando la hiptesis nula es verdadera; y 1 es la probabilidad de una decisin correcta cuando
la hiptesis nula es falsa. 1 Recibe el nombre de potencia de la prueba estadstica, porque es la
medida de la capacidad de una prueba de hiptesis para rechazar una hiptesis nula falsa, una
caracterstica muy importante.
La prueba de una hiptesis estadstica es la aplicacin de un conjunto explcito de reglas para decidir
si aceptamos la hiptesis nula o la rechazamos en favor de la hiptesis alternativa. Suponga, por ejemplo,
que un estadstico desea probar la hiptesis nula 0 contra la hiptesis alternativa 1 . Para tomar
una decisin, generar datos muestrales por medio de un experimento y despus calcular el valor de un
estadstico de prueba, que le dir qu accin tomar para cada resultado posible del espacio muestral. El
procedimiento de prueba, por consiguiente, divide los valores posibles del estadstico de prueba en dos
regiones: una regin de aceptacin para H0 y una regin de rechazo para H0.
Es costumbre referirse a la regin de rechazo para H0 como la regin critica de la prueba, y a la
probabilidad de obtener un valor del estadstico de prueba dentro de la regin critica, cuando H0 es verdad,
como el tamao de la regin critica. As, el tamao de una regin critica es justamente la probabilidad
de cometer un error de tipo I. sta probabilidad tambin se llama el nivel de significancia de la prueba.
Ejercicio: Con respecto al fabricante del nuevo medicamento, suponga que ste quiere probar la
hiptesis nula 0.90 contra la hiptesis alternativa 0.60 Su estadstico de prueba es x , el nmero
de xitos observados (recuperaciones) en 20 intentos, y aceptar la hiptesis nula s x 14 ; de otra
manera la rechazar. Encuentre y .
Solucin:
La regin de aceptacin para la hiptesis nula es x 15,16,17,18,19 y 20 y, correspondientemente, la
regin de rechazo (o regin crtica) es x 1, 2, 3,......14
Por consiguiente, de la tabla I:
P x 14; 0.90 0.0114
y
P x 14; 0.60 0.1255
Conclusin: Como > se comete un Error tipo II, por tanto rechazamos la hiptesis nula.
0.4 0.4
0.3 0.3
Densidad
Densidad
0.2 0.2
0.1 0.1
0.1256
0.0114
0.0 0.0
10 12.3 8.85 10
X X
Un buen procedimiento de prueba es aquel donde ambas y son pequeas, de ese modo
nos da una buena oportunidad de tomar la decisin correcta. La probabilidad de un error tipo II en el
ejemplo es ms bien alta, pero esta se puede reducir al cambiar en forma apropiada la regin critica. Por
ejemplo, si usamos la regin de aceptacin x 15 en este ejemplo de manera que la regin critica sea
x 15 , se puede comprobar con facilidad que esto hara 0.0433 y 0.0509 . As, aunque se ha
reducido la probabilidad de un error de tipo II, se ha vuelto ms grande la probabilidad de un error de tipo
I.
La nica forma en que podemos reducir las probabilidades de ambos tipos de errores es aumentar el
tamao de la muestra, pero mientras n se mantenga fija, esta relacin inversa entre las probabilidades de
errores de tipo I y de tipo II es tpica de los procedimientos de decisin estadsticos. En otras palabras, si
la probabilidad de un tipo de error se reduce, la del otro tipo de error aumenta.
Estimacin puntual
Cuando usamos el valor de una estadstica para estimar un parmetro de poblacin,
llamamos a esto estimacin puntual, y nos referimos al valor de la estadstica como un
estimador puntual del parmetro. Por ejemplo, si usamos el valor de X para estimar la media
de una poblacin, una proporcin muestral observada para estimar el parmetro de una
poblacin binomial, o un valor de S 2 para estimar una varianza de poblacin, en cada caso
usamos una estimacin puntual del parmetro en cuestin. Estas estimaciones se llaman
estimadores puntuales porque en cada caso un nmero nico, o un punto nico en el eje real,
se usa para estimar el parmetro.
Correspondientemente, nos referimos a las estadsticas mismas como estimadores
puntuales. Por ejemplo, X se puede usar como un estimador puntual de , en cuyo caso x
z
2 n
Ejemplo: Un equipo de expertos en eficiencia intenta usar la media de una muestra aleatoria de
tamao n 150 para estimar el promedio de la aptitud mecnica de los trabajadores de una
lnea de ensamble en una industria grande. Si basados en la experiencia, los expertos en
eficiencia pueden suponer que 6.2 para esos datos, Qu pueden afirmar con probabilidad
de 0.99 acerca del error mximo de su estimacin?
Solucin:
6.2
2.575 1.30 , as, los expertos en eficiencia pueden afirmar con probabilidad de 0.99 que
150
su error ser menor que 1.30
x z z
2 n 2 n
Es un intervalo de confianza de 1 100% para la media de la poblacin.
Ejemplo: Si una muestra aleatoria de tamao n 20 de una poblacin normal con la varianza
2 225 tiene la media x 64.3 , construya un intervalo de confianza del 95% para la media de
la poblacin .
Solucin:
obtenemos
15 15
64.3 1.96 64.3 1.96
20 20
57.7 70.9
Cuando estamos tratando con una muestra aleatoria de una poblacin normal, n 30 y
es desconocida, no podemos usar la frmula anterior, debemos usar
Teorema 3: Si x y s son los valores de la media y la desviacin estndar de una muestra aleatoria
de tamao n de una poblacin normal con la varianza 2 desconocida, entonces
s s
x t , n 1
x t , n1
2 n 2 n
Es un intervalo con 1 100% de confianza para la media de la poblacin.
Solucin:
Al sustituir x 66.3 , s 8.4 y t0.025, 11 2.201 , el intervalo de confianza del 95% para se
vuelve
8.4 8.4
66.3 2.201 66.3 2.201
12 12
61.0 71.6
Esto significa que podemos afirmar con 95% de confianza que el intervalo de 61.0 minutos a
71.6 minutos contiene el verdadero promedio del tiempo de secado de la pintura.
Z
X 1 X 2 1 2
12
22
n1 n2
P Z Z Z
2 2
1 nos da la siguiente frmula para el intervalo de confianza para 1 2
12 22 12 22
X X Z 2
*
n1
n2
1 2 X X Z *
2 n1
n2
Es un intervalo de confianza del 1 100% para la diferencia entre las dos medias de las poblaciones
Ejemplo:
Construya un intervalo de confianza del 94% para la diferencia entre las vidas medias de dos
clases de focos, dado que una muestra aleatoria de 40 focos de la primera clase dur en
promedio 418 horas de uso continuo y 50 focos de la segunda clase duraron en promedio 402
horas de uso continuo. Las desviaciones estndar de las poblaciones se sabe que son
1 26 y 2 22 .
Solucin:
Para 0.06, Z0.03 1.88 , Por consiguiente, el intervalo de confianza del 94% para 1 2
es
Por tanto, estamos 94% seguros de que el intervalo de 6.3 a 25.7 horas contiene la
diferencia real entre las vidas medias de las dos clases de focos. El hecho de que ambos
lmites de confianza son positivos sugiere que en promedio la primera clase de focos es
superior a la segunda.
EJERCICIOS DE LA UNIDAD II
11.15 Un estudio del crecimiento anual de ciertos cactus mostro que 64 de ellos, seleccionados
aleatoriamente en una regin desrtica crecieron en promedio 52.80 mm con una desviacin
estndar de 4.5 mm Construya un intervalo de confianza del 99 % para el verdadero promedio de
crecimiento anual de la clase de cactus dada.
11.19 Un experto en eficiencia quiere determinar la cantidad promedio de tiempo que tarda la cuadrilla
de un foso en cambiar un juego de cuatro neumticos a un auto de carreras. Use la frmula
propuesta para calcular el tamao de la muestra (n) que se necesita para que el experto en
eficiencia pueda afirmar con 95% de probabilidad que la media de la muestra diferir de , la
cantidad a ser estimada, en menos de 2.5 segundos. Se sabe por estudios previos que =
12.2 }.
2
= [2 ]
11.21 La longitud de los crneos de 10 esqueletos fsiles de una especie extinta de pjaros tiene una
media de 5.68 cm y una desviacin estndar de 0.29 cm. Suponga que esas mediciones estn
distribuidas normalmente, encuentre un intervalo de confianza del 95 % para la media de la
longitud de los crneos de esta especie de pjaro.
11.25 Un estudio de dos clases de equipo de fotocopiado muestra que 61 averas del equipo de la
primera clase se llevaron en promedio 80.7 minutos en ser reparadas con una desviacin estndar
de 19.4 minutos, mientras que 61 averas del equipo de la segunda clase se llevaron en promedio
88.1 minutos en ser reparadas con una desviacin estndar de 18.8 minutos. Encuentre un
intervalo de confianza del 99 % para la diferencia entre los verdaderos promedios del tiempo que
toma reparar las averas de las dos clases de equipo de fotocopiado.
11.27 Las siguientes son las capacidades calricas del carbn de dos minas (en millones de caloras
por tonelada):
Mina A: 8 500 8 330 8 480 7 960 8030
Mina B: 7 710 7 890 7 920 8 270 7 860
Suponga que los datos constituyen muestras aleatorias independientes de poblaciones normales con
varianzas iguales, construya in intervalo de confianza del 99 % para la diferencia entre los promedios
verdaderos de las capacidades calricas del carbn de las dos minas.
Suponga que queremos probar la hiptesis nula 0 contra una de las alternativas
0 , 0 y 0 sobre la base de una muestra aleatoria de tamao n de una poblacin normal
con la varianza conocida 2 . Como indicamos anteriormente, los niveles de significancia que ms
comnmente se usan son 0.05 y 0.01 y como hemos visto en ejemplos anteriores: z y z dan
2
Ejemplo 10: En relacin con el ejemplo 1, el diseo del experimento para contrastar la hiptesis
del supervisor especifica que debe seleccionar una muestra de 16 envases obtenidos al azar de la lnea de
produccin. Si la muestra arrojo una media de X 302.5 gr , a qu decisin se llega con un nivel de
confianza del 95%, suponiendo que la muestra proviene de una poblacin distribuida normalmente, con
varianza 2 9 ?
Solucin:
i. La hiptesis estadstica es: H 0 : 300 H a : 300
ii. Estadstico de prueba: La poblacin de inters X " Contenido de caf en los envases "
est normalmente distribuida, as que no interesa el tamao de la muestra y como se
conoce la varianza de la poblacin 2 9 , entonces el estadstico de prueba es:
X
Z que tiene una distribucin normal estndar.
n
iii. Regla de decisin: Por ser una prueba de cola derecha se tiene que para =0.05, el valor
crtico es: 1 = 0.95 = 1.645. Luego la regla de decisin es:
Rechace H0 si > .
iv. Decisin estadstica: Los datos con los que se cuenta son:
= , = . , = , = .
. .
Con estos datos resulta que = = = = = . , por tanto, la
decisin es: rechcese H0 ya que = 3.333 > 1.645
v. Decisin tcnica: Se presenta la probabilidad de un error tipo I, controlada con el nivel de
significancia ; la decisin estadstica de rechazar H0 implica aceptar Ha, y como la
hiptesis alternativa establece que >300, entonces la decisin tcnica debe ser detener
el proceso de produccin y llamar al personal especializado para que ajuste la mquina
envasadora).
Ejemplo 11: Suponga que por experiencia se sabe que la desviacin estndar del peso de paquetes
de 8 onzas de galletas de cierta pastelera es de 0.16 onzas. Para comprobar si su produccin est bajo
control en un da dado, esto es, comprobar si el peso promedio verdadero de los paquetes es 8 onzas, los
empleados seleccionan una muestra aleatoria de 25 paquetes y encuentran que la media de su peso es x =
8.091 onzas. Puesto que la pastelera pierde dinero cuando > 8 y el cliente pierde cuando < 8, pruebe
la hiptesis nula = 8 contra la hiptesis alternativa 8 al nivel 0.01 de significancia.
Solucin
H0 : 8
H1 : 8
0.01
x 0
Rechace la hiptesis nula si z -2.575 o z 2.575 donde z
n
8.091 8 0.091
Al sustituir x 8.091, 0 8, 0.16 y n 25, obtenemos z 2.8438
0.16 0.0320
25
Puesto que z 2.8438 excede a 2.575, se debe rechazar la hiptesis nula y se deben hacer ajustes
apropiados en el proceso de produccin.
Ejemplo 12: Suponga que 100 neumticos que cierto fabricante produce duraron en promedio 21, 819
millas con una desviacin estndar de 1, 295 millas. Pruebe la hiptesis nula 22, 000 millas contra la
hiptesis alternativa 22, 000 millas en el nivel 0.05 de significancia.
Solucin:
H 0 : 22, 000
1. H1 : 22, 000
0.05
x 0
2. Rechace la hiptesis nula si z 1.645, donde z
n
3. Al sustituir x 21,819, 0 22,000, 1, 295 y n 100, obtenemos
21,819 22, 000 181
z 1.3977
1, 295 12.95
100
4. Puesto que z 1.3977 es mayor que 1.645, no se puede rechazar la hiptesis nula; no hay
evidencia real de que los neumticos no son tan buenos como se supone bajo la hiptesis nula.
Ejemplo 13: Se hace un experimento para determinar si el contenido promedio de nicotina de una
clase de cigarrillos excede al de otra clase en 0.20 miligramos. Si n1 50 cigarrillos de la primera clase
tuvieron un contenido promedio de nicotina de x1 2.61 mg con una desviacin estndar de s1 0.12 mg ,
en tanto que n2 40 cigarrillos de la otra clase tuvieron un contenido promedio de nicotina de
x2 2.38 mg con una desviacin estndar de s2 0.14 mg , pruebe la hiptesis nula 1 2 0.20 contra
la hiptesis alternativa 1 2 0.20 en el nivel 0.05 de significancia. Tome la decisin con base en el
Valor p que corresponde al valor del estadstico de prueba apropiado.
Solucin:
1. H 0 : 1 2 0.20
H 0 : 1 2 0.20
0.05
Este valor corresponde a una cola, por tanto, Valor p 2 0.1401 0.2802
4. Puesto 0.2802 0.05 , no se puede rechazar la hiptesis nula; es decir que, la diferencia entre
2.61 2.38 0.23 y 0.20 no es significativa. Esto significa que la diferencia bien podra
atribuirse al azar
respectivamente, t t , n1 n2 2
, t t , n1 n2 2 y t t , n1 n2 2 .
2
Solucin:
H 0 : 0.50
1. H A : 0.50
0.05
2. Use la estadstica de prueba X, el nmero observado de xitos.
3. x 4 , y puesto que P X 4 0.0059 el Valor p es2 0.0059 0.0118
4. Puesto que el Valor-p es menor que 0.05, se debe rechazar la hiptesis nula; y concluimos que 0.50
Si usamos tamaos grandes de n, podemos usar las siguientes formulas:
x n
z Como una variable aleatoria que tiene la distribucin normal estndar.
n 1
n 100 0 0 z z
0 z z
x n 0 1
x n 0
z z
2
n 0 1 0
Y la siguiente formula: o
n 0 1 0
X i nii
a) Zi para i 1, 2, ....., k con distribuciones normales estndar,
nii 1 i
xi nii
2
k
2
i 1 ni i 1 i
y , podemos entonces considerar como un valor
xi ni0
2
k
, donde
2
2 2, k
i 1 ni 0 1 0
b) Cuando no se especifica 0 , esto es, cuando solo nos interesa la hiptesis nula
1 2 ..... k sustituimos por la estimacin ponderada
x1 x2 .... xk
2 2, k 1 , donde
n1 n2 .... nk y la regin crtica se vuelve
2
k xi ni
2
i 1 n 1
i
Presento ahora una frmula alternativa para la estadstica ji cuadrada inmediata anterior,
la cual, se presta ms rpidamente a otras aplicaciones. Si arreglamos los datos como en la
tabla siguiente
xitos Fracasos
Muestra 1 x1 n1 x1
Muestra 2 x2 n2 x2
.
Muestra k xk nk xk
i 1 ni 1
i 1 j 1 eij
Ejemplo 15: Determine, con base en los datos muestrales de la siguiente tabla, si la
proporcin verdadera de compradores que favorecen el detergente A sobre el detergente B es la
misma en las tres ciudades:
Solucin:
H 0 : 1 2 3
1. H A : 1 , 2 y 3 no son todas iguales
0.05
2. Rechace la hiptesis nula si 2 0.05,
2
2 5.991 donde
fij eij
2
3 2
2
i 1 j 1 eij
232 260 197 689
3. La estimacin ponderada de es 0.53
400 500 400 1300
232 212 260 265 197 212 168 188 240 235 203 188
2 2 2 2 2 2
2
6.48
212 265 212 188 2235 188
4. Puesto que 2 6.48 excede a 5.991, se debe rechazar la hiptesis nula; en otras palabras, las
proporciones verdaderas de compradores que favorecen el detergente A sobre el detergente B en las 3
ciudades no son las mismas.
Hay varias razones por las que es importante probar las hiptesis concernientes a las
varianzas de las poblaciones. En lo que concierne a las aplicaciones directas, un fabricante que
tiene que cumplir con especificaciones rgidas tendr que efectuar pruebas sobre la variabilidad
de su producto, tal vez un maestro desea saber si ciertas aseveraciones son verdaderas acerca de
la variabilidad que puede esperar en el desempeo de un estudiante, y quiz un farmacutico
tiene que comprobar si la variacin en la potencia de una medicina est dentro de los lmites
permisibles. En lo que concierne a aplicaciones indirectas, las pruebas acerca de las varianzas a
menudo son prerrequisitos para las pruebas concernientes a otros parmetros. Las pruebas que
veremos en esta seccin son:
1. Prueba de la hiptesis nula de que la varianza de una poblacin normal es igual a una
constante dada
2. Prueba de la igualdad de las varianzas de dos poblaciones normales (a la que nos
referiremos en la seccin 3.11)
Donde 2 n 1 S 2
2
0
Ejemplo 16: Suponga que el espesor de una parte usada de un semiconductor es su dimensin crtica y que las
mediciones del espesor de una muestra aleatoria de 18 de dichas partes tiene la varianza S 0.68 , donde las
2
mediciones son en milsimas de pulgada. El proceso se considera que est bajo control si la variacin del espesor
est dada por una varianza no mayor que 0.36 Suponga que las mediciones constituyen una muestra aleatoria de
una poblacin normal, pruebe la hiptesis nula 2 0.36 contra la hiptesis alternativa 2 0.36 en el nivel
de 0.05 de significancia.
SOLUCION:
H 0 : 2 0.36
1. H A : 2 0.36
0.05
2 2 , n1 , 2
n 1 S 2
2. Rechace la hiptesis nula si donde y
02
2, n1 0.05,17
2
27.587
17 0.68
3. Sustituimos S 2 0.68, 02 0.36 y n 18, y obtenemos 2 32.11
0.36
4. Puesto que 2 32.11 27.587 , la hiptesis nula debe rechazarse y el proceso para la
manufactura de las partes debe ajustarse. Advierta que si hubiera sido 0.01, no se
podra haber rechazado H 0 , puesto que 2 32.11 no excede a 0.01,2
17 33.409 . Esto
sirve para indicar una vez ms que la eleccin del nivel de significancia debe hacerse por
adelantado, para evitar la tentacin de escoger un valor que casualmente satisfaga
nuestros fines.
Ejemplo 17: En una empacadora de leche en polvo se ha observado que queda demasiado
espacio vaco en los botes cuyo contenido neto es de 1000 gr y se decide optimizar el costo de los
botes mediante el ahorro de material para su elaboracin; el proceso natural de compactacin de
la leche envasada debera de darse con una varianza menor que 400 cm3. En una muestra de 15
botes seleccionados al azar se mide la diferencia entre el volumen que ocupa el producto al ser
enlatado y el que ocupa despus de ocurrida la compactacin. La varianza de los 15 datos
muestrales es S2 = 349.7 cm3. A qu decisin llegaran con estos datos?
Solucin:
estadstico de prueba
2 n 1 S 2
tenga una distribucin Chi-cuadrada con 14 gl
02
3. Regla de decisin: Para un nivel de significancia 0.05 y una prueba de cola derecha
se tiene
Se rechaza H0 si 2 0.05,
2
14
Grfica de distribucin
Chicuadrado, df=14
0.09
0.08
0.07
Regin de
0.06
aceptacin de H0
Densidad
0.05
0.04
0.03
0.02
0.01
0.05
0.00
0 6.57
X
Regin de
rechazo de H0
4. Decisin estadstica: Para obtener el estadstico de prueba calculado se tienen los datos
Estas pruebas se emplean cuando el inters se concentra en comparar las varianzas de dos
poblaciones, en particular al seleccionar el estadstico de prueba adecuado en la prueba de
hiptesis para dos medias con varianzas desconocidas, se tiene que decidir si ambas varianzas son
t
X 1 X 2 1 2
con S 2
n1 1 S12 n2 1 S 22
) o no lo son, es decir que 2 2 , (en
n1 n2 2
p 1 2
1 1
Sp
n1 n2
S12 12
En general, el estadstico de prueba para esta situacin es: F , sin embargo,
S22 22
cuando la prueba de hiptesis se hace bajo el supuesto de que H0 es cierta, podemos considerar
S12
que 1 2 por lo que dicho estadstico se reduce a F 2
2 2
S2
El valor crtico para una prueba en cola izquierda es F , n 2 1, n1 1 que puede ser obtenido de
1
la igualdad Fn2 1, n1 1, y buscando Fn1 1, n2 1,1 en tablas.
Fn1 1, n2 1, 1
El valor crtico para cola derecha es Fn1 1, n2 1,1 y los valores crticos para la prueba de
dos colas se obtienen con Fn 1, n 1, 1 y Fn 1, n 1, 1
1 2 2 2 1 2
Ejemplo 18: La homogeneizacin del conocimiento es una caracterstica de gran relevancia para
los investigadores. Se est estudiando si entre el mtodo onomatopyico y el del silabario hay
diferencias en la homogeneidad de los resultados de la enseanza de la lectura a los nios que
ingresan a la primaria sin saber leer. Se conformaron dos grupos, cada uno de 25 alumnos
seleccionados al azar y se asign a un grupo tambin seleccionado al azar- un profesor
especialista en el mtodo onomatopyico, siendo el otro grupo atendido por un especialista en el
Ing. Fernando Loera Rivera
Docente Ingeniera industrial
Tecnolgico Nacional de Mxico
ITSU
ESTADISTICA Y CONTROL DE CALIDAD
mtodo del silabario. Al fin del ao escolar una prueba estndar de lectura dio los siguientes
resultados:
Mtodo onomatopyico S12 128.4
Mtodo del silabario S12 166.7
Estos datos dan evidencia significativa para afirmar que entre ambos mtodos existe una
diferencia en el grado de homogeneidad del aprendizaje?
Solucin:
1. Hiptesis estadstica: Homogeneidad y heterogeneidad son conceptos que se miden con
la varianza, por eso el planteamiento estadstico es:
H0: 12 22 Ha: 12 22
2. Estadstico de prueba: Los tamaos de muestra n1 n2 25 , sin ser pequeos, no son lo
suficientemente grandes; entonces el requisito es que ambas poblaciones se distribuyan
S12
aproximadamente en forma normal para que el estadstico de prueba F 2 tenga una
S2
distribucin F-Fisher con n1 1 n2 1 24 gl en el numerador y en el denominador.
3. Regla de decisin: Si 0.05 , para una prueba de dos colas los valores crticos que
determinan las regiones de aceptacin y de rechazo de H0 son F24, 24, 0.975 2.27 y
1 1
F24, 24, 0.025 0.4405 , la regla de decisin es:
F24, 24, 0.975 2.27
Se rechaza H0 si FCalc F24, 24, 0.025 0.4405 o si FCalc F24, 24, 0.975 2.27
Grfica de distribucin
F, df1=24, df2=24
1.2
1.0
0.8
Densidad
0.6
0.4
0.2
0.025
0.025
0.0
0 0.4405 2.27
X
4. Decision estadstica: Con los datos S12 128.4 y S12 166.7 obtenemos el estadstico de
S12 128.4
prueba calculado: F 2 0.7702 , siendo la decisin estadstica
S2 166.7
Aceptar H0 porque F24, 24, 0.025 FCalc F24, 24, 0.975 , esto es, cae en la zona de aceptacin
de H0 es decir, 0.4405 0.7702 2.27
Grfica de distribucin
F, df1=24, df2=24
1.2
1.0
0.8
Densidad
0.6
0.4
0.2
0.025
0.025
0.0
0 0.4405 2.27
X
0.7702