Vous êtes sur la page 1sur 65

UNIDAD

10

Inferencia estadstica
Objetivos
Al finalizar la unidad, el alumno: determinar si un estimador es sesgado o insesgado resolver problemas de intervalos de confianza para la media, diferencia de medias, varianza y proporciones llevar a cabo pruebas de hiptesis para la media, diferencia de medias, varianza y proporciones en problemas de aplicacin

Introduccin En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se
realizan estimaciones de parmetros en estudio; las multivariables aleatorias; se defini formalmente el mues tre oaleatorio, y se estudiaron algunasdis tribucionesmues trale sempleando el te ore ma central de l lmite . El objetivo general de dichostemasesla construccin de lasbases tericas para la inferencia estadstica. En esta unidad se analizar e l proces o de inferencia es tads tica, el cual se puede hacer de tres maneras: por es timacin puntual, intervalo de confianza o por prueba de hiptes is . Los es timadores puntuales , como se ver, tienen gran importancia terica en la inferencia es tads tica, pero en la cuestin prctica no es apropiado llevarlosa cabo con base en un solo punto; por consiguiente se harn es timacionesbasadasen intervalos . La otra rea de inferencia estadstica que se analizar esla prue ba dehiptes is . Esdecir, se formula una suposicin del parmetro y bajo condiciones determinadas se comprobar si es vlida o no. En la unidad 1 se determin que la es tads tica des criptiva trabaja con todos los individuosdelapoblacin o lamuestra. En estaunidad severquelaes tads ticainferencial s e basa en e l es tudio de mues tras, a partir de las cuales s e pre tende inferir as pectos re le vantes de toda la poblacin. En la unidad 9 se determin que el mtodo de seleccionar muestras tiene gran importancia en el desarrollo de la estadstica. Cmo se realiza la inferencia y qu grado de confianza se puede tener en la muestra son aspectos fundamentales que se analizarn en esta unidad.

10.1 Inferencia estadstica


La inferencia estadstica consiste en crear mtodos con los cuales se puedan realizar conclusiones o inferencias acerca de la poblacin, con base en informacin muestral o a priori. Tales mtodos se dividen en dos grupos: 1. Clsico. 2. Bayesiano. En el mtodo clsico la inferencia se realiza mediante los resultados de un muestreo aleatorio. Mientras que en el mtodo bayesiano las inferencias se realizan (de forma anloga a la asignacin de probabilidades en la corriente bayesiana) con base en el conocimiento previo sobre la distribucin de los parmetros desconocidos. El desarrollo de la inferencia estadstica en la presente unidad se har slo con el mtodo clsico. El anlisis comienza con la estimacin de parmetros.

286

10.1.1 Estimacin puntual


Un estimador es un elemento descriptivo basado en las mediciones contenidas en una muestra. Por ejemplo, la media de la muestra
x 1 n xi ni 1

es un es timador puntual para la media de la poblacin 0. Supngase que se quiere obtener una inferencia respecto de la calificacin media de todos los alumnosque cursan la materia de clculo, para esto se analiza una muestra aleatoria de diez de ellos, cuyas calificaciones son
8, 4, 9, 9, 6, 8, 2, 7, 3 y 6

Mediante el promedio de los datos de una muestra se calcula un valor para el estadstico X
x 1 (8 4 9 9 6 8 2 7 3 6) 6.2 10

Con base en el valor calculado del estadstico X se puede llevar a cabo una inferencia respecto del parmetro , es decir, una es timacin puntual del parmetro media respecto de las calificaciones de la materia de clculo. En este caso la calificacin promedio es 6.2. En general
Definicin 10.1
Dada una poblacin en donde estimador puntual de es un parmetro, y

su estadstica correspondiente, se le llama

a cualquier valor

de

De la definicin de es timador puntual no se puede esperar que dicho valor realice una estimacin certera del parmetro, de hecho, sta tambin depende del estadstico utilizado. Por ejemplo, si la poblacin estudiantil de la materia de clculo tiene calificacin promedio = 6.5, y se considera una muestra al azar de tres estudiantescon calificaciones 3, 6 y 6, para realizar una estimacin del parmetro, se tiene
x 1 (3 6 6) 5 3

Es decir, el estadstico media difiere del parmetro en 1.5 unidades, mientras que el estadstico mediana x 6, difiere del parmetro en slo 0.5. Por tanto, con lamuestra anterior, el estadstico medianaestima mejor el parmetro. Pero, qu pasar si en una segunda muestra aleatoria de tamao tres, las calificaciones para la estimacin del parmetro resultan 4, 4, y 10, se tiene
x 1 (4 4 10) 6 3

Por tanto, para esta muestra el estadstico media difiere del parmetro en 0.5 unidades, mientras que el estadstico x 4, difiere del parmetro en 2.5. Es decir, con la muestra anterior el estadstico media estima mejor el parmetro. Por tanto, puede ser de interesqu estimador puntual para un mismo parmetro es mejor elegir. La respuesta se encuentra en las siguientes definiciones.

287

Definicin 10.2
El estadstico

se llama estimador insesgado del parmetro

si E(

)=

E jemplo 1

Dadas X1, X2, . . ., X5 una muestra aleatoria de una poblacin cuya distribucin es normal, con media y varianza 2, considerando los estadsticos
T1 X , T2 X1 X 2 10 X5 y T3 X1 X 2 X3 X4 3 X5

se comprueba cules son estimadores insesgados de . Para verificar qu estimadores son insesgados, se emplea la definicin y la propiedad del valor esperado en variables independientes
E(a1X1 a2X2 anX n ) a1E(X1 ) a2E(X 2 ) anE(X n )

Para el estadstico T1
E(T1 ) E(X ) E X1 X2 X3 X4 5 X5 1 E X1 X 2 X 3 X 4 5 X5

1 E(X1) E(X 2 ) E(X 3 ) E(X 4 ) E(X 5 ) 5 1 ( 5 ) 1 (5 ) 5

Se muestra que T1 es un es timador ins es gado. Para el estadstico T2


E( T2 ) E X1 X2 X3 10 X4 X5 1 E X1 X 2 10 X3 X4 1 2 X5

1 E( X1) E( X 2 ) E( X 3) E( X 4 ) E( X 5 ) 10

1 (5 ) 10

Se muestra que T2 es un es timador s es gado. Para el estadstico T3


E( T3 ) E X1 X 2 X3 X4 3 X5 1 E X1 X 2 3 1 ( 3 X 3 X4 X5 ) 1 (3 ) 3

1 E( X1) E( X 2 ) E( X 3) E( X 4 ) E( X 5 ) 3

Por tanto, T3 tambin es un es timador ins es g ado de la media. En el ejemplo anterior se apreciaquea un mismo parmetro le pueden corresponder varios estimadores insesgados. Por consiguiente, en el estudio de la estadstica resulta de inters conocer el estimador insesgado que tenga la menor varianza, ya que en tal caso su distribucin est ms cercana al parmetro.
Definicin 10.3
Dado un parmetro y un conjunto de estimadores insesgados de l, de al de menor varianza.

, , , 1 2

m , se llama

288

E jemplo 2

Dadalamuestra aleatoriadel ejemplo anterior X1, X2, . . ., X5 y considerando losestadsticos que resultaron insesgados de
T1 X y T3 X1 X 2 X3 X4 3 X5

se comprueba cul es ms eficiente. Para esto se usa la definicin y la propiedad de la varianza en variables independientes
V (a1X1 a2X 2
2 2 anX n ) a1 V (X1 ) a2 V (X2 )

a2 nV (X n )

Para el estadstico T1
V( T1) V X1 X 2 X3 5 X4 X5 1 52 V X1 X 2 X3 1 ( 25
2

X4
2

X5
2 2 2

1 V( X1) V( X 2 ) V( X 3) V( X 4 ) V( X 5 ) 25 1 (5 25
2

1 5

Para el estadstico T3
V( T3) V X1 X 2 X3 X4 3 X5 1 32 V X1 X2 X3 X4 1 ( 9
2

X5
2 2 2 2

1 V( X1) V( X 2) V( X 3) ( 1)2 V( X 4 ) V( X 5 ) 9 1 (5 9
2

5 9

De los clculos anteriores, resulta que el estadstico T1 es ms eficiente que T3, puesto que 1/ 5 5/ 9. Entre los parmetros ms comunes y sus estadsticos, existen los insesgados que se emplean con mayor regularidad:

E jercicio 1
1. Dadas X1, X2, X3 y X4 una muestra aleatoria seleccionada de una poblacin distribuida en forma normal con media y desviacin estndar , considera los siguientes estimadores de
T1 X1 X 2 6 X3 X4 T2 X1 X2 4 X3 X4 T3 X1 2X 2 3X 3 10 4X 4

y determina cules son insesgados y entre stos cul es ms eficiente.

289

2. La lectura en un voltmetro conectado a un circuito depruebatiene una distribucin uniforme en el intervalo de ( , + 1), donde es el parmetro para el voltaje del circuito. Supn que X1, X2, X3 y X4 es una muestra aleatoria de tales lecturas y verifica que X 0.5 es un estimador insesgado. 3. Dadas X1, X2 y X3 y Y1, Y2 y Y3 como muestras aleatorias independientes de dos 2 2 y 2 , respectivamente poblaciones con medias 1 y 2 y varianza 1 a) comprueba que X Y es un estimador insesgado de b) calcula la varianza del estimador X Y
1

10.1.2 Estimacin por intervalo


Despus de iniciado el estudio de los estimadores puntuales es lgico suponer que la inferencia realizada mediante un valor puntual no es la ms adecuada, ya que puede variar considerablemente de muestra en muestra, por tanto, es preferible indicar un intervalo en el que se pueda estimar, con cierto grado de confianza, la localizacin del parmetro en estudio. Dada como parmetro, supngase que, bajo ciertas condiciones (como se ver ( i , s), donde los puntos extremos en las siguientes subsecciones ), se encuentra que y llamados extremo inferior y extremo s uperior, respectivamente, dependen del i s valor de la estadstica para una muestra particular. Como los extremos i y s del intervalo dependen de la muestra, resulta que slo son valores de las variables aleatorias correspondientes i y s. Con base en las variables aleatorias anteriores y sus valores correspondientes, se calcula la probabilidad de que el parmetro se encuentre en el (0, 1) a la probabilidad mencionada intervalo establecido. Se simboliza por 1 con
P(
i

) 1 s

Es decir, se tiene una probabilidad de 1 de seleccionar una variable aleatoria que con base en una muestra produzca un intervalo que contenga a .
Definicin 10.4
El intervalo anterior en el que se localiza el parmetro de ,

(1 )100%;

mientras que la fraccin

, se llama intervalo de s se le llama o grado inferior y superior,

y los extremos respectivamente.

y, i s

son los

Por ejemplo, se tiene una muestra de 20 focos cuya duracin promedio en horas es x 750 y con base en este valor se estima que el parmetro puede encontrarse con una probabilidad 1 , establecida de antemano en el intervalo de confianza (740, 760), es decir P(740 760) 1

En las siguientes subsecciones se analizarn los intervalos de confianza ms comunes para los parmetros, medias , diferencia de medias , varianzas y proporciones .

290

Intervalos de confianza para medias de poblaciones aproximadamente normales


Establecidas las bases generales de los intervalos de confianza y utilizando el teorema del lmite central, losconceptossobre estimadorespuntuales ylasdistribuciones determinadas en la unidad 9, se presentan mtodos para el clculo de intervalos de confianza. Uno de estos mtodos se refiere a la media, y se divide en tres casos: tribucin normal, 1. Intervalo de confianza para la media poblacional con dis cuando s e conoce Dada x la media de una muestra aleatoria de tamao n de una poblacin con dis tribucin aproximadamente normal, de la cual se conoce 2, el intervalo de confianza (1 ) de 100% para est dado por
x z
2

x z
2

donde z / 2 es el valor de la distribucin normal estndar, a la derecha del cual tiene un rea de / 2. Se denota en este caso que para poder aplicar la frmula, la distribucin tiene que ser normal o aproximadamente normal y s e de be conocer e l parmetro .
E jemplo 3

Una mquina de refrescos est ajustada de tal manera que la cantidad de lquido suministrado se distribuye en forma normal con desviacin estndar de 0.15 dl. Se calcula 95% de intervalo de confianza para la media de refrescosservidosde una muestra de 36 vasos tomada al azar con un contenido promedio de 2.25 dl. Se toman los datos: = 0.15 dl, el tamao de la muestra es 36 con media muestral de x 2.25 dl. Para calcular el intervalo de confianza del parmetro media se emplea la frmula anterior. Primero se calcula el valor de z / 2, con 1 = 0.95. De las tablasporcentuales para la distribucin normal estndar se tiene z / 2 = 1.96. Por tanto,
2.25 1.96 0.15 36 2.201 2.25 1.96 2.299 0.15 36

Es decir, con 95% de probabilidad se afirma que el parmetro media del lquido suministrado por la mquina de refrescos se encuentra entre 2.201 y 2.299 dl. e des conoce en 2. Intervalo de confianza para la media poblacional cuando s mues trasgrandes . Dada x la media de una muestra aleatoria de tamao n (n 30) tomada al azar de una poblacin de la cual se conoce su desviacin estandar s y se desconoce , el intervalo de confianza (1 ) de 100% para est dado por
x z
2

s n

x z
2

s n

291

donde z / 2 es el valor de la distribucin normal estndar, la cual tiene un rea de / 2 y s es la desviacin estndar obtenida del estadstico varianza insesgada. En este caso es posible notar que para poder aplicar la frmula, a diferencia del anterior, s e des conoce la dis tribucin.
E jemplo 4

Setieneunamquinaderefrescoscomo en el ejemplo anterior, pero delacual sedesconoce su desviacin estndar. Para estimar la cantidad promedio de lquido suministrado por la mquina se toma una muestra al azar de 50 vasos, con media de 240 ml y desviacin estndar de 20. Se calcula 99% de intervalo de confianza para la media de refrescos servidos. Se toman losdatos: el tamao de la muestra es 50, x 240 y s= 20 ml. El intervalo de confianza del parmetro media se obtiene sustituyendo estos valores en la frmula anterior. Se calcula primero el valor de z / 2, con 1 = 0.99. De las tablasporcentuales para la distribucin normal estndar se tiene z / 2 = 2.575. Por tanto,
240 2.575 20 50 232.72 240 2.575 247.28 20 50

Es decir, con 99% de probabilidad se afirma que el parmetro media del lquido suministrado por la mquina de refrescos se encuentra entre 232.72 y 247.28 ml. 3. Intervalo de confianza para la media poblacional cuando s e des conoce en mues traspequeas . Dada x la media de una muestra de tamao n (n 30) tomada al azar de una poblacin 2 con distribucin normal de la cual se conoce s , y se desconoce 2, el intervalo de confianza (1 ) de 100% para est dado por
x t
2

s n

x t
2

s n

donde t / 2 es el valor de la distribucin t-S tudent con v = n 1 grados de libertad, la cual tiene un rea de / 2, y s es la desviacin estndar obtenida del estadstico varianza insesgada. Se denota en este caso que la aplicacin de la frmula se puede realizar si la distribucin de la poblacin esnormal o aproximadamente normal, pero a diferencia del caso 1, no se conoce el parmetro , y del caso 2, el tamao de la muestra debe ser pequeo.
E jemplo 5

Un fabricantedemquinasderefrescosaseguraquesusmquinassuministran en promedio 240 ml de refresco 99.9% de los casos. Un comprador decide verificar estos datos, por lo que toma una muestra al azar de 15 vasos, obteniendo los siguientes resultados
243 246 250 250 240 252 240 250 247 248 249 239 245 248 245 250 240 249 238 245 250 246 247 248 252 238 247 247 248 251

Se calcula con 99.9% de confianza si es vlida la afirmacin del fabricante. Para encontrar el intervalo de confianza se necesita calcular la media y la varianza 2 insesgada de la muestra obtenida: x 246.27 y s n 1 17.58, es decir, s = 4.19.

292

Siendo la muestra de 15 vasos, se aplica el caso 3, para lo cual se calcula el valor de t / 2, con v = 15 1 = 14 grados de libertad y 1 = 0.999, donde = 0.001, es decir / 2 = 0.0005. Por tanto, aplicando las tablas porcentuales para la distribucin t-S tudent se tiene t0.0005 = 4.14. En conclusin
246.27 4.14 4.19 15 241.79 246.27 4.14 250.75 4.19 15

Es decir, con 99.9% de probabilidad se determina que el parmetro media del lquido suministrado por la mquina de refrescos se encuentra entre 241.79 y 250.75 ml. Por tanto, la afirmacin del fabricante no ser vlida con 99% de confianza, puesto que el valor 240 ml est fuera del intervalo.

E jercicio 2
1. De la siguiente muestra aleatoria, tomada de un poblacin normal
13 19 14 12 21 14 17 20 17

calcula 95% de intervalo de confianza para la media de la poblacin a) si se sabe que la varianza poblacional es 4 b) si no se conoce el valor de la varianza poblacional 2. Un ingeniero de control de calidad midi lasparedes de 25 botellas de vidrio de dos litros. La media muestral fue 4.02 mm y la desviacin estndar muestral 0.09, calcula 95% de intervalo de confianza respecto de la media del espesor de las paredes de las botellas. 3. Mientras se efecta una tarea determinada en condiciones simuladas de ausencia de gravedad el ritmo cardiaco de 40 astronautas en adiestramiento se incrementa, 26.4 pulsaciones por minuto en promedio con desviacin estndar de 4.28, calcula la verdadera media en el incremento del ritmo cardiaco si x 26.4 se utiliza como una estimacin puntual del incremento medio en el ritmo cardiaco y se utiliza 95% de confianza. 4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una estacin de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supn normalidad y calcula un intervalo de confianza para la media con = 0.05 5. Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra al azar de piezas cuyos dimetros son 10, 12, 11, 11.5, 9, 9.8, 10.4, 9.8, 10 y 9.8 mm. Supn que los dimetros tienen una distribucin aproximadamente normal y a) calcula 99% de intervalo de confianza para el dimetro promedio de todas las piezas b) calcula 99% de intervalo de confianza para el dimetro promedio de piezas si = 1.

293

Intervalos de confianza para la diferencia de medias en poblaciones aproximadamente normales


Despus de analizar los intervalos de confianza para la media poblacional, se contina con el clculo de intervalos de confianza para la diferencia de medias, el cual se divide en cinco casos. 1. Intervalo de confianza para cuando s e conocen
2 1

de poblaciones con dis tribuciones normales ,

2 2.

Dadas x 1 y x 2 las medias de muestras aleatorias independientes de tamaos n1 y n2, respectivamente, de poblacionescon distribucionesaproximadamente normales, 2 2 y 2 de las cuales se conoce 1 , el intervalo de confianza de (1 ) de 100% para y 2 est dado por 1
(x 1 x2 ) z
2 2 1 2 2

n1

n2

(x 1

x2 ) z
2

2 1

2 2

n1

n2

donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2.


E jemplo 6

Se comparan dos tipos de rosca de tornillos para determinar su resistencia a la tensin. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados (en kg)
Tipo de rosca 1 2

1 68 75

2 70 73

3 72 73

4 69 68

5 71 68

6 72 67

7 70 69

8 69 75

9 75 74

10 69 68

11 70 73

12 71 74

Si 1 y 2 son resistencias promedio a la tensin de los tornillos tipo I y tipo II, 2 5y respectivamente, con las variaciones a la tensin de los tornillos tipo I y tipo II 1 2 10, . respectivamente, se calcula 90% de intervalo de confianza para 2 1 2 Primero se calculan las medias muestrales: x 1 70.5 y x 2 71.4 . Las muestras son de tamao n1 = n2 = 12. Se calcula el valor para z / 2 con 90% de intervalo de confianza usando las tablas porcentuales, z / 2 = 1.645.
(70.5 71.4) 1.645 5 10 12 12 2.74
1 2

(70.5 71.4) 1.645 0.94

5 10 12 12

Es decir, la diferencia de la resistencia promedio a la tensin al fabricar lostornillos tipos I y II se encuentra entre el intervalo (2.74, 0.94), con 90% de confianza. Dado que en el intervalo se encuentra el 0, no hay diferencia significativa entre los dos tipos de rosca.

294

2. Intervalo de confianza para en mues trasgrandes .

de poblacionescuando s e desconocen

2 1

2 2

Dadas x 1 y x 2 las medias de muestras aleatorias independientes de tamaos n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones de las cuales se desconocen 2 2 1 y 2 , el intervalo de confianza (1 ) de 100% para 1 2 est dado por
(x 1 x2 ) z
2 2 s 1 n1 2 s 2 n2 1 2

(x 1

x2 ) z
2

2 s 1 n1

2 s 2 n2

donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2 2 2 ys 1, s 2 son las varianzas insesgadas respectivas de las muestras 1 y 2.
E jemplo 7

Retomando el ejemplo 6, se prueban 40 tornillosde cada tipo de cuerda bajo condiciones similares y se obtienen los siguientes resultados (en kg).
del tipo I x 1 72.5 y s 1 del tipo II x2 2.45, n1 40 40

69.8 y s 2 1.75, n2

Si 1 y 2 son resistencias promedio a la tensin, de los tornillos tipo I y tipo II, respectivamente, se calcula 95% de intervalo de confianza para 1 2 con el fin de determinar con cul tipo de tornillos es ms resistente. Como ya se conocen los valores muestrales para la media y la desviacin estndar, y siendo las muestras grandes (n1 = n2 = 40 30), falta nicamente encontrar el valor para z / 2 con 95% de intervalo de confianza. Usando las tablas porcentuales, z / 2 = 1.96
(72.5 69.8) 1.96 2.452 40 1.752 40 1.78
1 2

(72.5 69.8) 1.96 3.62

2.452 40

1.752 40

Puesto que el intervalo para la diferencia de las medias poblacionales siempre ser positivo, se tiene 95% de confianza de que la resistencia a la tensin de los tornillos tipo I es mayor a la de los del tipo II
1

(1.78, 3.62) indica que

0, es decir

3. Intervalo de confianza para


2 1

de poblacionesnormalescuando s e desconocen en mues traspequeas .

2 2,

pero s es abe que

2 1

2 2

Dadas x 1 y x 2 las medias de muestras aleatorias independientes de tamaos n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones aproximadamente normales de 2 2 2 2 las que se desconocen 1 y 2 pero se conoce que 1 2 , el intervalo de confianza (1 ) de 100% para 1 2 est dado por
(x 1 x2 ) t (sp )
2

1 n1

1 n2

(x 1

x2 ) t (sp )
2

1 n1

1 n2

295

donde t / 2 es el valor de la distribucin t-S tudent con v = n1 + n2 2 grados de libertad, el cual tiene un rea de / 2
sp
2 2 (n1 1)s 1 (n2 1)s 2 n1 n2 2

2 2 esla estimacin comn de la desviacin estndar poblacional y s 1 ys 2 son las varianzas insesgadas respectivas de las muestras 1 y 2.

E jemplo 8

Las pruebas de traccin en diez puntos de soldadura para un dispositivo semiconductor produjeron los siguientes resultados en libras requeridas para romper la soldadura
15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5

Un segundo conjunto de ocho puntos fue probado para determinar si la resistencia a la traccin se incrementa con un recubrimiento, produciendo los siguientes resultados
24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

Se supone distribucin normal, se calcula 90% de intervalo de confianza para 1 2, 2 2 considerando 1 2 , ambas desconocidas. Primero se calculan las medias y varianzas muestrales
2 del conjunto 1 x 1 14.29 y s 1 7.50, n1 10 2 del conjunto 2 x2 22.09 y s 2 2.68, n2 8

Con estos valores se calcula


sp
2 2 (n1 1)s 1 (n2 1)s 2 n1 n2 2

(10 1)7.50 (8 1)2.68 10 8 2

.32 2.

Falta determinar en las tablas porcentuales de la distribucin t-S tudent el valor de t / 2 con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v = n1 + n2 2 = 16 grados de libertad. Se determina en las tablas correspondientes que t 0.05 = 1.746.
(14.29 22.09) 1.746 2.32 1 10 1 8
1 2

(14.29 22.09) 1.746 2.32 5.88

1 10

1 8

9.72

4. Intervalo de confianza para


2 1

de poblacionesnormalescuando s e desconocen en mues traspequeas .

2 2,

pero s es abe que

2 1

2 2

Dadas x 1 y x 2 las medias de muestras aleatorias independientes de tamaos n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones aproximadamente normales 2 2 2 2 y 2 donde se desconocen 1 pero se sabe que 1 2 , el intervalo de confianza (1 ) de 100% para 1 2 est dado por
(x 1 x2 ) t
2 2 s 1 n1 2 s 2 n2 1 2

(x 1

x2 ) t
2

2 s 1 n1

2 s 2 n2

296

donde t

/2

es el valor de la distribucin t-S tudent con


2 s 1 n1 2 s 1 n1 2 2 s 2 n2 2

1 n1 1

2 s 2 n2

1 n2 1

2 2 grados de libertad, el cual tiene un rea de / 2, y s 1ys 2 son las varianzas insesgadas respectivas de las muestras. De la frmula anterior se puede estimar que el resultado del clculo de los gradosde libertad generalmente ser una cantidad no entera, por lo que siempre s ede be redondear al entero ms prximo (no al siguiente), por ejemplo, si v = 14.3 14; v = 14.7 15; v = 14.5 15.

E jemplo 9

2 Se retoman los datos del ejemplo 8, considerando que 1 2 y son ambas desconocidas. Se supone normalidad; se calcula 90% de intervalo de confianza para 1 2; se determina qu tipo de semiconductor sin recubrimiento (1) o con recubrimiento (2) tiene ms resistencia a la traccin. Las medias y varianzas muestrales se calcularon anteriormente
2 del conjunto 1 x 1 14.29 y s 1 7.50, n1 10 2 del conjunto 2 x2 22.09 y s 2 2.68, n2 8

Con estos valores se calculan los grados de libertad


2 s 1 n1 2 s 1 n1 2 2 s 2 n2 2

7.50 10
2

2.68 8

1 n1 1

2 s 2 n2

1 n2 1

7.50 10

1 10 1

2.68 8

14.99 15 1 8 1

Falta determinar, usando las tablas porcentuales de la distribucin t-S tudent, el valor de t / 2 con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v = 15 grados de libertad. Se determina en las tablas correspondientes que t 0.05 = 1.753.
(14.29 22.09) 1.753 7.50 10 2.68 8 9.63
1 2

(14.29 22.09) 1.753 5.97

7.50 10

2.68 8

Como el intervalo de confianza siempre resulta negativo (de 9.63 a 5.97), se tiene 90% de confianza de que la resistencia a la traccin con recubrimiento es mayor que sin recubrimiento. 5. Intervalo de confianza para = 1 2 de poblacionesnormales , cuando s e des conocen 2 2 , pero s e s abe que s on obs ervaciones por pares en mues tras pequeas . y 1 2 Dadas xd y s d la media y la desviacin estndar de las diferencias normalmente distribuidas de n pares aleatorios y dependientes de mediciones de muestras de tamao n(n 30), respectivamente, de poblaciones aproximadamente normales

297

donde se desconoce 1 y = 1 2 est dado por d


xd t

2 2,

el intervalo de confianza (1 ) de 100% para


s d n xd t
2

s d n

donde t / 2 es el valor de la distribucin t-S tudent con v = n 1 grados de libertad, el cual tiene un rea de / 2.
E jemplo 10

En un proceso qumico se comparan dos catalizadores para comprobar su efecto en el resultado de la reaccin. Se prepar una muestra de doce procesos utilizando el catalizador marca L y tambin doce de la marca M; a continuacin se muestran los datos con los rendimientos.
L M
0.99 0.95 0.90 0.40 0.32 0.60 0.70 0.62 0.43 0.44 0.67 0.62 0.65 0.42 0.61 0.72 0.44 0.26 0.92 0.86

Se calcula 99% de intervalo de confianza para la diferencia de observaciones igualadas y se supone que los datos estn distribuidos normalmente. Primero se determinan las diferencias de los datos de la muestra
L M LM
0.99 0.95 0.04 0.90 0.40 0.50 0.32 0.60 0.28 0.70 0.62 0.08 0.43 0.44 0.01 0.67 0.62 0.05 0.65 0.42 0.23 0.61 0.72 0.11 0.44 0.26 0.18 0.92 0.86 0.06

Con estas diferencias se calcula su valor medio y la desviacin estndar


xd 0.074 y s d 0.207

El tamao de la muestra es diez, por cons iguiente los grados de libertad v = 10 1 = 9. De las tablas porcentuales correspondientes a la distribucin t-S tudent con 99% de con-fianza ( = 0.01 y / 2 = 0.005), se tiene que t 0.005 = 3.25. Por ltimo el intervalo de confianza resulta
0.074 3.25 0.207 10 0.139
d

0.074 3.25 0.287

0.207 10

E jercicio 3
1. Calcula si en una clase de diez estudiantes se tiene el mismo rendimiento en dos pruebas diferentes. Sus puntuaciones son
Estudiante: Prueba 1: Prueba 2: 1 90 84 2 90 84 3 90 82 4 80 94 5 90 90 6 92 85 7 88 89 8 90 62 9 63 65 10 70 52

Considera 95% de intervalo de confianza para la diferencia de las puntuaciones igualadas y supn normalidad en las poblaciones.

298

2. Se aplic un examen de matemticas financieras a un grupo de alumnos (grupo A), el cual obtuvo las siguientes calificaciones
3.0 3.5 4.0 8.1 7.2 8.9 8.2 10.0 10.0 9.0

A otro grupo se le aplic un examen de lgebra lineal con las siguientes calificaciones
2.0 3.0 3.7 8.0 5.0 4.0 3.0 8.0 9.0 10.0 7.0 7.0 6.0

Calcula un intervalo de confianza para la diferencia de medias con 90% de nivel de confianza. 3. Un centro de investigacin en medicinadel deporte dio a conocer lasdiferenciasen las tasas de consumo de oxgeno para varonesuniversitariosentrenados con dosmtodos diferentes. Uno de ellos recibe entrenamiento continuo y el otro intermitente, los dos con igual duracin. En la siguiente tabla se registran los tamaos de muestra, medias y desviaciones estndar respectivas, expresados en ml por kg/ min
Entrenamiento continuo Entrenamiento intermitente

nc = 9 xc = 43.71 sc = 4.87

ni = 7 xi = 39.63 si = 9.68

Calcula las medias de estas poblaciones con 99% de intervalo de confianza; supn que lasvarianzaspoblacionalesson diferentesy que su distribucin esaproximadamente normal. 4. Los datosque se muestran a continuacin son losgradosde dureza Brinell obtenidos para muestras de dos aleaciones de magnesio

Supn que provienen de poblaciones aproximadamente normales con varianzas que son distintas y considera 98% de intervalo de confianza para 1 2. 5. Se dice que una nueva dieta reduce el peso de una persona, 4.5 kg en promedio, en un periodo de dos semanas. Los pesos de siete mujeres que siguieron esta dieta fueron anotados antes y despus de dicho periodo.
Mujer Peso anterior Peso posterior 1 58.5 60.0 2 60.3 54.9 3 61.7 58.1 4 69.0 62.1 5 64.0 58.5 6 62.6 59.9 7 56.7 54.4

Determina la eficacia de la dieta considerando 95% de intervalo de confianza para la diferencia de media de los pesos; supn que su distribucin aproximadamente normal. a) si b) si
2 1 2 1 2 2 2 2

299

Intervalos de confianza para la varianza de poblaciones aproximadamente normales


Cuando se trata de intervalos de confianza para la varianza, se consideran dos casos, uno para las varianzas poblacionales y el otro para una razn entre varianzas. 1. Intervalo de confianza para
2

de poblaciones normalesen mues traspequeas .

2 Dada s la varianza de una muestra aleatoria de tamao n (n 30) de una poblacin aproximadamente normal, el intervalo de confianza (1 ) de 100% para el parmetro 2 est dado por
2 (n 1)s 2 2 2 2 (n 1)s 2 1 2

2 2 donde (ver tablas estads2 y 1 2 son valores de la distribucin ji cuadrada ticas correspondientes ) con v = n 1 grados de libertad, los cuales tienen reas de / 2 y 1 / 2, respectivamente.

E jemplo 11

Un antroplogo midi el ancho (en centmetros) de una muestra tomada al azar de nueve crneos de miembros de cierta tribu, y obtuvo los siguientes resultados
13.3 14.2 13.5 16.7 11.1 13.1 13.0 12.2 13.0

Se calcula 95% de intervalo de confianza para la varianza de dicha tribu. 2 Primero se calcula la varianza insesgada de la muestra s = 2.33. El grado de confi anza est dado por 1 = 0.95, donde = 0.05, es deci r / 2 = 0.025 y 1 / 2 = 0.975. Buscando en las tablas de la distribucin ji cuadrada con v = 9 1 = 8 grados de libertad, se tiene
2 2 2 0.025

17.5345 y

2 1

2 0.975

2.1797

Por ltimo, resulta


(9 1)2.33 17.5345 1.06
2

(9 1)2.33 2.1797 8.55

2. Intervalo de confianza para


2 2

2 1

2 2

de poblacionesnormalesen mues traspequeas .

Dadas s 1 ys 2 las varianzas de muestras aleatorias independientes de tamaos n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones normales, el intervalo de 2 2 confianza (1 ) de 100% para la razn de las varianzas 1 2 est dado por
2 s1 2 s2

1 f 2( 1,

2)

2 1 2 2

2 s1 2 s2

2( 2,

1)

donde f 2 ( 1, 2 ) es el valor de la distribucin F (ver tablas correspondientes), con v1 = n1 1 grados de libertad del numerador y v2 = n2 1 grados de libertad del denominador el cual tiene un rea de / 2, similarmente f 2 ( 2 , 1 ).

300

E jemplo 12

2 Retomando los datos del ejemplo 8 se hizo la suposicin de que 1 2 y se calcul un intervalo de confianza para la razn de varianzas y se determin si fue vlida la suposicin, con 90% de confianza. Los resultados del conjunto 1 fueron

15.8

12.7

13.2

16.9

10.6

18.8

11.1

14.3

17.0

12.5

Los resultados del conjunto 2 fueron


24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

2 7.50, n1 = 10, y Al calcular las varianzas muestrales, del conjunto 1 se obtuvo s 1 2 del conjunto dos s 2 2.68, n2 = 8. Falta determinar usando las tablas porcentuales de la distribucin F los valores de f 2 ( 1, 2 ) y f 2 ( 2 , 1 ) con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v1 = n1 1 = 10 1 = 9 y v2 = n2 1 = 8 1 = 7 grados de libertad. Se busca en las tablas de la distribucin F y se obtiene

2( 1,

2)

f 0.05 (9, 7) 3.677 y f

2 ( 2,

1)

f 0.05(7, 9) 3.293

El intervalo de confianza resulta


7.50 1 2.68 3.677 0.76
2 1 2 2 2 1 2 2

7.50 3.293 2.68 9.22

Del intervalo de confianza para la razn entre varianzas se determina que el valor 1 est contenido en el intervalo. Por tanto, con 90% de confianza se justifica la suposicin de 2 2 2 2 2 que 1 2 1 (0.76, 9.22) y si se multiplican por 2 ambos miembros 2 , ya que 1 2 2 de la igualdad se obtiene 1 2.

E jercicio 4
1. Un gelogo estudia el movimiento de los cambios relativos en la corteza terrestre en un sitio particular, en un intento por determinar el ngulo medio de las fracturas eligi n = 50 fracturas y determina que la media es de 39.8y la desviacin estndar muestral es de 17.20 . Considera 99% de intervalo d e confianza para estimar la varianza de la poblacin (supn que la poblacin est normalmente distribuida). 2. En un proceso qumico se comparan dos catalizadores para verificar su efecto en el resultado de la reaccin. Se prepar una muestra de diez procesos utilizando el catalizador marca L y diez con el de la marca M, a continuacin se muestran los datos con los rendimientos
L M
0.99 0.95 0.90 0.40 0.32 0.60 0.70 0.62 0.43 0.44 0.67 0.62 0.65 0.42 0.61 0.72 0.44 0.26 0.92 0.86

301

Considera 99% de intervalo de confianza para razn entre varianzas de los rendimientos de los catalizadores; supn que los datos estn distribuidos normalmente. 3. El espesor de las paredes de 25 botellas de vidrio de dos litros fue medido por un ingeniero de control de calidad. La media muestral fue de 4.02 mm y la desviacin estndar muestral de 0.09. Considera 95% de intervalo de confianza con respecto de la varianza del espesor de las paredes de las botellas. 4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una estacin de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supn normalidad y calcula un intervalo de confianza para la varianza con = 0.05.

Intervalos de confianza para las proporciones en muestras grandes


1. Intervalo de confianza para el parmetro p en mues trasgrandes . yq 1 Si p p son las proporciones respectivas de xitos y fracasos en una muestra aleatoria de tamao n (n 30), el intervalo de confianza (1 ) de 100% para el parmetro binomial p est dado por
p z
2

pq n

p p z
2

pq n

donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2.


E jemplo 13

En una muestra aleatoria de cien posibles clientes, 70 prefieren determinado producto. Se considera 95% de intervalo de confianza para la proporcin de todos los posibles clientes que prefieren tal producto. Para el intervalo de confianza de la proporcin primero se determina el valor de sta de personas que prefieren el producto
p 70 100 0.70 y q 30 100 0.30

En este caso se tiene 95% de confianza, por tanto, 1 = 0.95, y usando las tablas porcentuales de la distribucin normal se tiene z / 2 = 1.96. Por ltimo
0.70 1.96 0.70 0.30 100 p 0.70 1.96 0.70 0.30 100

0.6102 p 0.7898

2. Intervalo de confianza para p1 p2 de poblaciones en mues tras grandes . Dadas p1 y p2 las proporciones de xitos de lasmuestras aleatorias de tamaos n1 y n2 1 y q 2 , el intervalo de confianza 1 1 p 2 1 p (n1 30y n2 30), respectivamente y q (1 ) de 100% para la diferencia entre los dos parmetros binomiales p1 p2 est dado por
p1 p2 ) z (
2

1 p1q n1

2 p2q n2

p1 p2

( p1 p2 ) z
2

p1 q1 n1

2q 2 p n2

donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2.

302

E jemplo 14

Una firma manufacturera de cigarros distribuye dos marcas. Si se encuentra que 56 de 200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se considera 95% de intervalo de confianza para pA pB; se determina si es vlido suponer que la poblacin de fumadores prefiere la marca B, sobre la marca A. Dada pA la probabilidad de que 56 de 200 fumadores prefieran la marca A, su estadstico resulta
pA 56 200 0.28

A 0.72 con n1 = 200. Asimismo la probabilidad de que 29 de 150 de tal forma que q prefieran la marca B resulta
pB 29 150 0.19

de tal formaque qB 0.81 con n2 = 150. Por ltimo parael intervalo de 95% de confianza, de las tablas porcentuales para la distribucin normal resultaque z / 2 = 1.96, empleando la frmula correspondiente para pA pB
(0.28 0.19) 1.96 0.28 0.72 200 0.19 0.81 150 pA pB (0.28 0.19) 1.96 pB 0.1782 0.28 0.72 200 0.19 0.81 150

0.0018 pA

Como pA pB 0 entonces pA pB. Por tanto, no es vlida la suposicin de que la poblacin de fumadores prefiere la marca B sobre la A con 95% de confianza.

E jercicio 5
1. Para estimar la propuesta de los trabajadores desempleados en Panam, un economista toma una muestra al azar de 400 personas de clase obrera, donde 25 resultaron sin empleo. Calcula la proporcin real de trabajadores desempleados en Panam considerando 97% de un intervalo de confianza. 2. Un rector registr debidamente el porcentaje de calificaciones D y F otorgadas a los estudiantes por dos profesores universitarios de historia. El profesor I alcanz 32% contra 21% del profesor II, con 200 y 180 estudiantes, respectivamente. Considera90% de intervalo de confianza para la diferencia de proporciones. 3. Un antroplogo est interesado en la proporcin de individuos que presentan braquicefalia en dos tribus indgenas. Supn que se toman muestras independientes de cada una de las tribus y se descubre que 24 de cada 100 nativos de la tribu A y 36 de cada 120 de la tribu B poseen dicha caracterstica. Considera 95% de intervalo de confianza para la diferencia p1 p2 entre las proporciones de estas dos tribus.

10.2 Pruebas de hiptesis


En la seccin anterior se analizaron los intervalos de confianza para el clculo de estimaciones sobre los parmetros y para tomar decisiones al trabajar con la poblacin de inters. En esta seccin se estudiar otro mtodo estadstico que permita tomar decisionesen problemasrelacionadoscon poblaciones que resultan muy difcileso imposibles de analizar en su totalidad. Por ejemplo, para poder concluir con cierta veracidad sobre la

303

vida promedio de focos de cierta marca, se puede formular una hiptesis, la cual se debe comprobar, es decir, buscar evidencias que ayuden a decidir si la hiptesis se acepta o se rechaza.
Definicin 10.5
Se llama hiptesis estadstica

La comprobacin de una hiptes is es tads tica consiste en buscar evidencias para decidir sobre la aceptacin o rechazo de la afirmacin realizada. En el ejemplo de los focos se puede suponer que su vida promedio est por arriba de las 750 h de duracin; despus de elegir una muestra de tales focos, resulta que su vida promedio fue 730 h, con este anlisis surge un cuestionamiento. En la comprobacin de hiptesis, la manera ptima de tomar la decisin de aceptar o rechazar la afirmacin realizada slo se puede conocer cuando se analiza toda la poblacin; sin embargo, en la prctica, una afirmacin se acepta con base en una muestra aleatoria de la poblacin que slo indica que con los resultados obtenidos no existe evidencia para rechazarla. Asimismo, cuando se rechaza una afirmacin formulada slo significa que no existen evidencias suficientes de la muestra para aceptarla. Para formular unaafirmacin sobre un suceso y realizar una prueba de aceptacin o rechazo, surge la siguiente terminologa: se llama hiptes isnula a la afirmacin que se quiera probar y se simboliza por H 0. A la afirmacin que es opuesta a la hiptesis nula se le llama hiptes isalterna, y se simboliza por H1. Cabe aclarar que la hiptesis nula siempre deber ser establecida de tal forma que especifique un valor exacto del parmetro en estudio, mientras que la hiptesis alterna debe representar un valor diferente al de la hiptesis nula. Por ejemplo en el caso de la duracin promedio de los focos la muestra tuvo una vida promedio de 730 h, 20 menos que la conjetura del fabricante, por tanto, 750, es decir, la vida promedio de los focos es se formula la hiptesis nula como H0: menor o igual que 750. La hiptesis alterna correspondiente se basa en la afirmacin del fabricante, el cual asegura que la vida promedio de los focos est por arriba de las 750 h de duracin, con lo que se establece la hiptesis alterna como H1: 750, es decir, la vida promedio de los focos es mayor a 750. Como se aprecia, el valor del parmetro en la hiptesis alterna puede elegirse dentro de una infinidad de posibilidades ya que no se establece un valor concreto, en este caso slo debe cumplir con ser mayor a 750.

10.2.1 Tipos de errores en una prueba de hiptesis


Al aceptar o rechazar una hiptesisnula se pueden cometer ciertoserrores, loscualesdeben ser mnimos.
Definicin 10.6
Se llama error tipo I cuando se rechaza la hiptesis nula, dado que sta es cierta. Asimismo, se llama error tipo II cuando no se rechaza la hiptesis nula, dado que es falsa.

Dadas las definiciones de los dos errores que van implcitos al aceptar o rechazar una hiptesis nula, surge de nuevo un cuestionamiento.

304

La respuesta referente a la probabilidad de cometer un error tipo I o tipo II es fundamental en el desarrollo de la prueba de hiptesis.
Definicin 10.7
a la probabilidad de cometer un error tipo I y se simboliza por Se llama se comete un error tipo II, la probabilidad se simboliza por . ; si

E jemplo 15

Se retoma el caso de la vida promedio de los focos y se consideran 49 focos de muestra y 750, H1: 750, la evidencia de la muestra establece 760 h de vida las hiptesis H 0: promedio, se calcula el nivel de significancia.
= probabilidad de cometer un error tipo I = probabilidad de rechazar H 0 siendo verdadera

Es decir

P(X

760), cuando

750

Para calcular la probabilidad anterior se usa el teorema central del lmite


P(X 760) P X n 760 750 25 49 P(Z 2.8) 0.0026

En tales condiciones, la probabilidad de cometer un error tipo I es pequea; es decir, el nivel de significancia es 0.26%.
E jemplo 16

Se retoma el caso de la vida promedio de los focos y se calcula

para = 765.

= probabilidad de cometer un error tipo II = probabilidad de aceptar H 0, siendo falsa

Es decir,
P(X 760 cuando 765)

se calcula la probabilidad anterior usando el teorema del lmite central


P(X 760) P X n 760 765 25 49 P(Z 1.4) 0.0808

La probabilidad de cometer un error tipo II es pequea, es decir, 8.08% para el caso en que la verdadera vida promedio de los focos sea igual a 765 horas.

305

E jercicio 6
1. Se ha desarrollado una nueva preparacin para cierto tipo de cemento con un coeficiente de compresin de 5 mil kg por cm2 y una desviacin estndar de 120. Para comprobar la hiptesis de que = 5 000, en contraposicin con la alternativa de 5 000 se verifica una muestra al azar de 50 piezas de cemento. Se determina que la regin crtica es X 4 970. a) calcula la probabilidad de cometer el error tipo I cuando H 0 es verdadera b) evala para la alternativa = 4 960 2. Supn que X es una variable aleatoria normal con varianza 100. Si se toma una muestra al azar de tamao 16 de X, comprueba la hiptesis H0: = 10 contra H1: 10. Si se determin una media muestral de 12.5, calcula la probabilidad de error de tipo II. 3. Una lavandera afirma que un nuevo quitamanchas es efectivo en no ms de 70% de los casos en que se utiliza. Para comprobar esta afirmacin se aplica el producto en doce manchas tomadas al azar. Si menos de once son eliminadas se acepta la hiptesis nula de que p = 0.7; de otra forma se concluye p 0.7. a) evala , suponiendo p = 0.7 b) evala para la alternativa p = 0.9 Para la comprobacin de hiptesis se tienen los mismoscasosque en los intervalos de confianza. La formulacin de las hiptesis nula y alterna comnmente causa cierto desconcierto. Para diferenciar a la hiptesis nula de la alterna y simplificar los ejemplos y ejercicios, el anlisis delimita que las hiptesis a verificar siempre estn formuladas con , o =. De tal forma que en los dos primeros casos stas sern las hiptesis alternas correspondientes, mientras que en el tercero se refiere a la hiptesis nula. Puesto que en la prueba de hiptesis y los intervalos de confianza se tienen los mismos casos y sus condiciones para la aplicacin son las mismas, se simplifica el trabajo, resumiendo nicamente las frmulas para las hiptesis nulas y sus hiptesis alternas respectivas con sus estadsticos y regiones de rechazo correspondientes, para cada uno de los diferentes temas: medias (tres casos ), diferencia de medias (cinco), varianzas (dos) y proporciones (dos). Para la prueba de hiptesis se recomienda seguir los siguientes pasos: establecer la hiptesis nula establecer la hiptesis alterna fijar el nivel de significancia elegir el estadstico para la prueba de hiptesis con base en lo anterior encontrar la regin de aceptacin y rechazo calcular el valor del estadstico correspondiente y, con base en ste, aceptar o rechazar la hiptesis nula

306

10.2.2 Pruebas de hiptesis para medias de poblaciones aproximadamente normales con valor crtico

E jemplo 17

1. Una mquina produce piezas metlicas de forma cilndrica, se toma una muestra al azar de piezas cuyos dimetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 mm. Se supone que los dimetros tienen una distribucin aproximadamente normal. Si el fabricante afirma que el dimetro promedio es 10 mm, se determina respecto de esta afirmacin con 0.01 de nivel de significancia. Se pide una prueba de hiptesis para la media, comprobando que sta es igual a 10 mm, en tal caso, de acuerdo con datos muestrales, la hiptesis alterna ser el opuesto, es decir, diferente de diez. Se siguen los pasos para una prueba de hiptesis. a) b) c) d) H0: = 10 H1: 10 nivel de significancia = 0.01 estadstico de prueba, primero se identifica a cul de lostrescasosanteriorescorresponde, se indica que no se conoce sy que la muestra es pequea; por tanto,
t x 0 s n

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadstico de prueba est basado en la distribucin t-S tudent, por lo que la regin de rechazo est dada por
t
Regin de rechazo, cola izquierda Regin de rechazo, cola derecha

/2

yt

/2

Con base en el inciso c), se tiene = 0.01, donde / 2 = 0.005. Por otro lado, el tamao de la muestra es n = 9, donde v = 9 1 = 8 grados de libertad. Por tanto, de las tablas porcentuales de la distribucin t-S tudent resulta la regin de rechazo
t t 0.005 = 3.355 y t t0.005 = 3.355

307

f) para calcular el estadstico t, primero se determinan los datos de la media y la desviacin estndar muestral calculando los nueve datos, se tiene x 10.1222 y s= 0.7981, donde
t 10.1222 10 0.7981 9 0.4593

Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta y, por tanto, se determina que con nivel de significancia de = 0.01 es vlida la afirmacin del fabricante. 2. Se toma una muestra al azar de 36 vasos suministrados por una mquina de refrescos que sirve por vaso un contenido promedio de 21.9 dl, con desviacin estndar de 1.42 dl. Se comprueba la hiptesis = 22.2 dl contra la hiptesis alterna 22.2 con nivel de significancia 0.05. a) b) c) d) H0: = 22.2 H1: 22.2 nivel de significancia = 0.05 estadstico de prueba; primero se identifica a cul de los tres casos anteriores corresponde, dado que no se conoce y la muestra es grande; por tanto
z x 0 s n

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin normal, por lo que la regin de rechazo est dada por
z z

Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas porcentuales de la distribucin normal la regin de rechazo resulta
z z = 1.6449

f) de la muestra aleatoria de 36 servicios de la mquina de bebidas se obtuvo un contenido promedio de 21.9 dl, con desviacin estndar de 1.42 dl, donde
z= 21.9 22.2 = 1.2676 1.42 36

Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con un nivel de significancia de = 0.05. 3. De acuerdo con las normas establecidas para un examen de aptitud mecnica, las personas de 18 aos deberan promediar 73.2 con desviacin estndar de 8.6. Si de una toma al azar 45 personas promedian 76.7, se comprueba la hiptesis de que la media poblacional es mayor que 73.2. Se determina nivel de significancia de 2.5% y desviacin estndar poblacional de 8.6.

308

Se pide una prueba de hiptesis para la media, donde se comprueba que la media poblacional es mayor que 73.2, segn los datos anteriores; en tal caso, la hiptesis alterna ser la afirmacin que se quiere probar: la media poblacional es mayor que 73.2. a) b) c) d) H0: = 73.2 H1: 73.2 nivel de significancia = 0.025 estadstico de prueba; primero se identifica a cul de los tres casos corresponde, siendo que se conoce ; por tanto,
z x
0

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin normal, por lo que la regin de rechazo est dada por z z. Con base en el inciso c), se tiene que = 0.025. Por tanto, de las tablas porcentuales de la distribucin normal la regin de rechazo resulta
z z0.025 = 1.96

f) se calcula el estadstico z, x 76.7 y = 8.6, donde


z 76.7 73.2 8.6 45 2.73

Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con nivel de significancia de 2.5%.

E jercicio 7
1. Un fabricante de mquinas de refrescos asegura que sus mquinas suministran un promedio de 250 mm por vaso, pero debido a algunas quejas de los consumidores sobre una mquina en particular decide verificarla, para lo cual toma una muestra de 20 vasos, obteniendo 245 mm de media con desviacin estndar de 11. Calcula con 0.10 de nivel de significacin, si es cierta la afirmacin del fabricante. 2. Compruebalahiptesisdequeel contenido promedio delosenvasesdeun lubricante es de diez litros si los contenidos de una muestra aleatoria de diez envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 l. Utiliza 0.01 de nivel de significancia y supn que la distribucin de los contenidos es normal. 3. Un investigador afirma que el promedio de accidentes en una fbrica es inferior a 2 once. Al tomar una muestra al azar de tamao 36, se obtiene que X 10 y S = 9. Calcula si se puede apoyar al investigador con base en los resultados de la muestra a nivel de 1%.

309

4. Un investigador afirma que el promedio de accidentes en una fbrica es inferior a trece. Al tomar una muestra al azar de tamao 36, se obtiene una media y una varianza de 10 y 9, respectivamente. Calcula si se puede apoyar al investigador con base en los resultados de la muestra a nivel de 1%.

10.2.3 Pruebas para la diferencia de medias de poblaciones aproximadamente normales con valor crtico

(x 1 x 2 ) d0 sp (1 n1) (1 n2 )

sp

2 2 (n1 1)s 1 (n2 1)s 2 n1 n2 2

(x 1

x2 ) d0

2 2 (s 1 n 1 ) (s 2 n2 )

2 s 1 n1 2 s 1 n1 2

2 s 2 n2

1 n1 1

2 s 2 n2

1 n2 1

d d0 sd n

310

1. Para determinar el rendimiento de combustible en dos marcas de automviles con caractersticas similares se experiment con doce automviles marca V y diez marca I en pruebas de velocidad fija de 90 kmph. Para los de la marca V se obtuvieron 16 kmpl con desviacin estndar de1.0 kmpl y para losdela marcaI el promedio fue 11 kmpl, con desviacin estndar de 1.8 kmpl. Se supone que la distancia por litro para cada modelo del automvil se distribuye aproximadamente en forma normal con varianzas iguales. Se comprueba la hiptesis referente a que los automviles marca V en promedio exceden a los de la marca I por 4 kmpl utilizando = 0.10 Las varianzas poblacionales son diferentes. Se pide una prueba de hiptesis para la diferencia de medias, donde se tiene que comprobar que el rendimiento promedio por litro de los automviles marca V excede el rendimiento de los de la marca I en 4 kmpl. De tal forma que la hiptesis alterna queda de doscolas. Se representa por 1 el promedio del rendimiento por litro de los automviles marca V y por 2 a los de la marca I. a) b) c) d) H0: 1 2 = 4 H1: 1 2 4 nivel de significancia = 0.10 estadstico de prueba; primero se identifica a cul de los cinco casos anteriores corresponde, dado que no se conoce la varianza poblacional y las muestras son pequeas, con varianzas poblacionales diferentes, se tiene
t (x 1
2 (s 1

x2 ) d0
2 n1) (s 2 n2 )

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadstico de prueba est basado en la distribucin t-S tudent, por lo que la regin de rechazo est dada por
t t
/2

yt

/2

Con base en el inciso c), se tiene que = 0.10, donde / 2 = 0.05. Los grados de libertad se calculan mediante
2 s 1 n1 2 s 1 n1 2 2 s 2 n2 2

1 12
2

3.24 10

1 n1 1

2 s 2 n2

1 n2 1

1 12

1 12 1

3.2 24 10

13.4946 13 1 10 1

Por tanto, usando lastablas porcentuales de la distribucin t-S tudent con 13 grados de libertad resulta la regin de rechazo
t t0.05 = 1.796 y t t 0.05 = 1.796

f) se calcula el estadstico t con los datos que se tienen


2 2 x 1 16, s 1 1 y n1 12; x 2 11, s 2

(1.8)2

3.24 y n2 10

311

(x 1
2 (s 1

x2 ) d0 n1 )
2 (s 2

n2 )

(16 11) 4 (1 12) (3.24 10)

1.5668

Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con nivel de significancia de 10%. Por tanto, el rendimiento por litro de los automviles marca V sobrepasa en 4 kmpl a los de la marca I. 2. Se comparan dos tipos de rosca de tornillo para determinar su resistencia a la tensin. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados (en kg)
Tipo de rosca 1 2 1 78 83 2 76 80 3 80 82 4 79 83 5 78 81 6 80 80 7 82 79 8 81 80 9 79 82 10 83 78 11 80 79 12 82 81

Con 0.025 de nivel de significancia, se calcula que la resistencia promedio a la tensin de los tornillos tipo I es menor a la de los tipo II, Se supone que las varianzas poblacionales son iguales. Se pide una prueba de hiptesis para la diferencia de medias, donde se tiene que comprobar que la resistencia promedio a la tensin de los tornillos tipo I es menor que la de los tipo II. De tal forma que la hiptesis alterna es de una cola. Se representa por 1 la resistencia promedio a la tensin de los tornillos tipo I y por 2 la resistencia promedio a la tensin de los tipo II. a) b) c) d) H0: 1 2 = 0 H1: 1 2 0 nivel de significancia = 0.025 estadstico de prueba; primero se identifica a cul de los cinco casos anteriores corresponde, dado que no conoce las varianza poblacional pero se sabe que son iguales y las muestras pequeas; por tanto
t (x 1 x 2 ) d0 sp (1 n1 ) (1 n2 )

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin t-S tudent, por lo que la regin de rechazo est dada por
t t

Con base en el inciso c), se tiene que = 0.025. Los grados de libertad se calculan mediante v = n1 + n2 2 = 12 + 12 2 = 22. Por tanto, de las tablas porcentuales de la distribucin t-S tudent con 22 grados de libertad, resulta la regin de rechazo
t t0.025 = 2.074

312

f) se calcula el estadstico t con los datos de sus medias y varianzas


2 x 1 79.8333, s 1

3.9697 y n1 12; x2

2 80.6667, s 2

2.6061 y n2 12

sp

2 2 (n1 1)s 1 (n2 1)s 2 n1 n2 2

(12 1)3.9697 (12 1)2.6061 1.8133 12 12 2

Se sustituye en la frmula del estadstico


t (x 1 x 2 ) d0 sp (1 n1 ) (1 n2 ) (79.8333 80.6667) 0 1.8133 (1 12) (1 12) 1.1257

Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta, con 2.5% de nivel de significancia, por tanto, la resistencia promedio a la tensin de los tornillos tipo I no es menor a la de los tipo II. 3. Se comparan dos tipos de rosca de anillo para determinar su resistencia a la tensin. Se prueban cien piezasde cadatipo de cuerdabajo condiciones similares, obtenindose los siguientes resultados, la tipo I, present resistencia promedio de 88 kg, con desviacin estndar de 5; la tipo II present resistencia promedio de 83 kg, con desviacin estndar de 9. Se calcula con nivel de significancia de 0.05 si la rosca tipo I tiene mayor resistencia promedio a la tipo II en ms de 3 kg. Se pide una prueba de hiptesis para la diferencia de medias, donde se tiene que comprobar la resistencia a la tensin de la rosca de dos tipos de tornillos. De tal forma que la hiptesis alterna es de una cola. Se representa por 1 a la resistencia a la tensin de las cuerdas de los tornillos tipo I y por 2 a la de los tornillos tipo II; a) b) c) d) H0: 1 2 = 3 H1: 1 2 3 nivel de significancia = 0.05. estadstico de prueba: primero se identifica a cul de los cinco casos anteriores corresponde, dado que no se conoce la varianza poblacional y las muestras son grandes, se tiene
z (x 1 x2 ) d0
2 s 1 2 s 2 n2

n1

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin normal, por lo que la regin de rechazo est dada por
z z

Con base en el inciso c), se tiene que = 0.05. Por tanto, de las tablas porcentuales de la distribucin normal resulta la regin de rechazo
z z = z0.05 = 1.6449

313

f) se calcula el estadstico z con los datos


x 1
2 88, s 1

52 z (x 1

25 y n1 100; x2 x2 ) d0
2 s 1 2 s 2

2 83, s 2

92

81 y n2 100

n1

n2

(88 83) 3 1.9426 25 81 100 100

Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con nivel de significancia de 5%, por tanto, la rosca de los tornillos tipo I tiene mayor resistencia promedio a la tipo II en ms de 3 kg.

E jercicio 8
1. Un grupo de personasrequiereprocesar trabajosde clculo en un centro de cmputo para estimar la cantidad de tiempo requerida por la computadora para analizar el trabajo. Este tiempo se mide en una unidad central de procesamiento (UCP). Se decide comparar el tiempo estimado contra el tiempo real en la UCP para un cliente y se obtienen los siguientes datos

Calcula si esta evidencia es suficiente para sealar que, en promedio, el cliente tiende a subestimar el tiempo en la UCP necesario para los trabajos; realiza la prueba con = 0.10 y varianzas poblacionales diferentes. 2. Cierto metal se obtiene mediante un proceso estndar. Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del metal. Los fabricantesse encuentran interesados en estimar la diferencia entre las tensionesde ruptura de los metales producidos por los dos procesos, el estndar y la aleacin. Para cada metal se toman al azar ocho especificaciones, donde cada una se somete a tensin hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los metales en kg/ cm2.
428 419 458 439 441 456 463 429 462 448 435 465 429 472 453 459

Supn que el muestreo se lleva a cabo sobre dos distribuciones normales e independientes con varianzas iguales. Con base en los resultados, calcula si existe una diferencia real entre e y n, con nivel de significancia de 5% y varianzas poblacionales iguales. 3. Se realiz un experimento para comparar los tiempos medios necesarios para que dos empleados (A y B), completen el trmite de las cuentas corrientes personales para nuevos clientes. Se toman al azar diezclientes para cada empleado y se registran los tiempos de servicio obtenindose los siguientes resultados

314

A Xi = 222 Xi2= 5075.64

B Yi = 285 Yi2= 8292.78

Determina si existe evidencia suficiente para indicar una diferencia significativa en los tiempos medios requeridos para completar los trmites necesarios mencionados. Los parmetros de las varianzas son diferentes; usa = 0.10. 4. Los siguientes datos fueron recabados en un experimento que se dise para verificar si existe una diferencia sistemtica en los pesos obtenidos con dos escalas diferentes

Suponiendo normalidad, se puede concluir que la escala 1 da menor peso promedio que la 2?Considrese = 5% y que las varianzas son diferentes.

10.2.4 Pruebas para las varianzas poblaciones normales de muestras pequeas con valor crtico

E jemplo 19

1. Se determina que una mquina de refrescos est fuera de control si la varianza de los contenidos excede 1.15 dl. Se toma una muestra aleatoria de 25 refrescos con varianza de 2.03 dl. Se calcula con 0.05 de nivel de significancia si la mquina est fuera de control y se supone que los contenidos tienen una distribucin normal. En este ejercicio la prueba de hiptesis se refiere a una varianza, se comprueba si sta es mayor que 1.15 dl. a) H0: 2 = 1.15 b) H1: 2 1.15 c) nivel de significancia = 0.05

315

d) estadstico de prueba; aqu slo se tiene un caso para la varianza; por tanto
2 2 (n 1)s 2 0

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin ji por lo que la regin de rechazo est dada por
2 2

rea derecha. Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas porcentuales de la distribucin ji2 con v = n 1 = 25 1 = 24 grados de libertad, resulta la regin de rechazo
2 2 2 0.05

36.415

Para calcular el estadstico y n = 25.


2 2 (n 1)s 2 0

2 , se tiene, de los datos del enunciado, s = 2.03

(25 1) 2.03 1.15

42.365

Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con un nivel de significancia de 0.05, por tanto, la mquina est fuera de control. 2. Se comparan dos tipos de rosca de tornillo para determinar su resistencia a la tensin. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados (en kg)
Tipo de rosca 1 2 1 78 83 2 76 80 3 80 82 4 79 83 5 78 81 6 80 80 7 82 79 8 81 80 9 79 82 10 83 78 11 80 79 12 82 81

Con 0.10 de nivel de significancia, se comprueba si es justificable la suposicin 2 2 de que 1 2. Como no se tiene ningn caso para diferencia de varianzas se puede dividir entre la varianza 2 y obtener una razn entre varianzas, de tal forma que a) H 0 : b) H1 :
2 1 2 2 2 1 2 2

c) nivel de significancia = 0.10

316

d) estadstico de prueba; aqu slo se tiene un caso para la razn entre varianzas; por tanto 2
f s 1
2 s 2

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadstico de prueba est basado en la distribucin F por lo que la regin de rechazo est dada por
f 1 f
2( 2, 1)

yf

2( 1,

2)

Con base en el inciso c), se tiene = 0.10, donde / 2 = 0.05. Por tanto, de las tablas porcentuales de la distribucin F con v1 = v2 = 11 grados de libertad, resulta la regin de rechazo
f 1 f0.05(11, 11) 1 2.818 0.355 y f f0.05(11, 11) 2.818

Para calcular el estadstico f se determinan las varianzas insesgadas de los datos muestrales
f
2 s 1 2 s 2

3.97 1.52 2.61

Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con nivel de significancia de 0.10 y se justifica la suposicin de que 2 2 1 2.

E jercicio 9
1. Se conoce que la varianza de los puntajes de lectura para los estudiantes de sexto ao de primaria es 1.44. Se toman al azar 21 estudiantes de sexto ao a los que se les proporciona un curso especial de lectura, despus del cual la varianza de los puntajes de lectura es 1.05. Calcula si sta es suficiente con nivel de significacin de 0.05 para determinar si el curso especial la reduce. 2. Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de piezas al azar cuyos dimetros son 9.8, 9.8, 9.8, 11.5, 9.0, 10.4, 10.0, 10.0, 11.0 y 12.0 mm. Supn que los dimetros tienen una distribucin aproximadamente normal. Si el fabricante de las mquinas indica que su mquina est desajustada cuando la varianza de los dimetros de las piezas metlicas producidas excede 0.5 mm, calcula con nivel de significancia de 0.01 si la mquina est desajustada. 3. Se sabe que el contenido de nicotina de una cierta marca de cigarrillos est normalmente distribuida con una varianza de 1.3 mg. Comprueba la hiptesis 2 = 1.3 en contra de la alternativa 2 1.3 , si una muestra aleatoria de ocho cigarrillos tiene desviacin estndar de 1.8. Utiliza 0.05 de nivel de significancia.

317

10.2.5 Pruebas para muestras grandes

E jemplo 20

1. Una firma manufacturera de cigarros distribuye dos marcas. Si se determina que 56 de 200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se calcula con nivel de significancia de 0.06 si la marca A aventaja en ventas a la B. Esto se puede comprobar mediante una diferencia de proporciones. a) b) c) d) H0 : pA pB 0 H1 : pA pB 0 nivel de significancia = 0.06 estadstico de prueba; aqu slo se tiene un caso para la diferencia de proporciones; por tanto

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin Z, por lo que la regin de rechazo est dada por
z z

Con baseen el inciso c), setiene = 0.06. Por tanto, delastablasporcentuales de la distribucin Z, resulta la regin de rechazo
z z0.06 = 1.5548

318

Para calcular el estadstico z las variables son X A y X B, que representan a los fumadores en favor de las marcas A y B, respectivamente, de tal manera que las proporciones correspondientes estn dadas por
A p xA nA 56 200 0.28 y pB xB nB 29 150 0.193

mientras que
p xA nA xB nB 56 29 200 150 1 0.243 0.757 1 p 0.243 y q

Por tanto,

Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con un nivel de significancia de 0.06; por tanto, la suposicin de que la marca A aventaja en ventas a la marca B se justifica. 2. Un canal televisivo asegura que la audiencia que mira cierto programa el sbado por la noche es 40%. Se tomo al azar una muestra de cien televidentes, a quienes se entrevist, dando como resultado que 45 de ellos vean el programa. Con 2.5% de nivel de significancia se comprueba si la afirmacin es vlida. La prueba se trata de proporciones, donde se define una variable
X = cantidad de personas que miran dicho programa los sbados por la noche.

a) b) c) d)

H0: p = 0.40 H1: p 0.40 nivel de significancia = 0.025 estadstico de prueba; aqu slo se tiene un caso para las proporciones; por tanto,
z x np0 np0q0

e ) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin Z, por lo que la regin de rechazo est dada por
z z

Con base en el inciso c), se tiene = 0.025. Por tanto, de las tablas porcentuales de la distribucin z, resulta la regin de rechazo
z z0.025 = 1.96

f) se calcula el estadstico z con los datos que se tienen, la variable X representa a los televidentes que ven dicho programa los sbados por la noche: se entrevista a n = 100 televidentes de los cuales x = 45 ven el programa; por tanto

319

x np0 np0q0

45 100 0.40 100 0.40 0.60

1.02

Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con nivel de significancia de 0.025, por tanto, se puede asegurar que la proporcin de televidentesque ven el programa del sbado por la noche es menor que 40%.

E jercicio 10
1. En un estudio para estimar la proporcin de amas de casa que tienen una secadora automtica, se determina que 63 de cada 100 residentes urbanos y 59 de cada 125 residentes suburbanos la tienen. Calcula si la proporcin de amas de casa urbanas que tienen secadora exceden en ms de 7% a la proporcin de amas de casa suburbanas que tambin tienen. Considera = 4%. 2. La industria cervecera est interesada en comparar dos marcas de cerveza (A y B), puesto que se presume que la marca B es preferida sobre la marca A. De 200 personas entrevistadas, 116 prefieren la marca B; y de 150 personas, 78 prefieren la marca A. Determina la veracidad de la hiptesis de la industria. Considera = 10%. 3. Se realiz un estudio para determinar si msitalianosque estadounidensesprefieren el vino espumoso blanco que el vino espumoso rosado en lasbodas. De una muestra aleatoria de 300 italianos, 72 prefirieron el blanco; y de 400 estadounidenses, 70 tambin prefirieron el blanco. Calculasi msitalianosqueestadounidensesprefieren el vino espumoso blanco en las bodas. Utiliza 5% de nivel de significancia. 4. Un fabricante de cierto producto afirma que ms de 40% de los consumidores prefiere su producto. Se entrevista a 60 personas al azar para verificar su afirmacin. Si 28 personas de las entrevistadas prefiere dicho producto, entonces se considera vlida la afirmacin del fabricante, en caso contrario, se rechaza. Con un nivel de significancia de 5% prueba la afirmacin del fabricante.

Autoevaluacin
1. Dadas X1, X2, X3, y X4 variables de una muestra aleatoria tomada de una poblacin distribuida en forma normal, de los siguientes estimadores indica cul es un estimador insesgado de la media . a) b) c) d)

1

X1 2X2

3X 3 4

4X 4 X4

X1 2X 2 X 3 4

X1 X 2 X 3 X 4 X1 2X2 3X 3 4X 4 10

2. De una mquina que produce piezas metlicas de forma cilndrica, se toma una muestra al azar cuyos dimetros son 9.8, 10.5, 10.1, 9.9, 10.4, 10.6, 10.2, 10.8, 10.0,

320

10.7 y 9.8 mm. Supn que los dimetros tienen una distribucin aproximadamente normal, considera 95% de intervalo de confianza para el dimetro promedio de todas las piezas de esta mquina. a) b) c) d) (9.29, 11.29) (8.46, 10.36) (8.95, 11.06) (10.05, 10.55)

3. Supn que la vida promedio de los focos tiene 30 h de desviacin estndar de vida, considerando una muestra de 50 focos y las hiptesis H0: = 750, H1: 750, con la regin de rechazo establecida para medias mayores a 760, calcula el nivel de significancia. a) b) c) d) 0.0091 0.9919 0.0182 0.9818

4. El espesor de las paredes de 20 botellas de vidrio de dos litros fue medido por un ingeniero de control de calidad. La media muestral fue 3.98 mm y la desviacin estndar muestral 0.09 mm. Considera 90% de intervalo de confianza respecto de la varianza del espesor de las paredes de las botellas. a) b) c) d) (0.08, 0.010) (0.0051, 0.0152) (0.008, 0.010) (0.0152, 0.1520)

5. Se aplic un examen de ecuaciones diferenciales a un grupo de alumnos (grupo A), obtenindose las calificaciones 4.5, 3.5, 8.5, 9.5, 9.0, 6.0, 5.5, 7.5, 10, 4.0 y 8.0. A otro grupo de lgebra lineal se le aplic otro examen obtenindose las calificaciones 5.0, 6.0, 3.5, 8.0, 5.0, 7.0, 9.5, 8.0, 9.0, 10, 7.0, 4.5 y 6.5. Considera 95% de intervalo de confianza para la diferencia de medias, existir diferencia entre las medias de las calificaciones de los grupos? a) b) c) d) (0.245, 3.562) (2.476, 3.638) (1.7673, 1.89325) (1.477, 4.604)

6. Un economista tom al azar una muestra de 400 personas de clase obrera, de la cual 25 resultaron desempleadas. Calcula la proporcin real de trabajadores desempleados considerando 97% de intervalo de confianza. a) b) c) d) (0.018, 0.045) (0.360, 0.890) (0.036, 0.089) (0.046, 0.094)

321

7. Un investigador afirma que el promedio de accidentes en una fbrica es inferior a trece. Al tomar una muestra al azar de 36, se obtuvo media y varianza de 10 y 9, respectivamente. Comprueba la hiptesis del investigador con 1% de nivel de significancia. a) b) c) d) se acepta la afirmacin con z = 2.3263 se rechaza la afirmacin con z = 6 se rechaza la afirmacin con z = 2.3263 se acepta la afirmacin con z = 4.569

8. Considera un medidor de volumen en la bomba de una estacin de gasolina en la cual se realizan cinco mediciones, 10.5, 10.0, 9.90, 9.95 y 10.15. Supn normalidad, calcula un intervalo de confianza para la varianza con = 0.05. a) b) c) d) (6.799, 13.401) (9.799, 10.401) (8.799,12.401) (8.946, 10.984)

Respuestas de los ejercicios


E jercicio 1
1. insesgados T2, T3, ms eficiente T2 2. se comprueba que E( ) 3. a) se comprueba que E(X Y) b)
V (X Y)
2 1 2 2

n1

n2

E jercicio 2
1. a) (15.03, 17.64) b) (13.84, 18.82) 2. (3.98, 4.06) 3. (25.07, 27.73) 4. (9.80, 10.40) 5. a) (9.40, 11.26) b) (9.52, 11.14)

322

E jercicio 3
1. (1.50, 12.70) 2. (0.55, 3.28) 3. (9.35, 17.51) 4. (4.96, 1.60) 5. a) (0.96, 8.08) b) (0.51, 7.62)

E jercicio 4
1. (132.24, 1016.46) 2. (0.17, 7.16) 3. (0.0049, 0.0157) 4. (0.021, 0.485)

E jercicio 5
1. (0.036, 0.089) 2. (0.036, 0.184) 3. (0.177, 0.057)

E jercicio 6
1. a) 0.0384 b) 0.2776 2. 0.1587 3. a) 0.085 b) 0.341

E jercicio 7
1. t = 2.033; no es cierta la afirmacin del fabricante 2. t = 2.44; se acepta que el contenido promedio es 10.l

323

3. z = 4; el promedio de accidentes es menor que doce 4. z = 2, el promedio de accidentes es mayor o igual que once

E jercicio 8
1. t = 0.408; el promedio real es mayor o igual al estimado 2. t = 1.456; los dos procesos son iguales 3. t = 0.18; los tiempos medios son iguales 4. t = 1.039; la escala 1 da un peso promedio mayor o igual que la 2

E jercicio 9
1. 2. 3.
2 2 2

10.1273; los cursos disminuyen la varianza de los puntajes en la lectura 29.76; s, la mquina est desajustada 7.45; la varianza es igual a 1.3

E jercicio 10
1. z = 1.316; la proporcin de amas de casa urbanas que poseen secadora no es mayor que la de las residentes suburbanas 2. z = 1.1176; la marca B no es preferida sobre la marca A 3. z = 5.2927; los italianos prefieren el vino espumoso blanco 4. z = 1.05; la afirmacin no es vlida

Respuestas de la autoevaluacin
1. d) 2. d) 3. a) 4. b) 5. c); dado que el 0 est en el intervalo, no hay diferencia entre los grupos 6. c) 7. b) 8. b)

Apndice A
Uso de tablas alternativas para la distribucin normal
La unidad 8 abord la distribucin normal y en la seccin 8.3.3 se estudi el uso de las tablas normales que se encuentran en el apndice B. En su momento, se mencion que la distribucin normal juega un papel muy importante en el estudio de la probabilidad y la inferencia estadstica; por consiguiente, en diferentes textos, la presentacin de las tablas normales es variable, obviamente el valor de la probabilidad que se calcula no cambiar. A causa de dichas variantes en su presentacin se decidi dar al alumno una explicacin sobre el uso de otros dos tipos de tablas, las cuales estn al final de la presente explicacin.

A.1 Uso de tablas de la distribucin normal estndar, cola derecha


Las tablas de cola derecha tienen el siguiente aspecto:

En las tablas, los valores de Z varan de centsima en centsima desde 0 hasta 3.99. En la fila se ponen las dcimas y en las columnas las centsimas. P or tanto, el clculo de probabilidades con base en esta funcin y las propiedades de simetra y el complemento estudiadas en la subseccin 8.3.2, se podr efectuar de la siguiente forma, para losdiferentescasosque puedan ocurrir, y que ya se vieron en la seccin 8.3.3:

326

1. P(Z Z0 ) 2. P(Z Z0 )

Fd( Z0 ), en caso de que Z0 1 Fd(Z0 ), en caso de que Z0

0 0 0

1 Fd( Z0 ), en caso de que Z0 Fd(Z0 ), en caso de que Z0 0

3. P( Z0 Z Z0 ) 1 2Fd(Z0 )
Fd(a) Fd(b), en caso de que a, b 0,

4. P(a Z b)

Fd( b) Fd( a), en caso de que a, b 0, 1 Fd(b) Fd( a), en caso de que a 0 y b 0

En los siguientes ejemplos se emplear la funcin Fd(z).


E jemplo

Dada Z una variable aleatoria continua con distribucin normal estndar, se calculan las probabilidades indicadas en el ejemplo 4 de la seccin 8.3.3: 1. 2. 3. 4. 5. 6.
P(Z 1.25) 1 Fd(1.25) 1 0.1056 0.8944 P(Z 0.86) Fd( ( 0.86)) Fd(0.86) 0.1949 P( 2.97 Z 2.97) 1 2Fd(2.97) 1 2 0.0015 1 0.0030 0.9970 P( 0.67 Z 1.24) 1 Fd(1.24) Fd( ( 0.67)) 1 0.1075 0.2514 0.6411 P(0.06 Z 3.04) Fd(0.06) Fd(3.04) 0.4761 0.0012 0.4749 P( 1.34 Z 0.56) Fd( ( 0.56)) Fd( ( 1.34)) 0.2877 0.0901 0. .1976

327

328

A.2 Uso de tablas de la distribucin normal estndar, parte central


Las tablas de la parte central tienen el siguiente aspecto:

En las tablas, losvalores de Z varan de centsima en centsima desde 0 hasta 3.99. En la fila se ponen las dcimas y en las columnas las centsimas. P or tanto, el clculo de probabilidades con base en esta funcin y las propiedades de simetra y el complemento estudiadas en la subseccin 8.3.2, se podr efectuar de la siguiente forma, para losdiferentescasosque puedan ocurrir, y que ya se vieron en la seccin 8.3.3: 1. P(Z Z0 ) 2. P(Z Z0 )
0.5 Fc( Z0 ), en caso de que Z0 0.5 Fc(Z0 ), en caso de que Z0 0.5 Fc( Z0 ), en caso de que Z0 05 Fc(Z0 ), en caso de que Z0 0 0 0 0

3. P( Z0 Z Z0 ) 2Fc(Z0 )
Fc(b) Fc(a), en caso de que a, b 0,

4. P(a Z b)

Fc( a) Fc( b), en caso de que a, b 0, Fc(b) Fc( a), en caso de que a 0 y b 0

En los siguientes ejemplos se emplear la funcin Fc(z).

329

E jemplo

Dada Z una variable aleatoria continua con distribucin normal estndar, se calculan las probabilidades indicadas en el ejemplo 4 de la seccin 8.3.3: 1. 2. 3. 4. 5. 6.
P(Z 1.25) 05 Fc(1.25) 0.5 0.3944 0.8944 P(Z 0.86) 0.5 Fc( ( 0.86)) 0.5 Fc(0.86) 0.5 0.3051 0.1949 P( 2.97 Z 2.97) 2Fc(2.97) 2 0.4985 0.9970 P( 0.67 Z 1.24) Fc(1.24) Fc( ( 0.67)) 0.3925 0.2486 0.6411 P(0.06 Z 3.04) Fc(3.04) Fc(0.06) 0.4988 0.0239 0.4749 P( 1.34 Z 0.56) Fd( ( 1.34)) Fd( ( 0.56)) 0.4099 0.2123 0. .1976

Apndice B

332

Funcin acumulada de la distribucin normal estndar

333

334

T abla porcentual de la distribucin normal estndar

335

T abla t -S tudent

336

T abla de porcentajes de la funcin inversa acumulada, distribucin -cuadrada, rea de cola derecha

337

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

338

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

339

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

340

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

341

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

342

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

343

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

344

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

345

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

346

T abla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

Bibliografa
Bibliografa bsica
Mendenhall, William, Richard L. Scheaffer y Dennis D. Wackerly, Es tads tica matemtica con aplicaciones , Grupo Editorial Iberoamrica, 1994. Por medio de esta obra se pueden ampliar los conocimientos sobre las multivariables y distribuciones muestrales (unidad 9), as como los modelos continuos y discretos (unidades 5 a 8). Meyer, Paul L., Probabilidad y aplicaciones es tads ticas , AddisonWesley Iberoamericana (edicin revisada), 1992. Este texto es propicio para los estudiantesque quieran resolver problemasreferentes a los temas de las unidades 210 con mayor grado de dificultad. Montgomery, Douglas C. y George C. Runger, Probabilidad y es tads tica aplicadas a la ingeniera, McGraw-Hill, Mxico, 1996. Este texto es propicio para ampliar los conocimientos sobre estadstica descriptiva e inferencial (unidades 1 y 10 del presente libro, respectivamente) y los modelos continuos y discretos (unidades 5 a 8). Walpole, Ronald E., y Raymond H. Myers, Probabilidad y e s tads tica, Pearson Educacin, 1998. Este texto es propicio para ampliar los conocimientos sobre estadstica inferencial (unidad 10) y modelos continuos y discretos (unidades 5 a 8).

Bibliografa complementaria
Devore, Jay L., Es tads tica matemtica con aplicaciones , Thomson Editores, 1998. Gutirrez Gonzlez, Eduardo y Olga Vladimirovna Panteleeva, Fundame ntosde la te ora de lasprobabilidadespara ing enie ra y ciencias , Libudi, Mxico, 2000. ________________ , Tablasy formulases tads ticas , Libudi, Mxico, 2000. Mendenhall, William, y Terry Sincich, Probabilidad y es tads tica para ingeniera y ciencias , Prentice-Hall, 1997.

Vous aimerez peut-être aussi