Vous êtes sur la page 1sur 24

UNIVERSIDAD AUSTRAL DE CHILE

FACULTAD DE CS. ECONÓMICAS Y ADMINISTRATIVAS


INSTITUTO DE ESTADÍSTICA

ESTADÍSTICA Y PROBABILIDADES PARA INGENIERÍA


UNIDAD DE APRENDIZAJE III: INFERENCIA ESTADÍSTICA
Autor
Prof. Dr. Víctor Figueroa Arcila
Versión 4.04

Profesores de la asignatura en el segundo semestre de 2017:


Víctor Figueroa Arcila
Luis Alfredo Ojeda Silva
Magaly Moraga Cárdenas

Segundo semestre 2017


Unidad de
Aprendizaje III
INFERENCIA
ESTADÍSTICA
3.1 INTRODUCCIÓN 77

3.2 DISTRIBUCIONES MUESTRALES 77

3.3 ESTIMACIÓN 80

3.3.1 Estimación de parámetros 80

3.3.1.1 Estimación puntual 80


3.3.1.2 Estimación por intervalos 81

3.3.1.3 Aplicaciones 82
3.4 PRUEBA DE HIPÓTESIS (PRIMERA PARTE) 85
3.4.1 HIPÓTESIS ESTADÍSTICAS 85
3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPÓTESIS 86
3.4.3 CRITERIOS DE DECISIÓN 86
3.4.4 CONTRASTES UNILATERALES Y BILATERALES 86
3.4.5 METODOLOGÍA PARA CONTRASTAR UNA HIPÓTESIS 87
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRARÁ UN RESUMEN 87
CON LOS PRINCIPALES CONTRASTES)

3.5 APLICACIONES EN EL ÁMBITO DE LA INGENIERÍA 89


ANEXOS 95

76
3.1 INTRODUCCIÓN

A menudo necesitamos estudiar las propiedades de una determinada población, pero nos encontramos con el
inconveniente de que ésta es demasiado numerosa como para analizar a todos los individuos que la componen. Por
tal motivo, recurrimos a extraer una muestra de la misma y a utilizar la información obtenida para hacer inferencias
sobre toda la población. La Inferencia estadística persigue entonces la obtención de conclusiones sobre toda una
población, basándose en la observación de una muestra obtenida de ella. Estas estimaciones serán válidas sólo si la
muestra tomada es “representativa” de la población. Así, el muestreo es una técnica que utilizamos para asegurarnos
que las muestras seleccionadas de la población sean realmente representativas. El muestreo puede hacerse con o sin
reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con
reposición puede considerarse infinita teóricamente. También, para efectos prácticos, una población muy grande puede
considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo
con reposición.

3.2 DISTRIBUCIONES MUESTRALES


El estudio de determinadas características de una población se efectúa a través del análisis de diversas muestras que
pueden extraerse de ella. Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra
podemos calcular un estadígrafo (media aritmética, desviación estándar, proporción, entre otros), cuyo valor variará de
una muestra a otra. Así obtenemos una distribución de probabilidades del estadígrafo que se llama distribución
muestral. Se presentarán ahora las distribuciones muestrales relacionadas con dos situaciones comunes: Muestreo
a partir de una población y Muestreo a partir de dos poblaciones.

3.2.1 Muestreo a partir de una población


Vamos a suponer que deseamos estudiar el comportamiento que tiene una variable en una determinada población.
Supondremos además que dicha variable tiene una distribución normal con parámetros µ y σ2 (N(µ, σ2)), los cuales
habitualmente son desconocidos. Para realizar nuestro estudio extraemos de esta población muestras de tamaño n.
3.2.1.1 Distribución muestral de la media muestral. Cada muestra de tamaño n que podemos extraer de
una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable
aleatoria podemos estudiar su distribución que llamaremos distribución muestral de la media muestral.
Caso 1. Si tenemos una población donde la variable bajo estudio X tiene una distribución normal, N(µ, σ2), y
extraemos de ella muestras aleatorias de tamaño n, entonces la distribución muestral de la media muestral sigue
también una distribución normal.
(X  μ)
 
 2
X N μ, σn   Z  σ N(0,1)
 
 
n

Caso 2. Si tenemos una población donde la variable bajo estudio X NO tiene una distribución normal, pero el
tamaño de la muestra n es mayor o igual que 30 (n>30), entonces aplicando el llamado Teorema del límite central la
distribución muestral de la media se aproxima también a la distribución normal anterior.

 2 (X  μ)
X  Nμ, σn   Z  σ  N(0,1)
 
 
n

Caso 3. El resultado del Caso 2 sigue siendo válido en aquellos casos en que no se conozca la varianza poblacional
σ2 y n> 30. En tales casos es posible utilizar la varianza muestral S 2, en reemplazo de la varianza poblacional σ2. El
resultado quedaría como:
 2 (X  μ)
X  Nμ, Sn   Z   N(0,1)




S
n

77
Caso 4. Si en el Caso 3, el tamaño de la muestra es menor a 30 (n < 30), entonces la estadística,

(X  μ)
t tiene una distribución t con (n-1) grados de libertad.
S
n

Comentario: Los resultados anteriores son aplicables también a la estadística suma, es decir, de acuerdo al teorema
n
del límite central la distribución de  X i es aproximadamente normal, con media n y varianza n2, sin importar la
i 1
distribución de la población.
Ejemplo 1. Suponga que las notas obtenidas en la primera prueba parcial de la asignatura siguen una distribución
normal con una media µ igual a 5,8 y una desviación estándar, σ, igual a 2,4. Encuentre la probabilidad de que la media
de una muestra tomada al azar de 16 estudiantes esté comprendida entre 5 y 7.
Solución: Como la variable NOTAS tiene una distribución N(5,8; 2,4), con n=16, la distribución muestral de la media
se distribuye N(5,8; 0,6). Si x es la media de la muestra hemos de calcular la probabilidad

P(5< x < 7)=P(-1,33 < z < 2)= Φ(2) – Φ(-1,33) = 0,8854

3.2.1.2 Distribución muestral de la proporción muestral


En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma
solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la
población es grande, la distribución binomial B(n, p) se aproxima a la normal N(np,npq) . Luego, para muestras de
pq
tamaño n>30, la distribución muestral de la proporción sigue una distribución normal N(p, ), donde p es la
n
proporción de éxitos en la población y q=1-p.

(p̂  p)
p̂  N p, pq 

n   Z   N(0,1)
 pq
n
Ejemplo 2. Si tiramos una moneda correcta 100 veces, ¿cuál es la probabilidad de que obtengamos más de 55 caras?.
Solución: En una moneda correcta la proporción de caras es 0,5, con lo que p=0,5; q=0,5 y n=100. Entonces la
proporción muestral tiene una distribución muestral N(0,5; 0,05 2). Si llamamos p̂ a la proporción en la muestra hemos

de calcular la probabilidad P( p̂ > 0,55) = 1-0,8413 = 0,1587.

3.2.1.3 Distribución muestral de la varianza muestral


Supóngase que X1, X2, X3, … ,Xn es una muestra aleatoria de una distribución N(, 2). Entonces la variable aleatoria:

n  
2
  X i  X  tiene una distribución Chi-cuadrado con n-1 grados de libertad.
i 1 (n  1)S2

σ2 σ2

3.2.2. Muestreo a partir de dos poblaciones

78
Supongamos ahora que estamos estudiando el comportamiento de una variable en dos poblaciones independientes.
Supongamos además que en ambas poblaciones dicha variable tiene una distribución normal con parámetros distintos

y habitualmente desconocidos, es decir en la población 1 la variable tiene una distribución N(µ1,


σ 12 ) y en la población
σ2
2 tiene una distribución N(µ2, 2 ). De ambas poblaciones extraemos muestras de tamaño n1 y n2 respectivamente.
Sea X11, X12, X13,…, X1n1 una muestra aleatoria de n1 observaciones a partir de la primera población, y sea X21, X22,
X23, … ,X2n2 una muestra aleatoria de tamaño n2 tomada de la segunda población.

3.2.2.1 Distribución muestral de la diferencia de medias muestrales


Caso 1. Si las varianzas poblacionales son conocidas, entonces la diferencia de las medias muestrales tiene una
distribución normal, sin importar los tamaños de n 1 y n2.

σ 12 σ 22 (X  X 2 )  (  1   2 )
(X1 - X 2 )  N( μ 1 - μ 2 ,  ) Z 1  N (0,1)
n1 n 2  12  22

n1 n2
Caso 2. Si las distribuciones de la variable a nivel poblacional NO son normales y las varianzas son conocidas,
entonces si los tamaños muestrales son ambos mayores o iguales a 30 (n1 ≥ 30 y n2 ≥ 30), la diferencia de las medias
muestrales se aproximan a una distribución normal.

n 1 , n2   σ 12 σ 22 (X  X 2 )  ( 1   2 ) n1 , n2 
(X1 - X 2 )   N( μ 1 - μ 2 ,  ) Z 1    N (0,1)
n1 n 2  11  22

n1 n2

Caso 3. Si las varianzas poblacionales son desconocidas y los tamaños muestrales son ambos mayores o iguales a
30 (n1 ≥ 30 y n2 ≥ 30), entonces el resultado anterior sigue siendo válido, es decir, la diferencia de las medias
muestrales se aproximan a una distribución normal, donde las varianzas poblacionales se reemplazan por las
varianzas muestrales.

n1 , n2  S12 S 22 (X  X 2 )  (  1   2 ) n1 , n2 
(X 1 - X 2 )   N( μ 1 - μ 2 ,  ) Z 1   N (0,1)
n1 n 2 S 11 S 22

n1 n 2

Caso 4. Si las varianzas poblacionales son desconocidas, pero aproximadamente iguales, y los tamaños muestrales
son pequeños (n1 < 30 y/o n2 < 30), entonces la estadística,

(X - X ) - (μ - μ ) tiene una distribución t con n1 + n2 – 2 grados de libertad, donde


t 1 2 1 2
1 1
Sp  (n1  1)S12  (n 2  1)S22
n n S2p 
1 2 n1  n 2  2
Caso 5. Si las varianzas poblacionales son desconocidas y desiguales, y los tamaños muestrales son pequeños (n1
< 30 y/o n2 < 30), entonces la estadística, 2 2
2
 S1 S 2 
  
n1 n2 
(X - X ) - (μ - μ )
t 1 2 1 2
  
S2 S2 tiene una distribución t con  grados de libertad, donde 2 2
1 2  S12   S 22 
n n    
1 2
 n1    n2 
n1  1 n2  1
Caso 6. Muestras pareadas

79
Si
D y SD son la media y la desviación estándar muestrales de la diferencia de n pares aleatorios de mediciones
D - μD
t
SD

normalmente distribuidas, entonces la estadística n tiene una distribución t con n-1 grados de libertad.

3.2.2.2 Distribución muestral de la diferencia de proporciones muestrales


Si p̂1 y p̂ 2 son las proporciones muestrales de dos muestras aleatorias independientes de tamaños n 1 y n2,
respectivamente, entonces bajo la hipótesis de que se aplica la aproximación normal de una distribución binomial, la
diferencia de las proporciones muestrales tiene aproximadamente una distribución normal,

1 , n 2 
p1 q 1 p 2 q 2 ( pˆ  pˆ 2 )  ( p1  p 2 ) n1 ,n2 
(p̂1 - p̂ 2 ) n  N( p1 - p 2 ,  ) Z  1    N (0,1)
n1 n2 p1 q1 p 2 q 2

n1 n2

3.1.2.2. Distribución muestral del cociente entre dos varianzas muestrales


Supongamos que se tienen dos distribuciones normales independientes X1 N(1, 12) y X2 N(2, 22). Sea X11, X12,
X13, … ,X1n1 una muestra aleatoria de n1 observaciones a partir de la primera distribución normal, y sea X 21, X22, X23,

… ,X2n2 una muestra aleatoria de tamaño n2 tomada de la segunda distribución. Si


S12 y
S 22 son las varianzas
muestrales, entonces el cociente:

Tiene una distribución F con n1 - 1 grados de libertad en el numerador y n 2 - 1 grados de libertad en el


S2 σ 2
1 2 denominador
S σ2
2
2 1

3.3 ESTIMACIÓN
3.3.1 Estimación de parámetros
Una variable aleatoria se caracteriza o describe mediante su distribución de probabilidad, la cual depende de
parámetros, que usualmente son desconocidos, por ello es necesario disponer de procedimientos para estimarlos
a partir de datos muestrales.

3.3.1.1 Estimación puntual


Un estimador puntual es una estadística que produce un solo valor numérico como estimación del parámetro
desconocido.
Por ejemplo la media aritmética muestral es un estimador de la media poblacional, la proporción observada en la
muestra es un estimador de la proporción en la población.
Un valor numérico particular de un estimador, calculado a partir de datos muestrales, se llama estimación.

Parámetro poblacional Estimador Estimación

80
n

x
n

Media  X i i
̂  X  i 1
x i 1
n n

 
n n
1 1
2  
2

Varianza ̂ 2  S 2  ( X i  X )2 s2  xi  x
n  1 i 1 n  1 i 1

X número éxitos x
Proporción p ˆ 
p  pˆ 
n número pruebas n

Los estimadores puntuales adecuados requieren cierto número de propiedades importantes, de las cuales dos de las
más importantes son las siguientes: (VER LIBRO: CANAVOS)

1. El estimador puntual debe carecer de sesgo; es decir, el valor esperado del estimador puntual debe ser igual al
parámetro estimado.
2. El estimador debe tener varianza mínima. Cualquier estimador puntual es una variable aleatoria. por tanto, un
estimador puntual de varianza mínima tendrá una menor varianza que cualquier otro estimador puntual del
parámetro.
Ejemplo: Sea X1, X2, X3 y X4 una m.a (4) de una población cuya distribución es normal con media  y
2. Considérense las estadísticas T 1= (X1 + X2 + X3 + X4)/4 y T2= (X1+2X2+X3)/4
a) ¿Cuáles son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), ¿Cuál tiene varianza mínima?

Actividad
Sea X1, X2, X3 y X4 una m.a(4) de una población cuya distribución es exponencial con parámetro . Considérense
las estadísticas T1= (1/6)(X1 + X2) + (1/3)(X3 + X4), T2= (X1+ 2X2 + 3X3+4X4)/4, T3= (X1 + X2 + X3 + X4)/4
a) ¿Cuáles son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), ¿Cuál tiene varianza mínima?

Para determinar estimadores puntuales existen métodos de estimación, dentro de los cuales se destacan: El Método
de los Momentos; El Método de Máxima Verosimilitud y el Método de Mínimos Cuadrado Ordinarios (Unidad
IV).

3.3.1.2 Estimación por intervalos

Un estimador por intervalo es un intervalo aleatorio que incluye el valor real del parámetro, con cierto nivel de
probabilidad. Estos intervalos aleatorios se denominan normalmente intervalos de confianza. Una estimación por
intervalo de un parámetro es el intervalo limitado por dos estadísticas, de manera que incluye el verdadero valor del
parámetro con cierta probabilidad.

Por ejemplo para elaborar un estimador por intervalo para un parámetro , es necesario encontrar dos estadísticas L
y U, tales que: P{L    U} = 1- . El intervalo resultante: L    U se denomina intervalo bilateral al 100(1- )% de
confianza para el parámetro desconocido , donde: L es el límite inferior de confianza; U es el límite superior de
confianza; 1-  es el coeficiente o nivel de confianza y U -  (ó  - L) se denomina exactitud del intervalo.

Interpretación de un intervalo de confianza

Si se determinan un gran número de tales intervalos, cada uno a partir de una muestra aleatoria, entonces el (1- ) de
estos intervalos contendrán el verdadero valor del parámetro .

 Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parámetro. Se
indica por 1- y habitualmente se da en porcentaje 100(1-)%. Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraída la muestra, el intervalo de confianza contendrá al verdadero valor del parámetro o no, lo que

81
sabemos es que si repitiésemos el proceso con muchas muestras podríamos afirmar que el 100(1-)% de los
intervalos así construidos contendría al verdadero valor del parámetro.

Intervalos de confianza unilaterales


Un intervalo unilateral inferior al 100(1- )% de confianza para  estaría dado por, L  , donde L, el límite inferior
de confianza, se escoge de manera que P{L   } = 1- .

Un intervalo unilateral superior al 100(1- )% de confianza para  estaría dado por,   U donde U, el límite superior
de confianza, se escoge de manera que P{   U } = 1- .

Metodología para construir intervalos de confianza

Para construir un intervalo de confianza para un parámetro determinado se requiere encontrar una estadística que
cumpla dos condiciones:
1. Que involucre en su formulación al parámetro que se desea estimar.
2. Que dicha estadística tenga una distribución de probabilidades conocida.

Una estadística que cumpla con estas condiciones recibe el nombre de estadística pivotal.
3.3.1.3 Aplicaciones (en anexo 1 encontrará un resumen con estadísticas pivotales)

Estudiaremos ahora cómo construir intervalos de confianza para la media, la varianza y la proporción en una población.
Para el caso de dos poblaciones estudiaremos cómo construir intervalos de confianza para la diferencia de medias, el
cociente de varianzas y la diferencia de proporciones. En cada caso se trabaja con las estadísticas y distribuciones
muestrales ya estudiadas anteriormente.

A. Caso una población


A.1 Estimación de la media

Caso 1. Intervalo de confianza para  ; con  conocida

Si x es la media de una muestra aleatoria de tamaño n proveniente de una población cuya variable de interés tiene
una distribución normal con varianza conocida 2, entonces un intervalo al 100(1 - )% de confianza para , la media
poblacional de la variable está dado por:

x z  xz  donde z (1


 es el percentil (1-/2) de la distribución normal estándar.
) ) 2)
(1 
2
n (1 
2
n
Teorema: Si se utiliza x como una estimación de , se puede tener entonces una confianza de 100(1-
)% de que el error no excederá de:

Z 
(1 

) n Ver Figura 1
2

x
μ
XZ  XZ 
 ) n
(1  ) n (1 
2
2
e: error de estimación

Z 
(1 

) n
Figura 1. Error al estimar  por x 2

82
Teorema: Si se utiliza x como una estimación de , se puede tener una confianza de 100(1 - )% de que el error será
menor que una cantidad especificada cuando el tamaño de la muestra es:


z )
 2
(1 
n 

2 

 e 
 
 

C a s o 2 . I n t e r va l o d e c o n f i a n z a p a r a  ; c o n  2 d e s c o n o c i d a ( m u e s t r a s g r a n d e s )

Si x y s son la media y la desviación estándar de una muestra aleatoria de tamaño n > 30, tomada de una población
cuya variable de interés tiene una distribución normal con varianza desconocida 2, entonces un intervalo al 100(1 -
)% de confianza para , la media poblacional de la variable, está dado por:
S S
x z 
xz 
(1 
2
) n (1  )
2
n donde z (1 
2)
es el percentil (1-/2) de la distribución normal estándar.

C a so 3. In t er v al o d e c on fi a nz a p a r a ; c o n  2 d es c on oc id a (m u e s t r a s p equ e ñ as)
Si x y s son la media y la desviación estándar de una muestra aleatoria de tamaño n < 30, tomada de una población
cuya variable de interés tiene una distribución normal con varianza desconocida 2, entonces un intervalo al 100(1 -
)% de confianza para , la media poblacional de la variable está dado por:

S S
x t )
  x t  donde t(1-/2) es el percentil (1-/2) de la distribución t con v = n – 1
(1  (1  )
2 n 2 n grados de libertad.

A.2 Estimación de una proporción



Si es la proporción muestral de una muestra aleatoria de tamaño n, tomada de una población cuya variable de interés
tiene una distribución normal, entonces un intervalo al (1 - )% de confianza para P, la proporción poblacional, está
dado por:
donde z (1 ) es el percentil (1-/2) de la distribución
p̂ (1  p̂) p̂ (1  p̂) 2
p̂  z   P  p̂  z 
(1  ) n (1  ) n normal estándar.
2 2

A.3 Estimación de la varianza

Si S2 es la varianza muestral de una muestra aleatoria de tamaño n, tomada de una población cuya variable de interés
tiene una distribución normal con varianza desconocida 2, un intervalo al 100(1 - )% de confianza para 2, la varianza
poblacional, está dado por:
donde
2) 2
y (1 2 ) son los percentiles /2 y (1-/2), respectivamente

2 2 2
(n -1) S   (n -1)2 S
2
de la distribución Chi-cuadrado con (n – 1) grados de libertad.
2
 )

(1 
2 2

B. CASO DOS POBLACIONES


1.- Estimación de la diferencia entre dos medias

Caso 1. Intervalo de confianza para 1 - 2; con σ 12 y σ 22 conocidas

Si x1 y x2 son las medias de muestras aleatorias independientes de tamaños n1 y n2 provenientes de poblaciones,


donde la variable de interés tiene una distribución normal, con varianzas conocidas  12 y  22 , respectivamente,
entonces un intervalo al 100(1 - )% de confianza para 1   2 , la diferencia de medias poblacionales, está dado
por:

σ2 σ2 σ2 σ2
(x - x )  z α 1  2  μ - μ  (x - x )  z 1  2 donde z (1 
2)
es el percentil (1-/2) de la
1 2 (1 
2
) n n 1 2 1 2 (1  α )
2 n n
1 2 1 2 distribución normal estándar.
Comentario:

83
El grado de confianza es exacto cuando las muestra provienen de poblaciones donde la variable de interés tiene una
distribución normal. Para poblaciones donde la variable de interés no tiene una distribución normal se obtiene un
intervalo de confianza aproximado que es muy bueno cuando tanto n 1 como n2 son > 30.

Como antes, si  12 y  22 son desconocidos y los tamaños muestrales son suficientemente grandes, se puede

reemplazar, en la ecuación precedente,  12 por S12 y  22 por S 22 , sin afectar de manera significativa el intervalo de
confianza.

Caso 2. Intervalo de confianza para 1 - 2; con σ 12 = σ 22 pero desconocidas (para muestras pequeñas)

Si x1 y x2 son las medias de muestras aleatorias pequeñas independientes de tamaños n1 y n2, respectivamente,
provenientes de poblaciones, donde la variable de interés tiene una distribución normal, con varianzas  12 y  22
desconocidas pero aproximadamente iguales, entonces un intervalo al 100(1 - )% de confianza para 1   2 , la
diferencia de medias poblacionales, está dado por:

1 1 1 1
(x - x )  t (1  α ; v)Sp   μ -μ  (x - x )  t (1  α ; v) Sp 
1 2 2 n n 1 2 1 2 2 n n
1 2 1 2
donde Sp es la estimación conjunta de la desviación estándar de la población, y donde t(1-/2) es el percentil (1-/2) de
la distribución t con v = n1 + n2 – 2 grados de libertad.

Caso 3. Intervalo de confianza para 1 - 2; con σ 12  σ 22 y desconocidas (para muestras pequeñas)

Si x1 , S12 y x2 , S 22 , son las medias y las varianzas de muestras aleatorias pequeñas independientes de tamaños n1
y n2 respectivamente, provenientes de poblaciones donde la variable de interés tiene una distribución normal, con
 12 y  22 desconocidas y desiguales, respectivamente, entonces un intervalo al 100(1 - )% de confianza
varianzas

para 1   2 , la diferencia de medias poblacionales, está dado por:

S2 S2 S2 S2
(x - x )  t (1α ;v) 1  2  μ -μ  (x - x )  t 1  2
1 2 2
n n 1 2 1 2 (1  α ; v )
2 n n
1 2 1 2
donde t(1-/2) es el percentil (1-/2) de la distribución t con  grados de libertad, y  queda dado por la siguiente expresión:
2
 S12 S 22 
  
   12
n n2 
2
 S1 2
 S 22 
   
 n1    n2 
n1  1 n2  1

Caso 4. Intervalo de confianza para D = 1 - 2 en el caso de observaciones en pares

84
Si d y Sd son la media y la desviación estándar de las diferencias de n pares aleatorios de mediciones, entonces

un intervalo al 100(1 - )% de confianza para  D  1   2 , la diferencia de medias poblacionales está dado por:

Sd Sd donde t(1-/2) es el percentil (1-/2) de la distribución t con v = n – 1


dt 
   d t  grados de libertad.
(1  ; v) n
2 ación de la diferencia
d (1  ; v )
2
n
2.- Estim
entre dos proporciones
Intervalo de confianza para p1 - p2, a partir de muestras grandes

Si p1 y p2 son las proporciones de éxitos en muestras aleatorias de tamaños n1 y n2, respectivamente, y además
qˆ1  1  pˆ 1 y qˆ 2  1  pˆ 2 , entonces un intervalo al 100(1 - )% de confianza para p1 – p2, está dado por:
p̂ q̂ p̂ q̂ p̂ q̂ p̂ q̂
(p̂ - p̂ )  z  1 1  2 2  P - P  (p̂ - p̂ )  z 1 1 2 2 donde z (1 es el percentil (1-/2) de
(1  )

1 2 (1 ) 1 2 1 2 2)
2 2
n n n n la distribución normal estándar.
1 2 1 2
3.- Estimación de la razón de dos varianzas

 22
Intervalo de confianza para  12

Si S12 y S 22 son las varianzas de muestras aleatorias independientes de tamaños n1 y n2, respectivamente, tomadas
de poblaciones cuya variable de interés tiene una distribución normal, entonces un intervalo al 100(1 - )% de confianza

(a s2 s12   2 12  b s2 s12 )


2 2 2
 22
para  12 está dado por:
En donde a y b son los cuantiles inferior y superior de una distribución F tales que:

a  1 / f1 ;n2 1;n1 1 y b  f1 ;n1 1;n2 1


2 2

3.4 PRUEBA DE HIPÓTESIS


3.4.1 HIPÓTESIS ESTADÍSTICAS
Una hipótesis estadística es una afirmación respecto a alguna característica de una población. Contrastar una
hipótesis es comparar las predicciones con la realidad que observamos. Si dentro del margen de error que nos
permitimos admitir, hay coincidencia, aceptaremos la hipótesis y en caso contrario la rechazaremos. La veracidad o
falsedad de una hipótesis estadística nunca es conocida con certeza, a menos que se analice la población completa.
Aun cuando es frecuente utilizar los términos aceptar o rechazar, es importante comprender que rechazar una hipótesis
significa concluir que es falsa, mientras que aceptar una hipótesis solamente implica que no se tiene suficiente
información como para creer otra cosa.
La hipótesis emitida se suele designar por Ho y se llama Hipótesis nula porque parte del supuesto que la diferencia
entre el valor verdadero del parámetro y su valor hipotético es debida al azar, es decir no hay diferencia. Llamaremos
hipótesis nula, Ho, a la hipótesis que se contrasta. El nombre de “nula” proviene del hecho de que Ho representa la
hipótesis que mantendremos a no ser que los datos indiquen su falsedad, y debe entenderse, por tanto, en el sentido
de “neutra”. La hipótesis Ho nunca se considera probado, aunque puede ser rechazada por los datos. El rechazo de
Ho conduce a la aceptación de la hipótesis alternativa, H1. La hipótesis contraria se designa por H1 y se llama Hipótesis
alternativa.

3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPÓTESIS

85
El contraste de hipótesis no establece la verdad de la hipótesis, sino un criterio que nos permite decidir si una hipótesis
se acepta o se rechaza, o el determinar si las muestras observadas difieren significativamente de los resultados
esperados. En este proceso podemos incurrir en dos tipos de errores según sea la situación real y la decisión que
tomemos.
Si rechazamos una hipótesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que si la aceptamos
debiendo ser rechazada diremos que hemos cometido un error de tipo II. Minimizar los errores no es una cuestión
sencilla, un tipo suele ser más grave que otro y los intentos de disminuir uno suelen producir el aumento del otro. La
única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra.

Ho verdadera Ho falsa

Decisión incorrecta
Decisión correcta
DECISIÓN: Mantener Ho
Error de tipo II
Decisión incorrecta
Decisión correcta
DECISIÓN: Rechazar Ho
Error de tipo I

La probabilidad de cometer un error de tipo I es el NIVEL DE SIGNIFICACIÓN , la probabilidad de cometer un error


de tipo II depende del verdadero valor de µ y del tamaño de la muestra.
Ejercicio 1: Compruebe que la probabilidad de cometer un error de tipo II disminuye al aumentar el tamaño de la
muestra (n).
Ejercicio 2: Compruebe también lo que ocurre al variar la diferencia entre la media hipotética de la población (µo) y la
verdadera (µ).

3.4.3 CRITERIOS DE DECISIÓN


Puesto que la elección entre H0 y H1 ha de hacerse basándose en datos provenientes de una muestra, es necesario
escoger una función de las n observaciones de la muestra que permita tomar esta decisión. A tal función de la muestra
se le llama estadística de prueba. En general, la estadística de prueba debe ser una cuya distribución muestral sea
conocida en el supuesto que la hipótesis nula es cierta. La estadística de prueba generalmente se obtiene a partir del
estimador convencional del parámetro previsto en H0.

El conjunto donde toma valores la estadística de prueba se divide en dos subconjuntos, la región de rechazo o región
crítica, R, que contiene los resultados menos favorables de H0, y la región de aceptación, A, que contiene los
resultados más favorables a H0. Luego si el valor calculado de la estadística de prueba pertenece a R, rechazamos H 0,
en cambio si pertenece a A, aceptamos H0. El valor (o los valores) de la estadística de prueba que separa (o separan)
a la región R de la región A se llama valor crítico (o valores críticos).

3.4.4 CONTRASTES UNILATERALES Y BILATERALES


Los contrastes pueden ser unilaterales o bilaterales (también llamados de una o dos colas) según establezcamos las
hipótesis, si las definimos en términos de igual y distinto estamos ante una hipótesis unilateral, si suponemos una
dirección (en términos de mayor o menor) estamos ante uno unilateral.

A una prueba de cualquier hipótesis estadística, en la que la hipótesis alternativa es unilateral, tal como:

H0:  = 0 versus H1:  > 0 o bien, H0:  = 0 versus H1:  < 0

Se le denomina prueba de una cola o unilateral.

La región crítica de la hipótesis alternativa H1:  > 0 se ubica por completo en la cola derecha de la distribución,
mientras que la región crítica de la hipótesis alternativa H1:  < 0 se ubica por completo en la cola izquierda. En cierto
sentido el símbolo de desigualdad señala la dirección en la cual se ubica la región crítica.

A una prueba de cualquier hipótesis estadística, en la que la hipótesis alternativa es bilateral, tal como:

86
H0:  = 0 versus H1:   0

Se le denomina prueba de dos colas o bilateral, ya que la región crítica está dividida en dos partes igualmente
probables ubicadas en cada cola de la distribución de la estadística de prueba.
3.4.5 METODOLOGÍA PARA CONTRASTAR UNA HIPÓTESIS

Se trata pues, de extraer conclusiones a partir de una muestra aleatoria y significativa, que permitan aceptar o rechazar
una hipótesis previamente emitida, sobre el valor de un parámetro desconocido de la población. El método que
seguiremos es el siguiente:
1. Formulación de las hipótesis.
2. Elegir un nivel de significación 
3. Escoger la estadística de prueba.
4. Establecer el criterio en que se basará la decisión. Construir la zona de aceptación, intervalo fuera del cual
sólo se encuentran el 100% de los casos más raros. A la zona de rechazo la llamaremos región crítica, y su área
es el nivel de significación.
5. Verificar la hipótesis extrayendo una muestra cuyo tamaño se ha decidido en el paso anterior y obteniendo de ella
el correspondiente estadístico (media o proporción en nuestro caso).
6. Decidir. Si el valor calculado en la muestra cae dentro de la zona de aceptación se acepta la hipótesis y si no se
rechaza.
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRARÁ UN RESUMEN CON LOS PRINCIPALES CONTRASTES)

Estudiaremos ahora hipótesis sobre la media, la varianza y sobre la proporción en una población. Para el caso de dos
poblaciones estudiaremos la comparación de medias, comparación de varianzas y comparación de proporciones. En
cada caso se trabaja con un contraste bilateral y otro unilateral. Los contrastes unilaterales son de distinta dirección en
cada ejemplo, pero el método a seguir es análogo para ambos.

3.4.6.1 CASO UNA POBLACIÓN


A. Contraste de hipótesis para la media
A.1 Contraste bilateral
Ejemplo 1. Se sabe que la desviación estándar de las notas de cierto examen es 2,4. Para una muestra de 36 estudiantes se obtuvo
una nota media de 5,6. ¿Sirven estos datos para confirmar la hipótesis de que la nota media del examen fue de 6, a un nivel de
significación de 0,05?
Ejemplo 2. En otra muestra de 81 estudiantes se obtuvo una nota media de 6,2. ¿Se confirma la hipótesis anterior a un nivel de
significación de 0,01?

A.2 Contraste unilateral


Ejemplo 3. Se cree que la altura media de los habitantes de cierta población es como mucho 170 cm, con una desviación típica de
8 cm. En una muestra de 100 personas se observa una altura media de 172 cm. ¿Podemos aceptar la hipótesis con un nivel de
significación del 5%?. ¿Si el nivel de significación fuese 0,01 se aceptaría la hipótesis anterior?

B. Contraste de hipótesis para la proporción

Queremos contrastar una hipótesis acerca de la proporción en una población a partir de los datos extraídos de una
muestra. Procederemos como en el apartado anterior:
B.1 Contraste bilateral
Ejemplo 4. Se realizan 200 lanzamientos de una moneda y salen 120 caras, ¿podemos aceptar que la moneda no
está trucada con un nivel de significación del 5%?. ¿Aceptaríamos que la moneda no está trucada con =0,01?
Ejemplo 5. Un partido político afirma que obtendrá el 60% de los votos en las próximas elecciones. Encuestados 1000
votantes afirman su intención de votar a dicho partido 540. ¿Se puede aceptar la hipótesis del partido con un nivel de
significación del 5%?

B.2 Contraste unilateral

87
Ejemplo 6.Una máquina fabrica piezas de precisión y se garantiza que la proporción de piezas correctas producidas
es al menos del 97%. Un cliente recibe un lote de 200 piezas y aparecen 8 piezas defectuosas; a un nivel de confianza
del 95% ¿rechazará el lote por no cumplir las condiciones de la garantía?
Si la muestra hubiese sido de 300 piezas con 285 correctas, ¿se aceptaría el lote al 10% de significación?
C. Contraste de hipótesis para la varianza de una población
Ejemplo 7. El peso de 12 latas de cerezas, en onzas, es:
11,9 12,3 12,6 11,8 12,1 11,5 12,7 11,3 11,9 12,0 11,8 12,1
La desviación estándar especificada es de 1/2 onza. ¿Se cumple esta especificación? Use el nivel de significación del
1% y una prueba bilateral. (Nota: 1 onza = 28,35 gramos)

3.4.6.2 Caso dos poblaciones


D. Contraste de hipótesis para la diferencia de medias
Ejemplo 8. Un inversionista está considerando dos lugares alternativos para un centro comercial regional. Como los
ingresos de los hogares de la comunidad son una consideración importante en esa selección, desea probar la hipótesis
nula de que no existe diferencia entre el ingreso promedio por hogar en las dos comunidades. Consistente con esta
hipótesis supone que la desviación estándar del ingreso por hogar es también igual en las dos comunidades. Para una

muestra de n = 30 hogares de la primera comunidad, encuentra que el ingreso diario promedio es


x1 = $35.500, con

desviación estándar muestral de s1 = $1.800. Para una muestra de n2 = 40 hogares de la segunda comunidad,
x2 =
$34.600 s2 = $2.400. Probar la hipótesis nula en el nivel de significación del 5%.

3.5 APLICACIONES EN EL ÁMBITO DE LA INGENIERÍA

88
REFORZAMIENTO ESTIMACIÓN
1. Se sabe que la duración, en horas, de una ampolleta utilizada a la luz testigo, tiene una distribución
aproximadamente normal, con una desviación estándar de  = 25 horas. Se toma una muestra aleatoria de 20
ampolletas, la cual arroja una duración promedio de 1.014 horas.
a) Construya un intervalo de confianza bilateral del 95% para la duración promedio.
b) Estudie el error de estimación para niveles de confianza del 95% y del 99%. ¿Qué relación existe entre longitud
del intervalo, precisión de la estimación y nivel de confianza?.
c) Supóngase que se desea una confianza del 95% en que el error en la estimación de la duración promedio sea
menor que 5 horas. ¿Qué tamaño de muestra debe utilizarse?
d) Supóngase que se desea el ancho total del intervalo de confianza bilateral sea de seis horas, con una confianza
del 95%. ¿Qué tamaño de muestra debe emplearse para este fin?
2. Una máquina produce piezas metálicas de forma cilíndrica para ser utilizadas en la fabricación de discos duros
para computadoras. Se toma una muestra de las piezas y los diámetros resultan de: 1,01, 0,97, 1,03, 1,04, 0,99,
1,01, y 1,03 centímetros, respectivamente:
a) Obtenga un intervalo de confianza de 99% para el diámetro medio de las piezas producidas por la máquina,
suponiendo una distribución aproximadamente normal.
b) Estudie el error de estimación para niveles de confianza del 95%. ¿Qué relación existe entre longitud del
intervalo, precisión de la estimación y nivel de confianza?
c) Supóngase que se desea que el error en la estimación del diámetro medio de las piezas sea menor que 0.05
centímetros, con una confianza del 95%. ¿Cuál debería ser en este caso el tamaño de la muestra?.
3. Una muestra aleatoria de tamaño n1 = 16 que se tomó de una población con una desviación estándar 1 = 5 tiene
una media x 1 = 80. Una segunda muestra aleatoria de tamaño n2 = 25 tomada de una población normal diferente
con una desviación estándar 2 = 3, tiene media x 2 = 75. Encuentre un intervalo de confianza del 95% para 1
-  2 . De acuerdo con el intervalo hallado. ¿hay evidencia de que las dos medias son iguales?
4. Una compañía tiene dos departamentos que producen el mismo producto. Se tiene la sensación de que las
producciones por hora son diferentes en los dos departamentos. Al tomar una muestra aleatoria de horas de
producción en cada departamento se obtuvieron los datos siguientes:
Departamento I Departamento II

Tamaño de muestra n1 = 64 n2 = 49

Media muestral x1 = 100 unid x2 = 90 unid

Se sabe que las varianzas de las producciones por hora son  12 = 256,  22 = 196 para los dos departamentos
respectivamente. Obtenga e interprete un intervalo del 95% para la verdadera diferencia de la producción media.
¿Qué puede decirse de la sospecha que exista acerca de la diferencia entre la producción promedio?
5. Se compara la resistencia de dos tipos de rosca de tornillo, utilizados en el armado de computadores, 50 piezas
con cada tipo de rosca se prueban en condiciones similares. Las piezas de la marca A tienen una resistencia
media a la tensión de 78,3 kg., con una desviación estándar de 5,6 kg., en tanto que las de la marca B tienen una
resistencia media a la tensión de 87,2 g., con una desviación estándar de 6,3 kilogramos.
a) Determine un intervalo de confianza de 95% para la diferencia de las medias poblaciones.
b) Con base en los resultados obtenidos en (a), ¿Qué marca recomendaría comprar?. Justifique.
6. Durante un periodo de 15 días se tomaron los tiempos gastados por dos estudiantes para transportarse de sus
casas a la universidad. Las medias y varianzas fueron:
x1 = 40,33 x2 = 42,54

2 2
s 1
= 1,53 s 2
= 2,96

a) Calcule e interprete un intervalo de confianza del 95% para la diferencia de medias.


b) De acuerdo con el intervalo hallado. ¿qué puede decirse de la igualdad de las medias?
c) Calcule e interprete un intervalo del 90% de confianza para el verdadero cociente de varianzas.
d) De acuerdo con el intervalo hallado. ¿qué puede decirse de la igualdad entre las varianzas poblacionales?.
7. Suponga que la Escuela de Ingeniería Civil en Informática debe comprar tubos para iluminar la sala de computación.
Para ello tiene dos alternativas comprar tubos con filamento tipo A o con filamento tipo B. Con el objetivo de tener

89
mayores antecedentes, para tomar la decisión, sometió a prueba 10 tubos de cada tipo, obteniendo las siguientes
duraciones en horas:

A: 1.614, 1.094, 1.293, 1.643, 1.466, 1.270, 1.340, 1.380, 1.028, 1.997

B: 1.383, 1.138, 1.092, 1.143, 1.017, 1.061, 1.627, 1.021, 1.711, 1.065

a) Suponiendo que las varianzas son iguales, encontrar un intervalo de confianza para la diferencia de medias.
b) Suponiendo que las varianzas son desiguales, encontrar un intervalo de confianza para la diferencia de medias.
c) Con base en los resultados obtenidos en (a) y (b), ¿qué tipo de tubo recomendaría comprar usted, el con
filamento tipo A o el con filamento tipo B?. Justifique.

8. Un científico de la computación está investigando la utilidad de dos lenguajes de diseño para mejorar la tarea de
programación. Se pide a doce programadores expertos, familiarizados con los dos lenguajes, que codifiquen una
función estándar en ambos lenguajes, anotando el tiempo, en minutos, que requieren para hacer esta tarea. Los
datos obtenidos son los siguientes:

TIEMPO

Programador Lenguaje de Diseño 1 Lenguaje de Diseño 2

1 17 18

2 16 14

3 21 19

4 14 11

5 18 23

6 24 21

7 16 10

8 14 13

9 21 19

10 23 24

11 13 15

12 18 20

a) Encuentre un intervalo de confianza del 95% para la diferencia en los tiempos de codificación promedio.
b) ¿Existe algo que indique una preferencia por alguno de los lenguajes?.
9. Un fabricante de calculadoras electrónicas está interesado en estimar la fracción de unidades defectuosas
producidas. Se toma una muestra aleatoria de 800 calculadoras, de las cuales 10 resultan defectuosas. Calcule
un intervalo de confianza superior del 99% para la fracción de calculadoras defectuosas.
10. Se lleva a cabo un estudio para determinar el porcentaje de hogares en Valdivia donde hay al menos un
computador. ¿De qué tamaño debe ser la muestra si se desea tener una confianza del 99% de que el error al
estimar esta cantidad es menor que 0,017?.
11. El jefe de personal de una empresa desea realizar una encuesta para determinar la proporción de trabajadores
que está a favor de un cambio en el horario de trabajo. Como es imposible consultar a los N = 500 trabajadores en
un lapso razonable, procede a escoger aleatoriamente cierto número de trabajadores para entrevistarlos; determine
el número de trabajadores que debe entrevistarse si desea que la proporción estimada presente un error máximo
del 5% y un nivel de confianza del 95%.
12. Se analiza la fracción de productos defectuosos producidos por dos líneas de producción. Una muestra aleatoria
de 100 unidades provenientes de la línea 1 contiene 10 que son defectuosas, mientras que una muestra aleatoria
de 120 unidades de la línea 2 tiene 25 que son defectuosas.

90
a) Encuentre un intervalo de confianza del 99% para la diferencia en fracciones de productos defectuosos
producidos por las dos líneas.
b) ¿Qué conclusiones pueden obtenerse de los resultados obtenidos en (a)?
13. Considere los datos del problema 2. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 95% para 2 ?
b) Un intervalo de confianza inferior del 95% para 2 ?
c) Un intervalo de confianza superior del 95% para 2 ?
14. Considere los datos del problema 4. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 90% para 21 /22
b) Un intervalo de confianza bilateral del 95% para 21 /22 . Compare el ancho de este intervalo con el del obtenido
en la parte (a).
c) Un intervalo de confianza inferior del 90% para 21 /22
d) ¿Qué conclusiones se podrían obtener, en el contexto del problema, de los resultados obtenidos en (a), (b) y
(c)?
Ejercicios de Comprensión

REFORZAMIENTO PRUEBA DE HIPÓTESIS


Sección 1:
31. Definir los siguientes conceptos tan completamente como sea posible:
a) Hipótesis estadística
b) Prueba de hipótesis
c) Región critica
d) Nivel de significación
e) Hipótesis nula
f) Hipótesis alternativa
32. ¿En qué situaciones se hace una prueba de dos colas?. ¿Cómo se enuncia la hipótesis alternativa en una prueba de dos colas?.
33. ¿En qué casos se hace una prueba de una cola? ¿Cómo se enuncia la hipótesis alternativa en una prueba de una cola?.
34. Distinga entre los siguientes conceptos:
a) Error de tipo I y Error de tipo II
b) Región de rechazo y región de aceptación.
c) Estimación estadística y prueba de hipótesis.
35. ¿Son aditivos los errores de tipo I y de tipo II, es decir, se verifica que  = 1? Explique.
36. ¿Cómo se relacionada el error de Tipo I con el de Tipo II?. Explique completamente.
37. Si X es N ( 1  2 ) y una muestra de n observaciones da una media x , y si se desea contrastar la hipótesis nula H0 :  =
 0 con las alternativas:
a) Ha :  >  0
b) Ha :  <  0
c) Ha :    0
¿Cuál es la regla de decisión en cada uno de los casos?

38. Se admite que la velocidad promedio de las mecanógrafas de una compañía es de 55 palabras por minuto. El jefe de personal
afirma que un programa de adiestramiento instituido hace poco ha aumentado la velocidad de las mecanógrafas. Formule la
hipótesis nula y la hipótesis alternativa.
39. La resistencia a la tracción de los alambres de acero es cuando más de 1.000 libras. El fabricante asegura que un nuevo proceso
de producción ha aumentado la resistencia de los alambres. Formule la hipótesis nula y la hipótesis alternativa. Si se sabe que la
resistencia a la tracción es exactamente de 1.000 libras. ¿cuáles son las hipótesis nula y alternativa?
Sección 2:
40. Una fábrica de pilas garantiza que su producto tiene una vida media de 1.000 horas y una desviación estándar de 50. Pruebe la
hipótesis de que  = 1.000 en contraposición de la alternativa   1.000 horas, si una muestra aleatoria de 30 baterías tiene
una duración promedio de 950 horas. Utilice  = 5%.
41. Una muestra aleatoria de 36 refrescos de una máquina despachadora tiene un contenido promedio de 19.8 decilitros, con una
desviación estándar de 1.3 decilitros. Pruebe la hipótesis de  = 20 decilitros en contraposición a la hipótesis alternativa 
< 20. Use el nivel de significación  = 1%. Calcule el valor p de significación.
42. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4,22, 3,99, 5,41, 4,23, 4,29, 4,62, 4,55,
4,13, 4,23, 4,48. ¿Evidencian estos datos que el contenido promedio de grasa en los hombres es menor de 4,46? Considere 
= 5% y tome  = 0,4. Calcule el valor p.
43. Se espera que dos operarios produzcan en promedio el mismo número de unidades terminadas en el mismo tiempo. Los
siguientes datos dan los números de las unidades terminadas para ambos trabajadores en una semana de trabajo.
Operador 1 Operador 2

91
10 12

9 16

16 16

14 15

11 14

Si supone que el número de unidades terminadas diariamente por los trabajadores son variables aleatorias independientes
distribuidas normalmente con varianzas iguales, ¿puede concluirse alguna diferencia entre las medias? Tome = 5%. 
44. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194, 202, 335, 515, 184, 369, 142, 552, 200,
344, 421, 590, 301, 439. ¿podemos concluir que la distancia promedio en que se aleja es mayor de 338?. Suponga que = 149 
y tome  = 5%.
45. Pruebe la hipótesis según la cual el contenido promedio de un aceite comestible es de 5 litros. Si los contenidos de una muestra
aleatoria de 10 recipientes son: 5,2, 4,7, 5,3, 5,1, 4,8, 4,9, 5,4, 5,3, 4,8. Utilice un nivel de significación de= 1% y suponga
que la distribución de los contenidos es normal. Calcule el valor p para dicho nivel.
46. Se desea comparar dos métodos para enseñar estadística. Para ello se tomaron 10 pares de estudiantes del mismo nivel de
aprovechamiento en estadística. De cada par a uno se asigna al azar al método A y el otro al método B. Después de un periodo
de cuatro semanas, cada estudiante se sometió a un examen, con las puntuaciones siguientes:
Par 1 2 3 4 5 6 7 8 9 10

Método A 36 37 41 42 36 35 42 33 40 38

Método B 35 35 42 41 36 34 40 31 39 37

¿Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de aprovechamiento de los métodos
son distintos? Sea  = 5%.

47. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para responder a un examen de estadística.
Grupo Tiempo mínimo

1 100 84 96 107 89

2 79 163 95 132 91 85

Considere que se trata de poblaciones normales de igual varianza y pruebe que el tiempo de duración promedio para responder
el examen del grupo 1 es mayor que el promedio del grupo 2. Tome 
= 2%.

48. Los siguientes datos corresponden a los diámetros de dos muestras de arandelas producidas por dos máquinas
distintas.
Muestra 1 0,91 1,82 1,46 1,95 1,57 1,61 1,32

Muestra 2 1,03 1,99 1,65 2,07 1,66 1,76 1,28 2,01

Considere que los diámetros se distribuyen normalmente y que las varianzas respectivas son  12 = 0,12 y  22
= 0,13. ¿Evidencian estos datos que los diámetros promedios de las arandelas producidas por las dos máquinas
son iguales? Tome  = 5%.

49. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron observados sus pesos al
comienzo y al final de la dieta. Estos se muestran en la tabla que sigue:
Individuo 1 2 3 4 5

92
Peso inicial 295 305 323 299 310

Peso final 251 259 267 265 263

¿Se puede concluir según estos datos que la dieta es efectiva? Tome  = 10%.

50. Suponga que se tienen dos poblaciones X, Y independientes, distribuidas normalmente y de igual varianza. De
cada una de estas poblaciones se extrae una muestra. En la tabla que sigue se dan los resultados.
Población Media Desviación estándar Tamaño de muestra

X 4.52 1,4 5

Y 5,31 1,95 23

¿Se puede concluir, a partir de estos datos, que y  x es mayor de 1? Tome  = 5%.

51. Suponga que la varianza de los cocientes intelectuales de los estudiantes de enseñanza secundaria media en una ciudad es de
225. Una muestra aleatoria de 25 estudiantes arroja un cociente intelectual de 106. ¿Se puede concluir a partir de estos datos
que el cociente intelectual medio de los estudiantes es superior a 100? Use 
= 5%.
52. Una muestra aleatoria de tamaño n1 = 25, tomada de una población normal con desviación estándar de 1 = 4,8, tiene una

media x1 = 75. Una segunda muestra aleatoria de tamaño n2 = 36, tomada de una población normal diferente con desviación

2
estándar = 3,5, tiene media x2 = 70. Pruebe la hipótesis de 1  2 , en contraposición a la alternativa 1  2 . Use
  5% .
53. Se conduce una prueba sobre la potencia de fricción producida por ciertas máquinas lubricadas con dos aceites comerciales. Los
resultados fueron:
Marca 1 Marca 2

n1 = 9 n2 = 11

x1  10,4 x2 = 14,1

S12  1,00 S 22  0,9


Considere que se trata de poblaciones normales con igual varianza. ¿Evidencian estos datos que las potencias
promedios son iguales?. Use   2% .
Sección 3:
54. En una encuesta de 10.000 electores tomados al azar entre todos los votantes de una ciudad se encuentra que 5.180 están a
favor de cierto candidato. Probar la hipótesis de que la proporción de todos los electores que están a favor del candidato en
mención es igual o menor al 50%. Sea 
 5%.
55. Se afirma que un dispensador de gaseosas está fuera de control si la varianza de los contenidos excede de 1,0 decilitros. Si una
muestra aleatoria de 16 vasos despachados por este dispensador dio una varianza muestral de 1,9 decilitros. ¿qué puede decirse
del mismo acerca de si está bajo control? Sea 
 5% .
56. Con referencia al problema 49 de la Sección 2. ¿Proporcionan estos datos una igualdad entre las varianzas?.
57. Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribución normal con varianza de 1,3 miligramos. Pruebe
la hipótesis de que  2  1,3. Si una muestra aleatoria que 8 de estos cigarrillos tiene una desviación estándar S = 1,8.

Use   5%.
58. En un estudio diseñado para conocer los efectos secundarios de dos medicamentos a 100 animales se les administro el
medicamento A y a otros 100 el medicamento B. De los 100 que recibieron el medicamento A, 20 mostraron efectos secundarios
mientras que 15 de los que recibieron el medicamento B reaccionaron en forma similar. ¿Evidencian estos datos una diferencia
entre las dos proporciones de los que tuvieron efectos secundarios? Use   5%.
59. Con referencia al problema 51 de la Sección 2. ¿proporcionan estos datos una evidencia de que  2  0,16 ?. Use   5%.
60. Se cree que al menos el 60% de los habitantes de una gran ciudad está a favor del adelanto de la hora local en 30 minutos. Se
tomó una muestra de 200 habitantes de esta ciudad y 110 estuvieron de acuerdo en el adelanto. ¿Qué puede decirse, según
estos datos, del porcentaje real de los que están a favor? Use 
= 2%.

93
61. Se compara el nivel de colesterol en la sangre de pacientes seleccionados al azar y sometidos a dos dietas distintas; una baja en
grasa y la otra normal. Las varianza y tamaños de muestra se dan a continuación.

Baja en grasas
S12  198 n1  19

Normal
S22  435 n2  24

¿Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad de las dos poblaciones de donde se
obtuvieron las muestras?. Use   10%.
62. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de casa de 200 consultadas prefieren la
marca A; y que 29 de 150 la marca B. ¿Es esto evidencia suficiente para sostener que la marca A es preferida a la B?. Sea
  1%.
63. Se realizó una encuesta para determinar la diferencia que puede existir entre las fracciones de casados y solteros entre 20 y 30
años que fuman. Se entrevistaron 200 personas de cada grupo y se encontraron 64 casados y 80 solteros que fuman. ¿Contienen
los datos suficiente evidencia que indique que existe una diferencia entre las dos fracciones de fumadores para las dos
poblaciones?. Sea   10%.
64. Dos máquinas diferentes A y B se utilizan para producir pernos idénticos que se suponen de 2 pulgadas de longitud. Se toman
dos muestras aleatorias de 25 pernos cada una de la producción de ambas máquinas y arrojan dos varianzas S12  0,03
pulgadas para la máquina A, y S12 = 0,04 pulgadas para la máquina B. ¿Evidencian estos datos que las varianzas son iguales?

Tome   5% .
65. La desviación estándar de cierto proceso de producción es de 4 pulgadas. Se sospecha que la varianza se ha hecho demasiado
grande. Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son: 5, 7, 2, 4, 8, 9, 8, 6 y 5 pulgadas.
Pruebe la hipótesis de que el proceso conserva aún la varianza  2  4. sea   1%.

94
ANEXO 1
Tabla 1: Estadísticas pivotales para la construcción de intervalos de confianza relacionados con medias, varianzas y
proporciones.
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADÍSTICA PIVOTAL

µ x-
Z  N(0,1)

con 2 conocida n

µ
x-
Z  N(0,1)
S
2 desconocida y n > 30
n

µ x-
t  t(n - 1)
S
2 desconocida y n < 30 n

µ1 - µ2
(x - x ) - (μ - μ )
Z 1 2 1 2  N (0,1)
con  1 y  22 conocidas
2
 2 2
1  2
n n
1 2
µ1 - µ2
(x - x ) - (μ - μ )
Z 1 2 1 2  N (0,1)
con  y  desconocidos; muestras
2 2 2
1 2 S S2
1  2
aleatorias independientes de tamaños n1 y n2, n n
1 2
ambos mayores o iguales que 30 (n1> 30 y n2 >
30)

µ1 - µ2 (x - x ) - (μ - μ )
t 1 2 1 2  t(n  n - 2)
1 1 1 2
con  1 y  2 desconocidas pero 
2 2
S
p n n
aproximadamente iguales. Muestras aleatorias 1 2
(n1  1)S12  (n 2  1)S22
pequeñas independientes de tamaños n1 y n2 S2p 
n1  n 2  2
(n1< 30 y/o n2 < 30)

µ1 - µ2 (x - x ) - (μ - μ )
S S 
2

t 1 2 1 2  t( ) 2 2

 n  n 
1 2

2 2  
con  1 y  2 desconocidas y distintas. S S
2 2
1  2   1 2

S  S 
2 2
2 2

Muestras aleatorias pequeñas independientes n n     1 2

1 2 n  n  1
 2

de tamaños n1 y n2 (n1< 30 y/o n2 < 30) n 1


1
n 1
2

µD d-
t D  t(n -1)
2
Muestras pareadas S
d
n

95
Tabla 1: Estadísticas pivotales para la construcción de intervalos de confianza relacionados con medias,
varianzas y proporciones (Continuación).
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADÍSTICA PIVOTAL

(n - 1) S2
2    2 (n  1)
 2
 2

2 2
 S
F 2 1  F(n  1, n  1)
 12 /  22 2 2
 S
1 2

1 2
p̂ - p
Z  N(0,1)
p̂ (1  p̂)
p n

(p̂ - p̂ )  (p - p )
Z 1 2 1 2  N(0,1)
p1  p 2 p̂ q̂ p̂ q̂
1 1 2 2
n n
1 2

96
ANEXO 2
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones
H0 VALOR DE LA ESTADÍSTICA DE H1 REGIÓN CRÍTICA
PRUEBA

µ = µ0 µ < µ0 z < -z1-


x-
Z  N(0,1)
 µ > µ0 z > z1-
n
µ  µ0 z < -z1-/2 o z > z1-/2

µ = µ0 µ < µ0 z < -z1-


x-
2 desconocido y n  30 Z  N(0,1) µ > µ0 z > z1-
S
n
µ  µ0 z < -z1-/2 o z > z1-/2

µ = µ0 µ < µ0 t < -t1-


x-
2 desconocida y n < 30 t  t(n -1) µ > µ0 t > t1-
S
n µ  µ0 t < -t1-/2 o t > t1-/2

µ1 - µ2 = d0

µ1 - µ 2 < d0
con  1 y  22
2 z < -z1-
conocidas (x - x ) - (μ - μ )
Z 1 2 1 2  N (0,1)
 2 2
1  2 µ1 - µ 2 > d0 z > z1-
n n
1 2

µ1 - µ 2  d0 z < -z1-/2 o z > z1-/2

µ1 - µ2 = d0

µ1 - µ 2 < d0
con  1 y  22
2 z < -z1-
desconocidas; muestras
(x - x ) - (μ - μ )
aleatorias independientes de tamaños n1 Z 1 2 1 2  N (0,1)
y n2, ambos mayores o iguales que 30 S 2 S2
(n1> 30 y n2 > 30) 1  2 µ1 - µ 2 > d0 z > z1-
n n
1 2

µ1 - µ 2  d0 z < -z1-/2 o z > z1-/2

µ1 - µ2 = d0 t < -t1-
(x - x ) - (μ - μ )
t 1 2 1 2  t(n  n - 2) µ1 - µ 2 < d0
con  1 y  22
2
desconocidas pero 1 1 1 2
Sp 
aproximadamente iguales. Muestras n n t > t1-
aleatorias pequeñas independientes de
1 2
tamaños n1 y n2 (n1< 30 y/o n2 < 30) µ1 - µ 2 > d0
(n  1)S  (n  1)S2 2

S 
2 1 1 2 2
t < -t1-/2 ó t > t1-/2
n n 2
p

1 2

µ1 - µ 2  d0

97
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones (Continuación).
t < -t1-

µ1 - µ2 = d0 (x - x ) - (μ - μ ) µ1 - µ 2 < d0
t 1 2 1 2  t( )
S S2
2
con  1 y  22
2 t > t1-
desconocidas y distintas. 1 2
Muestras aleatorias pequeñas n n µ1 - µ 2 > d0
1 2 S S  2 2
2

independientes de tamaños n1 y n2 (n1<   1 2

 
n n 
30 y/o n2 < 30 1 2

S  S 
2 2
2 2

   
1 2
µ1 - µ 2  d0 t < -z1-/2 o t > t1-/2
 n  n 
1 2

n 1 n 1
1 2

µD < d 0 t < -t1-

d-
t D  t(n -1)
µD = d0 2 µD> d 0 t > t1-
S
d
Muestras pareadas n µD  d0 t < -t1-/2 o t > t1-/2

 2   02  2  12
 2   02 (n - 1) S2
2 
2
  2 (n  1)  2   02  2  12

 2   02  2  12 o  2  12
2

2

 12   22 f 2  f12
2 2
 S
F 2 1  F(n  1, n  1)  12   22 f 2  f12
 2
1
2
2 2 2 1 2
 S
 12   22 f 2  f12 2 o f  f12 2
2
1 2

p < p0 z < -z1-

p = p0 Z
p̂ - p
 N(0,1) p > p0 z < -z1-
p̂ (1  p̂)
n z < -z1-/2 z > z1-/2
p ≠ p0

(p̂ - p̂ )  (p - p ) p1 –p2 < d0 z < -z1-


Z 1 2 1 2  N(0,1)
p̂ q̂ p̂ q̂
p1 –p2 = d0 1 1 2 2 p1 –p2 > d0 z > z1-
n n
1 2
p1 –p2 ≠ d0 z < -z1-/2 o z > z1-/2

98