Vous êtes sur la page 1sur 409

UNIVERSIDAD NACIONAL DEL CALLAO

VICERECTORADO DE INVESTIGACIN
FACULTAD DE CIENCIAS ECONMICAS

TEXTO DE PROBLEMAS DE
INFERENCIA ESTADSTICA

AUTOR:
JUAN FRANCISCO BAZN BACA
(Resolucin Rectoral 940-2011-R del 22-9-11)
01-09-11 al 31-08-13

CALLAO PER
2013

NDICE
Pg.
INDICE

INTRODUCCIN

Captulo 1. LA DISTRIBUCIN NORMAL Y EL TEOREMA DEL LMITE


CENTRAL

1.1

Distribucin normal

1.2

Distribucin normal estndar

1.3

Propiedad reproductiva de la distribucin normal

1.4

Teorema del lmite central

10

1.5

Ejercicios resueltos

13

1.6

Ejercicios propuestos

29

Captulo 2. DISTRIBUCIONES MUESTRALES

33

2.1

Distribucin muestral de la media

37

2.2

Distribucin muestral del total (conocida la media)

39

2.3

Distribucin de la diferencia de medias muestrales

40

2.4

Distribucin muestral de la proporcin

43

2.5

Distribucin muestral del total (conocida la proporcin)

47

2.6

Distribucin muestral de la diferencia de proporciones

48

2.7

Ejercicios resueltos

52

2.8

Ejercicios propuestos

73

Captulo 3. DISTRIBUCIONES ESPECIALES

77

3.1

Distribucin Chi-cuadrado

77

3.2

Distribucin t de student

86

3.3

Distribucin muestral de la media (n < 30)

92

3.4

Distribucin de la diferencia de medias muestrales con varianzas


desconocidas pero iguales

93

3.5

Distribucin F de Snedecor

94

3.6

Distribucin de la razn de dos varianzas muestrales

98

3.7

Ejercicios resueltos

100
2

3.8

Ejercicios propuestos

119

Captulo 4. ESTIMACIN PUNTUAL

122

4.1

Estimadores. Propiedades

123

4.2

Mtodos de Estimacin Puntual

130

4.3

Mtodo de Mxima Verosimilitud

130

4.4

Mtodo de los Momentos

132

4.5

Mtodo de los mnimos cuadrados

133

4.6

Ejercicios resueltos

135

4.7

Ejercicios propuestos

152

Captulo 5. ESTIMACIN POR INTERVALOS DE CONFIANZA

155

5.1

Intervalo de confianza para la media y tamao de muestra

160

5.2

Intervalo de confianza para el total (conocida la media)

162

5.3

Intervalo de confianza para la proporcin y tamao de muestra

164

5.4

Intervalo de confianza para el total (conocida la proporcin)

167

5.5

Intervalo de confianza para la diferencia de medias

168

5.6

Intervalo de confianza para la diferencia de proporciones

170

5.7

Intervalo de confianza para la media (n < 30)

173

5.8

Intervalo de confianza para la varianza

175

5.9

Intervalo de confianza para la razn de varianzas

177

5.10

Intervalo de confianza para la diferencia de medias (n y m <30)

179

5.11

Ejercicios resueltos

187

5.12

Ejercicios propuestos

235

Captulo 6. CONTRASTE DE HIPTESIS ESTADSTICAS PARAMTRICAS 245


6.1

Prueba de hiptesis para la media (con varianza conocida)

251

6.2

Prueba de hiptesis para la media (con varianza desconocida)

258

6.3

Prueba de hiptesis acerca de una varianza

263

6.4

Prueba de hiptesis para la razn de varianzas

270

6.5

Prueba de hiptesis acerca de dos medias (varianzas conocidas)

276

6.6

Prueba de hiptesis acerca de dos medias (varianzas desconocidas)

281

6.7

Prueba de hiptesis para la proporcin

290

6.8

Prueba de hiptesis para la diferencia de proporciones

293

6.9

Ejercicios resueltos

299

6.10

Ejercicios propuestos

348

Captulo 7. PRUEBA DE HIPTESIS NO PARAMTRICAS

355

7.1

Uso de la distribucin Chi-cuadrado. Test de independencia

356

7.2

Test de bondad de ajuste

362

7.3

Test de Wilcoxon

364

7.4

Test de signos

367

7.5

Test de la mediana

374

7.6

Ejercicios resueltos

379

7.7

Ejercicios propuestos

395

REFERENCIAS BIBLIOGRFICAS

398

Apndice

400

Tabla 1. Distribcin acumulativa normal estndar

401

Tabla 2. Distribucin acumulativa chi-cuadrado

403

Tabla 3. Distribucin acumulativa T de student

407

Tabla 4. Distribucin acumulativa F

408

Tabla 5. De Wilcoxon para n 40 y = 0.05 o 0.01

409

Tabla 6. Valores crticos para la prueba del signo S

409

INTRODUCCIN
La ciencia econmica para poder realizar las mediciones econmicas recurre
permanentemente a la inferencia estadstica, ya que las deducciones y conjeturas
econmicas acerca de los parmetros estn basadas en muestras aleatorias tratadas
por esta disciplina.
Con el propsito de poder contribuir al proceso de enseanza aprendizaje de la
estadstica para economistas en la Universidad Nacional del Callao (UNAC),
hemos credo conveniente elaborar un

Texto de problemas de inferencia

estadstica que de manera sencilla ayude a estudiantes de la especialidad a


desarrollar competencias conceptuales y procedimentales, mediante la asimilacin
de la terminologa propia de la estadstica, as como las correspondientes
aplicaciones a la economa.
El texto consta de siete captulos. En el primero, se desarrolla la distribucin
normal y el teorema del lmite central; el captulo dos, presenta las distribuciones
muestrales para muestras grandes (n 30) y en el captulo tres, se desarrollan las
distribuciones muestrales especiales ligadas a muestras pequeas (n < 30) como la
chi-cuadrado, t de student y F.
En los captulos cuatro y cinco se desarrollan los temas relacionados a la
estimacin puntual y la estimacin por intervalos de confianza respectivamente.
En el captulo seis, se desarrollan los contrastes de hiptesis estadsticas
paramtricas, poniendo especial nfasis en la determinacin del valor-P
(probabilidad mnima para rechazar la hiptesis nula) usado en los clculos
computacionales modernos. Finalmente, en el captulo siete se presentan las
pruebas de hiptesis no paramtricas.
Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para
alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas
para la discusin en clases. El reconocimiento especial a los estudiantes de
economa de la FCE-UNAC, ya que gracias a su esfuerzo y comprensin en los
ltimos aos se han puesto en prctica los resultados de este modesto trabajo.
5

Captulo 1. LA DISTRIBUCIN NORMAL Y EL TEOREMA


CENTRAL DEL LMITE
Slo cabe progresar cuando se piensa en grande, slo es posible avanzar
cuando se mira lejos.
Jos Ortega y Gasset

CONTENIDO
1.1
1.2
1.3
1.4
1.5
1.6

Distribucin normal.
Distribucin normal estndar.
Propiedad reproductiva de la distribucin normal.
Teorema del lmite central.
Ejercicios resueltos.
Ejercicios propuestos.

1.1 DISTRIBUCIN NORMAL


La teora de probabilidades nos ofrece la distribucin normal como una de las
distribuciones ms importantes, junto al teorema central del lmite, con mltiples
aplicaciones para la inferencia estadstica, sobre todo en lo concerniente a las
distribuciones muestrales. Por ello a continuacin hacemos un breve repaso de la
distribucin normal y la presentacin del teorema central del lmite.
Definicin.- una variable aleatoria continua X tiene distribucin normal con media
y varianza 2 , si su funcin de densidad de probabilidad esta dada por:

f ( x)
donde: = 3.14159265....

1
2 2
y

( X )2
2 2

- < x <

e = 2.71828184

(la base de los logaritmos

neperianos).
Notacin.- una notacin muy comn para la distribucin normal es: X ~ N( , 2 )
Que se lee la variable aleatoria X se distribuye normalmente con media y
varianza 2 .
Caractersticas geomtricas.

La grfica tiene forma acampanada, con centro en .


6

Es una funcin creciente en el intervalo (- , ).

Es una funcin decreciente en el intervalo ( , ).

Tiene sus puntos de inflexin en y + .

Caractersticas estadsticas.

Media:

E (X) =

Varianza:

V (X) = 2

Si X ~ N( , 2 ). Entonces, la variable aleatoria Y = a + b X tambin se


distribuye normalmente con media: E(Y) = a + b y varianza: V(Y) = b2 2
. Es decir: Y ~ N(a + b , b2 2 )

Si X ~ N( , 2 ) el clculo de probabilidades se efecta realizando el


proceso de estandarizacin siguiente:
Z = (X - ) /

~ N(0, 1) y decimos que la v.a. Z tiene distribucin

normal estndar.

DISTRIBUCIN NORMAL
40
35
30

25
20
15
10
5
0

- 3

X
- 2

+ 2

+ 3

1.2 DISTRIBUCIN NORMAL ESTNDAR


Definicin.- Se dice que una variable aleatoria Z, es una variable aleatoria normal
estndar, si tiene distribucin normal con media cero ( = 0) y varianza uno (2 =
1) y su funcin de densidad de probabilidades es:

f ( z)

1 z2 / 2
e
2

- < z <

La funcin de distribucin acumulativa de Z se denota por (z) o F(z) y se calcula


as:
7

(z) = F(z) = P [Z z] =

1 t 2 / 2
e
dt
2

Esta probabilidad nos da el rea bajo la curva normal desde - hasta el valor z.
Entonces, conocidos los valores de la media y la varianza 2 de una variable aleatoria
X ~ N( , 2 ) utilizando el proceso de estandarizacin Z = (X - ) / , se puede
efectuar el clculo de probabilidades tales como:

P[a X b] = P[ (a - ) / (X - ) / (b - ) / ]
= P[ (a - ) / Z (b - ) / ]
= [(b - ) / ] - [(a - ) / ]

P[X a] = P[(X - ) / (a - ) / ] = P[Z (a - ) / ] = [(a - ) / ]

P[X > a] = 1 P[X a] = 1 - [(a - ) / ]

Los valores de la funcin de distribucin acumulativa normal estndar, (z) o F(z),


han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de clculo Excel.
Uso de la Tabla de la distribucin normal estndar
a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar
(z) = F(z) = P [Z z]. Por ejemplo, para z = 1.96, tenemos que:
(1.96) = F (1.96) = P [Z 1.96] = 0.97500.
b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la
probabilidad (z) = F (z) = P [Z z] = , en la tabla 1, se debe hallar el valor
de z que acumule en probabilidad y que denotaremos como z = Z .
Para el mismo ejemplo, s (z) = F (z) = P [Z z] = 0.97500, esto implica
que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 .
Una caracterstica importante de la distribucin normal es que:
Entre y + se encuentra el 68.27% de las observaciones. Es decir que :

P( X + ) = P
P 1 Z 1

= (1) - (-1) = 0.84134 0.15866 = 0.68268


8

Entre 2 y + 2 se encuentra el 95.45% de las observaciones, puesto que:

2
2
P( 2 X + 2) = P
Z
P 2 Z 2

= (2) - (-2) = 0.97725 0.02275 = 0.9545


Entre 3 y + 3 se encuentra el 99.73% de las observaciones. Es decir que:

3
3
P( 3 X + 3) = P
Z
P 3 Z 3

= (3) - (-3) = 0.99865 0.00135 = 0.9973


Entre 4 y + 4 se encuentra el 99.9937% de las observaciones. Es decir
que:

4
4
P( 4 X + 4) = P
Z
P 4 Z 4

= (4) - (-4) = 0.999968 0.000031 = 0.999937


Entre 5 y + 5 se encuentra el 99.999942% de las observaciones. Es decir
que:

5
5
Z
P( 5 X + 5) = P
P 5 Z 5

= (5) - (-5) = 0.99999971 0.00000029 = 0.99999942


Entre 6 y + 6 se encuentra el 99.9999998% de las observaciones. Es
decir que:

6
6
Z
P( 6 X + 6) = P
P 6 Z 6

= (6) - (-6) = 0.999999999 0.000000001 = 0.999999998


1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIN NORMAL
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas
normalmente con media i y varianza i2 .

Es decir: Xi ~ N(i , i2 ) i = 1, 2, 3,

.... , n . Si Y es una combinacin lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... +


n

an Xn . Entonces, la variable aleatoria Y ~ N [a0 + ai i ,


i 1

a
i 1

2
i

Puesto que:

Y = E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) =


= E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) =
= a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) =
n

= a0 + a1 1 + a2 2 + .... + an n = a0 + ai i
i 1

2
Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) =

= V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) =


= 0 + a12 V(X1 ) + a22 V(X2 ) + .... + an2 V(Xn ) =
= a12 12 + a22 22 + .... + a2n n2 =

a
i 1

2
i

1.4 TEOREMA DEL LMITE CENTRAL


Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas
dadas por: E(Xi) = i y V(Xi ) = i2 .
n

Si:

Yn = X1 + X2 + .... + Xn =

X
i 1

, entonces bajo ciertas condiciones generales,

la variable aleatoria Zn definida por:


n

Y E (Yn )
Zn n

V (Yn )

X
i 1

i 1

i 1

tiene aproximadamente una distribucin normal estndar N(0, 1).


Nota.

E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =


10

= 1 + 2 + .... + n =

i 1

V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =


n

= 12 + 22 + .... + n2 =

i 1

2
i

Observaciones.n

1. La variable aleatoria Yn =

X
i 1

(suma de v.a. independientes) puede ser

aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribucin
de las Xi .
2. Las condiciones generales indicadas en el teorema estn referidas a que los trminos
Xi tomados individualmente, contribuyen con una cantidad despreciable a la
variacin de la suma, y no es probable que un simple trmino tenga una gran
contribucin a la suma.
Una aplicacin importante de estas condiciones generales del teorema central del
lmite, se da en los modelos de regresin: Yi = 0 + 1 X1i + 2 X2i + .... + k Xki + ei
Donde la variable explicada o dependiente Y es funcin de un conjunto de variables
explicativas o independientes (X1 , X2 , .... , Xk ) ms un error e. La aplicacin del
teorema central del lmite se da cuando se asume que los errores ei se distribuyen
normalmente, debido a que estos errores recogen la suma de las contribuciones
despreciables de todas las variables dejadas de considerar en el modelo.
Por ejemplo, en los modelos de demanda Qi = a b Pi + ei , se asume que las
cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del
precio (P) del bien. Efectivamente, pero existen otras variables independientes
(gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que
tambin podran explicar dicha demanda, sin embargo, sus contribuciones a explicar
la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en
los errores ei se aproximan a la distribucin normal.

11

3. Una situacin especial del teorema central del lmite se presenta cuando cada Xi
tiene la misma distribucin (que es el caso de la definicin de muestra aleatoria,
como veremos ms adelante) y que permita encontrar la distribucin de una media
muestral. La propuesta es la siguiente:
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idnticamente
distribuidas con media y varianza comn y finitas dadas por: E(Xi) = y V(Xi ) = 2.
n

Si:

Yn = X1 + X2 + .... + Xn =

X
i 1

por :

Y E (Yn )
Zn n

V (Yn )

X
i 1

, entonces la variable aleatoria Zn dada

Xn
/ n

tiene aproximadamente distribucin normal estndar N(0 , 1). Donde X n


es la media muestral de las Xi .
Nota.

E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =


= + + .... + = n .
V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =

= 2 + 2 + .... + 2 = n 2

12

1 n
Xi
n i 1

1.5 EJERCICIOS RESUELTOS


1.

Sea Z una variable aleatoria con distribucin normal estndar [Z ~ N(0, 1)]. Hallar
las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z <
0.50) ;

d) P(-1.65 < Z < -1.00) ;

e) P(Z < -1.52) ;

f) P(0 < Z < 1.25) y g)

P(-1.63 < Z < 0).


Solucin.-Usando la tabla 1 del anexo se tiene:
a) P(Z > 1.13) = 1 - P(Z 1.13) = 1 (1.13) = 1 0.8708 = 0.1292
b) P(1.00 < Z < 1.42) = (1.42) - (1.00) = 0.9222 0.8413 = 0.0809
Para obtener los grficos en Minitab ver Bazn, Juan (2010)
0.4

0.4

0.6247
0.3

Densidad

Densidad

0.3

0.0809

0.2

0.1

0.1

0.0

0.2

0
Z

0.0

1 1.42

-1.5

0.5

P(-1.5 Z < 0.5)

En Minitab: P(1.00 < Z < 1.42)

c) P(-1.5 Z < 0.5) = (0.50) - (-1.5) = 0.6915 0.0668 = 0.6247


d) P(-1.65 Z -1.00) = (-1.00) - (-1.65) = 0.1587 0.0495 = 0.1092
e) P(Z < -1.52) = (-1.52) = 1 - (1.52) = 1 0.9357 = 0.0643
f) P(0 Z 1.25) = (1.25) - (0) = 0.8944 0.5000 = 0.3944
g) P(-1.63 < Z 0) = (0) - (-1.63) = 0.5000 0.0516 = 0.4484
2.

Sea Z una variable aleatoria normal estndar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes: a) (z) = 0.9500;

b) (z) = 0.9772;

c) (z) =

0.9987; d) el rea entre z y z es 0.95; e) el rea a la izquierda de z es 0.01; y


f) el rea a la derecha de z es 0.05.

13

Solucin
a) S (z) = F (z) = P [Z z] = 0.9500, esto implica que, en la tabla 1, a la
probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente.
b) S (z) = F (z) = P [Z z] = 0.9772, esto implica que, en la tabla 1, a la
probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente.
c) S (z) = F (z) = P [Z z] = 0.9987, esto implica que, en la tabla 1, a la
probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente.
d) Si 0.95 = P [-z Z z] = (z) - (-z) = (z) [1 - (z)] = 2 (z) 1.
Entonces, (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96.
e) Si 0.01 = (z) = P [Z z], esto implica que, en la tabla 1, a la probabilidad
0.01, le corresponde z = Z0.01 = -2.33 aproximadamente.
f) Si 0.05 = P [Z z] = 1 - (z), entonces (z) = 0.9500 y de acuerdo a lo
visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645.
3.

El monto de las solicitudes de prstamo de los comerciantes que recibe un


Banco, est distribuido aproximadamente en forma normal con = S/. 10,000 y
= S/. 1,000. Calcule e interprete la probabilidad de que el monto del prstamo
solicitado: a) Est entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c)
Mayores de que cantidad ser el 20 % de los prstamos?
Solucin
Sea X = monto de las solicitudes de prstamo.
Se sabe que X ~ N(10000 , 10002),

entonces

Z = (X 10000)/ 1000 ~ N(0,

1). Luego, las probabilidades solicitadas son:

8500 10000 X 10000 12000 10000

a) P(8500 X 12000) = P
=
1000
1000
1000

= P(-1.5 Z 2.0) = (2.00) - (-1.50) = 0.97725 0.06681 = 0.91044


Rpta.
Interpretacin: el 91.04% de los montos de prstamo solicitados por los
comerciantes flucta entre S/. 8,500 y 12,000.
14

X 10000 8000 10000

b) P(X 8000) = P
=
1000
1000
= P(Z -2.0) = (-2.00) = 0.02275 Rpta.
Interpretacin: el 2.28% ( en 228 de cada 10000 solicitudes) de los montos
de prstamo solicitados por los comerciantes es menor a S/. 8,000.
Distribucin del monto de prstamo
Normal, Media=10000, Desv.Est.=1000

0.0004

Densidad

0.0003

0.0002

0.0001
0.0228
0.0000

8000

10000
X = monto del prstamo

Resultado grfico en Minitab


c) Sea C la cantidad de prstamo buscada, entonces:

C 10000

0.20 = P(X > C) = 1 - P Z

1000

C 10000
0.80 =

1000

C 10000
Z 0 . 8 0 0.84
1000

C = S/. 10840

Rpta.
Interpretacin: el 20% de los montos de prstamo solicitados por los
comerciantes es mayor a S/. 10,840.

15

Distribucin del monto de prstamo


Normal, Media=10000, Desv.Est.=1000

0.0004

Densidad

0.0003

0.0002

0.20

0.0001

0.0000

4.

10000 10840
X = monto del prstamo

Para cierto examen la calificacin vigesimal tiene distribucin normal con media
11 y desviacin estndar 2. Se desea desaprobar al 40% de los examinados.
Cul debe ser la calificacin mxima desaprobatoria? Interprete el resultado.
Solucin
Sea X = calificacin vigesimal de los examinados.
Se sabe que X ~ N(11 , 22),

entonces

Z = (X 11)/ 2 ~ N(0, 1).

Sea M la mxima nota desaprobatoria buscada, entonces:

M 11

M 11
0.40 = P(X < M) = P Z
= 2
2

M 11
Z 0.40 0.25 M = 10.5 Rpta.
2

Interpretacin: el 40% de los examinados desaprobados tiene nota menor a 10.5.


5.

Los ingresos de los trabajadores tiene distribucin normal con media = S/.
1000 y desviacin estndar = S/. 200. Si se selecciona a 2000 de estos
trabajadores, calcule e interprete:
a) Cuntos trabajadores tienen ingreso menor a S/. 600?
b) Cuntos trabajadores tienen ingreso entre S/. 850 y 1300?
Solucin

16

Si X = ingreso de los trabajadores ~ N(1000, 2002), Z = (X 1000)/ 200 ~ N(0,


1).
Para determinar cuntos de los n = 2000 trabajadores tienen ingresos en los
intervalos dados, primero se determina la probabilidad P y despus multiplica
por n. Se pide:

X 1000 600 1000


a) P = P(X < 600) = P

= P(Z < -2.0) = (-2.0) =


200
200

0.02275
Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta.
Interpretacin: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.

850 1000 X 1000 1300 1000

b) P = P(850 X 1300) = P
=
200
200
200
= P(-0.75 Z 1.5) = (1.5) - (-0.75) = 0.93319 0.22663 = 0.70656
Distribucin del ingreso

Normal, Media=1000, Desv.Est.=200


0.0020

0.0015

Densidad

0.7066
0.0010

0.0005

0.0000

850

1000
X = ingreso

1300

Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta.


Interpretacin: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre
S/. 850 y 1300.
6.

El volumen de negociaciones diarias (en millones de nuevos soles) para las


acciones comercializadas en la bolsa de Lima tiene distribucin normal con
media = 800 y desviacin estndar = 100. En un perodo de 60 das, calcule e
interprete:
a) En cuntos das el volumen de negociaciones es de 600 o menos millones?
b) En cuntos das el volumen de negociaciones es mayor de 900 millones?
17

Solucin
Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002)

Z = (X 800)/ 100 ~ N(0, 1).


Para determinar en cuntos de los n = 60 das el volumen de las negociaciones
est en los intervalos dados, primero se determina la probabilidad P y despus
multiplica por n. Se pide:

X 800 600 800


a) P = P(X 600) = P

= P(Z < -2.0) = (-2.0) =


100
100
0.02275
Luego nP = 0.02275 x 60 = 1.4 das Rpta.
Interpretacin: en alrededor de 1.4 das (2.28%) el volumen de
negociaciones es de 600 o menos millones de nuevos soles.

X 800 900 800


b) P = P(X > 900) = P

= P(Z > 1.0) = 1 - (1.0) =


100
100
= 1 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5das Rpta.
Interpretacin: en alrededor de 9.5 das (15.87%) el volumen de
negociaciones es mayor de 900 millones de nuevos soles.
7.

El peso de los pernos fabricados se distribuye normalmente con media = 80 gr.


y desviacin estndar = 5 gr. Si se almacenan 2000 pernos, calcule e interprete
qu cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90
gramos?
Solucin
Si X = peso de los pernos ~ N(80, 52) Z = (X 80)/ 5 ~ N(0, 1).
Para determinar cuntos de los n = 2000 pernos tienen un peso en los intervalos
dados, primero se determina la probabilidad P y despus multiplica por n. Se
pide:

X 80 70 80
a) P = P(X < 70) = P

= P(Z < -2.0) = (-2.0) = 0.02275


5
5
Luego nP = 0.02275 x 2000 = 46 pernos Rpta.
Interpretacin: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos.

75 80 X 80 90 80

b) P = P(75 X 90) = P
= P(-1 Z 2) =
5
5
5
18

= (2.0) - (-1.0) = 0.97725 0.15866 = 0.81859.


Distribucin del peso de los pernos
Normal, Media=80, Desv.Est.=5

0.09
0.08
0.07

Densidad

0.06
0.8186

0.05
0.04
0.03
0.02
0.01
0.00

75

80
X = peso

90

Resultado grfico en Minitab


Luego nP = 0.81859 x 2000 = 1637 pernos Rpta.
Interpretacin: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90
gramos.
8.

El tiempo necesario para terminar un examen se distribuye normalmente con


media = 80 minutos y desviacin estndar = 10 minutos. En un curso de 60
alumnos, calcule e interprete cuntos alumnos terminan el examen:
a) en una hora o menos?
b) en ms de 60 minutos, pero en menos de 75 minutos?
c) Cuntos alumnos no terminan el examen, si ste dura 90 minutos?
Solucin
Si X = tiempo para terminar un examen ~ N(80, 102)

Z = (X 80)/ 10 ~ N(0, 1).


Para determinar cuntos de los n = 60 alumnos terminan el examen en los
intervalos dados, primero se determina la probabilidad P y despus multiplica
por n. Se pide:

X 80 60 80
a) P = P(X 60) = P

= P(Z -2.0) = (-2.0) = 0.02275.


10
10
Luego nP = 0.02275 x 60 = 1.4 alumnos Rpta.
19

Interpretacin: alrededor de 1.4 alumnos (2.28%) terminan el examen en una


hora o menos.

60 80 X 80 75 80

b) P = P(60 X 75) = P
= P(-2 Z -0.5) =
10
10
10
= (-0.50) - (-2.0) = 0.30854 0.02275 = 0.28579.
Resultado grfico en Minitab
Distribucin tiempo duracin examen
Normal, Media=80, Desv.Est.=10

0.04

Densidad

0.03

0.02

0.286

0.01

0.00

60

75 80
X = tiempo duracin examen

Luego nP = 0.28579 x 60 = 17 alumnos Rpta.


Interpretacin: alrededor de 17 alumnos (28.6%) terminan el examen en ms
de 60 minutos, pero en menos de 75 minutos.

X 80 90 80
c) P = P(X > 90) = P

= P(Z > 1.0) = 1 - (1.0) =


10
10
= 1 0.84134 = 0.15866.
Luego nP = 0.15866 x 60 = 9.5 alumnos Rpta.
Interpretacin: alrededor de 10 alumnos (15.87%) no terminan el examen, si
ste dura 90 minutos.
9.

Suponga que el ingreso familiar mensual (X) en una comunidad tiene


distribucin normal con media $400 y desviacin estndar $50. Si los gastos de
consumo familiar (C) estn dados por la relacin C = 0.80 X + 50, calcule e
interprete la probabilidad de que los gastos de consumo familiar sean inferiores a
$320?
Solucin
20

Si X = ingreso familiar mensual ~ N(400, 502), Z = (X 400)/ 50 ~ N(0, 1).


Se pide:
P(C < 320) = P(0.80 X + 50 < 320) = P(X < 337.5) =

X 400 337.5 400


= P

= P(Z < -1.25)


50
50

= (-1.25) = 0.10565 Rpta.


Otra forma de resolver es usando la propiedad reproductiva de la distribucin
normal. S C = 0.80 X + 50, entonces la media y la varianza de C son:
C E(C) 0.8E( X ) 50 0.8(400) 50 370
C2 Var (0.8 X 50) 0.8 Var ( X ) 0.64(2500) 1600 402
2

Luego C ~ N(370, 402), Z = (C 370)/ 40 ~ N(0, 1). Entonces:

C 370 320 370


P(C < 320) = P

= P(Z < -1.25) = (-1.25) = 0.10565


40
40

Rpta.
Interpretacin: el 10.6% de ( en 1057 de cada 10000 familias) los gastos de
consumo familiar en la comunidad son menores a S/. 320.
10.

Sean Xl , X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 , 3 )


;

X2 ~ N (12 , 4 ) y X3 ~ N (14 , 6). Si Y = X1 - 2 X2 + X3 . Se pide:

a) Hallar la media y la varianza de Y ; b) Ca1cule e interprete P 8 Y 10


Solucin
X1 ~ N (10 , 3 )

1 10

12 3

X2 ~ N (12 , 4 )

2 12

22 4

X3 ~ N (14 , 6 )

3 14

32 6

a) Clculo de la media y la varianza de Y


Y E Y E X1 2 X 2 X 3 E( X1 ) 2E( X 2 ) E( X 3 ) =

Y 1 22 3 10 2(12) 14 0 Rpta.
Y2 V (Y ) V ( X1 2 X 2 X 3 ) V ( X1 ) 4V ( X 2 ) V ( X 3 )

Y2 12 4 22 32 3 4(4) 6 25 Rpta.
21

b) Clculo de la P 8 Y 10
Sabemos que Y 0 y Y2 25 Y 5 .
Adems Y ~ N [0, 25] Z = (Y 0)/ 5 ~ N(0, 1). Luego:

8 0 Y 0 10 0
P 8 Y 10 P

P 1.6 Z 2
5
5
5
= (2.0) - (-1.60) = 0.97725 0.05480 = 0.92245 Rpta.
Interpretacin: alrededor del 92.25% de los valores observados de Y se
encuentran entre -8 y 10.
11.

Sean X1, X2, X3 y

X4 variables aleatorias normales independientes con 1

2
2
2
2
30; 2 = 25 ; 3 = 12 ; 4 = 8 ; 1 = 8 ; 2 = 6 ; 3 = 6 ; 4 = 2. S:

X 2X 2 X3 X4
Y= 1
- 2
4


Calcule e interprete: a) P 8 Y 14

b) P Y 12

Solucin:

X
X X
X
X 2X 2 X3 X4
Y = 1
-
= 1 2 3 4

4
2
2
2
4

1
1
1
1
E X1 E X 2 E X 3 E X 4
4
2
2
2

Y = E(Y) =
=

1
1
1
1
(30) (25) (12) (8) 10
4
2
2
2

Y2 = V (y) = 1 V ( X ) 1 V ( X ) 1 V ( X ) 1 V ( X )
1
2
3
4
16

1
1
1
1
(8) (6) (6) (2) 4
16
4
4
4

Siendo Y una combinacin lineal de las variables independientes Xi cada una


con distribucin normal, entonces por la propiedad reproductiva de la
distribucin normal se cumple que Y ~ N [10, 4] Z = (Y 10)/ 2 ~ N(0, 1).
Luego:

8 10 Y 10 14 10

a) P 8 Y 14 = P
= P (-1.0 Z 2.0) =
2
2
2
= (2.0) - (-1.0) = 0.97725 0.15866 = 0.81859 Rpta.
22

Interpretacin: el 81.86% de los valores de Y se encuentran entre 8 y 14.

12 10 Y 10 12 10
b) P Y 12 = P 12 Y 12 = P
=

2
2
2
= P (-11.0 Z 2.0) = (2.0) - (-11.0) =
= 0.97725 0.00000 = 0.0.97725 Rpta.
Interpretacin: alrededor del 97.73% de los valores absolutos de Y son
menores o iguales a 12.
12.

En el proceso de fabricacin de condensadores, varias pruebas han demostrado


que la temperatura ms alta (en C) que pueden soportar es N(125, 9). En los
sistemas en que se utilizan, la temperatura mxima (en C) a que se sujeta un
condensador individual es N(116, 16). Qu proporcin de condensadores fallar
por sobre calentamiento? Interprete el resultado.
Solucin
Sean: F = temperatura ms alta de fabricacin ~ N(125, 9) y
U = temperatura mxima de uso ~ N(116, 16)
Habr falla por sobrecalentamiento (S) cuando S = F < U = F U < 0.
Para hallar la proporcin solicitada mediante P(S) = P(F < U) = P(F U < 0)
determinamos la distribucin de F U usando la propiedad reproductiva de la
distribucin normal, as:
F U ~ N(9, 25) Z = ( F U 9)/ 5 ~ N(0, 1).
Entonces:

F U 80 0 9
P(S) = P(F < U) = P(F U < 0) = P

=
5
5

= P(Z -1.8) = (-1.8) = 0.03593 Rpta.


Interpretacin: alrededor del 3.59% de los ( 359 de cada 10000) condensadores
fabricados falla por sobrecalentamiento en los sistemas en que se utilizan.
13.

En una de las etapas de un proceso de ensamble un tapn cilndrico tiene que


ajustarse a una abertura circular seleccionando cada elemento al azar en un
suministro continuo. Los dimetros del tapn y de los casquillos en mm, son
N(24.9, 0.032 ) y N(25, 0.042 ) respectivamente. Si para que el ajuste sea
23

satisfactorio se requiere un claro de dimetro de cuando menos 0.02 mm, en


qu proporcin de los casos el ajuste no ser satisfactorio? Interprete el
resultado. (claro del dimetro = dimetro del casquillo dimetro del tapn)
Solucin
Sean: T = dimetro del tapn ~ N(24.9, 0.032) y
C = dimetro del casquillo ~ N(25, 0.042)
Si X = claro del dimetro = C T, usando la propiedad reproductiva de la
distribucin normal se tiene que:
X = E(X) = E(C T) = E(C) E(T) = 25.0 24.9 = 0.10
2X = V(X) = V(C T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052.
Luego: X = claro del dimetro = C T ~ N(0.10, 0.052)

Z = (X 0.10)/ 0.05 ~ N(0, 1).


Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces:

X 0.10 0.02 0.10


P(X < 0.02) = P

= P(Z -1.8) = (-1.6) = 0.0548


0.05
0.05
Rpta.
Interpretacin: en alrededor del 5.48% de los ( en 548 de cada 10000)
ensambles el tapn no se ajusta al casquillo.
14.

Las pastillas metlicas cilndricas que se utilizan en un reactor se fabrican en


serie y puede suponerse que sus longitudes siguen una distribucin normal con
media 0.290 cm. y desviacin estndar 0.016cm. Nueve de estas pastillas deben
ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no
mayor de 2.670 cm. Si las nueve pastillas se ensamblan al azar, qu proporcin
de estos no se ajustar en el espacio requerido? Interprete el resultado.
Solucin
Sean: Xi = dimetro de las pastillas ~ N(0.29, 0.0162) y
9

L = longitud del recipiente con 9 pastillas =

X
i 1

Por la propiedad reproductiva de la distribucin normal, se tiene que:


9

E(L) = E( X i ) =
i 1

E( X i ) =
i 1

0.29 = 9 x 0.29 = 2.61 cm.


i1

24

V(L) = V( X i ) =
i 1

V ( X i ) =
i 1

0.016

= 9 x 0.0162 = 0.002304 cm2.

i1

Luego:
9

L = longitud del recipiente con 9 pastillas =

X
i 1

~ N(2.61, 0.0002304)

Z = (L 2.61)/ 0.048 ~ N(0, 1).


Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto:

L 2.61 2.67 2.61


P(L > 2.67) = 1 P(L 2.67) = 1 - P

=
0.048
0.048
= 1 - P(Z 1.25) = 1 - (1.25) = 1 - 0.89435 = 0.10565 Rpta.
Interpretacin: en alrededor del 10.56% de los ( en 1056 de cada 10000)
recipientes con 9 pastillas, stas no se ajustan en el espacio requerido.
15.

Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida til de
50 tubos electrnicos; los mismos que se usan de la siguiente manera: tan pronto
como falla el primer tubo, empieza a funcionar el segundo y cuando falla el
segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, ., 50
tienen distribucin exponencial con parmetro = 1/500. Cul es la
probabilidad que el tiempo de funcionamiento de los 50 tubos est comprendido
entre 20 000 y 30 000 horas? Interprete el resultado.
Solucin
Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial ( = 1/500)
Entonces = E(Xi) = 1/ = 500 , 2 = 1/ 2 = 5002] i = 1, 2, ., 50.
Sea Y50 = tiempo de funcionamiento de los 50 tubos =
50

= X1 X 2 ............ X 50 X i
i 1

Entonces, por el teorema del lmite central la probabilidad solicitada es:


P(20 000 Y50 30 000) =
50

20000 50 x500 X i 50 x500 30000 50 x500


= P(-1.41 Z
i 1

= P
500 x 50)
500 x 50)
500 x 50)

1.41)
25

= (1.41) - (-1.41) = 0.92073 0.07927 = 0.84146 Rpta.


Interpretacin: en alrededor del 84.15% de los ( en 8415 de cada 10000)
tiempos de funcionamiento de 50 tubos estar comprendido entre 20 000 y 30
000 horas.
16.

Las botellas de aceite vegetal Primor tienen un contenido medio de 1 litro y


una desviacin estndar de 0.04. Para la distribucin se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga ms de 36.6
litros.
Solucin
Sea Xi = contenido de las botellas de aceite ~ [ = 1, = 0.04 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
36

= X1 X 2 ............ X 36 X i
i 1

Entonces, por el teorema del lmite central la probabilidad solicitada es:

36

X i 36 x1 36.6 36 x1
=

P(Y36 > 36.6) = 1 - P(Y36 36.6) = 1 - P i 1


0.04 36
0.04 36

= 1 P(Z 2.5) = 1- (2.5) = 1 0.99379 = 0.00621 Rpta.


Interpretacin: alrededor del 0.62% de las ( en 62 de cada 10000) cajas con 36
botellas de aceite el contenido es de ms de 36.6 litros.
17.

En una ciudad grande el 20% de los hogares no tiene desage. Si se eligen 100
hogares al azar, calcule e interprete la probabilidad de que ms de 30 hogares no
tengan desage.
Solucin
Sea Xi = 1, si el hogar no tiene desage ~ Bernoulli [p = 0.20]
Sea Y100 = el total de hogares sin desage, entre los 100 elegidos =
100

= X1 X 2 ............ X100 X i ~ B[n = 100, p = 0.20] N[np = 20, npq =


i 1

16]
Entonces, por el teorema del lmite central la probabilidad solicitada es:

26

P(Y100

>

30)

P(Y100

30)

100

X i 100 x0.20
30 100 x0.20
=
P i 1

0.20 x0.80 100


0.20 x0.80 100

= 1 P(Z 2.5) = 1- (2.5) = 1 0.99379 = 0.00621 Rpta.


Interpretacin: en alrededor del 0.62% de los ( en 62 de cada 10000) grupos de
100 hogares escogidos, ms de 30 hogares no tienen desage.
18.

Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviacin


estndar de 0.15 Kg. Este lote debe ser entregado a los vendedores minoristas a
razn de 100 cada uno. Cul es la probabilidad de que un vendedor cualquiera
de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete
su resultado.
Solucin
Sea Xi = peso de los pavos ~ [ = 7, = 0.15 Kg.]
100

Sea Y100 = peso total de los 100 pavos = X1 X 2 ............ X100 X i


i 1

Entonces, por el teorema del lmite central la probabilidad solicitada es:

100

X i 100 x7 697 100 x7


=

P(Y100 < 697) = P i 1


0.15 100
0.15 100

= P(Z < -2.0) = (-2.0) = 0.02275 Rpta.


Interpretacin: alrededor del 2.28% de los ( 228 de cada 10000) vendedores
minoristas recibe un peso total menor a 697 Kg.
19.

La Constructora Techito estima que el peso promedio de las personas que


vivirn en un edificio de apartamentos es de 68 Kg., con una desviacin estndar
de 15 Kg. De acuerdo con la estimacin, instala en el edificio un ascensor para
36 personas con capacidad mxima de 2700 Kg. Si la estimacin es correcta,
calcule e interprete la probabilidad de que un cupo completo exceda la capacidad
del ascensor.
Solucin
27

Sea Xi = peso de las personas ~ [ = 68, = 15 Kg.]


36

Sea Y36 = peso total de las 36 personas = X1 X 2 ............ X 36 X i


i 1

Entonces, por el teorema del lmite central la probabilidad solicitada es:

36

X i 36 x68 2700 36 x68


=

P(Y36 > 2700) = 1 - P(Y36 2700) = 1 - P i 1


15 36
15 36

= 1 P(Z 2.8) = 1- (2.8) = 1 0.99744 = 0.00256 Rpta.


Interpretacin: alrededor del 0.26% de los ( en 256 de cada 10000) cupos
completos del ascensor con 36 personas exceden su capacidad mxima de 2700
Kg.
20.

Las botellas de ron Pepito tienen un contenido medio de 2 litros y una


desviacin estndar de 0.018. Para la distribucin se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga ms de 72.36
litros.
Solucin
Sea Xi = contenido de las botellas de ron ~ [ = 2, = 0.018 lts.]
Sea

Y36

contenido

por

caja

de

las

36

botellas

36

X1 X 2 ............ X 36 X i
i 1

Entonces, por el teorema del lmite central la probabilidad solicitada es:

36

X i 36 x2 72.36 36 x 2
=

P(Y36 > 72.36) = 1 - P(Y36 72.36) = 1 - P i 1


0.018 36
0.018 36

= 1 P(Z 3.33) = 1- (3.33) = 1 0.99957 = 0.00043 Rpta.


Interpretacin: alrededor del 0.04% de las ( en 4 de cada 10000) cajas con 36
botellas de ron contienen ms de 72.36 litros.

28

EJERCICIOS PROPUESTOS
1. Sea Z una variable aleatoria con distribucin normal estndar [Z ~ N(0, 1)].
Hallar las probabilidades siguientes:
a) P(Z 2.15)
b) P(0.80 < Z < 1.96)
c) P(-2.45 < Z 1.65)
d) P(-2.75 Z -0.65)
e) P(Z -1.38)
f) P(-2.57 Z < 0)
g) P(0 Z < 2.33).
2. Sea Z una variable aleatoria normal estndar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes:
a) (z) = 0.8665
b) (z) = 0.9222
c) (z) = 0.9972
d) el rea entre z y z es 0.99
e) el rea a la izquierda de z es 0.05
f) el rea a la derecha de z es 0.025
3. El contenido en las botellas de cierta gaseosa tiene distribucin normal con
media = 1000 ml. y desviacin estndar = 5 ml. Calcule e interprete la
probabilidad de que una botella de gaseosa tenga:
a) Entre 990 y 1005 ml.
b) Menos de 985 ml.
4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene
distribucin normal con media = S/. 12 y desviacin estndar = S/. 0.80.
Calcule e interprete la probabilidad de que el precio pagado por el kilo de
pescado:
a) Sea menor de S/. 10.
b) Se encuentre entre S/. 10.50 y 13.50.
c) Por arriba de que precio paga el 10% superior de los consumidores.
29

5. El tiempo que dura la atencin a los clientes de un negocio se distribuye


normalmente con media = 30 minutos y desviacin estndar = 4 minutos.
Calcule e interprete la probabilidad de que el tiempo de atencin a los clientes:
a) dure entre 25 y 40 minutos.
b) Entre que lmites simtricos alrededor de dura el 95% de las atenciones.
6. El peso de las cajas de mango se distribuye normalmente con media = 20 Kg. y
desviacin estndar = 0.5 Kg. Si se almacenan 2000 cajas, calcule e interprete
qu cantidad de cajas pesan:
a) menos de 19 kilos?
b) entre 19.5 y 21 kilos?
7. El peso de los huevos de gallina producidos por una avcola se distribuye
normalmente con media = 65 gr. y desviacin estndar = 5 gr. Si se
almacenan 2000 huevos, calcule e interprete qu cantidad de huevos pesan:
a) Menos de 70 gramos?
b) Entre 55 y 60 gramos?
8. La duracin de ciertos focos elctricos tiene distribucin normal con media =
1000 horas y desviacin estndar = 200 horas. Si compra 2000 de estos focos,
calcule e interprete:
a) Cuntos focos durarn menos de 600 horas?
b) Cuntos focos durarn entre 850 y 1300 horas?
9. El volumen de ventas diarias de bolsas de azcar de la comercializadora
Yapatera tiene distribucin normal con media = 800 bolsas y desviacin
estndar = 100. En un perodo de 60 das, calcule e interprete:
a) En cuntos das el volumen de ventas es de 600 o menos bolsas de azcar?
b) En cuntos das el volumen de ventas es mayor de 900 bolsas de azcar?
10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con
2
2
1 50; 2 = 35; 1 = 10; 2 = 6. Si: Y = X1 - X2. Calcule e interprete:

a) La media y la varianza de Y
b) P 10 Y 25
30

11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente


2
2
32 = 6. S: Y = X + 2 X con 1 10; 2 = 15; 3 = 12; 1 = 3; 2 = 4;
1
2

X3
Calcule e interprete:
a) P 20 Y 40
b) P Y 18
12. Los telfonos celulares A y B tienen una duracin (en das) que son N(2190,
2002 ) y N(2878, 2502 ) respectivamente. Si se prueba la vida de cada uno de los
telfonos correspondientes a cada una de las marcas, cul es la probabilidad que
los A duren un ao o ms que los B? Interprete su resultado.
13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100
hogares, calcule e interprete la probabilidad que ms de 30 no tengan agua.
14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener
entre 40 y 60 caras.
15. Las cajas con limn tienen un peso medio de 20 Kg. y una desviacin estndar
de 750 gr. Calcule e interprete la probabilidad de que el peso de 410 cajas
recibidas al azar y cargadas en un camin, supere su capacidad mxima que es
de 8,250 kg.
16. Los pesos de los sacos de algodn Pima cosechados tienen una media de 50
kilos y una desviacin estndar de 1.4 kilos. Calcule e interprete la probabilidad
de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos.
17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviacin estndar
de 0.5 kilos. Calcule e interprete la probabilidad de que el peso de 400 cajas
tomadas al azar sea menor de 5,980 kg.
18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una
desviacin

estndar de 0.05 Kg. Este lote debe ser entregado a las polleras a

razn de 100 cada una. Cul es la probabilidad de que una pollera, cualquiera
31

de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete
su resultado.
19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de
580 libras y una desviacin estndar de 80 libras. Calcule e interprete la
probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un
montacargas, supere su capacidad de 30 000 libras.
20.

Un lote muy grande de cajas con palta tiene un peso medio = 20 Kg. y una
desviacin estndar = 0.5 Kg. Este lote debe ser entregado a los
supermercados a razn de 100 cajas cada uno. Calcule e interprete la
probabilidad de que un supermercado cualquiera, reciba un peso total de
menos de 1 990.2 Kg.?

32

Captulo 2. DISTRIBUCIONES MUESTRALES


Hace falta remarcar que un pas que no conoce su demografa,
tampoco conoce su economa? No se puede saber lo que un pas
produce y ahorra si se ignora esta cosa fundamental: la poblacin. ....
En un pas donde no se puede contar a los hombres, menos an se
puede contar la produccin. Se desconoce el primero de sus factores:
el factor humano, el factor trabajo..
Jos Carlos Maritegui
CONTENIDO
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8

Distribuciones muestral de la media.


Distribucin muestral del total (conocida la media)
Distribucin de la diferencia de medias muestrales.
Distribucin muestral de la proporcin.
Distribucin muestral del total (conocida la proporcin)
Distribucin muestral de la diferencia de proporciones.
Ejercicios resueltos.
Ejercicios propuestos.

La estadstica es una ciencia importante porque permite el conocimiento de la


poblacin basndose en muestras aleatorias representativas. El principal problema de
la estadstica es estudiar una poblacin con funcin de cuanta o funcin de densidad,
f(x, ) conocida o supuestamente conocida, con parmetro desconocido. Si se
conoce , la distribucin de probabilidad queda determinada. Para ello, se toma una
muestra aleatoria de tamao n (X1 , X2 , .... , Xn ) de una poblacin de tamao N y se
busca alguna funcin de esta muestra que estime el parmetro desconocido ,
problema que ser abordado con mayor detalle en el captulo de estimacin.
En este captulo se desarrollan las distribuciones muestrales para muestras grandes (n
30 ) referidas a la media, a la diferencia de medias, a la proporcin, a la diferencia
de proporciones y a los totales (conocida la distribucin de la media y la proporcin).
Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte
fundamental para poder comprender el desarrollo de la estimacin por intervalos y la
docimasia de hiptesis a tratar captulos ms adelante. A continuacin se desarrolla
cada uno de los conceptos importantes de las distribuciones muestrales.
33

Poblacin.- es el conjunto de todas las unidades de anlisis (individuos u objetos) a


ser observadas y que poseen una caracterstica comn. Es decir, es el conjunto de
todas las observaciones posibles que puede tomar una variable aleatoria X. Por
ejemplo, en todas las empresas podemos estudiar: el nmero de trabajadores, las
ventas, etc.; en todos los hogares podemos estudiar: los ingresos, los gastos, etc.
Muestra.- es una parte representativa de la poblacin. La representatividad implica
adecuado: mtodo de muestreo, tamao de muestra, seleccin de la muestra y
propuesta de estimadores (frmulas). Relacionado al ejemplo anterior, la muestra
vendra dada por una parte representativa de empresas u hogares.
Muestra Aleatoria.- Sea X una variable aleatoria con distribucin de probabilidad
f(x) (funcin de cuanta o funcin de densidad) con media y varianza 2. Una
muestra aleatoria (m.a.) de tamao n de X, es un conjunto de n variables aleatorias
(X1 , X2 , .... , Xn ) que cumplen:
1. Cada Xi (i = 1, 2, .... , n) tiene la misma distribucin que X. Es decir, tienen la
misma distribucin de probabilidades f X i ( x) f X ( x) , la misma funcin de
distribucin acumulativa FX i ( x) FX ( x) , la misma media X i = E(Xi) = E(X)
N

con
N

(X
i 1

X
i 1

y la misma varianza X2 I = V(Xi ) = V(X) =

)2

2. Las variables aleatorias Xi (i = 1, 2, .... , n) son independientes. Por lo tanto la


funcin de probabilidad conjunta de la muestra aleatoria X1 , X2 , .... , Xn est
dada

por:
n

f X1 , X 2 ,...., X n ( X 1 , X 2 ,...., X n ) f X ( X 1 ) f X ( X 2 ).... f X ( X n ) f X ( X i ) .


i 1

Esta probabilidad de ocurrencia de la muestra observada, es importante en


estimacin puntual, ya que all representa la funcin de verosimilitud a
maximizar.
Nota:

34

La definicin de m.a. se cumple cuando la muestra proviene de una poblacin


infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de
una poblacin finita.

La definicin de m.a. no se cumple cuando el muestreo es sin reemplazo de una


poblacin finita, ya que las v.a. X1 , X2 , .... , Xn no son independientes. Sin
embargo, si el tamao n de la muestra es muy pequeo en comparacin con el
tamao N de la poblacin (n < 5% N ) se cumple aproximadamente la
definicin.

Ejemplo 1.Si se toma una m.a. de tamao n, de una poblacin X con distribucin de Poisson,
con parmetro , hallar la funcin de probabilidad conjunta (funcin de
verosimilitud) para dicha muestra.
Solucin:
Como la v.a. X ~ Poisson (), entonces Xi
probabilidad es: f X ( X i )

X e
i

~ Poisson () y su funcin de

, i 1,2,....,n ; Xi = 0, 1, 2, 3, ......

X i!

Luego la funcin de probabilidad conjunta (funcin de verosimilitud) ser:

f X1 , X 2 ,....,X n ( X 1 , X 2 ,...., X n ) f X ( X 1 ) f X ( X 2 ).... f X ( X n ) =

i 1

X e
i

X i!

X n e
X1 e X 2 e

....
=

X 1! X 2 !
X n!
n

Xi

i 1

e n

X !
i 1

, Xi = 0, 1, 2, 3, ...... ; i = 1, 2, .... , n .

Rpta.
Ejemplo 2.Si se toma una m.a. de tamao n, de una poblacin X con distribucin N( , 2 ),
hallar la funcin de probabilidad conjunta (funcin de verosimilitud) para dicha
muestra.
Solucin:

35

Como la v.a. X ~ N( , 2 ), entonces Xi ~ N( , 2 ) y su funcin de probabilidad


est dada por:

f X (Xi )

2 2

e ( X i )

/ 2 2

; X i , i = 1, 2, 3, .... , n.

Luego la funcin de densidad conjunta (funcin de verosimilitud) ser:

f X1 , X 2 ,....,X n ( X 1 , X 2 ,...., X n ) f X ( X 1 ) f X ( X 2 ).... f X ( X n ) =

1
2
2
1
2
2
2
2
1
e ( X n ) / 2
=
e ( X1 ) / 2
e ( X 2 ) / 2 ....
2
2
2
2

2
2

=
n
2

1
e
=
2
2

( X i ) 2 / 2 2

i 1

; xi , i = 1, 2, 3, .... , n. Rpta.

Estadstico.- es una variable aleatoria que depende slo de la muestra observada.


As, si X1 , X2 , .... , Xn es una m.a. de una poblacin X, entonces la media muestral
( X ) y la varianza muestral (s2 ) son estadsticos. Donde:
n

Xi
i 1

s2

( X
i 1

X )2

n 1

Distribucin muestral.- es la distribucin de probabilidad de un estadstico.


Error estndar de un estadstico.- es la desviacin estndar de la distribucin
muestral de un estadstico.
Error relativo de un estadstico.- es el coeficiente de variacin de la distribucin
muestral de un estadstico.
Teorema 1.- Sea X1 , X2 , .... , Xn una muestra aleatoria de tamao n de una
n

poblacin X, con media E(X) =

y varianza Var (X) = . Sea X


2

media muestral, entonces: E (X )

X2 Var( X )

2
n

X
i 1

la

Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamao n
de una poblacin X de tamao N, con media E(X) = E(Xi ) = y varianza Var (X)
= Var (Xi) = 2.
Entonces: E (X )

2 N n

S2 N n
Var( X )

.
n N 1 n N
2
X

36

Donde:

S2

( X
i 1

)2
, representa la cuasivarianza poblacional y el factor

N 1

N n
se llama factor de correccin para poblaciones finitas (f.c.p.f.) el mismo que
N 1
es

descartado

cuando

n
0.05 0.97
N

la

fraccin

de

muestreo

(f

N n
1.
N 1

A continuacin presentamos las distribuciones muestrales de la media, del total


(conocida la media), de la diferencia de medias muestrales, de la proporcin, del total
(conocida la proporcin) y de la diferencia de proporciones. Todas ellas de suma
importancia en el diario quehacer de muchos campos de la investigacin cientfica,
ya que como estudiaremos ms adelante, van a permitir la determinacin de
intervalos de confianza y la verificacin de hiptesis para los parmetros
poblacionales.
2.1 DISTRIBUCIN MUESTRAL DE LA MEDIA
Teorema 3.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamao n de una
poblacin X, con media E(X) =

y varianza Var (X) = 2. Entonces, por el


n

teorema central del lmite, la media muestral X

X
i 1

tiene aproximadamente

distribucin normal con media y varianza 2/n. X N (, 2 / n) . Y la variable


aleatoria Z

( X )
tiene aproximadamente distribucin N(0, 1).
/ n

Este teorema es vlido para cualquier poblacin finita o infinita, discreta o continua,
cuando el tamao de la muestra n 30. Si la poblacin es normal, se cumple
cualquiera sea el tamao n de la muestra.
Cuando la poblacin es finita de N elementos y el muestreo es sin reemplazo, la
variables aleatorias Xi no son independientes, entonces la distribucin de X es
hipergeomtrica, con:

E (X )

X2 Var( X )

2 N n

. Luego:
n N 1

37

Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamao n extraida sin


reemplazo de una poblacin X finita de tamao N, con media E(X) = y varianza
n

Var (X) = . Entonces, la media muestral X


2

X
i 1

tiene aproximadamente

distribucin normal con media y varianza Var( X )


2
X

2 N n

. Y la
n N 1

( X )
tiene aproximadamente distribucin N(0, 1).
N n
n N 1

variable aleatoria Z

Ejemplo 3.En Lima Metropolitana la botella de aceite primor de un litro tiene un precio
promedio de S/. 5.00 y una desviacin estndar de S/. 0.40. Si se toman muestras
aleatorias de 50 precios, se pide calcular e interpretar: a) la probabilidad que el precio
promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el
precio medio muestral sea inferior a S/. 4.80; y c) dentro de que lmites simtricos
alrededor del precio promedio verdadero se encontrar el 95 % de los precios
promedios muestrales.
Solucin.Como datos del problema se tiene que: = S/. 5.00 , = S/. 0.40 y n = 50.

X2 Var( X )

2
n

= (0.40)2 / 50 = 0.0032

Luego: X N (5.00;0.0032) y Z

X 0.057. S/.

( X 5.00)
N (0,1) . Nos piden:
0.057

4.85 5.00 X 5.00 5.10 5.00

a) P(4.85 X 5.10) = P
=
0.057
0.057
.057
= P(-2.63 Z 1.75) = (1.75) - (-2.63) =
= 0.95994 0.00427 = 0.95567 Rpta.
Interpretacin.- el 95.567% de los precios promedios muestrales de las botellas de
aceite primor de un litro, se encuentran entre S/. 4.85 y 5.10, para muestras de
50 precios.
b) P( X < 4.80) = P(

X 5.00 4.80 5.00

) P( Z 3.51) 0.00022
0.057
0.057
38

Interpretacin.- el 0.022% de los precios promedios muestrales de las botellas de


aceite primor de un litro, ser inferior a S/. 4.80, para muestras de 50 precios.
c) Sean 5.00 E y 5.00 + E los lmites simtricos alrededor de la media = S/.
5.00, dentro de los cuales estar el 95 % de las X . Entonces:
0.95 = P(5.00 E X 5.00 + E) = P(

E
E
Z
)
0.057
0.057

E E
E
E
=

2
1
0.975
0.057 0.057
0.057
0.057
E
Z 0.975 1.96 E 1.96(0.057 ) 0.11 . Luego los lmites sern:
0.057
5.00 E= 5.00 0.11 = S/. 4.89

5.00 + 0.11 = S/. 5.11. Es decir:

0.95 = P(4.89 X 5.11)


Interpretacin.- el 95 % de los precios promedios muestrales de las botellas de
aceite primor de un litro, se encuentran entre S/. 4.89 y 5.11 alrededor de =
S/. 5.00, para muestras de 50 precios.
2.2 DISTRIBUCIN MUESTRAL DEL TOTAL (conocida la media)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la media muestral, para lo cual se tiene que tener presente
lo siguiente:
N

S el promedio poblacional es:

X
i 1

N
n

El total de la poblacin se define como: X X i N


i 1

X N NX

el cual es estimado por:

Utilizando la propiedad reproductiva de la distribucin normal, el teorema


central del lmite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:

X N NX N N , N 2 X2

NX N
~ N(0, 1)
N X

Donde la varianza del estimador del total est dada por:


39

,
Var( X ) Var( N ) Var( NX ) N 2Var( X ) N 2 X2 N 2
n
2

si

la

fraccin de muestreo f = n / N 0.05 , o

Var( X ) Var( N ) Var( NX ) N 2Var( X ) N 2 X2 N 2

2 N n
n N 1

si

la fraccin de muestreo f = n / N > 0.05.


2.3 DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES
Esta distribucin va a surgir cuando estemos interesados en efectuar la comparacin
de las medias de dos poblaciones. Por ejemplo: comparar el precio promedio
poblacional de un bien o servicio en la ciudad X (X ) y el precio promedio
poblacional del mismo bien o servicio en la ciudad Y (Y ). O comparar los ingresos
promedios, ventas promedios, los rendimientos promedios, etc. no slo entre
ciudades, sino tambin entre grupos.
Esta comparacin se formula as: Sern iguales los precios promedios de un bien o
servicio en las ciudades X e Y (o en las ciudades 1 y 2)? Que es idntico a
plantearse X = Y o X Y = 0? o tambin 1 = 2 o 1 2 = 0?
Es decir, que esta comparacin se reduce a conocer la diferencia de medias
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la media muestral en cada una de ellas,
de la siguiente manera:
Sea X1 , X2 , .... , Xn es una muestra aleatoria de tamao n, de una poblacin X de
y varianza Var (X) = X2 . Sabemos que la

tamao N, con media E(X) = X


n

media muestral X

X
i 1

tiene aproximadamente distribucin normal:

X N ( X , X2 ) . Donde: X2

X2

o X2 Var( X )

X2 N n

..... (1)
n N 1

Sea Y1 , Y2 , .... , Ym una muestra aleatoria de tamao m, de una poblacin Y de


tamao M, con media E(Y) = Y

y varianza Var (Y) = Y2 . Sabemos que la

media muestral Y

Y
i 1

tiene aproximadamente distribucin normal:

40

Y2

Y N (Y , Y2 ) . Donde: m o
2
Y

Y2 Var(Y )

Y2 M m

m M 1 ..... (2)

De (1) y (2) tenemos que X - Y es una variable aleatoria con media:

X Y E X Y E X EY X Y X Y
y varianza:

X2 Y Var X Y Var X VarY X2 Y2

X2 Y2
+
n
m

X2 Y =

X2 N n

M m

+ Y

m M 1
n N 1
2

.............. (3)

Adems, por la propiedad reproductiva de la distribucin normal, de (1) y (2) se tiene


que:

X - Y ~ N( X Y , X2 Y )

X Y ( X Y ) )

X Y

N(0 , 1)

donde X Y se obtiene a partir de (3).

Sintetizamos lo expuesto hasta aqu en el teorema 5.


Teorema 5.- Si X y Y son las medias de dos muestras aleatorias (de tamaos n y
m) de dos poblaciones X e Y, con medias X y Y , y varianzas Var (X) = X2 y
Var (Y) = Y2 , respectivamente, entonces la distribucin muestral de la diferencia de
medias es aproximadamente normal N( X Y , X2 Y ) y la variable aleatoria

X Y ( X Y ) )

X2
n

Y2

X Y ( X Y ) )

X2 N n Y2 M m

tiene

n N 1 m M 1

aproximadamente distribucin normal estndar N(0 , 1).


Si n y m son mayores o iguales que 30, la aproximacin a la normal para la
diferencia de medias muestrales es ptima.
Si las poblaciones X e Y son normales, el teorema se cumple para cualesquier
tamao de muestra.
Ejemplo 4.Ciertas bolsas de caf tienen un peso medio de 500 gr. y una desviacin estndar de
20 gr. Cierto da de produccin se toman independientemente dos muestras al azar
sin reposicin, con n = 500 y m = 800. Cul es la probabilidad que los pesos medios
41

de las dos muestras difieran a) en ms de 2 gr.? y b) en menos de 1gr.? Interpretar


los resultados.
Solucin.Sea X la muestra de tamao n = 500 bolsas de caf, con X = 500 gr. y X = 20 gr.
Sea Y la muestra de tamao m = 800 bolsas de caf, con Y = 500 gr. y Y = 20 gr.
Luego: X Y = X Y = 500 500 = 0,
1.3 y
Adems,

X2 Y =

X2 Y2
+
n
m

202 202
=

500 800

X Y = 1.14 gr.
X - Y ~ N(0, 1.3) y

X Y 0
~ N(0 , 1).
1.14

Nos piden:

a) P ( X - Y > 2 ) = 1 - P ( X - Y 2 ) = 1 - P(-2 X - Y 2) =

2 0 X Y 0 2 0
= 1 - P

= 1 - P(-1.75 Z
1.14
1.14
1.14
1.75) =
= 1 [ (1.75) - (-1.75)] = 1 - [ (1.75) 1 + (1.75)] =
= 2 2 (1.75) = 2 2 (0.95994) = 0.08012 Rpta.
Interpretacin.- en el 8.01% de las comparaciones, para muestras de 500 y 800
bolsas de caf respectivamente, las diferencias de pesos medios sern mayores a 2
gramos.
b) P ( X - Y < 1 ) = P( -1 < X - Y < 1) =

1 0 X Y 0 1 0

= P
= P(-0.88 Z 0.88) =
1.14
1.14
1.14
= (0.88) - (-0.88) = 0.81057 0.18943 = 0.62114 Rpta.
Interpretacin.- en el 62.11% de las comparaciones, para muestras de 500 y 800
bolsas de caf respectivamente, las diferencias de pesos medios sern menores de
1 gramo.

42

2.4 DISTRIBUCIN MUESTRAL DE LA PROPORCIN


En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o
cuantitativos de la poblacin en dos clases distintas (poblacin dicotmica o
binomial) tales como: xitos y fracasos; hombres y mujeres; a favor y en contra;
aprueba y desaprueba; jvenes (menores de x aos) y adultos (de x aos y ms);
caras y sellos; empleados y desempleados; etc.
En este caso, se desea estimar la proporcin de unidades (P) o el nmero total de
unidades (A) en la poblacin que poseen una cierta caracterstica o atributo que
cae dentro de una clase definida. Por ejemplo, se desea estimar:
- El porcentaje (o nmero) de personas que consumen un cierto producto.
- El porcentaje (o nmero) de clientes que compran ms de 10 000 dlares
mensuales.
- El porcentaje (o nmero) de ciudadanos que est a favor de un personaje.
Notacin: Adems de la notacin usada anteriormente, si se define la v.a.
Bernoulli:
Xi = 1, si la unidad estadstica observada posee la caracterstica de inters
(xito).
Xi = 0, si la unidad estadstica no posee la caracterstica de inters (fracaso).
Entonces:
N

A Xi

X
i 1

i 1

representan el nmero total de unidades (A) y la

proporcin (P) de unidades en la poblacin que poseen una cierta caracterstica.


Suponga que se extrae una muestra aleatoria simple de tamao n de la poblacin
binomial, entonces la proporcin muestral p definida como:
n

X
i 1

X
n

43

estima a P.

X =

X
i 1

= nmero de xitos en la muestra es una v.a. Binomial (n, P). La

proporcin muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) = P y


V(Xi ) = P Q; representa la proporcin de xitos en la muestra y estima a la
proporcin de xitos en la poblacin P. Es decir, que p tiene el mismo
comportamiento de una media muestral X . Por lo tanto:

Xi 1 n
1 n
1
E ( p) E i 1 E ( X i ) P (nP) P
n i 1
n
n n i 1

n
n

X
Var
(
Xi )

i
i 1
i 1

Var( p) Var
n2
n

(propiedad de la varianza)

Var( X ) PQ
i

i 1

i 1

nPQ PQ

p2
2
n
n

Luego:

X
i 1

X
n

PQ
N P,

pP
~ N(0, 1)
PQ
n

Si el muestreo se efecta sin reemplazo de una poblacin binomial finita, la


distribucin muestral de p sigue la distribucin hipergeomtrica y su varianza
requiere el factor de correccin para poblaciones finitas (salvo que la fraccin de
muestreo f = n/N sea menor del 5%, donde no se utiliza). Entonces:
n

X
i 1

X
n

PQ N n
N P,

n N 1

44

pP
~ N(0, 1)
PQ N n

n N 1

Ejemplo 5.Segn el Censo Nacional de Talla en Escolares de 19991 la desnutricin crnica en el


Per era del 27.9%. Si se toma una muestra al azar sin reposicin, de n = 1500 nios
y nias. Calcule e interprete la probabilidad que: a) la desnutricin crnica muestral
se encuentre entre 26 y 30%? y b) dentro de que lmites simtricos alrededor de la
proporcin verdadera de desnutridos crnicos se encontrar el 95% de las
proporciones muestrales.
Solucin.El mencionado Censo tiene los siguientes datos:
N = 2 059 426 nios y nias censados como casos vlidos = tamao de la poblacin.
N

X=

X
i 1

= 574 314 nios y nias desnutridos crnicos.

X
i 1

X
574,314
= 0.279 = proporcin censal de nios y nias con

N 2'059,426

desnutricin crnica.
Q = 0.721 = proporcin censal de nios y nias sin desnutricin crnica.
n = 1500 nios y nias = tamao de la muestra.
Como la fraccin de muestreo n/N es menor de 0.05, entonces, la proporcin
muestral:

Ministerio de Educacin. Nutricin y Retardo en el Crecimiento. Resultados del II Censo Nacional de Talla en Escolares 1999.
Lima, Per, Noviembre de 2000.

45

X
i 1

X
n

PQ
N P,
N 0.279; 0.0001341
n

pP
p 0.279
p 0.279
~ N(0, 1)

0.0116
PQ
0.0001341
n

Se pide calcular:

0.26 0.279 p 0.279 0.30 0.279


a) P ( 0.26 p 0.30 ) = P

0.0116
0.0116
0.0116
= P( -1.64 Z 1.81 ) = (1.81) - (-1.64) =
= 0.96485 0.05050 = 0.91435 Rpta.
Interpretacin.- en el 91.44 % de las muestras de 1500 nios y nias a nivel
nacional, el porcentaje de desnutridos crnicos, se encuentra entre el 26 y 30 %.
b) Sean 0.279 E y 0.279 + E los lmites simtricos alrededor de la proporcin
verdadera P = 0.279 , dentro de los cuales estar el 95 % de las p. Entonces:
0.95 = P(0.279 E p 0.279 + E) = P(

E
E
Z
)
0.0116
0.0116

E E
E
E
=

2
1
0.975
0.0116 0.0116
0.0116
0.0116
E
Z 0.975 1.96 E 1.96(0.0116 ) 0.023 . Luego los lmites sern:
0.0116
0.279 E = 0.279 0.023 = 0.256

0.279 + 0.023 = 0.302 . Es decir:

0.95 = P(0.256 p 0.302 )

Rpta.

Interpretacin.- en el 95 % de las muestras de 1500 nios y nias a nivel nacional,


la proporcin de desnutridos crnicos se encontrar entre 0.256 y 0.302 alrededor
de la proporcin verdadera P = 0.279.
46

2.5 DISTRIBUCIN MUESTRAL DEL TOTAL (conocida la proporcin)


En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la proporcin muestral, para lo cual se tiene que tener
presente lo siguiente:
N

X
i 1

representa la proporcin (P) de unidades en la poblacin que


N

poseen una cierta caracterstica y A X i

el nmero total (A) de unidades que

i 1

poseen dicha caracterstica. Entonces:


N

El total de la poblacin se define como: A X i NP


i 1

A NP Np

el cual es estimado por:

Utilizando la propiedad reproductiva de la distribucin normal, el teorema


central del lmite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:

A NP Np N NP, N 2 p2

Np NP
~ N(0, 1)
N p

Donde la varianza del estimador del total est dada por:

Var( A ) Var( NP ) Var( Np) N 2Var( p) N 2 p2 N 2

PQ
,
n

si

la

fraccin de muestreo f = n / N 0.05 , o

Var( A ) Var( NP ) Var( Np) N 2Var( p) N 2 p2 N 2


la fraccin de muestreo f = n / N > 0.05.

47

PQ N n

, si
n N 1

2.6 DISTRIBUCIN MUESTRAL DE LA DIFERENCIA DE


PROPORCIONES
Esta distribucin surge cuando estemos interesados en efectuar la comparacin de las
proporciones de dos poblaciones. Por ejemplo: comparar la proporcin poblacional
de individuos que prefiere un bien o servicio en la ciudad 1 (P1 ) y la proporcin
poblacional de individuos que prefiere el mismo bien o servicio en la ciudad 2 (P2 ).
Comparar las proporciones de aceptacin no slo entre ciudades, sino tambin entre
grupos.
Esta comparacin se formula as: Sern iguales las proporciones poblacionales de
individuos que prefieren un bien o servicio en las ciudades 1 y 2? Que es idntico a
plantearse P1 = P2 o P1 P2 = 0 ?
Es decir, que esta comparacin se reduce a conocer la diferencia de proporciones
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la proporcin muestral en cada una de
ellas y de la diferencia p1 p2 de la siguiente manera:
Suponga que se extrae una muestra aleatoria simple de tamao n1 de la poblacin
binomial 1, de tamao N1 con una proporcin de xitos igual a P1. Sea X1 el
nmero de xitos en la muestra de tamao n1 , entonces la proporcin muestral de
xitos p1 , definida como p1

X1
n1

estima a P1 y para n1 suficientemente

grande tiene aproximadamente distribucin normal:

p1 N ( P1, p21 ) . Donde: p21

P1Q1
n1

o p21

P1Q1 N1 n1

n1 N1 1

..... (1)

Suponga que se extrae una muestra aleatoria simple de tamao n2 de la poblacin


binomial 2, de tamao N2 con una proporcin de xitos igual a P2. Sea X2 el
nmero de xitos en la muestra de tamao n2 , entonces la proporcin muestral de
xitos p2 , definida como p2

X2
n2

estima a P2 y para n2 suficientemente

grande tiene aproximadamente distribucin normal:

48

p2 N ( P2 , p22 ) . Donde: p22

P2Q2
n2

p2

P2Q2 N2 n2

n2 N2 1

.....

(2)
Siendo p1 y p2 variables aleatorias independientes, cuyas distribuciones estn
dadas en (1) y (2) tenemos que p1 p2 es una variable aleatoria con media:

p p E p1 p2 E p1 E p2 p p P1 P2
1

y varianza:

p2 p Var p1 p2 Var p1 Var p2 p2 p2


1

p2 p =
1

P1Q1 P2Q2
PQ N n P Q N n2

+
o 1 1 1 1 + 2 2 2
n2 N 2 1
n1
n2
n1 N1 1

............. (3)

Adems, por la propiedad reproductiva de la distribucin normal, de (1) y (2) se


tiene que:
p1 p2 ~ N(P1 P2 , p21 p2 )

p1 p2 ( P1 P2 )

p p
1

~ N(0 , 1)

donde p1 p2 se obtiene a partir de (3).


Sintetizamos lo expuesto hasta aqu en el teorema 6.
Teorema 6.- Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaos
n1 y n2 ) de las poblaciones binomiales 1 y 2, respectivamente, entonces la
distribucin muestral de la diferencia de proporciones p1 - p2 ~ N(P1 P2 , p21 p2 )
y

la

variable

aleatoria

p1 p2 ( P1 P2 )
P1Q1 N1 n1 P2Q2 N 2 n2

n1 N1 1
n2 N 2 1

normal estndar N(0 , 1).


49

p1 p2 ( P1 P2 )
P1Q1 P2Q2

n1
n2

tiene aproximadamente distribucin

Si n1 y n2 son mayores o iguales que 30, la aproximacin a la normal para la


diferencia de proporciones muestrales es ptima.
Ejemplo 6.Una empresa que trabaja en ciudades grandes, considera que el nivel de aceptacin
de su producto en los hogares de la ciudad 1 es de un 35% y en la ciudad 2 de un
30%. Si se toma una muestra aleatoria de 400 hogares de cada ciudad. Cul es la
probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el
producto en ambas ciudades sea menor al 8%? Interpretar el resultado.
Solucin.P1 = 0.35 = proporcin de hogares que prefiere el producto en la ciudad 1.
Q1 = 1 P1 = 0.65 = proporcin de hogares que no prefiere el producto en la ciudad
1.
P2 = 0.30 = proporcin de hogares que prefiere el producto en la ciudad 2.
Q2 = 1 P2 = 0.70 = proporcin de hogares que no prefiere el producto en la ciudad
2.
n1 = n2 = 400 hogares (tamao de la muestra en ambas ciudades)
Considerando que ambas ciudades son grandes y que las correspondientes fracciones
de muestreo son menores al 5% (f = n / N < 0.05) se tiene que:
p1 p2 ~ N(P1 P2 , p21 p2 )
Con media: p1 p 2 P1 P2 = 0.35 0.30 = 0.05

Y varianza:

p2 p =
1

(0.35)(0.65) (0.35)(0.65)
P1Q1
PQ

+ 2 2 =
= 0.0011 .
400
400
n1
n2

Luego:
p1 p2 ~ N(0.05 ; 0.0011) y Z

p1 p2 ( P1 P2 )

p p
1

50

p1 p2 0.05
~ N(0 , 1)
0.0331

Se pide calcular:
P (p1 p2 0.08 ) = P(-0.08 p1 p2 0.08) =

0.08 0.05 p1 p2 0.05 0.08 0.05


= P

=
0.0331
0.0331
0.0331
= P(-3.93 Z 0.91) = (0.91) - (-3.93) =
= 0.81859 0.00004 = 0.81855

Rpta.

Interpretacin.- en el 81.86% de las comparaciones, para muestras de 400 hogares


de cada ciudad, las diferencias de proporciones muestrales de hogares que
prefieren el producto en ambas ciudades ser menor al 8%.

51

2.7 EJERCICIOS RESUELTOS


1. Si se toma una muestra aleatoria de tamao n, de una poblacin X con
distribucin Bernoulli, con parmetro p, hallar la funcin de probabilidad conjunta
(o de verosimilitud) para dicha muestra.
Solucin
Si la variable aleatoria. X ~ Bernoulli (p), entonces cada Xi ~ Bernoulli (p) y su
funcin de probabilidad es: f X ( xi ) p xi q1 xi , i 1, 2,...., n ; xi = 0 y 1.
Luego la funcin de probabilidad conjunta o de verosimilitud ser:

f ( x1, x2 ,...., xn ) f X ( x1 ) f X ( x2 ).... f X ( xn ) p x1 q x1 p x2 q x2 .... p xn q xn


n

xi

= p i1

xi
i 1

, xi = 0 y 1; i = 1, 2, .... , n . Rpta.

2. Si se toma una muestra aleatoria de tamao m, de una poblacin X con


distribucin binomial, con parmetros n y p, hallar la funcin de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
Solucin
Como la variable aleatoria X ~ B(n, p), entonces cada Xi ~ B(n, p) y su funcin
de probabilidad es: f X ( xi ) n C x p xi q n xi , i 1, 2,...., m ; xi = 0, 1, 2, 3, .... , n
i

Luego la funcin de probabilidad conjunta o de verosimilitud ser:

f ( x1, x2 ,...., xn ) f X ( x1 ) f X ( x2 ).... f X ( xn )


= n Cx1 p x1 q n x1 n Cx2 p x2 q n x2 .... n Cxm p xm q n xm
m

xi m xi
= n Cxi p i1 q i1 , xi = 0, 1, 2,....,n; i = 1, 2, ..., m .
i 1

Rpta.
3. Si se toma una muestra aleatoria de tamao n, de una poblacin X con
distribucin de Pareto, con parmetro B, hallar la funcin de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
52

Solucin
Si la variable aleatoria. X ~ Pareto (B), entonces cada Xi ~ Pareto (B) y su funcin de
probabilidad es: f X ( xi )

BX 0B
, X i X 0 , i 1, 2,...., n . Donde:
X iB 1

B = Coeficiente de Pareto > 0.


Xo = Ingreso mnimo.
Luego la funcin de probabilidad conjunta o de verosimilitud ser:

BX 0B
f ( x1, x2 ,...., xn ) f X ( x1 ) f X ( x2 ).... f X ( xn ) X B 1
1

BX 0B
BX 0B
B 1 .... B 1
X1
X1

B n X nB
n 0 ; X i X 0 , i 1, 2,...., n
X B 1
,
i

i 1

Rpta.

4. Si se toma una muestra aleatoria de tamao n, de una poblacin X con distribucin


log-normal, con parmetros y 2, hallar la funcin de probabilidad conjunta (o de
verosimilitud) para dicha muestra.
Solucin
Como la variable aleatoria X ~ LN ( , 2 ), entonces cada Xi ~ LN ( , 2 ) y su

f X ( xi )

funcin de probabilidad esta dada por:

1
xi 2

e (ln xi )

/ 2 2

; xi 0, i =

1, 2, ...., n.
Luego la funcin de densidad conjunta o de verosimilitud ser:

f ( x1, x2 ,...., xn ) f X ( x1 ) f X ( x2 ).... f X ( xn )


=

2
2
2
2
2
2
1
1
1
e (ln x1 ) / 2
e (ln x2 ) / 2 ....
e (ln xn ) / 2 =

2
2
2
x1 2
x2 2

xn 2

(ln xi )
1 1 2
i 1
= n
e
2 2
x

i 1

/ 2 2

; xi 0, i = 1, 2, 3, .... , n. Rpta.

53

5. Las botellas de aceite para motor de carros tienen un contenido medio de 2.0 litros
y una desviacin estndar de 0.12 litros. Si se toma una muestra aleatoria de 36
botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 1.96 y 2.03 litros.
b) Dentro de qu lmites simtricos caer el 95 % de las medias muestrales
alrededor de la media poblacional?
Solucin
Los datos del problema son: = 2.0 lts., = 0.12 lts. y n = 36 botellas.

X2 Var( X )

2
n

= (0.12)2 / 36 = 0.0004

X 0.02 lts.

Luego: X N ( , X2 ) = N(2.00, 0.0004) y Z

( X 2.00)
N (0,1) . Nos piden:
0.02

1.96 2.00 X 2.00 2.03 2.00

a) P(1.96 X 2.03) = P
= P(-2.0 Z
0.02
0.02
0.02
1.5)
= (1.5) - (-2.0) =
= 0.93319 0.02275 = 0.91044 Rpta.
Distribucin contenido medio de aceite
Normal, Media=2, Desv.Est.=0.02 lts.

20

Densidad

15

0.9104

10

1.96

2.00
2.03
X = media muestral

Resultado grfico en Minitab

54

Interpretacin.- en el 91.04% de las ( en 9104 de cada 10000) muestras de 36


botellas de aceite para motor de carro de dos litros, el contenido medio est entre
1.96 y 2.03 litros.
b) Sean 2.00 E y 2.00 + E los lmites simtricos alrededor de la media = 2.0 lts.,
dentro de los cuales estar el 95 % de las X . Entonces:
0.95 = P(2.00 E X 2.00 + E) = P(

E
E
Z
)
0.02
0.02

E E
E
E
=

2
1
0.975
0.02 0.02
0.02
0.02
E
Z 0.975 = 1.96 E = 1.96 x 0.02 = 0.039 lts. Luego los lmites sern:
0.02
2.00 E = 2.00 0.039 = 1.961 lts.

2.00 + 0.039 = 2.039 lts. Es decir:

0.95 = P(1.961 X 2.039) Rpta.


Interpretacin.- en el 95% de las ( en 9500 de cada 10000) muestras de 36
botellas de aceite para motor de carro de dos litros, el contenido medio est entre
1.961 y 2.039 lts. alrededor de = 2.0 lts.
6. Una estacin de servicio de una ciudad grande ha encontrado que sus ventas
semanales de petrleo tienen un promedio de 15 galones por cliente con una
desviacin estndar de 2.8. Para una muestra aleatoria de 49 clientes, calcule e
interprete:
a) La probabilidad de que la compra promedio semanal de petrleo sea menor de
14 galones;
b) Dentro de qu lmites simtricos caer el 99% de las medias muestrales
alrededor de la media poblacional?
Solucin
Los datos del problema son: = 15 glns., = 2.8 glns. y n = 49 clientes.

X2 Var( X )

2
n

= (2.8)2 / 49 = 0.16 X 0.4 glns.


55

Entonces: X N ( , X2 ) = N(15, 0.16) y Z

( X 15)
N(0, 1). Nos piden:
0.4

X 15 14 15

a) P( X < 14) = P
= P(Z < -2.5) = (-2.5) = 0.00621 Rpta.
0.4
0.4
Interpretacin.- en el 0.621% de las ( en 62 de cada 10000) muestras de 49
clientes de petrleo, la compra media es menor a 14 galones.
b) Sean 15 E y 15 + E los lmites simtricos alrededor de la media = 15
glns., dentro de los cuales caer el 99 % de las X . Entonces:
0.99 = P(15 E X 15 + E) = P(

E
E
Z
)
0.4
0.4

E E
E
E
=

2
1
0.995
0.4 0.4
0.4
0.4
E
Z 0.995 = 2.575 E = 2.575 x 0.4 = 1.03 glns. Luego los lmites sern:
0.4
15 E = 15 1.03 = 13.97 glns.

15 + 1.03 = 16.03 glns. Es decir:

0.99 = P(13.97 X 16.03)

Rpta.

Distribucin compra media de petrleo


Normal, Media=15, Desv.Est.=0.4
0.99

1.0

Densidad

0.8

0.6

0.4

0.2

0.0

13.97

15
X = media muestral

16.03

Resultado grfico en Minitab

56

Interpretacin.- en el 99% de las ( en 9900 de cada 10000) muestras de 49


clientes de petrleo, la venta media se encuentra entre 13.97 y 16.03 glns.
alrededor de = 15 glns.
7.

La compaa Yapatera vende bolsas de azcar con un contenido medio de 5


kilos y una desviacin estndar de 0.2 kilos. Si se toma muestras al azar de 36
bolsas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra supere los 5.1 kilos.
b) Dentro de que lmites simtricos alrededor de la media poblacional caer el
90% de los pesos medios muestrales?
Solucin
Los datos del problema son: = 5 Kg., = 0.2 Kg. y n = 36 bolsas.

X2 Var( X )

2
n

= (0.2)2 / 36 = 0.0011 X 0.033 Kg.

Entonces: X N ( , X2 ) = N(5, 0.0011) y Z

( X 5)
N(0, 1). Se pide:
0.033

X 5 5.1 5

a) P( X > 5.1) = P
= P(Z > 3.03) = 1 - (3.03) =
0.033 0.033
= 1 - 0.99878 = 0.00122 Rpta.
Interpretacin.- en el 0.12% de las ( en 12 de cada 10000) muestras de 36 bolsas
de azcar, el peso medio supera los 5.1 kilos.
b) Sean 5 E y 5 + E los lmites simtricos alrededor de la media = 5 Kg.,
dentro de los cuales caer el 90 % de las X . Entonces:
0.90 = P(5 E X 5 + E) = P(

E
E
Z
)
0.033
0.033

E E
E
E
=

2
1
0.95
0.033 0.033
0.033
0.033
E
Z0.95 = 1.645 E = 1.645 x 0.033 = 0.054 Kg. Luego los lmites sern:
0.033

57

5 E = 5 0.054 = 4.946 Kg.

5 + 0.054 = 5.054 Kg. Es decir:

0.90 = P(4.946 X 5.054)

Rpta.

Interpretacin.- en el 90% de las ( en 9000 de cada 10000) muestras de 36


bolsas de azcar, el contenido medio se encuentra entre 4.946 y 5.054 Kg.
alrededor de = 5 Kg.
8.

En Lima el precio promedio al consumidor del kilo de arroz es = S/. 3.20 con
una desviacin estndar = S/. 0.25. Si se selecciona una muestra aleatoria de 100
consumidores de arroz, calcule e interprete:
a) La probabilidad que el precio medio muestral del arroz sea mayor a S/. 3.25 el
kilo.
b) Dentro de que lmites simtricos caer el 95% de los precios medios
muestrales alrededor de la media poblacional?
Solucin
Los datos del problema son: = S/. 3.20, = S/. 0.25. y n = 100 consumidores.

X2 Var( X )

2
n

= (0.25)2 / 100 = 0.000625 X S/. 0.025

Entonces: X N ( , X2 ) = N(3.20, 0.000625) y Z

( X 3.20)
N(0, 1). Se
0.025

pide:

X 3.20 3.25 3.20

a) P( X > 3.25) = P
= P(Z > 2.0) = 1 - (2.00) =
0.025
0.025
= 1 - 0.97725 = 0.02275 Rpta.
Interpretacin.- en el 2.28% de las ( en 228 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo es mayor a S/. 3.25.
b) Sean 3.20 E y 3.20 + E los lmites simtricos alrededor de la media = S/.
3.20, dentro de los cuales caer el 95 % de las X . Entonces:
0.95 = P(3.20 E X 3.20 + E) = P(

58

E
E
Z
)
0.025
0.025

E E
E
E
=

2
1
0.975
0.025 0.025
0.025
0.025
E
Z 0.975 = 1.96 E = 1.96 x 0.025 = S/. 0.05. Luego los lmites sern:
0.025
3.20 E = 3.20 0.05 = S/. 3.15

3.20 + 0.05 = S/. 3.25. Es decir:

0.95 = P(3.15 X 3.25) Rpta.


Interpretacin.- en el 95% de las ( en 9500 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo se encuentra entre 3.15 y 3.25
nuevos soles alrededor de = S/. 3.20.
9.

La compaa La negrita vende latas de caf con un contenido medio de 195


gramos y una desviacin estndar de 6 gramos. Si se toman muestras al azar de 25
latas. Calcule e interprete:
a)

La probabilidad de que el peso medio de la muestra sea menor de 192


gramos.

b) Dentro de que lmites simtricos alrededor de la media poblacional caer el


99.73% de los pesos medios muestrales?
Solucin
Los datos del problema son: = 195 gr., = 6 gr. y n = 25 latas.

Var( X )
2
X

2
n

= (6)2 / 25 = 1.44 X 1.2 gr.

Entonces: X N ( , X2 ) = N(195, 1.44) y Z

( X 195)
N(0, 1). Se pide:
1.2

X 195 192 195

a) P( X < 192) = P
= P(Z < -2.5) = (-2.50) = 0.00621
1.2
1.2
Interpretacin.- en el 0.62% de las ( en 62 de cada 10000) muestras de 25
latas de caf, el peso medio es menor 192 gr.
b) Sean 195 E y 195 + E los lmites simtricos alrededor de la media = 195
gr, dentro de los cuales caer el 99.73 % de las X . Entonces:

59

0.9973 = P(195 E X 195 + E) = P(

E
E
Z )
1.2
1.2

E E
E
E
=

2 1 0.99865
1.2 1.2
1.2
1.2
E
Z 0.99865 = 3.0 E = 3 x 1.2 = 3.6 gr. Luego los lmites sern:
1.2
195 E = 3.6 0.05 = 191.4 gr.

195 + 3.6 = 198.6 gr. Es decir:

0.9973 = P(191.4 X 198.6) Rpta.


Interpretacin.- en el 99.73% de las ( en 9973 de cada 10000) muestras de 25
latas de caf, el peso medio se encuentra entre 191.4 y 198.6 gr. alrededor de =
195 gr.
10. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. 250, con
una desviacin tpica de S/. 60; mientras que en la ciudad B dicho gasto medio
mensual es de S/. 235, con una desviacin tpica de S/. 50. En una auditora para
determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una
muestra al azar de 300 hogares de cada ciudad. Calcule e interprete la
probabilidad de que:
a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad
A.
b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 ms
que el gasto medio mensual en arbitrios en la ciudad B.
Solucin
Los datos del problema son: A = S/. 250, A = S/. 35 y nA = 300 hogares.
B = S/. 235, A = S/. 20 y nB = 300 hogares. Luego:

X2 Var ( X A )
A

A2
nA

2 (50)2
(60)2
= 12.00 y X2 B Var ( X B ) B
= 8.33
300
nB
300

60

A XB

AXB

A B = 250 - 235 = 15, X2 A X B x2A x2B = 12 + 8.33 = 20.33

= 4.51. Luego:

X A X B N ( A B , X2 A X B ) = N(15, 20.33) y Z

( X A X B 15)
N(0, 1).
4.51

Se pide:
a) P( X B

> XA)

P( X A

<

XB )

P( X A

XB

<

0)

( X X B 15) 0 15
P A

=
4.51
4.51

= P(Z < -3.33) = (-3.33) = 0.00043 Rpta.


Interpretacin.- en el 0.04% de las ( en 4 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad B ser
mayor que en la ciudad A.

X X B 15 25 15

b) P X A X B 25 = 1 - P X A X B 25 = 1 - P A

4.51
4.51

=
= 1 P(Z < 2.22) = 1 - (2.22) =
= 1 0.98679 = 0.01321 Rpta.
Interpretacin.- en el 1.32% de las ( en 132 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad A
ser al menos S/. 25 ms que el gasto medio mensual en arbitrios en la ciudad
B.
11. Dos fbricas A y B productoras de bombillas afirman que el promedio de
duracin de ellas es de 1980 y 1950 horas, respectivamente, con desviaciones
tpicas de 90 y 100 horas. Si se seleccionan 100 bombillas al azar de cada fbrica,
calcule e interprete la probabilidad de que:
a) Las bombillas B tengan una duracin media menor de 1930 horas.
b) Las bombillas B tengan una duracin media mayor que la duracin media de
las bombillas A.
61

Solucin
Los datos del problema son: A = 1980 horas, A = 90 horas y nA = 100 bombillas.
B = 1950 horas, B = 100 horas y nB = 100 bombillas. Luego:

X2 Var ( X A )
A

A2
nA

= (90)2 / 100 = 81 y X2 B Var ( X B )

B2
nB

= (100)2 / 100 =

100
a) X B N ( B , X2 B ) = N(1950, 81) y Z

( X B 1950)
N(0, 1). Se pide:
9

X 1950 1930 1950

P( X B < 1930) = P B
= P(Z < -2.22) =
9
9

= (-2.22) = 0.01321 Rpta.


Interpretacin.- en el 1.32% de las ( en 132 de cada 10000) muestras de 100
bombillas B, la duracin media menor de 1930 horas.
b) X A X B A B = 1980 - 1950 = 30, X2 A X B x2A x2B = 81 + 100 = 181 y

AXB

= 13.45. Luego:

X A X B N ( A B , X2 A X B ) = N(30, 181) y Z

( X A X B 30)
N(0,
13.45

1). Se pide:

( X X B 30) 0 30

P( X B > X A ) = P( X A < X B ) = P( X A - X B < 0) = P A

13.45
13.45

=
= P(Z < -2.23) = (-2.23) = 0.01287 Rpta.
Interpretacin.- en el 1.29% de las ( en 129 de cada 10000) muestras de 100
bombillas A y 100 bombillas B, la duracin media de las bombillas B es mayor
que la duracin media de las bombillas A.
12. Un proceso automtico es realizado por dos mquinas que empaquetan un
producto en bolsas de 500 gramos. La mquina 1 llena con una desviacin
estndar de 15 gramos y la mquina 2 de 20 gramos. Si se seleccionan muestras
de 100 bolsas de cada mquina, calcule e interprete la probabilidad de que:
a) El llenado medio de la mquina 1 sea menor que el llenado medio de la mq.
2.
62

b) Las medias muestrales difieran en menos de 2 gramos.


Solucin
Los datos del problema son: 1 = 500 gr., 1 = 15 gr. y n1 = 100 bolsas.
2 = 500 gr., 2 = 20 gr. y n2 = 100 bolsas. Luego:

2
X1

Var ( X 1 )

12
n1

= (15) / 100 = 2.25 y


2

X X 1 2 = 500 - 500 = 0,
1

AXB

2
X2

Var ( X 2 )

22
n2

= (20)2 / 100 = 4.

X2 X x2 x2 = 2.25 + 4 = 6.25
1

= 2.5. Luego:

X1 X 2 N ( 1 2 , X2 1 X 2 ) = N(0, 6.25) y Z

( X1 X 2 0)
N(0, 1). Se pide:
2.5

( X X 2 0) 0 0

a) P( X 1 < X 2 ) = P( X 1 - X 2 < 0) = P 1
=
2.5
2.5

= P(Z < 0) = (0) = 0.5000 Rpta.


Interpretacin.- en el 50% de las ( en 5000 de cada 10000) muestras de 100
bolsas de la mquina 1 y 100 bolsas de la mquina 2, el llenado medio de la
mquina 1 es menor que el llenado medio de la mquina 2.

2 0 X 1 X 2 0 2 0

b) P X1 X 2 2 = P 2 X1 X 2 2 = P
=
2.5
2.5
2.5

= P(-0.80 < Z < 0.80) = 2 (0.80) - 1 =


= 2 (0.78814) 1 = 0.57628 Rpta.
Interpretacin.- en el 57.63% de las ( en 5763 de cada 10000) muestras de
100 bolsas de cada mquina, las medias muestrales difieren en 2 gramos.
13. Segn un estudio del Ministerio de Salud,2 en el Per los varones de 9 aos de
edad tienen un peso promedio de 26.8 Kg. y una desviacin estndar de 2.5 Kg.,
mientras que las mujeres tienen un peso promedio de 26.7 Kg. y una desviacin
estndar de 3.8 Kg. Si se toman independientemente dos muestras al azar sin
reposicin, de n = 300 nios y m = 300 nias. Calcule e interprete la probabilidad
de que:

Ministerio de Salud. Informe del estado nutricional en el Per. Componente nutricional ENAHO-CENAN Julio 2009 Junio 2010,
CENAN INEI,.. Lima, Per, 2011.

63

a) El peso promedio de los nios sea menor que el peso promedio de las nias.
b) El peso promedio de los nios sea al menos 0.6 kg. ms que el peso promedio
de las nias.
Solucin
Los datos del problema son: v = 26.8 Kg., v = 2.5 Kg. y nv = 300 nios.
m = 26.7 Kg., m = 3.8 Kg. y nm = 300 nias. Luego:

X2 Var ( X v )

v2

2
Xm

Var ( X m )

= (2.5)2 / 300 = 0.02083 y

nv

m2
nm

= (3.8)2 / 300 = 0.04813.

X X v m = 26.8 26.7 = 0.1,


v

v Xm

X2

v Xm

x2v x2m = 0.06896

= 0.2626. Luego:

X v X m N ( v m , X2 v X m ) = N(0.1, 0.2626) y Z

( X v X m 0.1)
N(0,
0.2626

1). Se pide:

( X X m 0.1) 0 0.1

a) P( X v < X m ) = P( X v - X m < 0) = P v
=
0.2626
0.2626

= P(Z < -0.38) = (-0.38) = 0.35197 Rpta.


Interpretacin.- en el 35.2% de las ( en 3520 de cada 10000) muestras de 300
nios y 300 nias peruanos de 9 aos de edad, el peso promedio de los nios
es menor que el peso promedio de las nias.
b) P X v X m 0.6

P X v X m 0.6

X X m 0.1 0.6 0.1


P v

=
0.2626
0.2626
= 1 P(Z < 1.90) = 1 - (1.90) =
= 1 0.97128 = 0.02872 Rpta.
Interpretacin.- en el 2.87% de las ( en 287 de cada 10000) muestras de 300
nios y 300 nias peruanos de 9 aos de edad, el peso promedio de los nios
ser al menos 0.6 kg. ms que el peso promedio de las nias.
14. Una empresa azucarera embolsa azcar con un contenido medio de 50 kg. y
desviacin estndar de 0.5 kg. Para el control de calidad se toman muestras
64

aleatorias de 25 bolsas de la produccin diurna y 50 de la produccin nocturna.


Calcule e interprete la probabilidad de que la produccin media de las bolsas de
ambos turnos difieran en menos de 0.2 kg.
Solucin
Los datos del problema son: 1 = 50 Kg., 1 = 0.5 Kg. y n1 = 25 bolsas.
2 = 50 Kg., 2 = 0.5 Kg. y n2 = 50 bolsas. Luego:

X2 Var ( X 1 )
1

12
n1

= (0.5) / 25 = 0.01 y X2 Var ( X 2 )


2

22
n2

= (0.5)2 / 50 =

0.005

X X 1 2 = 50 - 50 = 0, X2 X x2 x2 = 0.010 + 0.005 = 0.015


1

AXB

= 0.1225. Luego:

X1 X 2 N ( 1 2 , X2 1 X 2 ) = N(0, 0.015) y Z
pide:

( X1 X 2 0)
N(0, 1). Se
0.1225

P X1 X 2 0.2 = P 0.2 X1 X 2 0.2 =


0.2 0 X1 X 2 0 0.2 0

= P
=
0.1225
0.1225
0.1225
= P(-1.63 < Z < 1.63) = 2 (1.63) - 1 =
= 2 (0.94845) 1 = 0.8969 Rpta.
Interpretacin.- en el 89.69% de las ( en 8969 de cada 10000) muestras de 25
bolsas de la produccin diurna y 50 de la produccin nocturna, la produccin
media de las bolsas de ambos turnos difieren en menos de 0.2 kg.
15. En las tiendas Metro el 70 % de las compras es en alimentos y bebidas. Si se
seleccionan muestras aleatorias de 200 compras. Calcule e interprete:
a) La probabilidad de que el porcentaje de compras en alimentos y bebidas sea
mayor al 80%.
b) entre que lmites simtricos alrededor del verdadero porcentaje de compras
en alimentos y bebidas caer el 99% de los porcentajes muestrales?
Solucin
Los datos del problema son: P = 0.70 = proporcin de las compras en alimentos y
bebidas en las tiendas Metro, Q = 0.30,

n = 200 compras = tamao de la muestra.


65

Asumiendo un nmero muy grande de compradores, entonces, la proporcin muestral:


n

p
Z

X
i 1

X
PQ
N P,
= N(0.70; 0.00105) y
n
n

pP
p 0.70
p 0.70
~ N(0, 1). Se pide calcular:

PQ
0.00105 0.0324
n

p 0.70 0.80 0.70


a) P (p > 0.80 ) = 1 - P (p 0.80 ) = 1 - P

0.0324
0.0324
= 1 - P(Z 3.09) = 1 - (3.09) = 1- 0.9990 = 0.0010 Rpta.
Interpretacin.- en el 0.10 % de las ( en 10 de cada 10000) muestras de 200
compras en las tiendas Metro, el porcentaje de compras en alimentos y bebidas es
mayor al 80%.
b) Sean 0.70 E y 0.70 + E los lmites simtricos alrededor de la proporcin
verdadera P = 0.70, dentro de los cuales estar el 99 % de las p (proporciones
muestrales). Entonces:
0.99 = P(0.70 E p 0.70 + E) = P(

E
E
Z
)=
0.0324
0.0324

E E
E
E
=

2
1
0.995
0.0324 0.0324
0.0324
0.0324
E
Z0.995 2.575 E 2.575(0.0324) 0.083 . Luego los lmites sern:
0.0324
0.70 E = 0.70 0.083 = 0.617

0.70 + 0.083 = 0.783. Es decir:

0.99 = P(0.617 p 0.783)

Rpta.

Interpretacin.- en el 99% de las ( en 9900 de cada 10000) muestras de 200


compras en las tiendas Metro, el porcentaje de compras en alimentos y
bebidas se encuentra entre 61.7% y 78.3% alrededor de la proporcin
verdadera P = 0.70.
16. El 40% de los clientes de las tiendas Saga son varones. Si se toma una muestra
aleatoria de 200 clientes. Calcule e interprete:
a) La probabilidad que el porcentaje de clientes varones est entre 36% y 45%.

66

b) dentro de que lmites simtricos del porcentaje de mujeres en la poblacin


caer el 95% de los porcentajes de la muestra?
Solucin
Los datos del problema son: P = 0.40 = proporcin de clientes varones en las tiendas
Saga, Q = 0.60 y

n = 500 clientes.

Asumiendo un nmero muy grande de clientes en las tiendas Saga, la distribucin


de la proporcin muestral de hombres p es:
n

p
Z

X
i 1

X
PQ
N P,
= N(0.40; 0.0012) y
n
n

p P p 0.40 p 0.40
~ N(0, 1). Se pide calcular:

PQ
0.0012 0.0346
n

0.36 0.40 p 0.40 0.45 0.40

a) P ( 0.36 p 0.45 ) = P
=
0.0346
0.0346
0.0346
= P(-1.16 Z 1.45) = (1.45) - (-1.16) =
= 0.92647 0.12302 = 0.80345 Rpta.
Interpretacin.- en el 80.35 % de las ( en 8035 de cada 10000) muestras de 200
clientes de las tiendas Saga, el porcentaje de clientes varones est entre 36% y
45%.
b) La distribucin de la proporcin muestral de mujeres q es:
n

q
Z

X
i 1

X
PQ
N Q,
= N(0.60; 0.0012) y
n
n

q 0.60
~ N(0, 1). Se pide calcular lmites simtricos.
0.0346

Sean 0.60 E y 0.60 + E los lmites simtricos alrededor de la proporcin


verdadera Q = 0.60, dentro de los cuales estar el 95 % de las proporciones
muestrales de mujeres q. Entonces:
0.95 = P(0.60 E q 0.60 + E) = P(

E
E
Z
)=
0.0346
0.0346

E E
E
E
=

2
1
0.975
0.0346 0.0346
0.0346
0.0346
67

E
Z0.975 1.96 E 1.96(0.0346) 0.068 . Luego los lmites sern:
0.0346
0.60 E = 0.60 0.068 = 0.532

0.60 + 0.068 = 0.668. Es decir:

0.95 = P(0.532 q 0.668)

Rpta.

Interpretacin.- en el 95% de las ( en 9500 de cada 10000) muestras de 200


clientes de las tiendas Saga, el porcentaje de clientes mujeres est entre 53.2% y
66.8% alrededor de la proporcin verdadera Q = 0.60.
17. En Lima el 60% de los hogares consume mantequilla. Si se toma una muestra
aleatoria de 1000 hogares. Calcule e interprete:
a)

La probabilidad que menos del 57% de los hogares consuma mantequilla.

b) Dentro de que lmites simtricos, alrededor de la verdadera proporcin de


hogares que consume mantequilla, estar el 99% de las proporciones
muestrales.
Solucin
Los datos del problema son: P = 0.60 = proporcin de hogares que consume
mantequilla, Q = 0.40 y

n = 1000 hogares.

Asumiendo un nmero muy grande de hogares en Lima, la distribucin de la


proporcin muestral de hogares que consume mantequilla p es:
n

p
Z

X
i 1

X
PQ
N P,
= N(0.60; 0.00024) y
n
n

p P p 0.60 p 0.60

~ N(0, 1). Se pide calcular:


PQ
0.0155 0.0155
n

p 0.60 0.57 0.60

a) P (p < 0.57 ) = P
=
0.0155
0.0155
= P(Z < - 1.94) = (-1.94) = 0.02619 Rpta.
Interpretacin.- en el 2.62 % de las ( en 262 de cada 10000) muestras de 1000
hogares, menos del 57% de los hogares consume mantequilla.
b) Sean 0.60 E y 0.60 + E los lmites simtricos alrededor de la proporcin
verdadera P = 0.60, dentro de los cuales cae el 99 % de las proporciones
muestrales de hogares que consume mantequilla p. Entonces:
68

0.99 = P(0.60 E p 0.60 + E) = P(

E
E
Z
)=
0.0155
0.0155

E E
E
E
=

2
1
0.995
0.0155 0.0155
0.0155
0.0155
E
Z 0.995 2.575 E 2.575(0.0155) 0.04 . Luego los lmites sern:
0.0155
0.60 E = 0.60 0.04 = 0.56

0.60 + 0.04 = 0.64. Es decir:

0.99 = P(0.56 p 0.64)

Rpta.

Interpretacin.- en el 99% de las ( en 9900 de cada 10000) muestras de 1000


hogares de Lima, el porcentaje de hogares que consume mantequilla est entre
56% y 4% alrededor de la proporcin verdadera P = 0.60.
18. Dos empresas producen cierto artculo, la empresa A produce por trmino medio
20% de defectuosos, mientras que la empresa B produce un 30% de defectuosos.
Si se extrae una muestra aleatoria de 300 y 150 artculos respectivamente, calcule
e interprete la probabilidad de que el porcentaje de artculos defectuosos
producidos por la empresa B difiere de los defectuosos producidos por la empresa
A en 2% o menos.
Solucin
Los datos del problema son:
PA = 0.20 = proporcin de artculos defectuosos producidos por la empresa A.
QA = 0.80 = proporcin de artculos buenos producidos por la empresa A.
PB = 0.30 = proporcin de artculos defectuosos producidos por la empresa B.
QB = 0.70 = proporcin de artculos buenos producidos por la empresa B.
nA = 300 y nB = 150 artculos.
Considerando que ambas empresas producen gran nmero de artculos y que las
correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene
que:
pB - pA ~ N(PB PA ; p2B pA )
Con media: pA pB = PB PA = 0.30 0.20 = 0.10
Y varianza: p2B pA =

PAQA PB QB (0.2)(0.8) (0.3)(0.7)

+
=
= 0.0019. Luego:
300
150
nA
nB
69

pB pA ~ N(0.10 ; 0.0019) y

pB pA ( PB PA )

B pA

pB pA 0.10
~ N(0 ,
0.044

1)
Se pide calcular:

p pA 0.10 0.02 0.10


P (pB pA 0.02) = P B
=

0.044
0.044

= PZ -1.82) = (-1.82) = 0.03438 Rpta.


Interpretacin.- en el 3.44% de las ( en 344 de cada 10000) comparaciones, para
muestras de 300 artculos de la empresa A y 150 de la empresa B, el porcentaje de
artculos defectuosos producidos por la empresa B difiere de los defectuosos
producidos por la empresa A en 2% o menos.
19. En una ciudad se sabe que la preferencia de las mujeres por un diario es del 20% y
para los hombres de un 25%. Si se toma una muestra aleatoria de 200 mujeres y
100 hombres, calcule e interprete la probabilidad de que el porcentaje de mujeres
que prefiere el diario difiera del porcentaje de hombres que lo prefiere en 8% o
ms.
Solucin
Los datos del problema son:
PM = 0.20 = proporcin de mujeres que prefiere el diario.
QM = 0.80 = proporcin de mujeres que no prefiere el diario.
PH = 0.25 = proporcin de hombres que prefiere el diario.
QH = 0.75 = proporcin de hombres que prefiere el diario.
nM = 200 mujeres y nH = 100 hombres.
Considerando que el nmero de mujeres y hombres en la ciudad es grande y que las
correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene
que:
PM pH ~ N(PM PH ; p2M pH )
Con media: pA pB = PM PH = 0.20 0.25 = -0.05
Y varianza: p2M pH =

PM QM PH QH (0.2)(0.8) (0.25)(0.75)

+
=
= 0.0027. Luego:
200
100
nM
nH
70

pM pH ~ N(-0.05 ; 0.0027) y Z

pM pH ( PM PH )

pH

pM pH 0.05
~ N(0 ,
0.052

1)
Se pide calcular:

p pH 0.05 0.08 0.05


P (pM pH 0.08) = P M
= P(Z 2.50) =

0.052
0.052

= 1 - (2.50) = 1 - 0.99379 = 0.00621 Rpta.


Interpretacin.- en el 0.62% de las ( en 62 de cada 10000) muestras de 200 mujeres y
100 hombres, el porcentaje de mujeres que prefiere el diario difiere del porcentaje de
hombres que lo prefiere en 8% o ms.
20. Considere que los niveles de preferencia de un determinado artculo en la ciudad
A es de un 30% de hogares y en la ciudad B de un 35%; si se seleccionan
muestras aleatorias de 250 hogares de la ciudad A y 150 hogares de la B, calcule e
interprete la probabilidad de que el % de hogares que prefiere el artculo en la
ciudad A difiere de los que lo prefieren en la ciudad B en 7% o ms.
Solucin
Los datos del problema son:
PA = 0.30 = proporcin de hogares que prefiere el artculo en la ciudad A.
QA = 0.70 = proporcin de hogares que no prefiere el artculo en la ciudad A.
PB = 0.35 = proporcin de hogares que prefiere el artculo en la ciudad B.
QB = 0.65 = proporcin de hogares que no prefiere el artculo en la ciudad B.
nA = 250 y nB = 150 hogares.
Considerando que en ambas ciudades hay un gran nmero de hogares y que las
correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene
que:
pA pB ~ N(PA PB ; p2A pB )
Con media: pA pB = PA PB = 0.30 0.35 = -0.05
Y varianza: p2A pB =

PAQA PB QB (0.3)(0.7) (0.35)(0.65)

+
=
= 0.0024. Luego:
250
150
nA
nB

71

pA pB ~ N(-0.05 ; 0.0024) y Z

pA pB ( PA PB )

A pB

p A pB 0.05
~ N(0 ,
0.049

1)
Se pide calcular:

p pB 0.05 0.07 0.05


P (pA pB 0.07) = P A
= P(Z 2.45) =

0.049
0.049

= 1 - (2.45) = 1 - 0.99286 = 0.00714 Rpta.


Interpretacin.- en el 0.71% de las ( en 71 de cada 10000) muestras de 250 hogares
de la ciudad A y 150 hogares de la ciudad B, el % de hogares que prefiere el artculo
en la ciudad A difiere de los que lo prefieren en la ciudad B en 7% o ms.

72

2.8 EJERCICIOS PRPUESTOS


1. Si se toma una muestra aleatoria de tamao n, de una poblacin X con
distribucin geomtrica, con parmetro p, hallar la funcin de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
2. Si se toma una muestra aleatoria de tamao n, de una poblacin X con
distribucin binomial negativa, con parmetros r y p, hallar la funcin de
probabilidad conjunta (o de verosimilitud) para dicha muestra.
3. Si se toma una muestra aleatoria de tamao n, de una poblacin X con
distribucin exponencial, con parmetro , hallar la funcin de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
4. Las botellas de la bebida Rica Kola familiar tienen un contenido medio de 2.5
litros y una desviacin estndar de 0.1 litros. Si se toma una muestra aleatoria de
36 botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 2.46 y 2.53 litros.
b) dentro de qu lmites simtricos caer el 99 % de las medias muestrales
alrededor de la media poblacional?
5. En Lima el precio promedio al consumidor del kilo de mango es = S/. 2.20 con
una desviacin estndar = S/. 0.20. Si se selecciona una muestra aleatoria de 100
consumidores de mango, calcule e interprete la probabilidad:
a) que el precio medio muestral sea mayor a S/. 2.25 el kilo.
b) Dentro de que lmites simtricos caer el 95% de las medias muestrales
alrededor de la media poblacional?
6. Las cajas con mango tienen un peso medio de 20 Kg. y una desviacin estndar de
0.75 Kg. Si se cargan 400 cajas al azar en un camin, calcule e interprete la
probabilidad de que:
a) El peso total de las cajas supere la capacidad mxima del camin que es de
8,040 Kg.
b) El peso medio de las cajas sea menor a 19.92 Kg.
c) Dentro de que lmites simtricos alrededor de la media poblacional caer el
95% de las medias muestrales?
73

7. En una gran ciudad el promedio de empleados para establecimientos pequeos es


de 10 y la desviacin estndar de 5 empleados. Para una muestra aleatoria de 36
establecimientos pequeos extrados sin reemplazo, calcule e interprete:
a) La probabilidad que el promedio muestral de empleados sea menor que 8.
b) Dentro de que lmites simtricos del promedio poblacional caer el 95% de
las medias muestrales de empleados por establecimientos pequeos?
8. Una empresa elctrica fabrica focos cuya duracin tiene distribucin normal con
media de 1500 horas y desviacin estndar de 50 horas. En una muestra aleatoria
de 16 focos, calcule e interprete la probabilidad que:
a) La duracin promedio de los focos menor de 1475 horas.
b) Dentro de que lmites simtricos de la duracin media poblacional caer el
95% de las duraciones medias muestrales?
9. Dos fbricas A y B que embolsan caf, afirman que el promedio en las bolsas es
de 495 y 490 gramos, respectivamente, con desviaciones tpicas de 5 y 6 gramos.
Si se seleccionan 36 bolsas al azar de cada fbrica, calcule e interprete la
probabilidad de que:
a) El contenido medio de las bolsas A sea mayor de 497 gramos.
b) El contenido medio de las bolsas A sea menor que el contenido medio de las
bolsas B.
10. Uno de los principales fabricantes de tv compra cables a dos compaas. Los
cables de la compaa A tienen una vida media de 7.2 aos con una desviacin
estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos
con una desviacin estndar de 0.7 aos. Si se toman m.a. de 34 cabless de A y 40
de B, calcule e interprete la probabilidad de que la vida media de los cables A sea
de al menos un ao ms que la vida media de los B.
11. En una empresa de gaseosas la produccin media de los varones es de 52 lts. Con
una desviacin estndar de 7 lts. y la produccin media de las mujeres es de 48 lts.
con una desviacin estndar de 5 lts. Si se toma una muestra aleatoria de 40
trabajadores hombres y 40 mujeres. Calcule e interprete la probabilidad que la
produccin media de los varones resulte menor que la produccin media de las
mujeres.
74

12. En una universidad la edad promedio de los alumnos del turno de la maana es de
22 aos con una desviacin estndar de 3 aos, mientras que los del turno de la
noche tienen una edad media de 28 aos con una desviacin estndar de 5 aos. Si
se toma una muestra aleatoria de 50 alumnos de cada turno, calcule e interprete la
probabilidad de que la edad promedio de los alumnos de la maana es superior a
la edad media de los de la noche.
13. El 60% de los ciudadanos esta de acuerdo con la gestin presidencial. Si se toma
una muestra aleatoria de 500 ciudadanos, calcule e interprete:
a) La probabilidad de que ms del 65% est de acuerdo con la gestin
presidencial.
b) Dentro de que lmites simtricos, alrededor de la verdadera proporcin de
ciudadanos esta de acuerdo con la gestin presidencial, esta el 95% de las
proporciones muestrales.
14. En Lima el 60% de los hogares usa gas como combustible para cocinar. Si se
toma una muestra aleatoria de 1000 hogares. Calcule e interprete:
a) La probabilidad que ms del 65% de los hogares use gas.
b) Dentro de que lmites simtricos, alrededor de la verdadera proporcin de
hogares que usa gas, estar el 99% de las proporciones muestrales.
15. En Lima el 30% de los hogares compra peridicos y/o revistas. Si se toma una
muestra aleatoria de 1000 hogares. Calcule e interprete:
a) La probabilidad de que ms del 34% de hogares compre peridicos y/o
revistas.
b) Dentro de que lmites simtricos alrededor de la proporcin verdadera caer
el 99.73% de las proporciones muestrales de hogares que compra peridicos
y/o revistas?
16. El 70% de empleados pblicos es casado. Si se toma una muestra aleatoria de 64
empleados, calcule e interprete:
a) La probabilidad de que ms del 85% est casado.
b) Dentro de que lmites simtricos, alrededor de la verdadera proporcin de
empleados pblicos casados, estar el 95% de las proporciones muestrales.

75

17. El 70 % de las compras con tarjeta de crdito en tiendas Ripley son superiores a
$200. Si se seleccionan muestras aleatorias de 100 compras; Calcule e interprete:
a) La probabilidad que las muestras tengan entre 65% y 80 % de compras
mayores que $200?
b) Entre que lmites simtricos del porcentaje de compras mayores de $200 en
la poblacin caer el 99% de los porcentajes muestrales?
18. Dos empresas producen equipos de sonido, la empresa A produce por trmino
medio 10% de defectuosos, mientras que la empresa B produce un 20%. Si se
extrae una muestra aleatoria de 400 y 200 unidades respectivamente, calcule e
interprete la probabilidad de que el porcentaje de equipos defectuosos producidos
por la empresa A difiere de los defectuosos producidos por la empresa B en 7% o
menos.
19. En un estudio pasado se determin que el porcentaje de hombres que est de
desacuerdo con la construccin de un gimnasio era del 12%, mientras que el
porcentaje de mujeres en desacuerdo era del 10%. Si se toma una muestra
aleatoria de 100 hombres y 100 mujeres, calcule e interprete la probabilidad de
que el porcentaje de hombres en desacuerdo sea al menos 3% mayor que el de las
mujeres.
20. En cierta ciudad se sabe que el 25% de los hombres y el 30% de las mujeres estn
familiarizados con un producto. Si se toma una muestra aleatoria de 200 hombres
y 200 mujeres, calcule e interprete la probabilidad de que el porcentaje de
hombres familiarizados con el producto sea mayor que el de mujeres.

76

Captulo 3. DISTRIBUCIONES ESPECIALES


El informar mal, utilizando material estadstico, podra llamarse
manipulacin estadstica, y resumindolo en una sola palabra (aunque
no sea muy buena), estadisticulacin
Darrell Huff
CONTENIDO
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8

Distribucin Chi-cuadrado.
Distribucin t de student.
Distribucin muestral de la media (n < 30).
Distribucin de la diferencia de medias muestrales con varianzas
desconocidas pero iguales.
Distribucin F de Snedecor
Distribucin de la razn de dos varianzas muestrales.
Ejercicios resueltos.
Ejercicios propuestos.

En este captulo, se presentan las distribuciones muestrales especiales, las mismas


que han sido desarrolladas fundamentalmente para muestras pequeas (menores de
30 observaciones).
Entre las principales distribuciones tenemos: la distribucin chi cuadrado de
Pearson, la distribucin t student de Gosset y la distribucin F de Snedecor. A
continuacin veremos sus principales caractersticas y propiedades de cada una de
ellas.
3.1 DISTRIBUCIN CHI-CUADRADO
Esta distribucin fue descubierta por Helmert el ao 1875 y redescubierta por Karl
Pearson el ao 1900.
Definicin.- Sean Z1, Z2, ..., Zr, variables aleatorias independientes, cada una
con distribucin normal estndar, Zi ~ N(0 , 1) . Entonces, la variable aleatoria

x Z12 Z22 ... Zr2


77

tiene una distribucin chi-cuadrado (o Ji-cuadrado) con r grados de libertad, si


su funcin de densidad de probabilidades est dada por:

f X 2 ( x) =

1
r
2
2
r
2

x 2 e x / 2

= 0

0<x<

en otros casos

Donde:

representa el gamma de un nmero, (n) X n 1e x dx , n > 0. Si n


0

1
es entero positivo (n) = (n 1)! . Adems, .
2

r = grados de libertad (g.l.) representa el nmero de v.a. independientes

que se suman o el nmero de variables que pueden variar libremente. En


regresin y econometra es el rango de una matriz (mximo nmero de
columnas linealmente independientes) asociado a formas cuadrticas delas
sumas de cuadrados.
Observacin: la distribucin chi cuadrado es un caso particular de la
distribucin de probabilidades Gamma con n = r / 2 y = 1 / 2.
Si X ~ Gamma con parmetros n > 0 y > 0, entonces su funcin de densidad
de probabilidades est dada por:

f ( x)

n
( n)

x n 1e x

= 0

,x>0

, en otros casos.

La esperanza y la varianza de la distribucin gamma son:


E(X) = n /

Var (X) = n / 2

Notacin: decir que la variable aleatoria X tiene distribucin chi-cuadrado con


r grados de libertad, la denotaremos como X ~ X r2 .
Media y Varianza:
La media y la varianza de la v. a. chi-cuadrado con r grados de libertad son:
78

= E(x) = r

= Var(x) = 2r

Es decir, la media es igual a los grados de libertad y la varianza es igual a dos


veces los grados de libertad. La fig. 1 muestra la forma de la funcin de
densidad de la variable aleatoria chi-cuadrado, para distintos grados de libertad.

Funcin de Distribucin Acumulativa de Probabilidades.Las probabilidades para v.a. chi-cuadrado, se calculan utilizando los valores de
la funcin de distribucin acumulativa menor o igual que, los que han sido
reproducidos en la Tabla 2 del Anexo, utilizando la hoja de clculo Excel.
As tenemos que, la probabilidad que la variable aleatoria X con distribucin

xr2 1 r 30 sea menor o igual a un valor constante x2 , representada por:

P X X 2 ,

P X x2

x2

0 < < 1, est dada por:

f X 2 x dx

x2

r
2
2
r
2

y representada en la figura 2.

79

x 2 e 2 dx

Note que P x x2 1
Puesto que existe una distribucin chi-cuadrado diferente para cada valor de r,
resulta imprctico proporcionar tablas de reas completas. En lugar de esto, la
tabla 2 de la distribucin acumulativa chi-cuadrado, presenta un resumen de la
informacin ms esencial acerca de la distribucin. En el encabezado de la
columna de la izquierda, dice grados de libertad (G.L.) y cada fila de esta tabla
corresponde a una distribucin chi-cuadrado particular, con sus probabilidades
(p) en la parte superior de esta tabla.
En la hoja de clculo Excel se determina las probabilidades y los valores de
chi-cuadrado as:
a) DISTR.CHI: devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribucin chi cuadrado de una sola cola. La distribucin
chi cuadrado est asociada con la prueba chi cuadrado.
Sintaxis: DISTR.CHI(x;grados_de_libertad)
X es el valor al que desea evaluar la distribucin.
Grados_de_libertad es el nmero de grados de libertad = r.
Observaciones :

Si uno de los argumentos no es numrico, DISTR.CHI devuelve el


valor de error #VALOR!.

Si el argumento x es negativo, DISTR.CHI devuelve el valor de error


#NUM!.

Si el argumento grados_de_libertad no es un entero, se trunca.

Si el argumento grados_de_libertad < 1 o grados_de_libertad 10^10,


DISTR.CHI devuelve el valor de error #NUM!

DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una


variable aleatoria chi cuadrado. El clculo es el complemento de la
mayora de tablas.

Ejemplo:
DISTR.CHI(18,307;10) es igual a 0,050001
80

b) PRUEBA.CHI.INV: devuelve para una probabilidad dada, de una sola


cola, el valor x de la variable aleatoria siguiendo una distribucin chi
cuadrado.
Si el argumento probabilidad = p = DISTR.CHI(x;...), entonces
PRUEBA.CHI.INV(probabilidad,...) = x.
Sintaxis: PRUEBA.CHI.INV(probabilidad;grados_de_libertad)
Probabilidad

es una probabilidad asociada con la distribucin chi

cuadrado.
Grados_de_libertad es el nmero de grados de libertad.
Observaciones

Si uno de los argumentos no es numrico, PRUEBA.CHI.INV devuelve


el valor de error #VALOR!.

Si

el

argumento

probabilidad

<

probabilidad

>

1,

PRUEBA.CHI.INV devuelve el valor de error #NUM!.

Si el argumento grados_de_libertad no es un entero, se trunca.

Si el argumento grados_de_libertad < 1 o grados_de_libertad 10^10,


PRUEBA.CHI.INV devuelve el valor de error #NUM!.

PRUEBA.CHI.INV usa una tcnica iterativa para calcular la funcin.


Dado un valor de probabilidad, PRUEBA.CHI.INV reitera hasta que el
resultado tenga una exactitud de 3x10^-7. Si PRUEBA.CHI.INV no
converge despus de 100 iteraciones, la funcin devuelve el valor de error
#N/A.
Ejemplo:
PRUEBA.CHI.INV(0,05;10) es igual a 18,3070290368475
Ejemplo 1.Si X ~ X r2 . Usando la tabla 2, de Ji-cuadrado, hallar el x2 correspondiente
para:
81

a) P(X < x2 ) = 0.05, si r = 15 g.l.


Se busca en la tabla 2, 15 g.l. en el margen izquierdo y se intercepta con la
probabilidad 0.05 de las columnas y se obtiene x2 = x02.05, 15 = 7.26 Rpta.
b) P(X < x2 ) = 0.99, si r = 21 g.l.
Procediendo como en a) se obtiene entonces x2 = x02.99, 21 = 38.9 Rpta.
Ejemplo 2.2
Si X es una variable aleatoria x20
. Calcular:

a) P[X < 10.9];

c) P[ 10.9 < X 31.4 ]

b) P[ X > 31.4 ];

Solucin
Para obtener las probabilidades solicitadas, en la fila de 20 g.l de la tabla 2 se
buscan los valores dados para X y se leen las probabilidades (acumuladas
menores que) correspondientes en el encabezamiento de las columnas as:
a) P[X < 10.9] =

P X x02.05

= 0.05

Rpta.

b) P[ X > 31.4 ] = 1 PX 31.4 1 P X x02.95 = 1 0.95 = 0. 05


Rpta.
c) P[ 10.9 < X 31.4 ] = P[X 31.4 ] - P[X 10.9 ] =

= P X x02.95 P X x02.01
= 0.95 0.01 = 0.94

Rpta.

Ejemplo 3.Si X es X 132 . Hallar P(X 20).


Solucin
P(X 20) = 1 P(X < 20) = 1 p
Como en la tabla 2, de chi cuadrado, para 13 grados de libertad, no se
encuentra el valor 20, pero ste se encuentra entre los valores 19.8 (con
probabilidad 0.90) y 22.4 (con probabilidad 0.95) para hallar p interpolamos
de la siguiente manera:
82

x2

19.8

0.90

20

22.4

0.95

22.4 19.8 20 19.8

0.95 0.90 p 0.90

52

0.2
52 p 46.8 0.2
p 0.90

P(X 20) = 1 0.9038 = 0.0962

p 0.9038

Rpta.

Ejemplo 4.2
Si X es una variable aleatoria con distribucin x25
. Hallar a y b tal que:

P[a X b] = 0.95

P[ X a ] = 0.025

Solucin
a = x02.025 , 25 = 13.1

Para r = 25 g.l.,

Rpta.

0.95 = P[a X b] = P[X b] P[X a] = P[X b] - 0.025


Luego:

P[X b] = 0.975

b = x02.975 , 25 = 40.6

Rpta.

Veamos a continuacin algunos teoremas importantes relacionados con la


distribucin chi-cuadrado y de mucha importancia para la construccin de
intervalos de confianza y pruebas de hiptesis.
Teorema 1.- Si la variable aleatoria

X ~ N(, ), entonces la variable

Y = Z = (X - )/ es una x12 .

aleatoria,
n

Sabemos que X

X
i 1

N(0,1) entonces, Z 2

~ N ( ,

X n

X n es

) y por lo tanto Z
n

x12 .

Ejemplo 5.Si X ~ N(12, 5). Calcule e interprete P[13.55 (X 12) < 19.20 ]

83

Solucin
Como X ~ N (12, 5) entonces la variable aleatoria

X 12
5

~ x12 .

Luego:

13.55 X 12 19.20
P[13.55 (X 12) < 19.20 ] = P
=

5
5
5
= P[2.71 x12 < 3.84 ] = P[ x12 3.84 ] - P[ x12 2.71 ] =
= 0.95 - 0.90 = 0.04
Interpretacin: el

Rpta.

4% de las desviaciones al cuadrado, de los valores

observados de X ~ N (12, 5)

con respecto a su media 12, estarn

comprendidos entre 13.55 y 19.20.


Teorema 2.- (Propiedad Reproductiva de la Chi-Cuadrado)
Sean X 12 , X 22 ,..., X p2 variables aleatoria chi-cuadrados dependientes con
grados de libertad r1, r2, ..., rp respectivamente, entonces la variable aleatoria:

X X 12 X 22 ... X p2
p

Sigue una distribucin chi-cuadrado con grado de libertad igual a r ri


i 1

Teorema 3.-

Sea X1, X2, ..., Xn, una muestra aleatoria de una variable

aleatoria X ~ N (, ). Entonces, la variable aleatoria:


n

2
Y xi / ~ x n2
i 1

Distribucin de la Varianza Muestral


Teorema 4.- Sea X1, X2, ... , Xn una muestra aleatoria de tamao n de una
poblacin normal con media y varianza . Sea X y S la media muestral y
varianza muestral respectivamente, entonces:
a) Las variables aleatorias X y S son independientes.
n

b) La funcin de la varianza muestral x


84

n 1S
i 1

xi X

~ x n21 .

Demostracin.- Demostraremos slo la parte b)


n

x
i 1

Sabemos que la variable aleatoria


tiene una distribucin xn2 ,

puesto que cada trmino (xi - )/ son variables aleatorias normales estndar
e independientes (teorema 3).
Consideremos:
n

i 1

i 1

X i X i X X
n

i 1

i 1

i 1

X i X X 2 X X i X
n

X
i 1

X n X

Dividiendo entre y ordenando tenemos:


n

X i X i X

X
i 1
i 1

/n

n 1S X

/n

Dado que ( X - )/(/n) tiene una distribucin X 12 . Adems, como X y S


n

son independientes, y

X
i 1

/ tiene una distribucin x n2 , por la

propiedad aditiva de la chi-cuadrado, concluimos que la distribucin de

n 1S

2
es x n 1 .

Ejemplo 6.Suponga que X1, X2, ......,X10 es una muestra aleatoria de una variable
aleatoria normal estndar. Calcule e interprete:
10

a) P 2.56 X i2 18.3
110

b) P(S2 < 1.88)

Solucin
entonces X2 i ~ X 12 y por lo tanto

a) Como las v.a Xi ~ N(0, 1),


10

X
i 1

2
i

85

~ X 102

10

P 2.56 X i2 18.3 = P 2.56 X 102 18.3 =


110

= P( X 102 18.3) P( X 102 2.56) =


= 0.95 0.01 = 0.94

Rpta.

Interpretacin: En el 94% de las muestras de 10 observaciones de la


10

distribucin normal estndar, la

X
i 1

b) P(S2 < 1.88) = P(

9S 2

2
i

estar entre 2.56 y 18.3.

9 x1.88
) = P( X 92 16.92) = 0.95
1

Rpta.

Interpretacin: En el 95% de las muestras de 10 observaciones de la


distribucin normal estndar, la varianza muestral es menor que 1.88.
3.2 DISTRIBUCIN T DE STUDENT
Esta distribucin fue descrita en 1908 por el estadstico ingls William S. Gosset,
quien, al estar prohibido de publicar artculos cientficos por la empresa cervecera
Guinness donde laboraba en Dublin, tuvo que presentarla con el pseudnimo de
Student y es comnmente conocida como la distribucin t.
Es Ronald A. Fisher quien aprecia la importancia de los trabajos de Gosset sobre
muestras pequeas, tras recibir correspondencia de Gosset en la que le deca le
envo una copia de las Tablas de Student, ya que es la nica persona que
probablemente las use jams. 3
Definicin.- Sea Z una variable aleatoria normal estndar N(0, 1). Sea X2 ~ X r2
una variable aleatoria que tiene una distribucin chi-cuadrado con r grados de
libertad, y si Z y X2 son independientes, entonces la variable aleatoria

Z
X2
r

Z r
~ tr
Y

tiene una distribucin t, con r grados de libertad, y su funcin de densidad de


probabilidades est dada por:

http://es.wikipedia.org/wiki/William_Sealy_Gosset; revisado en agosto de 2012.

86

r 1
r 1

2 t 2

f t
1
,
r r
r
2

- < t <

Notacin: decir que la variable aleatoria T, tiene distribucin t con r grados de


libertad, se denota como T ~ tr.
Media y Varianza:
La media y la varianza de la v. a. T con r grados de libertad son:
E(T) = T = 0
Var(T) = T2

r
r2

r>1

r>2

Observe que la distribucin de la variable aleatoria T, queda completamente


determinada slo por el parmetro r. Por lo tanto, hay una distribucin t
correspondiente a cada grado de libertad. En la figura 3 se presenta la funcin
de densidad de la variable aleatoria T, para diferentes grados de libertad. En la
misma figura se da, la grfica de la normal estndar.

La distribucin t es simtrica alrededor de la media

= 0 y vara de menos

infinito a ms infinito. Es muy similar a la distribucin normal estndar, ya que


ambas varan de - a , son simtricas y centradas alrededor de = 0, es decir
su media es cero, pero la distribucin t tiene mayor dispersin que la
87

distribucin normal estndar, esto se observa de la varianza T2

r
, que
r2

se aproxima a 1 cuando el grado de libertad r es grande (r ).


Por lo tanto, la distribucin t, se aproxima a la distribucin normal estndar
cuando el grado de libertad r es suficientemente grande. En la prctica se trata
a la distribucin t, como N(0,1) cuando r > 30.
Funcin de Distribucin Acumulativa de Probabilidades.El clculo de probabilidades para la v.a. t, se efecta utilizando los valores de
la funcin de distribucin acumulativa menor o igual que, los que han sido
reproducidos en la Tabla 3 del Anexo, utilizando la hoja de clculo Excel.
As tenemos que, la probabilidad que la variable aleatoria T con distribucin tr
(con 1 r < 30) sea menor o igual a un valor constante t , representada por:

PT t

0<<1

Est dada por:

PT t f t dt
t

r 1
r 1

2 1 2 dt
r r
r
2

cuya representacin grfica la podemos ver en la fig. 4.

Estas probabilidades estn determinadas en la Tabla 3, de la distribucin


acumulativa t de student. En el encabezado de la columna de la izquierda, dice
grados de libertad (G.L.) y cada fila de esta tabla corresponde a una
distribucin t particular, con sus probabilidades (p) en la parte superior de esta
tabla.
En la hoja de clculo Excel, las probabilidades y los valores de T se determinan
as:
88

a) DISTR.T: devuelve la probabilidad (los puntos porcentuales) de la


distribucin t de Student, donde un valor numrico (x) es un valor calculado
de t para el que deben calcularse los puntos porcentuales. La distribucin t
de Student se utiliza para la comprobacin de pruebas de hiptesis cuando el
tamao de la muestra es pequeo (n < 30). Se puede utilizar esta funcin en
lugar de una tabla de valores crticos para la distribucin t.
Sintaxis: DISTR.T(x; grados_de_libertad; colas)
X es el valor numrico al que se ha de evaluar la distribucin.
Grados_de_libertad

es un entero que indica el nmero de grados de

libertad.
Colas

especifica el nmero de colas de la distribucin que se ha de

devolver. Si colas = 1, DISTR.T devuelve la distribucin de una cola. Si


colas = 2, DISTR.T devuelve la distribucin de dos colas.
Observaciones:

Si uno de los argumentos no es numrico, DISTR.T devuelve el valor de


error #VALOR!

Si grados_de_libertad < 1, DISTR.T devuelve el valor de error #NUM!

Los argumentos grados_de_libertad y colas se truncan a enteros.

Si el argumento colas es un nmero distinto de 1 2, DISTR.T devuelve


el valor de error #NUM!

DISTR.T se calcula como DISTR.T = P( x < X ), donde X es una variable


aleatoria que sigue la distribucin t.

Ejemplo:
DISTR.T(1,96;60;2) es igual a 0,054645 5,46%
b) DIST.T.INV : Devuelve el valor t de la distribucin t de Student como
funcin de la probabilidad y los grados de libertad.
Sintaxis:

DISTR.T.INV(probabilidad;grados_de_libertad)

Probabilidad:

es la probabilidad asociada con la distribucin t de

Student dos colas.

89

Grados_de_libertad: es el nmero de grados de libertad para diferenciar


la distribucin.
Observaciones:

Si uno de los argumentos no es numrico, DISTR.T.INV devuelve el


valor de error #VALOR!

Si el argumento probabilidad < 0 o si probabilidad > 1, DISTR.T.INV


devuelve el valor de error #NUM!

Si el argumento grados_de_libertad no es un entero 1, se trunca.

DISTR.T.INV se calcula como DISTR.T.INV = P (X > t ), donde X es


una variable aleatoria que sigue la distribucin t.

Puede devolverse un valor t de una cola reemplazando probabilidad por


2*probabilidad. Para una probabilidad de 0,05 y grados de libertad de 10,
el valor de dos colas se calcula con DISTR.T.INV(0,05;10), que
devuelve 2,28139. El valor de una cola para la misma probabilidad y los
mismos

grados

de

libertad

puede

calcularse

con

DISTR.T.INV(2*0,05;10), que devuelve 1,812462.


Nota.- En algunas tablas, la probabilidad se describe como (1-p).
DISTR.T.INV se calcula utilizando una tcnica iterativa. Dado un valor
del argumento probabilidad, DISTR.T.INV reitera hasta obtener un
resultado con una exactitud de 3x10-7. Si DISTR.T.INV no converge
despus de 100 iteraciones, la funcin devuelve el valor de error #N/A.
Ejemplo:
DISTR.T.INV(0,054645;60) es igual a 1,96
Ejemplo7.Si la variable aleatoria T ~ t20 (r = 20). Usando la tabla 3, de T de student,
hallar: P[T 1.725 ]
Solucin
Para obtener las probabilidad solicitada, buscar en la tabla 3 el valor T =
1.725 en la fila de 20 g.l y su probabilidad correspondiente se lee en la parte
superior de esa columna, cuyo valor es 0.95. Es decir:
90

P[T 1.725 ] = P[T t 0.95 ] = 0.95

Rpta.

Nota.- Por la simetra de la distribucin t, se tiene que:


Para < 0.5, los valores t son: t = - t1- , .

(ver fig. 5).

Fig. 5 Obtencin de valores T para < 0.05

T = - T(1 - )

T(1 - )

P[ T -a ] = 1 - P[ T a ]
Ejemplo 8.Sea T una variable aleatoria que tiene una distribucin t con varianza =

5
.
3

Calcular: P[-2.015 T 2.571]


Solucin
Como T2

r
5
, entonces r = 5 y T ~ t5 . Luego:
r 2 3

P [- 2.015 T 2.571] = P[T 2. 571] P[T - 2. 015 ] =


= P[T 2. 571] [1 P[T 2. 015 ] =
Buscando las probabilidades en la tabla 3 y reemplazando se tiene:
= P [T t0.975 ] {1 - P[T t0.95 ]} =
= 0.975 [ 1 - 0.95 ] =
= 0.975 - 0.05 = 0.925

Rpta.

Ejemplo 9.Sea T una variable aleatoria que tiene una distribucin t con 23 grados de
libertad. Hallar el valor de a tal que: P[T a ] = 0.95
91

Solucin
0.95 = P [T a ] = P[-a T a ] =
= P[T a] P[T - a]
= P[ T a ] [ 1 P[T a ]
= 2P[Ta]1

P[ T a ] = 0.975

En la tabla 3, a = t0.975 , 23 = 2.069

Rpta.

3.3 DISTRIBUCIN MUESTRAL DE LA MEDIA (n < 30)


En el acpite 2.1 vimos la distribucin muestral para la media, con muestras
grandes (n 30), la misma que se aproximaba a la distribucin normal. Sin
embargo, cuando las muestra son pequeas (n < 30) la aproximacin es hacia la
distribucin t de student, tal como veremos a continuacin.
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n, de una variable aleatoria
X con distribucin N(, ), en acpites anteriores hemos visto que:

X
~ N(0,1).
/ n

1.

La variable aleatoria Z

2.

La variable aleatoria x 2

3.

X y S son variables aleatorias independientes

(n 1)S 2

~ x 2n 1

(teorema 4).
(teorema 4).

Usando la definicin de la variable aleatoria T, tenemos que:

X
T

Z
x2
g.l.

n 1S / n 1

X
S

~ tn-1

tiene distribucin t con n 1 grados de libertad y se usa para estimar cuando no


se conoce la desviacin estndar .
Ejemplo 9.Si X y S 2 son la media y la varianza de una muestra aleatoria de tamao 17 de
una distribucin N(, o2). Hallar la constante C tal que:
92

4X

P C
C 0.95
S

Solucin
En el problema propuesto, T

( X ) n ( X ) 17
~ t 16. Entonces:

S
S

C 17 X 17 C 17
= P

=
4
S
4

4X
C
0.95 = P C
S

C 17

C 17
C 17
C 17
= P
t16
= P t16
- P t16
=
4
4
4
4

C 17
= P t16
4

1 P t16

C 17
0.95 = 2 P t16
- 1
4

C 17
t16 , 0.975 2.12
4

C 17

C 17
P t16
= 0.975
4

C = 2. 0567

Rpta.

3.4 DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES,


CON VARIANZAS DESCONOCIDAS PERO IGUALES
Si se toma dos muestras aleatorias independientes de dos poblaciones normales
X e Y, con varianzas desconocidas pero iguales X = Y = , as:
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n, de una variable aleatoria
X con distribucin N(X, ). Sea tambin Y1, Y2, ..., Ym una muestra aleatoria
de tamao m de una variable aleatoria Y, con distribucin N(Y, ). De
acuerdo a lo estudiado en acpites anteriores se tiene que:
1.

La distribucin de la variable aleatoria

X Y X Y X Y X Y

n

2.

1 1

n m

~ N (0 , 1 )

La variable aleatoria:
n

n 1S
U

2
X

X
i 1

93

~ x 2n 1

U es independiente de X e Y .
3.

La variable aleatoria:
n

m 1SY2
V

Y Y

i 1

~ x2m 1

V es independiente de X , Y y S X2 .

4.

Por la propiedad reproductiva de la distribucin chi-cuadrado, la v.a. :


U+V=

n 1S X2

m 1SY2

~ x2n m 2

Con los resultados encontrados en (1) y (4); siendo las variables Z normal
estndar y U + V chi-cuadrado e independientes; usando la definicin de la
variable aleatoria T se obtiene la distribucin de la diferencia de medias
muestrales X - Y siguiente:

X Y X Y
T

U V
nm2

1 1

n m
(n 1) S X2 (m 1) SY2 / 2
nm2

X Y X Y
n 1S X2 m 1SY2 1 1

~ t n+m-2

Simplificando:

nm2

tiene distribucin t con n + m 2 grados de libertad. Observe que esta variable


aleatoria depende de las medias y las varianzas muestrales.
3.5 DISTRIBUCIN F DE SNEDECOR
Esta distribucin fue descubierta por Fisher, de all la denominacin F y
redescubierta por Snedecor. Es muy utilizada para comparar las varianzas de
dos variables aleatorias independientes distribuidas normalmente.

94

Definicin.- Sea U y V dos variables aleatorias independientes que tienen


distribuciones chi-cuadrado, con r1 y r2 grados de libertad, respectivamente.

Entonces, la variable aleatoria:

tiene una distribucin F con r

y r

U / r1
V / r2

grados de libertad y su funcin de

densidad de probabilidades est dada por:

r r 1 2
r1
1
1 2 r1 2 r2 2
x2
2
.
r1 r2 x r r r1 2 r2

1
2
2 2
r

fF (x) =

= 0

0<x<

en otros casos

La distribucin F depende de los parmetros r1 y r2 en ese orden.


r1 = grados de libertad en el numerador, y
r2 = grados de libertad en el denominador.
En la figura 6 se muestra la funcin de densidad de probabilidades de la
variable aleatoria F para tres pares diferentes de grados de libertad.

Fig. 6

Las distribuciones F son una familia de distribuciones asimtricas hacia la


derecha. Existe una distribucin F separada para cada par de valores de sus
parmetros r1 y r2.

95

Notacin: decir que la variable aleatoria F tiene distribucin F con r1 y r2


grados de libertad, se denota como F ~ Fr1 , r 2 .
Media y Varianza.La media y la varianza de la v. a. F con r1 y r2 grados de libertad son:

F E F

r2
r2 2

F2 VarF

2r22 r1 r2 2
,
r1 r2 2r2 4

r2 > 2

r2 > 4

Funcin de Distribucin Acumulativa de Probabilidades


El clculo de probabilidades para v.a. F, se efecta utilizando la Tabla 4 de
distribucin acumulativa F, las mismas que han sido elaboradas utilizando la
funcin de distribucin acumulativa de probabilidades que en la mayora de los
casos son del tipo de acumulacin menor o igual que.
La probabilidad que la variable aleatoria F ~ Fr1 , r 2 sea menor o igual que una
constante f est dada por:

PF f

PF f
0

f F x dx

r r 1 2
r1
1
1 2 r1 2 r2 2
2
x
2

.
dx
r1 r2 x r r r1 2 r2

1
2
2 2
r

96

Estas probabilidades se presentan en tablas de F. Como la distribucin depende


de los dos parmetros r1, y r2, se necesita una tabla con tres entradas para
tabular el valor de F que corresponde a diferentes probabilidades y valores de
r1 y r2.
Para valores de < 0.50 , se obtiene usando la siguiente igualdad

U / r

V / r

1
2
P
F ,r ,r P

V
/
r
U
/
r
f ,r ,r

2
1

1 2

1 2

V / r2
1
= 1 P

U / r1 f ,r1 ,r2

V / r2
1
P

1
U / r1 f ,r1 ,r2

Pero,

1 V / r2

~ Fr2 , r1
F U / r1

tiene distribucin F con r2 y r1 g.l.

V / r2

P
f1 ,r2 ,r1 1
U / r1

................ (1)

............... (2)

Igualando (1) y (2), se tiene que:

f1 , r2 , r1

1
f , r1 , r2

f , r1 , r2

1
f1 , r2 , r1

, para < 0.50

Ejemplo 10.Sea F una variable aleatoria que tiene una distribucin F con r1 y r2 grados de
libertad. Hallar :
a) PF 15.0 ,

con r1 = 7,

r2 = 4

b) PF 3.69 ,

con r1 = 5,

r2 = 8

c) P[F 0.0358 ],

con r1 = 3,

r2 = 6

d) Hallar los valores a y b tales que:


97

P[ F b ] = 0.975 y P[a F b] = 0.95 . Con r1 = 7,

r2 = 5

Solucin
Usando la tabla F:
a) P[F 15.0 ] = 1 P[F 15.0 ] = 1 P[F f0.99, 7, 4 ] =1 0.99 = 0.01
Rpta.
b) P[F 3.69 ] = P[F f0.95, 5, 8 ] = 0.95

Rpta.

1
1
1

c) P[F 0.0358] = P
1 P 27.9

F 0.0358
F

= 1 P f 0.99, 6, 3 = 1 0.99 = 0.01


F

d) P[F b] = 0.975

b = f0.975, 7, 5 = 6.85

Rpta.
Rpta.

0.95 = P[a F b] = P[F b] - P[F a] = 0.975 - P[F a]


P[F a] = 0.025

1 1
1 1
P[F a] = P 1 P 0.025
F a
F a

1 1
P 0.975 ,
F a

Luego:

1
f.0975, 5, 7 5.29 , de donde a = 0.189
a

1/F ~ F 5, 7

Rpta.

3.6 DISTRIBUCIN DE LA RAZN DE DOS VARIANZAS MUESTRALES


Si se toman dos muestras aleatorias independiente de las poblaciones normales
X e Y, encontraremos la distribucin de probabilidades para la razn de
varianzas muestrales de la siguiente manera.
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n de una variable aleatoria
X ~ N(X, X2 ). Sea Y1, Y2, ..., Ym una muestra aleatoria de tamao m de una

variable aleatoria Y con distribucin N Y , Y2 . Entonces, la variable


aleatoria,
98

n 1S X2
U

2
X

X
i 1

X
2
X

~ x 2n 1

De modo similar, la variable aleatoria,


m

m 1SY2

Y2

Y Y
i 1

Y2

~ x2m 1

Adems, las dos variables aleatorias chi-cuadrado U y V son independientes


por que X e Y son independientes. Entonces, usando la definicin de la
variable aleatoria F, tenemos que la variable aleatoria:

n 1S X2 / n 1

U / (n 1)
X2

V / (m 1) m 1SY2

Y2

/ m 1

99

S X2 / X2 S X2 Y2
~ Fn1,m-1

SY2 / Y2 SY2 X2

3.7 EJERCICIOS RESUELTOS


1.

Si X ~ X2 con 15 grados de libertad, hallar:


a) P(X > 27.5).
b) P(7.26 X 25.0).
c) P(X 23.5).
d) Hallar a y b tal que P(X a) = 0.025 y P(a X b) = 0.95.
Solucin
Para obtener las probabilidades solicitadas, en la fila de 15 g.l de la tabla 2 se
buscan los valores dados para X y se leen las probabilidades (acumuladas
menores que) correspondientes en el encabezamiento de las columnas as:
2
= 1 0.975 = 0.025 Rpta.
a) P[X > 27.5] = 1 - P(X 27.5) = 1- P X x0.975

b) P[7.26 X 25.0] = P[X 25.0 ] - P[X 7.26] =


2
2
P X x0.05
=
= P X x0.95

= 0.95 0.05 = 0.90

Rpta.

Distribucin chi-cuadrado con 15 g.l.

0.900

7.26

25.0

Resultado grfico en Minitab


c) P(X 23.5) = p
Como en la tabla 2, de chi cuadrado, para 15 grados de libertad, no se
encuentra el valor 23.5, pero ste se encuentra entre los valores 22.3 (con
probabilidad 0.90) y 25.0 (con probabilidad 0.95) para hallar p interpolamos
de la siguiente manera:
100

x2

22.3

0.90

23.5

25.0

0.95

54

Luego:

25.0 22.3 23.5 22.3

0.95 0.90
p 0.90
1.2
54 p 48.6 1.2
p 0.90

P(X 23.5) = 0.9222

p = 0.9222

Rpta.

d) P(X a) = 0.025
2
a = x0.025
, 15 = 6.26

Para r = 15 g.l.,

Rpta.

0.95 = P[a X b] = P[X b] P[X a] = P[X b] - 0.025


P[X b] = 0.975

Luego:

2
b = x0.975,
15 = 27.5

Rpta.

Distribucin chi-cuadrado con 15 g.l.

0.95

a = 6.26

b = 27.5
X

2.

De una poblacin X: N(u, 18 ), se extrae una muestra aleatoria de tamao n =


21. Calcule e interprete:
a) P [ 3.291 < ( x - )2 < 5.683 ]
b) Entre que valores se encontrar el 90 % central de las varianzas muestrales?
Solucin

101

a) Se sabe que X

X
i 1

N(0,1) entonces, Z 2

~ N ( ,

X n es

) y por lo tanto Z
n

X n X x21 ~

18

2
1

Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad


por 21/18 y se construye una 12 as:

3.291x21 ( x ) 2 x21 5.683 x21


P [3.291 < ( x - ) < 5.683] = P
=

18
18
18
2

= P [3.84 < 12 < 6.63] = P[ 12 6.63] - P[ 12 3.84] = 0.99 0.95 = 0.04.


Interpretacin.- en el 4% de las muestras de tamao 21, de una poblacin X
N(u, 18 ), las desviaciones al cuadrado, de las medias muestrales x con
respecto a la media poblacional , se encuentran entre 3.291 y 5.683.
b) Sean a y b los valores centrales dentro de los cuales se encuentra el 90% de
las varianzas muestrales (S2), con el 5% hasta a y 95% hasta b, es decir:
0.90 = P (a S2 b), con P (S2 a) = 0.05 y P (S2 b) = 0.95
Se sabe que:

(n 1)S 2

n21 entonces,

(21 1)S 2 20S 2

202
18
18

Multiplicando en la probabilidad anterior por 20/18 se tiene una 202 as:


0.05

20S 2 20a
2 20a
P

P 20

18
18

18

20a
2
20,
0.05 10.9 .
18

Luego: a = 9.81. Adems:


0.95

20S 2 20b
2 20b
P

P 20

18
18

18

20b
22 0 , 0 . 931.4
.
5
18

Luego: b = 28.26. Entonces: 0.90 = P (9.81 S2 28.26) Rpta.


Interpretacin.- en las muestras de tamao 21, de una poblacin X N(u, 18 ),
el 90% central de las varianzas muestrales (S2) se encuentra entre 9.81 y
28.26.
3.

De una poblacin X: N(u, 18), se extrae una muestra aleatoria de tamao n = 21.
Calcule e interprete:
21

a) P [208.7 <

(X i - )2 < 638.7]

i 1

102

b) P (9.77 < S2 < 30.78)


Solucin
a) Se sabe que
n

(X
i 1

2
i )

para muestras de una poblacin normal se cumple que:


21

n2

(X
i 1

)2

18

212 .

Para obtener la probabilidad solicitada se divide dentro de la desigualdad por


18 y se construye una 212 as:
21

P [208.7 <

i 1

21

2
208.7 ( X i )

638.17
=
i 1

(X i - )2 < 638.7] = P
18
18
18

= P [11.6 < 212 < 35.5] = P[ 212 35.5] - P[ 212 11.6] = 0.975 0.05 =
0.925.
Interpretacin.- en el 92.5% de las muestras de tamao 21, de una poblacin
X

N(u, 18 ), las sumas de desviaciones al cuadrado, de los valores

observados con respecto a la media poblacional , se encuentran entre 208.7


y 638.7.
b) Se sabe que:

(n 1)S 2

2
n 1

(21 1)S 2 20S 2


entonces,

202
18
18

Multiplicando en la probabilidad solicitada por 20/18 se tiene una 202 as:

20 x9.77 20 S 2 20 x30.78
P (9.77 < S2 < 30.78) = P

18
18
18

= P[10.9 < 212 < 34.2] = P[ 202 34.2] - P[ 202 10.9] = 0.975 0.05 =
0.925.
Interpretacin.- en el 92.5% de las muestras de tamao 21, de una poblacin
X N(u, 18 ), las varianzas muestrales (S2) se encuentra entre 9.77 y 30.78.
4.

Suponga que el nmero de horas semanales que las amas de casa ven TV tiene
distribucin normal con una varianza de 3. Al escoger una muestra de 17 amas
de casa y registrar el nmero de horas a la semana que ven TV, calcule e
103

interprete la probabilidad de que la varianza muestral de los tiempos obtenidos


sea mayor que 5.4 (horas)2.
Solucin
Sean X = nmero de horas semanales que las amas de casa ven TV, n = 17 y 2
= 3.
Se sabe que:

(n 1)S 2

n21 entonces,

(17 1)S 2 16S 2

162
3
3

Multiplicando en la probabilidad solicitada por 16/3 se tiene una 162 as:

16S 2 16 x5.4

P (S > 5.4) = 1 - P (S 5.4) = 1 - P


=
3
3
2

= 1 - P[ 162 < 28.8] = 1 - 0.975 = 0.025

Rpta.

Interpretacin.- en el 92.5% de las muestras de 17 amas de casa, las varianzas


muestrales (S2) del nmero de horas semanales que ven TV es mayor que 5.4
(horas)2.
5.

La duracin de los transistores fabricados por una compaa tienen una media de
2000 horas y una desviacin tpica de 60 horas. Se selecciona 10 transistores al
azar, calcule e interprete la probabilidad que la desviacin tpica muestral se
encuentre entre 50 y 70 horas.
Solucin
Sean X = duracin de los transistores, = 2000, 2 = (60)2 = 3600 y n = 10.
Se sabe que:

(n 1)S 2

2
n 1

(10 1)S 2 S 2
entonces,

92
3600
400

Dividiendo en la probabilidad solicitada entre 400 se tiene una 92 as:

2500 S 2 4900
P(50 S 70) = P (2500 S2 4900) = P

=
400 400 3600
= P[6.25 92 12.25] = P[ 92 12.25] P[ 92 6.25] = 0.80 - p
Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no est el valor
6.25, pero ste se encuentra entre los valores 5.38 (con probabilidad 0.20) y 6.39
(con probabilidad 0.30) para hallar p interpolamos as:
104

x2

5.38

0.20

6.25

6.39

0.30

10.1

6.39 5.38 6.25 5.38

0.30 0.20
p 0.20
0.87
10.1 p 2.02 0.87 p = 0.2861
p 0.20

Reemplazando p = 0.2861 en la ltima expresin se tiene que:


P(50 S 70) = 0.80 - 0.0.2861 = 0.5139

Rpta.

Interpretacin.- en el 51.4% de las muestras de 10 transistores, la desviacin


estndar muestral de la duracin de dichos transistores se encuentra entre 50 y
70 horas.
6.

De una poblacin X: N(0, 1) se extrae una muestra aleatoria de tamao n = 15.


Calcule e interprete:
15

a) P 7.26 X i2 27.5
i 1

b) P(0.4693 < S < 1.864)


Solucin
a) Se sabe que las observaciones muestrales tienen la misma distribucin que la
poblacin, luego Xi ~ N(0, 1), entonces X i2 ~ 12 y por tanto

15

X
i 1

2
i

~ X 152 .

La probabilidad solicitada es:


15

P 7.26 X i2 27.5 = P 7.26 152 27.5 =


i 1

= P[ 152 27.5] P[ 152 7.26] = 0.975 0.05 = 0.925 Rpta.


Interpretacin.- en el 92.5% de las muestras de 15 observaciones de la
distribucin normal estndar, la suma de los valores observados al cuadrado
se encuentra entre 7.26 y 27.5.
b) Dado que:

(n 1)S 2

n21 entonces,

(15 1)S 2
14 S 2 142
1

Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad


por 14 y se construye una 142 as:
105

P(0.4693 < S < 1.864) = P 14 x 0.4693 14 S 2 14 x1.864 =


= P[6.57 142 26.1] = P[ 142 26.1] P[ 142 6.57] = 0.975 0.05 =
0.925.
Interpretacin.- en el 92.5% de las muestras de 15 observaciones de la
distribucin normal estndar, la varianza muestral se encuentra entre 0.4693
y 1.964.
7.

De una poblacin X: N(, 10) se extrae una muestra aleatoria. de tamao n = 9 y


de una poblacin Y: N(, 12) se extrae una muestra aleatoria de tamao m = 4.
Calcule e interprete:
9

a) P 21.8 ( X i X )2 175
i 1

b) P 5.81 (Yi ) 2 133.2


i 1

Solucin

x X
n

a) Si 2

n 1 S

i 1

x X
9

n21 entonces

i 1

10

82 .

Para obtener la probabilidad solicitada se divide dentro de la desigualdad


entre 10 y se construye una 82 as:
9

( X i X )2

9
21.8 i 1
175

P 21.8 ( X i X )2 175 = P
10
10
10
i 1

= P(2.18 82 17.5) = P[ 82 17.5] P[ 82 2.18] =


= 0.975 0.025 = 0.955 Rpta.
Interpretacin.- en el 92.5% de las muestras de 9 observaciones de la
poblacin X: N(, 10), la suma de de las desviaciones al cuadrado de los
valores observados respecto a la media muestral, se encuentra entre 21.8 y
175.

106

Y
b) Para una muestra de una poblacin normal, se sabe que:

i 1

m2

Y
entonces

i 1

12

42 . Para obtener la probabilidad solicitada se divide

dentro de la desigualdad por 12 y se construye una 42 as:


4

(Yi )2

4
5.81
133.2

=
i 1

P 5.81 (Yi ) 2 133.2 = P


12
12
12
i 1

= P[0.484 42 11.1] = P[ 42 11.1] P[ 42 0.484] =


= 0.975 0.025 = 0.95.

Rpta.

Interpretacin.- en el 92.5% de las muestras de 4 observaciones de la


distribucin normal Y: N(, 12), la suma de de las desviaciones al cuadrado
de los valores observados respecto a la media poblacional , se encuentra
entre 5.81 y 133.2.
8.

Si T ~ t con 18 grados de libertad (T18), hallar:


a) P(T > 2.101)
b) P(-1.734 T 2.552)
c) P(T 1.53)
d) Hallar t0 tal que P(-t0 T t0) = 0.95.
Solucin
Para obtener las probabilidades solicitadas, en la fila de 18 g.l de la tabla 3 se
buscan los valores dados para T y se leen las probabilidades (acumuladas
menores que) correspondientes en el encabezamiento de las columnas as:
a) P(T > 2.101) = 1 - P(T 2.101) = 1- P(T T18, 0.975) = 1 0.975 = 0.025
Rpta.
b) P(-1.734 T 2.552) = P(T 2.552) P(T -1.734) =
= P(T T18, 0.99) [1 - P(T 1.734)] =
= 0.99 [1 0.95] = 0.99 - 0.05 = 0.94

107

Rpta.

Grfica de distribucin T con 18 G.L.

0.940

-1.734

0
T

2.552

Resultado grfico en Minitab


c) P(T 1.53) = p
Solucin
Como en la tabla 3, T de student, para 18 grados de libertad, no se encuentra
el valor 1.53, pero ste se encuentra entre los valores 1.33 (con probabilidad
0.90) y 1.734 (con probabilidad 0.95) para hallar p interpolamos de la
siguiente manera:
T

1.33

0.90

1.53

1.734

0.95

8.08

Luego:

1.734 1.33 1.53 1.33

0.95 0.90
p 0.90
0.2
8.08 p 7.272 0.2 p = 0.9248
p 0.90

P(T 1.53) = 0.9248

Rpta.

d) 0.95 = P(-t0 T t0) = P(T18 t0 ) P(T18 -t0) =


= P(T18 t0 ) [1 - P(T18 t0)] = 2 P(T18 t0 ) 1
P(T18 t0 ) = 0.975 to = T18, 0.975 = 2.101 Rpta.
Resultado grfico en Minitab
108

Grfica de distribucin T con 18 G.L.

0.95

0.025
0

9.

0.025
-2.101

0
T

2.101

Un inspector investiga las acusaciones contra la fbrica de ron Pepito porque


no llena bien sus envases. Una muestra de 25 botellas de ron indica una
desviacin tpica S = 0.18 litros. Calcule e interprete la probabilidad de que el
promedio muestral difiera de su media poblacional en menos de 0.085 litros.
Solucin

Datos: n = 25, S = 0.18 lts. Se pide hallar P X 0.085


Se sabe que: T

X
X
X
tn1 , entonces: T

t24
0.18 / 25 0.036
S/ n

Para obtener la probabilidad solicitada se divide dentro de la desigualdad por


0.036 y se construye una T24 as:

X 0.085
P X 0.085 = P

P( T24 2.361) =
0.036
0.036

= P(-2.131 T24 2.131) = P(T24 2.131) P(T24 -2.131) =


= P(T24 2.131) [1 - P(T24 2.131)] =
= 2 P(T24 2.131) 1 = 2p 1 . (1)
Como en la tabla 3, T de student, para 24 grados de libertad, no est el valor
2.131, pero ste se encuentra entre los valores 2.064 (con probabilidad 0.975) y
2.492 (con probabilidad 0.99) para hallar p interpolamos de la siguiente manera:
109

2.064 0.975
2.131

2.492 2.064 2.131 2.064


0.067
28.53 =

0.990 0.975
p 0.975
p 0.975

2.492

0.990

28.53p - 27.817 = 0.067 p = 0.9774

Reemplazando p = 0.9774 en (1) se tiene que:

P X 0.085 = 2 (0.9774) 1 = 0.9548 Rpta.


Interpretacin.- en el 95.48% de las muestras de 25 botellas de ron Pepito, el
promedio muestral difiere de su media poblacional en menos de 0.085 litros.
10. De una poblacin X ~ N(10, 100) se extrae una muestra aleatoria de tamao 10 y
de una poblacin Y ~ N(20, 40) se extrae una m.a. de tamao 10. Determine el
valor de la constante a tal que: P (a SY <

- 10) = 0.95. Donde

es la media

muestral de las X y SY es la desviacin estndar muestral de las Y.


Solucin
Para resolver el problema es necesario construir una distribucin T de student.
Con la muestra de tamao 10 de la poblacin X, se tiene que: X N(10, 10).
Entonces: Z

X 10
N (0, 1) .
10

Con la muestra de la poblacin Y se tiene que: 2

(10 1)SY2
92
40

Con los resultados anteriores construimos una variable T as:

se distribuye como una T con los grados de libertad de la chi-

G.L
cuadrado. Reemplazando Z y la 92 en la expresin anterior se obtiene:

X 10
2( X 10)
10
T

t9
SY
9SY2 / 40
9
110

Para hallar el valor de la constante a solicitada, la probabilidad dada se adeca a


la distribucin t de student antes construida, as:
0.95 = P(a SY <

- 10) = P ( X - 10 a SY ) = 1 - P ( X - 10 a SY )

2( X 10)

2a = P(T9 2a)
0.05 = P ( X - 10 a SY) = P
SY

Luego: 2a = T9, 0.05 = - T9, 0.95 = -1.833 a = -0.9165 Rpta.


11. Para analizar el tiempo de atencin por clienta en las tiendas de pantalones
Ricas y apretaditas, se tom una muestra aleatoria sin reemplazo de 25
atenciones con lo cual se obtiene S2 = 2.25 minutos2. Calcule e interprete la
probabilidad de que el tiempo promedio muestral de atencin a las clientas
difiera de su media poblacional en menos de 0.57 minutos.
Solucin

Datos: n = 25, S2 = 2.25 minutos2. Se pide hallar P X 0.57


Se sabe que: T

X
X
X
tn1 , entonces: T

t24
0.3
1.5 / 25
S/ n

Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 0.3


y se construye una T24 as:

X 0.57
P X 0.57 = P

P( T24 1.9) =
0.3
0.3

= P(-1.9 T24 1.9) = P(T24 1.9) P(T24 -1.9) =


= P(T24 1.9) [1 - P(T24 1.9)] = 2 P(T24 1.9) 1 = 2p 1

. (2)

Como en la tabla 3, T de student, para 24 grados de libertad, no tiene el valor


1.9, pero ste se encuentra entre los valores 1.711 (con probabilidad 0.95) y
2.064 (con probabilidad 0.975) para hallar p interpolamos as:
T

1.711

0.95

1.9

2.064 0.975

2.064 1.711 1.9 1.711


0.189
14.12 =

0.975 0.95
p 0.95
p 0.95

14.12p - 13.414 = 0.189 p = 0.9634


111

Reemplazando p = 0.9634 en (2) se tiene que:

P X 0.57 = 2 (0.9634) 1 = 0.9268

Rpta.

Interpretacin.- en el 92.68% de las muestras de 25 atenciones en las tiendas de


pantalones Ricas y apretaditas, el tiempo promedio muestral de atencin a las
clientas difiere de su media poblacional en menos de 0.57 minutos.
12. De una poblacin X: N(0, ) se extrae una m.a. de tamao 7 y de una poblacin
Y: N(0, 1/3) se extrae una m.a. de tamao 9. Determine el valor de la constante a
tal que: P (a x > SY) = 0.01. Donde x es la media muestral de las X y SY es la
desviacin estndar de las Y.
Solucin
Para resolver el problema es necesario construir una distribucin T de student.
Con la muestra de tamao 7 de la poblacin X, se tiene que: X N(0, 1/28).
Entonces: Z

X 0
2 7 X N (0, 1) .
1/ 28

Con la muestra de la poblacin Y se tiene que: 2

(9 1)SY2
24SY2 82
1/ 3

Con los resultados anteriores construimos una variable T as:

se distribuye como una T con los grados de libertad de la chi-

G.L
cuadrado. Reemplazando Z y la 82 en la expresin anterior se obtiene:

2 7X
24SY2
8

3.055 X
t8
SY

Para hallar el valor de la constante a solicitada, la probabilidad dada se adeca a


la reciente distribucin t de student construida, as:
0.01 = P (a x > SY) = 1 - P ( X /SY 1/a)

3.055 X 3.055

0.99 = P ( X /SY 1/a) = P


= P(T8 3.055/a)
a
SY
Luego: 3.055/a = T8, 0.99 = 2.896 a = 1.055 Rpta.
112

13. Para analizar el N de libros encuadernados diariamente por una mquina


automtica, se seleccion una muestra aleatoria de 25 das con lo cual se obtiene
S = 8 libros. Calcule e interprete la probabilidad de que el nmero medio
muestral de libros encuadernados difiera de su media poblacional en a lo ms
4 libros.
Solucin

Datos: n = 25 das, S = 8 libros. Se pide hallar P X 4


Se sabe que: T

X X
X
tn1 , entonces: T

t24
1.6
8 / 25
S/ n

Para obtener la probabilidad solicitada se divide dentro de la desigualdad entre


1.6 y se construye una T24 as:

X
4
P X 4 = P

P( T24 2.5) =
1.6
1.6

= P(-2.5 T24 2.5) = P(T24 2.5) P(T24 -2.5) =


= P(T24 2.5) [1 - P(T24 2.5)] = 2 P(T24 2.5) 1 = 2(0.99) 1 = 0.98
Rpta.
Interpretacin.- en el 98% de las muestras de 25 das de encuadernacin cada
una, el nmero medio muestral de libros encuadernados difiere de su media
poblacional en a lo ms 4 libros.
14. De una poblacin X: N(, ), se extrae una m.a. de n+1 observaciones.
Encontrar c tal que el estadstico c( X Xn+1)/S tenga distribucin t. Donde X y
S es la media y la desviacin estndar muestral obtenidas con las n + 1
observaciones.
Solucin
Para hallar la constante c es necesario construir una distribucin T de student.
Con la muestra dada se tiene que: X N(,

2
n 1

) y Xn+1 N(, ).

Por la propiedad reproductiva de la distribucin normal, se tiene que:

X - Xn+1 N[0, (n +2)/(n + 1)]. Puesto que las correspondientes medias se


restan y las varianzas se suman.

113

Entonces: Z

X X n1 0

(n 2) /(n 1)
2

n 1 X X n1

N (0, 1) .
n2

Como S la desviacin estndar muestral obtenidas con las n + 1 observaciones,


entonces la chi-cuadrado es: 2

nS 2

n21

Con los resultados anteriores construimos una variable T as:

se distribuye como una T con los grados de libertad de la chi-

G.L
cuadrado. Reemplazando Z y la n21 en la expresin anterior se obtiene:

n 1 X X n1

n 2

nS 2

n 1 X X n1

tn1
n(n 2)
S

2
Comparando el resultado anterior con la expresin dada, se tiene que:
c=

n 1
n(n 2)

Rpta.

15. Si F ~ f con 7 y 8 grados de libertad, hallar:


a) P(F7,8 > 3.50)
b) P(F7,8 0.268)
c) P(0.1462 F7,8 4.53)
d) Hallar c y d tal que P(F7,8 c) = 0.025 y P(c F7,8 d) = 0.95
Solucin
Para obtener las probabilidades solicitadas en la tabla 4, ubicarse en la gran
casilla formada por la intercepcin de la columna 7 (G.L. numerador) y la fila 8
(G.L. denominador) se busca el valor dado de F y se leen las probabilidades
acumuladas menores que correspondientes, en la intercepcin de la lnea del
valor dado de F (en la fila 8) con la columna P as:
a) P(F7,8 > 3.50) = 1 - P(F7,8 3.50) = 1 0.95 Rpta.

1
1
b) P(F7,8 0.268) = P

F
P(F8,7 > 3.73) = 1 - P(F8,7 3.73) =
7,8 0.268
= 1 0.95 = 0.05

Rpta.
114

Para valores de 0 < F < 1 les corresponde probabilidades P = < 0.50 y se


usa la relacin: f , r1 , r2

1
f1 , r2 , r1

Como el valor de F7,8 = 0.268 no se encuentra en la intercepcin de la


columna 7 y la fila 8 de la Tabla 4, se toma el inverso de F7,8 que es otra
distribucin F8,7 (con los grados de libertad permutados). En la intercepcin
de la columna 8 y la fila 7 de la Tabla 4 se busca el valor 3.73 y le
corresponde la probabilidad 0.95.
c) P(0.1462 F7,8 4.53) = P(F7,8 4.53) - P(F7,8 0.1462)

1
1
= P(F7,8 4.53) - P

0
.
268
7
,
8

= P(F7,8 4.53) - P(F8,7 > 3.73)


= P(F7,8 4.53) - [1 - P(F8,7 3.73)]
= 0.975 - [1 0.95] = 0.925

Rpta.

d) Hallar c y d tal que P(F7,8 c) = 0.025 y P(c F7,8 d) = 0.95


Si P(F7,8 c) = 0.025 entonces c = f 7,8,0.025

1
f 8,7,0.975

1
= 0.204
4.90

Rpta.
Si 0.95 = P(c F7,8 d) = P(F7,8 d) - P(F7,8 c) = P(F7,8 d) 0.025
Luego: P(F7,8 d) = 0.975 entonces d = F7,8,0.975 = 4.53

Rpta.

16. Si muestras aleatorias independientes de tamao n1 = n2 = 8 provienen de


poblaciones normales con la misma varianza. Calcule e interprete la
probabilidad que la varianza de la primera muestra sea al menos 4 veces ms
grande que la otra.
Solucin
Dado que las varianzas son iguales, para obtener la probabilidad solicitada se

S12 22 S12
emplea la distribucin siguiente: F 2 2 2 f n1 1,n2 1 = F7,7
S2 1 S2

P S 5S
2
1

2
2

S12

P 2 5 = P(F7,7 > 5) = 1 - P(F7,7 5) =


S2

= 1 0.975 = 0.025 Rpta.


115

Interpretacin.- en el 2.5% de las ( en 25 de cada 1000) muestras de tamao 8


de cada poblacin, la varianza de la primera muestra es al menos 4 veces ms
grande que la segunda.
17. Si muestras aleatorias independientes de tamao n1 = 6 y n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la
probabilidad que la varianza de la primera muestra sea menor que seis veces la
segunda.
Solucin
Para hallar la probabilidad solicitada se emplea la propuesta del problema 16.

S2

P S12 6S 22 P 12 6 = P(F5,7 < 6) = p = 0.984 Rpta.


S2

Como en la tabla 4 de la distribucin F, para 5 y 7 grados de libertad, no se tiene


el valor 6, pero ste se encuentra entre los valores 5.29 (con probabilidad 0.975)
y 7.46 (con probabilidad 0.99) para hallar p interpolamos de la siguiente manera:
F

5.29

0.975

6.0

7.46 5.29 6.0 5.29


1.29
144.67 =

0.99 0.975 p 0.975


p 0.975

7.46

0.99

144.67 p 141.05 = 1.29 p = 0.984

Interpretacin.- en el 98.4% de las ( en 984 de cada 1000) muestras de tamao


6 de la poblacin 1 y 8 de la poblacin 2, la varianza de la primera muestra es
menor que seis veces la segunda.
18. De una poblacin X: N(0, ) se extrae una muestra aleatoria de tamao 7 y de
una poblacin Y: N(0, 1/3) se extrae una muestra aleatoria de tamao 9 Calcule
9
7

e interprete: P 4 X i2 9Y j2 .
j 1
i 1

Solucin
Para hallar la probabilidad solicitada se construye una F como el cociente de dos
chi-cuadrados entre sus respectivos grados de libertad.
116

Si X: N(0, ) entonces cada Xi: N(0, ) Z i


Luego: Z i2 4 X i2 12 y

i 1

i 1

Z i2 4 X i2 72 .

Si Y: N(0, 1/3) entonces cada Yj: N(0, 1/3) Z j


Luego: Z 2j 3Y j2 12 y

Xi 0
2 X i N (0,1) .
1/ 2

Z
j 1

Yj 0
1/ 3

3Y j N (0,1) .

2
j

3Y j2 92 .
j 1

Con las dos chi-cuadrado anteriores se construye la distribucin F siguiente:


7

4 X i2 / 7
i 1
9

3 Y / 9
2
j

j 1

9 x4 X i2 / 7
i 1
9

7 x3 Y / 9
j 1

F7,9

2
j

Acondicionando la probabilidad solicitada a la distribucin anterior se tiene:


7
7 2

4
X
9
x
4
X i2

i
7
9

9 x3
2
2
i 1
i 1

=
P 4 X i 9 Y j P 9
3 P

7
2
2
j 1
i 1

3 Y j

7 x3 Y j

j 1
j 1

= P(F7,9 > 3.86) = 1 - P(F7,9 3.86) = 1 p = 1 0.991 = 0.009 Rpta.


Como en la tabla 4 de la distribucin F, para 7 y 9 grados de libertad, no est el
valor 3.86, pero ste se encuentra entre los valores 5.61 (con probabilidad 0.99)
y 6.88 (con probabilidad 0.995) para hallar p interpolamos as:
F

5.61

0.99

5.86

6.88 5.61 5.86 5.61


0.25
254 =

0.995 0.99
p 0.99
p 0.99

6.88

0.995

254 p 251.46 = 0.25

p = 0.991

Interpretacin.- en el 0.9% de las ( en 9 de cada 1000) muestras de tamao 7


7

i 1

j 1

de la poblacin X y 9 de la poblacin Y, 4 X i2 9Y j2 .
19. Dos compaas A y B fabrican transistores. La duracin para los fabricados por
A tienen una desviacin estndar de 40 horas, en tanto que los B tienen una
desviacin estndar de 50 horas. Se toma una muestra de 8 transistores de A y
117

16 de B. Calcule e interprete la probabilidad que la varianza de la primera


muestra sea mayor 4.23 veces que la segunda.
Solucin
Datos: A = 40 horas, B = 50, nA = 8 transistores y nB = 16.
Para obtener la probabilidad solicitada se emplea la distribucin F siguiente:

S A2 B2 S A2 40 2
S A2

0
.
64
f n A 1,nB 1 = F7,15
S B2 A2 S B2 50 2
S B2

Adecuando la probabilidad solicitada al resultado anterior se obtiene:

S2

S2
P S A2 4.23S B2 P A2 4.23 P 0.64 A2 4.23x0.64 = P(F7,15 > 2.71) =
SB
SB

= 1 - P(F7,15 2.71) = 1 0.95 = 0.05 Rpta.


Interpretacin.- en el 5% de las ( en 50 de cada 1000) muestras de tamao 8 de
la poblacin A y 16 de la poblacin B, la varianza de la duracin de los
transistores de la primera muestra es mayor 4.23 veces que la varianza muestral
de la segunda.
20. De una poblacin X ~ N(, 100) se extrae una muestra aleatoria de tamao 12
y de una poblacin Y ~ N(, 225) se extrae una muestra aleatoria de tamao 8.
Calcule e interprete: P( S X2 1.6SY2 ) .
Solucin
Datos: 2X = 100 horas, 2Y = 225, nX = 12 transistores y nY = 8.
Para obtener la probabilidad solicitada se emplea la distribucin F siguiente:

S X2 Y2 S X2 225
S X2

2
.
25
f n X 1,nY 1 = F11,7
SY2 X2
SY2 100
SY2

Adecuando la probabilidad solicitada al resultado anterior se obtiene:

S2

S2
P S X2 1.6SY2 P X2 1.6 P 2.25 X2 2.25 x1.6 =
SY
SY

= P(F11,7 3.6) = 0.95 Rpta.


Interpretacin.- en el 95% de las ( en 950 de cada 1000) muestras de tamao
12 de la poblacin X y 8 de la poblacin Y, la varianza muestral de las X es
menor o igual que 1.6 veces que la varianza muestral de las Y.
118

3.7 EJERCICIOS PROPUESTOS


1. Si X ~ X2 con 25 grados de libertad, hallar:
a) P(X 46.9).
b) P(11.5 X 44.3).
c) P(X > 37.7).
d) Hallar a y b tal que P(X a) = 0.05 y P(a X b) = 0.90.
2.

De una poblacin X N(u, 18 ), se extrae una muestra aleatoria de tamao n = 25.


Calcule e interprete:
a) P [ 0.011 < ( x - )2 < 3.614 ]
b) Entre que valores se encontrar el 95 % central de las varianzas muestrales?

3.

De una poblacin X N( , 20 ), se extrae una muestra aleatoria de tamao n =


30. Calcule e interprete:
a) P [354

30

(X
i 1

) 2 876 ]

b) P ( 11.04 S2 31.52 )
4.

Se sabe que los pesos de ciertas latas de atn se distribuyen normalmente con una
desviacin estndar de 2 gramos. Si se toma una muestra de 12 latas, calcule e
interprete la probabilidad de que la varianza de la muestra sea menor que 8.5
(gr.)2.

5.

La duracin de los focos producidos por una compaa tienen una media de 1500
horas y una desviacin tpica de 80 horas. Se seleccionan 23 focos al azar, calcule
e interprete la probabilidad de que la desviacin estndar muestral se encuentre
entre 60 y 100 horas.

6.

La duracin de transistores fabricados por una compaa tienen distribucin


normal con una media de 2000 horas y una desviacin tpica de 60 horas. Se
selecciona 10 transistores al azar, calcule e interprete la probabilidad que la
varianza muestral se encuentre entre 2500 y 4900 (horas)2.

7.

De una poblacin X: N(u, 18), se extrae una muestra aleatoria de tamao n = 25.
Calcule e interprete:
25

a) P [327.5 <

(X i - )2 < 978.8 ]

i 1

119

b) P (8.18 < S2 < 32.25).


8.

De una poblacin X N(, 10) se extrae una m.a. de tamao n = 10 y de una


poblacin Y N(, 15) se extrae una m.a. de tamao m = 8. Calcule e interprete:

9.

10

a) P 30.1 ( X i X )2 190.0
i 1

b) P 32.7 (Yi ) 2 201.0


i 1

Si T ~ t con 23 grados de libertad, hallar:

a) P(T -1.714)
b) P(-1.319 T 2.5)
c) P(T > 1.319)
d) Hallar a y b tal que P(T -t0) = 0.05 y P(-t0 T t0) = 0.90.
10. Un inspector investiga las acusaciones contra una fbrica de gaseosas porque no
llena bien sus envases. Una muestra de 16 botellas de gaseosa indica una
desviacin tpica S = 0.18 litros. Calcule e interprete la probabilidad de que el
promedio muestral difiera de su media poblacional en menos de 0.096 litros.
11. De una poblacin X: N(0, ) se extrae una muestra aleatoria de tamao 10.
Determine el valor de la constante k tal que: P (k x > SX) = 0.05. Donde x es la
media muestral de las X y SX es la desviacin estndar muestral de las X.
12. Para analizar el tiempo de atencin por cliente en un establecimiento grande, se
tom una muestra aleatoria sin reemplazo de 25 atenciones con lo cual se obtiene
un tiempo promedio de 7.5 minutos y una varianza S2 = 2.25 minutos2. Calcule e
interprete la probabilidad de que el promedio muestral difiera de su media
poblacional en menos de 0.513 minutos.
13. De una poblacin X: N(, ), se extrae una muestra aleatoria de n+1
observaciones. Encontrar c tal que el estadstico c( x Xn+1

)/S

tenga

distribucin t. Donde x y S es la media y la desviacin estndar muestral


obtenidas con las n primeras observaciones.
14. Una inspectora de calidad investiga las acusaciones contra una fbrica de cerveza
porque no llena bien sus envases. Una muestra de 25 latas de cerveza indica un
contenido medio x = 33.2 onzas y S = 2.25 onzas. Calcule e interprete la
probabilidad de que el promedio muestral difiera de su media poblacional en
menos de 0.929 onzas.
120

15. Si F ~ f con 10 y 12 grados de libertad, hallar:


a) P(F 0.212)
b) P(0.276 F 4.30)
c) P(F > 3.37)
d) Hallar c y d tal que P(F c) = 0.05 y P(c T d) = 0.90.
16. Si muestras aleatorias independientes de tamaos n1 = n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la probabilidad
que la varianza de la primera muestra sea mayor que 5 veces la segunda.
17. Si muestras aleatorias independientes de tamao n1 = 6 y n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la probabilidad
que la varianza de la primera muestra sea 5 veces ms grande que la segunda
18. Sea X1 , X2 , . , X7 e Y1 , Y2 , . , Y9 muestras aleatorias independientes de
distribuciones normales, ambas con media cero y varianza uno. Calcule e
9
7

interprete: P 2 X i2 7Y j2
j 1
i 1

19. Dos compaas A y B fabrican transistores. La duracin para los fabricados por A
tiene una desviacin estndar de 40 horas, en tanto que los B tienen una
desviacin estndar de 50 horas. Se toma una muestra de 10 transistores de A y 10
de B. Calcule e interprete la probabilidad que la varianza de la muestra A sea al
menos dos veces ms grande que la B.
20. Dos compaas A y B fabrican focos. La duracin de los fabricados por A tiene
una desviacin tpica de 40 horas, en tanto que los B tienen una desviacin
estndar de 50 horas. Se toma una muestra aleatoria de 10 focos de A y 10 de B.
Calcule e interprete la probabilidad que la varianza de la muestra A sea mayor que
tres veces la varianza de la muestra B.

121

Captulo 4. ESTIMACIN PUNTUAL


Lo que escucho lo olvido, lo que veo lo recuerdo, pero lo que hago lo
entiendo
Confucio
CONTENIDO
4.1
4.2
4.3
4.4
4.5
4.6
4.7

Estimadores. Propiedades.
Mtodos de estimacin puntual.
Mtodo de mxima verosimilitud.
Mtodo de los momentos.
Mtodo de los mnimos cuadrados.
Ejercicios resueltos.
Ejercicios propuestos.

En este captulo, se presenta los aspectos fundamentales de la estimacin puntual, es


decir la aproximacin al valor del parmetro a travs de un solo valor, buscando de
observar las propiedades que deben reunir los estimadores de los parmetros, as
como el uso de los mtodos de estimacin puntual.
La estadstica provee tcnicas que permiten obtener conclusiones generales a partir
de una muestra (un conjunto limitado, pero representativo de datos). Cuando
inferimos no tenemos garanta de que la conclusin que obtenemos sea exactamente
correcta. Sin embargo, la estadstica permite cuantificar el error asociado a la
estimacin.
La mayora de las distribuciones de probabilidad dependen de cierto nmero de
parmetros. Por ejemplo: P(), N(, 2 ), B(n, p), etc. Salvo que estos parmetros se
conozcan, deben estimarse a partir de los datos muestrales.
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros que,
en algn sentido, sean los que mejor representan a los verdaderos valores de los
parmetros de inters.
Supongamos que se selecciona una muestra de tamao n de una poblacin. Antes de
obtener la muestra no sabemos cul ser el valor de cada observacin. As, la primera
observacin puede ser considerada una variable aleatoria X1, la segunda una v.a. X2,
etc. Por lo tanto, antes de obtener la muestra denotaremos X1 , X2 , .... , Xn a las
observaciones y, una vez obtenida la muestra los valores observados los denotaremos
x1, x2, .... , xn.
122

4.1 ESTIMADORES. PROPIEDADES


Estimador y estimacin
Definicin: Un estimador puntual del parmetro es un estadstico, una
frmula, obtenido como una funcin de la muestra, es decir = F(X1 , X2 , ....
, Xn).
Definicin: Una estimacin puntual de un parmetro es un valor que puede
ser considerado representativo de y se indicar . Se obtiene una vez
determinada la muestra de valores observados x1 , x2 , .... , xn , es decir

F(x1 , x2 , .... , xn ).
Ejemplo 1.- Con el fin de estudiar si un dado es o no equilibrado, se arroja el dado
100 veces en forma independiente, obtenindose 21 ases. Qu valor podra
utilizarse, en base a esa informacin, como estimacin de la probabilidad de as?
Parece razonable utilizar la frecuencia relativa de ases.
En este caso, si llamamos p a la probabilidad que queremos estimar,
p = 21 / 100 = 0.21.
Propiedades de los estimadores
Observemos que dada una m.a. X1 , X2 , .... , Xn un estimador puntual del
parmetro obtenido en base a ella, es una v.a. . La diferencia - es el
error de estimacin y una estimacin ser ms precisa cuanto menor sea este
error.
Este error es tambin una v.a. dado que depende de la muestra obtenida. Para
algunas muestras ser positivo, para otras negativo. Una propiedad deseable es
que la esperanza del error sea 0, es decir que en promedio el error obtenido al
estimar a partir de diferentes muestras sea cero.
a) Insesgamiento.- un estimador puntual del parmetro es insesgado si:
E( ) = .
Si no es insesgado, a la diferencia E( ) = b ( ) se le denomina sesgo de

.
123

Por lo tanto, se dice que un estimador es insesgado si su distribucin tiene como


valor esperado al parmetro que se desea estimar.
Ejemplo 2.- sea X1 , X2 , .... , Xn una m.a. de una poblacin X con media y
varianza 2. Hemos visto en las distribuciones muestrales que un estimador de la
n

media poblacional es la media muestral, es decir que X

X
i 1

, y

hemos probado que:

Xi 1 n
1 n
1
E ( X ) E i 1 E ( X i ) (n )
n i 1
n
n n i 1

Es decir que la media muestral X es un estimador insesgado de la media


poblacional .
Ejemplo 3.- Si X1 , X2 , .... , Xn una m.a. de una poblacin X ~ N( , 2 ) .
Veremos ms adelante, en estimacin mximo verosmil, que un estimador de la
n

varianza poblacional 2 es

( X
i 1

X )2

, cuya esperanza est dada por:

( X I X )2
n
n
1 E X 2 nX 2 1 E X 2 E X 2
E ( 2 ) E I 1
i
i

n
n
i 1
n i 1

n
2
2
E X i2 E X 2 V ( X i ) E ( X i ) V ( X ) E ( X )
n

=
2

E ( 2 )

Es decir que:
n

Luego 2

( X
i 1

n 1 2

n 1 2

X )2

no es estimador insesgado de la varianza poblacional

2.
b) Insesgamiento asinttico.- Un estimador puntual del parmetro , basado en
una muestra aleatoria X1 , X2 , .... , Xn , es insesgado asintticamente si:
124

lm
n

E()

En el ejemplo 3, si bien 2

( X
i 1

X )2
no es un estimador insesgado,

pero es asintticamente insesgado ya que su esperanza tiende a 2 cuando el


tamao de la muestra tiende a infinito.
n

Ejercicio.- verificar que la varianza muestral s 2

( X
i 1

X )2

n 1

es un

estimador insesgado de la varianza poblacional 2 cualquiera sea la


distribucin.
c) Consistencia.- Sea X1, X2, .... , Xn una m.a. de una distribucin que
depende de un parmetro , y sea n un estimador puntual de basado en
esa muestra. Diremos que n es un estimador consistente de , si

0 ,

lm
P n 1
n
n

Ejemplo 4.- Demuestre que la media muestral X

X
i 1

es un estimador

consistente de la media poblacional .


Solucin.Como la media muestral

X N (, 2 / n) . Y la variable aleatoria

( X )
tiene aproximadamente distribucin N(0, 1) ; tenemos que:
/ n

n
n
n
1
P X P X P
Z
2

Luego:

n
lm
lm
1 = 2 (1) 1 = 1
2
P X =
n
n
125

Por lo tanto, la media muestral X

X
i 1

es un estimador consistente de la

media poblacional , cualquiera que sea el tipo de distribucin de la poblacin,


siempre que tenga media y varianza.
d) Error Cuadrtico Medio (ECM) de un Estimador .- Sea un estimador
puntual

del

parmetro

su

error

cuadrtico

medio

es:

2
ECM () E

Proposicin.-

ECM () E Var() b()


2

Siendo b ( ) = E( ) el sesgo del estimador .


Demostracin.2
ECM () E[( ) 2 ] E[ E() E() ] =

2
2
= E[ E( E() 2 E(E() ]

E[ E( ] E[E() ] 2E E(E()
2

Utilizando las propiedades del operador esperanza, se tiene que:

ECM () E[ E ( ] [E () ] 2E E ( E ()

V ()

[b()]2
0
2

y, por lo tanto, ECM ( ) = Var ( ) + [ b( ) ]2, como queramos probar.


Nota.- Si el estimador es insesgado, el error cuadrtico medio es igual a la
varianza del estimador. Es decir, ECM ( ) = Var ( ).
e) Eficiencia Relativa (Principio de estimacin de menor error cuadrtico
medio).- Dados dos o ms estimadores del parmetro , se debe elegir al que
tiene menor ECM.
En el caso de que los estimadores sean insesgados, se escoge al que tenga
menor varianza. Entre un estimador insesgado y otro que no lo es, si el
126

estimador sesgado tiene una varianza mucho menor que el insesgado, podra ser
preferible su uso.
Ejemplo 5.Suponga que 1 y 2 son dos estimadores de con E ( 1 ) = , E( 2 )
= /3, Var ( 1 ) = 6 , Var ( 2 ) = 2. Cul es mejor estimador de ? por
qu?
Solucin.El estimador 1 es insesgado, por lo tanto: ECM ( 1 ) = Var ( 1 ) = 6 ........
(1)
El estimador 2 es sesgado, por lo tanto:
ECM ( 2 ) = Var( 2 ) + [ E ( 2 ) - ]2 = 2 + [/3 - ]2 = (18 + 4 2) / 9 ...
(2)

1 ser mejor estimador que 2 si:


ECM (1 ) < ECM ( 2 )
Reemplazando (1) y (2):

< (18 + 4 2) / 9

> 3.

Cuya solucin es:

Es decir que 1 ser mejor estimador que 2 si > 3, porque tiene menor
ECM; en caso contrario, si

< 3, 2 ser mejor estimador que 1 .

Rpta.
Ejemplo 6.Sea X1 , X2 , .... , Xn una m.a. de una poblacin X ~ N( , 2 ) . Se puede
verificar inmediatamente que los siguientes estimadores, son estimadores
insesgados de .

1 X ,

X1 X 2
2

3 X 1

Mientras que, la varianza de estos estimadores es:

127

V (1 )

2
n

, V ( 2 )

y V ( 3 ) 2

Por lo tanto, el mejor estimador de ser 1 X por tener menor varianza.


f) Eficiencia.- Se dice que un estimador puntual es un estimador eficiente del
parmetro si es insesgado y de varianza mnima.
Para todos los estimadores insesgados de , Cramer y Rao establecieron una
cota inferior de las varianzas, de la siguiente manera:
La cota inferior de Cramer Rao [ B() ]
Sea un estimador insesgado del parmetro , basado en una m.a. de n
observaciones y sea f(x; ) la distribucin de probabilidades de la v.a X.
Entonces, la cota inferior de la varianza de es:

Var() B( )

1
d

nE ln f ( x;
d

Si la varianza de un estimador insesgado satisface la desigualdad de Cramer


y Rao como una igualdad, este es un estimador insesgado de varianza mnima o
eficiente.
Ejemplo 7.Demostrar que la proporcin muestral p es un estimador insesgado de varianza
mnima de la proporcin poblacional P, de una variable aleatoria X con
distribucin de Bernoulli.
Solucin.Suponga que se extrae una muestra aleatoria simple de tamao n de la poblacin X
con distribucin de Bernoulli., entonces:
n

X
i 1

estima a P.

La proporcin muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) =


P y V(Xi ) = PQ; representa la proporcin de xitos en la muestra y estima a la
proporcin de xitos en la poblacin P. Luego:
128

Xi 1 n
1 n
1
E ( p) E i 1 E ( X i ) P (nP) P
n i 1
n
n n i 1

Es decir que la proporcin muestral p es un estimador insesgado de la


proporcin poblacional P. Veamos si es de varianza mnima.

n
n

X i Var( X i )
i 1
Var( p) Var i 1
n2
n

Var( X i )
i 1

(propiedad de la varianza)

PQ
i 1

nPQ PQ

n2
n

Hallemos la cota inferior de Cramer Rao, B(P):


i)

f(x; P) = P x (1 P) 1 - x , x = 0 , 1

ii)

ln f(x; P) = x ln P + (1 x) ln (1 P)

iii)

d
x 1 x
xP
ln f ( x; P)

dP
P 1 P P(1 P)

iv)

( x P)2 Var( X )
PQ
1
d

E ln f ( x; P) E 2
2 2 2 2
2
PQ
PQ
PQ
dP

P (1 P)

v)

B( P)

1
d

nE ln f ( x; P)
dP

1
PQ
= Var (p)

n
1
n

PQ

Dado que la Var (p) es igual a la cota inferior de Cramer-Rao B(P), p es


un estimador de varianza mnima para P.
Como la proporcin muestral p es un estimador insesgado y de varianza
mnima para P, es un estimador eficiente.

129

4.2 MTODOS DE ESTIMACIN PUNTUAL


Entre los principales mtodos de estimacin puntual se tiene:
El mtodo de mxima verosimilitud (que busca maximizar la probabilidad de que
ocurra la muestra observada)
El mtodo de los momentos (en el que se iguala los correspondientes momentos
poblacionales y muestrales).
El mtodo de los mnimos cuadrados ordinarios (que busca minimizar la varianza
de los errores en el modelo de regresin lineal).
A continuacin presentamos cada uno de estos mtodos de estimacin.
4.3 MTODO DE MXIMA VEROSIMILITUD
El mtodo consiste en seleccionar como Estimador Mximo Verosmil4 (EMV)
puntual del parmetro , al estimador que maximiza la probabilidad de
obtener la muestra realmente observada. Dicha probabilidad est representada
por la funcin de probabilidad conjunta de la muestra y recibe la denominacin
de funcin de verosimilitud.
Procedimiento.Sea X1, X2, .... , Xn una m. a. de X, una variable aleatoria con funcin de
probabilidad f(x; ) que depende del parmetro , y sean x1 , x2 , .... , xn , los
valores observados. Para hallar el EMV del parmetro desconocido se
procede de la siguiente manera:
1) Hallar la funcin de verosimilitud, que representa la probabilidad de
obtener la muestra observada, y se define as:
n

V() = f (x1 , x2 , .... , xn ; ) = f (x1 ; ) f (x2 ; ) .... f (xn ; ) =

f ( x ; )
i 1

2) El mtodo de mxima verosimilitud consiste en tomar como estimacin el


valor que hace mxima la funcin de verosimilitud V(). Sabemos que si

http://buscon.rae.es/drae/ Real Academia Espaola Todos los derechos reservados. Vigsima segunda edicin (2001).
Verosmil: 1. Adj. Que tiene apariencia de verdadero. 2. Adj. Creble por no ofrecer carcter alguno de falsedad.

130

hace mxima a V(), tambin hace mxima a su logaritmo ln V(). Para


convertir el producto en suma, se toma la funcin:
n

L = ln V() =

ln f ( x ; )
i 1

3) Se toma derivadas parciales de L con respecto a , se iguala a cero y se


obtiene . Es decir:
n
L
ln f ( xi ; )

0 = F (x1 , x2 , .... , xn )
i 1

Si la distribucin tiene r parmetros desconocidos 1 , 2 , .... , r ; se toma


derivadas parciales con respecto a cada parmetro y en lugar de una
ecuacin tendremos las r ecuaciones:

L
0 ,
1

L
L
0 , .... ,
0
2
r

a partir de las cuales se obtiene los estimadores 1 , 2 , .... , r .


Ejemplo 8.Hallar el estimador de mxima verosimilitud para el parmetro P (proporcin o
probabilidad de xito) de la distribucin X de Bernoulli.
Solucin.i)

La funcin de probabilidad de la v.a. X Bernoulli es:


f (x; P) = P x (1 P) 1 - x , x = 0 , 1 ; 0 < P < 1

ii) Sea X1 , X2 , .... , Xn una m. a. de X, cuyos valores observados son x1 , x2 ,


.... , xn. Entonces:

f ( xi ; P) P xi (1 P)1 xi , xi = 0 , 1 ; i = 1, 2, . , n
iii) La funcin de verosimilitud V(P) est dada por:
V(P) = f (x1 , x2 , .... , xn ; P) = f (x1 ; P) f (x2 ; P) .... f (xn ; P) =
n

f ( x ; P) = P
i 1

xi

X
n
X
(1 P)1 xi = P i (1 P) i

i 1

x
ln
P

i
xi ln(1 P)
i 1
i 1

iv) L = ln V(P) =

131

xi

v)

n xi

L i 1
i 1

P
P
1 P

1 P

n xi
i 1

x
i 1

P p

Luego:

x
i 1

Rpta.

Estimador muestral que sabemos es un estimador eficiente de la proporcin


poblacional P.
4.4 MTODO DE LOS MOMENTOS
La idea bsica de este mtodo consiste en igualar los momentos muestrales con
los correspondientes momentos poblacionales. Recordemos la siguiente
definicin.
Definicin.Sea X una v.a. con funcin de probabilidad puntual p(x) en el caso discreto o
funcin de densidad f(x) en el caso continuo. Se denomina momento de orden
k (k N) o momento poblacional de orden k a E(Xk ), es decir:

E ( X k ) x k p( x) en el caso discreto, y
x

E( X k )

f ( x)dx en el caso continuo.

si esas esperanzas existen.


Dada una muestra aleatoria X1 , X2 , .... , Xn , el momento muestral de orden k
n

alrededor del origen denotado por Mk , es:

M 'k

X
i 1

k
i

Definicin.Sea X1 , X2 , .... , Xn , una m.a. de una distribucin con funcin de probabilidad


o funcin de densidad que depende de m parmetros 1, 2, ...., m. Los
estimadores de momentos de 1, 2, ...., m son los valores 1, 2, .... , m
que se obtienen igualando m momentos poblacionales con los correspondientes
momentos muestrales. En general, se obtienen resolviendo el siguiente sistema
de ecuaciones:
132

E ( X k ) M 'k

X
i 1

k
i

k = 1, 2, .... , m

Ejemplo 9.Sea X1, X2, .... , Xn, una m.a. de una distribucin exponencial de parmetro .
Como hay un solo parmetro a estimar, basta plantear una ecuacin basada en
el primer momento.
Es decir, M1 = E (X).
Sabemos que para la distribucin exponencial E ( X )

Entonces:

M
'
1

X
i 1

E( X )

X
i 1

1
X

4.5 MTODO DE LOS MNIMOS CUADRADOS


Conocido tambin como el mtodo de los mnimos cuadrados ordinarios, es
utilizado para estimar los parmetros del modelo de regresin lineal simple y
mltiple. Se parte del hecho de que no todos los puntos caen sobre la recta
postulada, a la cual se le agrega la variable aleatoria error y lo que se busca es
n

minimizar la varianza de los errores representada por

e
i 1

2
i

Si Yi = a + b Xi + ei entonces ei = Yi - a - b Xi y por tanto se busca minimizar:


n

i 1

i 1

ei2 (Yi a bX i ) 2
Se toman derivadas parciales con respecto a a y con respecto a b, se igualan a cero
as:
n
d n 2
ei 2 (Yi a bX i )(1) 0

da i 1
i 1

133

n
d n 2
e

2
(Yi a bX i )( X i ) 0
i
db i 1
i 1

Luego de igualarlas a cero se obtiene las denominadas ecuaciones normales:


n

i 1

i 1

na b X i Yi

.. (1)

i 1

i 1

i 1

a X i b X i2 X i Yi .. (2)
Cuya solucin proporciona los siguientes estimadores: de b y a:
n

X Y nX Y
i 1
n

i i

X
i 1

a Y b X

y
2
i

nX

Cuando se reemplaza los resultados muestrales se obtiene: Y a bX i

134

4.6 PROBLEMAS RESUELTOS


n

1.

Demostrar que la varianza muestral 2 s 2

(X
i 1

X )2

n 1

es un estimador

insesgado de la varianza poblacional 2.


Solucin
Sabemos que:

i 1

i 1

( X i X ) 2 X i2 nX 2

Hallando la esperanza de la varianza muestral se tiene:

n 2
n 2
n

2
2
( X I X ) 2 E X i nX E X i nE X
i 1

i 1
E ( 2 ) E (s 2 ) E i 1

n 1
n 1
n 1

nE X i2 nE X 2
n V ( X i ) E ( X i ) V ( X ) E ( X )

=
n 1
n 1
2

2
n 2 2
2
n
n 2 2

n 1
n 1

(n 1) 2
Es decir que: E( ) E(s )
2
n
2

Luego 2 s 2

(X
i 1

X )2

n 1

es estimador insesgado de la varianza poblacional

2.
2.

La primera observacin de una muestra aleatoria de tamao n, podra utilizarse


como un estimador de la media poblacional. Es ste un estimador: a)
insesgado? y b) eficiente?
Solucin
Por definicin de muestra aleatoria se sabe que: X1, X2 , ., Xn son n variables
aleatorias independientes con: E(Xi) = , V(Xi) = 2.
Si X1 , entonces:
a) E( ) E( X1 ) = , luego X1 es un estimador insegado de .
135

b) Como X1 es un estimador insesgado, entonces ECM (X1) = V(X1) = 2.


n

Pero,

X
i 1

tambin es un estimador insesgado de , con

ECM ( X ) V ( X )

2
n .

Comparando los errores cuadrticos medios de ambos estimadores, se tiene


que:
ECM (X1) > ECM ( X ) luego X1 no es un estimador eficiente de , ya que

X es un estimador ms eficiente.
3.

Las cajas de un cereal producido por una fbrica deben tener un contenido de 16
onzas (una libra). Un inspector toma una muestra aleatoria simple que arroja los
siguientes pesos en onzas: 15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8,
15.6.
a) Cul es la estimacin puntual del peso medio poblacional de las cajas de
cereal?
b) Cul es la estimacin puntual de la varianza poblacional del peso de las
cajas?
Solucin
a) El estimador puntual de la media poblacional es la media muestral y su
estimacin es la siguiente:
n

Xi
i 1

10

X
i 1

10

15.7 15.7 .... 15.6 159

= 15.9 onzas.
10
10

b) El estimador puntual de la varianza poblacional es la varianza muestral y su


estimacin es:
n

2 S 2
n

10

i 1

i 1

( X i X )2
i 1

n 1

X i2 nX 2
i 1

n 1

10

X
i 1

2
i

10 X 2

10 1

X i2 X i2 15.7 2 15.7 2 .... 15.6 2 = 2528.58.


Reemplazando en la expresion de la varianza muestral se obtiene:
136

10

2 S 2
4.

X
i 1

2
i

10 X 2

10 1

2528 .58 10 x (15.9) 2


= 0.0533 (onzas)2.
9

En una encuesta de opinin a 1000 adultos para conocer su opinin acerca de la


economa. Las respuestas fueron las siguientes:
OPININ:

ADULTOS

La economa se est contrayendo

300

La economa permanece igual

400

La economa est creciendo

200

No sabe/No opina

100

Determine la estimacin puntual de los siguientes parmetros de la poblacin:


a) La proporcin de adultos que opinan que la economa se est contrayendo.
b) La proporcin de adultos que opinan que la economa permanece igual.
c) La proporcin de adultos que opinan que la economa est creciendo.
d) La proporcin de adultos que No sabe/No opina.
Solucin
El estimador puntual de la proporcin poblacional es la proporcin muestral
siguiente:
n

p p

X
i 1

X N de xitos

n
n

a) La estimacin de la proporcin de adultos que opinan que la economa se est


contrayendo es:

X adultos que opinan que la economa se est contrayendo 300

=
n
1000
1000

0.30.
b) La estimacin de la proporcin de adultos que opinan que la economa
permanece igual es:

X adultos que opinan que la economa sige igual


400

= 0.40
n
1000
1000

c) La estimacin de la proporcin de adultos que opinan que la economa est


creciendo es:
137

X adultos que opinan que la economa est creciendo 200

= 0.20.
n
1000
1000

d) La estimacin de la proporcin de adultos que No sabe/No opina es:

X adultos que No sabe/No opina


100

= 0.10.
n
1000
1000

Estimaciones que casi siempre son presentadas como porcentajes de la siguiente


manera:
NMERO Y PORCENTAJE DE ADULTOS, SEGN SU OPININ SOBRE LA
SITUACIN DE LA ECONOMA
OPININ:

5.

ADULTOS

La economa se est contrayendo

300

30

La economa permanece igual

400

40

La economa est creciendo

200

20

No sabe/No opina

100

10

Total

1000

100

Asumiendo que X1 y X2 son variables aleatorias independientes con: E(X1) = 3,


V(X1) = 4, E(X2) = 4, V(X2) = 8. Si 1 = 3X1 X2 y 2 = 3X2 X1 son dos
estimadores de , Cul de los estimadores es ms eficiente?
Solucin
Para determinar cul de los estimadores es ms eficiente hay que hallar sus errores
cuadrticos medios y compararlos.

ECM (i ) V (i ) E(i )

E (1 ) = E[3X1 X2] = 3 E(X1) - E(X2) = 3(3) 4 = 5


V (1 ) = V[3X1 X2] = 32 V(X1) + V(X2) = 9(4) + 8 = 44. Luego:
2

ECM (1 ) V (1 ) E (1 ) =
= 44 + [ - 5]2 = 44 + [2 10 + 25] = 2 10 + 69

E(2 ) = E[3X2 X1] = 3 E(X2) E(X1) = 3(4) 3 = 9


V (2 ) = V[3X2 X1] = 32 V(X2) + V(X1) = 9(8) + 4 = 76. Luego:
138

ECM (2 ) V (2 ) E (2 ) =
= 76 + [ - 9]2 = 68 + [2 - 18 + 81] = 2 - 18 + 157
El estimador 1 es un estimador ms eficiente para que 2 si se cumple que:

ECM (1 ) ECM (2 )
8 < 88

2 10 + 69 < 2 - 18 + 157

< 11.

Si > 11, el estimador 2 es un estimador ms eficiente para que 1 Rpta.


6.

Suponga que tiene una muestra de tamao 2n de una poblacin X con E(X) =
2n

y Var(X) = . Sean X 1
2

Xi
i 1

X2

2n

X
i 1

dos estimadores de , cul

es el mejor estimador de ?
Solucin
2n

Ambos estimadores de propuestos, X 1

Xi
i 1

2n

X2

X
i 1

, son

estimadores insesgados, ya que son medias muestrales con 2n y n observaciones


muestrales respectivamente. Luego, ser mejor estimador el que tenga menor
varianza.
Teniendo en cuenta que E(Xi) = y Var(Xi) = 2, por definicin de muestra
aleatoria, hay que hallar sus varianzas y compararlas.

2n
Xi
V ( X 1 ) V i 1
2n

V ( X i )

n
Xi
V ( X 2 ) V i 1
n

V ( X )

2n

i 1

( 2 n) 2

2n

i 1

( 2 n) 2

2n 2 2

2n
( 2n ) 2

n 2 2

n
n2

i 1

n2

i 1

n2

Se observa que V ( X 1 ) V ( X 2 ) . Por lo tanto, X 1 es el mejor estimador de .


Rpta.

139

7.

Sea X1, X2,..,Xn, una muestra aleatoria de una variable aleatoria X con
distribucin uniforme en el intervalo [, + 1].
a) Demuestre que la media muestral x = es un estimador sesgado de .
b) Calcule el error cuadrtico medio del estimador x .
Solucin
a) Como la variable aleatoria X tiene distribucin uniforme en el intervalo [, + 1],
entonces f ( x)

1
1 , X + 1. As mismo,
1

E( X ) EX i

1
2

2 1
( 1 ) 2 1
y V ( X ) V X i

2
12
12

Si x , entonces:

n
Xi
E ( ) E ( x ) E i 1
n

E( X i )
i 1

i 1

2 1
2 1
1
2


n
2
2

Luego: = x es un estimador sesgado de . Rpta.


b) El error cuadrtico medio del estimador x esta dado por:

ECM ( ) V ( ) E( )

n
Xi
V ( ) V ( X ) V i 1
n

.. (b)

V ( X ) 12
i

i 1

i 1

1
n

2
12n
12n

Reemplazando la varianza de y la esperanza de en (b) se tiene:


2

1
1
1
1 1 3n

ECM ( )


12n
2
12n 4 12n

8.

Rpta.

Sea X1 , X2 , . , X7 una muestra aleatoria de una poblacin con media y


varianza 2. Considere los siguientes estimadores de :

1 = (X1 + X2 + . + X7 ) / 7 ;

2 = ( 2 X1 - X6 + X4 ) / 2

a) Son estimadores insesgados? y b) Cul es mejor estimador de ?


Solucin
a) Por definicin de muestra aleatoria E(Xi) = y Var(Xi) = 2. Luego:
140

E ( X 1 ) E ( X 2 ) .... E ( X 7 ) .... 7

7
7
7
2E ( X 1 ) E ( X 6 ) .E ( X 4 ) 2 2
E 2

2
2
2
Por lo tanto 1 como 2 son estimadores insesgados de . Rpta.
E 1

b) Por ser insesgados, es mejor estimador de el que tiene menor varianza.


Luego:

V 1

V ( X 1 ) V ( X 2 ) .... V ( X 7 ) 2 2 .... 2 7 2
= 0.14 2.

2
49
49
7

2 2 V ( X 1 ) V ( X 6 ) .V ( X 4 ) 4 2 2 2 6 2

= 1.5 2.
V 2

2
4
4
2
Por lo tanto 1 es mejor estimador de que 2 .
9.

Rpta.

Suponga que 1 y 2 son estimadores de con E( 1) = , E( 2) = , Var ( 1


2
) = 6 , Var ( 2 ) = 2. Cul es mejor estimador de ? por qu?
Solucin
De los dos estimadores, es mejor el que tiene menor error cuadrtico medio.
2

Sabemos que: ECM (i ) V (i ) E (i ) .


Como 1 es estimador insesgado de , entonces: ECM (1 ) V (1 ) 6
2
8
ECM (2 ) V (2 ) E (2 ) 2
2
4

El estimador 1 es mejor estimador de que 2 si se cumple que:

ECM (1 ) ECM (2 )

8 2
24 < 8 + 2 2 > 16 4 .
4

Si 4 , el estimador 2 es mejor estimador de que 1 .


10. Suponga que 1 y 2 son 2 estimadores de con:
/3, Var ( 1 ) = 7

Rpta.

E ( 1 ) = /2, E ( 2 ) =

Var ( 2 ) = 6. Cul es mejor estimador de ? Por

qu?
Solucin
141

De los dos estimadores, es mejor el que tiene menor error cuadrtico medio.
2
28

ECM (1 ) V (1 ) E (1 ) 7
2
4

2
54 4

ECM (2 ) V ( 2 ) E (2 ) 6
3
9

El estimador 1 es mejor estimador de que 2 si se cumple que:

28 2 54 4 2

252 + 9 2 < 216 + 16 2


ECM (1 ) ECM (2 )
4
9

36 < 7 2 7 2 > 36

6 7


Si
7 ,

6 7
7 .

el estimador 2 es mejor estimador de que 1 .

Rpta.

11. Si 1 y 2 son estimadores independientes insesgados de un parmetro


desconocido , con varianzas conocidas 12 y 22 respectivamente:
a) Demostrar que = a 1 + (1 a) 2 tambin es un estimador insesgado de
, para cualquier valor de a.
b) Encontrar el valor de a que minimiza la varianza de .
Solucin
a) Si 1 y 2 son estimadores independientes insesgados del parmetro
desconocido , entonces: E( 1 ) = y E( 2 ) = . Luego:
E( ) = E[a 1 + (1 a ) 2 ] = a E( 1 ) + (1 a) E( 2 ) =
= a + (1 a ) = .
Por lo tanto es un estimador insesgado de , para cualquier valor de a.
b) Se tiene como datos: V( 1 ) = 12 y V( 2 ) = 22 . Luego, la varianza del
estimador es:
V( ) = V[a 1 + (1 a ) 2 ] = a2 V( 1 ) + (1 a)2 V( 2 )
Reemplazando la varianza de los estimadores se obtiene:
V( ) = a2 12 + (1 a)2 22 = f(a)
142

Para hallar el valor de a que minimiza la varianza del estimador , se toma la


derivada parcial de V( ) con respecto a a y se iguala a cero. As:

dV ()
= 2a 12 + 2(1 a) 22 (-1) = 0
da

f(a) =

Para resolver la ecuacin anterior se divide entre 2 en ambos miembros y se


tiene:
a 12 - (1 a ) 22 = 0 a 12 + a 22 = 22

a=

22
, punto
12 22

crtico.
f(a) =

d 2V ()
= 2 12 + 2 22 .
da 2

Reemplazando el punto crtico encontrado en f(a) se tiene que:


f(a) = 2 12 + 2 22 > 0 a es un mnimo para la V( ).
Por lo tanto el valor a =
12.

22
minimiza la varianza de . Rpta.
12 22

Sea X una variable aleatoria con media y varianza 2. Dadas dos muestras
aleatorias de tamaos n1 y n2 con medias muestrales X 1 y X 2 respectivamente.
a) Demostrar que: X aX1 (1 a) X 2 , 0 a 1, es un estimador insesgado de
.
b) Asumiendo que X 1 y X 2 son independientes, hallar el valor de a que
minimiza la varianza de X .
Solucin
Se sabe que la media muestral es un estimador insesgado de la media
poblacional. Entonces: E( X 1 ) = y E( X 2 ) = .
Adems, la varianza de la media muestral es igual a la varianza poblacional
entre el tamao de la muestra. Luego: V ( X 1 )

2
n1

y V (X 2 )

a) E( X ) = E[ aX 1 (1 a) X 2 ] = a E( X 1 ) + (1 a) E( X 2 ) =
= a + (1 a) = .
Entonces, X es un estimador insesgado de . L.Q.Q.D.
143

2
n2

b) V( X ) = V[ aX 1 (1 a) X 2 ] = a2 V( X 1 ) + (1 a) 2 V( X 2 ) =
Reemplazando la varianza de las medias muestrales se obtiene:
V( X ) = a2

2
2
+ (1 a)2
= f(a)
n1
n2

Para hallar el valor de a que minimiza la varianza del estimador X , se toma


la derivada parcial de V( X ) con respecto a a y se iguala a cero. As:
f(a) =

2
2
dV ( X )
= 2a
+ 2(1 a)
(-1) = 0
da
n1
n2

Para resolver la ecuacin anterior se divide entre 22 en ambos miembros y se


tiene:

n1
a 1 a
= 0 an2 + an1 = n1 a =
, punto crtico.
n1
n2
n1 n 2
f(a) =

2
2
d 2V ( X )
=
2
+
2
.
n1
n2
da 2

Reemplazando el punto crtico encontrado en f(a) se tiene que:

2
2
f(a) = 2
+2
> 0 a es un mnimo para la V( X ).
n1
n2
Por lo tanto el valor a =
13.

n1
minimiza la varianza de X . Rpta.
n1 n 2

En base a una muestra aleatoria de tamao n de una distribucin Poisson con


parmetro , se pide:
a) Determinar el estimador mximo verosmil del parmetro .
b) Es eficiente el estimador obtenido para el parmetro ?
Solucin
Sea X1, X2, .... , Xn, una m.a. de una distribucin X ~ Poisson( ). Entonces:
f (Xi, ) =

X e
i

Xi !

Adems: E(Xi) = = Var (Xi).

, Xi = 0, 1, 2,

La funcin de verosimilitud es:


n

V() = f(X1, X2, X3 ,, Xn) =

i 1

X e
i

X i!

Xi e n
n

Xi !

i 1

144

Xi

i 1

L = Ln V() = Ln

e n

Xi !

i 1
n

L=

X i Ln n Ln e ln X i ! =
i 1

i 1

i 1

i 1

X i Ln n ln X i !

a) Determinacin del estimador de :


n

Xi

n0

i 1

X
i 1

= x Rpta.

b) Es eficiente el estimador de ?
Ser eficiente si es insesgado y de varianza mnima.

E ( )

1 n
1 n
n
E
(
X
)

i
n i 1
n i 1
n

Por lo tanto = x es un estimador insesgado para .

Es de varianza mnima si: V( ) = B()

V ( )

,
n

B( )

nE
ln f ( x, )

X e

f(X, ) =

X!

ln f(X, ) = X ln - ln e ln X ! = X ln - - ln X !

X
( X )
ln f ( X , ) 1

( X )

ln f ( X , )

1
1
1
E
ln f ( X , )
E ( X ) V ( X ) 2

Luego:

B( )

V ( ) .
n
1 n
n .

Por lo tanto = x es un estimador de varianza mnima.


145

Como = x es un estimador insesgado y de varianza mnima, es un


estimador eficiente para .
14.

En base a una muestra aleatoria de tamao n de la distribucin geomtrica


determine el estimador mximo verosmil del parmetro p.
Solucin
Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Geomtrica (p). Entonces:

f X ( X i ) p(1 p) X 1 ; X i 1, 2,3,.... i 1, 2,3,...., n


Luego la funcin de verosimilitud ser:
n

V ( p) f ( X1 , X 2 ,...., X n ) p(1 p)

X i 1

Xi n

p (1 p) i1
n

i 1

n
Xi n

n
i 1

= n Ln p X i n Ln (1 p)
L = Ln V(p) = Ln p (1 p)

i 1

L n

p p

X
i 1

n
0

1 p

X
i 1

15.

1
X

Rpta.

En base a una muestra aleatoria de tamao n de una distribucin normal N(, 2


) se pide:
a) Determinar el estimador mximo verosmil de y 2.
b) Es eficiente el estimador del parmetro ?
Solucin
Sea X1, X2, .... , Xn, una m.a. de una distribucin X ~ N( , 2 ) . Entonces:

f (Xi )

1
2 2

2 2

( X i )2

; X i ; i 1,2,....,n

La funcin de verosimilitud es:


n

V(,) = f(X1, X2, X3 ,, Xn) =

i 1

n
2

1 2
e
L = Ln V(,) = Ln
2
2

1
2 2

( X i )2

i 1

146

( X i )2

( X i )
1 2 2 2
i 1
e
=
2
2

n
Ln1 Ln ( 2 ) 1 ( X i ) Ln e
2
2

=
L=

n
n
1
Ln Ln 2
2
2
2

(X
i 1

a) Determinacin del estimador de


n
L
1

(2) (1) ( X i ) 0

2
i 1
n

Luego:

(X
i 1

) 0

i 1

n 0

i 1

Por lo tanto:

Rpta.

Determinacin del estimador de 2

L
n
1

2
2 2( )

(X
i 1

) = 0

( Xi ) 2
2( )
i 1

( X i )
i 1

2( )

( Xi )
i 1

Rpta.

b) Es eficiente el estimador de ?
Ser eficiente si es insesgado y de varianza mnima.
n

E( X )

X
i 1

1 n
1 n
n
E X i E( X i )

n i 1
n i 1
n

Por lo tanto = X es un estimador insesgado para .

Es de varianza mnima si: B( )

f(X, ) =

nE
ln f ( x, )

2 2

1 X

1 X
Ln f(X,) = Ln1-Ln 2
Ln e
2
2

147

V ( X )

2
n

1 X
= - Ln 2

1
( X )
ln f ( X , )
(2) ( X )(1) =

B ( )

1
( X )
n E

1
1

=
n
n
( X )
( )
n E

)
(

V (X )

Por lo tanto = X es un estimador de varianza mnima.

Como = X es un estimador insesgado y de varianza mnima, es un


estimador eficiente para .
16.

Rpta.

En base a una muestra aleatoria de tamao n de la distribucin de Pareto


determine el estimador mximo verosmil del parmetro B.
Solucin
Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Pareto (B) . Entonces:

fX (Xi )

BX 0B
, X i X 0 , i 1, 2,...., n . Donde: B = Coeficiente de Pareto > 0 y
X iB 1

Xo = Ingreso mnimo.
La funcin de verosimilitud es:
n

V(B) = f(X1 , X2 , ....,Xn ) =


i 1

BX 0B
B n X 0nB

n
X iB 1
X iB1
i 1

L = Ln V(B) = Ln

B n X 0nB
n

X
i 1

B 1
i

n LnB nB LnX 0 ( B 1) Ln X i
i 1

n
n
L n
n
n Ln X 0 Ln X i 0
Ln X i n Ln X 0
B B
B i 1
i 1

n
n
n
n
Ln X i Ln X 0 Ln ( X i / X 0 )
B i 1
i 1
i 1

148

Ln ( X
i 1

17.

Rpta.

/ X0)

En base a una muestra aleatoria de tamao n de una distribucin Lognormal con


parmetros (, 2). Se pide:
a) Determinar el estimador mximo verosmil de los parmetros y 2.
b) Se sabe que el ingreso familiar anual (en miles de soles) tiene
aproximadamente distribucin Lognormal. Determine una estimacin de
con los ingresos de 20 familias escogidas al azar siguientes:
10
18

50
61

40
16

8
9

12
11

15
19

10
21

25
27

14
25

32
30

Solucin
Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Lognormal (, 2). Entonces:

fX (Xi )

1
X i 2 2

e ( L n X i )

/ 2 2

; X i 0, i = 1, 2, ...., n.

Luego la funcin de verosimilitud ser:


V(, 2) = f ( X1, X 2 ,...., X n )

X
i 1

n
2

1
2 2 e
Xi
1

1
2

e ( L n X i )

/ 2 2

( L n X i )2 / 2 2
i 1

; X i 0, i = 1, 2, 3, .... , n.

i 1

L = Ln V(,) = Ln

n
2

1
2 2 e
Xi
1

( L n X i )2 / 2 2
i 1

i 1

= Ln1 Ln X i
i 1

L = Ln X i
i 1

n
Ln1 Ln ( 2 ) 1 ( Ln X i ) Ln e
2
2

n
n
1
Ln Ln 2
2
2
2

( Ln X

a) Determinacin del estimador de

L
1

(2) (1)

(Ln X
i 1

) 0

149

i 1

Luego:

( Ln X i ) 0

Ln X

i 1

i 1

n 0

Por lo tanto:

Ln X
i 1

Rpta.

Determinacin del estimador de 2

L
n
1

2
2 2( )

( Ln X
i 1

) = 0
n

( Ln X

( Ln Xi )

2( ) i 1
2

i 1

2( )
2

Por lo tanto:

( Ln Xi )

i 1

Rpta.

b) Estimacin de con los ingresos de las 20 familias:


n

Ln10 Ln 50 Ln 40 .... Ln 25 Ln 30
= 2.9538 Rpta.
n
20
Basados en una muestra aleatoria de tamao n, hallar el estimador de momentos

18.

Ln X
i 1

para el parmetro , de la distribucin de Poisson.


Solucin
Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ Poissn ()
Como hay un solo parmetro a estimar, basta plantear una ecuacin basada en el
primer momento.
Es decir, M1 = E (X).
Sabemos que para la distribucin Poisson E(X) = . Entonces:
n

M
'
1

19.

Xi
i 1

E ( X )

X
i 1

Rpta.

Sea X una variable aleatoria con distribucin uniforme en el intervalo [-a , 3a].
Hallar el estimador de a por el mtodo de los momentos, basado en una muestra
aleatoria de tamao n de X.
Solucin

150

Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ uniforme en el
intervalo [ -a , 3a ]. Como el nico parmetro es a, basta plantear una ecuacin
basada en el primer momento.
Es decir, M1 = E (X).
Sabemos que para la distribucin uniforme en el intervalo [a, b], E(X) = (a +
b)/2. Luego: en el intervalo [ -a , 3a ], E(X) = a. Por lo tanto:
n

M
'
1

20.

Xi
i 1

E ( X ) a a

X
i 1

X Rpta.

Basados en una muestra aleatoria de tamao n, hallar el estimador de momentos


para los parmetros y 2 de la distribucin de normal.
Solucin
Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ N(, 2). Como
la distribucin tiene dos parmetros, es necesario igualar los dos momentos
muestrales y poblacionales correspondientes. Es decir:
M1 = E (X)

.. (1)

M2 = E (X2) . (2)
En la distribucin normal E (X) = y E (X2) = 2 + 2. Reemplazando en las
ecuaciones anteriores se tiene:
n

En (1): M
'
1

X
i 1

E ( X )

X
i 1

Rpta.

En (2): M 2'

X
i 1

2
i

E( X 2 ) 2 2

Como la media muestral es un estimador de la media poblacional , la


reemplazamos en la expresin anterior para hallar el estimador de 2.
n

2 2 2 X 2

X
i 1

X i2
i 1

2
i

n
n

X2

X i2 nX 2
i 1

151

(X
i 1

X )2

Rpta.

4.7 PROBLEMAS PROPUESTOS


1.

Si X1, y X2 son variables aleatorias independientes con: E(X1) = 4, E(X2) = 2,


V(X1) = 8 y V(X2) = 4. Siendo 1 = 2X1 3 X2 y 2 = 3 X2 - X1 dos
estimadores de , cul de los estimadores es ms eficiente?

2.

Suponga que tiene una muestra de tamao n de una poblacin X con E(X) = y
n2

Var(X) = . Sean X 1

X
i 1

n2

X2

X
i 1

dos estimadores de , cul es

el mejor estimador de ?
3.

Los pesos netos (grs.) en una muestra aleatoria simple de diez latas de conserva
fueron los siguientes: 159, 162, 159, 158, 156,157, 157, 163, 158, 161
a) Cul es la estimacin puntual del peso neto medio poblacional de las latas de
conserva?
b) Cul es la estimacin puntual de la desviacin estndar poblacional del peso
neto de las latas de conserva?

4.

Realizada una encuesta de opinin, a una muestra aleatoria simple de 800


ciudadanos, en la pregunta, Est usted de acuerdo con la gestin del Alcalde de
la ciudad? 260 responden que S, 440 que No y el resto No sabe/No opina.
a) Cul es la estimacin puntual de la proporcin de la poblacin que Si est de
acuerdo con la gestin del Alcalde de la ciudad?
b) Cul es la estimacin puntual de la proporcin de la poblacin que No est de
acuerdo con la gestin del Alcalde de la ciudad?

5.

Sea X1, X2, . , X10 una muestra aleatoria de una poblacin con media y
varianza 2. Considere los siguientes estimadores de :

1 = (X1 + X2 + . + X10 ) / 10 ;

2 = ( X1 + 3 X5 - X10 ) / 3

a) Son estimadores insesgados? y b) Cul es mejor estimador de ?


6.

Sean 1 y 2 dos estimadores de con E ( 1) = , E ( 2) = /3, Var ( 1 ) = 8,


Var ( 2 ) = 2. Cul es mejor estimador de ? por qu?

152

7.

Suponga que 1 y 2 son 2 estimadores de con:


/3, Var ( 1 ) = 4

E ( 1 ) = /2, E ( 2 ) =

Var ( 2 ) = 3. Cul es mejor estimador de ? Por

qu?
8.

Si 1 y

2 son estimadores independientes insesgados de un parmetro

desconocido , con varianzas conocidas 12 y 22 respectivamente:


a) Demostrar que = k 2 + (1 k ) 1 tambin es un estimador insesgado de
, para cualquier valor de k;
b) Encontrar el valor de k que minimiza la varianza de .
9.

Sea Y una variable aleatoria con media y varianza 2. Dadas dos muestras
aleatorias de tamaos n1 y n2 con medias muestrales y1 y y2 respectivamente.
a) Demostrar que: Y b y2 (1 b) y1 , 0 b 1, es estimador insesgado de .
b) Asumiendo que y1 y y2 son independientes, hallar el valor de b que
minimiza la varianza de Y .

10. En base a una muestra aleatoria de tamao m de la distribucin binomial con


parmetros n y p, determine el estimador mximo verosmil de dichos
parmetros.
11. En base a una muestra aleatoria de tamao n de la distribucin de Pascal o
binomial negativa, determine el estimador mximo verosmil del parmetro p.
12. En base a una muestra aleatoria de tamao n de la distribucin gamma con
parmetros = 2 y , determine el estimador mximo verosmil del parmetro .
13. En base a una muestra aleatoria de tamao n de la distribucin exponencial con
parmetro , se pide:
a) Determinar el estimador mximo verosmil del parmetro .
b) Es eficiente el estimador obtenido para el parmetro ?
14. Basados en una muestra aleatoria de tamao n, hallar el estimador de momentos
para el parmetro p, de la distribucin Bernoulli.
15. Basados en una muestra aleatoria de tamao n, hallar el estimador de momentos
para el parmetro p, de la distribucin Geomtrica.
16. Basados en una muestra aleaatoria de tamao m, hallar el estimador de
momentos para el parmetro p, de la distribucin binomial.
153

17. Basados en una muestra aleatoria de tamao n, hallar el estimador de momentos


para el parmetro p, de la distribucin Pascal o binomial negativa.
18. Sea X una variable aleatoria con distribucin uniforme en el intervalo [-2, 2a].
Basado en una muestra aleatoria de tamao n, halle el estimador de a por el
mtodo de los momentos.
19. En base a una muestra aleatoria de tamao n de la distribucin gamma con
parmetros = 2 y , determine el estimador de momentos del parmetro .
20. En base a una muestra aleatoria de tamao n de la distribucin de Pareto
determine el estimador de momentos del parmetro B.

154

Captulo 5. ESTIMACIN POR INTERVALOS DE


CONFIANZA
Quien hace que las cosas difciles parezcan fciles, es el educador
Emerson
CONTENIDO
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
5.10
5.11
5.12

Intervalo de confianza para la media y tamao de muestra.


Intervalo de confianza para el total (conocida la media).
Intervalo de confianza para la proporcin y tamao de muestra.
Intervalo de confianza para el total (conocida la proporcin).
Intervalo de confianza para la diferencia de medias.
Intervalo de confianza para la diferencia de proporciones.
Intervalo de confianza para la media (n < 30).
Intervalo de confianza para la varianza.
Intervalo de confianza para la razn de varianzas.
Intervalo de confianza para la diferencia de medias (n y m <30).
Ejercicios resueltos.
Ejercicios propuestos.

En el captulo anterior se establecieron una serie de procedimientos para determinar


estimadores y estimaciones de los parmetros a travs de un solo valor, buscando
tambin algunas bondades para dichos estimadores.
En este captulo, se presenta los aspectos fundamentales de la estimacin por
intervalos de confianza, es decir la aproximacin al valor del parmetro a travs de
un rango de valores, como un complemento de la estimacin puntual.
Cuando inferimos usando muestras, no tenemos garanta de que la conclusin
obtenida sea exactamente correcta. Sin embargo, la estadstica permite cuantificar el
grado de confiabilidad y el error asociado a la estimacin (la precisin de la
estimacin).
El objetivo de la estimacin por intervalos de confianza es usar una muestra para
obtener un rango de posibles valores para el parmetro y sean los que mejor lo
representan.

155

Definicin.- El procedimiento de determinar un intervalo [a, b] que comprenda un


parmetro

poblacional con cierta probabilidad 1 - , se llama estimacin por

intervalos. En general, para cualquier parmetro y su estimador , el intervalo de


confianza ser:



1 P(a b) P( k k ) P
k2
k1
Donde:
a = Lmite inferior del intervalo de confianza.
b = Lmite superior del intervalo de confianza.
k = una constante positiva que corresponde al valor de la distribucin del estimador
para una probabilidad 1 .
1 - = Nivel de confianza (probabilidad de que el parmetro poblacional este
comprendido en el intervalo) cuyo valor se toma de 0.90, 0.95 o 0.99.
Ejemplo 1.S 1 = 0.95 se dice que se tiene un intervalo de confianza del 95% y que la
probabilidad de que el intervalo contenga el verdadero valor del parmetro es del
95%. Es decir, que si para muestras distintas y bajo el mismo procedimiento se
construye el intervalo repetidamente, 95 de cada 100 de estos intervalos, contendr el
parmetro y 5 de ellos no.
Se puede pensar que 1 significa certeza, seguridad y significa riesgo. La seguridad
menos el riesgo, es decir 1 - da, por lo tanto, el coeficiente de confianza de nuestras
afirmaciones.
En el caso anterior, se tiene una confianza de que 95 de cada 100 intervalos que se
extraigan como muestra, contendrn el verdadero valor del parmetro. Pero una vez
determinado el intervalo, es decir, una vez calculados numricamente los extremos,
ya no debe hablarse en trminos de confiabilidad ni en trminos probabilsticos, pues
la situacin pasa a ser completamente determinstica. De tal manera, asociado a un
intervalo de confianza ya calculado, se tiene una probabilidad 0 1 de que contenga
al parmetro a estimar y no hay otra opcin, ya que lo contiene o no lo contiene.

156

Resumiendo, los extremos del intervalo son variables aleatorias, mientras que el
parmetro a determinar es constante.
Los pasos a seguir para construir intervalos de confianza para un parmetro, son:
1. Fijar el nivel de confianza 1 que se desea en la estimacin.
2. Extraer la muestra y calcular el o los estadsticos necesarios.
3. Determinar la distribucin muestral (normal estndar Z, t, chi cuadrado, F, etc.)
que tiene el estadstico empleado, el mismo que debe ser una funcin del
estimador y del parmetro, es decir f ( , ).
4. Conocida la distribucin del estadstico y el nivel de confianza, se establece la
relacin: 1 = P[ d1 f ( , ) d2 ]. Donde d1 y d2 son valores obtenidos de
acuerdo a la distribucin muestral.
5. Dentro de la probabilidad se trabaja las desigualdades de modo tal que al centro
quede el parmetro y en los extremos los lmites inferior y superior de confianza
buscados, dependiendo del estimador y de los valores d1 y d2.
Se vern los casos paramtricos, es decir aquellos en los que se tiene conocimiento
del tipo de distribucin de la poblacin o del estimador (Bernoulli, Binomial,
Poisson, Normal, t, chi-cuadrado, F, etc.) los mismos que estudiamos en los captulos
2 y 3.
Trabajaremos primero un Caso General con muestras grandes (n 30) los intervalos
de confianza para la media , la proporcin P, la diferencia de medias X - Y, la
diferencia de proporciones P1 P2, los totales conocida la media y la proporcin, ya
que sus estimadores tienen distribucin normal y la determinacin de los intervalos
de confianza para cada uno de ellos es similar.
Es decir, que s ~ N[, 2 ]
Media:

entonces:

X N (, 2 / n)


~ N ( 0, 1 ). As tenemos:

Z

( X )
~ N(0,
/ n

1).

Total: X N NX N N , N 2 X2

y
157

NX N
~ N(0, 1)
N X

Dif. Medias: X - Y ~ N( X Y , X2 Y )

y Z

X Y ( X Y ) )

X Y

~ N(0 , 1)

Proporcin: p

Total:

X
i 1

X
n

PQ
N P,

A NP Np N NP, N 2 p2

pP
~ N(0, 1)
PQ
n

Dif. Proporc.: p1 p2 ~ N(P1 P2 , p21 p2 ) y

Np NP
~ N(0, 1)
N p

p1 p2 ( P1 P2 )

p p
1

~ N(0 ,

1)
Para todos ellos, dado un nivel de confianza 1 es posible hallar:
1 = P [ - Z0 Z Z0 ] ..................... (1)
Donde los valores Z0 son simtricos, de modo tal que centralizan la probabilidad 1 y se determinan como Z0 = Z

, cuyos valores son ubicados en la tabla de la

distribucin normal estndar. As tenemos:


1-

1 /2

Z0 = Z

0.90

0.95

Z0 = Z0.95 = 1.645

0.95

0.975

Z0 = Z0.975 = 1.96

0.99

0.995

Z0 = Z0.995 = 2.575

Reemplazando la v.a. Z


en (1) y trabajando con la desigualdad buscando

dejar al centro el parmetro , la probabilidad queda como:


1 = P [ - Z0 Z Z0 ] = P [ - Z

Multiplicando por el error estndar del estimador en la desigualdad:

158

1 =P[- Z

- Z

Restando el estimador en la desigualdad


1 = P [- - Z

- - + Z

Multiplicando por (-1) y manteniendo el sentido de la desigualdad, se tiene:


1 = P [ - Z

+ Z

A partir del cual se obtiene el intervalo de confianza para el parmetro , cuyo


estimador ~ N[, 2 ], siguiente:
El parmetro [ - Z0 , + Z0 ] con el 100 (1 ) % de confianza.
Donde el error de estimacin es E = Z0 .
Resumimos el Caso General, sealando que para obtener intervalos del 100 (1 - )%
de confianza para parmetros , cuyo estimador sigue distribucin normal ~ N[,

2 ], al valor del estimador se le debe restar o sumar el error de estimacin E =


Z0 .
Utilizando este resultado veamos rpidamente la determinacin de intervalos de
confianza para los parmetros poblacionales: la media, la diferencia de medias, la
proporcin, la diferencia de proporciones y los totales.

Media :

Total :

Proporcin :

Total :

X Z

X , X Z

N N X N Z X , N X N Z X
1
1
2
2

P p Z p , p Z p
1
1
2
2

N P N p N Z p , N p N Z p
1
1
2
2

159

Dif. Medias : X Y ( X Y ) Z X Y , ( X Y ) Z X Y
1
1
2
2

Dif. Proporc. : P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2
1
1
2
2

5.1

INTERVALO DE CONFIANZA PARA LA MEDIA Y TAMAO DE


MUESTRA
Sea X1, X2, .............., Xn una muestra aleatoria de tamao n de una poblacin X
distribuida con media desconocida y varianza 2 conocida.
Sabemos que el estimador de la media poblacional , es la media muestral

,y

que para n suficientemente grande (n 30) por el teorema central del lmite:

X N (, 2 / n)

( X )
~ N(0, 1).
/ n

Entonces, para un nivel de confianza 1 , se tiene que:

X
1 = P [ - z0 Z z0 ] = P Z
Z
1
2
1 2 / n
Trabajando como en el caso general y dejando al centro de la desigualdad el
parmetro poblacional , se obtiene:


1 = P X Z
X Z
1
1
n
n
2
2

A partir del cual se deduce el intervalo de confianza para la media poblacional


siguiente:

X Z

, X Z

con el 100 (1 ) % de confianza.


n

Si las muestras se toman sin reposicin de una poblacin finita de tamao N,


debe emplearse el factor de correccin por finitud y el intervalo ser:

X Z

N n

, X Z
1
N 1
n
2
confianza.
160

N n
al 100(1 ) % de
N 1

Donde el error de estimacin E para la media es:

E Z

E Z

N n
N 1

La longitud del intervalo de confianza para la media es 2E.


Ejemplo 2
Se hace un estudio de mercado, para determinar la venta promedio de una
nueva marca de gaseosas, durante un mes en una cadena de tiendas. Los
resultados para una muestra de 36 tiendas indicaron ventas promedio de S/1000
con una desviacin estndar de S/120. Calcule e interprete un intervalo de
confianza del 95% para la verdadera venta promedio en la cadena de tiendas.
Solucin
= 1000,

S = 120,

n = 36. En la tabla de la distribucin normal

estndar, al 95% de confianza: Z0 = Z0. 975 = 1.96


Entonces:
[

Z0 / n ] = [1000 1.96x 120/6] = [1000 39.20]

Luego: [960.80, 1039.20] S/. con el 95% de confianza. Rpta.


Interpretacin: la verdadera venta media mensual de gaseosas, en la cadena de
tiendas, se encuentra entre S/ 960.80 y S/ 1039.20 con el 95% de confianza.
TAMAO DE MUESTRA PARA ESTIMAR LA MEDIA
Se sabe que: X N (, 2 / n) Z

( X )
E

/ n / n

Elevando al cuadrado y despejando n se obtiene el tamao inicial de muestra


siguiente:

n0

Z 2 2
E2

Donde:
Z = valor de la abscisa de la distribucin normal estndar para un nivel de
confianza (1 ) dado.
2 = varianza de la variable en estudio. Si se desconoce se estima con una
muestra pasada o reciente (S2).
161

E= |

- | = error mximo permisible.

Si la fraccin inicial de muestreo f = n0 / N 0.05 n0 0.05N n = n0.


Si f = n0 / N > 0.05 es necesario el factor de correccin para poblaciones
finitas y se ajusta el tamao de muestra as:

n0
n
1 0
N

Ejemplo 3
En el estudio de mercado del ejemplo 2, para estimar la venta promedio
mensual de una nueva marca de gaseosas, Qu tamao de muestra debe
tomarse, si se desea que

difiera de en menos de S/. 30, con el 95 % de

confianza?
Solucin
Datos: S = 120, E = |

- | = S/. 30 y segn la tabla de la distribucin normal

estndar, al 95% de confianza: Z = Z0. 975 = 1.96


Entonces:

Z 2 2 1.96 2 x120 2
n0

61 tiendas. Rpta.
E2
30 2
5.2 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la media)
Sea X1, X2, .............., Xn una muestra aleatoria de tamaazo n de una poblacin X
de tamao N, distribuida con media desconocida y varianza 2 conocida.
Sabemos que el estimador del total poblacional X = N , es N , y que para n
suficientemente grande (n 30) por el teorema central del lmite:

X N NX N N , N 2 X2

NX N
~ N(0, 1)
N X

Entonces, para un nivel de confianza 1 , se tiene que:

162

NX N
1 = P [ - z0 Z z0 ] = P Z
Z
1
1
N / n
2
2

Trabajando como en el caso general y dejando al centro de la desigualdad el total


poblacional N , se obtiene:


1 = P NX NZ

N
X

NZ

1
1
n
n
2
2

A partir del cual se deduce el intervalo de confianza para el total poblacional N


siguiente:


N NX NZ
, NX NZ
con el 100 (1 ) % de
1
1
n
n
2
2

confianza.
Si las muestras se toman sin reposicin de una poblacin finita de tamao N,
debe emplearse el factor de correccin por finitud y el intervalo ser:

N NX NZ
1
n
2

N n

, NX NZ
1
N 1
n
2

N n

N 1

al 100(1 ) % de confianza.
Observe que si se quiere construir intervalos de confianza para el total
poblacional, basta con multiplicar por N los lmites encontrados para la media
poblacional; y viceversa, si se conoce el intervalo de confianza para el total
poblacional, entonces dividirlo entre N para determinar los intervalos para la
media poblacional.
Ejemplo 4
En el ejemplo 2, si el nmero de tiendas de la cadena es 1000, calcule e
interprete un intervalo de confianza del 95% para determinar el monto total
mensual de las ventas de la nueva marca de gaseosas en la cadena de tiendas.
Solucin

163

En el ejemplo 2, se ha determinado que la verdadera venta media mensual de


gaseosas en la cadena de tiendas es: [960.80, 1039.20] S/. con el 95% de
confianza.
Entonces, para hallar los lmites de confianza para la real venta total mensual
de gaseosas, se multiplica a los lmites anteriores por 1000. Es decir,
T = N [(1 000x 960.8) , (1 000x1039.2)]
T = N [960 800, 1 039 200] S/. con el 95% de confianza.
Interpretacin: el monto total mensual por la venta de gaseosas se encuentran
entre S/. 960 800 y 1 039 200 con el 95% de confianza.
5.3 INTERVALO DE CONFIANZA PARA LA PROPORCIN Y TAMAO
DE MUESTRA
Sea X1, X2, ..............,Xn una muestra aleatoria de tamaazo n de una poblacin
binomial X con parmetro P.
Sabemos que el estimador de la proporcin poblacional P , es la proporcin
muestral p, y que para n suficientemente grande (n 30) por el teorema central del
lmite:
n

X
i 1

X
n

PQ
N P,

pP
~ N(0, 1)
PQ
n

Entonces, para un nivel de confianza 1 , se tiene que:

pP

1 = P [ - Z0 Z Z0 ] = P Z
Z
1
1
PQ
2
2

Trabajando como en el caso general y dejando al centro de la desigualdad la


proporcin poblacional P, se obtiene:

PQ
PQ
1 = P p Z
P p Z
1
1
n
n
2
2

Luego el intervalo de confianza para la proporcin poblacional P es:


164


PQ
PQ
Pp Z
, pZ
con el 100 (1 ) % de confianza.
1
1
n
n
2
2

Como los valores poblacionales P y Q = 1 - P se desconocen, se estiman mediante


p y q = 1 - p, resulta entonces el intervalo de confianza para la proporcin
poblacional P siguiente:

P p Z
1
2

pq
, pZ
1
n
2

pq
con el 100 (1 ) % de confianza.
n

Si las muestras se toman sin reposicin de una poblacin finita de tamao N,


debe emplearse el factor de correccin por finitud y el intervalo ser:

Pp Z
1
2

pq N n
, pZ
1
n N 1
2

pq N n
al 100 (1 ) % de conf.
n N 1

TAMAO DE MUESTRA PARA ESTIMAR LA PROPORCIN P


n

Se sabe que: p

X
i 1

X
n

PQ
N P,

pP

PQ
n

E
PQ
n

Elevando al cuadrado y despejando n se obtiene el tamao inicial de muestra


siguiente:

Z 2 PQ
n0
E2
Donde:
Z = valor de la abscisa de la distribucin normal estndar para un nivel de
confianza (1 ) dado.
P = proporcin de xitos para la variable en estudio. Si se desconoce se estima
con una muestra pasada o reciente (p). Q = 1 P.
E = |p - P| = error mximo permisible.
Si la fraccin inicial de muestreo f = n0 / N 0.05 n0 0.05N n = n0.
Si f = n0 / N > 0.05 es necesario el factor de correccin para poblaciones
finitas y se ajusta el tamao de muestra as:

165

n0
n
1 0
N

Ejemplo 5
El auditor de una dependencia gubernamental de proteccin del consumidor,
quiere determinar la proporcin de reclamos sobre plizas de enfermedades
que paga el seguro, en un plazo de dos meses de haber recibido el reclamo. Se
selecciona una muestra aleatoria de 200 reclamos y se determina que 80 fueron
pagados en un plazo de 2 meses despus de recibidos. a) Calcule e interprete
un intervalo del 99 % de confianza para la proporcin real de reclamos pagados
dentro de ese plazo de dos meses; y b) Con un 95% de confianza, qu tamao
de muestra (reclamos) ser necesario si desea cometer un error mximo del
5%?
Solucin
a) n = 200,

X = 80,

1 = 0.99,

Z0 = Z 0.995 = 2.575

p = proporcin muestral de reclamos pagados en el plazo de dos meses.

X 80

0.4 ,
n 200

q = 1 p = 0.6

El intervalo de confianza para la verdadera proporcin poblacional P de


reclamos pagados en plazo de dos meses, es:

P p Z
1
2

pq
, pZ
1
n
2

pq

Reemplazando valores se tiene:


P [ 0.40 2.575

0.40 x0.60
; 0.40 + 2.575
200

0.40 x0.60
]
200

P [ 0.40 0.089 ; 0.40 + 0.089 ]


Por lo tanto: P [ 0.311 ; 0.489 ] con el 99% de confianza.

Rpta.

Interpretacin.- la verdadera proporcin (porcentaje) de reclamos, sobre plizas


pagadas dentro del plazo de dos meses de haber recibido el reclamo, se encuentra
entre 0.311 y 0.489 (31.1% y 48.9%) con el 99% de confianza.
b) Datos: p = 0.40, q = 0.60, E = |p - P| = 0.05 y segn la Tabla 1 de la
distribucin normal estndar, al 95% de confianza:
Entonces:

n0

Z 2 pq 1.96 2 x0.40 x0.60

369 reclamos. Rpta.


E2
(0.05) 2
166

Z = Z0. 975 = 1.96

5.4 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la


proporcin)
Sea X1, X2, ..............,Xn una muestra aleatoria de tamaazo n de una poblacin
binomial X con parmetro P.
Sabemos que el estimador del total poblacional A = NP, es Np, y que para n
suficientemente grande (n 30) por el teorema central del lmite:

A NP Np N NP, N 2 p2

Np NP
~ N(0, 1)
N p

Entonces, para un nivel de confianza 1 , se tiene que:

Np NP

1 = P [ - Z0 Z Z0 ] = P Z
Z
1
1
PQ
2
2
N

Trabajando como en el caso general y dejando al centro de la desigualdad el total


poblacional NP, se obtiene:

PQ
PQ
1 = P N p N Z
N P N p N Z
1
1
n
n
2
2

A partir del cual se deduce el intervalo de confianza para el total poblacional NP


siguiente:

PQ
PQ
NP N p N Z
, N pNZ
con el 100 (1 ) % de
1
1
n
n
2
2

confianza.
Como los valores poblacionales P y Q se desconocen, se estiman por p y q, resulta
entonces el intervalo de confianza para el total poblacional NP siguiente:

NP N p N Z
1
2

pq
, N pNZ
1
n
2

pq
con el 100 (1 ) % de
n

confianza.
Si las muestras se toman sin reposicin de una poblacin finita de tamao N,
debe emplearse el factor de correccin por finitud y el intervalo ser:

NP Np NZ
1
2

pq N n
, Np NZ
1
n N 1
2
confianza.
167

pq N n
al 100 (1 ) % de
n N 1

Observe que si se quiere construir intervalos de confianza para el total poblacional,


basta con multiplicar por N los lmites encontrados para la proporcin poblacional; y
viceversa, si se conoce el intervalo de confianza para el total poblacional, entonces
dividirlo entre N para determinar los intervalos para la proporcin poblacional.
Ejemplo 6
En el problema 6, si en la dependencia gubernamental de proteccin del
consumidor hay 5 000 reclamos sobre plizas de enfermedades que paga el
seguro, en un plazo de dos meses de haber recibido el reclamo. Calcule e
interprete un intervalo del 99% de confianza para el total verdadero de
reclamos pagados dentro de ese plazo de dos meses.
Solucin
En el ejemplo 6, se ha determinado que la verdadera proporcin de reclamos,
sobre plizas pagadas dentro del plazo de dos meses de haber recibido el
reclamo, se encuentra entre 0.311 y 0.489 con el 99% de confianza. Entonces,
para hallar los lmites de confianza para el total de reclamos pagados dentro del
plazo de dos meses, se multiplica a los lmites anteriores por 5 000. Es decir,
A = N P [(5 000 x 0.311), (5 000 x 0.489)]
A = N P [1 555, 2 445 ] con el 99% de confianza.

Rpta.

Interpretacin: el verdadero total de reclamos, sobre plizas pagadas dentro del plazo
de dos meses de haber recibido el reclamo, se encuentra entre 1 555 y 2 445 reclamos
con el 99% de confianza.
5.5 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
Sea X1, X2, ..............,Xn una muestra aleatoria de tamaazo n de una poblacin X de
tamao N, distribuida con media X desconocida y varianza X2 conocida.
Sea tambin Y1, Y2, ..............,Ym una muestra aleatoria de tamaazo m de una
poblacin X de tamao M, distribuida con media

desconocida y varianza

Y2 conocida.

Sabemos que el estimador de la diferencia de medias poblacionales X - Y es la


diferencia de medias muestrales X - Y , y que para n y m suficientemente grandes
(n y m 30) por el teorema central del lmite:
168

X - Y ~ N( X Y , X2 Y )

X Y ( X Y ) )

y Z

X Y

~ N(0 , 1)

Entonces, para un nivel de confianza 1 , se tiene que:

X Y ( X Y )
1 = P [- Z0 Z Z0] = P Z
Z
1
1
X Y
2
2

Trabajando como en el caso general y dejando al centro de la desigualdad el


parmetro poblacional X - Y, se obtiene:

1 = P ( X Y ) Z X Y X Y ( X Y ) Z X Y
1
1
2
2

A partir del cual se deduce el intervalo de confianza para la diferencia de medias


poblacionales X - Y siguiente:

X - Y ( X Y ) Z X Y , ( X Y ) Z X Y al 100 (1- )% de conf.


1
1
2
2

Donde, el error estndar de la diferencia de medias muestrales X Y = Y X es:

X Y

X2
n

Y2
m

X Y

X2 N n Y2 M m

n N 1 m M 1

Si se desconoce las varianzas poblacionales, se estiman con las varianzas


muestrales y el error estndar de la diferencia de medias muestrales X Y es:

X Y

S X2 SY2

n
m

X Y

S X2
n

N n SY M m

N 1 m M 1
2

Ejemplo 7
Muestras del pago por hora a los choferes de camiones, en las ciudades X e Y,
proporcionan los siguientes datos:

X = $ 5.40, n = 30, SX = $ 0.16

Y = $ 5.30, m = 30, SY = $

0.15.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre los pagos medios por hora a los choferes de camiones de las dos
ciudades.
b) Son iguales los pagos medios por hora en ambas ciudades?
Solucin
169

a) Un intervalo de confianza para la diferencia de pagos medios por hora a los


choferes de ambas ciudades viene dado por:

X Y ( X Y ) Z X Y , ( X Y ) Z X Y ................ (1)
1
1

Si 1 = 0.95, entonces: Z0 = Z 0.975 = 1.96

X Y

S X2 SY2
(0.16) 2 (0.15) 2

= $ 0.04
n
m
30
30

Reemplazando valores en (1):


X - Y [(5.40 5.30) 1.96 (0.04) , (5.40 5.30) + 1.96 (0.04)]
Luego: X - Y [0.02, 0.18] $ con el 95% de confianza. Rpta.
Interpretacin: la diferencia entre los pagos medios por hora a los choferes de
camiones de las dos ciudades se encuentra entre $ 0.02 y 0.18 con el 95% de
confianza.
b) Responder a la pregunta Son iguales los pagos medios por hora en ambas
ciudades? implica responder si X = Y? o tambin X - Y = 0?
Si apreciamos el intervalo de confianza construido en a) X - Y no puede ser
cero, es decir X - Y 0 o X Y.
Por lo tanto, los pagos medios por hora en ambas ciudades son diferentes.
Rpta.
5.6

INTERVALO DE CONFIANZA
PROPORCIONES

PARA

LA

DIFERENCIA

DE

Suponga que se extrae una muestra aleatoria simple de tamao n1 de la poblacin


binomial 1, de tamao N1 con una proporcin de xitos igual a P1. Sea X1 el
nmero de xitos en la muestra de tamao n1 , entonces la proporcin muestral de
xitos p1 , definida como p1

X1
n1

estima a P1 .

Suponga tambin que se extrae una muestra aleatoria simple de tamao n2 de la


poblacin binomial 2, de tamao N2 con una proporcin de xitos igual a P2. Sea
X2 el nmero de xitos en la muestra de tamao n2 , entonces la proporcin
muestral de xitos p2 , definida como p2

170

X2
n2

estima a P2 .

Para n1 y n2 suficientemente grande (n1 y n2 30) por el teorema central del


lmite:
p1 p2 ~ N(P1 P2 , p21 p2 ) y

p1 p2 ( P1 P2 )

p p
1

~ N(0 , 1)

Entonces, para un nivel de confianza 1 , se tiene que:

p p2 ( P1 P2 )
1 = P [ - z0 Z z0 ] = P Z 1
Z
1
1
p1 p2
2
2

Trabajando como en el caso general y dejando al centro de la desigualdad la


proporcin poblacional P1 - P2 se obtiene:

1 = P ( p1 p2 ) Z p1 p2 P1 P2 ( p1 p2 ) Z p1 p2
1
1
2
2

A partir del cual se deduce el intervalo de confianza para la diferencia de


proporciones poblacionales P1 - P2 siguiente:

P1 P2 ( p1 p2 ) Z

p p , ( p1 p2 ) Z
1

p p al 100 (1 ) % de
1

conf.

Donde p1 p2 = p2 p1 se obtiene a partir de:

p p =
1

P1Q1 P2Q2

n1
n2

p p =

P1Q1 N1 n1 P2Q2 N 2 n2

n1 N1 1 n2 N 2 1

Como los proporciones poblacionales P1 , Q1 , P2 y Q2 se desconocen, se


estiman con las proporciones muestrales p1
= 1 p2 , resultando entonces:

p p =

p1q1 p2 q2

n1
n2

p p =

p1q1 N1 n1 p2 q2 N 2 n2

n1 N1 1 n2 N 2 1

171

X1
X
, q1 = 1 p1 , p2 2 y q2
n1
n2

Ejemplo 8
Una empresa de estudios de mercado quiere estimar las proporciones de
hombres y mujeres que conocen un producto promocionado a escala nacional.
en una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20
hombres y 60 mujeres estn familiarizados con el artculo indicado. a)
Calcular el intervalo de confianza de 95 % para la diferencia de proporciones
de hombres y mujeres que conocen el producto. b) Son iguales las
proporciones de hombres y mujeres que conocen el producto?
Solucin
Sea el grupo 1, el referido a los hombres y el grupo 2, a las mujeres.
a) El intervalo de confianza para la diferencia de proporciones de hombres
(P1 ) y de mujeres (P2 ) que conocen el producto, P1 - P2 est dado por:

P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2 ............... (1)
1
1
2
2

Si 1 = 0.95, entonces Z0 = 1.96


Como:

n1 = 100,

Entonces: p1

p p =
1

X1 = 20,

X 1 20

= 0.20
n1 100

n2 = 200

p2

X2 = 60

X2
60

= 0.30
n2
200

p1q1 p2q2
(0.20)(0.80 (0.30)(0.70)

= 0.0515
n1
n2
100
200

Z0 p1 p2 = 1.96 (0.0515) = 0.1009


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.20 0.30) 0.1009 ; (0.20 0.30) + 0.1009] = [0.10
0.1009]
P1 - P2 [-0.2009 ; 0.0009] con el 95% de confianza.

Rpta.

Interpretacin: la diferencia de proporciones de hombres (P1) y de


mujeres (P2) que conocen el producto, est entre -0.2009 y 0.0009 con el
95% de confianza.
b) La pregunta Son iguales las proporciones de hombres y mujeres que
conocen el producto? implica preguntar P1 = P2? o tambin P1 - P2 = 0?
172

La diferencia P1 - P2 = 0 est incluida en el intervalo de confianza construido


en a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2.
Por lo tanto, las proporciones de hombres y mujeres que conocen el producto
son iguales.

Rpta.

Veamos a continuacin la construccin de intervalos de confianza para la


media poblacional y la diferencia de medias poblacionales, cuando se trabaja
con muestras pequeas (n < 30), donde es necesario utilizar la distribucin t
de student. El proceso de construccin es idntico a los determinados
anteriormente.
5.7 INTERVALO DE CONFIANZA PARA LA MEDIA (n < 30)
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n, de una variable aleatoria
X con distribucin N(, ), con varianza desconocida, al estudiar la
distribucin t de student vimos que para muestras pequeas, n < 30, la variable
aleatoria:

X
~ tn-1
S/ n

Esta variable aleatoria depende de valores conocidos con la informacin


muestral, entonces, dado un nivel de confianza 1 es posible hallar:
1 = P [ - t0 T t0 ] ..................... (1)
Donde los valores t0 son simtricos, de modo que centralizan la probabilidad 1
- y se determinan como t0 = t

, n 1

, cuyos valores son ubicados en la tabla

de la distribucin t de student.
Reemplazando la variable aleatoria T

X
en (1) y trabajando con la
S/ n

desigualdad buscando dejar al centro el parmetro , la probabilidad queda


como:
1 = P [- t0 T t0 ] = P [ - t0

X
S/ n

t0]

Multiplicando por el error estndar del estimador S / n en la desigualdad:


173

1 = P [- t0 S / n X t0 S / n ]
Restando el estimador X en la desigualdad
1 = P [- X - t0 S / n - - X + t0 S / n ]
Multiplicando por (-1) y manteniendo el sentido de la desigualdad, se tiene:
1 = P [ X - t0 S / n X + t0 S / n ]
A partir del cual se obtiene el intervalo de confianza para el parmetro ,
[ X - t0 S / n ,

X + t0 S / n ] con el 100 (1 - )% de confianza.

El intervalo de confianza para el total N se determina multiplicando el intervalo


de confianza para la media por el tamao de la poblacin N, obtenindose:
N [N X - Nt0 S / n ; N X + Nt0 S / n ] con el 100 (1 - )% de
confianza.
Ejemplo 9
Una Universidad grande (12 000 alumnos) quiere estimar el nmero
promedio de das de enfermedad de los estudiantes

durante

un ao

acadmico; una muestra de 25 estudiantes indica que x = 5.2 das y S = 3.1


das.
Calcule e interprete intervalos de confianza del 95% Para: a) el verdadero nmero
medio de das de enfermedad de los estudiantes, y b) el verdadero nmero total
de das que los estudiantes se enferman en un ao.
Solucin
N = 12 000 alumnos, n = 25, x = 5.2 das y

S = 3.1 das

Para 1 = 0.95 , t0 = t24 , 0.975 = 2.064


a) El intervalo de confianza para la media est dado por:
[ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
[5.2 2.064 x

3.1
3.1
, 5.2 + 2.064 x
] = [5.2 1.28]
25
25

Por lo tanto: [3.92 ; 6.48] das con el 95% de confianza.


Rpta.

174

Interpretacin: en la Universidad el verdadero nmero medio de das de


enfermedad de los estudiantes en el ao, se encuentra entre 3.92 y 6.48 das
con el 95% de confianza.
b) Para hallar el intervalo de confianza para el total se multiplica por N = 12 000
el intervalo de confianza para la media encontrado en a) y se obtiene:
Total = N [12 000 (3.92) , 12 000 (6.48) ]
Por lo tanto:
Total = N [47,040 ; 77,760 ] das con el 95% de confianza.
Rpta.
Interpretacin: el verdadero nmero total de das que los estudiantes se
enferman en un ao, se encuentra entre 47,040 y 77,760 das con el 95% de
confianza.
5.8 INTERVALO DE CONFIANZA PARA LA VARIANZA
Al estudiar la distribucin chi-cuadrado determinamos que si X1, X2, ... , Xn es una
muestra aleatoria de tamao n de una poblacin normal con media y varianza ,
entonces:
La funcin de la varianza muestral x 2

n 1S

~ x n21 .

Esta variable aleatoria depende de valores conocidos con la informacin


muestral, entonces, dado un nivel de confianza 1 es posible hallar:
1 = P [ a x 2 b ] ..................... (2)
Los valores a y b son valores chi-cuadrados, obtenidos en la tabla 2, con n 1
grados de libertad, centralizando la probabilidad 1 - y se determinan como:
a = x2

n 1 ,

b = x2

n 1 , 1

los mismos que son ubicados en la tabla 2, de la distribucin chi cuadrado.


Reemplazando la v.a. x 2

n 1S

en (2) y trabajando con la desigualdad

buscando dejar al centro el parmetro , la probabilidad queda como:


1 = P [ a x2 b ] = P [ a
175

n 1S

b]

Dividiendo entre (n 1) S2 tenemos:

a
1
b
1 = P
2
2
2

(n 1)S
(n 1)S
Tomando el inverso dentro de la probabilidad y buscando mantener el sentido
de la desigualdad, se tiene que:

(n 1) S 2
(n 1) S 2
2
1 = P

b
a

Luego se tiene que el intervalo de confianza para la varianza , est dado por:

(n 1)S 2 (n 1)S 2
(n 1) S 2 (n 1) S 2
,

=
, 2
2
al 100 (1 )% de

b
a

xn 1 , 1 / 2 xn 1 , / 2
confianza.
Un intervalo de confianza para la desviacin estndar se obtiene sacando raz
cuadrada a cada uno de los lmites del intervalo anterior, entonces:

(n 1)S 2 (n 1)S 2 (n 1)S 2 (n 1)S 2


,

,
al 100(1 )% de
= 2
xn21 , / 2
b
a

xn 1 , 1 / 2
confianza
Ejemplo 10
Para el ejemplo 9, en la Universidad grande se estudia el nmero de das que
los estudiantes se enferman durante el ao acadmico, una muestra de 25
estudiantes indica que x = 5.2 das y S = 3.1 das.
Calcule e interprete intervalos de confianza del 95% para la varianza y la
desviacin estndar del nmero de das que los estudiantes se enferman.
Solucin
El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 25 y 1 = 0.95, entonces:


2
a = x24
, 0.025 = 12.4

2
b = x24
, 0.975 = 39.4

Se tiene adems la desviacin estndar muestral S = 3.1


176

Reemplazando valores en el intervalo de confianza para la varianza, se tiene que:

(25 1)(3.1)2 (25 1)(3.1)2



,

39.4
12.4

Por lo tanto:
[5.85 , 18.60 ] (das) con el 95% de confianza.

Rpta.

[ 2.42 , 4.31 ] (das) con el 95% de confianza.

Rpta.

Interpretacin: la varianza del nmero de das que los estudiantes enferman en la


Universidad durante el ao acadmico, se encuentra entre 5.85 y 18.60 (das) con
el 95% de confianza. Mientras que la desviacin estndar esta entre 2.42 , 4.31
(das) con el 95% de confianza.
5.9 INTERVALO DE CONFIANZA PARA LA RAZN DE VARIANZAS
Cuando estudiamos la distribucin F, encontramos que si se toman dos muestras
aleatorias independientes de tamaos n y m, de las poblaciones X ~ N (X ,

X2 )

e Y ~ N Y , Y2 , la distribucin de probabilidades para la razn de

varianzas muestrales estaba dada por:

S X2 Y2
~ Fn1,m-1
SY2 X2

Esta variable aleatoria depende de valores conocidos con la informacin


muestral, entonces, dado un nivel de confianza 1 es posible hallar:
1 = P [ c F d ] ..................... (3)
Los valores c y d son valores de la variable aleatoria F, de modo tal que
centralizan la probabilidad 1 - y se determinan como:
c= F

n 1 , m 1,

d= F

n 1 , m 1 , 1

los mismos que son ubicados en la tabla 4 de la distribucin F.

S X2 Y2
Reemplazando la variable aleatoria F 2 2 en (3) y trabajando con la
SY X
desigualdad buscando dejar al centro el parmetro razn de varianzas
poblacionales X2 / Y2 , la probabilidad queda como:
1 =P[c F d]=P[c
177

S X2 Y2
d]
SY2 X2

Multiplicando en la desigualdad por

SY2
se tiene que:
S X2
SY2
S X2

1 =P[c

Y2
SY2

d
]
X2
S X2

Tomando el inverso dentro de la probabilidad y buscando mantener el sentido de la


desigualdad, obtenemos:
1 =P[

1 =P[

1 S X2
X2
1 S X2

]
d SY2
c SY2
Y2

1
F

n 1, m 1,1

X2
S X2
1

2
2
Y
SY
F

n 1, m 1,

S X2
]
SY2

Entonces, el intervalo de confianza para la razn de varianzas X2 / Y2 , est dado


por:

2
2
S X2 / S Y2 S X2 / S Y2
S X2 / SY2
X2
S X / SY
;
;

F
c
F
Y2

d
n 1,m1,1
n 1, m 1,
2
2

al 100 (1 )% de

conf.
Ejemplo 11
Se hacen 16 ensayos para cada uno de los tratamientos X e Y, con las siguientes
varianzas maestrales S X2 = 35 y SY2 = 10. a) Calcule e interprete un intervalo del
95% de confianza para X2 / Y2 b) Son iguales las varianzas poblacionales de X
e Y?
Solucin

a) El intervalo de confianza solicitado es:


Datos:

n = m = 16,

S X2 = 10,

S X2 / S Y2 S X2 / S Y2
X2

c
Y2
d

SY2 = 35.

Como 1 = 0.95,

entonces d = F15 , 15 , 0.975 = 2.86 y c = F15 , 15 , 0.025 = 1/ F15 , 15 , 0.975 = 1/ 2.86 =


0.349.
Reemplazando valores en el intervalo se tiene que:

178

X2
35 / 10
35 / 10

= [1.22; 10.03] con el 95% de confianza. Rpta.
;
2
Y
0.349
2.86
Interpretacin: la razn de varianzas de las poblaciones X e Y se encuentra entre
1.22 y 10.03 con el 95% de confianza.
b) Preguntar si Son iguales las varianzas poblacionales de X e Y? es similar a
preguntar si X2 = Y2 ? o tambin si

X2
= 1?
Y2

Para responder a esto ltimo, basta con observar si el valor 1 se encuentra en el


intervalo construido. Como el valor 1 no pertenece al intervalo de confianza,
entonces:

X2
1
Y2

X2 Y2 .

Por lo tanto, las varianzas poblacionales de X e Y no son iguales.


Rpta.

Si en el intervalo de confianza para la razn de varianzas

X2
= 1, las varianzas
Y2

son iguales (homogneas) caso contrario, son diferentes (heterogneas)

5.10 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


(n y m <30)
Cuando se quiere determinar intervalos de confianza para la diferencia de
medias con muestras aleatorias independientes pequeas (n y m < 30) se tiene
que tomar en cuenta si las varianzas de las poblaciones normales de donde se
extraen son homogneas o heterogneas, usando el intervalo de confianza
para la razn de varianzas propuesto en el acpite anterior.
A) Caso de varianzas homogneas ( X2 = Y2 = )
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n, de una variable
aleatoria X con distribucin N(X, ). Sea tambin Y1, Y2, ..., Ym una
muestra aleatoria de tamao m de una variable aleatoria Y, con distribucin
N(Y, ). De acuerdo a lo estudiado en la distribucin t de student vimos que
para muestras pequeas, n < 30 y m < 30, la variable aleatoria:
179

X Y X Y
n 1S X2 m 1SY2 1 1
nm2

~ t n+m-2

El estimador de la varianza comn es: S c2 S p2

(n1 1) S X2 (n2 1) SY2


n1 n2 2

representa la varianza combinada (o ponderada) de las varianzas muestrales.


Esta variable aleatoria depende de valores conocidos con la informacin
muestral, entonces, dado un nivel de confianza 1 es posible hallar:
1 = P [ - t0 T t0 ] ..................... (4)
Los valores t0 son simtricos, de modo tal que centralizan la probabilidad 1 y se determinan como t0 = t

, cuyos valores son ubicados en la

, nm 2

tabla de la distribucin t de student.


Reemplazando la variable aleatoria T

X Y X
Sc

Y
1 1

n m

en (4)

tenemos:
1 = P [- t0 T t0] = P [- t0

X Y X
Sc

Y
t0]
1 1

n m

Trabajando con la desigualdad buscando dejar al centro el parmetro X - Y,


de manera similar a los intervalos anteriores, la probabilidad queda como:
1 = P [ ( X - Y ) - t0 S c

1 1

X - Y ( X - Y ) + t0 S c
n m

1 1
]
n m

A partir del cual se tiene que el intervalo de confianza para la diferencia de


medias poblacionales X - Y est dado por:
X - Y [( X - Y ) t0 S c

1 1
] al 100(1- )% de confianza.
n m

Ejemplo 12
Se compararon dos marcas de cigarrillos, X e Y, respecto a su contenido
medio de nicotina en miligramos; dos muestras aleatorias de 21 cigarrillos de
cada marca, dieron estos resultados:

X = 14.3, n = 21, SX = 2.9

y
180

Y = 15.7, m = 21, SY = 3.8.

a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia


entre los contenidos medios de nicotina para las dos marcas de cigarrillos. b)
Son iguales los contenidos medios de nicotina?
Solucin
a) Primero determinamos si las varianzas son iguales con el intervalo de confianza

S X2 / S Y2 S X2 / S Y2
X2
;
para la razn de varianzas: 2

c
Y
d
Datos: n = m = 21,

S X2 = 2.92 = 8.41, SY2 = 3.82 = 14.44. Como 1 = 0.95,

entonces d = F20 , 20 , 0.975 = 2.46 y c = F20 , 20 , 0.025 = 1/ F20 , 20 , 0.975 = 1/ 2.46 =


0.407.
Reemplazando valores en el intervalo se tiene que:

X2
8.41 / 14.44
8.41 / 14.44

;
2
= [0.24; 1.43] con el 95% de confianza.
Y
0.407
2.46
Dado que el intervalo toma el valor 1, es decir

X2
= 1, entonces X2 = Y2 .
Y2

Considerando que las muestras son pequeas y que las varianzas del contenido de
nicotina son iguales, el intervalo de confianza para la diferencia entre los
contenidos medios de nicotina para las dos marcas de cigarrillos est dado por:
X - Y [ ( X - Y ) t0

(n 1) S X2 (m 1) SY2
nm2

1 1

]
n m

Datos del problema:

X = 14.3, n = 21, SX = 2.9

Y = 15.7, m = 21, SY = 3.8.

Como n = m = 21, los grados de libertad de la t son n + m 2 = 21 + 21 2 =


40
Si 1 = 0.95,

t0 = t40 , 0.975 = 2.021.

Reemplazando valores en la frmula para el intervalo de confianza, tenemos que:


X - Y [(14.3 15.7) 2.021

(21 1)(2.9) 2 (21 1)(3.8) 2


21 21 2

X - Y [ (14.3 15.7) 2.021(1.0431) ]

1
1

]
21 21

X - Y [ -1.40

2.11 ]
Por lo tanto:
X - Y [-3.51 , 0.71] mg. de nicotina con el 95% de confianza.
181

Rpta.

Interpretacin: la diferencia entre los contenidos medios de nicotina para las


marcas de cigarrillos X e Y se encuentra comprendida entre -3.51 , 0.71 mg. con
el 95% de confianza.
b) Responder a la pregunta Son iguales los contenidos medios de nicotina en los
cigarrillos X e Y? implica preguntar X = Y? o tambin X - Y = 0?
La diferencia X - Y = 0 est incluida en el intervalo de confianza construido en
a), es decir X - Y = 0

X = Y. Por lo tanto, los contenidos medios de

nicotina en los cigarrillos X e Y son iguales.

Rpta.

B) Caso de varianzas heterogneas ( X2 Y2 )


Sea X1, X2, ..., Xn una muestra aleatoria de tamao n, de una variable
aleatoria X con distribucin N(X, X2 ). Sea tambin Y1, Y2, ..., Ym una
muestra aleatoria de tamao m de una variable aleatoria Y, con distribucin
N(Y, Y2 ). Si las varianzas son diferentes, se cumple que:

X Y X
2
X

Y
2
Y

S
S

n
m

~ tH

S12 S22

n
n2
Donde: H 12
(valor entero) representa los grados de libertad.
2
S12 S22

n1 n2
n1 1 n2 1
Esta variable aleatoria depende de valores conocidos con la informacin
muestral, entonces, dado un nivel de confianza 1 es posible hallar:
1 = P [ - t0 T t0 ] ..................... (5)
Los valores t0 son simtricos, de modo tal que centralizan la probabilidad 1 y se determinan como t0 = t

1 , H
2

, cuyos valores son ubicados en la tabla 3

de la distribucin t de student.
Reemplazando la variable aleatoria T

tenemos:
182

X Y X

S X2 S Y2

n
m

en (5)

1 = P [- t0 T t0] = P [- t0

X Y X

S X2 S Y2

n
m

t0]

Trabajando con la desigualdad buscando dejar al centro el parmetro X - Y,


de manera similar a los intervalos anteriores, la probabilidad queda como:

S X2 S Y2

X - Y ( X - Y ) + t0
n
m

1 = P [ ( X - Y ) - t0

S X2 S Y2

]
n
m

A partir del cual se tiene que el intervalo de confianza para la diferencia de


medias poblacionales X - Y est dado por:
X - Y [( X - Y ) t0

S X2 S Y2

] al 100(1- )% de confianza.
n
m

Ejemplo 12
En un estudio para determinar si hay diferencia en el salario semanal de los
hombres y las mujeres de una gran empresa, se toma una muestra de 18
hombres encontrndose un promedio de S/. 420 y una desviacin estndar de
S/. 50, mientras que en una muestra de 15 mujeres se encontr un promedio
de S/. 360 y una desviacin estndar de S/. 90. Se pide:
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre los salarios medios semanales de hombres y mujeres.
b) Son iguales los salarios medios semanales de hombres y mujeres?
Solucin
a) Primero determinamos si las varianzas de los salarios son iguales con el
intervalo de confianza para las varianzas:

Datos: nH = 18,

X M = S/. 360,

X H = S/. 420,

S H2 / S M2 S H2 / S M2
H2

M2
c
d

S H2 = 502 = 2500,

S M2 = 902 = 8100.

nM = 15,

Como 1 = 0.95,

entonces d = F17 , 14 , 0.975 = 2.90 y c = F17 , 14 , 0.025 = 1/ F14 , 17 , 0.975 = 1/ 2.75 =


0.364.
Reemplazando valores en el intervalo se tiene que:

183

H2
2500 / 8100
2500 / 8100

;
2
= [0.11;
0.364
M
2.90

0.85] con el 95% de

confianza.
Dado que el intervalo no toma el valor 1, es decir

H2
1, entonces H2
2
M

M2 .
Considerando que las muestras son pequeas y que las varianzas de los
salarios semanales de hombres y mujeres son diferentes, el intervalo de
confianza del 95% para la diferencia de los salarios medios de hombres y
mujeres est dado por:
H - M

[( X H - X M ) t0

S H2 S M2

]
n H nM

Donde t0 = tH, 0.975 = t20, 0.975 = 2.086.


2

2
S H2 S M2
2500 8100

n H nM
18
15

Donde: H =
=
= 20.98 20
2
2
2
2
2500
8100
S H2
S M2

18 15
n H nM
18 1
15 1
n H 1 nM 1
Reemplazando valores en el intervalo de confianza propuesto, se tiene:
2500 8100

H - M [(420 - 360) 2.086 x


] = [60 54.35]
18
15
Por lo tanto: H - M [5.65 ; 114.35] S/. con el 95 % de confianza.
Rpta.

Interpretacin: la diferencia entre los salarios medios semanales de hombres y


mujeres se encuentra comprendido entre S/. 5.65 y S/. 114.35 con el 95% de
confianza.
b) Responder a la pregunta Son iguales los salarios medios semanales de
hombres y mujeres? implica responder si H = M? o tambin H - M =
0?
La diferencia

- M = 0 no est incluida en el intervalo de confianza

construido en a), es decir H - M 0 o H M. Por lo tanto, los salarios


medios semanales de hombres y mujeres son diferentes.
184

Rpta.

INTERVALOS DE CONFIANZA PARA UN SOLO PARMETRO


I.C. PARA LA MEDIA POBLACIONAL:
Caso

Intervalo

1. Cuando la muestra es aleatoria de X ~


N (, 2) con 2 conocida o n 30.

X Z

2. Cuando la muestra es aleatoria de X ~


N (, 2) con 2 desconocida, n < 30.

X t

(1 , n1)
2

S
)
n

I.C. PARA EL TOTAL POBLACIONAL: N


A los I.C. para la media multiplicarlos por el tamao de la poblacin N.

I.C. PARA LA VARIANZA POBLACIONAL: 2


Caso

Intervalo

La muestra es aleatoria de una poblacin


normal.

(n 1) S 2 (n 1) S 2
, 2
2

(1 , n 1) ( , n 1)
2
2

I.C. PARA LA PROPORCIN POBLACIONAL: p


Caso

Intervalo

p Z

La muestra es aleatoria y su tamao es


grande (n 30)

p q
n

I.C. PARA EL TOTAL POBLACIONAL: Np


Al I.C. para la proporcin p multiplicarlo por el tamao de la poblacin N.

Tamao de muestra para


n
Z 2 2
n 0
n0 0 2
n
E
1 0
N

Tamao de muestra para p

n0
Z 2 pq
n
n0 0 2
n 1
E
1 0
N

185

INTERVALOS DE CONFIANZA PARA DOS PARMETROS


I.C. PARA LA RAZN DE VARIANCIAS: 12 / 22
Caso
Intervalo

S12 / S 22
12 S12 / S 22
Dos muestras aleatorias independientes de
,

poblaciones normales.
22 F
F
1 , n 1, m 1
, n 1, m 1
2
2

I.C. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES: 1 2


Caso
Intervalo
1. Dos muestras aleatorias independientes,
12 22
X1 X 2 Z

de poblaciones normales con 12 y 22


1
n
n2
1
2
conocidas y n1 y n 2 30.
2. Dos muestras aleatorias independientes
1 1
X1 X 2 t
Sc2
de poblaciones normales con 12 y 22
1 , n1 n 2 2
n1 n2
2
desconocidas pero iguales (varianzas
homogneas) y n1 y n 2 < 30.
(n 1) S12 (n2 1) S22
Con Sc2 1
n1 n2 2
2
3. Dos muestras aleatorias independientes
S12 S21
X1 X 2 t

de poblaciones normales con 12 y 22


1 , H
n1 n2
2
desconocidas
pero
diferentes
2
(varianzas heterogneas) y n1 y n 2 <
S12 S22

30,
n
n2
Con: H 12
, valor entero.
2
S12 S22

n1 n2
n1 1 n2 1
I.C. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES: p1 p2
Caso
Intervalo
Dos muestras aleatorias independientes
con n1 y n2 30

p 1 p 2 Z

p 1 q 1
1

186

n1

p 21 q 2
n2

5.11 PROBLEMAS RESUELTOS


1.

Demostrar que:
a) Las desigualdades - E x + E, son equivalentes a | x - | E
X
b) Si 1 P(Z1 / 2 Z Z1 / 2 ) y Z
entonces:
/ n


1 P X Z
X Z
1
1
n
n
2
2

Solucin
a) En la desigualdad: - E x + E se resta en cada miembro y se
obtiene:
-E x - E

|x -|E

b) En la expresin 1 P(Z1 / 2 Z Z1 / 2 ) se reemplaza Z por:

X
y se obtiene:
/ n

1 = P(Z1 / 2

X
Z1 / 2 )
/ n

Multiplicando en la desigualdad anterior por / n queda:


1 = P Z
X Z
1
n
2
1 2 n
Restando X en la desigualdad:


1 = P X Z
X Z
1
1
n
n
2
2

Multiplicando por -1 y manteniendo el sentido de la desigualdad se tiene:


1 = P X Z
X Z
1
1
n
n
2
2

2.

Se desea estimar el peso total de una partida de 10,000 naranjas. Para ello se
selecciona una muestra aleatoria de 41 naranjas, la cual da una media de 200
gramos y una desviacin estndar de 25 gramos. Calcule e interprete intervalos
de confianza del 95 % para:
187

a) El verdadero peso promedio (), el peso total (N) y la varianza verdadera


(2) de los pesos de las naranjas.
b) Qu tamao de muestra debe tomarse, si se desea que x difiera de en
menos de 13 gr. con el 99 % de confianza?
Solucin
Datos: N = 10000 naranjas, n = 41, X = 200 gr. S = 25 gr. 1 = 0.95
a) Para hallar el intervalo de confianza para la media y el total, si 1 = 0.95
en la Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresin:

X Z

N n

, X Z
1
N 1
n
2

N n
. (1)
N 1

Donde el error de estimacin para la media es:


E= Z

N n
25 10000 41
= 7.64 gr.
1.96
N 1
41 10000 1

Reemplazando en (1) se tiene:


[200 7.64 ;
confianza.

200 + 7.64] = [192.36 ; 207.64] gr. con el 95% de

Rpta.

Interpretacin.- con el 95% de confianza, el verdadero peso medio de las


naranjas se encuentra entre 192.36 y 207.64 gr.
Para hallar el intervalo de confianza para el Total (N) se multiplica los
lmites de la media por N = 10000, as:
Total = N 10000 [192.36 ; 207.64] = [1923600 ; 2076400] gr. con el
95% de confianza.

Rpta.

Interpretacin.- con el 95% de confianza, el verdadero peso total de las


naranjas se encuentra entre 1923600 y 2076400 gr.
El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 41 y 1 = 0.95, entonces en la Tabla 2:


2
a = x40
, 0.025 = 24.4

2
b = x40
, 0.975 = 59.3

Se tiene adems la desviacin estndar muestral S = 25


188

Reemplazando valores en el intervalo de confianza para la varianza, se tiene


que:

(41 1)(25) 2 (41 1)(25) 2



,

59.3
24.4

Por lo tanto:
[421.59 ; 1024.59 ] (gr.) con el 95% de confianza.

Rpta.

Interpretacin: la varianza del peso de las naranjas se encuentra entre 421.59 y


1024.59 (gr.) con el 95% de confianza.

Z 2 2
b) El tamao de muestra est dado por: n0
E2
Donde: | x - | = E = 13, 1 = 0.99 en la Tabla 1, Z = Z0.995 = 2.575
y S = 25. Reemplazando en la frmula para n se tiene:

n0

2.575 2 25 2
= 24.5 25 naranjas.
132

Rpta.

Interpretacin.- para estimar el peso medio de las naranjas con el 99% de


confianza y un error mximo de 13 gramos se requiere de 25 naranjas.
3.

Un proceso est programado para embotellar la cantidad media de 750 mililitros


de gaseosa. Se toma una muestra aleatoria de 41 botellas, resultando una media
de 745 ml. y una desviacin tpica de 12 ml. Calcule e interprete intervalos de
confianza del 99 % para:
a) El verdadero contenido promedio () de gaseosa en las botellas.
b) La varianza verdadera (2) del contenido de gaseosa en las botellas.
Solucin
Datos: n = 41 botellas, X = 745 ml. S = 12 ml. 1 = 0.99
a) Para hallar el intervalo de confianza para la media, si 1 = 0.99 En la
Tabla 1, Zo = Z0.995 = 2.575.
El intervalo de confianza para la media se obtiene con la expresin:

X Z

, X Z

. (1)

Donde el error de estimacin para la media es:

189

E= Z

2.575

12
= 4.83 ml.
41

Reemplazando en (1) se tiene:


[745 4.83 ;
confianza.

745 + 4.83] = [740.17 ; 749.83] ml. con el 99% de

Rpta.

Interpretacin.- con el 99% de confianza, el verdadero contenido medio de


las botellas de gaseosa se encuentra entre 740.17 y 749.83 ml.
b) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 41 y 1 = 0.99, entonces en la Tabla 2:


2
a = x40
, 0.005 = 20.7

2
b = x40
, 0.995 = 66.8

Se tiene adems la desviacin estndar muestral S = 12


Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:

(41 1)(12) 2 (41 1)(12) 2


,

66.8
20.7


Por lo tanto:

[86.23 ; 278.26] (ml.) con el 99% de confianza.

Rpta.

Interpretacin: con el 99% de confianza, la varianza del contenido de las botellas


de gaseosa se encuentra entre 421.59 y 1024.59 (ml.).
4.

Una muestra de 75 clientes de cierta gasolinera indica que el nmero medio de


galones comprados es de X = 14.3 y la desviacin estndar de S = 2.7 galones.
a) Encuentre E tal que tengamos un 95 % de confianza de que el error de
estimacin es menor que E al usar X para estimar .
b) Construya un intervalo de confianza del 95 % para el nmero medio de
galones de gasolina comprados.
c) Construya un intervalo de confianza del 95 % para 2.
d) Encuentre el tamao de muestra necesario para lograr un 95 % de confianza
de que el error mximo de estimacin sea menor que 0.5 galones.
Solucin
190

Datos: n = 75 clientes, X = 14.3 galones, S = 2.7 galones, 1 = 0.95 En


la Tabla 1, Zo = Z0.975 = 1.96.
a) El error de estimacin para la media E es:
E= Z

1.96

2.7
= 0.61 galones.
75

b) El intervalo de confianza para la media se obtiene con la expresin:

X Z

, X Z

. (1)

Reemplazando en (1) se tiene:


[14.3 0.61 ; 14.3 + 0.61] = [13.69 ; 14.91] galones con el 95% de
confianza.

Rpta.

Interpretacin.- en la gasolinera, el verdadero consumo medio de gasolina se


encuentra entre 13.69 y 14.91 galones con el 95% de confianza.
c) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 75 y 1 = 0.95, entonces en la Tabla 2:


2
a = x74
, 0.025 = 52.1

2
b = x74
, 0.975 = 99.7

Se tiene adems la desviacin estndar muestral S = 2.7


Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:

(75 1)(2.7) 2 (75 1)(2.7) 2



,

99
.
7
52.1

Por lo tanto:
[5.41 ; 10.35] (galones) con el 95% de confianza.

Rpta.

Interpretacin: con el 95% de confianza, la varianza de la gasolina comprada


se encuentra entre 5.41 y 10.35 (galones).

Z 2 2
d) El tamao de muestra est dado por: n0
E2
Donde: | x - | = E = 0.5 galones, 1 = 0.95 en la Tabla 1, Z =
Z0.975 = 1.96 y S = 2.7. Reemplazando en la frmula para n se tiene:

191

1.96 2 2.7 2
= 112 clientes.
n0
0.52

Rpta.

Interpretacin.- para estimar el consumo medio de gasolina con el 95% de


confianza y un error mximo de 0.5 galones se requiere una muestra de 112
clientes.
5.

Un proceso est programado para embolsar la cantidad media de 250 gramos de


caf. Se toma una muestra aleatoria de 36 bolsas, resultando una media de 246.5
gramos y una desviacin tpica de 12 gramos.
a) Construya un intervalo de confianza del 95% para el verdadero peso medio de
las bolsas con caf.
b) Se puede afirmar que no se est cumpliendo con el contenido medio en las
bolsas?
c) Construya un intervalo de confianza del 95% para la verdadera varianza de
los pesos de las bolsas con caf. aceptara usted que 2 = 250 gr2 por bolsa?
Solucin
Datos: = 250 gr., n = 36 bolsas, X = 246.5 gr., S = 12 gr., 1 = 0.95
a) Para hallar el intervalo de confianza para la media, si 1 = 0.95 En la
Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresin:

X Z

, X Z

. (1)

Donde el error de estimacin para la media es:


E= Z

1.96

12
= 3.92 gr.
36

Reemplazando en (1) se tiene:


[246.5 3.92 ;
confianza.

246.5 + 3.92] = [242.58 ; 250.42] gr. con el 95% de

Rpta.

Interpretacin.- con el 95% de confianza, el verdadero contenido medio de


las bolsas con caf se encuentra entre 242.58 y 250.42 gr.
b) No se puede afirmar que no se est cumpliendo con el contenido medio en las
bolsas de caf, puesto que = 250 gr., est en el intervalo de confianza
obtenido en a).
192

c) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 36 y 1 = 0.95, entonces en la Tabla 2:


2
a = x35
, 0.025 = 20.6

2
b = x35
, 0.975 = 53.2

Se tiene adems la desviacin estndar muestral S = 12.


Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:

(36 1)(12) 2 (36 1)(12) 2



,

53.2
20.6

Por lo tanto:
[94.74 ; 244.66] (gr.) con el 95% de confianza.

Rpta.

Interpretacin: con el 95% de confianza, la varianza de los pesos de las


bolsas con caf se encuentra entre 94.74 y 244.66 (gr.).
Nota: No aceptara que 2 = 250 gr2 por bolsa, ya que el resultado anterior
indica que es menor de 250 gr2.
6.

Para estimar la cantidad total de depsitos a la vista en dlares, un banco


comercial selecciona una muestra aleatoria de 36 cuentas. La muestra da una
media de $ 5,000 y una desviacin estndar de $ 1,000. Suponiendo que el banco
tiene 12,000 cuentas a la vista. Calcule e interprete intervalos de confianza del
95 % para:
a) El verdadero depsito promedio en las cuentas a la vista.
b) La cantidad total en depsitos.
c) La desviacin estndar verdadera de los depsitos en las cuentas a la vista.
d) Qu tamao de muestra debe tomarse, si se desea que x difiera de en
menos de $ 150 con el 95 % de confianza?
Solucin
Datos: N = 12,000 cuentas, n = 36, X = $ 5,000, S = $ 1,000, 1 = 0.95
a) Para hallar el intervalo de confianza para la media, si 1 = 0.95 En la
Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresin:
193

X Z

, X Z

. (1)

Donde el error de estimacin para la media es:


E= Z

1.96

1000
= $ 326.67. Reemplazando en (1) se tiene:
36

[5,000 326.67 ; 5,000 + 326.67] = [4,673.33 ; 5,326.67] $ con el 95%


de confianza. Rpta.
Interpretacin.- con el 95% de confianza, el verdadero depsito medio a la
vista en las cuentas se encuentra entre 4,673.33 y 5,326.67 dlares.
b) Para hallar el intervalo de confianza para el Total (N) se multiplica los
lmites de la media por N = 12,000, as:
Total = N 12,000 [4,673.33 ; 5,326.67] = [56079,960 ; 63920,040] $
con el 95% de confianza.

Rpta.

Interpretacin.- con el 95% de confianza, el verdadero total de depsitos a la


vista en las cuentas en dlares se encuentra entre $ 56079,960 y 63920,040.
c) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 36 y 1 = 0.95, entonces en la Tabla 2:


2
a = x35
, 0.025 = 20.6

2
b = x35
, 0.975 = 53.2

Se tiene adems la desviacin estndar muestral S = 1,000.


Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:

(36 1)(1000 ) 2 (36 1)(1000 ) 2



,

53.2
20.6

Por lo tanto:
[657,894.74 ; 1699,029.13] ($) con el 95% de confianza.
[811.11 ; 1,303.47] $ con el 95% de confianza.

194

Rpta.

Entonces:

Interpretacin: con el 95% de confianza, la desviacin estndar de los


depsitos a la vista en las cuentas se encuentra entre 811.11 y 1,303.47
dlares.
d) El tamao de muestra est dado por: n0

Z 2 2
E2

Donde: | x - | = E = $ 150, 1 = 0.95 en la Tabla 1, Z = Z0.975 =


1.96 y S = 1,000. Reemplazando en la frmula para n se tiene:

(1.96) 2 (1,000) 2
n0
= 171 cuentas.
(150) 2

Rpta.

Interpretacin.- para estimar el depsito medio a la vista, con el 95% de


confianza y un error mximo de $ 150 se requiere una muestra de 171
cuentas.
7.

De un rea de la ciudad en la que habitan 500 familias se extrae una muestra


aleatoria de 50 familias, obtenindose los siguientes datos sobre el nmero de
hijos por familia:
Hijos por familia (Xi)
Familias (ni)

20

10

Calcule e interprete intervalos de confianza del 95 % para estimar:


a) El nmero medio de hijos por familia en la ciudad.
b) El nmero total de hijos por familia en el rea de la ciudad.
c) La proporcin de familias con menos de 2 hijos en el rea.
d) El total de familias con menos de 2 hijos en el rea.
Solucin
Con la informacin en la tabla se determina el promedio y la varianza muestral de
los hijos por familia as:
6

X n
i

i 1

0 x20 1x10 2 x7 3x6 4 x4 5 x3 73

= 1.46 hijos.
50
50

195

S2

( X i X ) 2 ni

i 1

n 1

X
i 1

n nX 2

2
i i

n 1

231 50 (1.46) 2
= 2.54 hijos2 y S =
50 1

1.594.
6

X
i 1

n 0 2 x20 12 x10 2 2 x7 32 x6 4 2 x4 5 2 x3 = 231

2
i i

Otros datos: N = 500, n = 50, 1 = 0.95.


a) Para hallar el intervalo de confianza para la media y el total, si 1 = 0.95
en la Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresin:

X Z

N n

, X Z
1
N 1
n
2

N n
. (1)
N 1

Donde el error de estimacin para la media es:


E= Z

N n
1.594 500 50
1.96
= 0.42 hijos.
N 1
500 1
50

Reemplazando en (1) se tiene:


[1.46 0.42 ; 1.46 + 0.42] = [1.04 ; 1.88] hijos / familia con el 95% de
confianza.

Rpta.

Interpretacin.- con el 95% de confianza, el verdadero nmero medio de


hijos por familia se encuentra entre 1.04 y 1.88 hijos.
b) Para hallar el intervalo de confianza para el Total (N) de hijos se multiplica
los lmites de la media por N = 500 familias, as:
Total = N 500 [1.04 ; 1.88] = [520 ; 940] hijos al 95% de confianza.
Rpta.
Interpretacin.- el verdadero total de hijos en el rea de la ciudad, se
encuentra entre 520 y 940 hijos, con el 95% de confianza.
c) Para determinar el intervalo de confianza para la proporcin de familias con
menos de 2 hijos en el rea, del enunciado y la tabla tomemos los datos:
N = 500,

n = 50,

en la Tabla 1,

X = 30 familias con menos de 2 hijos, Si 1 = 0.95


Z0 = Z 0.975 = 1.96.

Si p = proporcin muestral de familias con menos de 2 hijos, entonces:


196

X 30

= 0.6,
n 50

q = 1 p = 0.4. El intervalo de confianza para la

verdadera proporcin poblacional P de familias con menos de 2 hijos, es:

Pp Z
1
2

pq
n

N n
, pZ
1
N 1
2

pq N n

n N 1

Reemplazando valores se tiene:


P

1.96

[0.60

1.96

0.60 x0.40 500 50


50
500 1

0.60

0.60 x0.40 500 50


]
50
500 1

P [0.60 0.129 ; 0.60 + 0.129 ]


Por lo tanto:

P [ 0.471 ; 0.729 ] con el 99% de confianza.

Rpta.

Interpretacin.- la verdadera proporcin de familias con menos de 2 hijos en


el rea de la ciudad, se encuentra entre 0.311 y 0.489 con el 95% de
confianza.
d) Para hallar el intervalo de confianza para el Total (NP) de familias con menos
de 2 hijos, se multiplica los lmites de la proporcin por N = 500 familias,
as:
Tot. = NP 500 [0.471; 0.729] = [236; 365] familias al 95% de confianza.
Rpta.
Interpretacin.- el total de familias con menos de 2 hijos en el rea de la
ciudad, se encuentra entre 236 y 365 familias, con el 95% de confianza.
8. En una muestra aleatoria de 1000 hogares de Lima Metropolitana (con 800 mil
consumidores de gas domstico) se encontr que 650 estn a favor de la reduccin
del precio del gas domstico.
a) Calcule e interprete un intervalo del 90% de confianza para la proporcin y
otro para el total verdadero de hogares que estn a favor de la reduccin del
precio del gas domstico.
b) Con un 95% de confianza, qu tamao de muestra ser necesario si desea
cometer un error mximo del 5%?
Solucin

197

Datos: N = 800,000 consumidores de gas, n = 1,000, X = 650 a favor de la


reduccin del precio del gas, 1 = 0.90.
a) Para determinar el intervalo de confianza para la proporcin de hogares que
estn a favor de la reduccin del precio del gas domstico, si 1 = 0.90
En la Tabla 1, Zo = Z0.95 = 1.645.
Si p = proporcin muestral de hogares que estn a favor de la reduccin del
precio del gas domstico, entonces: p

X 650

= 0.65, q = 1 p = 0.35.
n 1000

El intervalo de confianza para la verdadera proporcin poblacional P de


hogares que estn a favor de la reduccin del precio del gas domstico, es:

Pp Z
1
2

pq
, pZ
1
n
2

pq

Se desecha el factor de correccin para poblaciones finitas porque la fraccin


de muestreo n/N < 0.05.
Reemplazando valores se tiene:
P [0.65 1.645

0.65 x0.35
0.65 x0.35
; 0.65 + 1.645
]
1000
1000

P [0.65 0.025 ; 0.65 + 0.025]


Por lo tanto:

P [0.625 ; 0.675] con el 90% de confianza. Rpta.

Interpretacin.- la verdadera proporcin (porcentaje) de hogares que estn a


favor de la reduccin del precio del gas domstico, se encuentra entre 0.625 y
0.675 (62.5% y 67.5%) con el 90% de confianza.
Para hallar el intervalo de confianza para el Total (NP) de hogares que estn a
favor de la reduccin del precio del gas domstico, se multiplica los lmites de
la proporcin por N = 800,000 hogares, as:
Total = NP 800,000 [0.575 ;

0.625] = [460,000 ; 500,000] hogares con el

90% de confianza. Rpta.


Interpretacin.- el total de hogares que estn a favor de la reduccin del precio
del gas domstico en Lima Metropolitana, se encuentra entre 460,000 y
500,000 hogares, con el 90% de confianza.
b) Datos: p = 0.65, q = 0.35, E = |p - P| = 0.05 y segn la Tabla 1 de la
distribucin normal estndar, al 95% de confianza:
198

Z = Z0. 975 = 1.96.

Reemplazando en la frmula para el tamao de muestra se tiene:

Z 2 pq 1.96 2 x0.65 x0.35


n0

350 hogares.
E2
(0.05) 2

Rpta.

Interpretacin.- para estimar la proporcin de hogares que estn a favor de la


reduccin del precio del gas domstico, con el 95% de confianza y un error
mximo del 5% se requiere una muestra de 350 hogares consumidores de gas.
9. Una Encuesta de Opinin realizada en 1000 hogares de Lima Metropolitana
(con 1400 000 hogares) indica que el 30.5 % de los hogares compra peridicos y
revistas.
a) Determine un intervalo de confianza del 95 % para la proporcin y otro para el
total de hogares limeos que compra peridicos y revistas.
b) Aceptara Ud. que menos del 25 % de hogares limeos compra peridicos y
revistas?
c) Con un error del 2.5 % y una confianza del 95 %. Qu tamao de muestra es
necesario para estimar la proporcin de hogares que compran peridicos y
revistas?
Solucin
Datos: N = 1400,000 hogares, n = 1,000, p = 0.305, q = 1 p = 0.695.
a) Para determinar el intervalo de confianza para la proporcin de hogares que
compra peridicos y revistas, si 1 = 0.95 En la Tabla 1, Zo = Z0.975 =
1.96.
Si p = 0.305 es la proporcin muestral de hogares que compra peridicos y
revistas, entonces el intervalo de confianza para la verdadera proporcin
poblacional P de hogares que compra peridicos y revistas, es:

Pp Z
1
2

pq
, pZ
1
n
2

pq

Se desecha el factor de correccin para poblaciones finitas porque la fraccin


de muestreo n/N < 0.05. Reemplazando valores se tiene:
P [0.305 1.96

0.305 x0.695
0.305 x0.695
; 0.305 + 1.96
]
1000
1000

P [0.305 0.029 ; 0.305 + 0.029]


Por lo tanto:

P [0.276 ; 0.334] con el 95% de confianza.


199

Rpta.

Interpretacin.- la verdadera proporcin (porcentaje) de hogares que compra


peridicos y revistas en Lima Metropolitana, se encuentra entre 0.276 y 0.334
(27.6% y 33.4%) con el 95% de confianza.
Para hallar el intervalo de confianza para el Total (NP) de hogares que compra
peridicos y revistas, se multiplica los lmites de la proporcin por N =
1400,000 hogares, as:
Total = NP 1400,000 [0.276 ; 0.334] = [386,400 ; 467,600] hogares con el
95% de confianza.

Rpta.

Interpretacin.- el total de hogares que compra peridicos y revistas en Lima


Metropolitana, se encuentra entre 386,400 y 467,600 hogares, con el 95% de
confianza.
b) No aceptara que menos del 25 % de hogares limeos compra peridicos y
revistas, puesto que se encuentra entre 27.6% y 33.4% (ver la parte a).
c) Datos: p = 0.305, q = 0.695, E = |p - P| = 0.025 y segn la Tabla 1 de la
distribucin normal estndar, al 95% de confianza: Z = Z0. 975 = 1.96.
Reemplazando en la frmula para el tamao de muestra se tiene:

n0

Z 2 pq 1.96 2 x0.305 x0.695

1,303 hogares. Rpta.


E2
(0.025) 2

Interpretacin.- para estimar la proporcin de hogares que compra peridicos


y revistas, con el 95% de confianza y un error mximo del 2.5% se requiere
una muestra de 1,303 hogares.
10. Una muestra aleatoria de 500 compradores de un centro comercial se encontr que
300 compran alimentos y bebidas.
a) Calcule e interprete un intervalo del 99% de confianza para la proporcin
verdadera de compradores que adquieren alimentos y bebidas.
b) Con un 99% de confianza, qu tamao de muestra ser necesario si desea
cometer un error mximo del 4%?
Solucin
Datos: n = 500 compradores, X = 300 compran alimentos y bebidas.

200

a) Para hallar los lmites de confianza para la proporcin de compradores que


adquieren alimentos y bebidas, si 1 = 0.99 En la Tabla 1, Zo = Z0.995 =
2.575.
Si p = proporcin muestral de compradores que adquieren alimentos y bebidas,
entonces: p

X 300

= 0.60,
n 500

q = 1 p = 0.40.

El intervalo de confianza para la verdadera proporcin poblacional P de


compradores que adquieren alimentos y bebidas, es:

Pp Z
1
2

pq
, pZ
1
n
2

pq

Se desecha el factor de correccin para poblaciones finitas, asumiendo un


nmero grande de compradores, tal que la fraccin de muestreo n/N < 0.05.
Reemplazando valores se tiene:
P [0.60 2.575

0.60 x0.40
0.65 x0.35
; 0.60 + 2.575
]
500
1000

P [0.60 0.056 ; 0.60 + 0.056]


Por lo tanto:

P [0.544 ; 0.656] con el 99% de confianza.

Rpta.

Interpretacin.- con el 99% de confianza, la verdadera proporcin (porcentaje)


de compradores que adquieren alimentos y bebidas en el centro comercial, se
encuentra entre 0.544 y 0.656 (54.4% y 65.6%).
b) Datos: p = 0.60, q = 0.40, E = |p - P| = 0.04 y segn la Tabla 1 de la
distribucin normal estndar, al 99% de confianza:

Z = Z0. 995 = 2.575.

Reemplazando en la frmula para el tamao de muestra se tiene:

n0

Z 2 pq 2.575 2 x0.60 x0.40

995 compradores.
E2
(0.04) 2

Rpta.

Interpretacin.- para estimar la proporcin de compradores que adquieren


alimentos y bebidas en el centro comercial, con el 99% de confianza y un error
mximo del 4% se requiere una muestra de 995 compradores.
11. Se tom una muestra aleatoria de 800 mujeres casadas en Lima y se encontr que
560 estn a favor del uso de la pldora del da siguiente.

201

a) Calcule e interprete un intervalo del 95% de confianza para la verdadera


proporcin de mujeres casadas que estn a favor del uso de la pldora del da
siguiente.
b) Con el 95 % de confianza, Qu tamao de muestra debe tomarse, si se desea
un error mximo del 3%?
Solucin
Datos: n = 800 mujeres casadas, X = 560 a favor del uso de la pldora del da
siguiente.
a) Para hallar los lmites de confianza para la proporcin de mujeres casadas que
estn a favor del uso de la pldora del da siguiente, si 1 = 0.95 En la
Tabla 1, Zo = Z0.975 = 1.96.
Si p = proporcin muestral de mujeres casadas que estn a favor del uso de la
pldora del da siguiente, entonces: p

X 560

= 0.70,
n 800

q = 1 p = 0.30.

El intervalo de confianza para la verdadera proporcin poblacional P de


mujeres casadas que estn a favor del uso de la pldora del da siguiente, es:

Pp Z
1
2

pq
, pZ
1
n
2

pq

Se desecha el factor de correccin para poblaciones finitas, asumiendo un


nmero grande de mujeres casadas en Lima, tal que la fraccin de muestreo
n/N < 0.05.
Reemplazando valores se tiene:
P [0.70 1.96

0.70 x0.30
0.70 x0.30
; 0.70 + 1.96
]
800
800

P [0.70 0.032 ; 0.70 + 0.032]


Por lo tanto:

P [0.668 ; 0.732] con el 95% de confianza.

Rpta.

Interpretacin.- la verdadera proporcin (porcentaje) de mujeres casadas que


estn a favor del uso de la pldora del da siguiente en Lima, se encuentra entre
0.668 y 0.732 (66.8% y 73.2%) con el 95% de confianza.
b) Datos: p = 0.70, q = 0.30, E = |p - P| = 0.03 y segn la Tabla 1 al 95% de
confianza:

Z = Z0. 975 = 1.96.

Reemplazando en la frmula para el tamao de muestra se tiene:


202

n0

Z 2 pq 1.96 2 x0.70 x0.30

896 mujeres casadas.


E2
(0.03) 2

Rpta.

Interpretacin.- con el 95% de confianza y un error mximo del 3% para


estimar la proporcin de mujeres casadas que estn a favor del uso de la pldora
del da siguiente, se requiere una muestra de 896 mujeres casadas.
12. Una Encuesta de Opinin realizada a 1000 ciudadanos de Lima Metropolitana
(con 5.5 millones de ciudadanos) indica que el 19.5 % de los ciudadanos juega la
tinka.
a) Determine un intervalo de confianza del 95 % para la proporcin y otro para el
total de ciudadanos limeos que juegan la tinka.
b) Con un error del 3.5 % y una confianza del 95 %. Cul sera el tamao de
muestra necesario para estimar la proporcin de ciudadanos que juega la
tinka?
Solucin
Datos: N = 5500,000 ciudadanos, n = 1,000, p = 0.195, q = 1 p = 0.805.
a) Para determinar el intervalo de confianza para la proporcin de ciudadanos
limeos que juegan la tinka, si 1 = 0.95 En la Tabla 1, Zo = Z0.975 =
1.96.
Si p = 0.195 es la proporcin muestral de ciudadanos limeos que juegan la
tinka, entonces el intervalo de confianza para la verdadera proporcin
poblacional P de ciudadanos limeos que juegan la tinka, es:

Pp Z
1
2

pq
, pZ
1
n
2

pq

Se desecha el factor de correccin para poblaciones finitas porque la fraccin


de muestreo n/N < 0.05. Reemplazando valores se tiene:
P [0.195 1.96

0.195 x0.805
0.305 x0.695
; 0.195 + 1.96
]
1000
1000

P [0.195 0.025 ; 0.195 + 0.025]


Por lo tanto:

P [0.17 ; 0.22] con el 95% de confianza.

Rpta.

Interpretacin.- con el 95% de confianza la verdadera proporcin (porcentaje)


de ciudadanos limeos que juegan la tinka, se encuentra entre 0.17 y 0.22 (17%
y 22%).
203

Para hallar el intervalo de confianza para el Total (NP) de ciudadanos limeos


que juegan la tinka, se multiplica los lmites de la proporcin por N =
5500,000 ciudadanos, as:
Total = NP 5500,000 [0.17 ; 0.22] = [935,000 ; 1210,000] ciudadanos con
el 95% de confianza.

Rpta.

Interpretacin.- el total de ciudadanos limeos que juegan la tinka, se encuentra


entre 935,000 y 1210,000 ciudadanos, con el 95% de confianza.
b) Datos: p = 0.195, q = 0.805, E = |p - P| = 0.035 y segn la Tabla 1 de la
distribucin normal estndar, al 95% de confianza:

Z = Z0. 975 = 1.96.

Reemplazando en la frmula para el tamao de muestra se tiene:

Z 2 pq 1.96 2 x0.195 x0.805


n0

492 ciudadanos.
E2
(0.035) 2

Rpta.

Interpretacin.- para estimar la proporcin de ciudadanos limeos que juegan


la tinka, con el 95% de confianza y un error mximo del 3.5% se requiere una
muestra de 492 ciudadanos.
13. En una muestra aleatoria de 600 compradores de un centro comercial se encontr
que 360 estn a favor de un horario ms amplio para las compras.
a) Calcule e interprete un intervalo del 95% de confianza para la proporcin
verdadera de compradores que estn a favor de un horario ms amplio para
las compras.
b) Esta evidencia es suficiente para concluir que menos de 2/3 de los
compradores estn a favor de un horario ms extenso? Explique.
c) Con un 95% de confianza, qu tamao de muestra ser necesario si desea
cometer un error mximo del 4.5%?
Solucin
Datos: n = 600 compradores, X = 360 estn a favor de un horario ms amplio
para las compras.
a) Para hallar los lmites de confianza para la proporcin de compradores que
estn a favor de un horario ms amplio para las compras, si 1 = 0.95 En
la Tabla 1, Zo = Z0.975 = 1.96.

204

Si p = proporcin muestral de compradores que estn a favor de un horario ms


amplio para las compras, entonces: p

X 360

= 0.60,
n 600

q = 1 p = 0.40.

El intervalo de confianza para la verdadera proporcin poblacional P de


compradores que estn a favor de un horario ms amplio para las compras, es:

Pp Z
1
2

pq
, pZ
1
n
2

pq

No se considera el factor de correccin para poblaciones finitas, asumiendo un


nmero grande de compradores en el centro comercial, tal que la fraccin de
muestreo n/N < 0.05.
Reemplazando valores se tiene:
P [0.60 1.96

0.60 x0.40
0.60 x0.40
; 0.60 + 1.96
]
600
600

P [0.60 0.039 ; 0.60 + 0.039]


Por lo tanto:

P [0.561 ; 0.639] con el 95% de confianza.

Rpta.

Interpretacin.- la verdadera proporcin (porcentaje) de compradores que estn


a favor de un horario ms amplio para las compras en el centro comercial, se
encuentra entre 0.561 y 0.639 (56.1% y 63.9%) con el 95% de confianza.
b) Se puede concluir que menos de 2/3 de los compradores estn a favor de un
horario ms extenso, puesto que P se encuentra entre 0.561 y 0.639 (ver parte
a).
c) Datos: p = 0.60, q = 0.40, E = |p - P| = 0.045 y segn la Tabla 1 al 95% de
confianza:

Z = Z0. 975 = 1.96.

Reemplazando en la frmula para el tamao de muestra se tiene:

Z 2 pq 1.96 2 x0.60 x0.40


n0

455 compradores.
E2
(0.045) 2

Rpta.

Interpretacin.- con el 95% de confianza y un error mximo del 4.5% para


estimar la proporcin de compradores que estn a favor de un horario ms
amplio para las compras en el centro comercial, se requiere una muestra de 455
compradores.

205

14. En un estudio para determinar el gasto medio mensual en arbitrios en las


ciudades A y B, se toma una muestra al azar de 200 hogares de A arrojando un
gasto medio de S/. 250 y una desviacin estndar de 15. Una muestra al azar de
180 hogares de la ciudad B da una gasto medio de 235 y una desviacin estndar
de 10.
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto
medio en las ciudades A y B.
b) Es diferente el gasto medio mensual en arbitrios en las ciudades A y B?
Solucin
Datos: nA = 200, X A = 250, SA = 15, nB = 180, X B = 235, SB = 10.
a) Un intervalo de confianza para la diferencia del gasto medio mensual en arbitrios
en las ciudades A y B viene dado por:

A B ( X A X B ) Z

AXB

, (X A X B ) Z

AXB

...........

(1)
Si 1 = 0.99, entonces: Z0 = Z 0.995 = 2.575

AXB

XB X A

S A2 S B2
(15) 2 (10) 2

= S/. 1.30
n A nB
200
180

Reemplazando valores en (1):


A - B [(250 235) 2.575 (1.30) ; (250 235) + 2.575 (1.30)] = [15 3.34]
Luego: A - B [11.66; 18.34] S/. con el 95% de confianza.

Rpta.

Interpretacin: con el 99% de confianza, la diferencia del gasto medio mensual


en arbitrios en las ciudades A y B se encuentra entre S/. 11.66 y 18.34.
b) Responder a la pregunta Es diferente el gasto medio mensual en arbitrios en las
ciudades A y B? implica responder si A B? o tambin A - B 0?
Si apreciamos el intervalo de confianza construido en a) A - B no puede ser
cero, es decir A - B 0 o

A B. Por lo tanto, el gasto medio mensual en

arbitrios en ambas ciudades es diferente.

Rpta.

15. Un departamento de produccin desea determinar si hay diferencia en el


rendimiento entre el turno diurno (A) y el nocturno (B). Una muestra aleatoria
de 80 obreros del turno diurno alcanza una produccin media de 94.3 partes por
206

hora, con una desviacin estndar de 14 partes por hora, mientras que otra
muestra de 60 obreros de la noche alcanza un promedio de 89.7 partes por hora,
con una desviacin estndar de 17. Se pide:
a) Calcule e interprete un intervalo de confianza del 95% para la verdadera
diferencia de rendimientos medios de ambos turnos.
b) Son diferentes los rendimientos medios de ambos turnos? A B?
Explique
Solucin
Datos: nA = 80, X A = 94.3 partes por hora, SA = 14, nB = 60, X B = 89.7, SB =
17.
a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado
por:

A B ( X A X B ) Z

AXB

, (X A X B ) Z

AXB

...........

(1)
Si 1 = 0.95, entonces: Z0 = Z 0.975 = 1.96

AXB

S A2 S B2
(14) 2 (17) 2

= 2.7 partes por hora.


n A nB
80
60

Reemplazando valores en (1):


A - B [(94.3 89.7) 1.96 (2.7) ; (94.3 89.7) + 1.96 (2.7)] = [4.6 5.3]
Luego: A - B [-0.7; 9.9] partes por hora con el 95% de confianza.

Rpta.

Interpretacin: con el 95% de confianza, la diferencia de rendimientos medios del


turno diurno y nocturno se encuentra entre -0.7 y 9.9 partes por hora.
b) Responder a la pregunta Son diferentes los rendimientos medios de ambos
turnos? Es responder si A B? o tambin A - B 0?
Si apreciamos el intervalo de confianza construido en a) A - B toma el valor
cero, es decir A - B = 0 o

A = B. Por lo tanto, los rendimientos medios de

ambos turnos no son diferentes.

Rpta.

16. El departamento de marketing desea determinar si hay diferencia entre las ventas
mensuales realizadas por hombres y mujeres. Una muestra aleatoria de 60
hombres alcanza un promedio de 78 artefactos mensuales, con una desviacin
207

estndar de 15; mientras que otra muestra de 50 mujeres arroja una venta media
de 85 artefactos mensuales, con una desviacin estndar de 10 artefactos. Se
pide:
a) Construya un intervalo del 95% de confianza para la verdadera diferencia de
las ventas medias realizadas por hombres y mujeres.
b) Son diferentes las ventas medias realizadas por hombres y mujeres? h
m?
Solucin
Datos: nh = 60, X h = 78 artefactos, Sh = 15, nm = 50, X m = 85, Sm = 10.
a) Un intervalo de confianza para la diferencia de las ventas medias realizadas por
hombres y mujeres viene dado por:

h m ( X h X m ) Z

h Xm

, (X h X m ) Z

h Xm

...........

(1)
Si 1 = 0.95, entonces: Z0 = Z 0.975 = 1.96

h Xm

S h2 S m2
(15) 2 (10) 2

= 2.4 partes por hora.


nh nm
60
50

Reemplazando valores en (1):


h - m [(78 85) 1.96 (2.4) ; (78 85) + 1.96 (2.4)] = [-7 4.7]
Luego: h - m [-11.7; -2.3] artefactos con el 95% de confianza.

Rpta.

Interpretacin: con el 95% de confianza, la diferencia de las ventas medias


mensuales de hombres y mujeres se encuentra entre -11.7 y -2.3 artefactos.
b) Responder a la pregunta Son diferentes las ventas medias realizadas por hombres
y mujeres? implica responder si h m? o tambin h - m 0?
Si apreciamos el intervalo de confianza construido en a) h - m no puede ser
cero, es decir h - m 0 o h m. Por lo tanto, si es diferente la venta medias
mensual de artefactos entre hombres y mujeres.

Rpta.

17. Para determinar el precio medio del kilo de pollo en las ciudades A y B, se toma
una muestra al azar de 120 hogares de A arrojando un precio medio de S/. 6.50 y
una desviacin estndar de S/ 0.70. Una muestra al azar de 100 hogares de la
ciudad B da una precio medio de S/. 6.75 y una desviacin estndar de S/. 0.90.
208

a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del


precio medio del pollo en las ciudades A y B.
b) Es diferente el precio medio del pollo en las ciudades A y B?
Solucin
Datos: nA = 120 hog., X A = S/. 6.50, SA = 0.70, nB = 100, X B = 6.75, SB =
0.90.
a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado
por:

A B ( X A X B ) Z

AXB

, (X A X B ) Z

AXB

...........

(1)
Si 1 = 0.95, entonces: Z0 = Z 0.975 = 1.96

AXB

S A2 S B2
(0.7) 2 (0.9) 2

= S/. 0.11
n A nB
120
100

Reemplazando valores en (1):


A - B [(6.50 6.75) 1.96 (0.11) ; (6.50 6.75) 1.96 (0.11)] = [-0.25
0.22]
Luego: A - B [-0.47; -0.03] S/. con el 95% de confianza.

Rpta.

Interpretacin: con el 95% de confianza, la diferencia del precio medio del pollo
en las ciudades A y B se encuentra entre S/. -0.47 y -0.03.
b) Responder a la pregunta Es diferente el precio medio del pollo en las ciudades A
y B? es responder si A B? o tambin A - B 0?
Si apreciamos el intervalo de confianza construido en a) A - B no toma el valor
cero, es decir A - B 0 o
ambas ciudades es diferente.

A B. Por lo tanto, el precio medio del pollo en


Rpta.

18. Muestras del pago mensual a los obreros en las ciudades 1 y 2 proporcionan los
siguientes datos:
n1 = 35, X 1 = $ 540,

S1 = $ 25,

n2 = 35, X 2 = $ 530,

S2 = $ 20.

a) Construya un intervalo del 95 % de confianza para la diferencia entre los


pagos medios a los obreros de las dos ciudades.
209

b) Difieren los pagos medios a los obreros en las dos ciudades? Explique.
Solucin
Datos: n1 = 35, X 1 = $ 540,

S1 = $ 25,

X 2 = $ 530,

n2 = 35,

S2 = $

20.
a) Un intervalo de confianza para la diferencia de pagos medios viene dado por:

1 2 ( X 1 X 2 ) Z

X X , ( X1 X 2 ) Z
1

X X ........... (1)
1

Si 1 = 0.95, entonces: Z0 = Z 0.975 = 1.96

X X
1

S12 S 22
(25) 2 (20) 2

= $ 5.41
n1 n2
35
35

Reemplazando valores en (1):


1 - 2 [(540 530) 1.96 (5.41) ; (540 530) 1.96 (5.41)] = [10 10.60]
Luego: 1 - 2 [-0.60; 20.60] $ con el 95% de confianza.

Rpta.

Interpretacin: la diferencia entre los pagos medios a los obreros de las dos
ciudades se encuentra entre $ -0.60 y 20.60 con el 95% de confianza.
b) Responder a la pregunta Difieren los pagos medios a los obreros en las dos
ciudades? implica responder si 1 2? o tambin 1 - 2 0?
Si apreciamos el intervalo de confianza construido en a) 1 - 2 toma el valor
cero, es decir 1 - 2 = 0 o 1 = 2. Por lo tanto, los pagos medios a los obreros
en las dos ciudades no difieren.

Rpta.

19. Se compararon dos marcas de cigarrillos, 1 y 2, respecto a su contenido de


nicotina en miligramos; dos muestras aleatorias de 40 cigarrillos de la marca 1 y
50 de la marca 2, dieron estos resultados:
n1 = 40 cigarros, X 1 = 14.3 mg., S1 = 2.9 y

n2 = 50, X 2 = 15.7,

S2 = 3.8.

a) Construya un intervalo del 99 % de confianza para la diferencia entre las


medias del contenido de nicotina para las dos marcas de cigarrillos.
b) Difieren las dos marcas en su contenido medio de nicotina? Explique.
Solucin
Datos: n1 = 40, X 1 = 14.3 mg., S1 = 2.9 y n2 = 50, X 2 = 15.7,
210

S2 = 3.8.

a) Un intervalo de confianza para la diferencia de contenido medio viene dado por:

1 2 ( X 1 X 2 ) Z

X X , ( X1 X 2 ) Z
1

X X ........... (1)
1

Si 1 = 0.99, entonces: Z0 = Z 0.995 = 2.575

X X
1

S12 S 22
(2.9) 2 (3.8) 2

= 0.71mg.
n1 n2
40
50

Reemplazando valores en (1):


1 - 2 [(14.3 15.7) 2.575 (0.71) ; (14.3 15.7) + 2.575 (0.71)] = [-1.4
1.83]
Luego: 1 - 2 [-3.23; 0.43] mg. con el 99% de confianza.

Rpta.

Interpretacin: con el 99% de confianza, la diferencia entre las medias del


contenido de nicotina para las dos marcas de cigarrillos se encuentra entre -3.23 y
0.43 mg.
b) Responder a la pregunta Difieren las dos marcas en su contenido medio de
nicotina? es responder si 1 2? o tambin 1 - 2 0?
El intervalo de confianza construido en a) 1 - 2 toma el valor cero, es decir 1 2 = 0 o 1 = 2. Por lo tanto, el contenido medio de nicotina para las dos marcas
no difiere.

Rpta.

20. Se entrevistaron dos grupos de mujeres respecto a su inters por la compra de


botas de cuero. De una muestra de 300 mujeres menores de 40 aos, slo 60
estuvieron interesadas, mientras que de 200 mujeres 40 aos a ms, 54
mostraron inters.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 aos y las de 40
aos a ms que mostraron inters por la compra de botas de cuero.
b) Es diferente la proporcin de mujeres menores de 40 aos y las de 40 aos a
ms que mostraron inters por la compra de botas de cuero? Explique.
Solucin
Sean: grupo 1 = mujeres menores de 40 aos y grupo 2 = mujeres de 40 aos a
ms.
Datos:

n1 = 300,

X1 = 60,

n2 = 200
211

X2 = 54

a) El intervalo de confianza para la diferencia de proporciones de mujeres


menores de 40 aos (P1) y las de 40 aos a ms (P2) que mostraron inters por
la compra de botas de cuero, P1 - P2 est dado por:

P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2 ............... (1)
1
1
2
2

Si 1 = 0.99, entonces Z0 = Z 0.995 = 2.575. Adems:

p1

X1
60
= 0.20 q1 = 0.80

n1 300

p2

X2
54
= 0.27 q2 =

n2 200

0.73

p p =
1

p1q1 p2 q2
(0.20)(0.80) (0.27)(0.73)
= 0.039

n1
n2
300
200

Z0 p1 p2 = 2.575 (0.039) = 0.1004


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.20 0.27) 0.1004 ; (0.20 0.27) + 0.1004] = [-0.07 0.1004]
P1 - P2 [-0.1704 ; 0.0304] con el 95% de confianza.

Rpta.

Interpretacin: la diferencia de proporciones de mujeres menores de 40 aos


(P1) y las de 40 aos a ms (P2) que mostraron inters por la compra de botas
de cuero, est entre -0.1704 y 0.0304 con el 99% de confianza.
b) La pregunta Es diferente la proporcin de mujeres menores de 40 aos y las
de 40 aos a ms que mostraron inters por la compra de botas de cuero?
implica preguntar si P1 P2? o tambin P1 - P2 0?
La diferencia P1 - P2 = 0 est incluida en el intervalo de confianza construido en
a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2. Por lo tanto, no es diferente la
proporcin de mujeres menores de 40 aos y las de 40 aos a ms que mostraron
inters por la compra de botas de cuero.

Rpta.

21. A fin de determinar el nivel de aceptacin de la gestin presidencial (X), se


entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto
del Pas (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280;

Resto del Pas (2): n2 = 1200, X2 =

300

212

a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia


entre las verdaderas proporciones de limeos y no limeos que estn de
acuerdo con la gestin presidencial.
b) Son diferentes las verdaderas proporciones de limeos y no limeos que
estn de acuerdo con la gestin presidencial?
Solucin
Datos: Lima M. (1): n1 = 800, X1 = 280; Resto del Pas (2): n2 = 1200, X2 =
300.
a) El intervalo de confianza para la diferencia de proporciones de limeos (P1)
y no limeos (P2) que estn de acuerdo con la gestin presidencial es:

P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2 ............... (1)
1
1
2
2

Si 1 = 0.95, entonces Z0 = Z 0.975 = 1.96. Adems:

p1

X 1 280
= 0.35 q1 = 0.65

n1 800

p2

X 2 300
= 0.25 q2 =

n2 1200

0.75

p p =
1

p1q1 p2 q2
(0.35)(0.65) (0.25)(0.75)
= 0.021

n1
n2
800
1200

Z0 p1 p2 = 1.96 (0.039) = 0.041


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.35 0.25) 0.041 ; (0.35 0.25) + 0.041] = [0.10 0.041]
P1 - P2 [0.059; 0.141] con el 95% de confianza.

Rpta.

Interpretacin: con el 95% de confianza, la diferencia de proporciones de


limeos y no limeos que estn de acuerdo con la gestin presidencial,
est entre 0.059 y 0.141.
b) La pregunta Son diferentes las verdaderas proporciones de limeos y no
limeos que estn de acuerdo con la gestin presidencial? implica preguntar
si P1 P2? o tambin P1 - P2 0?
La diferencia P1 - P2 = 0 no est incluida en el intervalo de confianza construido
en a), es diferente de cero, es decir P1 - P2 0

P1 P2. Por lo tanto, si son

diferentes las verdaderas proporciones de limeos y no limeos que estn de


acuerdo con la gestin presidencial.
213

Rpta.

22. En una muestra aleatoria de 400 hombres y 600 mujeres que ven cierto programa
de TV, 220 hombres y 300 mujeres dijeron que les gustaba.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de hombres y mujeres que les gusta el
programa.
b) Se puede afirmar que son diferentes las verdaderas proporciones de hombres
y mujeres que les gusta el programa?
Solucin
Sean: grupo 1 = hombres y grupo 2 = mujeres.
Datos:

n1 = 400,

X1 = 220,

n2 = 600

X2 = 300

a) El intervalo de confianza para la diferencia de proporciones de hombres (P1)


y de mujeres (P2) que les gusta el programa de TV, P1 - P2 est dado por:

P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2 ............... (1)
1
1
2
2

Si 1 = 0.99, entonces Z0 = Z 0.995 = 2.575. Adems:

p1

X 1 220
= 0.55 q1 = 0.45

n1 400

p2

X 2 300
= 0.50 q2 =

n2 600

0.50

p p =
1

p1q1 p2 q2
(0.55)(0.45) (0.50)(0.50)
= 0.032

n1
n2
400
600

Z0 p1 p2 = 2.575 (0.032) = 0.083


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.55 0.50) 0.083 ; (0.55 0.50) + 0.083] = [0.05 0.083]
P1 - P2 [-0.033; 0.133] con el 99% de confianza.

Rpta.

Interpretacin: la diferencia de proporciones de hombres (P1) y de mujeres


(P2) que les gusta el programa de TV, est entre -0.033 y 0.133 con el 99% de
confianza.
b) La pregunta Se puede afirmar que son diferentes las verdaderas proporciones
de hombres y mujeres que les gusta el programa? implica preguntar si P1
P2? o tambin P1 - P2 0?
La diferencia P1 - P2 = 0 est incluida en el intervalo de confianza construido
en a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2. Por lo tanto, no son
214

diferentes las proporciones de hombres y mujeres que les gusta el programa.


Rpta.
23. De los alumn@s de la UNAC se toma una muestra aleatoria de 600 mujeres,
300 de las cuales estn a favor de la titulacin con tesis. En una muestra de 400
hombres, 240 indican que estn a favor de lo mismo.
a) Halle un intervalo de confianza del 95% para la verdadera diferencia de
proporciones de alumnos y alumnas que estn a favor de la titulacin con
tesis.
b) Se puede afirmar que son diferentes las verdaderas proporciones de alumnos
y alumnas que estn a favor de la titulacin con tesis?
Solucin
Sean: grupo 1 = alumnos (hombres) y grupo 2 = alumnas (mujeres).
Datos:

n1 = 400,

X1 = 240,

n2 = 600

X2 = 300

a) El intervalo de confianza para la diferencia de proporciones de alumnos (P1) y


de alumnas (P2) que estn a favor de la titulacin con tesis, P1 - P2 est dado
por:

P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2 ............... (1)
1
1
2
2

Si 1 = 0.95, entonces Z0 = Z 0.975 = 1.96. Adems:

p1

X 1 240
= 0.60 q1 = 0.40

n1 400

p2

X 2 300
= 0.50 q2 =

n2 600

0.50

p p =
1

p1q1 p2 q2
(0.60)(0.40) (0.50)(0.50)
= 0.032

n1
n2
400
600

Z0 p1 p2 = 1.96 (0.032) = 0.063


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.60 0.50) 0.063 ; (0.60 0.50) + 0.063] = [0.10 0.063]
P1 - P2 [0.037; 0.163] con el 95% de confianza.

Rpta.

Interpretacin: la diferencia de proporciones de alumnos (P1) y de alumnas


(P2) que estn a favor de la titulacin con tesis en la UNAC, est entre 0.037
y 0.163 con el 95% de confianza.
215

b) La pregunta Se puede afirmar que son diferentes las verdaderas proporciones


de alumnos y alumnas que estn a favor de la titulacin con tesis? implica
preguntar si P1 P2? o tambin P1 - P2 0?
La diferencia P1 - P2 = 0 no est incluida en el intervalo de confianza
construido en a), no puede ser cero, es decir P1 - P2 0 o P1 P2. Por lo
tanto, son diferentes las proporciones de alumnos y alumnas de la UNAC que
estn a favor de la titulacin con tesis.

Rpta.

24. Se entrevistaron a hombres y mujeres respecto a su inters por una nueva marca
de perfume. En una muestra aleatoria de 500 hombres y 500 mujeres, 200
hombres y 160 mujeres dijeron que les gustaba el nuevo perfume.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las proporciones de hombres y mujeres que les gusta el nuevo perfume.
b) Son diferentes las verdaderas proporciones de hombres y mujeres que
dijeron que les gustaba el nuevo perfume? Explique.
Solucin
Sean: grupo 1 = hombres y grupo 2 = mujeres.
Datos:

n1 = 500,

X1 = 200,

n2 = 500

X2 = 160

a) El intervalo de confianza para la diferencia de proporciones de hombres (P1)


y de mujeres (P2) que les gusta el el nuevo perfume, P1 - P2 est dado por:

P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2 ............... (1)
1
1
2
2

Si 1 = 0.95, entonces Z0 = Z 0.975 = 1.96. Adems:

p1

X 1 200
= 0.40 q1 = 0.60

n1 500

p2

X 2 160
= 0.32 q2 =

n2 500

0.68

p p =
1

p1q1 p2 q2
(0.40)(0.60) (0.32)(0.68)
= 0.030

n1
n2
500
500

Z0 p1 p2 = 1.96 (0.030) = 0.059


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.40 0.32) 0.059 ; (0.40 0.32) + 0.059] = [0.08 0.059]
P1 - P2 [0.021; 0.139] con el 95% de confianza.
216

Rpta.

Interpretacin: la diferencia de proporciones de hombres (P1) y de mujeres


(P2) que les gusta el nuevo perfume, est entre 0.021 y 0.139 con el 95% de
confianza.
b) La pregunta Son diferentes las verdaderas proporciones de hombres y
mujeres que dijeron que les gustaba el nuevo perfume? implica preguntar si
P1 P2? o tambin P1 - P2 0?
La diferencia P1 - P2 = 0 no est incluida en el intervalo de confianza
construido en a), no puede ser cero, es decir P1 - P2 0 o P1 P2. Por lo
tanto, si son diferentes las proporciones de hombres y mujeres que les gusta el
nuevo perfume.

Rpta.

25. Es ampliamente conocido que no cualquiera coopera respondiendo a


cuestionarios de los entrevistadores puerta por puerta. En un experimento para
determinar si las mujeres son ms cooperadoras que los hombres, se obtuvieron
los siguientes resultados: Hombres: n1 = 175, X1 = 85;

Mujeres: n2 =

250, X2 = 150.
a) Determine un intervalo de confianza del 99 % para la diferencia de mujeres y
hombres cooperadores.
b) Es diferente la proporcin de mujeres y hombres cooperadores?
Solucin
Sean: grupo 1 = hombres y grupo 2 = mujeres.
Datos:

n1 = 175,

X1 = 84,

n2 = 250

X2 = 150

a) El intervalo de confianza para la diferencia de proporciones de mujeres (P2) y


de hombres (P1) que coopera respondiendo a cuestionarios de los
entrevistadores puerta por puerta, P2 P1 est dado por:

P2 P1 ( p2 p1 ) Z p2 p1 , ( p2 p1 ) Z p2 p1 ............... (1)
1
1
2
2

Si 1 = 0.99, entonces Z0 = Z 0.995 = 2.575. Adems:

p1

X 1 84
= 0.48 q1 = 0.52

n1 175

0.40

217

p2

X 2 150
= 0.60 q2 =

n2 250

p p = p p =
2

p1q1 p2 q2
(0.48)(0.52) (0.60)(0.40)
= 0.049

n1
n2
175
250

Z0 p1 p2 = 2.575 (0.049) = 0.126


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.60 0.48) 0.126; (0.60 0.48) + 0.126] = [0.12 0.126]
P1 - P2 [-0.006; 0.246] con el 99% de confianza.

Rpta.

Interpretacin: con el 99% de confianza, la diferencia de proporciones de


mujeres (P2) y de hombres (P1) que coopera respondiendo a cuestionarios de
los entrevistadores puerta por puerta, est entre -0.006 y 0.246.
b) La pregunta Es diferente la proporcin de mujeres y hombres cooperadores?
implica preguntar si P2 P1? o tambin P2 P1 0?
La diferencia P2 P1 = 0 est incluida en el intervalo de confianza construido
en a), puede ser cero, es decir P2 P1 = 0 o P2 = P1. Por lo tanto, no es
diferente la proporcin de mujeres y hombres que cooperan respondiendo a
cuestionarios de los entrevistadores puerta por puerta.

Rpta.

26. Se entrevistaron dos grupos de mujeres respecto a su inters por los polos de
verano Burberry. De una muestra de 250 mujeres menores de 40 aos, 150
estuvieron interesados, mientras que de 250 mujeres de 40 aos a ms, slo 120
mostraron inters.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 aos y las de 40
aos a ms que mostraron inters por los polos de verano Burberry.
b) Existe diferencia entre la proporcin de mujeres menores de 40 aos y las de
40 aos a ms que mostraron inters por los polos de verano Burberry?
Explique.
Solucin
Sean: grupo 1 = mujeres menores de 40 aos y grupo 2 = mujeres de 40 aos a
ms.
Datos:

n1 = 250,

X1 = 150,

n2 = 250

X2 = 120

a) El intervalo de confianza para la diferencia de proporciones de mujeres


menores de 40 aos (P1) y las de 40 aos a ms (P2) que mostraron inters por
los polos de verano Burberry, P1 - P2 est dado por:
218

P1 P2 ( p1 p2 ) Z p1 p2 , ( p1 p2 ) Z p1 p2 ............... (1)
1
1
2
2

Si 1 = 0.95, entonces Z0 = Z 0.975 = 1.96. Adems:

p1

X 1 150
= 0.60 q1 = 0.40

n1 250

p2

X 2 120
= 0.48 q2 =

n2 250

0.52

p p =
1

p1q1 p2 q2
(0.60)(0.40) (0.48)(0.52)
= 0.0443

n1
n2
250
250

Z0 p1 p2 = 1.96 (0.0443) = 0.087


Reemplazando valores en (1) se tiene que:
P1 - P2 [(0.60 0.48) 0.087; (0.60 0.48) + 0.087] = [0.12 0.087]
P1 - P2 [0.033; 0.207] con el 95% de confianza.

Rpta.

Interpretacin: la diferencia de proporciones de mujeres menores de 40 aos


(P1) y las de 40 aos a ms (P2) que mostraron inters por los polos de verano
Burberry, est entre 0.033 y 0.207 con el 99% de confianza.
b) La pregunta Es diferente la proporcin de mujeres menores de 40 aos y las
de 40 aos a ms que mostraron inters por los polos de verano Burberry?
implica preguntar si P1 P2? o tambin P1 - P2 0?
La diferencia P1 - P2 = 0 no est incluida en el intervalo de confianza construido
en a), no puede ser cero, es decir P1 - P2 0

P1 P2. Por lo tanto, no es

diferente la proporcin de mujeres menores de 40 aos y las de 40 aos a ms que


mostraron inters por los polos de verano Burberry.

Rpta.

27. De los 2000 establecimientos pequeos de una ciudad se extrae una muestra
aleatoria de 25 establecimientos y se recolecta informacin sobre el nmero de
personas empleadas (X) por establecimiento, obtenindose la siguiente
25

informacin:

X i 138 y
i 1

25

X
i 1

2
i

1145 .76 .

Calcule e interprete intervalos de confianza del 95 % para:


a) El nmero medio de empleados por establecimiento en la ciudad.
b) La varianza del nmero de empleados por establecimiento.

219

c) Para estimar en el futuro el nmero medio de empleados por establecimiento,


con un margen de error mximo de 0.9 empleados y una confianza del 95 %
qu tamao mnimo de muestra ser necesario?
Solucin
Con la informacin dada se determina el promedio y la varianza muestral de los
empleados por establecimiento as:
25

X
i 1

138
= 5.52 empleados por establecimiento.
25

25

S2

( X i X )2
i 1

n 1

25

X
i 1

2
i

nX 2

n 1

1145 .76 25 (5.52) 2


= 16 (empleados)2
25 1

S = 4 empleados. Otros datos: N = 2000 establecimientos, n = 25, 1 = 0.95.


a) Para hallar el intervalo de confianza para la media se usa la distribucin Tn-1
de student (n < 30), si 1 = 0.95 en la Tabla 3, t0 = t24 , 0.975 = 2.064.
El intervalo de confianza para la media se obtiene con la expresin:
[ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
[5.52 2.064 x

4
, 5.52 + 2.064 x
25

4
] = [5.52 1.65]
25

Por lo tanto: [3.87 ; 7.17] empleados con el 95% de confianza.


Rpta.
Interpretacin: en la ciudad el verdadero nmero medio de empleados por
establecimiento pequeo, se encuentra entre 3.87 y 7.17 con el 95% de confianza.
b) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 25, S = 4 y 1 = 0.95, entonces en la Tabla 2:


2
a = x24
, 0.025 = 12.4

2
b = x24
, 0.975 = 39.4

Reemplazando valores en el intervalo de confianza para la varianza, se tiene


que:

220

(25 1)(4) 2 (25 1)(4) 2



,

12.4
39.4

Por lo tanto: [9.75 ; 30.97 ] (emp.) con el 95% de confianza.


Rpta.
Interpretacin: la varianza del nmero de empleados por establecimiento
pequeo 9.75 y 30.97 (empleados) con el 95% de confianza.
c) El tamao de muestra est dado por: n0

Z 2 2
E2

Donde: | x - | = E = 0.9, 1 = 0.95 en la Tabla 1, Z = Z0.975 = 1.96


y S = 4. Reemplazando en la frmula para n se tiene:

1.96 2 4 2
= 76 establecimientos.
n0
0.9 2

Rpta.

Interpretacin.- para estimar el nmero medio de empleados por


establecimiento, con el 95% de confianza y un error mximo de 0.9
empleados, se requiere de 76 establecimientos.
28. Las cajas de un cereal producido por una fbrica deben tener un contenido de 16
onzas. Un inspector tom una muestra que arroj los siguientes pesos en onzas:
15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8, 15.6
Calcule e interprete intervalos de confianza del 90 % para la media poblacional y
la varianza poblacional de los pesos de las cajas de cereal.
Solucin
Con la informacin dada se determina el promedio y la varianza muestral de los
empleados por establecimiento as:
10

X
i 1

10

S2

(X
i 1

159
= 15.9 onzas por caja.
10
10

X )2

n 1

X
i 1

2
i

nX 2

n 1

2528 .58 10 (15.9) 2


= 0.0533 (onzas)2
10 1

S = 0.231 onzas. Otros datos: n = 10 cajas, 1 = 0.90.


a) Para hallar el intervalo de confianza para la media se usa la distribucin Tn-1
de student (n < 30), si 1 = 0.90 en la Tabla 3, t0 = t9, 0.95 = 1.833.
221

El intervalo de confianza para la media se obtiene con la expresin:


[ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
[15.9 1.833 x

0.231
0.231
, 15.9 + 1.833 x
] = [15.9 0.134]
10
10

Por lo tanto: [15.766 ; 16.034] onzas con el 90% de confianza.


Rpta.
Interpretacin: el verdadero peso medio de las cajas de cereal, se encuentra entre
15.766 y 16.034 onzas, con el 95% de confianza.
b) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 10, S = 0.231 y 1 = 0.90, entonces en la Tabla 2:


a = x92, 0.05 = 3.33

b = x92, 0.95 = 16.9

Reemplazando valores en el intervalo de confianza para la varianza, se tiene


que:

(10 1)(0.231) 2 (10 1)(0.231) 2



,

16.9
3.33

Por lo tanto: [0.0284;

0.1442] (onzas) con el 90% de confianza.

Rpta.
Interpretacin: con el 90% de confianza, la varianza del peso de las cajas de
cereal se encuentra entre 0.0284 y 0.1442 (onzas).
29. Los pesos netos (grs.) de una muestra aleatoria de 10 latas de leche fueron los
siguientes:
259, 262, 259, 258, 256, 257, 257, 263, 258, 261
Calcule e interprete intervalos de confianza del 95 % para la media poblacional y
la varianza poblacional de los pesos netos.
Solucin
El promedio y la varianza muestral de los empleados por establecimiento es:

222

10

X
i 1

2590
= 259 gr. por lata.
10

10

S2

( X i X )2
i 1

n 1

10

X
i 1

2
i

nX 2

n 1

670858 10 (259) 2
= 5.3333 (gr.)2
10 1

S = 2.31 gr. Otros datos: n = 10 cajas, 1 = 0.95.


a) Para hallar el intervalo de confianza para la media se usa la distribucin Tn-1
de student (n < 30), si 1 = 0.95 en la Tabla 3, t0 = t9, 0.975 = 2.262.
El intervalo de confianza para la media se obtiene con la expresin:
[ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
[259 2.262 x

2.31
2.31
, 259 + 2.262 x
] = [259 1.65]
10
10

Por lo tanto: [257.35; 260.65] gr. con el 95% de confianza.


Rpta.
Interpretacin: el verdadero peso medio de las de leche, se encuentra entre 257.35
y 260.65 gramos, con el 95% de confianza.
b) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 10, S = 2.31 y 1 = 0.95, entonces en la Tabla 2:


a = x92, 0.025 = 2.70

b = x92, 0.975 = 19.0

Reemplazando valores en el intervalo de confianza para la varianza, se tiene


que:

(10 1)(2.31) 2 (10 1)(2.31) 2



,

19.0
2.70

Por lo tanto: [2.53;

17.79] (gramos) con el 95% de confianza.

Rpta.
Interpretacin: con el 95% de confianza, la varianza del peso de las latas de
leche se encuentra entre 2.53 y 17.79] (gramos).

223

30. De un rea de la ciudad en la que habitan 1000 familias se extrae una muestra
aleatoria de 20 familias y se recolecta informacin sobre el nmero de personas
(X) por familia, obtenindose la siguiente informacin:
20

X
i 1

20

105

i 1

2
i

763

Calcule e interprete intervalos de confianza del 99 % para el(la) verdadero(a):


a) Nmero medio de personas por familia. Aceptara usted que el tamao
medio de las familias es de 6 personas?
b) Nmero total de personas en el rea.
c) La varianza del nmero de personas por familia en el rea.
d) Para estimar en el futuro el nmero medio de personas por familia, con un
margen de error mximo de 0.6 personas y una confianza del 99 % qu
tamao mnimo de muestra ser necesario?
Solucin
Con la informacin dada se determina el promedio y la varianza muestral de los
empleados por establecimiento as:
20

X
i 1

20

S
2

(X
i 1

105
= 5.25 persona por familia.
20
X)

n 1

20

X
i 1

2
i

nX 2

n 1

763 20 (5.25) 2

= 11.145 (personas)2
20 1

S = 3.34 personas. Otros datos: N = 1000 familias, n = 20, 1 = 0.99.


a) Para hallar el intervalo de confianza para la media se usa la distribucin Tn-1
de student (n < 30), si 1 = 0.95 en la Tabla 3, t0 = t19, 0.995 = 2.861.
El intervalo de confianza para la media se obtiene con la expresin:
[ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
[5.25 2.861 x

3.34
3.34
, 5.25 + 2.861 x
] = [5.25 2.14]
20
20

Por lo tanto: [3.11 ; 7.39] personas con el 99% de confianza.


Rpta.

224

Interpretacin: en el rea de la ciudad el verdadero nmero medio de personas por


familia, se encuentra entre 3.11 y 7.39 con el 99% de confianza.
b) Para hallar el intervalo de confianza para el total (N) se multiplica los
lmites de la media por N = 1000, as:
Total = N 1000 [3.11 ; 7.39] = [3110 ; 7390] personas con el 99% de
confianza.

Rpta.

Interpretacin.- con el 99% de confianza, el verdadero total de personas en el


rea de la ciudad se encuentra entre 3110 y 7390 personas.
c) El intervalo de confianza para la varianza est dado por:

(n 1) S 2 (n 1) S 2
,

b
a

Como n = 20, S = 3.34 y 1 = 0.99, entonces en la Tabla 2:


2
a = x19
, 0.005 = 6.84

2
b = x19
, 0.995 = 38.6

Reemplazando valores en el intervalo de confianza para la varianza, se tiene


que:

(20 1)(3.34) 2 (20 1)(3.34) 2



,

38.6
6.84

Luego: [5.49 ; 30.99 ] (personas) con el 99% de confianza.


Rpta.
Interpretacin: la varianza del nmero de personas por familia se encuentra entre
5.49 y 30.99 (personas) con el 99% de confianza.
d) El tamao de muestra est dado por: n0

Z 2 2
E2

Donde: E = | x - | = 0.6, 1 = 0.99 en la Tabla 1, Z = Z0.995 =


2.575 y S = 3.34. Reemplazando en la frmula para n se tiene:

(2.575) 2 (3.34) 2
n0
= 205.
(0.6) 2
Como f = n0 / N = 205 / 1000 = 0.205 > 0.05 es necesario ajustar el tamao
de muestra as:

225

n0
205

= 170 familias
n0
205
1
1
1000
N

Rpta.

Interpretacin.- para estimar el nmero medio de personas por familia, con


el 99% de confianza y un error mximo de 0.6 personas, se requiere de 170
familias.
31. Muestras del pago semanal a los obreros (1) y obreras (2) proporcionan los
siguientes datos: n1 = 15, x1 = $ 135, S1 = $ 25

n2 = 15, x 2 = $ 125,

S2 = $ 15. Calcule e interprete intervalos de confianza del 95% para:


a) La razn de varianzas de los pagos semanales a obreros y obreras. Son
iguales las varianzas de los pagos semanales a obreros y obreras?
b) La diferencia entre los pagos medios semanales a obreros y obreras. Son
diferentes los pagos medios semanales a obreros y obreras? Explique.
Solucin

12 S12 / S 22 S12 / S 22
;
a) Intervalo de confianza para la razn de varianzas: 2

c
2 d
Datos: n1 = n2 = 15, S12 = 252 = 625, S 22 = 152 = 225. Como 1 = 0.95,
entonces en la tabla 4: d = F14, 14, 0.975 = 2.98 y c = F14, 14, 0.025 = 1/ F14, 14, 0.975 = 1/
2.98 = 0.336.
Reemplazando valores en el intervalo se tiene que:

12 625 / 225
625 / 225
;

= [0.93; 8.27] con el 95% de confianza.


2
0.336
2 2.98
Interpretacin.- con el 95% de confianza, la razn de varianzas de los pagos
semanales a obreros y obreras, se encuentra entre 0.93 y 8.27.
Preguntar s: Son iguales las varianzas de los pagos semanales a obreros y
obreras? Es similar a preguntar s: 12 = 22 o

12
= 1? La respuesta es s, ya
22

que el intervalo para la razn de varianzas toma el valor 1, es decir

12
= 1,
22

entonces 12 = 22 (las varianzas de los pagos semanales a obreros y obreras son


iguales)
226

b) Considerando que las muestras son pequeas y que las varianzas de los pagos
semanales a obreros y obreras son iguales, el intervalo de confianza para la
diferencia entre los de los pagos semanales a obreros y obreras est dado por:
1 - 2 [( x1 - x 2 ) t0

(n1 1)S12 (n2 1)S 22


n1 n2 2

1 1

]
n1 n2

Datos del problema:


n1 = 15, x1 = $ 135, S1 = $ 25

n2 = 15, x 2 = $ 125, S2 = $ 15.

Los grados de libertad de la t son n1 + n2 2 = 15 + 15 2 = 28.


Si 1 = 0.95,

En la tabla 3, t0 = t28, 0.975 = 2.048.

Reemplazando valores en la frmula para el intervalo de confianza, tenemos que:


1 - 2 [(135 125) 2.048

(15 1)(25) 2 (15 1)(15) 2


15 15 2

1 1

]
15 15

1 - 2 [10 2.048(7.53) ] 1 - 2 [10 15.42 ]


Por lo tanto:
1 - 2 [-5.42 ; 25.42] $ con el 95% de confianza.

Rpta.

Interpretacin: la diferencia entre los pagos semanales a obreros y obreras, se


encuentra comprendida entre $ -5.42 y 25.42 con el 95% de confianza.
Preguntar s, Son diferentes los pagos medios semanales a obreros y
obreras? Es similar a preguntar s: 1 2 o 1 - 2 0? La respuesta es no,
ya que el intervalo para su diferencia de medias toma el valor cero, es decir,
1 - 2 = 0 o 1 = 2. Entonces, los pagos medios semanales a obreros y
obreras son iguales.
32. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para
secretarias, aprenden taquigrafa por dos mtodos diferentes y luego se les
somete a pruebas de dictado. Se encuentra que el grupo 1 obtiene en promedio
123 palabras por minuto con una desviacin estndar de 15 palabras, mientras
que el grupo 2 promedia 110 palabras por minuto con una desviacin estndar de
10 palabras. Calcule e interprete intervalos de confianza del 99 % para:
a) La verdadera razn de varianzas de los 2 grupos. Son heterogneas las
varianzas de ambos grupos?
b) La diferencia de medias de palabras por minuto de ambos mtodos. Es
diferente el promedio de palabras por minuto para los dos mtodos?
227

Solucin
Datos: n1 = 16, x1 = 123, S1 = 15

n2 = 16, x 2 = 110, S2 = 10.

a) Intervalo de confianza para la razn de varianzas:

12 S12 / S 22 S12 / S 22
;

c
22 d

Si: n1 = n2 = 16, S12 = 152 = 225, S 22 = 102 = 100. Como 1 = 0.99, entonces
en la tabla 4: d = F15, 15, 0.995 = 4.07 y c = F15, 15, 0.005 = 1/ F15, 15, 0.995 = 1/ 4.07 =
0.246.
Reemplazando valores en el intervalo se tiene que:

12 225 / 100
225 / 100

= [0.55; 9.15] con el 99% de confianza.


;
2
0.246
2 4.07
Interpretacin.- con el 99% de confianza, la razn de varianzas de las palabras por
minuto de ambos grupos, se encuentra entre 0.55 y 9.15.
Preguntar s: Son heterogneas las varianzas de ambos grupos? Es similar a
preguntar s: 12 22 o

12
1?
22

La respuesta es no, ya que el intervalo para la razn de varianzas toma el valor 1,


es decir

12
= 1, entonces 12 = 22 (las varianzas son homogneas o iguales)
2
2

b) Considerando que las muestras son pequeas y que las varianzas de las palabras
por minuto de ambos grupos son iguales, el intervalo de confianza para la
diferencia de medias de palabras por minuto de los dos mtodos est dado por:
1 - 2 [( x1 - x 2 ) t0

(n1 1)S12 (n2 1)S 22


n1 n2 2

1 1

]
n1 n2

Datos del problema:


n1 = 16, x1 = 123, S1 = 15

n2 = 16, x 2 = 110, S2 = 10.

Los grados de libertad de la t son n1 + n2 2 = 16 + 16 2 = 30.


Si 1 = 0.99,

En la tabla 3, t0 = t30, 0.995 = 2.75.

Reemplazando valores en la frmula para el intervalo de confianza, tenemos que:


1 - 2 [(123 110) 2.75

(16 1)(15) 2 (16 1)(10) 2


16 16 2

1 - 2 [13 2.75(4.51) ] 1 - 2 [13 12.4]


228

1 1
]
16 16

Por lo tanto:
1 - 2 [0.6 ; 25.4] palabras por minuto con el 95% de confianza.

Rpta.

Interpretacin: la diferencia de medias de los dos mtodos, se encuentra


comprendida entre 0.6 y 25.4 palabras por minuto con el 95% de confianza.
Preguntar s, Es diferente el promedio de palabras por minuto para los 2
mtodos? Es similar a preguntar s: 1 2 o 1 - 2 0? La respuesta es
s, ya que el intervalo para su diferencia de medias no toma el valor cero, es
decir, 1 - 2 0 o 1 2. Entonces, el promedio de palabras por minuto
para ambos mtodos s es diferente.
33. Para determinar el costo medio de la enseanza en las universidades 1 y 2, se
toma una muestra al azar de 21 alumnos de la universidad 1 arrojando un costo
medio de S/. 675 y una desviacin estndar de S/ 90. Una muestra al azar de 21
alumnos de la universidad 2 da una costo medio de S/. 650 y una desviacin
estndar de S/. 50. Calcule e interprete intervalos de confianza del 95% para:
a) La razn de varianzas de los costos de enseanza en las universidades 1 y 2.
Son diferentes las varianzas de los costos de enseanza en las 2
universidades?
b) La diferencia del costo medio de la enseanza en las 2 universidades. Son
diferentes los costos medios de la enseanza en las universidades 1 y 2?
Solucin
Datos: n1 = 21, x1 = S/. 675, S1 = 90

n2 = 21, x 2 = 650, S2 = 50.

12 S12 / S 22 S12 / S 22
;
a) Intervalo de confianza para la razn de varianzas: 2

c
2 d
Si: n1 = n2 = 21, S12 = 902 = 8100, S 22 = 502 = 2500. Como 1 = 0.95,
entonces en la tabla 4: d = F20, 20, 0.975 = 2.46 y c = F20, 20, 0.025 = 1/ F20, 20, 0.975 = 1/
2.46 = 0.407.
Reemplazando valores en el intervalo se tiene que:

12 8100 / 2500
8100 / 2500
;

2
= [1.32; 7.96] con el 95% de confianza.
0.407
2 2.46

229

Interpretacin.- con el 95% de confianza, la razn de varianzas de los costos de


enseanza en las universidades 1 y 2, se encuentra entre 1.32 y 7.96.
Preguntar s: Son diferentes las varianzas de los costos de enseanza en las 2
universidades? Es similar a preguntar s: 12 22 o

12
1?
22

La respuesta es s, ya que el intervalo para la razn de varianzas no toma el valor


1, es decir

12
1, entonces 12 22 (las varianzas de los costos de enseanza
2
2

en las 2 universidades son diferentes o heterogneas)


b) Considerando que las muestras son pequeas y que las varianzas de los costos de
enseanza en las 2 universidades son diferentes, el intervalo de confianza para la
diferencia de medias de los costos de enseanza en las 2 universidades est dado
por:

S12 S 22

]
n1 n2

1 - 2 [( x1 - x 2 ) t0
Datos del problema:

n1 = 21, x1 = S/. 675, S12 = 8100 y

n2 = 21, x 2 = 650, S 22 = 2500.

Si 1 = 0.95, en la tabla 3: t0 = tH, 0.975 = t31, 0.975 = 2.04.


2

2
S12 S 22
8100 2500

n1 n2
21
21

Donde: H =
=
= 31.27 31
2
2
2
2
8100
2500
S12
S 22



21 21
n1 n2
21 1
21 1
n1 1
n2 1
Reemplazando valores en el intervalo de confianza propuesto, se tiene:
8100 2500

1 - 2 [(675 - 650) 2.04 x


] = [25 45.83]
21
21
Por lo tanto: 1 - 2 [-20.83 ; 70.83] S/. con el 95 % de confianza. Rpta.

Interpretacin: con el 95% de confianza, la diferencia de los costos medios de


enseanza en las universidades 1 y 2 se encuentra comprendido entre S/. -20.83
y S/. 70.83.
Preguntar s: Son diferentes los costos medios de la enseanza en las
universidades 1 y 2? Es similar a preguntar s: 1 2 o 1 - 2 0? La
230

respuesta es no, ya que el intervalo para su diferencia de medias toma el valor


cero, es decir, 1 - 2 = 0 o 1 = 2. Entonces, los costos medios de la
enseanza en las universidades 1 y 2 no son diferentes, son iguales.
34. Dos mquinas embolsan diariamente detergente de manera independiente.
Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada mquina se han
obtenido los siguientes resultados sobre el peso de las bolsas (en gramos):
n1 = 12, x1 = 505, S1 = 10

n2 = 12, x 2 = 495, S2 = 4.

Calcule e interprete intervalos de confianza del 99% para:


a) La razn de varianzas de los pesos de las bolsas con detergente de ambas
mquinas. Son diferentes las varianzas de los pesos de las bolsas con
detergente de ambas mquinas?
b) La diferencia de los pesos medios de las bolsas con detergente de ambas
mquinas. Son diferentes los pesos medios de las bolsas con detergente de
ambas mquinas?
Solucin
Datos: n1 = 12, x1 = 505, S1 = 10

n2 = 12, x 2 = 495, S2 = 4.

a) Intervalo de confianza para la razn de varianzas:

12 S12 / S 22 S12 / S 22
;

c
22 d

Si: n1 = n2 = 12, S12 = 102 = 100, S 22 = 42 = 16. Como 1 = 0.99, entonces en


la tabla 4: d = F11, 11, 0.995 = 5.32 y c = F11, 11, 0.005 = 1/ F11, 11, 0.995 = 1/ 5.32 = 0.188.
Reemplazando valores en el intervalo se tiene que:

12 100 / 16
100 / 16

= [1.17; 33.24] con el 99% de confianza.


;
2
0.188
2 5.32
Interpretacin.- con el 99% de confianza, la razn de varianzas de los pesos de las
bolsas con detergente de ambas mquinas, se encuentra entre 1.17 y 33.24.
Preguntar s: Son diferentes las varianzas de los pesos de las bolsas con
detergente de ambas mquinas? Es similar a preguntar s:
1?

231

2
1

2
2

12
o

22

La respuesta es s, ya que el intervalo para la razn de varianzas no toma el valor

12
1, es decir 2 1, entonces 12 22 (las varianzas de los pesos de las bolsas
2
con detergente de ambas mquinas son diferentes o heterogneas)
b) Considerando que las muestras son pequeas y que las varianzas de los pesos de
las bolsas con detergente de ambas mquinas son diferentes, el intervalo de
confianza para la diferencia de medias de los pesos de las bolsas con detergente
de ambas mquinas est dado por:

S12 S 22

]
n1 n2

1 - 2 [( x1 - x 2 ) t0
Datos del problema:

n1 = 12, x1 = 505, S12 = 100 y

n2 = 12, x 2 = 495, S 22 = 16.

Si 1 = 0.99, en la tabla 3: t0 = tH, 0.995 = t14, 0.995 = 2.977.


2

2
S12 S 22
100
16

n1 n2
12 12

Donde: H =
=
= 14.43 14
2
2
2
2
100
16
S12
S 22




12
12

n
n
1 2

12 1 12 1
n1 1
n2 1
Reemplazando valores en el intervalo de confianza propuesto, se tiene:
100 16
] = [10 9.26]
1 - 2 [(505 - 495) 2.977 x
12 12
Por lo tanto: 1 - 2 [0.74 ; 19.26] gr. con el 99 % de confianza. Rpta.

Interpretacin: con el 99% de confianza, la diferencia de los pesos medios de las


bolsas con detergente de ambas mquinas se encuentra comprendido entre 0.74 y
19.26 gramos.
Preguntar s: Son diferentes los pesos medios de las bolsas con detergente de
ambas mquinas? Es similar a preguntar s: 1 2 o 1 - 2 0? La
respuesta es s, ya que el intervalo para su diferencia de medias no toma el
valor cero, es decir, 1 - 2 0 o 1 2. Entonces, los pesos medios de las
bolsas con detergente de ambas mquinas s son diferentes.

232

35. Se compararon dos marcas de llantas de automvil, 1 y 2, respecto a su duracin


en Km; dos muestras aleatorias de 16 llantas de cada marca, dieron estos
resultados:
n1 = 16,

x1 = 49,658, S1 = 2,150

x 2 = 48,125,

n2 = 16,

S2 =

1,875.
Calcule e interprete intervalos de confianza del 99% para:
a) La razn de varianzas de la duracin de las llantas de ambas marcas. Son
diferentes las varianzas de la duracin de las llantas de ambas marcas?
b) La diferencia de las duraciones medias de las llantas de ambas marcas. Son
diferentes las duraciones medias de las llantas de ambas marcas?
Solucin
Datos:

n1 = 16,

x1 = 49,658, S1 = 2,150

n2 = 16,

x2

48,125, S2 = 1875.
a) Intervalo de confianza para la razn de varianzas:

12 S12 / S 22 S12 / S 22
;

c
22 d

Si: n1 = n2 = 16, S12 = 4622,500, S 22 = 3515,625. Como 1 = 0.99,


entonces en la tabla 4: d = F15, 15, 0.995 = 4.07 y c = F15, 15, 0.005 = 1/ F15, 15, 0.995 = 1/
4.07 = 0.246.
Reemplazando valores en el intervalo se tiene que:

12
4622500 / 3515625
4622500 / 3515625

;
2
= [0.32; 5.34] con el
4.07
0.246
2

99% de confianza.
Interpretacin.- con el 99% de confianza, la razn de varianzas de la duracin de
las llantas de ambas marcas, se encuentra entre 0.32 y 5.34.
Preguntar s: Son diferentes las varianzas de la duracin de las llantas de ambas
marcas? Es similar a preguntar s:
2
1

2
2

12
o
1?
22

La respuesta es no, ya que el intervalo para la razn de varianzas toma el valor 1,

12
es decir 2 = 1, entonces 12 = 22 (las varianzas de la duracin de las llantas
2
de ambas marcas son homogneas o iguales).
233

b) Considerando que las muestras son pequeas y que las varianzas de la duracin de
las llantas de ambas marcas son iguales, el intervalo de confianza para la
diferencia de medias de la duracin de las llantas de ambas marcas est dado por:
1 - 2 [( x1 - x 2 ) t0

(n1 1)S12 (n2 1)S 22


n1 n2 2

1 1

]
n1 n2

Datos del problema:


n1 = 16, x1 = 49,658, S1 = 2,150

n2 = 16,

x 2 = 48,125, S2 = 1,875.

Los grados de libertad de la t son n1 + n2 2 = 16 + 16 2 = 30.


Si 1 = 0.99,

En la tabla 3, t0 = t30, 0.995 = 2.75.

Reemplazando valores en la frmula para el intervalo de confianza, tenemos que:


1

[(49,658

(16 1)(2150 ) 2 (16 1)(1875) 2


16 16 2

48,125)

2.75

1 1

]
16 16

1 - 2 [1533 2.75(713.18) ] 1 - 2 [1533 1961.25]


Por lo tanto:
1 - 2 [-428.25 ; 3594.25] Km. con el 99% de confianza.

Rpta.

Interpretacin: con el 99% de confianza, la diferencia de duraciones medias de las


llantas de las marcas 1 y 2, se encuentra comprendida entre -428.25 ; 3594.25
Km.
Preguntar s, Son diferentes las duraciones medias de las llantas de ambas
marcas? Es similar a preguntar s: 1 2 o 1 - 2 0?
La respuesta es no, ya que el intervalo para su diferencia de medias toma el
valor cero, es decir, 1 - 2 = 0 o 1 = 2. Entonces, las duraciones medias de
las llantas de ambas marcas no son diferentes, son iguales.

234

5.12 PROBLEMAS PROPUESTOS


1.

Demuestre que:
a) Las desigualdades - E < x < + E, son equivalentes a | x - | < E
b) Si 1 P(t1 / 2 T t1 / 2 ) y T ( x ) n / s entonces:
s
s
1 P( x t1 / 2
x t1 / 2
)
n
n

2.

Se desea estimar el peso total de una partida de 10,000 manzanas. Para ello se
selecciona una muestra aleatoria de 50 manzanas, la cual da una media de 300
gramos y una desviacin estndar de 25 gramos. Calcule e interprete intervalos
de confianza del 95 % para:
a) El verdadero peso medio de las manzanas y el peso total (N).
b) La verdadera varianza (2) de los pesos de las manzanas.
c) Qu tamao de muestra debe tomarse, si se desea que x difiera de en
menos de 8 gramos con el 95 %

3.

Se toma una muestra al azar de 45 alumnos, sin reposicin de una clase de


estadstica de 221 alumnos que dan una calificacin final media de 70 puntos y
una desviacin tpica de 9 puntos. Determine el intervalo de confianza del 95 %
para la media y la varianza de las calificaciones.

4.

Un proceso est programado para embolsar la cantidad media de 500 gramos de


frejol. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
496.5 gramos y una desviacin tpica de 12 gramos.
a) Construya un intervalo de confianza del 95% para el verdadero peso medio
de las bolsas de frejol. Se puede afirmar que no se est cumpliendo con el
contenido medio en las bolsas de frejol?
b) Qu tamao de muestra debe tomarse, si se desea que X difiera de en
menos de 3 gramos con el 95 % de confianza?
c) Construya un intervalo de confianza del 95% para la verdadera varianza de
los pesos de las bolsas con frejol.

5.

Una universidad grande quiere estimar el nmero medio de das de enfermedad


de los estudiantes durante un ao; una muestra de 50 estudiantes indica que

235

x = 3.2 das y S = 5.2 das. Calcule e interprete intervalos de confianza del 95%
para:
a) La media y la varianza 2.
b) Qu tamao de muestra debe tomarse, si se desea que x difiera de en
menos de 10 gr. con el 95 % de confianza?
6.

Una muestra de 50 animales experimentales reciben una cierta clase de racin


por un perodo de 2 semanas. Sus aumentos de pesos arrojan los valores x =
480 gr. y S = 30 gr. Calcule e interprete intervalos de confianza del 99% para:
a) La media y la varianza 2.
b) Qu tamao de muestra debe tomarse, si se desea que x difiera de en
menos de 13 gr. con el 99 % de confianza?

7.

Se acaba de lanzar al mercado una nueva marca de cigarrillos; un estudio en 35


cigarros, para determinar su contenido medio de nicotina dio x = 25.4 mg. y S =
1.9 mg. Calcule e interprete intervalos de confianza del 95% para:
a) El verdadero contenido medio de nicotina y la verdadera varianza (2) del
contenido de nicotina.
b) Qu tamao de muestra debe tomarse, si se desea que x difiera de en
menos de 13 mg. con el 95 % de confianza?

8.

De los 500 establecimientos pequeos de una ciudad, se ha tomado una muestra


aleatoria de 50, obtenindose los siguientes datos sobre el nmero de empleados
por establecimiento:
Empleados por establecimiento (Xi)

Establecimientos (ni)

10

15

12

Calcule e interprete intervalos de confianza del 99 % para:


a) El nmero medio de empleados por establecimiento en la ciudad.
b) El total de empleados en los establecimientos pequeos de la ciudad.
c) La proporcin de establecimientos pequeos con 2 ms empleados.
d) El total de establecimientos pequeos que emplean a 2 ms personas.

236

9.

Una Encuesta de Opinin realizada en 1000 hogares de Lima Metropolitana


(con 1.4 millones de hogares) indica que el 35 % de los hogares tiene acceso a
internet. Calcule e interprete un intervalo de confianza del 95 % para:
a) La proporcin de hogares limeos que tiene acceso a internet;
b) El total de hogares limeos que tiene acceso a internet;
c) Con un error del 2.5 % y una confianza del 95 %. Cul sera el tamao de
muestra necesario para estimar la proporcin de hogares que tiene acceso a
internet?

10. En una muestra aleatoria de 400 hinchas del ftbol peruano (de un total de 15
millones) se encontr que 140 opinan que Per clasifica al mundial de ftbol.
a) Calcule e interprete un intervalo del 99% de confianza para la proporcin
verdadera y el total de hinchas que opinan que Per clasifica al mundial de
ftbol.
b) Con un 99% de confianza y un error mximo del 3%, qu tamao de muestra
ser necesario para estimar la proporcin de hinchas que opinan que Per
clasifica al mundial de ftbol?
11. De una poblacin de 4.5 millones de ciudadanos, se selecciona una muestra
aleatoria de 2,000 y se halla que 520 estn de acuerdo con la gestin del actual
presidente. Calcule e interprete intervalos de confianza del 95 % para:
a) La fraccin de la poblacin de ciudadanos que estn de acuerdo con la gestin
del actual presidente.
b) El total de votantes que estn de acuerdo con la gestin del presidente.
c) Con un 95% de confianza y un error mximo del 4%, qu tamao de muestra
ser necesario para estimar la proporcin de ciudadanos que estn de acuerdo
con la gestin del actual presidente?
12. De una poblacin de 100,000 fumadores, se selecciona una muestra aleatoria de
1,000 fumadores y se encuentra que 350 tienen preferencia por la marca A.
Calcule e interprete intervalos de confianza del 90 % para:
a) La proporcin de la poblacin de fumadores que prefieren la marca A.
b) El total de fumadores que prefieren la marca A.

237

c) Con el 95 % de confianza, Qu tamao de muestra debe tomarse, si se desea


un error mximo del 5%?
13. Una Encuesta de Opinin realizada en 1000 hogares de Lima Metropolitana
(con 1.4 millones de hogares) indica que el 16.3 % de los hogares usa tele cable.
a) Determine un intervalo de confianza del 95 % para la proporcin y otro para
el total de hogares limeos que usan tele cable.
b) Con un error del 2.5 % y una confianza del 95 %. Cul sera el tamao de
muestra necesario para estimar la proporcin de hogares que usa tele cable?
14. De una poblacin de 1500000 ciudadanos de una regin, se selecciona una
muestra aleatoria de 2,000 ciudadanos y se halla que 1,140 estn contentos con
el actual presidente regional.
a) Calcule e interprete intervalos de confianza del 90 % para la fraccin de la
poblacin de ciudadanos y otro para el total que estn a favor del actual
presidente regional.
b) Con un 95% de confianza, qu tamao de muestra ser necesario si desea
cometer un error mximo del 5%?
15. En un estudio para determinar el gasto medio mensual en luz en las ciudades A y
B, se toma una muestra al azar de 250 hogares de A arrojando un gasto medio de
S/. 120 y una desviacin estndar de 15. Una muestra al azar de 200 hogares de
la ciudad B da una gasto medio de 105 y una desviacin estndar de 10.
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto
medio mensual en luz en las ciudades A y B.
b) Ser diferente el gasto medio mensual en luz en las ciudades A y B?
16. Para determinar el costo medio de la enseanza en las universidades A y B, se

toma una muestra al azar de 121 alumnos de la universidad A arrojando un costo


medio de S/. 650 y una desviacin estndar de S/ 70. Una muestra al azar de 121
alumnos de la universidad B da una costo medio de S/. 675 y una desviacin
estndar de S/. 90.
a) Calcule e interprete intervalos de confianza del 95% para la diferencia del
costo medio de la enseanza en las universidades A y B.
b) Ser diferente el costo medio de la enseanza en las universidades A y B?
238

17. Una muestra al azar de 200 pilas para calculadoras de la marca A muestra una
vida media de 240 horas y una desviacin estndar de 10 horas. Una muestra al
azar de 120 pilas de la marca B da una vida media de 225 horas y una desviacin
estndar de 9 horas.
a) Determine un intervalo de confianza del 99 % para la diferencia de la vida
media de las pilas A y B.
b) Ser diferente la duracin media de las pilas A y B? Explique.
18. Dos grupos escogidos al azar, cada uno de 40 alumnas, de una escuela para
secretarias, aprenden taquigrafa por dos sistemas diferentes y luego se les
somete a pruebas de dictado. Se encuentra que el primer grupo obtiene en
promedio 120 palabras por minuto con una desviacin estndar de 11 palabras,
mientras que el segundo grupo promedia 115 palabras por minuto con una
desviacin estndar de 10 palabras.
a) Determine un intervalo de confianza del 95 % para la diferencia de medias de
palabras por minuto con los dos mtodos.
b) Sern diferentes las medias de palabras por minuto con los 2 mtodos?
Explique.
19. En un estudio para determinar el gasto medio semanal en alimentos en las
ciudades 1 y 2, se toma una muestra al azar de 200 hogares de la ciudad 1
arrojando un gasto medio de S/. 150 y una desviacin estndar de 15. Una
muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 135 y una
desviacin estndar de 10.
a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del
gasto medio en las ciudades 1 y 2.
b) Ser igual el gasto medio semanal en alimentos en las ciudades 1 y 2?
20. Se compararon los gastos mensuales (S/.) en educacin en las ciudades 1 y 2;
muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2, dieron
estos resultados: X 1 = 160, n1 = 200, S1 = 60
S2 = 50.

239

X 2 = 150, n2 = 150,

a) Calcule e interprete un intervalo del 95 % de confianza para la verdadera


diferencia entre los gastos medios mensuales en educacin de las familias de
las dos ciudades;
b) Difieren los gastos medios en educacin de ambas ciudades? Explique
21. En una muestra aleatoria de 400 adultos, 220 estn de acuerdo con la gestin
presidencial. Mientras que en una muestra de 600 jvenes, 300 estn de acuerdo
con la gestin presidencial.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de adultos y jvenes que estn de acuerdo
con la gestin presidencial.
b) Se puede afirmar que hay una diferencia entre las verdaderas proporciones
de adultos y jvenes que estn de acuerdo con la gestin presidencial?
22. Se entrevistaron dos grupos de mujeres respecto a su inters por la compra de
casacas de cuero. De una muestra de 300 mujeres de 40 aos a ms, 75
estuvieron interesadas, mientras que de 200 mujeres menores 40 aos, 80
mostraron inters.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 aos y las de 40
aos a ms que mostraron inters por la compra de casacas de cuero.
b) Existe diferencia entre la proporcin de mujeres menores de 40 aos y las de
40 aos a ms que mostraron inters por la compra de casacas de cuero.
Explique.
23. De los alumn@s de la UNAC se toma una muestra aleatoria de 600 hombres,
300 de las cuales estn a favor del cambio curricular. En una muestra de 400
mujeres, 240 indican que estn a favor de lo mismo.
a) Determine un intervalo de confianza del 99 % para la proporcin de alumnas
que estn a favor del cambio curricular.
b) Se puede afirmar que hay diferencia entre las verdaderas proporciones de
alumnos y alumnas que estn a favor del cambio curricular?
24. Se entrevistaron dos grupos de hombres respecto a su inters en una nueva
rasuradora elctrica que tiene cuatro navajas. De una muestra de 60 hombres
240

menores de 40 aos, slo 12 estuvieron interesados, mientras que de 40 hombres


mayores 40 aos, slo 5 mostraron inters.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de hombres menores de 40 aos y mayores
de 40 aos que mostraron inters.
b) Existe diferencia entre las verdaderas proporciones de hombres menores de
40 aos y mayores de 40 aos que mostraron inters? Explique.
25. Se entrevistaron dos grupos de mujeres respecto a su inters por la transmisin
de encuentros de voleibol por TV. De una muestra de 120 mujeres de 40 aos a
ms, slo 30 estuvieron interesadas, mientras que de 100 mujeres menores 40
aos, slo 40 mostraron inters.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 aos y las de 40
aos a ms que mostraron inters.
b) Existe diferencia entre la proporcin de mujeres menores de 40 aos y las de
40 aos a ms que mostraron inters. Explique.
26. Es ampliamente conocido que no cualquiera coopera respondiendo a los
cuestionarios de los entrevistadores puerta por puerta. En un experimento para
determinar si las personas mayores (1) son ms cooperadoras que los jvenes
(2), se obtuvieron los siguientes resultados:
Mayores (1): n1 = 250, X1 = 150;

Jvenes (2): n2 = 200, X2 = 110

a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia


entre las verdaderas proporciones de personas mayores y de jvenes que
cooperaron con los entrevistadores.
b) Existe diferencia entre las proporciones de mayores y de jvenes que
cooperan? Explique.
27. Se entrevistaron a un grupo de hombres en las ciudades de Cusco y Puno
respecto a su inters por la compra de abrigos de lana. De una muestra de 400
cusqueos, slo 160 estuvieron interesados, mientras que de 300 puneos, slo
90 mostraron inters.

241

a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia


entre las verdaderas proporciones de cusqueos y puneos que mostraron
inters por la compra de abrigos de lana.
b) Existe diferencia entre la proporcin de cusqueos y puneos que mostraron

inters por la compra de abrigos de lana? Explique.


28. Las cajas de un cereal producido por una fbrica deben tener un contenido de
160 gramos. Un inspector tom una muestra que arroj los siguientes pesos en
gramos:
157, 157, 163, 158, 161, 159, 162, 159, 158, 156
Calcule e interprete intervalos de confianza del 90 % para la media poblacional y
la varianza poblacional de los pesos.
29. Los pesos netos (grs.) de diez latas de conserva fueron los siguientes:
159, 162, 159, 158, 156,157, 157, 163, 158, 161
Calcule e interprete intervalos de confianza del 90 % para la media poblacional y
la varianza poblacional de los pesos netos.
30. De las 1500 micro empresas de una ciudad se extrae una muestra aleatoria de 20
y se recolecta informacin sobre el nmero de personas empleadas (X) por
empresa, obtenindose la siguiente informacin:
20

20

X i 210

i 1

i 1

2
i

1526

Calcule e interprete intervalos de confianza del 95 % para el(la) verdadero(a):


a) Nmero medio de empleados por micro empresa en la ciudad. Aceptara
usted que el tamao medio de las microempresas es de 7 empleados?
b) Nmero total de empleados en las micro empresas.
c) La varianza del nmero de empleados por micro empresa.
d) Para estimar en el futuro el nmero medio de empleados por establecimiento,
con un margen de error mximo de 0.8 empleados y una confianza del 95 %
qu tamao mnimo de muestra ser necesario?
31. Los contenidos netos (ml.) de una muestra aleatoria de 10 frascos de yogurt
fueron los siguientes: 248, 254, 249, 252, 250, 253, 250, 249, 247, 248
Calcule e interprete intervalos de confianza del 99 %
242

a) Para la media poblacional de los contenidos netos en los frascos.


b) La varianza poblacional de los contenidos netos en los frascos.
c) Qu tamao de muestra debe tomarse, si se desea que x difiera de en
menos de 1.5 ml. con el 99 % de confianza?
32. La produccin de 13 obreros de la jornada diurna, dio un promedio de 82 piezas
con una desviacin estndar de 10, mientras que para 11 obreros de la jornada
nocturna, dio un promedio de 74 con una desviacin estndar de 7. Calcule e
interprete intervalos de confianza del 95% para:
a) La razn de varianzas de la produccin de ambas jornadas. Sern
heterogneas las varianzas de ambos grupos?
b) La diferencia de la produccin media de ambos grupos. Son diferentes las
producciones medias de ambas jornadas?
33. En un colegio de secundaria, el cociente de inteligencia de 15 alumnos del turno
diurno, dio un promedio de 112 con una desviacin estndar de 6; mientras que
para 15 estudiantes del turno nocturno, dio un promedio de 105 con una
desviacin estndar de 15. Calcule e interprete intervalos de confianza del 99 %
para:
a) La verdadera razn de varianzas de los cocientes de inteligencia de los
alumnos de ambos turnos. Son heterogneas las varianzas de los 2 turnos?
b) La verdadera diferencia de las medias de los cocientes de inteligencia de los
alumnos de ambos turnos. Son diferentes los cocientes medios de
inteligencia de los 2 grupos?
34. Dos mquinas producen diariamente mil latas de conservas cada una
independientemente. Mediante muestra aleatoria sin reemplazo de 16 latas
tomadas de cada mquina se han obtenido los siguientes resultados sobre el peso
de las latas (en gramos): n1 = 16,

x1 = 495, S1 = 5

n2 = 16,

x2 =

505, S2 = 7.
Calcule e interprete intervalos de confianza del 99% para:
a) La razn de varianzas de los pesos de las latas de conservas de ambas
mquinas. Son diferentes las varianzas de los pesos de las latas de conservas
de ambas mquinas?

243

b) La diferencia de los pesos medios de las latas de conservas de ambas


mquinas. Son diferentes los pesos medios de las latas de conservas de
ambas mquinas?
35. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad
particular realizada por las empresas de dos ciudades. Mediante muestras
aleatorias de 20 empresas tomadas en cada ciudad se han obtenido los siguientes
resultados:
n1 = 20,

x1 = 458, S1 = 25

n2 = 20,

x 2 = 385, S2 = 15.

Calcule e interprete intervalos de confianza del 95% para:


a) La razn de varianzas de los gastos mensuales en seguridad particular
realizada por las empresas de ambas ciudades. Son diferentes las varianzas
de los gastos mensuales en seguridad particular realizada por las empresas de
ambas ciudades?
b) La diferencia de los gastos medios mensuales en seguridad particular
realizada por las empresas de ambas ciudades. Son diferentes los gastos
medios mensuales en seguridad particular realizada por las empresas de
ambas ciudades?

244

Captulo 6. CONTRASTE DE HIPTESIS ESTADSTICAS


PARAMTRICAS
El pensamiento estadstico ser un da tan necesario para el
ciudadano eficiente como la capacidad de leer y escribir. H.G. Wells
CONTENIDO
6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8
6.9
6.10

Prueba de hiptesis para la media (con varianza conocida).


Prueba de hiptesis para la media (con varianza desconocida).
Prueba de hiptesis acerca de una varianza.
Prueba de hiptesis para la razn de varianzas.
Prueba de hiptesis acerca de dos medias (varianzas conocidas).
Prueba de hiptesis acerca de dos medias (varianzas desconocidas).
Prueba de hiptesis para la proporcin.
Prueba de hiptesis para la diferencia de proporciones.
Ejercicios resueltos.
Ejercicios propuestos.

En el captulo anterior se ha desarrollado los diferentes aspectos relacionados con la


estimacin, que han permitido establecer las bases para de una manera sencilla hacer el
contraste, prueba o docimasia de hiptesis. Prueba que es fundamental en la investigacin
cientfica cuando se usa el modelo hipottico-deductivo, ya que frente a un problema de la
realidad tiene que formularse una hiptesis, cuyo contraste pasa muchas veces por el uso
de la estadstica.
En este captulo, se presenta los aspectos fundamentales de las pruebas de hiptesis, as
como la propuesta de contrastes de hiptesis estadsticas referidas a parmetros como: la
media, la varianza, la razn de varianzas, la diferencia de medias, la proporcin y la
diferencia de proporciones.
Hiptesis Estadstica
Es una aseveracin que se hace acerca del valor del parmetro o los valores de los
parmetros de una poblacin.
Ejemplo 1.El contenido medio de las bolsas de arroz es de = 1 000 gr., la tasa de desempleo es del
12% (P = 0.12), las notas tienen distribucin normal con = 12 y = 2.1 etc.
245

Planteamiento del Problema


Contrastar una hiptesis estadstica es juzgar si cierta propiedad supuesta para una
poblacin es compatible con lo observado en una muestra de ella. Es decir que:
La prueba estadstica de una hiptesis es una regla que cuando los valores muestrales
son observados nos conducen a aceptar o rechazar la hiptesis bajo consideracin.
Ejemplo 2.La Compaa Agrcola Yapatera S.A. embolsa arroz con un contenido medio de 1 000
gr. El proceso de llenado tiene distribucin N ( = 1 000 gr. , = 3 gr.). Por razones
imprevisibles el proceso de llenado se desajusta a veces produciendo un aumento o
disminucin del llenado medio sin variar la desviacin estndar. Para contrastar si en
cierto momento el proceso se ha desajustado, se toma una muestra al azar de n = 5 bolsas
con arroz. Se pesan las bolsas obteniendo los siguientes datos:
1 005, 1 006, 1 004, 1 005 y 1 006 gr.
Podemos decir que el proceso de llenado se ha desajustado?
Si el proceso no se ha desajustado al ser X ~ N (1 000 , 9)
X ~ N (1 000, 9 / 5) = N (1 000 , 1.8 ).
Calculando X = (1 005 + 1 006 + 1 004 + 1 005 + 1 006) / 5 = 1 005.2 gr.
El valor X = 1 005.2 gr. est muy alejado del valor central = 1 000 gr. Para verlo
formalmente, estandaricemos la variable.

X 1005 .2 1000

= 3.87. Es decir, se aleja ms de 3.8 veces la desviacin


X
1.342

estndar de la media. Por todo ello debemos pensar que el proceso se ha desajustado ya
que de ser correcto, la probabilidad de que una muestra de tamao 5 tome como media 1
005.2 gr. es muy pequea. Esta probabilidad es:
P( X 1 005.2) = P(Z 3.87) = 1 P(Z 3.87) = 1 0.99995 = 0.00005 . Sumamente
menor al 0.005%.
Estos son los elementos fundamentales a tener en cuenta para el contraste de hiptesis, as
como su relacin con los intervalos de confianza.
Para el ejemplo anterior [1 001.5 , 1 008.9] gr. con el 95% de confianza.

246

Como = 1 000 no pertenece al intervalo de confianza, entonces nos lleva a confirmar la


hiptesis de que es diferente de 1 000 gr. y que se ha producido un desajuste en el
proceso de llenado de las bolsas con arroz.
Tipos de Hiptesis
Para efectuar el contraste de hiptesis se formula dos tipos de hiptesis: la nula y la
alternativa.
Hiptesis Nula .- se denota por H0 y es la hiptesis que se contrasta. Generalmente se
establece en forma exacta. Es la hiptesis que mantendremos hasta que los datos
demuestren su falsedad. Ejemplo: H0 : = 0 .
La hiptesis nula refleja el valor que ha tenido el parmetro en un momento determinado,
pero pueda que haya cambiado dando lugar a la hiptesis alternativa.
Hiptesis Alternativa .- se denota por H1 o Ha y generalmente es especificada con menos
precisin. Es la suposicin contraria a la que se quiere contrastar, que se acepta en caso la
hiptesis nula se rechace. Ejemplo: H1 : < 0 , > 0 o 0 .
Al efectuar el contraste, hablamos de probar la hiptesis nula contra la hiptesis
alternativa, bajo el supuesto tentativo que la hiptesis nula es cierta. Ello porque la
hiptesis nula refleja el comportamiento que ha tenido (tiene o seguir teniendo) el
parmetro, hasta que los datos demuestren su falsedad.
Tipos de Pruebas
Hay dos tipos principales de pruebas: las pruebas unilaterales y la prueba bilateral.
Cada una se identifica por la forma en que se formula H1.
1.

Pruebas Unilaterales o de una Cola


Prueba de la cola inferior o prueba del lado izquierdo (cola izquierda)
Ho : = 0

H1 : < 0

Se emplea cuando se tiene alguna evidencia de que el valor del parmetro ha


disminuido.

247

Prueba de la cola superior o prueba del lado derecho (cola derecha)


Ho : = 0

H1 : > 0

Se emplea cuando se tiene alguna evidencia de que el valor del parmetro ha


aumentado.

2.

Prueba Bilateral o de dos Colas


Ho : = 0

H1 : 0

Este tipo de prueba se emplea, en caso de que el valor que se prueba no sea
verdadero, entonces, todos los dems valores son posibles.

Tipo de Errores
Error tipo I: se comete al rechazar la hiptesis nula Ho cuando sta es verdadera.
= Nivel de significacin = P (Error Tipo I) = P [Rechazar Ho / Ho es verdadera
Los valores ms comunes de son 0.05 y 0.01; porque el error debe ser bajo. Si
tuviramos un nivel de confianza del 95% entonces, el nivel de significacin sera
del 5%. Significara que en 5 de cada 100 pruebas nos estaramos equivocando al
rechazar Ho cuando esta es cierta.
Error de tipo II: se comete cuando se acepta una hiptesis Ho siendo esta falsa.
La probabilidad de cometer este error la denotamos con la letra .
= P [Aceptar Ho / Ho es falsa ]
248

Decisin
(muestral)
Aceptar Ho
Rechazar Ho

Ho es verdadera
No hay error
Error tipo I

Ho es falsa
Error tipo II
No hay error

Los errores tipo I y tipo II se relacionan. Una disminucin en la probabilidad de uno,


por lo general tiene como resultado un aumento en la probabilidad del otro.
La decisin de aceptar o rechazar la hiptesis bajo consideracin H0 se hace
basndose en pruebas de muestras, por ello escogemos una funcin de las n
observaciones, = G(X1,

X2, . , Xn ) como estadstica de prueba, cuya

distribucin por muestreo sea conocida en el supuesto (tentativo) que la hiptesis


nula H0 : = 0 es cierta.
Las reglas de decisin sobre la aceptacin o rechazo de H0 , se hace respecto al rango
de y un resultado particular de la muestra. Esto se hace hallando un valor C
llamado valor crtico de la estadstica de prueba (a veces hay ms de un valor
crtico) la cual divide al rango de en dos regiones: la regin crtica o de rechazo
(R,C) y la regin de aceptacin (R.A). Si

R.C. rechazamos H0. Si

R.A.

aceptamos H0.
Regin Crtica o de Rechazo
Es la regin que contiene lo valores para los cuales se rechaza la hiptesis H0 bajo
consideracin. Es la regin del rango de que de acuerdo con una prueba prescrita,
conduce al rechazo de la hiptesis bajo consideracin.

249

Regin de Aceptacin
Es la regin que contiene lo valores para los cuales se acepta la hiptesis H0 bajo
consideracin.
Pasos para el Contraste de Hiptesis
1.

Formular las hiptesis de acuerdo al problema.


H0 :

= 0

H1 :

< 0

> 0

2.

Escoger el nivel de significacin .

3.

Escoger la prueba estadstica apropiada (Z, t, chi-cuadrado, F, etc.) cuya distribucin


por muestreo sea conocida en el supuesto tentativo de que H0 es cierta. Esta prueba
estadstica, debe ser funcin del estimador y del parmetro, al igual que en la
construccin de intervalos de confianza.

4.

Establecer la regin crtica. Para ello tomar en cuenta la distribucin de la prueba


estadstica escogida.

5.

Calcular el valor de la prueba estadstica, con la informacin de una muestra aleatoria


de tamao n y bajo el supuesto que H0 es cierta.

6.

Conclusin: Si el valor calculado de la prueba estadstica pertenece a la regin


crtica, entonces rechazamos H0 y aceptamos H1. En caso contrario, si el valor
calculado de la prueba estadstica pertenece a la regin de aceptacin, entonces
aceptamos H0 y rechazamos H1.

A continuacin, utilizando los resultados de las distribuciones muestrales y de los


intervalos de confianza, veremos la aplicacin de las pruebas de hiptesis para los
parmetros poblacionales como la media, diferencia de medias, la varianza, la
igualdad de varianzas, la proporcin y la diferencia de proporciones. Cuyas
estadsticas de prueba van a estar referidas a distribuciones como la normal estndar,
t de student, chi cuadrado y F respectivamente.
Veamos cada una de ellas.

250

6.1 PRUEBA DE HIPTESIS PARA LA MEDIA (con varianza conocida)

Sea X la media de una muestra aleatoria de tamao n seleccionada de una


poblacin con media y con varianza 2 supuestamente conocida.
Si la poblacin es normal N(, 2), entonces, la distribucin de la estadstica

X es exactamente normal N(, 2/n). Si la poblacin no es normal, para

cualquier valor de n 30, la distribucin de X es aproximadamente normal


N(, 2/n). Si se necesita el factor de correccin para poblaciones finitas se usa
(N n) / (n-1)
Entonces, la estadstica para la prueba acerca de con varianza 2 conocida es:

X
, cuya distribucin es exacta o aproximadamente normal estndar
Z
/ n
N(0,1), segn sea la poblacin normal o no.
Si se supone verdadera la hiptesis nula: Ho: = o, la estadstica especificada

X 0
por esta hiptesis es entonces: Z
/ n
A. Prueba bilateral o de dos colas
1. Hiptesis:

Ho: = o ,

H1: 0

2. Escoger el nivel de significacin:

X
3. Estadstica de prueba: Z
, cuya distribucin es normal N(0,1).
/ n
4. Regin crtica: determinar el valor Z1-/2 tal que la probabilidad de rechazar H0
cuando se supone verdadera sea:

PZ Z1 / 2 / 2 o PZ Z1 / 2 / 2
En consecuencia, la regin crtica en el rango de variacin de Z es:

R.C. Z Z1 / 2 o Z Z1 / 2
Por otro lado, la probabilidad de aceptar H0 cuando se supone verdadera es:

P Z1 / 2 Z Z1 / 2 1
Resultando la regin de aceptacin: R.A. Z1 / 2 Z Z1 / 2

251

5. Hallar Z calc

x 0

con la informacin muestral y suponiendo que Ho es


/ n

cierta.
6. Decisin: se rechaza H0 con riesgo igual a , si Z calc R.C. (o si Z calc R.A. ).
No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .

Nota (Regin crtica en X )

Si X es estimador de , se cumple H1: 0 cuando X < a o X > b

R.C X a o X b

Si se sustituye Z ( X 0 ) /( / n ) en RC resulta la regin crtica en el rango

de variacin X con: a 0 Z1 / 2 ( / n ) ,

b 0 Z1 / 2 ( / n )

La regin de aceptacin es el intervalo en X :

R. A. [ a X b]

La regla de decisin es: Si x es el valor de X obtenido a partir de una muestra

aleatoria, se rechazar H0 con un riesgo , si x R.C. (o si x R. A.)


No se rechazar H0 en caso contrario.
B. Prueba unilateral de la cola derecha
1. Hiptesis:

Ho: = o ,

H1: > 0

2. Escoger el nivel de significacin:

X
3. Estadstica de prueba: Z
, cuya distribucin es normal N(0,1).
/ n
4. Regin crtica: determinar el valor Z1 tal que la probabilidad de rechazar H0
cuando se supone verdadera sea:

PZ Z1 | H 0 : 0 verdadera
En consecuencia, la regin crtica en el rango de variacin de Z es:

R.C. {Z Z1 }
252

R.A. {Z Z1 } .

La regin de aceptacin es:

5. Hallar Z calc

x 0

con la informacin muestral y suponiendo que Ho es


/ n

cierta.
6. Decisin: se rechaza H0 con riesgo igual a , si Z calc R.C. (o si Z calc R.A. ).
No se rechaza H0 en caso contrario.

Nota: (Regin Crtica en X )

Si X es estimador de , se cumple H1: > 0 cuando X > b1

R.C. { X b1} donde: b1 0 z1 ( / n )

La regin de aceptacin es el intervalo: R. A. { X b1}

La regla de decisin es: Siendo x el valor de X obtenido a partir de una muestra

aleatoria de tamao n, se rechazar H0 con un riesgo , si x R.C. (o si x R.A. ).


No se rechazar H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
Ho: = o ,

1. Hiptesis:

H1: < 0

2. Escoger el nivel de significacin:

X
3. Estadstica de prueba: Z
, cuya distribucin es normal N(0,1).
/ n
4. Regin crtica: determinar el valor Z1 tal que la probabilidad de rechazar H0
cuando se supone verdadera sea:

PZ Z1 / Ho : 0 verdadera
En consecuencia, la regin crtica en el rango de variacin de Z es:

R.C. Z Z1
R.A. Z Z1

La regin de aceptacin es:

5. Hallar Z calc

x 0

con la muestra y bajo el supuesto que Ho es cierta.


/ n

6. Decisin: se rechaza H0 con riesgo igual a , si Z calc R.C. (o si Z calc R.A. ).


253

No se rechaza H0 en caso contrario.

Nota: (Regin crtica en X )

Si X es estimador de , se cumple H1: < 0 cuando X < a1

RC { X a1} donde:

a1 = 0 Z1 ( / n )

Regin de aceptacin: RA { X a1}

Regla de decisin es: Si X es un valor de X obtenido a partir de una muestra

aleatoria de tamao n, rechazar H0 con un riesgo si x R.C. . (o si x R.A. ).


No se rechazar H0 en caso contrario.
Nota: Regla de decisin con el Intervalo de Confianza
La prueba de la hiptesis nula Ho: = 0 contra H1: 0 a un nivel de
significacin dado , equivale al calcular el intervalo de confianza (I.C.) del 100(1 )% para el parmetro y luego rechazar la hiptesis nula Ho: = 0 si es que 0

I .C.

En efecto, si x es un valor de X , no se rechaza Ho: = 0 si el valor

Zcalc R.A. = [-Z1-/2, Z1-/2] donde Z calc ( x 0 ) /( / n )

o, si

Z1 / 2

x 0

Z1 / 2

, 0 z1 / 2
Esto es, no se rechaza Ho: = 0 si x R. A. 0 z1 / 2
n
n

o equivalentemente si 0 se encuentra en el intervalo de confianza (I.C.) del 100(1 -

, x Z1 / 2
) % para : 0 I .C. x Z1 / 2
n
n

Por tanto, se rechaza H0 con riesgo , si x R. A.

o si

0 I .C.

Nota: Mtodo del valor P (o P-valor o sig o Probab, etc.)


Otra forma de establecer la regla de decisin, es calculando el valor P (probabilidad
mnima para rechazar Ho), a partir del valor Zcalc, de manera que:
254

Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
Para cola a la derecha: P = P[Z > Zcalc]
Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
Ejemplo 3.Un proceso de empaquetar un producto est controlado, si el peso medio del
producto empaquetado es 400 gr. Si en una muestra aleatoria de 100 paquetes del
producto se ha encontrado que el peso medio es de 395 gramos. Suponga que el peso
de los productos empaquetados se distribuye normalmente con desviacin estndar
de 20 gramos.
a) Se podra concluir que el proceso est fuera de control al 5% de significacin?
Halle P-valor.
b) Construya un intervalo de confianza del 95% para el peso medio del producto
empaquetado. Aceptara usted que = 400 gr. (proceso controlado)?
Solucin
a) Sea X la variable aleatoria definida como el peso de los paquetes del producto.
Se supone que la distribucin de X es N(, (20)2).
1. Hiptesis: H0: = 400 (proceso controlado) H1: 400 (proceso fuera de
control).
2. Nivel de significacin: = 0.05.
3. Estadstica de prueba: Poblacin normal con varianza conocida, la estadstica es

X
cuya distribucin es normal N(0,1).
Z
/ n
4. Regin crtica: Si la hiptesis nula H0 es cierta, para = 0.05 y la alternativa

bilateral, en la distribucin de Z ( X 400) /(20 / 100 ) , se encuentra el valor


crtico: Z1-/2 = Z0.975 = 1.96
Luego, la regin crtica en la variable Z est dada por:

RC Z calc 1.96 o Z calc 1.96

5. Clculos, de los datos se tiene: n = 100,


Entonces:
255

x 395,

20

Z calc

x 0 395 400

2.5
2
/ n

6. Decisin: Puesto que Zcalc = -2.5 R.C. , debemos rechazar H0 y concluir con
un 5% de significacin que el proceso de empaquetado no est controlado.
P-valor = P[|Z| > |-2.5|] = P[|Z| > 2.5] = 2 P[Z < -2.5] = 2(0.00621) = 0.01242.
Como el valor-P = 0.01242 < = 0.05 se rechaza Ho y se acepta H1: 400 y se
concluye tambin con un 5% de significacin que el proceso de empaquetado no
est controlado.

Nota: En el rango de variacin de X , la regin crtica es:

R.C. { X 400 1.96 x2 o X 400 1.96 x2} { X 396.08 o X 403.92}

Por el hecho que x 395 R.C. , se debe rechazar H0 y concluir con un riesgo de 5
% que el proceso de empaquetado no est controlado.
Clculos utilizando Minitab (versin 15.0 en espaol)
Del men escoger Estadsticas Estadsticas bsicas 1Z Z de 1 muestra y
aparece la Ventana Z de 1 muestra (prueba e intervalo de confianza) siguiente:

256

Habilitar la opcin Datos resumidos y escribir el Tamao de muestra: 100 y en


Media: 395 (la media muestral). Escribir la Desviacin estndar: 20.
Nota: Si los datos muestrales aparecen en una columna, se escoge Muestras en
columnas: y se ingresa dicha columna. Lo que sigue es igual para ambos casos.
Seleccionar Realizar prueba de hiptesis y escribir en Media hipottica: 400.
Escoger Opciones Nivel de confianza: 95.0. Escoger en Hiptesis alterna:
no es igual a. Luego escoger Aceptar y Aceptar
En la hoja de Sesin aparecen los resultados siguientes:
Z de una muestra
Prueba de mu = 400 vs. no = 400
La desviacin estndar supuesta = 20

N
100

Media del
Error
estndar
2.00

Media
395.00

IC de 95%
(391.08, 398.92)

Z
-2.50

P
0.012

Aparecen los resultados antes obtenidos: Zcalc = -2.5, el valor-P = 0.012 y el


intervalo de confianza del 95% para la media obtenido a continuacin en b).
b) El intervalo de confianza del 95% para el peso medio del producto empaquetado
viene dado por:

X Z

, X Z

. (1)

Datos: n = 100, X = 395, = 20, 1 = 0.95 En la Tabla 1, Zo = Z0.975 =


1.96.
El error de estimacin para la media es:
E= Z

1.96

20
= 3.92 gr.
100

Reemplazando en (1) se tiene:


[395 3.92 ; 395 + 3.92] = [391.08 ; 398.92] gr. con el 95% de confianza.
No se acepta que = 400 gr. porque no pertenece al intervalo de confianza, por lo
tanto, se debe rechazar H0 y concluir con un 95 % de confianza que el proceso de
empaquetado no est controlado.

257

6.2

PRUEBA DE HIPTESIS
desconocida)

PARA

LA

MEDIA

(con

varianza

Poblacin no normal
Si la poblacin no tiene distribucin normal y si la varianza es desconocida, para
probar hiptesis acerca de la media , slo si, el tamao de la muestra es grande

X 0
(n 30), se suele utilizar la estadstica: Z
/ n

N(0,1)

Luego, las regiones crticas de las pruebas de Ho: = 0 contra cualquiera de las
tres alternativas H1: > 0

H1: < 0

H1: 0 son las mismas

(aproximadamente) de la seccin anterior.


Poblacin normal
Si la poblacin tiene distribucin normal N(,2), donde y 2 son parmetros
desconocidas, para 2 n < 30 la estadstica de la prueba acerca de la media es:

x
T
S/ n
Si se

t n 1

supone verdadera la hiptesis nula, Ho: = o , la

estadstica

x 0
especificada por esta hiptesis es: T
S/ n
Nota: La estructura de la prueba es idntica que en el caso de conocida ,
salvo que el valor de

se estima por S y la distribucin normal estndar se

sustituye por la distribucin t de Student con n-1 grados de libertad.


A. Prueba bilateral o de dos colas
1. Hiptesis:

Ho: = o,

H1: 0

2. Escoger el nivel de significacin:

x
3. Estadstica de prueba: T
S/ n

t n 1

4. Regin crtica: determinar los valores t1 / 2, n 1 , tales que la probabilidad de


rechazar Ho cuando se supone verdadera sea:
258

P(T t1 / 2,n1 ) / 2 o P(T t1 / 2, n 1 ) / 2

En consecuencia, la regin crtica en el rango de variacin de T es:

R.C. {T t1 / 2,n1 o T t1 / 2,n1}


La regin de aceptacin es: R. A. {t1 / 2, n1 T t1 / 2, n1}

5. Hallar Tcalc

x 0

con la informacin muestral y suponiendo que Ho es


S/ n

cierta.
6. Decisin: se rechaza H0 con riesgo igual a , si Tcalc R.C. (o si Tcalc R.A. ).
No se rechaza H0 en caso contrario.
Si se rechaza Ho se dice que la prueba es significativa con riesgo igual .
B. Prueba unilateral de la cola derecha
Ho: = o,

1. Hiptesis:

H1: > 0

2. Escoger el nivel de significacin:

x
3. Estadstica de prueba: T
S/ n

t n 1

4. Regin crtica: determinar el valor t1 , n 1 tal que la probabilidad de rechazar


H0 cuando se supone verdadera sea:

P [T t1 , n1 | H 0 : 0 verdadera]
En consecuencia, la regin crtica en el rango de variacin de T es:

R.C. {T t1 , n1}
La regin de aceptacin es:

R. A. {T t1 , n1} .

5. Hallar Tcalc

x 0

con la informacin muestral y suponiendo que Ho es


S/ n

cierta.
6. Decisin: se rechaza H0 con riesgo igual a , si Tcalc R.C. (o si Tcalc R.A. ).
No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hiptesis:

Ho: = o ,

H1: < 0
259

2. Escoger el nivel de significacin:

x
3. Estadstica de prueba: T
S/ n

t n 1

4. Regin crtica: determinar el valor - t1 , n 1 tal que la probabilidad de rechazar


H0 cuando se supone verdadera sea:

P [T t1 , n1 | H 0 : 0 verdadera]
En consecuencia, la regin crtica en el rango de variacin de T es:
R.C. = {T < -t1 - , n -1}
La regin de aceptacin es: R.A. = {T > -t1 - , n -1}

5. Hallar Tcalc

x 0

con la informacin muestral y suponiendo que Ho es


S/ n

cierta.
6. Decisin: se rechaza H0 con riesgo igual a , si Tcalc R.C. (o si Tcalc R.A. ).
No se rechaza H0 en caso contrario.
Nota: Regla de decisin con el Intervalo de Confianza
La prueba de la hiptesis nula Ho: = 0 contra H1: 0 a un nivel de
significacin dado , equivale al calcular el intervalo de confianza (I.C.) del 100(1 )% para el parmetro y luego rechazar la hiptesis nula Ho: = 0 si es que 0

I .C.
Nota: Mtodo del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisin, es calculando el valor P (probabilidad
mnima para rechazar Ho), a partir del valor Tcalc, de manera que:
Para dos colas: P = P[|Tn-1| > |Tcalc|] = P[Tn-1 < -|Tcalc|] + P[Tn-1 > |Tcalc|] =
= 2 P[Tn-1 < -|Tcalc|] = 2 P[Tn-1 > |Tcalc|]
Para cola a la derecha: P = P[Tn-1 > Tcalc]
Para cola a la izquierda: P = P[Tn-1 < Tcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.

260

Ejemplo 4.Un fabricante produce un cable de alambre de cierto tipo, que tiene una resistencia a la
ruptura no mayor de 300 kg. Se descubre un proceso nuevo y ms barato que desea
emplearse, siempre que el cable as producido tenga una resistencia media a la ruptura
mayor de 300 kg. Si una muestra aleatoria de 25 cables producidos con el nuevo proceso
ha dado una media 304.5 kg. y una desviacin estndar S = 10 kg. Debera el fabricante
adoptar el nuevo proceso, si est dispuesto a asumir un error tipo I del 5%? Hallar el Pvalor.
Solucin
1. Hiptesis: H0: 300 (proceso antiguo)

H1: > 300 (proceso nuevo).

2. Nivel de significacin: = 0.05.


3. Estadstica de prueba:

x
T
S/ n

t 24

4. Regin crtica: para = 0.05 y la alternativa unilateral derecha, se encuentra el


valor crtico en la Tabla 3: t1-, n-1 = t0.95, 24 = 1.711
Luego, la regin crtica en la variable T est dada por: R.C = {T > 1.711}

5. Clculos, de los datos se tiene: n = 25,

x = 304.5 Kg.

S = 10 y = 300

Entonces: Tcalc

x 304.5 300
= 2.25

S/ n
10 / 25

6. Decisin: puesto que Tcalc = 2.25 R.C., debemos rechazar H0 y concluir con un
5% de significacin que conviene adoptar el nuevo proceso.
P-valor = P[T24 > 2.25] = 1 - P[T24 2.25] = 1 x

(1)

Como en la tabla 3, T de student, para 24 grados de libertad, no est el valor 2.25,


pero ste se encuentra entre los valores 2.064 (con probabilidad 0.975) y 2.492 (con
probabilidad 0.99) se determina x interpolando de la siguiente manera:
T

2.064 0.975
2.25

2.492 0.990

2.492 2.064 2.25 2.064 28.53 = 0.186

0.990 0.975
x 0.975
x 0.975
28.53x - 27.82 = 0.186
261

x = 0.982

Reemplazando x = 0.982 en (1) se obtiene: P-valor = 1 0.982 = 0.018

Rpta.

Como el valor-P = 0.018 < = 0.05 se rechaza Ho y se acepta H1: > 300. Por lo
tanto, se concluye tambin con un 5% de significacin que es conveniente adoptar el
nuevo proceso.
Clculos utilizando Minitab
Del men escoger Estadsticas Estadsticas bsicas 1t t de 1 muestra y
aparece la Ventana t de 1 muestra (prueba e intervalo de confianza) siguiente:

Habilitar la opcin Datos resumidos y escribir el Tamao de muestra: 25 y en


Media: 304.5 (la media muestral). Escribir la Desviacin estndar: 10 (desviacin
estndar muestral).
Nota: Si los datos muestrales aparecen en una columna, se escoge Muestras en
columnas: y se ingresa dicha columna. Lo que sigue es igual para ambos casos.
Seleccionar Realizar prueba de hiptesis y escribir en Media hipottica: 300.
Escoger Opciones Nivel de confianza: 95.0. Escoger en Hiptesis alterna:
mayor que. Luego escoger Aceptar y Aceptar
En la hoja de Sesin aparecen los resultados siguientes:
262

T de una muestra
Prueba de mu = 300 vs. > 300

N
25

Media
304.50

Media del
Error
estndar
2.00

Desv.Est.
10.00

95% Lmite
inferior
301.08

T
2.25

P
0.017

Para prueba bilateral:


N
25

Media Desv.Est.
304.50
10.00

Errorestndar
2.00

IC de 95%
(300.37, 308.63)

Aparecen los resultados antes obtenidos: Tcalc = 2.25, el valor-P = 0.017 (ligeramente
diferente al 0.018 encontrado con aproximacin usando la Tabla 3) y el intervalo de
confianza del 95% para la media obtenido a continuacin.
Nota.Si se construye el intervalo de confianza del 95% para la media , con 1 = 0.95
en la Tabla 3, t0 = t24 , 0.975 = 2.064. Adems: n = 25, X = 304.5 Kg. y S = 10.
El intervalo de confianza para la media es: [ X - t0 S / n , X + t0 S / n ]
Luego: [304.5 2.064 x

10
10
, 304.5 + 2.064 x
] = [304.5 4.128]
25
25

Por lo tanto: [300.37 ; 308.63] Kg. con el 95% de confianza.


En consecuencia, se rechaza H0: = 300 kilos porque no pertenece al intervalo de
confianza y se acepta H1: > 300 Kg. siendo conveniente adoptar el nuevo proceso
con un 95% de confianza.
6.3 PRUEBA DE HIPTESIS ACERCA DE UNA VARIANZA
Sea Xk, X2, ...., Xn una muestra aleatoria de tamao n, seleccionada de una
poblacin normal con media y varianza 2, parmetros desconocidos, y sea la
n

varianza muestral, S 2

( X
i 1

X )2

n 1

Entonces, la variable aleatoria, 2

(n 1)S 2

263

n21

Esta estadstica se utiliza para probar hiptesis acerca de una varianza. Si se supone
verdadera la hiptesis nula Ho: 2 = 02 , la estadstica es:

2
2

El valor calc

(n 1) S 2

02

(n 1) S 2

02

n21

que resulta de la muestra aleatoria, se usa para la prueba

de H0, contra una alternativa unilateral o bilateral.


A. Prueba bilateral o de dos colas
1. Hiptesis:

Ho: 2 = 02 ,

H1: 2 02

2. Escoger el nivel de significacin:


3. Estadstica de prueba: 2

(n 1)S 2

n21

4. Regin crtica: determinar los valores X 2 / 2 , n 1 y X12 / 2 , n 1 , tales que la


probabilidad de rechazar la hiptesis nula H0 cuando se supone verdadera sea:

P [ 2 2 / 2,n1 ] / 2

o P [ 2 2 / 2,n1 ] / 2

La Regin crtica de la prueba es: R.C. = {X2 < 2 / 2,n1 o X2 > 12 / 2,n1 }

La regin de aceptacin es: R.A. = { 2 / 2,n1 X2 12 / 2,n1 }


2

5. Hallar calc

(n 1) S 2

02

con la informacin muestral y suponiendo que Ho es

cierta.
2
2
R.C. (o si calc
R. A. ).
6. Decisin: se rechaza H0 con riesgo igual a , si calc

No se rechaza H0 en caso contrario.


Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es
.
264

B. Prueba unilateral de la cola derecha


Ho: 2 = 02 , H1: 2 > 02

1. Hiptesis:

2. Escoger el nivel de significacin:


3. Estadstica de prueba: 2

(n 1)S 2

n21

4. Regin crtica: determinar el valor X12 , n 1 tal que la probabilidad de rechazar

P[ 2 12 ,n1 ]

H0 cuando se supone verdadera sea:

La Regin crtica de la prueba es: R.C. = {X2 > 12 , n1 }

12 , n1
La regin de aceptacin es:
5. Hallar

2
calc

(n 1) S 2

02

R.A. = {X2 < 12 , n1 }

con la muestra y suponiendo que Ho es cierta.

2
2
R.C. (o si calc
R. A. ).
6. Decisin: se rechaza H0 con riesgo igual a , calc

No se rechaza H0 en caso contrario.


C. Prueba unilateral de la cola izquierda
1. Hiptesis:

Ho: 2 = 02 , H1: 2 < 02

2. Escoger el nivel de significacin:


3. Estadstica de prueba: 2

(n 1)S 2

n21

4. Regin crtica: determinar el valor 2 ,n1 tal que la probabilidad de rechazar H0


cuando se supone verdadera sea:
265

P[ 2 2, n1 ]
La Regin crtica de la prueba es: R.C. = {X2 < 2, n1 }

R.A. = {X2 > 2, n1 }

La regin de aceptacin es:


5. Hallar

2
calc

(n 1) S 2

02

con la muestra y suponiendo que Ho es cierta.

2
2
R.C. (o si calc
R. A. ).
6. Decisin: se rechaza H0 con riesgo igual a , calc

No se rechaza H0 en caso contrario.


Nota: Regla de decisin con el Intervalo de Confianza
La prueba de la hiptesis nula Ho: 2 = 02 contra H1: 2 02 a un nivel de
significacin dado , equivale al calcular el intervalo de confianza (I.C.) del 100(1 )% para el parmetro 2 y luego rechazar la hiptesis nula Ho: 2 = 02 si es que 02

I .C. Caso contrario, si 02 I.C. se acepta la hiptesis nula Ho: 2 = 02 .


Nota: Mtodo del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisin, es calculando el valor P (probabilidad
2
mnima para rechazar Ho), a partir del valor calc
, de manera que:

Para dos colas:


2
2
Si calc
< n 1 P = 2 P[ n21 < calc
]
2
2
2
Si calc
> n 1 P = 2 P[ n21 > calc
] = 2 {1 - P[ n21 < calc
]}

2
Para cola a la derecha: P = P[ n21 > calc
]
2
Para cola a la izquierda: P = P[ n21 < calc
]

Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.


266

Ejemplo 5.En un proceso de fabricacin, se plantea la hiptesis que la desviacin estndar de las
longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos
elegidos al azar del proceso de produccin se han encontrado las siguientes
longitudes en milmetros: 71, 66, 64, 72, 69, 67, 70, 68, 65, 69
Con estos datos, se justifica la suposicin que la desviacin estndar verdadera es
2.00 mm? Use el nivel de significacin = 0.05, y suponga que la distribucin de las
longitudes es normal. Halle el valor-P.
Solucin:
1. Hiptesis : H 0 : 2 4,

H1 : 2 4

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: poblacin normal, con n = 10, y suponiendo verdadera la
hiptesis

(n 1)S 2
H 0 : 4 , la estadstica de prueba:
92
4
2

4. Regin crtica: Para = 0.05 y para un contraste bilateral, en la tabla 2 de chicuadrado se encuentran los siguientes valores crticos:

2 / 2,n1 02.025, 9 2.70 y 12 / 2,n1 02.975.9 19.02


Luego, la regin crtica es: R.C. {X2 < 2.70 o X2 > 19.02}
5. Clculos: De los datos de la muestra resulta S2 = 6.77, entonces,

2
calc

(n 1)S 2 9S 2 9 (6.77)

15.23
4
4
4

2
6. Decisin: Como calc
= 15.23 R.A. se acepta H 0 : 2 4 y concluimos que la

desviacin estndar es de 2 mm. con el 5% de significacin.

Rpta.

2
Como la prueba es bilateral y calc
= 15.23 > n 1 = 9 el valor-P se obtiene as:

2
P = 2 {1 - P[ n21 < calc
]} = 2 {1 - P[ 92 < 15.23]} = 2 {1 - x} . (1)

Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no est el valor 15.23,


pero ste se encuentra entre los valores 14.7 (con probabilidad 0.90) y 16.9 (con
probabilidad 0.95) se determina p interpolando de la siguiente manera:
267

X2

14.7

0.90

15.23

16.9

0.95

16.9 14.7 15.23 14.7

0.95 0.90
x 0.90
44x 39.6 = 0.53

44 =

0.53
x 0.90

x = 0.912

Reemplazando x = 0.9815 en (1) se obtiene:


P = P-valor = 2{1 0.912} = 0.176

Rpta.

Como el valor-P = 0.176 > = 0.05 se acepta H 0 : 2 4 . Por lo tanto, se concluye


tambin con un 5% de significacin que la desviacin estndar es de 2 mm.
Clculos utilizando Minitab
En la Ventana de Datos (Hoja de trabajo), columna C1 definir la variable Longitud
(de los tornillos) e ingresar los 10 valores de la muestra.
Del men escoger Estadsticas Estadsticas bsicas 2 1 varianza y aparece
la Ventana 1 varianza siguiente:

En vez de ingresar desviacin estndar, escoger ingresar varianza.


Como los datos muestrales aparecen en la columna C1 Longitud, se escoge
Muestras en columnas: y se selecciona en dicho recuadro la columna C1 Longitud.

268

Nota: si ya se tienen los clculos muestrales, habilitar la opcin Datos resumidos y


escribir el Tamao de muestra: y la Varianza de la muestra: correspondientes.
Lo que sigue es igual para ambos casos.
Seleccionar Realizar prueba de hiptesis y escribir en Varianza hipottica: 4.
Escoger Opciones Nivel de confianza: 95.0. Escoger en Hiptesis alterna: no
es igual a. Luego escoger Aceptar y Aceptar
En la hoja de Sesin aparecen los resultados siguientes:
Prueba e IC para una varianza: Longitud
Mtodo
Hiptesis nula
Hiptesis alterna

Sigma-cuadrado = 4
Sigma cuadrado no = 4

El mtodo estndar se utiliza slo para la distribucin normal.


El mtodo ajustado se utiliza para cualquier distribucin continua.

Estadsticas
Variable
Longitud

N
10

Desv.Est.
2.60

Varianza
6.77

Intervalos de confianza de 95%


IC para
Variable Mtodo
Desv.Est.
Longitud Estndar (1.79, 4.75)
Ajustado (1.93, 3.98)

IC para
varianza
(3.20, 22.55)
(3.73, 15.85)

Pruebas
Variable
Longitud

Mtodo
Estndar
Ajustado

Chicuadrada
15.23
26.47

GL
9.00
15.65

Valor P
0.170
0.084

2
Aparecen los resultados antes obtenidos: calc
= 15.23, el valor-P = 0.17

(ligeramente diferente al 0.176 encontrado con aproximacin usando la Tabla 2) y el


intervalo de confianza del 95% para la varianza analizado a continuacin.
Nota.Si se construye el intervalo de confianza del 95% para la varianza 2, ste resultar
ser: 2 [3.20; 22.55] mm2 con el 95% de confianza.
En consecuencia, se acepta H 0 : 2 4 porque pertenece al intervalo de confianza.
Por lo tanto, se concluye tambin que la desviacin estndar es de 2 mm. con un 95%
de confianza.
269

6.4 PRUEBA DE HIPTESIS PARA LA RAZN DE VARIANZAS


Sean S12 y S 22 las varianzas de dos muestras aleatorias independientes de
tamaos respectivos n1 y n2, escogidas de dos poblaciones normales con
varianzas respectivas 12 y 22 . Entonces, la estadstica,

S12 / 12
f n1 1, n2 1
S 22 / 22

tiene distribucin de probabilidad F con grados de libertad n1 1 y n2 1. Esta


estadstica se utiliza para probar igualdad de varianzas.
Si se supone verdadera la hiptesis nula Ho: 12 22
estadstica de la prueba es: F
Su valor Fcalc

12 / 22 = 1, la

S12
f n1 1, n2 1
S 22

S12
que resulta de dos muestras aleatorias, se utiliza para
S 22

probar la hiptesis nula Ho contra cualquiera alternativa unilateral o bilateral.


A. Prueba bilateral o de dos colas
1. Hiptesis:

Ho : 12 22 ,

H1 : 12 22

2. Escoger el nivel de significacin:


3. Estadstica de prueba: F

S12 / 12
f n 11, n2 1
S 22 / 22

4. Regin crtica: determinar los valores f / 2 , n 11, n 21 y X 12 / 2 , n 11, n 21 , tales que la


probabilidad de rechazar la hiptesis nula H0 cuando se supone verdadera sea:

P[ F f / 2, n 11, n 21 ] / 2 o P[ F f1 / 2, n 11, n 21 ] / 2
La Regin crtica es: R.C. = {F < f / 2, n 11, n 21 o F > f1 / 2, n 11, n 21 }
La regin de aceptacin es: R.A. = { f / 2, n 11, n 21 F f1 / 2, n 11, n 21 }
5. Hallar Fcalc

S12
2 con la informacin muestral y suponiendo que Ho es cierta.
S2

6. Decisin: se rechaza H0 con riesgo igual a , si Fcalc R.C. (o si Fcalc R.A. ).


No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .
270

B. Prueba unilateral de la cola derecha


1. Hiptesis:

Ho: 12 22 ,

H1 : 12 22

2. Escoger el nivel de significacin:


3. Estadstica de prueba: F

S12 / 12
f n 11, n2 1
S 22 / 22

4. Regin crtica: determinar el valor f1 , n 11, n 21 tal que la probabilidad de


rechazar H0 cuando se supone verdadera sea:

P[ F f1 , n 11, n 21 ]
La Regin crtica de la prueba es: R.C. = {F > f1 , n 11, n 21 }

f1 , n 11, n 21
La regin de aceptacin es:
5. Hallar Fcalc

R.A. = {F < f1 , n 11, n 21 }

S12
con la muestra y suponiendo que Ho es cierta.
S 22

6. Decisin: se rechaza H0 con riesgo igual a , Fcalc R.C. (o si Fcalc R.A. ).


No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hiptesis:

Ho : 12 22 ,

H1 : 12 22

2. Escoger el nivel de significacin:


3. Estadstica de prueba: F

S12 / 12
f n 11, n2 1
S 22 / 22

271

4. Regin crtica: determinar el valor f , n 11, n 21 tal que la probabilidad de


rechazar H0 cuando se supone verdadera sea:

P [ F f , n 11, n 21 ]
La Regin crtica de la prueba es: R.C. = {F < f , n 11, n 21 }
R.A. = {F > f , n 11, n 21 }

La regin de aceptacin es:


5. Hallar Fcalc

S12
2 con la muestra y suponiendo que Ho es cierta.
S2

6. Decisin: se rechaza H0 con riesgo igual a , Fcalc R.C. (o si Fcalc R.A. ).


No se rechaza H0 en caso contrario.
Nota: Regla de decisin con el Intervalo de Confianza
La prueba de la hiptesis nula Ho: 12 22 o 12 / 22 = 1 contra H1 : 12 22 o

12 / 22 1 a un nivel de significacin dado , equivale a determinar el intervalo


de confianza (I.C.) del 100(1 - )% para la razn de varianzas 12 / 22 y luego
rechazar la hiptesis nula Ho: 12 22 si es que 12 / 22 = 1 I .C. Por el
contrario, si 12 / 22 = 1 I.C. se acepta la hiptesis nula Ho: 12 22 .
Nota: Mtodo del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisin, es calculando el valor P (probabilidad
mnima para rechazar Ho), a partir del valor Fcalc , de manera que:
Para dos colas:
Si Fcalc < 1 P = 2 P[ f n 11, n 21 < Fcalc ]
Si Fcalc > 1 P = 2 P[ f n 11, n 21 > Fcalc ] = 2 {1 - P[ f n 11, n 21 < Fcalc ]}
Para cola a la derecha: P = P[ f n 11, n 21 > Fcalc ]
Para cola a la izquierda: P = P[ f n 11, n 21 < Fcalc ]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
Ejemplo 6.Una compaa disea un nuevo proceso de moldeo para reducir la variabilidad en el
dimetro de las piezas producidas. Se cree que la varianza del nuevo proceso es
menor que la varianza del proceso antiguo. Para una muestra de 8 piezas del proceso
272

antiguo y una muestra de 6 piezas del proceso nuevo se obtienen los siguientes
dimetros en milmetros:
Antiguo (1): 17, 23, 21, 18, 22, 20, 21, 19
Nuevo (2): 13, 16, 14, 12, 15, 14
Confirman estos datos que la varianza de los dimetros con el nuevo proceso es
menor que con el proceso antiguo? Suponga poblaciones normales y use = 0.05
Solucin
Sean X1 y X2 las variables que representan los dimetros de las piezas con el proceso
antiguo y nuevo respectivamente. Las dos poblaciones se distribuyen normalmente
con varianzas desconocidas.
1.

Hiptesis: H0: 12 = 22

H1: 12 > 22

2.

Nivel de significacin: = 0.05

3.

Estadstica de prueba: siendo las poblaciones normales y suponiendo verdadera


la hiptesis nula Ho, para n1 = 8 y n2 = 6, la estadstica de prueba es:

S12
F 2 f 7 ,5
S2
4.

Regin crtica: para = 0.05 y la prueba unilateral derecha, f7,5, 0.95 = 4.88 es:
R.C. = {F > 4.88}

5.

Clculos: con los datos de la muestra se obtiene:

S12 = 4.125, S 22 = 2 y Fcalc


6.

S12 4.125

= 2.0625
2
S 22

Decisin. Como Fcalc = 2.0625 R.A. se acepta Ho y concluimos que la


varianza de los dimetros con el nuevo proceso no es menor que con el proceso
antiguo, sino las dos varianzas son iguales con el 5% de significacin.

Nota. Si se construye el intervalo de confianza del 95% para la razn de varianzas, ste
resultar ser: 12 / 22 [0.301; 10.91] con el 95% de confianza.
Entonces, se acepta que 12 / 22 = 1, porque pertenece al intervalo de confianza.
Por lo tanto, se concluye que 12 22 con el 95% de confianza, es decir que la
varianza de los dimetros con el nuevo proceso es igual a la del proceso antiguo.
Para hallar el valor-P, como Fcalc = 2.0625 > 1 se obtiene as:
273

P = 2 P[f7,5 > 2.0625] = 2{1 - P[f7,5 2.0625]} > 0.10 (en Excel = 0.4428).
Rpta.
Ya que en la Tabla 4, de la distribucin F, para 7 y 5 grados de libertad la
probabilidad acumulada hasta 2.0625 es menor a 0.95 (en Excel es 0.7786).
Como P = 0.4428 > = 0.05, se acepta la hiptesis nula y se concluye tambin
con el 5% de significacin, que la varianza de los dimetros con el nuevo proceso
no es menor que con el proceso antiguo, sino las varianzas son iguales.
Clculos utilizando Minitab
En la Ventana de Datos (Hoja de trabajo), en la columna C1 definir la variable
dimetro Antiguo-1 e ingresar los 8 valores de la muestra y en la columna C2
definir la variable dimetro Nuevo-2 e ingresar los 6 valores de la muestra.
Del men escoger Estadsticas Estadsticas bsicas 21 22 2 varianzas y
aparece la Ventana 2 varianzas siguiente:

Como los datos muestrales aparecen en las columnas C1 y C2, se escoge Muestras
en diferentes columnas y se selecciona en el recuadro de Primera: la columna C1
Antiguo-1 y en el recuadro de Segunda: la columna C2 Nuevo-2.
Nota: si ya se tienen los clculos muestrales, habilitar la opcin Datos resumidos y
escribir el Tamao de muestra: y la Varianza: (de la muestra) correspondiente a la
Primera: y Segunda: muestra. Lo que sigue es igual para ambos casos.
274

Escoger Opciones Nivel de confianza: 95.0. Colocar un Ttulo: (del grfico)


Varianza antigua vs Varianza nueva. Luego escoger Aceptar y Aceptar
En la hoja de Sesin aparecen los resultados siguientes:
Prueba de varianzas iguales: Antiguo-1, Nuevo-2
Intervalos de confianza de Bonferroni de 95% para desviaciones
estndares
Antiguo-1
Nuevo-2

N
8
6

Inferior
1.27062
0.82920

Desv.Est.
2.03101
1.41421

Superior
4.65199
4.04599

Prueba F (distribucin normal)


Estadstica de prueba = 2.06, valor p = 0.443
Prueba de Levene (cualquier distribucin continua)
Estadstica de prueba = 1.25, valor p = 0.286

Aparecen los resultados antes obtenidos: Fcalc = 2.0625 y el valor-P = 0.4428. Si se


observan los intervalos de confianza de Bonferroni, en la grfica de Varianza antigua
vs Varianza nueva, se puede apreciar que estos se entre cruzan, indicando que las
varianzas (y desviaciones estndar) son iguales.
Varianza antigua vs Varianza Nueva
Prueba F
Estadstica de prueba
Valor P

Antiguo-1

2.06
0.443

Prueba de Levene
Estadstica de prueba
Valor P

Nuevo-2

1
2
3
4
5
Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Antiguo-1

Nuevo-2

12

14

16

18
Datos

20

275

22

24

1.25
0.286

6.5 PRUEBA DE HIPTESIS ACERCA DE DOS MEDIAS (con varianzas


conocidas)
Sean X

y X

las medias de dos muestras aleatorias independientes de

tamaos n1 y n2 seleccionadas respectivamente de dos poblaciones


independientes, con medias 1 y 2 y varianzas 12 y 22 conocidas.
Si las dos poblaciones son normales, entonces, las estadsticas X 1 y X 2 tienen
respectivamente distribucin normal N(1, 12 ,/n1) y N(2, 22 ,/n2) para n1 > 2,
y n2 > 2. Entonces: X

- X

tiene distribucin normal N(1 - 2;

12 /n1+ 22 /n2).
Si las dos poblaciones no son normales, pero n1 y n2 son suficientemente
grandes (n1 > 30 y n2 > 30), entonces, X

- X

tiene aproximadamente

distribucin normal N(1 - 2; 12 /n1+ 22 /n2).


Segn sean las dos poblaciones normales o no, la estadstica de prueba es:

X 1 X 2 (1 2 )

12
n1

22

N(0,1).

n2

Si suponemos verdadera la hiptesis nula H0: 1 = 2 1 - 2 = 0, la


estadstica de prueba es: Z

X1 X 2

12
n1

Su valor Zcalc =

X1 X 2

12
n1

22

22

N (0,1)

n2

que resulta de dos muestras independientes, se

n2

utiliza para probar Ho: 1 = 2 contra cualquiera de las hiptesis alternativas


H1: 1 2 H1: 1 > 2 H1: 1 < 2
La estructura de la prueba es similar a los casos descritos usando la
distribucin Z.
A. Prueba bilateral o de dos colas
Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 2 o 1 - 2 0, la regin
crtica en el rango de variacin de Z es:
R.C. = {Z < - Z1-/2 o Z > Z1-/2}
276

B. Prueba unilateral de la cola derecha


Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 > 2 o 1 - 2 > 0, la regin
critica en la variacin de Z es:
R.C. = {Z > Z1- }
C. Prueba unilateral de la cola izquierda
Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 < 2 o 1 - 2 < 0, la regin
critica en la variacin de Z es:
R.C. = {Z < - Z1- }
Nota 1.- Cuando las hiptesis son de la forma:
1) H0: 1 - 2 = d0 contra H1: 1 - 2 d0
2) H0: 1 - 2 = d0 contra H1: 1 - 2 > d0
3) H0: 1 - 2 = d0 contra H1: 1 - 2 < d0
La estadstica de la prueba es:

X 1 X 2 d0

12
n1

22
n2

Cuya distribucin es aproximadamente normal N(0, 1) segn sean las dos


poblaciones normales o no.
Se rechaza H0 con riesgo igual a , si Z calc R.C. (o si

Z calc R.A. ). No se

rechaza H0 en caso contrario.


Nota 2.Se usa el intervalo de confianza I.C. al 100(1 )% para la diferencia de medias 1 2, a fin de verificar si las medias son iguales (cuando se cumple que 1 - 2 = 0
I.C.) o su diferencia asume un valor determinado (si ocurre que 1 - 2 = d0 I.C.).
Otra forma de establecer la regla de decisin, es calculando el valor P (probabilidad
mnima para rechazar Ho), a partir del valor Zcalc, de manera que:
Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
Para cola a la derecha: P = P[Z > Zcalc]
Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
277

Ejemplo 7.Un fabricante quiere comparar los tiempos de proceso de dos marcas de mquinas A
y B, para fabricar un tipo de artculo. Al observar dos muestras aleatorias de 60
artculos procesados por A y B respectivamente, encuentra que las medias
respectivas son 1,230 y 1,190 segundos. Suponga A = 120 y B = 90 segundos.
a) Al nivel de significacin del 5%, se puede inferir que la mquina B es ms
rpida que la mquina A? Hallar el valor P.
b) Al nivel de significacin del 5%, se puede inferir que la media de B es menor
que la media de A en menos de 7 segundos? Hallar el valor P.
Solucin
Sean XA y XB los tiempos de proceso con las mquinas A y B respectivamente y A,
B sus medias respectivas. Se desconocen las distribuciones de probabilidades de
XA y XB, pero las muestras son grandes (nA = nB = 60 > 30). Para determinar si la
mquina B es ms rpida que la A, se comparan sus tiempos promedios de proceso:
A > B.
a) 1. Hiptesis: H0: A = B contra H1: A > B
2. Nivel de significacin: = 0.05.
3. Estadstica de prueba.- si se supone verdadera la hiptesis Ho y para muestras
grandes, la estadstica apropiada es:

XA XB

A2
nA

B2

N (0, 1)

nB

4. Regin Crtica. Para = 0.05 y una prueba unilateral de la cola derecha, en la


Tabla 1, distribucin de Z se encuentra el valor Z0.95 = 1.645. Luego, la regin
crtica es:
R.C. = {Z > 1.645}
5. Clculos, de los datos se tiene:
nA = nB = 60,

x A = 1230, x B = 1190, A = 120 y B = 90

E.S. = Error estndar =

Z calc

A2
nA

B2
nB

120 2 90 2

= 19.365
60
60

x A x B 1,230 1,190

2.07
ES
19.365
278

6. Decisin: ya que Zcalc = 2.07 R.C., debemos rechazar Ho y concluir con el 5%


de significacin que el equipo B utiliza menos tiempo en el proceso de
fabricacin.
El valor P para la cola derecha es:
P = P[Z > Zcalc] = P[Z > 2.07] = 1 (2.07) = 1 0.98077 = 0.01923 Rpta.
Como P = 0.01923 < = 0.05, entonces se rechaza la Ho y se acepta H1: A > B.
Se concluye tambin con el 5% de significacin que el equipo B utiliza menos
tiempo promedio en el proceso de fabricacin.
Clculos utilizando Minitab
Del men escoger Estadsticas Estadsticas bsicas 2t t de 2 muestras y
aparece la Ventana t de 2 muestras (prueba e intervalo de confianza) siguiente:

Recordar que cuando las muestras son grandes t se aproxima a la normal estndar.
Habilitar la opcin Datos resumidos y escribir el Tamao de muestra:, la
Media: y la Desviacin estndar: correspondiente a la Primera: y Segunda:
muestra respectivamente.
279

Nota: Si los datos muestrales aparecen en columnas, se escoge Muestras en


diferentes columnas: y se ingresa la Primera: y Segunda: columna en el
recuadro correspondiente. Lo que sigue es igual para ambos casos.
Escoger Opciones Nivel de confianza: 95.0. En Diferencia de la prueba:
dejar el 0. Escoger en Hiptesis alterna: mayor que. Luego escoger Aceptar y
Aceptar.
En la hoja de Sesin aparecen los resultados siguientes:
Prueba T de dos muestras e IC

Muestra
1
2

N
60
60

Media
1230
1190.0

Desv.Est.
120
90.0

Media del
Error
estndar
15
12

Diferencia = mu (1) - mu (2)


Estimado de la diferencia: 40.0
Lmite inferior 95% de la diferencia: 7.9
Prueba T de diferencia = 0 (vs. >):
Valor T = 2.07 Valor P = 0.021 GL = 109

Aparecen los resultados antes obtenidos: Zcalc = 2.07 = T y el valor-P = 0.021


(muy prximo al 0.01923 encontrado con Z).
b) Probar que la media de B es menor que la media de A en menos de 7 segundos, es
equivalente a plantear: B < A - 7 o B - A < 7 o A - B > 7.
Se debe probar H0: A - B = 7 contra H1: A - B > 7.
Si H0 es verdadera, la estadstica de la prueba es: Z

(X A X B ) 7

A2
nA

B2

N (0,1)

nB

La regin crtica de la prueba unilateral de la cola derecha al nivel = 0.05 es 260


misma del caso a):

Z calc

R.C. = {Z > 1.645 }

( x1 x 2 ) 7 (1,230 1,190) 7

1.7
ES
19.365

Ya que Zcalc = 1.7 R.C., debemos rechazar Ho y concluir que el tiempo


promedio que utiliza la mquina B en el proceso es menor que el tiempo promedio
de A en menos de 7 segundos.
280

El valor P para la cola derecha es:


P = P[Z > Zcalc] = P[Z > 1.7] = 1 (1.7) = 1 0.95543 = 0.04457 Rpta.
Como P = 0.04457 < = 0.05, entonces se rechaza la Ho y se acepta H1: A - B >
7. Se concluye tambin, con el 5% de significacin, que el tiempo promedio que
utiliza la mquina B en el proceso es menor que el tiempo promedio de A en
menos de 7.
Clculos utilizando Minitab
Los pasos son idnticos hasta antes de escoger Opciones Nivel de
confianza: 95.0. En Diferencia de la prueba: escribir 7. Escoger en Hiptesis
alterna: mayor que. Luego escoger Aceptar y Aceptar.
En la hoja de Sesin aparecen los resultados siguientes:
Prueba T de dos muestras e IC

Muestra
1
2

N
60
60

Media
1230
1190.0

Desv.Est.
120
90.0

Media del
Error
estndar
15
12

Diferencia = mu (1) - mu (2)


Estimado de la diferencia: 40.0
Lmite inferior 95% de la diferencia: 7.9
Prueba T de diferencia = 7 (vs. >):
Valor T = 1.70 Valor P = 0.046 GL = 109

Aparecen los resultados antes obtenidos: Zcalc = 1.70 = T y el valor-P = 0.046


(muy prximo al 0.04457 encontrado con Z).
6.6 PRUEBA DE HIPTESIS ACERCA DE DOS MEDIAS (con varianzas
desconocidas)
Si las dos muestras aleatorias independientes de tamaos n1 y n2 se seleccionan
respectivamente de dos poblaciones cuyas distribuciones no son normales con
varianzas 12 y 22 supuestas desconocidas, entonces, siempre que los tamaos de
las muestras sean grandes; n1 30 y n2 30 los parmetros 12 y 22 se estiman
respectivamente por S12 y S22 .

281

Para probar la hiptesis nula H0 : 1 2 0 contra una alternativa bilateral o


unilateral, se utiliza la estadstica: Z

X 2 ( 1 2 )
S12 / n1 S22 / n2

N (0,1)

Las regiones crticas y las reglas de decisin para las pruebas de la hiptesis nula

H0 : 1 2 0 (o H0 : 1 2 d0 ) contra una alternativa unilateral o bilateral


son las mismas del mtodo con varianzas conocidas.
Sean X 1 y X 2 las medias y S12 y S22 las varianzas de dos muestras aleatorias
independientes pequeas (n1 < 30 y n2 < 30 respectivamente) seleccionadas de dos
poblaciones normales con medias 1 y 2 y varianzas 12 y 22 desconocidas.
Estas varianzas desconocidas presentan dos casos, ya que pueden ser iguales
(homogneas) o diferentes (heterogneas) cuya prueba se realiza mediante el test
de hiptesis para la razn de varianzas del acpite 6.4. Veamos ambos casos.
A. Varianzas desconocidas pero iguales ( 12 22 )
Si las poblaciones son normales, independientes, y con varianzas desconocidas
pero iguales 12 22 = 2 , entonces, la estadstica de prueba es:

X 2 ( 1 2 )
Sc2 Sc2

n1 n2

tn1 n2 2

donde el estimador de la varianza comn 2 es: Sc2

n1 1 S12 (n2 1)S22


n1 n2 2

Si la hiptesis nula H0 : 1 2 es verdadera, entonces, la estadstica.

Su valor: t
calc

X1 X 2
S c2 S c2

n1 n2

t n1 n2 2

x1 x 2

n1 1 S12 (n2 1)S22 1

n1

n1 n2 2

n2

que resulta de dos muestras aleatorias, se usa para probar H0 con una alternativa
unilateral o bilateral.
282

La estructura de la prueba es similar a la usada con la distribucin de t.


1. Prueba bilateral o de dos colas
Si se prueba H0 : 1 2 contra H1 : 1 2 la regin crtica es el intervalo;

R.C. = T t1 / 2, n1 n2 2 o T t1 / 2, n1 n2 2

2. Prueba unilateral de cola a la derecha


Si se prueba H0 : 1 2 contra H1 : 1 2 la regin crtica es el intervalo
R.C. = {T t1 .n1 n2 2 }
3. Prueba unilateral de cola a la izquierda
Si se prueba H0 : 1 2 contra H1 : 1 2 la regin crtica es el intervalo.
R.C. = {T t1 , n1 n2 2 }
Ejemplo 8
Se compararon dos marcas de llantas de automvil, 1 y 2, respecto a su duracin
en Km; dos muestras aleatorias de 16 llantas de cada marca, dieron estos
resultados:
n1 = 16,

x1 = 49,658, S1 = 2,150

n2 = 16,

x 2 = 48,125,

S2 =

1,875.
Con el 1% de significacin, probar si son diferentes las duraciones medias de las
llantas de ambas marcas. Hallar el valor-P.
Solucin
Datos: n1 = 16,

x1 = 49,658, S1 = 2,150 y n2 = 16,

x 2 = 48,125, S2 =

1875.
Primero se debe probar si las varianzas de las duraciones de las llantas de ambas
marcas son iguales o no.
Hiptesis: H 0 : 12 22 ,

H 1 : 12 22 ,

= 0.01

Estadstica de prueba: siendo las poblaciones normales y suponiendo verdadera


la hiptesis nula Ho, para n1 = 16 y n2 = 16, la estadstica de prueba es:

S12
F 2 f15,15
S2

283

Regin crtica, para = 0.01 y la prueba bilateral, en la Tabla 4 de la


distribucin F, se obtiene los valores crticos: f15, 15, 0.995 = 4.07; f15, 15, 0.005 = 1 /
4.07 = 0.246.
Entonces:

R.C. = {F < 0.246 o F > 4.07}

Clculos: con los datos de la muestra se obtiene: Fcalc

S12 2150 2

= 1.31
S 22 1875 2

Decisin: como Fcalc = 1.31 R.A. se acepta Ho y concluimos que las


varianzas de las duraciones de las llantas de ambas marcas son iguales, con el
1% de significacin.
Clculos utilizando Minitab
Del men escoger Estadsticas Estadsticas bsicas 21 22 2 varianzas
y aparece la Ventana 2 varianzas.
Habilitar la opcin Datos resumidos y escribir el Tamao de muestra: 16 y 16,
as como la Varianza: (de la muestra) 4622500 y 3515625 correspondiente a la
Primera: y Segunda: muestra respectivamente.
Escoger Opciones Nivel de confianza: 95.0. Luego escoger Aceptar y
Aceptar. En la hoja de Sesin aparecen los resultados siguientes:
Prueba de varianzas iguales
Intervalos de confianza
desviaciones estndares
Muestra
1
2

N
16
16

Inferior
1524.27
1329.31

de

Desv.Est.
2150
1875

Bonferroni

de

95%

para

Superior
3564.60
3108.66

Prueba F (distribucin normal)


Estadstica de prueba = 1.31, valor p = 0.603

Aparece el Fcalc = 1.31 antes obtenido y el valor-P = 0.603 > = 0.01 y se


concluye tambin que las varianzas de las duraciones de las llantas de ambas
marcas son iguales, con el 1% de significacin.
A continuacin se prueba si son diferentes las duraciones medias de las llantas
de ambas marcas.
Hiptesis: H0 : 1 2 contra H1 : 1 2
284

= 0.01

La estadstica de prueba es: T

X1 X 2
S c2 S c2

n1 n2

t16162 t 30

Regin crtica, para = 0.01 y la prueba bilateral, en la Tabla 3: t30, 0.995 = 2.75.
R.C. = {T < -2.75 o T > 2.75}
Con la informacin muestral: n1 = 16, x1 = 49,658, S1 = 2,150

x 2 = 48,125,

16,

n2 =

S2 = 1875; y bajo el supuesto que Ho es cierta se

determina:

Sc2

n1 1 S12 (n2 1)S22 15x21502 15x18752

tcalc

n1 n2 2

x1 x 2
Sc2 Sc2

n1 n2

16 16 2

49658 48125
4069062.5 4069062.5

16
16

= 4069062.5

2.15

Decisin: como tcalc = 2.15 R.A. se acepta Ho y se concluye que las


duraciones medias de las llantas de ambas marcas no son diferentes.
Para dos colas: P = 2P[T30 > 2.15] = 2[1 P(T30 2.15)] = 2[1 x] .. (1)
En la Tabla 3, T de student, no est el valor 2.15, se determina x interpolando
as:
T

2.042 0.975
2.15

2.457 0.990

2.457 2.042 2.15 2.042 27.67 = 0.108

0.990 0.975
x 0.975
x 0.975

27.67x 26.975 = 0.108

x = 0.9789

Reemplazando x = 0.9789 en (1) se obtiene:


P-valor = 2 [1 0.9789] = 0.0422

Rpta.

Como el valor-P = 0.0422 > = 0.01 se acepta Ho y se concluye tambin que


las duraciones medias de las llantas de ambas marcas son iguales, con el 1% de
significacin.
Clculos utilizando Minitab
Del men escoger Estadsticas Estadsticas bsicas 2t t de 2 muestras y
aparece la Ventana t de 2 muestras (prueba e intervalo de confianza)
siguiente:
285

Habilitar la opcin Datos resumidos y escribir el Tamao de muestra:, la


Media: y la Desviacin estndar: correspondiente a la Primera: y Segunda:
muestra respectivamente. Seleccionar Asumir varianzas iguales.
Escoger Opciones Nivel de confianza: 95.0. En Diferencia de la prueba:
dejar el 0. Escoger en Hiptesis alterna: no es igual a. Luego escoger Aceptar
y Aceptar. En la hoja de Sesin aparecen los resultados siguientes:
Prueba T de dos muestras e IC
Muestra
1
2

N
16
16

Media
49658
48125

Desv.Est.
2150
1875

Media del
Error
estndar
538
469

Diferencia = mu (1) - mu (2)


Estimado de la diferencia: 1533
IC de 95% para la diferencia: (76, 2990)
Prueba T de diferencia = 0 (vs. no =): Valor T = 2.15
Valor P = 0.040 GL = 30
Ambos utilizan Desv.Est. agrupada = 2017.1917

Aparecen los resultados antes obtenidos tcalc = 2.15 y el valor-P = 0.040 > =
0.01 y se concluye tambin que las duraciones medias de las llantas de ambas
marcas son iguales, con el 1% de significacin.
286

B. Varianzas desconocidas supuestas distintas 12 22


Si las varianzas de las dos poblaciones normales independientes son desconocidas
supuestas diferentes, entonces, la estadstica de prueba usada es:

X 2 (1 2 )
S12 S22

n1 n2

tH

S12 S22

n
n2
Donde: H 12
representa los grados de libertad.
2
S12 S22

n1 n2
n1 1 n2 1
Dado que H rara vez es un entero, se toma la parte entera (entero mayor de H).
La prueba de hiptesis es similar a las trabajadas anteriormente con la
distribucin t.
Ejemplo 9
Dos mquinas embolsan diariamente detergente de manera independiente.
Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada mquina se han
obtenido los siguientes resultados sobre el peso de las bolsas (en gramos):
n1 = 12, x1 = 505, S1 = 10

n2 = 12, x 2 = 495, S2 = 4.

Asumiendo distribucin normal para el peso de las bolsas, con el 1% de


significacin son diferentes los pesos medios de las bolsas con detergente de
ambas mquinas? Hallar el valor-P.
Solucin
Datos: n1 = 12, x1 = 505, S1 = 10

n2 = 12, x 2 = 495, S2 = 4.

Primero se debe probar si las varianzas de los pesos de las bolsas con detergente
de ambas mquinas son iguales o no.
Hiptesis: H 0 : 12 22 ,

H 1 : 12 22 ,

= 0.01

Estadstica de prueba: siendo las poblaciones normales y suponiendo verdadera


la hiptesis nula Ho, para n1 = 12 y n2 = 12, la estadstica de prueba es:

S12
F 2 f11,11
S2
287

Regin crtica, para = 0.01 y la prueba bilateral, en la Tabla 4 de la


distribucin F se obtiene los valores crticos: f11, 11, 0.995 = 5.32; f11, 11, 0.005 = 1 /
5.32 = 0.188.
R.C. = {F < 0.188 o F > 5.32}
Clculos: con los datos de la muestra se obtiene: Fcalc

S12 100

= 6.25
S 22 16

Decisin: Como Fcalc = 6.25 R.C. se rechaza Ho y concluimos que las


varianzas de los pesos de las bolsas con detergente de ambas mquinas son
diferentes ( 12 22 ), con el 1% de significacin.
Clculos utilizando Minitab
Del men escoger Estadsticas Estadsticas bsicas 21 22 2 varianzas
y aparece la Ventana 2 varianzas.
Habilitar la opcin Datos resumidos y escribir el Tamao de muestra: 12 y 12,
as como la Varianza: (de la muestra) 100 y 16 correspondiente a la Primera: y
Segunda: muestra respectivamente.
Escoger Opciones Nivel de confianza: 99.0. Luego escoger Aceptar y
Aceptar. En la hoja de Sesin aparecen los resultados siguientes:
Prueba de varianzas iguales
Intervalos de confianza de Bonferroni de 99% para
desviaciones estndares
Muestra
1
2

N
12
12

Inferior
6.18776
2.47510

Desv.Est.
10
4

Superior
22.1991
8.8796

Prueba F (distribucin normal)


Estadstica de prueba = 6.25, valor p = 0.005

Aparece el Fcalc = 6.25 antes obtenido y el valor-P = 0.005 < = 0.01 y se


concluye tambin que las varianzas de los pesos de las bolsas con detergente de
ambas mquinas son diferentes ( 12 22 ), con el 1% de significacin.
A continuacin se prueba si son diferentes los pesos medios de las bolsas con
detergente de ambas mquinas.
Hiptesis: H0 : 1 2 contra H1 : 1 2
288

= 0.01

La estadstica de prueba es: T

X1 X 2
S12 S 22

n1 n2

t H t14

2
S12 S 22
100 16

12 12
n1 n2
Donde: H =
=
= 14.43 14
2
2
2 2
2 2
100
16


S1
S2




12
12

n
n
1 2

12 1 12 1
n1 1
n2 1

Regin crtica, para = 0.01 y la prueba bilateral, en la Tabla 3: t14, 0.995 = 2.977
R.C. = {T < -2.977 o T > 2.977}
Datos del problema:
n1 = 12, x1 = 505, S12 = 100 y

Tcalc

X1 X 2
2
1

2
2

S
S

n1 n2

n2 = 12, x 2 = 495, S 22 = 16.

505 495
= 3.22
100 16

12 12

Decisin: como tcalc = 3.22 R.C. se rechaza Ho y se acepta H1 : 1 2 . Se


concluye que los pesos medios de las bolsas con detergente de ambas mquinas
s son diferentes, al 1% de significacin.
Para dos colas: P = 2P[T14 > 3.22] = 2[1 P(T30 3.22)] = 2[1 0.9969] =
0.0062
Como el valor-P (hallado interpolando en T) = 0.0062 < = 0.01 se rechaza Ho
y se concluye tambin que los pesos medios de las bolsas con detergente de
ambas mquinas son diferentes, al 1% de significacin.
Clculos utilizando Minitab
Del men escoger Estadsticas Estadsticas bsicas 2t t de 2 muestras y
aparece la Ventana t de 2 muestras (prueba e intervalo de confianza).
Habilitar la opcin Datos resumidos y escribir el Tamao de muestra:, la
Media: y la Desviacin estndar: correspondiente a la Primera: y Segunda:
muestra respectivamente. No seleccionar Asumir varianzas iguales.
Escoger Opciones Nivel de confianza: 99.0. En Diferencia de la prueba:
dejar el 0. Escoger en Hiptesis alterna: no es igual a. Luego escoger Aceptar
y Aceptar. En la hoja de Sesin aparecen los resultados siguientes:
289

Prueba T de dos muestras e IC


Muestra
1
2

N
12
12

Media
505.0
495.00

Desv.Est.
10.0
4.00

Media del
Error
estndar
2.9
1.2

Diferencia = mu (1) - mu (2)


Estimado de la diferencia: 10.00
IC de 99% para la diferencia: (0.74, 19.26)
Prueba T de diferencia = 0 (vs. no =): Valor T = 3.22
Valor P = 0.006 GL = 14

Aparecen los resultados antes obtenidos tcalc = 3.22, los grados de libertad igual a
14 y el valor-P = 0.006 < = 0.01 y se concluye tambin que los pesos medios
de las bolsas con detergente de ambas mquinas son diferentes, al 1% de
significacin.
6.7 PRUEBA DE HIPTESIS PARA LA PROPORCIN
Suponga que se dispone de una muestra aleatoria de n observaciones, obtenida
de una poblacin con una proporcin p de xitos (elementos que poseen un
atributo particular). Si el nmero de observaciones de la muestra es grande y la
proporcin muestral observada es p , para realizar contrastes acerca de p se
sigue los siguientes pasos:
1. Hiptesis:

H0: p = p0
H1: p p0

H1: p > p0,

H1: p < p0,

2. Escoger el nivel de significacin:


3. Estadstica de prueba: Z

p p
N(0, 1)
pq
n

4. La Regin crtica de la prueba es:

R.C. = {Z < Z/2 = - Z1- /2 o Z > Z1- /2 } para H1: p p0

R.C. = {Z > Z1-}

R.C. = {Z < Z = -Z1-} para H1: p < p0

para H1: p > p0

5. Con la informacin muestral y suponiendo que H0: p = p0 es cierta, hallar:

Z calc

290

p p0
p0 q0
n

Donde

X # de xitos en la muestra

= proporcin de elementos que


n
n

poseen un atributo particular en la muestra.


6. Decisin: se rechaza H0 con riesgo igual a , Z calc R.C. (o si Z calc R.A. ). No
se rechaza H0 en caso contrario.
Mtodo del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisin, es calculando el valor P (probabilidad
mnima para rechazar Ho), a partir del valor Zcalc, de manera que:
Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
Para cola a la derecha: P = P[Z > Zcalc]
Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
Ejemplo 10
Una muestra aleatoria de 800 clientes de supermercados, 378 fueron capaces de decir
el precio correcto de un artculo inmediatamente despus de ponerlo en el carro.
Contrastar, al nivel de significacin del 10%, la hiptesis nula de que al menos la
mitad de los compradores son capaces de decir el precio correcto, frente a la
alternativa de que la proporcin poblacional es menor de la mitad. Asimismo, hallar
el p-valor.
Solucin
Denotemos por p la proporcin poblacional de compradores capaces de decir el
precio correcto en estas circunstancias. Queremos contrastar las hiptesis:
H0: p p0 = 0.50

= 0.10 Z = -Z1- = -Z0.90 = -1.28

H1: p < 0.50

La regin crtica es R.C. = {Z < -1.28}


Datos: p0 = 0.50,

n = 800,

X = 378

p 378 / 800 0.4725

El estadstico del contraste es, entonces,

Z calc

p p0 0.4725 0.50

= -1.56
p0 q0
0.5 x0.5
800
n
291

Decisin: como Zcalc = 1.64 R.C. se rechaza la hiptesis nula con el 10% de
significacin. Se concluye que menos de la mitad de los compradores son capaces de
decir el precio correcto.
P = P[Z < Zcalc] = P[Z < -1.56] = (-1.56) = 0.05938

Rpta.

Como el valor-P = 0.06 < = 0.10 se rechaza la hiptesis nula y se concluye


tambin que menos de la mitad de los compradores son capaces de decir el precio
correcto, con el 10% de significacin.
Clculos utilizando Minitab
Del men escoger Estadsticas Estadsticas bsicas 1P 1proporcin y
aparece la Ventana 1 proporcin (prueba e intervalo de confianza).
Habilitar la opcin Datos resumidos y escribir el Nmero de eventos: 378 (nmero
de xitos) y el Nmero de ensayos: 800 (tamao de la muestra).
Nota: Si los datos muestrales aparecen en una columna (1 para cada xito y 0 para
cada fracaso), se escoge Muestras en columnas: y se ingresa dicha columna. Lo que
sigue es igual para ambos casos.
Marcar Realizar prueba de hiptesis y escribir en Proporcin hipottica: 0.50.
Escoger Opciones Nivel de confianza: 90. Escoger en Hiptesis alterna: menor que.
Seleccionar Utilice la prueba y el intervalo basado en la distribucin normal. Luego escoger
Aceptar y Aceptar. En la hoja de Sesin aparecen los resultados siguientes:
Prueba e IC para una proporcin
Prueba de p = 0.5 vs. p < 0.5
Muestra
1

X
378

N
800

Muestra p
0.472500

Lmite
superior 90%
0.495121

Valor Z
-1.56

Valor P
0.060

Uso de la aproximacin normal.

Aparecen los resultados antes obtenidos Zcalc = -1.56 y el valor-P = 0.06 < = 0.10 entonces se
rechaza la hiptesis nula y se concluye tambin que menos de la mitad de los compradores son
capaces de decir el precio correcto, con el 10% de significacin.

292

6.8 PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE DOS


PROPORCIONES
Contrastar las hiptesis: Ho: p1 = p2 = p

p1 - p2 = 0

Contra:

H1: p1 < p2

H1: p1 > p2

H1: p1 p2

H1: p1 - p2 0

H1: p1 - p2 > 0

H1: p1 - p2 < 0

Donde: p1 y p2 son parmetros, siendo estos parmetros las proporciones de


xito de dos poblaciones binomiales.
La estadstica de prueba en la cual se basa los criterios de decisin es la
variable aleatoria: p 1 p 2 ; que tiene distribucin normal, esto se cumple para
muestras grandes la cual se aproxima a la distribucin normal estndar.

p 1 p 2 ( p1 p2 )
N(0, 1)
p1q1 p2 q2

n1
n2

Si se selecciona muestras aleatorias independientes de tamao n1 y n2 de una


poblacin binomial, se calcula la proporcin de xitos p 1 y p 2 de cada
muestra: p 1

X1
n1

p 2

X2
. Donde:
n2

X1: Es el nmero de xitos en la muestra de tamao n1


X2: Es el nmero de xitos en la muestra de tamao n2
El valor de la normal estndar Z, cuando Ho es verdadera y n1, n2 son grandes
es:

p 1 p 2

p1q1 p2 q2

n1
n2

p 1 p 2
1 1
pq
n1 n2

Para calcular Z, se estima el valor de p que aparece dentro del radical as:

X1 X 2
n1 n2

q = 1- p

Entonces el valor de la estadstica Z, es: Z calc

p 1 p 2
1 1
p q
n1 n2

Luego usando los puntos crticos de la curva normal estndar se puede hallar
la regin crtica para cada hiptesis alternativa.
293

PASOS PARA PROBAR LA HIPOTESIS DE DOS PROPORCIONES,


CUANDO LAS MUESTRAS SON GRANDES:
1. Ho: p1 = p2
H1:

p1 - p2 = 0

puede ser una de las alternativas.

H1: p1 < p2

H1: p1 > p2

H1: p1 p2

H1: p1 - p2 < 0

H1: p1 - p2 > 0

H1: p1 - p2 0

2. Escoger un nivel de significacin .


3. La estadstica de prueba es la variable aleatoria P1 P2 , que tiene una
distribucin aproximadamente normal cuando n1 y n2 son grandes. Es decir:

p 1 p 2
N(0, 1)
p1q1 p2 q2

n1
n2

Suponiendo que Ho es verdadera.


4. Regin Critica:

R.C. = {Z < Z/2 = - Z1- /2 o Z > Z1- /2 } para H1: p1 p2

R.C. = {Z > Z1-}

para H1: p1 > p2

R.C. = {Z < Z = -Z1-}

para H1: p1 < p2

5. Para los clculos se halla:

p 1

X1
,
n1

p 2

Luego: Z calc

X2
n2

X1 X 2
n1 n2

p 1 p 2
1 1
p q
n1 n2

6. Decisin: Rechazar: Ho; si Z pertenece a la regin crtica; en caso contrario


aceptar Ho.
Mtodo del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisin, es calculando el valor P (probabilidad
mnima para rechazar Ho), a partir del valor Zcalc, de manera que:
Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
Para cola a la derecha: P = P[Z > Zcalc]
Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
294

Ejemplo 11
De una muestra aleatoria de 203 anuncios publicitados en revistas britnicas,
52 eran humorsticos. De una muestra aleatoria independiente de 270 anuncios
publicados en revistas americanas, 56 eran humorsticos. Contrastar, frente a
una alternativa bilateral, la hiptesis nula de que las proporciones de anuncios
cmicos de las revistas britnicas y americanas son iguales, con el 5% de
significacin. Hallar p-valor.
Solucin
Sea las proporciones poblacionales de anuncios humorsticos en revistas
britnicas y americanas: p1 y p2, entonces se desea probar las hiptesis:
Ho: p1 = p2

H1: p1 p2

con = 0.05 Z1 /2 = Z0.975 = 1.96

La regin crtica es R.C. = {Z < -1.96 o Z > 1.96}

p 1

Datos: n1 = 203, X1 = 52,

p 2

X2
56
= 0.207,

n2 270

X 1 52
= 0.256,

n1 203

n2 = 270, X2 = 56,

X1 X 2
52 56
108
= 0.228 y q =

n1 n2
2 0 3 2 7 0 4 7 3

0.772
El estadstico del contraste es:

Z calc

p 1 p 2
1 1
p q
n1 n2

0.256 0.207
1
1
0.228 x0.772

203 270

= 1.25

Decisin: como Zcalc = 1.25 R.A. no se rechaza la hiptesis nula con el 5% de


significacin. Se concluye que las proporciones de anuncios cmicos de las
revistas britnicas y americanas son iguales.
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = = 2 P[Z < -1.25] =
= 2 (-1.25) = 2 (0.10565) = 0.2113
La hiptesis nula

Rpta.

de que las proporciones poblacionales de anuncios

humorsticos son la misma puede rechazarse para niveles de significacin


mayores que 20.8%.
Como el valor-P = 0.2113 > = 0.05 no se rechaza la hiptesis nula y se
concluye tambin que las proporciones de anuncios cmicos de las revistas
britnicas y americanas son iguales, con el 5% de significacin.
295

Clculos utilizando Minitab


Del men escoger Estadsticas Estadsticas bsicas 2P 2proporciones y
aparece la Ventana 2 proporciones (prueba e intervalo de confianza).
Habilitar la opcin Datos resumidos y escribir para la Primera: y Segunda:
muestra en Eventos: 52 y 108 (nmero de xitos) y en Ensayos: 203 y 403 (tamao
de la muestra).
Nota: Si los datos muestrales aparecen en diferentes columnas (1 para cada xito y 0
para cada fracaso), se escoge Muestras en diferentes columnas: y se ingresa dichas
columnas en Primera: y Segunda:. Lo que sigue es igual para ambos casos.
Escoger Opciones Nivel de confianza: 95. Dejar Diferencia de la prueba: 0.0. Escoger en
Hiptesis alterna: no es igual a. Seleccionar Utilice el clculo agrupado de p para la prueba.
Luego escoger Aceptar y Aceptar. En la hoja de Sesin aparecen los resultados siguientes:
Prueba e IC para dos proporciones
Muestra
1
2

X
52
56

N
203
270

Diferencia = p
Estimado de la
IC de 95% para
Prueba para la
0.211

Muestra p
0.256158
0.207407

(1) - p (2)
diferencia: 0.0487502
la diferencia: (-0.0283508, 0.125851)
diferencia = 0 vs. no = 0: Z = 1.25 Valor P =

Prueba exacta de Fisher: Valor P = 0.225

Aparecen los resultados antes obtenidos Zcalc = 1.25 y el valor-P = 0.211 > = 0.05 entonces no se
rechaza la hiptesis nula y se concluye tambin que las proporciones de anuncios cmicos de las
revistas britnicas y americanas son iguales, con el 5% de significacin.

296

PRUEBAS DE HIPTESIS PARA UN SOLO PARMETRO

H1:
> 0
< 0
0
> 0
< 0
0

H1:
> 02
2

2 < 02
2 02

H1:
> 0
< 0
0

P.H. PARA LA MEDIA POBLACIONAL H0 : = 0


Caso
Estadstico de prueba
Rechazar H0 si:
Cuando la muestra es aleatoria de X ~
Zc > Z1
X 0
2
2
Z

c
N (, ) con conocida o n 30.
Zc < Z
/ n
|Zc| > Z1 /2
Cuando la muestra es aleatoria de X ~
Tc > t1
X 0
Tc
tn 1
N (, 2) con 2 desconocida, n < 30.
Tc < t
S/ n
|Tc| > t1 /2
P.H. PARA LA VARIANZA POBLACIONAL H0 : 2 = 02
Caso
Estadstico de prueba
Rechazar H0 si:
2
La muestra es aleatoria de una poblacin
2c > 21
(n 1)S
2
2
C
n 1
normal o aproximadamente normal.
2c < 2
2
0
2c < 2 /2 o
2c > 21 /2

P.H. PARA LA PROPORCIN POBLACIONAL H0 : p = p0


Caso
Estadstico de prueba
La muestra es aleatoria y su tamao es
p p0
Zc
grande (n 30)
p0q0
n

Rechazar H0 si:
Zc > Z1
Zc < Z
|Zc| > Z1 /2

PRUEBAS DE HIPTESIS PARA DOS PARMETROS

H1:
12 > 22

12 < 22
12 22

P.H. PARA LA IGUALDAD DE VARIANZAS POBLACIONALES H0 : 12 = 22


Caso
Estadstico de prueba
Rechazar H0 si:
2
Dos muestras aleatorias independientes de
Fc > f1
S1
F

f
c
n

1
,
n

1
poblaciones normales.
Fc < f
1
2
S22
Fc <f /2 o
Fc > f1 /2

P.H. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES H0 : 1 - 2 = 0


H1:
Caso
Estadstico de prueba
Rechazar H0 si:
1 - 2 > 0 1. Se toman dos muestras aleatorias
Zc > Z1
X 1 X 2 0
Z

c
1 - 2 < 0
independientes, de poblaciones
Zc < Z
12 22
2
2

1 - 2 0
|Zc| > Z1 /2
normales con 1
y 2
n1 n2
conocidas o n1 y n 2 30.
1 - 2 > 0 2. Se toman dos muestras aleatorias
Tc > t1
X 1 X 2 0
T

t
c
n

2
1
2
1 - 2 < 0
independientes de poblaciones
Tc < t
1
2 1
2
2

1 - 2 0
|Tc| > t1 /2
Sp
normales, con 1
y 2
n
n
2
1
desconocidas pero
iguales
(varianzas homogneas).
297

1 - 2 > 0 3.
Dos
muestras
aleatorias
X 1 X 2 0
tH
1 - 2 < 0
independientes de poblaciones Tc
2
2
S
S
1
2
1 - 2 0
normales con 12 y 22
n1 n2
desconocidas pero diferentes
2
S12 S22
(varianzas heterogneas).

n
n2
Con: H 12
2
S12 S22

n1 n2
n1 1 n2 1

Tc > t1
Tc < t
|Tc| > t1 /2

P.H. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 - p2 = 0


H1:
Caso
Estadstico de prueba
Rechazar H0 si:
p1 - p2 > 0 Dos muestras aleatorias independienZc > Z1
p1 p 2
Z

c
p1 - p2 < 0 tes con n1 y n2 30.
Zc < Z
1 1
p1 - p2 0
|Zc| > Z1 /2
p q
n1 p 1 n2 p 2
Con p
n1 n2

n1 n2
P.H. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 - p2 = p0
H1:
Caso
Estadstico de prueba
Rechazar H0 si:
p1 - p2 > p0 Dos muestras aleatorias independienZc > Z1
p1 p 2 p0
Z

c
p1 - p2 < p0 tes con n1 y n2 30.
Zc < Z
p1q1 p 2q2

p1 - p2 p0
|Zc| > Z1 /2
n1
n2

298

6.9 PROBLEMAS RESUELTOS


1.

Las bolsas de cierta marca de gelatina indican un contenido medio de 250


gramos. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
246.5 gramos y una desviacin tpica de 12 gramos.
a) Al 5% de significacin se puede afirmar que no se est cumpliendo con el
contenido medio en las bolsas? Hallar p-valor.
b) Aceptara usted que 2 250 gr2 por bolsa? Use = 0.05. Halle p-valor.
Solucin
a) Sea X la variable aleatoria definida como el peso de las bolsas de gelatina.
1. Hiptesis: H0: = 250 gr.

H1: 250

2. Nivel de significacin: = 0.05.


3. Estadstica de prueba: para muestras grandes (n 30) es:

X
cuya distribucin es N(0,1).
Z
/ n
4. Regin crtica: para = 0.05 y la alternativa bilateral, en la Tabla 1 de la
distribucin normal estndar, se encuentra el valor crtico: Z1-/2 = Z0.975 =
1.96
Luego, la regin crtica en la variable Z est dada por:

RC Z calc 1.96 o Z calc 1.96

5. Clculos, de los datos se tiene: n = 36,

x 246.5,

S 12 , =

250.
Entonces:

Z calc

246.5 250
1.75
12
36

6. Decisin: Puesto que Zcalc = -1.75 R.A., no debemos rechazar H0 y


concluir con un 5% de significacin que se est cumpliendo con el
contenido medio en las bolsas de gelatina.
P-valor = P[|Z| > |-1.75|] = P[|Z| > 1.75] = 2 P[Z < -1.75] = 2(0.04006) =
0.0801.

299

Como el valor-P = 0.0801 > = 0.05 no se rechaza Ho y se concluye tambin


con un 5% de significacin que se est cumpliendo con el contenido medio en
las bolsas de gelatina.
b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes
pasos:
H1: 2 250

1. Hiptesis : H0: 2 = 250

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: poblacin normal, con n = 36, y suponiendo
verdadera

la

(n 1)S 2

hiptesis

H0,

la

estadstica

de

prueba

es:

(n 1)S 2
2
35
250

4. Regin crtica: Para = 0.05 y para un contraste bilateral, en la tabla 2 de


chi-cuadrado se encuentran los siguientes valores crticos:

2 / 2,n1 02.025, 35 20.6 y 12 / 2,n1 02.975.35 53.2


Luego, la regin crtica es: R.C. {X2 < 20.6 o X2 > 53.2}
5. Clculos: De los datos de la muestra resulta S2 = 122 = 144, entonces,
2
calc

(n 1)S 2 35S 2 35 (144)

20.2
250
250
250

2
6. Decisin: Como calc
= 20.2 R.C. se rechaza H0: 2 = 250 y concluimos

que la varianza de las bolsas de gelatina es diferente a 250 gr2 por bolsa,
con el 5% de significacin.
2
Como la prueba es bilateral y calc
= 20.2 < n 1 = 35 el valor-P se obtiene

as:
2
2
P = 2 P[ n21 < calc
] = 2 P[ 35
< 20.2] = 2 x . (1)

Como en la tabla 2, de chi-cuadrado, para 35 grados de libertad, no est el


valor 20.2, pero ste se encuentra entre los valores 18.5 (con probabilidad
0.01) y 20.6 (con probabilidad 0.025) se determina x interpolando de la
siguiente manera:
X2

18.5

0.01

20.2

20.6 18.5 20.2 18.5 140 = 1.7

0.025 0.01
x 0.01
x 0.01
300

20.6

0.025

140 x 1.40 = 1.70

x = 0.02214

Reemplazando x = 0.02214 en (1) se obtiene:


P = P-valor = 2{0.02214} = 0.0443

Rpta.

Como el valor-P = 0.0443 < = 0.05 se rechaza H0: 2 = 250. Por lo tanto, se
concluye tambin con un 5% de significacin que la varianza de las bolsas de
gelatina es diferente a 250 gr2 por bolsa.
2.

En un estudio para determinar si ha disminuido el tiempo de vida (en horas) del


artculo producido por una empresa, se tom una muestra aleatoria de 31
artculos, encontrndose los resultados siguientes: x = 45020 horas y S = 171
horas.
a) Aceptara usted que el verdadero tiempo promedio de vida de los artculos de
la empresa es menor de 45 090 horas. Use = 0.01 y determine p-valor.
b) Aceptara usted que 200 horas por artculo? Use = 0.05. Halle p-valor.
Solucin
a) Sea X la variable aleatoria definida como el tiempo de vida del artculo.
1. Hiptesis: H0: = 45090 horas

H1: < 45090

2. Nivel de significacin: = 0.01.


3. Estadstica de prueba: para muestras grandes (n 30) es:

X
cuya distribucin es N(0,1).
Z
/ n
4. Regin crtica: para = 0.01 y la alternativa unilateral izquierda, en la
Tabla 1 de la distribucin normal estndar, se encuentra el valor crtico:
Z = -Z1- Z0.01 = -Z0.99 = -2.33.
Luego, la regin crtica est dada por: R.C = {Zcalc < -2.33}

x 45020 ,

5. De los datos se tiene: n = 31,

S 171 , = 45090.

Entonces: Z calc

x
45020 45090

2.28 R.A.
/ n
171 / 31

6. Decisin: se acepta H0, se concluye al 1% de significacin que el tiempo


promedio de vida de los artculos de la empresa es igual a 45 090 horas.
P-valor = P = P[Z < -2.28] = 0.0113. Rpta.

301

Como P = 0.0113 > = 0.01 se acepta Ho y se concluye tambin con =


0.01 que el tiempo medio de vida de los artculos de la empresa es de 45 090
horas.
b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hiptesis: H0: = 200 2 = 40000

H1: 200

H1: 2

40000
2. Nivel de significacin: = 0.05
3. Estadstica de prueba: poblacin normal, con n = 31, y suponiendo
verdadera

H0,

(n 1)S 2

la

estadstica

de

prueba

es:

(31 1)S 2
2
30
40000

4. Regin crtica: Para = 0.05 y para un contraste bilateral, en la tabla 2 de


chi-cuadrado se encuentran los siguientes valores crticos:

2 / 2,n1 02.025, 30 16.8 y 12 / 2,n1 02.975.30 47.0


Luego, la regin crtica es: R.C. {X2 < 16.8 o X2 > 47.0}
5. Clculos: De los datos de la muestra resulta S2 = 1712 = 29 241, entonces,
2
calc

(n 1)S 2 30S 2 30 (29241)

21.9
40000
40000
40000

2
6. Decisin: Como calc
= 21.9 R.A. no se rechaza H0: = 200 y

concluimos que la desviacin estndar del tiempo de vida de los artculos


de la empresa es igual a 200 horas, con el 5% de significacin.
2
Como la prueba es bilateral y calc
= 21.9 < n 1 = 30 el valor-P se obtiene

as:
2
2
P = 2 P[ n21 < calc
] = 2 P[ 30
< 21.9] = 2 x . (1)

Como en la tabla 2, de chi-cuadrado, para 30 grados de libertad, no est el


valor 21.9, se determina x interpolando de la siguiente manera:
X2

20.6

0.10

21.9

23.4 20.6 21.9 20.6 28 = 1.3

0.20 0.10
x 0.10
x 0.10
302

23.4

0.20

28 x 2.8 = 1.3

x = 0.1464

Reemplazando x = 0.1464 en (1) se obtiene:


P = P-valor = 2{0.1464} = 0.2928

Rpta.

Como el valor-P = 0.2928 > = 0.05 se acepta H0: = 200. Por lo tanto, se
concluye tambin con un 5% de significacin que la desviacin estndar del
tiempo de vida de los artculos de la empresa es igual a 200 horas.
3.

Un proceso est programado para embolsar la cantidad media de 500 gramos de


sal. Se toma una muestra aleatoria de 41 bolsas, resultando una media de 495 gr.
y una desviacin tpica de 12 gr.
a) Al 5% de significacin se puede afirmar que no se est cumpliendo con el
contenido medio en las bolsas de sal? Halle p-valor.
b) Aceptara usted que 2 < 200 gr2 por bolsa? Use = 0.01. Halle p-valor.
Solucin
a) Sea X la variable aleatoria definida como el contenido de sal en las bolsas.
1. Hiptesis: H0: = 500 gr.

H1: 500

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: para muestras grandes (n 30) es:

X
cuya distribucin es N(0,1).
Z
/ n
4. Regin crtica: para = 0.05 y la alternativa bilateral, en la Tabla 1 de la
normal estndar, se encuentra el valor crtico: Z1-/2 = Z0.975 = 1.96
Luego, la regin crtica en la variable Z est dada por:

RC Z calc 1.96 o Z calc 1.96

x 495,

5. De los datos se tiene: n = 41,

S 12 , = 500.

Entonces: Z calc

x
495 500

2.32 R.C.
/ n 12 / 31

6. Decisin: se rechaza H0 y se acepta H1: 500, se concluye al 5% de


significacin que no se est cumpliendo con el contenido medio en las
bolsas de sal.
P-valor = P[|Z| > |-2.32|] = P[|Z| > 2.32] = 2 P[Z < -2.32] = 2(0.01017) =
0.02034.

Rpta.
303

Como P = 0.02034 < = 0.05 se rechaza Ho y se concluye tambin con =


0.05, que no se est cumpliendo con el contenido medio en las bolsas de sal.
b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hiptesis: H0: 2 = 200 gr2

H1: 2 < 200 gr2

2. Nivel de significacin: = 0.01


3. Estadstica de prueba: poblacin normal, con n = 41, y suponiendo
verdadera

(n 1)S 2

H0,

la

estadstica

de

prueba

es:

(41 1)S 2
2

40
200

4. Regin crtica: Para = 0.01 y para un contraste unilateral izquierdo, en la


tabla 2 de chi-cuadrado se encuentran el valor crtico siguiente:

2, n1 02.01, 40 22.2
Luego, la regin crtica es: R.C. {X2 < 22.2}
5. Clculos: De los datos de la muestra resulta S2 = 122 = 144, entonces,

2
calc

(n 1)S 2 40S 2 40 (144)

28.8
200
200
200

2
6. Decisin: Como calc
= 28.8 R.A. no se rechaza H0: 2 = 200 y

concluimos que la varianza del contenido en las bolsas de sal es igual a


200 gr2, con el 1% de significacin.
Como la prueba es unilateral a la izquierda el valor-P se obtiene as:
2
2
P = P[ n21 < calc
] = P[ 40
< 28.8] = x . (1)

Como en la tabla 2, de chi-cuadrado, para 30 grados de libertad, no est el


valor 28.8, se determina x interpolando de la siguiente manera:
X2

26.5

0.05

28.8

29.1 26.5 28.8 26.5 52 = 2.3

0.10 0.05
x 0.05
x 0.05

29.1

0.10

52 x 2.6 = 2.3

x = 0.0942

Reemplazando x = 0.0942 en (1) se obtiene: P = P-valor = 0.0942

304

Rpta.

Como el valor-P = 0.0942 > = 0.05 se acepta H0: 2 = 200. Por lo tanto, se
concluye tambin con el 1% de significacin, que la varianza del contenido
en las bolsas de sal es igual a 200 gr2.
4.

Una muestra de 50 animales experimentales reciben una cierta clase de racin


por un perodo de 2 semanas. Sus aumentos de pesos arrojan los valores x =
420 gr. y S = 60 gr.
a) Hay razn para creer que el aumento de peso neto medio poblacional es
mayor a 410 gr? Use = 0.01. Halle p-valor.
b) Con = 0.01 Ser rechazada la hiptesis 2 = 2500 gr2 a favor de 2 >
2500? Halle p-valor.
Solucin
a) Sea X la variable aleatoria definida como el aumento de peso en los animales.
1. Hiptesis: H0: = 410 gr.

H1: > 410

2. Nivel de significacin: = 0.01


3. Estadstica de prueba: para muestras grandes (n 30) es:

X
cuya distribucin es N(0,1).
Z
/ n
4. Regin crtica: para = 0.01 y la alternativa unilateral derecha, en la Tabla
1 de la normal estndar, se encuentra el valor crtico: Z1- = Z0.99 = 2.33
Luego, la regin crtica en la variable Z est dada por:

RC Z calc 2.33

x 420,

5. De los datos se tiene: n = 50,

S 60 , = 410.

Entonces: Z calc

x
420 410

1.18 R.A.
/ n 60 / 50

6. Decisin: no se rechaza H0: = 410 y se concluye al 1% de significacin,


que el aumento de peso neto medio de los animales es igual a 410 gr.
P = P[Z > 1.18] = 1 - P[Z 1.18] = 1 0.881 = 0.119

Rpta.

Como valor-P = 0.119 > = 0.01 no se rechaza Ho y se concluye tambin


con = 0.01, que el aumento de peso neto medio de los animales es igual a
430 gr.

305

b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes


pasos:
1. Hiptesis: H0: 2 = 2500 gr2

H1: 2 > 2500 gr2

2. Nivel de significacin: = 0.01


3. Estadstica de prueba: poblacin normal, con n = 50, y suponiendo
verdadera

(n 1)S 2

H0,

la

estadstica

de

prueba

es:

(50 1)S 2
2
49
2500

4. Regin crtica: Para = 0.01 y para el contraste unilateral derecho, en la


tabla 2 de chi-cuadrado se encuentran el valor crtico siguiente:

12 , n1 02.99, 49 74.9
Luego, la regin crtica es: R.C. {X2 > 74.9}
5. Clculos: De los datos de la muestra resulta S2 = 602 = 3600, entonces,
2
calc

(n 1)S 2 49S 2 49 (3600)

70.6
2500
2500
2500

2
6. Decisin: Como calc
= 70.6 R.A. no se rechaza H0: 2 = 2500 y se

concluye que la varianza del aumento del peso neto de los animales es
igual a 2500 gr2, con el 1% de significacin.
Como la prueba es unilateral a la derecha el valor-P se obtiene as:
2
2
2
P = P[ n21 > calc
] = P[ 49
> 70.6] = 1 - P[ 49
70.6] = 1 - x . (1)

Como en la tabla 2, de chi-cuadrado, para 49 grados de libertad, no est el


valor 70.6, se determina x interpolando de la siguiente manera:
X2
70.2

P
0.975
x

74.9 70.2 70.6 70.2

0.99 0.975
x 0.975

0.99

313.3 x 305.5 = 0.4

70.6

313.3 =

0.4
x 0.975
74.9

Reemplazando x = 0.9763 en (1) se obtiene:


P = P-valor = 1 0.9763 = 0.0237

306

Rpta.

x = 0.9763

Como el valor-P = 0.0237 > = 0.01 se acepta H0: 2 = 2500. Por lo tanto, se
concluye tambin con el 1% de significacin, que la varianza del aumento del
peso neto de los animales es igual a 2500 gr2.
5.

Una universidad grande quiere estimar el nmero medio de das de enfermedad


de los estudiantes durante un ao; una muestra de 50 estudiantes indica que

x = 3.2 das y S = 5.2 das.


a) Hay razn para creer que el verdadero nmero medio de das de enfermedad
es diferente a 6 das? Use = 0.05. Halle p-valor.
b) Con = 0.01 Ser rechazada la hiptesis 2 = 50 a favor de 2 < 50? Halle
p-valor.
Solucin
a) Sea X la variable aleatoria definida como el nmero de das de enfermedad de
los estudiantes durante un ao.
1. Hiptesis: H0: = 6 das

H1: 6

2. Nivel de significacin: = 0.05

X
3. Estadstica de prueba: para n 30 es: Z
N(0,1).
/ n
4. Regin crtica: para = 0.05 y la alternativa bilateral, en la Tabla 1 de la
normal estndar, se encuentra el valor crtico: Z1-/2 = Z0.975 = 1.96
Luego, la regin crtica en la variable Z est dada por:

RC Z calc 1.96 o Z calc 1.96

x 3.2,

5. De los datos se tiene: n = 50,

S 5.2 ,

6.

Entonces: Z calc

x
3.2 6

3.81 R.C.
/ n 5.2 / 50

6. Decisin: se rechaza H0 y se acepta H1: 6, se concluye con el 5% de


significacin, que el nmero medio de das de enfermedad de los
estudiantes es diferente a 6 das (de acuerdo a los resultados estimados es
de 3.2 das).

307

P = P[|Z| > |-3.81|] = P[|Z| > 3.81] = 2 P[Z < -3.81] = 2(0.000) = 0.000.
Rpta.
Como P = 0.000 < = 0.05 se rechaza Ho y se concluye tambin con =
0.05, que el nmero medio de das de enfermedad de los estudiantes es
diferente a 6.
b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hiptesis: H0: 2 = 50 das2

H1: 2 < 50 das2

2. Nivel de significacin: = 0.01


3. Estadstica de prueba: poblacin normal, con n = 50, y suponiendo
verdadera

(n 1)S 2

H0,

la

estadstica

de

prueba

es:

(50 1)S 2
2
49
50

4. Regin crtica: para = 0.01 y el contraste unilateral izquierdo, en la tabla


2 de chi-cuadrado se encuentran el valor crtico siguiente:

2, n1 02.01, 49 28.9
Luego, la regin crtica es: R.C. {X2 < 28.9}
5. Clculos: De los datos de la muestra resulta S2 = 5.22 = 27.04, entonces,
2
calc

(n 1)S 2 49S 2 49 (27.04)

26.5
50
50
50

2
6. Decisin: Como calc
= 26.5 R.C. se rechaza H0: 2 = 50 y concluimos

que la varianza del nmero de das de enfermedad de los estudiantes es


diferente a 50 das2, con el 1% de significacin (de acuerdo a los
resultados estimados es de 27.04 das2).
Como la prueba es unilateral a la izquierda el valor-P se obtiene interpolando:
2
2
P = P[ n21 < calc
] = P[ 49
< 26.5] = 0.0041

Como el valor-P = 0.0041 < = 0.01 se rechaza H0: 2 = 50. Por lo tanto, se
concluye tambin con el 1% de significacin, que la varianza del nmero de
das de enfermedad de los estudiantes es diferente a 50 das2.

308

6.

Las calificaciones de diez estudiantes en un examen de estadstica fueron: 43,


61, 67, 70, 74, 76, 79, 85, 94 y 81. Suponga que estas calificaciones proceden de
una poblacin normal.
a) Ponga a prueba H0: = 70 contra H1: 70, con un nivel de significacin del
5%. Halle p-valor.
b) Ponga a prueba H0: 2 = 500 contra H1: 2 500, con un nivel de
significacin de 0.05. Halle p-valor.
Solucin
a) Sea X la variable aleatoria definida como las calificaciones de los alumnos.
1. Hiptesis: H0: = 70

H1: 70

2. Nivel de significacin: = 0.05.

x
3. Estadstica de prueba: T
S/ n

t9

4. Regin crtica: para = 0.05 y la alternativa bilateral, se encuentra el valor


crtico en la Tabla 3: t1-/2, n-1 = t0.975, 9 = 2.262
Luego, la regin crtica en la variable T es: R.C = {T < -2.262 o T >
2.262}

5. Clculos, con los datos se obtiene: n = 10,

x = 73,

S = 14.08 y

70

Entonces: Tcalc

x
73 70
= 0.67

S / n 14.08 / 10

6. Decisin: puesto que Tcalc = 0.67 R.A., se acepta H0 y se concluye con un


5% de significacin que la nota promedio de los alumnos es de 70 puntos.
Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T9| > |0.67|] = 2 P[T9 > 0.67] = 2{1 - P[T9 0.67]} = 2 (1 0.75) = 0.50
Rpta.
Ya que en la tabla 3, T de student, para 9 grados de libertad, al valor 0.67 =
0.70, le corresponde una probabilidad acumulada de 0.75.
Como el valor-P = 0.50 > = 0.05, se acepta Ho: = 70 y se concluye
tambin, con un 5% de significacin, que la nota promedio de los alumnos es
de 70 puntos.
309

b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes


pasos:
1. Hiptesis: H0: 2 = 500

H1: 2 500

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: poblacin normal, con n = 10, y suponiendo
verdadera

(n 1)S 2

H0,

la

estadstica

de

prueba

es:

(10 1)S 2
92
500

4. Regin crtica: Para = 0.05 y para un contraste bilateral, en la tabla 2 de


chi-cuadrado se encuentran los siguientes valores crticos:

2 / 2,n1 02.025, 9 2.70 y 12 / 2,n1 02.975.9 19.0


Luego, la regin crtica es: R.C. {X2 < 2.70 o X2 > 19.0}
5. Clculos: De los datos de la muestra resulta S2 = 14.082 = 198.25,
entonces,
2
calc

(n 1)S 2 9S 2 9 (198.25)

3.57
500
500
500

2
6. Decisin: Como calc
= 3.57 R.A. no se rechaza H0: 2 = 500 y se

concluye que la varianza de las notas de los alumnos es igual a 500


puntos2, con el 5% de significacin.
2
Como la prueba es bilateral y calc
= 3.57 < n 1 = 9 el valor-P se obtiene

as:
2
P = 2 P[ n21 < calc
] = 2 P[ 92 < 3.57] = 2 x . (1)

Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no est el


valor 3.57, se determina x interpolando de la siguiente manera:
X2

3.33

0.05

3.57

4.17 3.33 3.57 3.33 16.8 = 0.24

0.10 0.05
x 0.05
x 0.05

4.17

0.10

16.8 x 0.84 = 0.24

Reemplazando x = 0.064 en (1) se obtiene:


P = P-valor = 2{0.064} = 0.128

Rpta.
310

x = 0.064

Como el valor-P = 0.128 > = 0.05 se acepta H0: 2 = 500. Por lo tanto, se
concluye tambin con un 5% de significacin, que la varianza de las notas de
los alumnos es igual a 500 puntos2.
7.

Los pesos de los paquetes de arroz embolsado es de 15 Kg. Una muestra


aleatoria de 8 paquetes da una media de 15.3 Kg. y una desviacin tpica de
1.211 Kg. Suponga que los pesos se distribuyen normalmente.
a) Con una significacin del 5 % pruebe si el verdadero peso medio de los
paquetes de arroz es distinto de 15 Kg. Halle p-value.
b) Ponga a prueba H0: 2 = 5 contra H1: 2 5, con un = 0.05. Halle p-valor.
Solucin
a) Sea X la variable aleatoria definida como el peso de los paquetes de arroz.
1. Hiptesis: H0: = 15

H1: 15

2. Nivel de significacin: = 0.05.

x
3. Estadstica de prueba: T
S/ n

t7

4. Regin crtica: para = 0.05 y la alternativa bilateral, se encuentra el valor


crtico en la Tabla 3: t1-/2, n-1 = t0.975, 7 = 2.365
Luego, la regin crtica en la variable T es: R.C = {T < -2.365 o T >
2.365}

5. Clculos, con los datos se obtiene: n = 8,

x = 15.3,

S = 1.211 y

15

Entonces: Tcalc

x
15.3 15
= 0.70

S / n 1.211 / 8

6. Decisin: puesto que Tcalc = 0.70 R.A., se acepta H0 y se concluye con un


5% de significacin que el peso medio de los paquetes de arroz es igual a
15 Kg.
Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T7| > |0.70|] = 2 P[T7 > 0.70] = 2{1 - P[T7 0.70]} = 2 (1 0.75) = 0.50
Rpta.
Ya que en la tabla 3, T de student, para 7 grados de libertad, al valor 0.70, le
corresponde una probabilidad acumulada cercana a 0.75.
311

Como el valor-P = 0.50 > = 0.05, se acepta Ho: = 15 y se concluye


tambin, con un 5% de significacin, que el peso medio de los paquetes de
arroz es igual a 15 Kg.
b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hiptesis: H0: 2 = 5

H1: 2 5

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: poblacin normal, con n = 8, y suponiendo
verdadera

(n 1)S 2

H0,

la

estadstica

de

prueba

es:

(8 1)S 2

72
5

4. Regin crtica: Para = 0.05 y para un contraste bilateral, en la tabla 2 de


chi-cuadrado se encuentran los siguientes valores crticos:

2 / 2,n1 02.025, 7 1.69 y 12 / 2,n1 02.975.7 16.0


Luego, la regin crtica es: R.C. {X2 < 1.69 o X2 > 16.0}
5. Clculos: De los datos de la muestra resulta S2 = 1.2112 = 1.467, entonces,

2
calc

(n 1)S 2 7S 2 7 (1.467)

2.05
5
5
5

2
6. Decisin: Como calc
= 2.05 R.A. no se rechaza H0: 2 = 5 y se

concluye que la varianza de los pesos de los paquetes de arroz es igual a 5


Kg2, con el 5% de significacin.
2
Como la prueba es bilateral y calc
= 2.05 < n 1 = 7 el valor-P se obtiene

as:
2
P = 2 P[ n21 < calc
] = 2 P[ 72 < 2.05] = 2 x . (1)

Como en la tabla 2, de chi-cuadrado, para 7 grados de libertad, no est el


valor 2.05, se determina x interpolando de la siguiente manera:
X2
1.69

P
0.025

2.05

2.17 1.69 2.05 1.69

0.05 0.025 x 0.025

0.36
x 0.025
312

19.2 =

2.17

0.05

19.2 x 0.48 = 0.36

x = 0.044

Reemplazando x = 0.044 en (1) se obtiene:


P = P-valor = 2{0.044} = 0.088

Rpta.

Como el valor-P = 0.088 > = 0.05 se acepta H0: 2 = 5. Por lo tanto, se


concluye tambin con un 5% de significacin, que la varianza de los pesos de
los paquetes de arroz es igual a 5 Kg2.
8.

Se prueba una muestra aleatoria de 5 fusibles de cierta marca para determinar el


punto medio de ruptura. Los puntos de ruptura medidos en amperes fueron: 28,
32, 30, 24 y 36.
a) Hay razn para creer que el verdadero punto medio de ruptura es mayor de
22 amperes? Use = 0.01. Halle p-valor.
b) Con = 0.01, Ser rechazada la hiptesis 2 = 30 amp2 a favor de 2 < 30?
Halle p-valor.
Solucin
a) Sea X la variable aleatoria definida como el punto de ruptura de los fusibles.
1. Hiptesis: H0: = 22 amperes

H1: > 22

2. Nivel de significacin: = 0.01.

x
3. Estadstica de prueba: T
S/ n

t7

4. Regin crtica: para = 0.01 y la alternativa unilateral derecha, se


encuentra el valor crtico en la Tabla 3: t1-, n-1 = t0.99, 4 = 3.747
Luego, la regin crtica en la variable T es: R.C = {T > 3.747}

5. Clculos, con los datos se obtiene: n = 5,

x = 30,

S = 4.472 y

22

Entonces: Tcalc

x
30 22
= 4.0

S / n 4.472 / 5

6. Decisin: puesto que Tcalc = 4.0 R.C., se rechaza H0 y se concluye con el


1% de significacin que el punto medio de ruptura es mayor de 22
amperes.
Siendo la prueba unilateral derecha, entonces p-valor = P es:
P = P[T4 > Tcalc] = P[T4 > 4.0] = {1 - P[T4 4.0]} = (1 0.9915) = 0.0085 Rpta.
313

Ya que en la tabla 3, T de student, para 4 grados de libertad, no est el valor


4.0, se interpola y obtiene una probabilidad acumulada de 0.9915.
Como el valor-P = 0.0085 < = 0.01, se rechaza Ho: = 22 y se concluye
tambin, con el 1% de significacin, que el punto medio de ruptura de los
fusibles es mayor de 22 amperes.
b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hiptesis: H0: 2 = 30 amp2

H1: 2 < 30

2. Nivel de significacin: = 0.01


3. Estadstica de prueba: poblacin normal, con n = 5, y suponiendo
verdadera

(n 1)S 2

H0,

la

estadstica

de

prueba

es:

(5 1)S 2
42
30

4. Regin crtica: Para = 0.01 y para un contraste de la cola izquierda, en la


tabla 2 de chi-cuadrado se encuentra el siguiente valor crtico:

2, n1 02.01. 4 0.297
Luego, la regin crtica es: R.C. {X2 < 0.297}
5. Clculos: De los datos de la muestra resulta S2 = 20, entonces,
2
calc

(n 1)S 2 4S 2 4 (20)

2.67
30
30
30

2
6. Decisin: Como calc
= 2.67 R.A. no se rechaza H0: 2 = 30 y se

concluye que la varianza de los puntos de ruptura de los fusibles es igual a


30 amp2, con el 1% de significacin.
2
Como la prueba es unilateral izquierda y calc
= 2.67, el valor-P se obtiene

as:
2
P = P[ n21 < calc
] = P[ 42 < 2.67] = 0.3857

Rpta.

Ya que en la tabla 2, de chi-cuadrado, para 4 grados de libertad, no est el


valor 2.67, se interpola y obtiene una probabilidad acumulada de 0.3857
Como el valor-P = 0.3857 > = 0.01 se acepta H0: 2 = 30. Por lo tanto, se
concluye tambin con el 1% de significacin, que la varianza de los puntos de
ruptura de los fusibles es igual a 30 amp2.
314

9.

Un fabricante sostiene que sus autos consumen en promedio 2.50 galones de


gasolina cada 100 Km. Un vendedor de la compaa comprueba el consumo de
gasolina de 25 autos y encuentra que el consumo medio es de 2.61 galones cada
100 Km. con una desviacin estndar de 0.25 galones.
a) puede dudarse de lo sustentado por el fabricante? Use = 0.01. Halle pvalor.
b) Ser rechazada la hiptesis 2 0.38? Use = 0.01. Halle p-valor.
Solucin
a) Sea X la variable definida como el nmero galones consumidos cada 100 Km.
1. Hiptesis: H0: = 2.5 galones

H1: 2.5

2. Nivel de significacin: = 0.01.

x
3. Estadstica de prueba: T
S/ n

t 24

4. Regin crtica: para = 0.01 y la prueba es bilateral, se encuentra el valor


crtico en la Tabla 3: t1-/2, n-1 = t0.995, 24 = 2.797
Luego, la regin crtica en la variable T es: R.C = {T < -2.797 o T >
2.797 }

5. Clculos, con los datos se obtiene: n = 25,

x = 2.61,

S = 0.25 y

2.5

Entonces: Tcalc

x
2.61 2.50
= 2.2

S / n 0.25 / 25

6. Decisin: puesto que Tcalc = 2.2 R.A., no se rechaza H0 y se concluye con


el 1% de significacin que el consumo medio de gasolina en los autos es
de 2.5 galones cada 100 Km. y no puede dudarse de lo sustentado por el
fabricante.
Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T24| > |2.2|] = 2 P[T24 > 2.2] = 2{1 - P[T24 2.2]} = 2 (1 0.98) = 0.04
Rpta.
Ya que en la tabla 3, T de student, para 24 grados de libertad, no est el valor
2.2, se interpola y obtiene una probabilidad acumulada de 0.98.

315

Como el valor-P = 0.04 > = 0.01, no se rechaza Ho: = 2.5 y se concluye


tambin, con el 1% de significacin, que el consumo medio de gasolina en los
autos es de 2.5 galones cada 100 Km.
b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hiptesis: H0: 2 = 0.38 galones2

H1: 2 0.38

2. Nivel de significacin: = 0.01


3. Estadstica de prueba: poblacin normal, con n = 5, y suponiendo
verdadera

H0,

(n 1)S 2

la

estadstica

de

prueba

es:

(25 1)S 2
2
24
0.38

4. Regin crtica: Para = 0.01 y para un contraste bilateral, en la tabla 2 de


chi-cuadrado se encuentran los siguientes valores crticos:

2 / 2,n1 02.005, 24 9.89 y 12 / 2,n1 02.995. 24 45.6


Luego, la regin crtica es: R.C. {X2 < 9.89 o X2 > 45.6}
5. Clculos: De los datos de la muestra resulta S2 = 0.252 = 0.0625, entonces,
2
calc

(n 1)S 2 24S 2 24 (0.0625)

3.95
0.38
0.38
0.38

2
6. Decisin: Como calc
= 3.95 R.C. se rechaza H0: 2 = 0.38 y se

concluye que la varianza del consumo de gasolina en los autos por cada
100 Km. es diferente a 0.38 galones2, con el 1% de significacin.
2
Como la prueba es bilateral y calc
= 3.95 < n 1 = 24 el valor-P se obtiene

as:
2
2
P = 2 P[ n21 < calc
] = 2 P[ 24
< 3.95] = 2 (0.00) = 0.000

Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor


3.95, tiene una probabilidad acumulada menor de 0.0005 0.000
Como el valor-P = 0.000 < = 0.01 se rechaza H0: 2 = 0.38. Por lo tanto, se
concluye tambin con el 1% de significacin, que la varianza del consumo de
gasolina en los autos por cada 100 Km. es diferente a 0.38 galones2.

316

10. Una muestra de 25 clientes de cierta gasolinera indica que el nmero medio de
galones comprados a la semana es de x = 14.3 y la desviacin estndar de S =
2.7 galones.
a) Con el 5 % de significacin. Hay razn para creer que el verdadero nmero
medio de galones comprados a la semana por cliente es menor de 15.6?
Determine el p-valor.
b) Con = 0.05 Aceptara usted que 2 > 4.1? Determine el p-valor.
Solucin
a) Sea X la variable definida como el nmero de galones de gasolina comprados
a la semana por un cliente.
1. Hiptesis: H0: = 15.6 galones

H1: < 15.6

2. Nivel de significacin: = 0.05.

x
3. Estadstica de prueba: T
S/ n

t 24

4. Regin crtica: para = 0.05 y la prueba de la cola izquierda, se encuentra


el valor crtico en la Tabla 3: t, n-1 = -t1-, n-1 t0.05, 24 = -t0.95, 24 = -1.711.
Luego, la regin crtica en la variable T es: R.C = {T < -1.711}

5. Clculos, con los datos se obtiene: n = 25,

x = 14.3,

S = 2.7 y

15.6

Entonces: Tcalc

x 14.3 15.6
= -2.41

S/ n
2.7 / 25

6. Decisin: puesto que Tcalc = -2.41 R.C., se rechaza H0 y se concluye con


el 5% de significacin, que el consumo medio semanal de gasolina por
cliente es menor a 15.6 galones.
Siendo la prueba unilateral izquierda, entonces p-valor = P es:
P = P[T24 < -2.41] = 1 - P[T24 2.41] = 1 0.987 = 0.013 Rpta.
Ya que en la tabla 3, T de student, para 24 grados de libertad, no est el valor
2.41, se interpola y obtiene una probabilidad acumulada de 0.987.
Como el valor-P = 0.013 < = 0.05, rechaza Ho: = 15.6 y se concluye
tambin, con el 5% de significacin, que el consumo medio semanal de
gasolina por cliente es menor a 15.6 galones.
317

b) Para verificar la hiptesis acerca de la varianza, se siguen los siguientes


pasos:
1. Hiptesis: H0: 2 = 4.1 galones2

H1: 2 > 4.1

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: poblacin normal, con n = 25, y suponiendo
verdadera

(n 1)S 2

H0,

la

estadstica

de

prueba

es:

(25 1)S 2
2
24
4.1

4. Regin crtica: Para = 0.05 y para un contraste unilateral derecho, en la


tabla 2 de chi-cuadrado se encuentran el siguiente valor crtico:

12 ,n1 02.95, 24 36.4


Luego, la regin crtica es: R.C. {X2 > 36.4}
5. Clculos: De los datos de la muestra resulta S2 = 2.72 = 7.29, entonces,
2
calc

(n 1)S 2 24S 2 24 (7.29)

42.7
4.1
4.1
4.1

2
6. Decisin: Como calc
= 42.7 R.C. se rechaza H0: 2 = 4.1 y se concluye

que la varianza de las compras de gasolina por cliente es mayor de 4.1


galones2, con el 5% de significacin.
Como la prueba es unilateral derecha el valor-P se obtiene as:
2
2
2
P = P[ n21 > calc
] = P[ 24
> 42.7] = 1 - P[ 24
42.7] = 1- 0.99 = 0.01

Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor


42.7, tiene una probabilidad acumulada cercana a 0.99.
Como el valor-P = 0.01 < = 0.05 se rechaza H0: 2 = 4.1. Por lo tanto, se
concluye tambin con el 5% de significacin, que la varianza de las compras
de gasolina por cliente es mayor de 4.1 galones2.
11. Se compararon dos marcas de llantas de automvil, 1 y 2, respecto a su duracin
en Km. Dos muestras aleatorias de 31 llantas de cada marca, dieron estos
resultados:

x1 = 46300, n1 = 31, S1 = 5000

x 2 = 48100, n2 = 31, S2 = 6100.

Son diferentes las duraciones medias de las llantas de ambas marcas? Use =
0.01. Determine p-valor.
318

Solucin
Sean X1 y X2 la duracin (en Km.) de las llantas marca 1 y 2 respectivamente y
1, 2 sus respectivas medias. Se desconoce la distribucin de probabilidades de
X1 y X2, pero las muestras son grandes (n1 = n2 = 31 > 30). Para determinar si
son diferentes las duraciones medias de las llantas de ambas marcas, se
comparan sus duraciones medias: 1 2.
1. Hiptesis: H0: 1 = 2 contra H1: 1 2
2. Nivel de significacin: = 0.01.
3. Estadstica de prueba.- si se supone verdadera la hiptesis Ho y para muestras
grandes, la estadstica apropiada es:

X1 X 2

12
n1

22

N (0, 1)

n2

4. Regin Crtica. Para = 0.01 y la alternativa bilateral, en la Tabla 1 de la


normal estndar, se encuentra el valor crtico: Z1-/2 = Z0.995 = 2.575
Luego, la regin crtica en la variable Z est dada por:
RC = {Zcalc < -2.575 o Zcalc > 2.575}
5. Clculos, de los datos se tiene:
n1 = 31,

x1 = 46300, S1 = 5000

n2 = 31,

x 2 = 48100, S2 =

6100.
E.S. = Error estndar =

Z calc

S12 S 22
5000 2 6100 2

= 1416.61
n1 n2
31
31
x1 x 2 46300 48100

1.27
ES
1416.61

6. Decisin: ya que Zcalc = -1.27 R.A., no se rechaza Ho y se concluye con el


1% de significacin, que la duracin media de las llantas marca 1 y 2 es la
misma.
El valor P para la prueba bilateral es:
P = P[|Z| > |-1.27|] = P[|Z| > 1.27] = 2P[Z < -1.27] = 2(0.10204) = 0.2041
Rpta.

319

Como P = 2041 > = 0.01 no se rechaza Ho y se concluye tambin que la


duracin media de las llantas de marcas es la misma, con el 1% de
significacin.
12. Muestras del pago por hora para los choferes de camiones en las ciudades 1 y 2
proporcionan los siguientes datos:
n1 = 35,

x1 = $ 5.30, S1 = $ 0.16

n2 = 40,

x 2 = $ 5.40, S2 = $

0.15.
Con un nivel de significacin del 1 %, probar si el pago medio por hora a los
choferes de camin de la ciudad 1 es menor que el pago medio por hora a los
choferes de camin de la ciudad 2. Hallar p-valor.
Solucin
Sean X1 y X2 el pago por hora a los choferes de camin en las ciudades 1 y 2
respectivamente y 1, 2 sus respectivas medias. Se desconoce las distribucin
de probabilidades de X1 y X2, pero las muestras son grandes (n1 y n2 > 30). Para
probar si el pago medio por hora a los choferes de camin de la ciudad 1 es
menor que el pago medio por hora a los choferes de la ciudad 2, se compara: 1
< 2.
1. Hiptesis: H0: 1 = 2 contra H1: 1 < 2
2. Nivel de significacin: = 0.01.
3. Estadstica de prueba: si se supone verdadera la hiptesis Ho y para muestras
grandes, la estadstica apropiada es:

X1 X 2

12
n1

22

N (0, 1)

n2

4. Regin Crtica. Para = 0.01 y la alternativa unilateral izquierda, en la Tabla 1


de la normal estndar, el valor crtico es: Z = -Z1- Z0.01 = -Z0.99 = -2.33.
Luego, la regin crtica est dada por: R.C = {Zcalc < -2.33}
5. Clculos, de los datos se tiene:

x1 = $ 5.30, n1 = 35, S1 = $ 0.16


0.15.

320

x 2 = $ 5.40, n2 = 40, S2 = $

E.S. = Error estndar =

S12 S 22
0.16 2 0.15 2

= 0.036
n1 n2
35
40

Z calc

x1 x 2 5.30 5.40

2.78
ES
0.036

6. Decisin: ya que Zcalc = -2.78 R.C., se rechaza Ho y se concluye con el 1%


de significacin, que el pago medio por hora a los choferes de camin de la
ciudad 1 es menor que el pago medio por hora a los choferes de la ciudad 2.
El valor P para la prueba unilateral izquierda es:
P = P[Z < -2.78] = 0.0027

Rpta.

Como P = 0.0027 < = 0.01 se rechaza Ho y se concluye tambin que el


pago medio por hora a los choferes de camin de la ciudad 1 es menor que el
pago medio por hora a los choferes de la ciudad 2, con el 1% de significacin.
13. En un estudio para determinar el gasto medio semanal en alimentos en los
hogares de las ciudades 1 y 2, se toma una muestra al azar de 200 hogares de la
ciudad 1 arrojando un gasto medio de S/. 150 y una desviacin estndar de 35.
Una muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 140 y
una desviacin estndar de 30. Probar si es diferente el gasto medio semanal en
alimentos en las ciudades 1 y 2. Use = 0.05. Hallar p-valor.
Solucin
Sean X1 y X2 el gasto semanal en alimentos en los hogares de las ciudades 1 y 2
respectivamente y 1, 2 sus respectivas medias. Se desconoce la distribucin
de probabilidades de

X1 y X2, pero las muestras son grandes (n1 y n2 > 30).

Para determinar si es diferente el gasto medio semanal en alimentos en ambas


ciudades, se comparan sus gastos medios: 1 2.
1. Hiptesis: H0: 1 = 2 vs H1: 1 2
2. Nivel de significacin: = 0.05.
3. Estadstica de prueba: si se supone verdadera la hiptesis Ho y para muestras
grandes, la estadstica apropiada es:

X1 X 2

12
n1

22
n2

321

N (0, 1)

4. Regin Crtica. Para = 0.05 y la alternativa bilateral, en la Tabla 1 de la


normal estndar, se encuentra el valor crtico: Z1-/2 = Z0.975 = 1.96
Luego, la regin crtica en la variable Z est dada por:
RC = {Zcalc < -1.96 o Zcalc > 1.96}
5. Clculos, de los datos se tiene:
n1 = 200, x1 = 150,

S1 = 35

E.S. = Error estndar =

n2 = 180, x 2 = 140,

S2 = 30.

S12 S 22
35 2 30 2

= 3.34
n1 n2
200 180

Z calc

x1 x 2 150 140
= 2.99

ES
3.34

6. Decisin: ya que Zcalc = 2.99 R.C., se rechaza Ho y se concluye con el 5%


de significacin, que el gasto medio semanal en alimentos en las ciudades 1 y
2 es diferente.
El valor P para la prueba bilateral es:
P = P[|Z| > |2.99|] = P[|Z| > 2.99] = 2(-2.99) = 2(0.00139) = 0.00278
Rpta.
Como P = 0.00278 < = 0.05 se rechaza Ho y se concluye tambin que el
gasto medio semanal en alimentos de ambas ciudades es diferente, con el 5%
de significacin.
14. Se compararon los gastos mensuales (S/.) en educacin en las ciudades 1 y 2;
muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2, dieron
estos resultados: n1 = 200,

X 1 = 160, S1 = 60

n2 = 150, X 2 = 150,

S2 = 50.
Use = 0.05, para determinar si el gasto medio mensual en educacin de la
ciudad 1 es mayor que el gasto medio mensual en educacin de la ciudad 2.
Hallar el p-valor.
Solucin
Sean X1 y X2 el gasto mensual en educacin realizado por las familias de las
ciudades 1 y 2 respectivamente y 1, 2 sus respectivas medias. Se desconoce
las distribucin de probabilidades de X1 y X2, pero las muestras son grandes (n1
y n2 > 30). Para determinar si el gasto medio mensual en educacin de la ciudad
322

1 es mayor que el gasto medio mensual en educacin de la ciudad 2, se


comparan sus gastos medios: 1 > 2.
1. Hiptesis: H0: 1 = 2 contra H1: 1 > 2
2. Nivel de significacin: = 0.05.
3. Estadstica de prueba: si se supone verdadera la hiptesis Ho y para muestras
grandes, la estadstica apropiada es:

X1 X 2

12
n1

22

N (0, 1)

n2

4. Regin Crtica. Para = 0.05 y la alternativa unilateral derecha, en la Tabla 1


de la normal estndar, se encuentra el valor crtico: Z1- = Z0.95 = 1.645.
Luego, la regin crtica en la variable Z est dada por: RC = { Zcalc > 1.645}
5. Clculos, de los datos se tiene:
n1 = 200, X 1 = 160, S1 = 60
E.S. = Error estndar =

n2 = 150, X 2 = 150, S2 = 50.

S12 S 22
60 2 50 2

= 5.89
n1 n2
200 150

Z calc

x1 x 2 200 150
= 1.70

ES
5.89

6. Decisin: ya que Zcalc = 1.70 R.C., se rechaza Ho y se concluye con el 5%


de significacin, que el gasto medio mensual en educacin de la ciudad 1 es
mayor que el gasto medio mensual en educacin de la ciudad 2.
El valor P para la prueba unilateral derecha es:
P = P[Z > 1.70] = 1 (1.70) =1 0.95543 = 0.04457

Rpta.

Como P = 0.04457 < = 0.05 se rechaza Ho y se concluye tambin que el


gasto medio mensual en educacin de la ciudad 1 es mayor que el gasto
medio mensual en educacin de la ciudad 2, con el 5% de significacin.
15. Para determinar el costo medio mensual de la enseanza en las universidades A

y B, se toma una muestra al azar de 121 alumnos de la universidad A arrojando


un costo medio de S/. 650 y una desviacin estndar de S/ 70. Una muestra al
azar de 121 alumnos de la universidad B da una costo medio de S/. 675 y una
desviacin estndar de S/. 90. Con = 0.01, probar si es diferente el costo medio
mensual de la enseanza en las universidades A y B. Hallar p-valor.
323

Solucin
Sean XA y XB el costo mensual de la enseanza en las universidades A y B
respectivamente y A, B sus respectivas medias. Se desconoce la distribucin
de probabilidades de

XA y XB, pero las muestras son grandes (nA y nB > 30).

Para determinar si es diferente el costo medio mensual de la enseanza en ambas


universidades, se comparan sus gastos medios: A B.
1. Hiptesis: H0: A = B vs H1: A B
2. Nivel de significacin: = 0.01.
3. Estadstica de prueba: si se supone verdadera la hiptesis Ho y para muestras
grandes, la estadstica apropiada es:

XA XB

A2
nA

B2

N (0, 1)

nB

4. Regin Crtica. Para = 0.01 y la alternativa bilateral, en la Tabla 1 de la


normal estndar, se encuentra el valor crtico: Z1-/2 = Z0.995 = 2.575
Luego, la regin crtica en la variable Z est dada por:
RC = {Zcalc < -2.575 o Zcalc > 2.575}
5. Clculos, de los datos se tiene:
nA = 121, x A = 650,

SA = 70

E.S. = Error estndar =

nB = 121, x B = 675,

SB = 90.

S A2 S B2
70 2 90 2

= 10.37
n A nB
121 121

Z calc

x A x B 650 675
= -2.41

ES
10.37

6. Decisin: ya que Zcalc = -2.41 R.A., no se rechaza Ho y se concluye con el


1% de significacin, que es igual el costo medio mensual de la enseanza en
las universidades A y B.
El valor P para la prueba bilateral es:
P = P[|Z| > |-2.41|] = P[|Z| > 2.41] = 2(-2.41) = 2(0.00798) = 0.01596
Rpta.

324

Como P = 0.01596 > = 0.01 se acepta Ho y se concluye tambin que el


costo medio mensual de la enseanza en ambas universidades es igual, con el
1% de significacin.
16. La produccin de 13 obreros de la jornada diurna, dio un promedio de 82 piezas
con una desviacin estndar de 10, mientras que para 11 obreros de la jornada
nocturna, dio un promedio de 74 con una desviacin estndar de 7. Con el 5% de
significacin ( = 0.05), probar si:
a) Son heterogneas las varianzas de ambos turnos? Halle p-valor.
b) Es diferente la produccin media de los dos turnos? Halle p-valor.
Solucin
Sean X1 y X2 las variables que representan el nmero de piezas producidas en
los turnos diurno (1) y nocturno (2) respectivamente. Asumiendo que las dos
poblaciones se distribuyen normalmente con varianzas desconocidas y las
muestras son pequeas (n1 y n2 < 30) primero se prueba si las varianzas son
heterogneas, para segn ello probar si las medias son diferentes.
Datos: n1 = 13, X 1 = 82, S1 = 10
a) 1. Hiptesis: H0: 12 = 22

n2 = 11, X 2 = 74, S2 = 7.

H1: 12 22

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: suponiendo las poblaciones normales y la hiptesis
nula cierta, para n1 = 13 y n2 = 11, la estadstica de prueba es:

S12
f12,10
S 22

4. Regin crtica. Para = 0.05 y la prueba bilateral en la Tabla 4, los valores


crticos F son: f12, 10, 0.025 = 1/ f10, 12, 0.975 = 1/ 3.37 = 0.297 y f12, 10, 0.975 =
3.62.
R.C. = {F < 0.297 o F > 3.62}
5. Clculos: con los datos de la muestra se obtiene:

S12 = 100, S 22 = 49 y Fcalc

S12 100

= 2.04
49
S 22
325

6. Decisin. Como Fcalc = 2.04 R.A. se acepta Ho y concluimos que las


varianzas del nmero de piezas producidas en los turnos diurno y nocturno
son iguales (homogneas), con el 5% de significacin.
El valor P para la prueba bilateral y como Fcalc = 2.04 > 1 se obtiene as:
P = 2 P[f12,10 > 2.04] = 2 {1 - P[f12,10 2.04]} > 0.10 (en Excel 0.2674).
Rpta.
Ya que en la Tabla 4 de la F, para 12 y 10 grados de libertad, la probabilidad
acumulada hasta 2.04 es menor a 0.95 (en Excel es 0.8663).
Como P > 0.10 > = 0.05, se acepta la hiptesis nula y se concluye tambin
que las varianzas del nmero de piezas producidas en los turnos diurno y
nocturno son homogneas, con el 5% de significacin.
b) A continuacin se prueba si es diferente la produccin media de los dos
turnos.
1. Hiptesis: H0: 1 = 2

H1: 1 2

2. Nivel de significacin: = 0.05


3. La estadstica de prueba cuando las varianzas son homogneas es:

X1 X 2
S c2 S c2

n1 n2

t13112 t 22

4. Regin crtica, para = 0.05 y la prueba bilateral, en la Tabla 3: t22, 0.975 =


2.074. Entonces:
R.C. = {T < -2.0745 o T > 2.074}
5. Con la informacin muestral: n1 = 13, X 1 = 82, S1 = 10 y n2 = 11, X 2 =
74, S2 = 7; y bajo el supuesto que Ho es cierta se determina:

2
c

n1 1 S12 (n2 1)S22 13x102 11x72

tcalc

n1 n2 2

x1 x 2
Sc2 Sc2

n1 n2

13 11 2

82 74
83.59 83.59
13 11

= 83.59

2.14

6. Decisin: como tcalc = 2.14 R.C. se rechaza Ho y se concluye con el 5%


de significacin, que la produccin media de los dos turnos son diferentes.
326

Para dos colas: P = 2P[T22 > 2.14] = 2[1 P(T22 2.14)] = 2[1 x] .. (1)
En la Tabla 3, T de student, no est el valor 2.15, se determina x interpolando
as:
T

2.074 0.975
2.14

2.508 2.074 2.14 2.074

0.990 0.975
x 0.975

28.93x 28.21 = 0.066

28.93 =

0.066
x 0.975
2.508

0.990

x = 0.9774

Reemplazando x = 0.9774 en (1) se obtiene:


P-valor = 2 [1 0.9774] = 0.0452

Rpta.

Como el valor-P = 0.0452 < = 0.05 se rechaza Ho y se concluye tambin


que la produccin media de los dos turnos son diferentes, con el 5% de
significacin.
17. Dos mquinas enlatan caf independientemente. Mediante muestras aleatorias
sin reemplazo, de latas con caf tomadas de cada mquina, se han obtenido los
siguientes resultados sobre el peso de las latas (en gramos):
n1 = 16, X 1 = 495, S1 = 9

n2 = 16,

X 2 = 505, S2 = 5.

a) Son diferentes las varianzas de los pesos de las latas con caf de ambas
mquinas? Use = 0.05. Halle p-valor.
b) Es mayor el peso medio de las latas con caf de la mquina 2 que el de la
mquina 1? Use = 0.01 y determine p-valor.
Solucin
Sean X1 y X2 las variables que representan el peso de las latas con caf (en gr.)
de las mquinas 1 y 2 respectivamente. Asumiendo que las dos poblaciones se
distribuyen normalmente con varianzas desconocidas y las muestras son
pequeas (n1 y n2 < 30) primero se prueba si las varianzas son diferentes, para
segn ello probar si es mayor el peso medio de las latas con caf de la mquina 2
que el de la mquina 1.
Datos: n1 = 16, X 1 = 495, S1 = 9
a) 1. Hiptesis: H0: 12 = 22

n2 = 16,

H1: 12 22
327

X 2 = 505, S2 = 5.

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: suponiendo las poblaciones normales y la hiptesis
nula cierta, para n1 = n2 = 16, la estadstica de prueba es:

S12
f15,15
S 22

4. Regin crtica. Para = 0.05 y la prueba bilateral en la Tabla 4, los valores


crticos F son: f15, 15, 0.025 = 1/ f15, 15, 0.975 = 1/ 2.86 = 0.35 y f15, 15, 0.995 =
2.86.
R.C. = {F < 0.35 o F > 2.86}
5. Clculos: con los datos de la muestra se obtiene:

S12 = 81, S 22 = 25 y Fcalc

S12 81

= 3.24
S 22 25

6. Decisin. Como Fcalc = 3.24 R.C. se rechaza Ho y concluimos que las


varianzas de los pesos de las latas con caf de ambas mquinas son
diferentes (heterogneas), con el 5% de significacin.
El valor P para la prueba bilateral y como Fcalc = 3.24 > 1 se obtiene as:
P = 2 P[f15,15 > 3.24] = 2 {1 - P[f15,15 3.24]} = 2{1 x} . (1)
Como en la Tabla 4 de la distribucin F, para 15 y 15 grados de libertad, no
est el valor 3.24, pero ste se encuentra entre los valores 2.86 (con
probabilidad 0.975) y 3.52 (con probabilidad 0.99) para hallar x se interpola
as:
F

2.86

0.975

3.24

3.52 2.86 3.24 2.86 44 = 0.38

0.99 0.975
x 0.975
x 0.975

3.52

0.99

44 x 42.9 = 0.38 x = 0.984

Reemplazando x = 0.984 en (1) se tiene:


P = 2 {1 0.984} = 0.032

Rpta.

Como P = 0.032 < = 0.05, se rechaza la hiptesis nula y se concluye


tambin que las varianzas de los pesos de las latas con caf de ambas
mquinas son diferentes (heterogneas), con el 5% de significacin.

328

b) A continuacin se prueba si el peso medio de las latas con caf de la mquina


2, es mayor que el peso medio de las latas con caf de la mquina 1.
1. Hiptesis: H0: 1 = 2

H1: 2 > 1

2. Nivel de significacin: = 0.01


3. La estadstica de prueba cuando las varianzas son heterogneas es:

X 2 X1
S12 S 22

n1 n2

t H t 23

2
S12 S 22
81 25


n1 n2
16 16

Donde: H =
=
= 23.45 23
2
2
2
2
81
25
S12
S 22




16 16
n1 n2
16 1 16 1
n1 1
n2 1

4. Regin crtica, para = 0.01 y la prueba unilateral derecha, en la Tabla 3 el


valor crtico es: t23, 0.99 = 2.50. Entonces:

R.C. = {T > 2.50}

5. Con la informacin muestral: n1 = 16, X 1 = 495, S1 = 9, n2 = 16, X 2 =


505, S2 = 5; y bajo el supuesto que Ho es cierta se determina:

tcalc

X 2 X1
S12 S22

n1 n2

505 495
3.89
81 25

16 16

6. Decisin: como tcalc = 3.89 R.C. se rechaza Ho y se concluye con el 1%


de significacin, que el peso medio de las latas con caf de la mquina 2 es
mayor que el peso medio de las latas con caf de la mquina 1.
Para la cola del lado derecho:
P = P[T23 > 3.89] = 1 - P[T23 3.89] < 0.0005

(en Excel 0.0004)

Rpta.
Ya que en la Tabla 3 de la T, para 23 grados de libertad, la probabilidad
acumulada hasta 3.89 es mayor a 0.9995 (en Excel es 0.9996).
Como el valor-P < 0.0005 < = 0.01 se rechaza Ho y se concluye tambin
que el peso medio de las latas con caf de la mquina 2 es mayor que el peso
medio de las latas con caf de la mquina 1, con el 1% de significacin.

329

18. En un colegio de secundaria, el cociente de inteligencia de 15 alumnos del turno


diurno, dio un promedio de 112 con una desviacin estndar de 6; mientras que
para 15 estudiantes del turno nocturno, dio un promedio de 105 con una
desviacin estndar de 15. Con el 1% de significacin pruebe s:
a) Son heterogneas las varianzas de ambos grupos? Halle p-valor.
b) Son diferentes los cocientes medios de inteligencia de los 2 turnos? Halle pvalor.
Solucin
Sean X1 y X2 las variables que representan el cociente de inteligencia de los
alumnos del turno diurno (1) y del turno nocturno (2) respectivamente.
Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas
desconocidas y las muestras son pequeas (n1 y n2 < 30) primero se prueba si las
varianzas son heterogneas, para segn ello probar si son diferentes los cocientes
medios de inteligencia de los 2 turnos.
Datos: n1 = 15, X 1 = 112, S1 = 6
a) 1. Hiptesis: H0: 12 = 22

n2 = 15,

X 2 = 105, S2 = 15.

H1: 12 22

2. Nivel de significacin: = 0.01


3. Estadstica de prueba: suponiendo las poblaciones normales y la hiptesis
nula cierta, para n1 = n2 = 15, la estadstica de prueba es:

S12
f14,14
S 22

4. Regin crtica. Para = 0.01 y la prueba bilateral en la Tabla 4, los valores


crticos F son: f14, 14, 0.005 = 1/ f14, 14, 0.995 = 1/ 4.30 = 0.233 y f14, 14, 0.995 =
4.30.
R.C. = {F < 0.233 o F > 4.30}
5. Clculos: con los datos de la muestra se obtiene:

S12 = 36, S 22 = 225 y Fcalc

S12
36

= 0.16
2
S 2 225

6. Decisin. Como Fcalc = 0.16 R.C. se rechaza Ho y concluimos que las


varianzas de los cocientes de inteligencia de los 2 turnos son diferentes
(heterogneas), con el 1% de significacin.
330

El valor P para la prueba bilateral y como Fcalc = 0.16 < 1 se obtiene as:
P = 2 P[f14,14 < 0.16] = 2 P[1/ f14,14 1/ 0.16] = 2 P[f14,14 6.25] =
= 2 {1 - P[f14,14 6.25]} < 0.01 (en Excel 0.0016).

Rpta.

Ya que en la Tabla 4 de la F, para 14 y 14 grados de libertad, la probabilidad


acumulada hasta 6.25 es mayor a 0.995 (en Excel es 0.9992).
Como P < 0.01 < = 0.01, se rechaza la hiptesis nula y se concluye tambin
que las varianzas de los cocientes de inteligencia de ambos turnos son
diferentes (heterogneas), con el 1% de significacin.
b) A continuacin se prueba si son diferentes los cocientes medios de
inteligencia de los 2 turnos.
1. Hiptesis: H0: 1 = 2

H1: 1 2

2. Nivel de significacin: = 0.01


3. La estadstica de prueba cuando las varianzas son heterogneas es:

X1 X 2
S12 S 22

n1 n2

t H t18

2
S12 S 22
36
225

n1 n2
15 15

Donde: H =
=
= 18.37 18
2
2
2
2
36
225
S12
S 22



15
15

n
n
1 2

15 1
15 1
n1 1
n2 1

4. Regin crtica, para = 0.01 y la prueba bilateral, en la Tabla 3 el valor


crtico es: t18, 0.995 = 2.878. Entonces:

R.C. = {T < -2.878 o T > 2.878}

5. Con la informacin muestral: n1 = 15, X 1 = 112, S1 = 6, n2 = 15, X 2 =


105, S2 = 15; y bajo el supuesto que Ho es cierta se determina:

tcalc

X1 X 2
2
1

2
2

S
S

n1 n2

112 105
1.68
36 225

15 15

6. Decisin: como tcalc = 1.68 R.A. se acepta Ho y se concluye con el 1%


de significacin, que los cocientes medios de inteligencia de los 2 turnos
son iguales.
331

Para dos colas: P = 2P[T18 > 1.68] = 2[1 P(T18 1.68)] = 2[1 x] .. (1)
En la Tabla 3, T de student, con 18 grados de libertad, no est el valor 1.68,
se determina x interpolando as:
T

1.330 0.90
1.68

1.734 1.330 1.68 1.330 8.08 = 0.35

0.95 0.90
x 0.90
x 0.90

1.734 0.95

8.08x 7.272 = 0.35

x = 0.943

Reemplazando x = 0.943 en (1) se obtiene:


P-valor = 2[1 0.943] = 0.114

Rpta.

Como el valor-P = 0.114 > = 0.01 no se rechaza Ho y se concluye tambin


que los cocientes medios de inteligencia de ambos turnos son iguales, con el
1% de significacin.
19. Muestras del sueldo de hombres (1) y mujeres (2) de una compaa
proporcionan los siguientes datos:
n1 = 20, X 1 = $ 540, S1 = $ 16

n2 = 20, X 2 = $ 530, S2 = $ 15.

a) Son heterogneas las varianzas de los sueldos de ambos grupos? Use =


0.01. Halle p-valor.
b) Con un nivel de significacin del 5%, probar si el sueldo medio de las
mujeres es menor que el de los hombres. Hallar p-valor.
Solucin
Sean X1 y X2 las variables que representan el sueldo de los hombres (1) y de las
mujeres (2) respectivamente. Asumiendo que las dos poblaciones se distribuyen
normalmente con varianzas desconocidas y las muestras son pequeas (n1 y n2 <
30) primero se prueba si las varianzas son heterogneas, para segn ello probar
si el sueldo medio de las mujeres es menor que el de los hombres.
Datos: n1 = 20,

X 1 = $ 540, S1 = $ 16

15.
a) 1. Hiptesis: H0: 12 = 22

H1: 12 22

2. Nivel de significacin: = 0.01

332

n2 = 20,

X 2 = $ 530, S2 = $

3. Estadstica de prueba: suponiendo las poblaciones normales y la hiptesis


nula cierta, para n1 = n2 = 20, la estadstica de prueba es:

S12
F 2 f19,19
S2
4. Regin crtica. Para = 0.01 y la prueba bilateral en la Tabla 4, los valores
crticos F son: f19, 19, 0.005 = 1/ f19, 19, 0.995 = 1/ 3.43 = 0.292 y f19, 19, 0.995 =
3.43.
R.C. = {F < 0.292 o F > 3.43}
5. Clculos: con los datos de la muestra se obtiene:
2
1

2
2

S = 256, S = 225 y Fcalc

S12 256
2
= 1.14
S 2 225

6. Decisin. Como Fcalc = 1.14 R.A. no se rechaza Ho y concluimos que


las varianzas de los sueldos de ambos grupos son iguales (homogneas),
con el 1% de significacin.
El valor P para la prueba bilateral y como Fcalc = 1.14 > 1 se obtiene as:
P = 2 P[f19,19 > 1.14] = 2 {1 - P[f19,19 1.14]} > 0.10 (en Excel 0.778).
Rpta.
Ya que en la Tabla 4 de la F, para 19 y 19 grados de libertad, la probabilidad
acumulada hasta 1.14 es menor a 0.95 (en Excel es 0.611).
Como P > 0.10 > = 0.01, no se rechaza la hiptesis nula y se concluye
tambin que las varianzas de los sueldos de ambos grupos son iguales
(homogneas), con el 1% de significacin.
b) A continuacin se prueba si el sueldo medio de las mujeres es menor que el
de los hombres.
1. Hiptesis: H0: 1 = 2

H1: 2 < 1

2. Nivel de significacin: = 0.05


3. La estadstica de prueba cuando las varianzas son homogneas es:

X 2 X1
S c2 S c2

n1 n2

t 20 202 t 38

4. Regin crtica, para = 0.05 y la prueba unilateral izquierda, en la Tabla 3:


t38, 0.05 = - t38, 0.95 = -1.686. Entonces:
333

R.C. = {T < -1.686}


5. Con la informacin muestral: n1 = 20,

X 1 = $ 540, S1 = $ 16, n2 = 20,

X 2 = $ 530, S2 = $ 15; y bajo el supuesto que Ho es cierta se determina:

Sc2

n1 1 S12 (n2 1)S22 19 x162 19 x152

tcalc

n1 n2 2

X 2 X1
Sc2 Sc2

n1 n2

20 20 2

= 240.5

530 540
2.04
240.5 240.5

20
20

6. Decisin: como tcalc = -2.04 R.C. se rechaza Ho y se concluye con el 5%


de significacin, que el sueldo medio de las mujeres es menor que el
sueldo medio de los hombres.
Para la prueba unilateral izquierda:
P = P[T38 < -2.04] = 1 P(T38 2.04) = 1 0.976 = 0.024

Rpta.

Como el valor-P = 0.024 < = 0.05 se rechaza Ho y se concluye tambin que


el sueldo medio de las mujeres, es menor que el sueldo medio de los hombres,
con el 5% de significacin.
20. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad
particular realizada por las empresas comerciales de dos ciudades. Mediante
muestras aleatorias sin reemplazo de 20 empresas tomadas en cada ciudad se han
obtenido los siguientes resultados:
n1 = 20,

x1 = 402, S1 = 25

n2 = 20,

x 2 = 385, S2 = 15.

a) Son diferentes las varianzas de los gastos mensuales en seguridad particular


realizada por las empresas comerciales de las dos ciudades? Use = 0.05.
Halle p-valor.
b) Son diferentes los gastos medios mensuales en seguridad particular realizada
por las empresas comerciales de ambas ciudades? Use = 0.05 y halle pvalor.
Solucin
Sean X1 y X2 las variables que representan los gastos mensuales en seguridad
particular de las empresas comerciales en las ciudades 1 y 2 respectivamente.
Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas
334

desconocidas y las muestras son pequeas (n1 y n2 < 30) primero se prueba si las
varianzas son diferentes; para segn ello, probar si son diferentes los gastos
medios mensuales en seguridad particular de las empresas comerciales de ambas
ciudades.
n1 = 20,

x1 = 402, S1 = 25

a) 1. Hiptesis: H0: 12 = 22

n2 = 20,

x 2 = 385, S2 = 15.

H1: 12 22

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: suponiendo las poblaciones normales y la hiptesis
nula cierta, para n1 = n2 = 20, la estadstica de prueba es:

S12
F 2 f19,19
S2
4. Regin crtica. Para = 0.05 y la prueba bilateral en la Tabla 4, los valores
crticos F son: f19, 19, 0.025 = 1/ f19, 19, 0.975 = 1/ 2.53 = 0.395 y f15, 15, 0.995 =
2.53.
R.C. = {F < 0.395 o F > 2.53}
5. Clculos: con los datos de la muestra se obtiene:
2
1

2
2

S = 625, S = 225 y Fcalc

S12 625
2
= 2.78
S 2 225

6. Decisin. Como Fcalc = 2.78 R.C. se rechaza Ho y concluimos que las


varianzas de los gastos mensuales en seguridad particular realizada por las
empresas comerciales de las dos ciudades son diferentes (heterogneas),
con el 5% de significacin.
El valor P para la prueba bilateral y como Fcalc = 2.78 > 1 se obtiene as:
P = 2 P[f19,19 > 2.78] = 2 {1 - P[f19,19 2.78]} = 2{1 x} . (1)
Como en la Tabla 4 de la distribucin F, para 19 y 19 grados de libertad, no
est el valor 2.78, pero ste se encuentra entre los valores 2.53 (con
probabilidad 0.975) y 3.03 (con probabilidad 0.99) para hallar x se interpola
as:
F

2.53

0.975

2.78

3.03 2.53 2.78 2.53 33.33 = 0.25

0.99 0.975
x 0.975
x 0.975
335

3.03

0.99

33.33 x 32.5 = 0.25 x = 0.983

Reemplazando x = 0.983 en (1) se tiene:


P = 2 {1 0.983} = 0.034

Rpta.

Como P = 0.034 < = 0.05, se rechaza la hiptesis nula y se concluye


tambin que las varianzas de los gastos mensuales en seguridad particular
realizada por las empresas comerciales de ambas ciudades son diferentes
(heterogneas), con el 5% de significacin.
b) A continuacin se prueba si son diferentes los gastos medios mensuales en
seguridad particular de las empresas comerciales de ambas ciudades.
1. Hiptesis: H0: 1 = 2

H1: 2 1

2. Nivel de significacin: = 0.05


3. La estadstica de prueba cuando las varianzas son heterogneas es:

X1 X 2

t H t 31

S12 S 22

n1 n2

2
S12 S 22
625
225

n1 n2
20
20

Donde: H =
=
= 31.11 31
2
2
2
2
625
225
S12
S 22



20
20

n
n
1 2

20 1
20 1
n1 1
n2 1

4. Regin crtica, para = 0.05 y la prueba bilateral, en la Tabla 3 el valor


crtico es: t31, 0.975 = 2.04. Entonces:

R.C. = {T < -2.04 o T > 2.04 }

5. Con la informacin muestral: n1 = 20,


20,

x 2 = 385,

x1 = 402, S1 = 25

n2 =

S2 = 15; y bajo el supuesto que Ho es cierta se

determina:

tcalc

X1 X 2
S12 S22

n1 n2

402 385
2.61
625 225

20 20

6. Decisin: como tcalc = 2.61 R.C. se rechaza Ho y se concluye con el 5%


de significacin, que los gastos medios mensuales en seguridad particular
de las empresas comerciales de ambas ciudades son diferentes.
Para dos colas: P = 2P[T31 > 2.61] = 2[1 P(T31 2.61)] = 2[1 x] .. (1)
336

En la Tabla 3, T de student, con 31 grados de libertad, no est el valor 2.61,


pero ste se encuentra entre los valores 2.453 (con probabilidad 0.99) y 2.744
(con probabilidad 0.995) para hallar x se interpola as:
T

2.453 0.990
2.61

2.744 2.453 2.610 2.453

0.995 0.990
x 0.990

58.2 x 57.618 = 0.157

58.2 =

0.157
x 0.990
2.744

0.995

x = 0.993

Reemplazando x = 0.993 en (1) se obtiene:


P-valor = 2[1 0.993] = 0.014

Rpta.

Como el valor-P = 0.014 < = 0.05 se rechaza Ho y se concluye tambin que


los gastos medios mensuales en seguridad particular de las empresas
comerciales de ambas ciudades son diferentes, con el 1% de significacin.
21. Una Encuesta de Opinin realizada en 1000 hogares de Lima Metropolitana
(con 1700 000 hogares) indica que el 30.5 % de los hogares compra peridicos
y revistas. Aceptara Ud. que menos del 34 % de hogares limeos compra
peridicos y revistas? Use = 0.05. Halle p-valor.
Solucin
Denotemos

con p la proporcin (%) poblacional de hogares que compra

peridicos y revistas. Se quiere contrastar las hiptesis si menos del 34 % (0.34)


de hogares limeos compra peridicos y revistas.
1. Hiptesis: H0: p p0 = 0.34,

H1: p < 0.34

2. Nivel de significacin: = 0.05

3. Estadstica de prueba: Z

p p0
N (0,1)
p0 q0
n

4. Regin crtica, para = 0.05 y la prueba unilateral izquierda, en la Tabla 1 el


valor crtico es: Z = -Z1- = -Z0.95 = -1.645. Entonces:
5. Con la informacin muestral: n = 1000,
Ho: p = p0 = 0.34 es cierta, se determina:
337

R.C. = {Z < -1.645}

p 0.305 y bajo el supuesto que

Z calc

p p0 0.305 0.34

= -2.33
p0 q0
0.34 x0.66
1000
n

6. Decisin: como Zcalc = 2.33 R.C. se rechaza la hiptesis nula y se concluye


con el 5% de significacin, que menos del 34 % (p < 0.34) de hogares
limeos compra peridicos y revistas (la estimacin muestral indica que es el
30.5%).
P = P[Z < Zcalc] = P[Z < -2.33] = (-2.33) = 0.0099

Rpta.

Como el valor-P = 0.0099 < = 0.05 se rechaza la hiptesis nula y se concluye


tambin que menos del 34 % de hogares limeos compra peridicos y revistas,
con el 5% de significacin.
22. Una Encuesta de Opinin realizada en 800 hogares de Lima Metropolitana
(con 1.7 millones de hogares) 644 hogares indicaron que tienen abastecimiento
de agua de la red pblica dentro de la vivienda. Aceptara usted que la
verdadera proporcin de hogares que tienen abastecimiento de agua de la red
pblica dentro de la vivienda difiere de 0.75 (75%)? Use = 0.01. Halle p-valor.
Solucin
Denotemos

con p la proporcin (%) poblacional de hogares que tienen

abastecimiento de agua de la red pblica dentro de la vivienda. Se quiere


contrastar las hiptesis si la proporcin de hogares que tienen abastecimiento de
agua de la red pblica dentro de la vivienda difiere de 0.75 o 75% (p 0.75).
H1: p 0.75

1. Hiptesis: H0: p = p0 = 0.75,


2. Nivel de significacin: = 0.01

3. Estadstica de prueba: Z

p p0
N (0,1)
p0 q0
n

4. Regin crtica, para = 0.01 y la prueba bilateral, en la Tabla 1 el valor


crtico es: Z1-/2 = Z0.995 = 2.575. Entonces:

R.C. = {Z < -2.575 o Z >

2.575}
5. Con la informacin muestral: n = 800, X = 644, p

X 644

= 0.805 y
n 800

bajo el supuesto que Ho: p = p0 = 0.75 es cierta, se determina:


338

Z calc

p p0 0.805 0.75

= 3.59
p0 q0
0.75 x0.25
800
n

6. Decisin: como Zcalc = 3.59 R.C. se rechaza la hiptesis nula y se concluye


con el 1% de significacin, que la proporcin de hogares que tienen
abastecimiento de agua de la red pblica dentro de la vivienda difiere de 0.75
o 75% (la estimacin muestral seala que es 0.805 o el 80.5%).
Como la prueba es bilateral, el valor-P se determina as:
P = P[|Z| > |Zcalc|] = P[|Z| > 3.59] = 2(-3.59) = 2(0.00017) = 0.00034
Rpta.
Como el valor-P = 0.00034 < = 0.01 se rechaza la hiptesis nula y se
concluye tambin que la proporcin de hogares que tienen abastecimiento de
agua de la red pblica dentro de la vivienda difiere de 0.75 o 75%, con el 1% de
significacin.
23. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima
Metropolitana, 400 indicaron que hay problemas de seguridad. Indica esta
evidencia que ms del 75 % de los ciudadanos limeos perciben que hay
problemas de seguridad? Use el nivel de significacin de 0.05. Halle p-valor.
Explique el error tipo II.
Solucin
Denotemos

con p la proporcin (%) poblacional de ciudadanos de Lima

Metropolitana que indican que hay problemas de seguridad. Se quiere contrastar


las hiptesis si ms del 75 % (p > 0.75) de los ciudadanos limeos perciben que
hay problemas de seguridad.
1. Hiptesis: H0: p = p0 = 0.75,

H1: p > 0.75

2. Nivel de significacin: = 0.05

3. Estadstica de prueba: Z

p p0
N (0,1)
p0 q0
n

4. Regin crtica, para = 0.05 y la prueba unilateral derecha, en la Tabla 1 el


valor crtico es: Z1- = Z0.95 = 1.645. Entonces:
339

R.C. = {Z > 1.645}

5. Con la informacin muestral: n = 500, X = 400, p

X 400

= 0.80 y bajo
n 800

el supuesto que Ho: p = p0 = 0.75 es cierta, se determina:

Z calc

p p0
0.80 0.75

= 2.58
p0 q0
0.75 x0.25
500
n

6. Decisin: como Zcalc = 2.58 R.C. se rechaza la hiptesis nula y se concluye


con el 5% de significacin, que ms del 75 % (p > 0.75) de los ciudadanos
limeos perciben que hay problemas de seguridad (la estimacin muestral
seala que es 0.80 o el 80%).
Como la prueba es unilateral derecha, el valor-P se determina as:
P = P[Z > Zcalc] = P[Z > 2.58] = 1 (2.58) = 1 0.99506 = 0.00494
Rpta.
Como el valor-P = 0.00494 < = 0.05 se rechaza la hiptesis nula y se
concluye tambin que ms del 75 % (p > 0.75) de los ciudadanos limeos
perciben que hay problemas de seguridad, con el 1% de significacin.
Error tipo II.- consiste en aceptar Ho (que el 75% de los ciudadanos limeos
percibe que hay problemas de seguridad) cuando es falsa (este porcentaje
realmente es de ms del 75%).
24. Se tom una muestra aleatoria de 300 compradores en un centro comercial y se
encontr que 182 estn a favor de un horario ms amplio para las compras.
Esta evidencia es suficiente para concluir que menos del 65 % de los
compradores estn a favor de un horario ms extenso? Use un nivel de
significacin de 0.05. Halle p-valor.
Solucin
Denotemos con p la proporcin (%) poblacional de compradores en el centro
comercial que responden que estn a favor de un horario ms amplio para las
compras. Se quiere probar las hiptesis si menos del 65 % (p < 0.65) de los
compradores estn a favor de un horario ms extenso en el centro comercial.
1. Hiptesis: H0: p = p0 = 0.65,

H1: p < 0.65

2. Nivel de significacin: = 0.05

340

3. Estadstica de prueba: Z

p p0
N (0,1)
p0 q0
n

4. Regin crtica, para = 0.05 y la prueba unilateral izquierda, en la Tabla 1 el


valor crtico es: Z = -Z1- = -Z0.95 = -1.645. Entonces:

R.C. = {Z < -1.645}

5. Con la informacin muestral: n = 300, X = 182, p

X 182

= 0.607 y
n 300

bajo el supuesto que Ho: p = p0 = 0.65 es cierta, se determina:

Z calc

p p0 0.607 0.65

= -1.56
p0 q0
0.65 x0.35
300
n

6. Decisin: como Zcalc = -1.56 R.A. no se rechaza la hiptesis nula y se


concluye con el 5% de significacin, que el 65 % (p = 0.65) de los
compradores estn a favor de un horario ms extenso en el centro comercial.
Como la prueba es unilateral izquierda, el valor-P se determina as:
P = P[Z < Zcalc] = P[Z < -1.56] = (-1.56) = 0.05938

Rpta.

Como el valor-P = 0.05938 > = 0.05 no se rechaza la hiptesis nula y se


concluye tambin que el 65 % (p = 0.65) de los compradores estn a favor de
un horario ms extenso en el centro comercial, con el 5% de significacin.
25. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima
Metropolitana, 375 indicaron que no estn de acuerdo con el servicio militar
obligatorio.
Indica esta evidencia que menos del 80 % de los ciudadanos no estn de
acuerdo con el servicio militar obligatorio? Use el nivel de significacin de 0.01.
Halle p-valor.
Solucin
Denotemos con p la proporcin (%) poblacional de ciudadanos entrevistados
que responden que indican que no estn de acuerdo con el servicio militar
obligatorio. Se quiere probar las hiptesis si menos del 80% (p < 0.80) de los
ciudadanos no estn de acuerdo con el servicio militar obligatorio.
1. Hiptesis: H0: p = p0 = 0.80,

H1: p < 0.80

2. Nivel de significacin: = 0.01


341

3. Estadstica de prueba: Z

p p0
N (0,1)
p0 q0
n

4. Regin crtica, para = 0.01 y la prueba unilateral izquierda, en la Tabla 1 el


valor crtico es: Z = -Z1- = -Z0.99 = -2.33. Entonces:
5. Con la informacin muestral: n = 500, X = 375, p

R.C. = {Z < -2.33}

X 375

= 0.75 y bajo
n 500

el supuesto que Ho: p = p0 = 0.80 es cierta, se determina:

Z calc

p p0
0.75 0.80

= -2.80
p0 q0
0.80 x0.20
500
n

6. Decisin: como Zcalc = -2.80 R.C. se rechaza la hiptesis nula y se concluye


con el 1% de significacin, que menos del 80% (p < 0.80) de los ciudadanos
no estn de acuerdo con el servicio militar obligatorio.
Como la prueba es unilateral izquierda, el valor-P se determina as:
P = P[Z < Zcalc] = P[Z < -2.80] = (-2.80 ) = 0.00256 Rpta.
Como el valor-P = 0.00256 < = 0.01 se rechaza la hiptesis nula y se
concluye tambin que menos del 80% (p < 0.80) de los ciudadanos no estn de
acuerdo con el servicio militar obligatorio, con el 1% de significacin.
26. A fin de determinar el nivel de aceptacin de una revista de negocios, se
entrevistaron dos grupos de empresarios: de Lima Metropolitana (1) y del Resto
del Pas (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280;

Resto del Pas (2): n2 = 1200, X2 =

300.
Con = 0.05 Son diferentes las verdaderas proporciones de empresarios
limeos y no limeos que aceptan la revista de negocios? Determine pvalor.
Solucin
Sean p1 y p2, las proporciones poblacionales de empresarios de Lima
Metropolitana (1) y del Resto del Pas (2) que aceptan la revista de negocios.
Entonces, se desea probar si son diferentes las verdaderas proporciones de
empresarios limeos y no limeos que aceptan la revista de negocios.
342

1. Hiptesis: Ho: p1 = p2

H1: p1 p2

2. Nivel de significacin: = 0.05

3. Estadstica de prueba: Z

p 1 p 2 ( p1 p2 )
N(0, 1)
p1q1 p 2 q2

n1
n2

4. Regin crtica, para = 0.05 y la prueba bilateral, en la Tabla 1 el valor


crtico es: Z1-/2 = Z0.975 = 1.96. Entonces:

R.C. = {Z < -1.96 o Z > 1.96}

5. Bajo el supuesto que Ho es cierta y con la informacin muestral: n1 = 800,

p 1

X1 = 280,
= 0.25, p

Z calc

X 1 280
X
300
= 0.35, n2 = 1200, X2 = 300, p 2 2

n1 800
n2 1200

X 1 X 2 280 300
580
= 0.29 y q = 0.71; se determina:

n1 n2
800 1200 2000

p 1 p 2
1 1
p q
n1 n2

0.35 0.25
1
1
0.29 x0.71

800 1200

= 4.83

6. Decisin: como Zcalc = 4.83 R.C. se rechaza la hiptesis nula con el 5% de


significacin. Se concluye que son diferentes las verdaderas proporciones de
empresarios limeos y no limeos que aceptan la revista de negocios.
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -4.83] =
= 2 (-4.83) < 0.0001 (en Excel 0.0000014).

Rpta.

Ya que en la Tabla 1 de la distribucin normal estndar, la probabilidad


acumulada hasta -4.83 es menor a 0.0001 (en Excel es 0.00000068).
Como P < 0.0001 < = 0.01, se rechaza la hiptesis nula y se concluye tambin
que son diferentes las verdaderas proporciones de empresarios limeos y no
limeos que aceptan la revista de negocios, con el 5% de significacin.
27. En una muestra aleatoria de 400 adultos, 220 estn de acuerdo con la gestin
presidencial. Mientras que en una muestra de 600 jvenes, 300 estn de acuerdo
con la gestin presidencial. Se puede afirmar que la verdadera proporcin de
adultos que est de acuerdo con la gestin presidencial, es mayor que la
proporcin de jvenes que est de acuerdo con dicha gestin? Use = 0.05.
Halle p-valor.
Solucin
343

Sean p1 y p2, las proporciones poblacionales de adultos (1) y de jvenes (2) que
estn de acuerdo con la gestin presidencial. Entonces, se desea probar si la
verdadera proporcin de adultos que est de acuerdo con la gestin presidencial,
es mayor que la proporcin de jvenes que est de acuerdo con dicha gestin.
1. Hiptesis: Ho: p1 = p2

H1: p1 > p2

2. Nivel de significacin: = 0.05

3. Estadstica de prueba: Z

p 1 p 2 ( p1 p2 )
N(0, 1)
p1q1 p 2 q2

n1
n2

4. Regin crtica, para = 0.05 y la prueba unilateral derecha, en la Tabla 1 el


valor crtico es: Z1- = Z0.95 = 1.645. Entonces:

R.C. = {Z > 1.645}

5. Bajo el supuesto que Ho es cierta y con la informacin muestral: n1 = 400,


X1 = 220,
0.50, p

Z calc

p 1

X 1 220
X
300
= 0.55, n2 = 600, X2 = 300, p 2 2
=

n1 400
n2 600

X 1 X 2 220 300 520


= 0.52 y q = 0.48; se determina:

n1 n2
400 600 1000
p 1 p 2

1 1
p q
n1 n2

0.55 0.50
1
1
0.52 x0.48

400 600

= 1.55

6. Decisin: como Zcalc = 1.55 R.A. no se rechaza la hiptesis nula con el 5%


de significacin. Se concluye que son iguales las verdaderas proporciones de
adultos y de jvenes que estn de acuerdo con la gestin presidencial.
Para la prueba es unilateral derecha:
P = P[Z > Zcalc] = P[Z > 1.55] = 1 (1.55) = 1 0.93943 = 0.06057

Rpta.

Como P = 0.06057 > = 0.05, se acepta la hiptesis nula y se concluye


tambin que son iguales las verdaderas proporciones de adultos y de jvenes que
estn de acuerdo con la gestin presidencial, con el 5% de significacin.
28. De los alumnos de la UNAC se toma una muestra aleatoria de 300 mujeres, 150
de las cuales estn a favor de la titulacin con tesis. En una muestra de 200
hombres, 120 indican que estn a favor de lo mismo. Se puede afirmar que hay
una diferencia significativa entre las verdaderas proporciones de alumnos y
alumnas que estn a favor de la titulacin con tesis? Use = 0.01. Halle p-valor
344

Solucin
Sean p1 y p2, las proporciones poblacionales de estudiantes hombres (1) y
mujeres (2) que estn a favor de la titulacin con tesis. Entonces, se desea probar
si son diferentes las verdaderas proporciones de alumnos y alumnas que estn a
favor de la titulacin con tesis.
1. Hiptesis: Ho: p1 = p2

H1: p1 p2

2. Nivel de significacin: = 0.01

3. Estadstica de prueba: Z

p 1 p 2 ( p1 p2 )
N(0, 1)
p1q1 p 2 q2

n1
n2

4. Regin crtica, para = 0.01 y la prueba bilateral, en la Tabla 1 el valor


crtico es: Z1-/2 = Z0.995 = 2.575. Entonces:

R.C. = {Z < -2.575 o Z >

2.575}
5. Bajo el supuesto que Ho es cierta y con la informacin muestral: n1 = 200,
X1 = 120,

p 1

X 1 120
X
150
= 0.60, n2 = 300, X2 = 150, p 2 2
=

n1 200
n2 300

0.50,

X 1 X 2 120 150 270


= 0.54 y q = 0.46; se determina:

n1 n2
200 300 500

Z calc

p 1 p 2
1 1
p q
n1 n2

0.60 0.50
1
1
0.54 x0.46

200 300

= 2.20

6. Decisin: como Zcalc = 2.20 R.A. no se rechaza la hiptesis nula con el 1%


de significacin. Se concluye que son iguales las verdaderas proporciones de
alumnos y alumnas que estn a favor de la titulacin con tesis.
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.20] =
= 2 (-2.20) = 2 (0.0139) = 0.0278

Rpta.

Como P = 0.0278 > = 0.01, se acepta la hiptesis nula y se concluye


tambin que son iguales las verdaderas proporciones de alumnos y alumnas que
estn a favor de la titulacin con tesis, con el 1% de significacin.
29. Una empresa desea determinar la proporcin de hogares que adquiere su
producto en las ciudades 1 y 2. Una muestra al azar de 600 hogares en cada
345

ciudad arroja que 288 lo adquiere en la ciudad 1 y 252 en la ciudad 2. Ser la


proporcin de hogares que adquiere el producto en la ciudad 2 menor que la
proporcin de hogares que adquiere el producto en la ciudad 1? Use = 0.01.
Halle p-valor.
Solucin
Sean p1 y p2, las proporciones poblacionales de hogares que adquiere el producto
en las ciudades 1 y 2 respectivamente. Entonces, se desea probar si la verdadera
proporcin de hogares que adquiere el producto en la ciudad 2 menor que la
proporcin de hogares que adquiere el producto en la ciudad 1.
1. Hiptesis: Ho: p1 = p2

H1: p2 < p1

2. Nivel de significacin: = 0.01

3. Estadstica de prueba: Z

p 2 p 1 ( p2 p1 )
N(0, 1)
p1q1 p 2 q2

n1
n2

4. Regin crtica, para = 0.01 y la prueba unilateral, en la Tabla 1 el valor


crtico es: Z = -Z1- = -Z0.99 = -2.33. Entonces:

R.C. = {Z < -2.33}

5. Bajo el supuesto que Ho es cierta y con la informacin muestral: n1 = 600,


X1 = 288,
0.42, p

Z calc

p 1

X 1 288
X
252
= 0.48, n2 = 600, X2 = 252, p 2 2
=

n1 600
n2 600

X 1 X 2 288 252 540


= 0.45 y q = 0.55; se determina:

n1 n2
600 600 1200
p 2 p 1

1 1
p q
n1 n2

0.42 0.48
1
1
0.45 x0.55

600 600

= -2.09

6. Decisin: como Zcalc = -2.09 R.A. no se rechaza la hiptesis nula con el 1%


de significacin; y se concluye que las verdaderas proporciones poblacionales
de hogares que adquiere el producto en las ciudades 1 y 2 son iguales.
Para la prueba es unilateral izquierda:
P = P[Z < Zcalc] = P[Z < -2.09] = (-2.09) = 0.01831

Rpta.

Como P = 0.01831 > = 0.01, se acepta la hiptesis nula y se concluye


tambin que las proporciones poblacionales de hogares que adquiere el producto
en las ciudades 1 y 2 son iguales, con el 5% de significacin.
346

30. Se entrevistaron dos grupos de mujeres respecto a su inters por los polos de
verano Sol y mar. De una muestra de 250 mujeres menores de 40 aos, 150
estuvieron interesados, mientras que de 250 mujeres de 40 aos a ms, slo 120
mostraron inters. Con el 5% de significacin, existe diferencia entre la
proporcin de mujeres menores de 40 aos y las de 40 aos a ms que mostraron
inters por los polos de verano Sol y mar? Halle p-valor.
Solucin
Sean p1 y p2, las proporciones poblacionales de mujeres menores de 40 aos (1)
y las mujeres de 40 aos a ms (2) que muestran inters por los polos de verano
Sol y mar. Entonces, se desea probar si son diferentes ambas proporciones .
1. Hiptesis: Ho: p1 = p2

H1: p1 p2

2. Nivel de significacin: = 0.05

3. Estadstica de prueba: Z

p 1 p 2 ( p1 p2 )
N(0, 1)
p1q1 p 2 q2

n1
n2

4. Regin crtica, para = 0.05 y la prueba bilateral, en la Tabla 1 el valor


crtico es: Z1-/2 = Z0.975 = 1.96. Entonces:

R.C. = {Z < -1.96 o Z > 1.96}

5. Bajo el supuesto que Ho es cierta y con la informacin muestral: n1 = 250,


X1 = 150,
0.48, p

Z calc

p 1

X 1 150
X
120
= 0.60, n2 = 250, X2 = 120, p 2 2
=

n1 250
n2 250

X 1 X 2 150 120 270


= 0.54 y q = 0.46; se determina:

n1 n2
250 250 500
p 1 p 2

1 1
p q
n1 n2

0.60 0.48
1
1
0.54 x0.46

250 250

= 2.69

6. Decisin: como Zcalc = 2.69 R.C. se rechaza la hiptesis nula con el 5% de


significacin; y se concluye que son diferentes las verdaderas proporciones de
mujeres menores de 40 aos y las de 40 aos a ms que mostraron inters por
los polos de verano Sol y mar.
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.69] = 2 (-2.69) = 2 (0.00357)
= 0.00714. Como P = 0.00714 < = 0.05, se rechaza la hiptesis nula y se
concluye tambin que son diferentes las verdaderas proporciones .
347

6.10 PROBLEMAS PROPUESTOS


1.

Un proceso est programado para embotellar la cantidad media de 750 mililitros


de gaseosa. Se toma una muestra aleatoria de 41 botellas, resultando una media
de 745 ml. y una desviacin tpica de 12 ml.
a) Al 5% de significacin se puede afirmar que no se est cumpliendo con el
contenido medio en las botellas de gaseosa? Halle p-valor.

2.

Aceptara usted que 2 < 200 ml2 por botella? Use = 0.05. Halle p-valor.
Un proceso est programado para embolsar la cantidad media de 250 gramos
de caf. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
253.5 gramos y una desviacin tpica de 13 gramos.
a) Se puede afirmar que el contenido medio en las bolsas de caf es mayor de
250 gramos? Use = 0.05. Halle p-valor.
b) Aceptara usted que 2 250 gr2 por bolsa? Use = 0.05. Halle p-valor.

3.

Un proceso est programado para embolsar la cantidad media de 500 gramos de


frejol. Se toma una muestra aleatoria de 35 bolsas, resultando una media de
496.5 gramos y una desviacin tpica de 15 gramos.
a) Al 5% de significacin se puede afirmar que el contenido medio en las
bolsas de frejol es menor de 500 gramos? Halle p-valor.
b) Aceptara usted que 2 > 300 gr2 por bolsa? Use = 0.05. Halle p-valor.

4.

Se tiene la siguiente prueba de hiptesis: Ho: 100 y H1: < 100.


Una muestra de 50 elementos produce una media muestral de 95.5 y una
desviacin estndar muestral de 12.
a) Realice la prueba de hiptesis usando = 0.05. Halle p-valor.
b) Ponga a prueba H0: 2 = 120 contra H1: 2 120, use = 0.05. Halle p-valor.

5.

Un proceso est programado para embolsar la cantidad media de 1000 gramos


de lenteja. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
996.5 gramos y una desviacin tpica de 10 gramos.
a) Al 5% de significacin se puede afirmar que no se est cumpliendo con el
contenido medio en la bolsa? Halle p-valor.
b) Aceptara usted que 2 250 gr2 por bolsa? Use = 0.05. Halle p-valor.
348

6.

Los pesos de diez estudiantes (en Kg.) fueron: 60, 44, 66, 71, 75, 75, 80, 84, 93
y 82. Suponga que estos pesos proceden de una poblacin normal.
a) Ponga a prueba H0: = 70 Kg. contra H1: 70, con un = 0.05. Halle pvalor.
b) Ponga a prueba H0: 2 = 80 Kg2 contra H1: 2 > 80, use = 0.05. Halle pvalor.

7.

Los pesos netos (grs.) de las bolsas de detergente es de 250. Una muestra
aleatoria de 10 bolsas dio estos pesos: 248, 251, 248, 247, 245, 246, 246, 252,
247, 250.
a) Ser la media poblacional de los pesos netos menor a 250gr. Use = 0.01.
Halle p-valor.
b) Ponga a prueba H0: 2 = 15 contra H1: 2 15, con un = 0.05. Halle p-valor.

8.

Las latas de duraznos de la Compaa La dulzura deben contener un peso neto


de 16 onzas, pero hay una gran variabilidad. Una muestra aleatoria de seis latas
revela los pesos netos siguientes en onzas: 15.1, 16.1, 15.8, 15.4, 16.1 y 15.1.
a) Use = 0.01 para determinar si el verdadero peso neto de las latas de
duraznos es menor de 16 onzas. Determine p-valor.
b) Aceptara usted que 2 < 1.25 gr2 por bolsa? Use = 0.05. Halle p-valor.

9.

Se prueba una muestra aleatoria de 9 bolsas de cierta marca para determinar el


peso medio de llenado. Los pesos de las bolsas, en onzas, fueron: 18, 22, 25, 20,
19, 26, 21, 24 y 23.
a) Hay razn para creer que el verdadero peso medio de llenado es mayor de 18
onzas? Use = 0.01. Halle p-valor.
b) Ser rechazada la hiptesis 2 > 3.5 onzas2? Use = 0.05. Halle p-valor.

10. Los pesos en kilos de una muestra aleatoria de 8 cajas de galleta son: 14.6, 12.5,
15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Suponiendo que los pesos se distribuyen
normalmente.
a) Con una significacin del 5 % pruebe si el peso medio de las cajas de galleta
es distinto de 14 Kg. Halle p-valor.
b) Ponga a prueba H0: 2 = 5 contra H1: 2 5, con un nivel de significacin de
0.05. Halle p-valor.
349

11. Un departamento de produccin desea determinar si hay diferencia en el


rendimiento entre el turno diurno y el nocturno. Una muestra aleatoria de 80
obreros del turno diurno alcanza una produccin media de 94.3 partes por hora,
con una desviacin estndar de 14 partes por hora, mientras que otra muestra de
60 obreros de la noche alcanza un promedio de 89.7 partes por hora, con una
desviacin estndar de 17. Se pide probar si es diferente el rendimiento medio de
ambos turnos. Use = 0.05. Hallar p-valor.
12. En un estudio para determinar el costo medio de los televisores en las ciudades
A y B, se toma una muestra al azar de 200 hogares de A arrojando un costo
medio de $ 250 y una desviacin estndar de 15. Una muestra al azar de 180
hogares de la ciudad B da una costo medio de $ 235 y una desviacin estndar
de 10.
Con = 0.01, probar si el costo medio de los televisores en las ciudades A es
mayor que el costo medio de los televisores en la ciudad B. Hallar p-valor.
13. El departamento de marketing desea determinar si hay diferencia entre las ventas
mensuales promedio realizadas por hombres y mujeres. Una muestra aleatoria de
80 mujeres arroja una venta media de 95 artefactos mensuales, con una
desviacin estndar de 14 artefactos, mientras que otra muestra de 60 hombres
alcanza un promedio de 89 artefactos mensuales, con una desviacin estndar de
17.
Con = 0.05, son diferentes las ventas medias realizadas por hombres y
mujeres (m h)? Determine el p-valor.
14. En un estudio para determinar el gasto medio mensual de los hogares en frutas
para las ciudades A y B, se toma una muestra al azar de 100 hogares de A
arrojando un gasto medio de S/. 82 y una desviacin estndar de 15. Una
muestra al azar de 100 hogares de la ciudad B da una gasto medio de 75 y una
desviacin estndar de 10.
Use = 0.01, para probar si el gasto medio mensual en frutas en la ciudad B es
menor que el gasto medio en A. Halle p-valor.
15. Se comparan dos marcas de cigarrillos, 1 y 2, respecto a su contenido de nicotina
en miligramos; dos muestras aleatorias de 40 cigarrillos de la marca 1 y 50 de la
350

marca 2, dieron estos resultados: x1 = 14.3, n1 = 40, S1 = 2.9

x2 =

15.7, n2 = 50, S2 = 3.8. Es diferente el contenido medio de nicotina de las


dos marcas? Use = 0.01. Halle p-valor.
16. Dos mquinas embotellan jugo independientemente. Mediante muestra aleatoria
sin reemplazo de botellas tomadas de cada mquina se han obtenido los
siguientes resultados sobre el contenido de las botellas (en ml.):
n1 = 16, X 1 = 495, S1 = 5

n2 = 16,

X 2 = 505, S2 = 7.

a) Son diferentes las varianzas de los contenidos de las botellas con jugo de
ambas mquinas? Use = 0.05. Halle p-valor.
b) Son diferentes los contenidos medios de las botellas con gaseosa de ambas
mquinas? Use = 0.01 y determine p-valor.
17. Se ha llevado a cabo un estudio para analizar los gastos mensuales en publicidad
(en dlares) realizado por las empresas comerciales de dos ciudades. Mediante
muestras aleatorias sin reemplazo tomadas independientemente en cada ciudad
se han obtenido los siguientes resultados:
n1 = 20, X 1 = $ 950, S1 = 95

n2 = 18, X 2 = $ 850, S2 = 60.

a) Son heterogneas las varianzas de los gastos mensuales en publicidad de


ambas ciudades? Use = 0.01. Halle p-valor.
b) Con un nivel de significacin del 5 %, probar si los gastos mensuales en
publicidad de las empresas de la ciudad 1 es mayor que el de las empresas de
la ciudad 2. Hallar p-valor.
18. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para
secretarias, aprenden taquigrafa por dos mtodos diferentes y luego se les
somete a pruebas de dictado. Se encuentra que el grupo 1 obtiene en promedio
123 palabras por minuto con una desviacin estndar de 15 palabras, mientras
que el grupo 2 promedia 110 palabras por minuto con una desviacin estndar de
10 palabras. Con el 1% de significacin probar si:
a) Son heterogneas las varianzas de ambos grupos? Halle p-valor.
b) Es diferente el promedio de palabras por minuto para los dos mtodos? Halle
p-valor.

351

19. Se ha llevado a cabo un estudio para analizar los gastos mensuales (S/.) en
alquiler de local realizado por las empresas comerciales de dos ciudades
grandes.

Mediante

muestras

aleatorias

sin

reemplazo

tomadas

independientemente en cada ciudad se han obtenido los siguientes resultados:


n1 = 20, x1 = 938, S1 = 96

n2 = 20,

x 2 = 856, S2 = 62.

a) Son diferentes las varianzas de los gastos mensuales en alquiler de ambas


ciudades? Use = 0.05. Halle p-valor.
b) Con un nivel de significacin del 5 %, probar si los gastos mensuales en
alquiler de las empresas de la ciudad 1 es menor que el de las empresas de la
ciudad 2. Hallar p-valor.
20. Dos mquinas embolsan diariamente detergente de manera independiente.
Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada mquina se han
obtenido los siguientes resultados sobre el peso de las bolsas (en gramos):
n1 = 12, x1 = 505, S1 = 10

n2 = 12, x 2 = 495, S2 = 4.

Con el 1% de significacin probar si:


a) Son diferentes las varianzas de los pesos de las bolsas con detergente de
ambas mquinas? Halle p-valor.
b) Son diferentes los pesos medios de las bolsas con detergente de ambas
mquinas? Halle p-valor.
21. De una poblacin de 100,000 fumadores de cigarro, se selecciona una muestra
aleatoria de 800 fumadores y se encuentra que 240 tienen preferencia por la
marca A. Esta evidencia es suficiente para concluir que ms del 25 % de los
fumadores de cigarro prefieren la marca A? Use un nivel de significacin del
1%. Halle p-valor.
22. En una muestra aleatoria de 500 de los 100 000 ciudadanos de un distrito se
encontr que 200 estn de acuerdo con la gestin del alcalde. Indica esta
evidencia que menos del 45% de los ciudadanos estn de acuerdo con la gestin
del alcalde. Use un nivel de significacin del 5%. Halle p-valor.
23. De una muestra aleatoria de 500 hombres entrevistados, 125 indicaron que ven
ftbol los lunes en la noche por televisin. Indica esta evidencia que ms del 20
% de los televidentes hombres ven el ftbol los lunes por la noche? Use el nivel
de significacin de 0.01. Halle p-valor.
352

24. En una muestra aleatoria de 600 de los 20000 hogares de un distrito se encontr
que 240 consumen leche. Indica esta evidencia que menos del 45% de los
hogares consumen leche. Use un nivel de significacin del 5%. Halle p-valor.
Explique el error tipo I.
25. De una muestra aleatoria de 800 ciudadanos entrevistados en Lima
Metropolitana, 200 indicaron que no estn de acuerdo con el voto electrnico.
Indica esta evidencia que ms del 20 % de los ciudadanos no estn de acuerdo
con el voto electrnico? Use el nivel de significacin de 0.01. Halle p-valor.
26. Se entrevistaron a hombres y mujeres respecto a su inters por una nueva marca
de perfume. En una muestra aleatoria de 400 hombres y 600 mujeres, 220
hombres y 300 mujeres dijeron que les gustaba el nuevo perfume. Con el 1% de
significacin, existe diferencia entre las verdaderas proporciones de hombres y
mujeres que dijeron que les gustaba el nuevo perfume? Halle p-valor.
27. De los alumnos de la UNAC se toma una muestra aleatoria de 600 hombres, 300
de las cuales estn a favor del cambio curricular. En una muestra de 400
mujeres, 240 indican que estn a favor de lo mismo. Se puede afirmar que es
menor la proporcin de hombres que estn a favor del cambio curricular, que la
proporcin de mujeres a favor del cambio curricular? Use = 0.01. Halle pvalor.
28. A fin de determinar el nivel de aceptacin de la gestin presidencial, se
entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto
del Pas (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280;

Resto del Pas (2): n2 = 1200, X2 =

300
Con = 0.05 Existe diferencia entre las verdaderas proporciones de limeos
y no limeos que estn de acuerdo con la gestin presidencial? Determine pvalor.
29. Se entrevistaron dos grupos de mujeres respecto a su inters por la compra de
casacas de cuero. De una muestra de 300 mujeres de 40 aos a ms, 75
estuvieron interesadas, mientras que de 200 mujeres menores 40 aos, 80
mostraron inters. Con el 5% de significacin, ser mayor la proporcin de
353

mujeres menores de 40 aos interesadas en la compra de casacas de cuero, que la


proporcin de las de 40 aos a ms interesadas en dicha compra. Halle p-valor.
30. En una muestra aleatoria

de 400 jvenes, 220 estn de acuerdo con la

suscripcin de los Tratados de Libre Comercio (TLCs). Mientras que en una


muestra de 600 adultos, 300 estn de acuerdo con la suscripcin de TLCs.
a) Est Ud. de acuerdo que ms del 50% de jvenes est de acuerdo con la
suscripcin de TLCs? Use = 0.01. Halle p-valor.
b) Se puede afirmar que hay una diferencia significativa entre las verdaderas
proporciones de jvenes y adultos que estn de acuerdo con la suscripcin de
TLCs? Use = 0.05. Halle p-valor.

354

Captulo 7. PRUEBAS DE HIPTESIS NO


PARAMTRICAS
Ser culto, es el nico modo de ser libre

Jos Mart

CONTENIDO
7.1
7.2
7.3
7.4
7.5
7.6
7.7

Uso de la distribucin Chi-cuadrado. Test de independencia.


Test de bondad de ajuste.
Test de Wilcoxon.
Test de signos.
Test de la mediana.
Ejercicios resueltos.
Ejercicios propuestos.

En este captulo, se presenta algunos mtodos para la realizacin de pruebas


estadsticas no paramtricas, las mismas que no requieren la verificacin de algunos
supuestos como la normalidad y homogeneidad de varianzas, para la realizacin de
pruebas paramtricas.
Los mtodos no paramtricos son una serie de procedimientos que no requieren
supuestos acerca de la distribucin de probabilidad por ello son llamados mtodos de
libre distribucin y son empleados con datos medidos en escala nominal u ordinal,
asi como con datos de intervalo o razn sin suponer distribucin alguna.
Entre las ventajas del uso de los mtodos no paramtricos se tiene:
-

Se emplean cuando se desconoce la distribucin de la poblacin estudiada.

Las hiptesis se formulan sin considerar valores para los parmetros.

Se usa en datos de escala nominal u ordinal.

Se usan cuando las muestras son pequeas (n < 30).

Las desventajas de estos mtodos son:


-

Se vuelven complicadas para muestras grandes.

Se desperdicia informacin usando mtodos no paramtricos si se puede emplear


procedimientos paramtricos.

A continuacin se desarrollan las principales pruebas estadsticas no paramtricas


con sus correspondientes aplicaciones.
355

7.1

USO DE LA DISTRIBUCIN CHI-CUADRADO. TEST DE


INDEPENDENCIA
En muchos estudios surge el inters por determinar si existe alguna relacin de
dependencia entre variables cualitativas, cuyos resultados son presentados en
tablas de contingencia de f filas por c columnas. Las categoras (cualidades,
atributos o modalidades) de las variables se presentan en los mrgenes superior
e izquierdo, en las casillas se presenta las frecuencias observadas para las
distintas combinaciones y los totales en los mrgenes derecho e inferior.
Suponga que se desea determinar si las variables A y B son dependientes. Sean
Ai las categoras de A (i = 1, 2, ., f) y Bj las categoras de B (j = 1, 2, ., c)
las que se muestra en la tabla de contingencia pxq siguiente:
Obs.

B1

Bj

Bc

A1

O11

O1j

O1c

O1.

Ai

Oi1

Oij

Oic

Oi.

Af

Of1

Ofj

Ofc

Of.

O.1

O.j

O.c

.
.

.
.

En la tabla anterior se muestra tambin las frecuencias observadas Oij, los


c

totales de cada fila Oi. = Oij , los totales de cada columna O.j =
j 1

j 1

i 1

total de observaciones para el estudio n O j Oi .


Los pasos a seguir para la prueba de hiptesis son:
1. Hiptesis:

Ho: A y B son variables independientes


H1: A y B son variables dependientes
356

O
i 1

ij

y el

2. Escoger el nivel de significacin:


f

3. Estadstica de prueba: 2

(Oij eij ) 2
eij

i 1 j 1

Donde eij

Oi x O j
n

(2f 1)(c 1)

son las frecuencias esperadas obtenidas con las

frecuencias observadas, suponiendo que Ho es cierta, es decir que A y B son


independientes. Las frecuencias esperadas se muestran en la tabla de
contingencia pxq siguiente:
Esp.

B1

Bj

Bc

A1

e11

e1j

e1c

O1.

Ai

ei1

eij

eic

Oi.

Af

ef1

efj

efc

Of.

O.1

O.j

O.c

.
.

.
.

4. Regin crtica: hallar el valor crtico 12 , ( f 1) (c 1) tal que la probabilidad de


rechazar H0 cuando se supone cierta sea:

P [ 2 12 ,( f 1)(c1) ]

La Regin crtica de la prueba es: R.C. = {X2 > 12 , ( f 1) (c 1) }

12 , ( f 1) (c 1)
357

La regin de aceptacin es: R.A. = {X2 < 12 , ( f 1) (c 1) }


5. Hallar

2
calc

(Oij eij ) 2

i 1 j 1

eij

con las tablas anteriores.

2
R.C. (o si
6. Decisin: se rechaza H0 con riesgo igual a , si calc
2
calc
R. A. ). No se rechaza H0 en caso contrario. Si se rechaza Ho se dice

que la prueba es significativa con riesgo cuyo valor es .


Ejemplo 1
En un estudio realizado con los alumnos de la asignatura de Estadstica Bsica de
la FCE-UNAC, el ao 2012, se usa el ndice de masa corporal (peso/talla2) para
determinar la condicin del peso del alumno (delgado, normal o con sobrepeso) y
ver si existe alguna relacin de dependencia con el sexo (hombre o mujer) del
estudiante.
Los resultados observados obtenidos con el SPSS v21, se muestran en la
siguiente tabla:
Tabla de contingencia CONDICIN DEL PESO * SEXO
Valores Observados
CONDICIN DEL
PESO

SEXO

Total

Hombre

Mujer

Delgado

Normal

33

66

99

Sobrepeso

14

Total

38

82

120

Con el 5% de significacin probar si hay una relacin de dependencia entre la


condicin del peso del alumno y su sexo (gnero).
Solucin
1. H0: La condicin del peso de los estudiantes es independiente del gnero de
este. (NO existe relacin entre la condicin del peso y el gnero del
estudiante).
H1: La condicin del peso de los estudiantes depende del gnero de este
(Existe relacin entre la condicin del peso y el genero del estudiante).

358

2. Nivel de significacin: = 0.05


3

3. Estadstica de prueba:
2

(Oij eij ) 2
eij

i 1 j 1

22

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

X 12 , ( f 1) (c 1) = X 02.95 , 2 = 5.99. Entonces, R.C. = {X2 > 5.99}


Distribution Plot
Chi-Square, df=2

0.5

Density

0.4

0.3

0.2

0.1

0.0

0.05
0

5.99

Valor crtico de chi-cuadrado en Minitab


2
5. Hallar calc
con la tabla de valores observados y la de valores esperados

siguiente:
Tabla de contingencia CONDICIN DEL PESO * SEXO
Valores Esperados
CONDICIN DEL
PESO

SEXO

Total

Hombre

Mujer

Delgado

2.2

4.8

Normal

31.4

67.6

99

Sobrepeso

4.4

9.6

14

Total

38

82

120

Los valores esperados se obtienen con los totales observados as:


Hombre-delgado = 7x38 / 120 = 2.2; Mujer-delgada = 7x82 / 120 = 4.8
Hombre-normal = 99x38 / 120 = 31.4; Mujer-normal = 99x82 / 120 = 67.6
Hombre-sobrep = 14x38 / 120 = 4.4; Mujer-sobrep = 14x82 / 120 = 9.6
359

2
calc

(Oij eij ) 2

i 1 j 1

eij

(0 2.2) 2 (7 4.8) 2 (33 31.4) 2

2.2
4.8
31.4

(66 67.6) 2 (5 4.4) 2 (9 9.6) 2


= 3.45

67.6
4.4
9.6

2
3.45 R. A. , con el 5% de significacin no se rechaza
6. Decisin: como calc

H0, por lo tanto la condicin del peso de los estudiantes es independiente del
gnero de este. (NO existe relacin entre la condicin del peso y el gnero
del estudiante).
Estando definidas las variables sexo y condicin del peso, los resultados en el
programa SPSS se obtienen as:
Analizar Estadsticos descriptivos Tablas de contingencia. En la
ventana de Tablas de contingencia, ingresar en Filas: la variable condicin del
peso y en Columnas: la variable sexo.
En Estadsticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los
resultados son la Tabla de contingencia de valores observados y las Pruebas de
chi-cuadrado siguientes:
Pruebas de chi-cuadrado
Valor

gl

Sig. asinttica
(bilateral)

,176

Razn de verosimilitudes

5,561

,062

Asociacin lineal por

1,724

,189

Chi-cuadrado de Pearson

3,477

lineal
N de casos vlidos

120

a. 3 casillas (50,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 2,22.

Los resultados son similares, pues chi-cuadrado = 3.477, es equivalente al


2
calc
3.45 y como el valor-P = Sig. = 0.176 > = 0.05 no se rechaza Ho y se

concluye tambin que la condicin del peso de los estudiantes es independiente


del gnero, es decir no hay diferencias significativas entre el sexo y el peso de
los alumnos, con el 5% de significacin.
360

De manera similar en el programa Minitab, definir las columnas para la


variables sexo y condicin (del peso). Escoger del men Estadsticas
Tablas Tabulacin cruzada y chi-cuadrada. En Para filas: seleccionar
condicin y en Para columnas: sexo, tal como se aprecia a continuacin:

Con el botn chi-cuadrada escoger Anlisis de chi-cuadrada. Luego


Aceptar, Aceptar y en la ventana de Sesin aprece el resultado siguiente:

Estadsticas tabuladas: Condicin, Sexo


Filas: Condicin

Delgado
Normal
Sobrepeso
Todo

Columnas: Sexo

Hombre

Mujer

Todo

0
33
5
38

7
66
9
82

7
99
14
120

Contenido de la celda:

Conteo

Chi-cuadrada de Pearson = 3.477, GL = 2, Valor P = 0.176


Chi-cuadrada de la tasa de verosimilitud = 5.561, GL =
2, Valor P = 0.062
* NOTA * 3 celdas con conteos esperados menores que 5

Resultados similares a los ya encontrados.


361

7.2 TEST DE BONDAD DE AJUSTE


Esta prueba es utilizada cuando se desea verficar si es razonable que los datos
observados de una variable, siguen una distribucin de probabilidades
determinada con p parmetros.
Los pasos a seguir para la prueba de hiptesis son:
1. Hiptesis:

Ho: Los datos se ajustan a un modelo de probabilidades


H1: Los datos no se ajustan al modelo de probabilidades

2. Escoger el nivel de significacin:

(Oi ei ) 2
3. Estadstica de prueba:
(2k p 1)
ei
i 1
k

Los datos se presentan en una tabla de frecuencias, con k categoras o


intervalos Ai, con sus correspondientes frecuencias observadas Oi y
frecuencias esperadas ei = npi. Las probabilidades pi = P(Ai) se obtienen con
el modelo de probabilidades al que se ajustan los datos. La tabla es:
Ai

Oi

ei

(Oi ei)2 /ei

A1

O1

e1

(O1 e1)2 /e1

A2

O2

e2

(O2 e2)2 /e2

Ak

Ok

ek

(Ok ek)2 /ek

(Oi ei)2 /ei

12 , k p 1
362

4. Regin crtica: hallar el valor crtico 12 , k p 1 tal que la probabilidad de

P [ 2 12 , k p1 ]

rechazar H0 cuando se supone cierta sea:

La regin crtica es: R.C. = {X2 < 12 , k p 1 }


k

2
5. Hallar calc

i 1

(Oi ei ) 2
con la anterior tabla de frecuencias.
ei

2
R.C.
6. Decisin: se rechaza H0 con con el 100 % de significacin, si calc

No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba


es significativa con riesgo cuyo valor es .
Ejemplo 2
Con el fin de estudiar si un dado est o no equilibrado, se arroja el dado 300 veces
en forma independiente, obtenindose los siguientes resultados:
Resultado

Oi

55

42

53

46

47

57

Con el 5% de significacin se puede decir que el dado no esta equilibrado.


Solucin
1. Hiptesis:

Ho: El dado est equilibrado P(i) = 1/6, i = 1, 2, , 6


H1: El dado no est equilibrado P(i) 1/6, i = 1, 2, , 6

2. Nivel de significacin: = 0.05

(Oi ei ) 2
3. Estadstica de prueba:
621
ei
i 1
6

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

12 , k p 1 = X 02.95 , 5 = 11.1. Entonces, R.C. = {X2 > 11.1}


2
5. Hallar calc
con la informacin muestral n = 300 y bajo el supuesto que Ho

es cierta, es decir, pi = 1/6, por lo tanto las frecuencias esperadas son ei =


npi = 300x1/6 = 50. La Tabla de frecuencias observadas y esperadas es:
Resultado

Oi

55

42

53

46

47

57

ei

50

50

50

50

50

50

363

(Oi ei ) 2
(55 50) 2 (42 50) 2 (53 50) 2 (46 50) 2
=
+

ei
50
50
50
50
i 1
6

2
calc

(47 50) 2 (57 50) 2


= 3.44

50
50

2
3.44 R. A. , con el 5% de significacin no se rechaza
6. Decisin: como calc

H0, por lo tanto, se concluye que el dado est equilibrado.


7.3 TEST DE WILCOXON
Es una prueba de RANGOS CON SIGNOS propuesta por Wilcoxon (1945) y se
usa para contrastar una hiptesis referida al valor de la mediana de la poblacin
(Me). Para la verificacin de la hiptesis no se hace ningn supuesto sobre la
distribucin de la poblacin y las observaciones Xi requieren al menos una escala
de intervalo ya que la prueba toma la diferencia entre cada valor muestral y el
valor hipottico de la mediana.
Los pasos a seguir en la prueba son:
1. Hiptesis:

Ho: Me = Me0
H1: Me Me0 o Me < Me0 o Me > Me0

2. Escoger el nivel de significacin:


3. Estadstica de prueba: W = suma de los rangos positivos
4. Regin crtica: buscar los valores crticos en la Tabla 5, de Wilcoxon para n
40 y = 0.05 o 0.01.
5. Determinar la W de Wilcoxon con la informacin muestral y bajo el
supuesto que Ho es cierta, mediante el siguiente procedimiento:
a) Hallar las diferencias di = Xi Me0 con el signo correspondiente. Si
alguna diferencia es cero, la observacin asociada se elimina y el tamao
efectivo de la muestra disminuye.
b) Ranquear las diferencias di en forma ascendente, sin tomar en cuenta el
signo (en valor absoluto). Si dos o ms diferencias son iguales se asume
el rango promedio de esas diferencias empatadas.
c) Asignar los signos de las diferencias di a sus respectivos rangos.
d) Obtener la suma de los rangos para las diferencias positivas y para las
negativas por separado. La suma de los rangos positivos = Wcalc, es el
364

valor calculado del estadstico de prueba y sirve para hallar el valor-P y


compararlo con el nivel de significacin .
e) Si el tamao de muestra es grande el valor-P se obtiene mediante la
aproximacin a la distribucin Normal con:

Z calc
Con W

(W 0.5) W

N (0, 1)

n(n 1)(2n 1)
n(n 1)
y W
24
4

6. Decisin: se rechaza H0 con el 100 % de significacin, si Wcalc R.C. No


se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .
Otra forma de establecer la regla de decisin, es calculando el valor P, a
partir del valor Zcalc, de manera que:
Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]
Para cola a la derecha: P = P[Z > Zcalc]
Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0.
Ejemplo 3
Una muestra de los salarios semanales (S/.) de 15 obreros arroja los siguientes
resultados: 303, 297, 375, 273, 321, 413, 233, 285, 276, 329, 306, 290, 380, 305 y
250. Probar si la mediana de los salarios es diferente de S/. 300. Use = 0.05.
Solucin
1. Hiptesis:

Ho: Me = 300
H1: Me 300

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: W = suma de los rangos positivos
4. Regin crtica: para n = 15 y = 0.05, en la tabla 5, de Wilcoxon la regin
crtica es: R.C. = {W < 25 o W > 95} R.A. = {25 W 95}
5. Determinar la

W de Wilcoxon con la informacin muestral y bajo el

supuesto que Ho es cierta, mediante el siguiente procedimiento:


365

Obreros
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Salarios
(Xi)
303
297
375
273
321
413
233
285
276
329
306
290
380
305
250
Total

Diferencias Rango de
di = Xi 300
|di|
3
1.5
-3
1.5
75
13
-27
9
21
7
113
15
-67
12
-15
6
-24
8
29
10
6
4
-10
5
80
14
5
3
-50
11

Rangos con signo


(+)
(-)
1.5
1.5
13
9
7
15
12
6
8
10
4
5
14
3
11
67.5
52.5

Wcalc = suma de los rangos positivos = 67.5


6. Decisin: como Wcalc = 67.5 R.A., con el 5% de significacin no se rechaza H0
y por lo tanto la mediana de los salarios es de S/. 300.
Para la aproximacin a la distribucin normal, con n = 15 se obtiene:

n(n 1)(2n 1)
15(16)(31)
n(n 1) 15(16)
= 60 y W
= 17.61

4
4
24
24

Z calc

(W 0.5) W

(67.5 0.5) 60
= 0.40. Para dos colas, el valor-P es:
17.61

P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -0.40] = 2(0.3446) = 0.69.
Como el valor-P = 0.69 > = 0.05, con el 5% de significacin no se rechaza H0.
En el programa Minitab, definir la variable salarios con sus datos. Escoger del
men Estadsticas No paramtricos 1W Wilcoxon de 1 muestra. Al abrir
la ventana de dilogo, en Variables: seleccionar Salarios, en Mediana de la
prueba: escribir 300 (mediana hipottica) y en Hiptesis alterna: escoger no es
igual a. Finalmente escoger Aceptar, tal como se aprecia a continuacin:

366

En la ventana de Sesin aprece el resultado siguiente:


Prueba de clasificacin con signos de Wilcoxon: Salarios (Xi)
Prueba de la mediana = 300.0 vs. La mediana no = 300.0

N
15

Salarios (Xi)

Nmero
de
prueba
15

Estadstica
de Wilcoxon
67.5

P
0.691

Mediana
estimada
304.0

Resultados y conclusiones similares a los antes obtenidos: W = 67.5 y P = 0.691.


El Minitab proporciona el intervalo de confianza del 95% para la mediana:
IC de clasificacin con signos de Wilcoxon: Salarios (Xi)

Salarios (Xi)

N
15

Mediana
estimada
304.0

Confianza
lograda
95.0

Intervalo de
confianza
Inferior Superior
281.0
339.0

Como la mediana hipottica cae en el intervalo de confianza, tambin se acepta que


la mediana de los salarios es S/. 300.
7.4 TEST DE SIGNOS
Es una prueba basada en los signos que surgen de la diferencia de comparar los
datos de una poblacin con respecto a su mediana o entre s (en investigacin
de mercados para identificar la preferencia hacia una de dos marcas de un
producto).
367

PRUEBA PARA COMPARAR LOS VALORES CON LA MEDIANA


Los pasos a seguir en la prueba son:
1. Hiptesis:

Ho: Me = Me0
H1: Me Me0 o Me < Me0 o Me > Me0

2. Escoger el nivel de significacin:


3. La estadstica de prueba S = nmero de veces que se repite el signo menos
frecuente. S se basa en la distribucin Binomial con probabilidad de xito ya
que la probabilidad que un valor sea mayor o menor que la mediana es .
4. Regin crtica: buscar el valor crtico en la Tabla 6, de valores crticos para la
prueba del signo S: n 25 y = 0.01 o 0.05. La hiptesis nula se rechaza si S
es menor o igual al valor de la tabla.
5. Determinar S = nmero de veces que se repite el signo menos frecuente, con
la informacin muestral y bajo el supuesto que Ho es cierta, mediante el
siguiente procedimiento:
a) Aplicar un signo ms (+) a cada valor observado en la muestra mayor que
la mediana hipottica Me0 y un signo menos (-) a cada valor menor. Si
algn valor es igual a la mediana hipottica Me0, no se aplica signo
alguno y el tamao efectivo de la muestra disminuye.
b) Hallar Scalc = nmero de veces que se repite el signo menos frecuente, es
el valor calculado del estadstico de prueba y sirve para hallar el valor-P
y compararlo con el nivel de significacin .
c) Si el tamao efectivo de muestra es n > 20 el valor-P se obtiene mediante
la aproximacin Normal de la Binomial S = X = nmero de veces que se
repite el signo menos frecuente con p = q = 0.5.
Si S = X N(0.5n, 0.25n) entonces Z calc

( X 0.5) 0.5n
N (0, 1)
0.5 n

6. Decisin: se rechaza H0 con el 100 % de significacin, si S calc R.C. No se


rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .
Otra forma de establecer la regla de decisin, es calculando el valor P, a
partir del valor Zcalc, de manera que:
368

Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]


Para cola a la derecha: P = P[Z > Zcalc]
Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0.
Ejemplo 4
Para la muestra de los salarios semanales (S/.) de 15 obreros del ejemplo 3,
siguientes: 303, 297, 375, 273, 321, 413, 233, 285, 276, 329, 306, 290, 380, 305 y
250. Probar si la mediana de los salarios es diferente de S/. 300. Use = 0.05.
Solucin
1. Hiptesis:

Ho: Me = 300
H1: Me 300

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: S = nmero de veces que se repite el signo menos
frecuente.
4. Regin crtica: para n = 15 y = 0.05, en la tabla 6 de valores crticos para
la prueba del signo, la regin crtica es: R.C. = {S 3} R.A. = {S > 3}
5. Determinar Scalc con la informacin muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:
Obreros
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Salarios
(Xi)
303
297
375
273
321
413
233
285
276
329
306
290
380
305
250

Signo Diferencia
Xi 300
+
+
+
+
+
+
+
+
369

Scalc = nmero de veces que se repite el signo menos frecuente = 7.


6. Decisin: como Scalc = 7 R.A., con el 5% de significacin no se rechaza H0 y
por lo tanto la mediana de los salarios es de S/. 300.
Para la aproximacin a la distribucin normal de S = X = nmero de veces que
se repite el signo menos frecuente, con n = 15, p = q = 0.5 se obtiene:

Z calc

( X 0.5) 0.5n (7 0.5) 0.5x15


= 0.00

0.5 n
0.5 15

Para dos colas, el valor-P es:


P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < 0.0] = 2(0.5000) = 1.0000.
Como el valor-P = 1.00 > = 0.05, con el 5% de significacin no se rechaza H0.
En el programa Minitab, definir la variable salarios con sus datos. Escoger del
men Estadsticas No paramtricos 1 Seal de 1 muestra.
Al abrir la ventana de dilogo, en Variables: seleccionar Salarios, en Mediana
de la prueba: escribir 300 (mediana hipottica) y en Hiptesis alterna:
escoger no es igual a. Finalmente escoger Aceptar, tal como se aprecia a
continuacin:

En la ventana de Sesin aprece el resultado siguiente:


370

Prueba de signos para mediana: Salarios (Xi)


Prueba del signo de la mediana =
Salarios (Xi)

N
15

Debajo
7

Igual
0

300.0 vs. no = 300.0


Arriba
8

P
1.0000

Mediana
303.0

Resultados y conclusiones similares a los obtenidos: S = Debajo = 7 y P = 1.0000.


El Minitab proporciona tambin el siguiente intervalo de confianza del 95% para la
mediana:
IC de signos: Salarios
Intervalo de confianza del signo para la mediana

Salarios

N
15

Mediana
303.0

Confianza
lograda
0.8815
0.9500
0.9648

Intervalo de
confianza
Inferior Superior
285.0
321.0
279.4
326.0
276.0
329.0

Posicin
5
NLI
4

Como la mediana hipottica cae en el intervalo de confianza, tambin se acepta que


la mediana de los salarios es S/. 300.
PRUEBA PARA COMPARAR LOS VALORES ENTRE SI
En investigacin de mercados sirve para identificar la preferencia hacia una de
dos marcas de un producto (se asigna signo positivo cuando la preferencia es por
la marca de inters y signo negativo en caso contrario), tambin para hacer
comparaciones entre los valores de los grupos A y B (asignando signo positivo
cuando el valor de A es superior al valor de B y signo negativo en caso contrario,
si son iguales se descarta las observaciones y n disminuye).
Probar si las preferencias son iguales para ambas marcas o que el nmero de
signos positivos es igual al nmero de signos negativos es equivalente a probar si
p = 0.50.
Los pasos a seguir en la prueba son:
1. Hiptesis:

Ho: p = 0.50
H1: p 0.50 o p < 0.50 o p > 0.50.

2. Escoger el nivel de significacin:


371

3. La estadstica de prueba S = nmero de veces que se repite el signo menos


frecuente. S se basa en la distribucin Binomial con probabilidad de xito ya
que la probabilidad que se prefiera una u otra marca (o que un valor sea mayor
o menor que otro) es .
4. Regin crtica: buscar el valor crtico en la Tabla 6 para la prueba del signo S. La
hiptesis nula se rechaza si S es menor o igual al valor de la tabla.
5. Determinar S = nmero de veces que se repite el signo menos frecuente, con
la informacin muestral y bajo el supuesto que Ho es cierta, mediante el
siguiente procedimiento:
a) Si se comparan dos marcas de un bien o servicio: aplicar signo positivo
(+) cuando la preferencia es por la marca de inters y signo negativo (-)
en caso contrario.
Si se hace comparaciones entre los valores de los grupos A y B asignar
signo positivo (+) cuando el valor de A es superior al valor de B y signo
negativo (-) en caso contrario.
Si son iguales los valores no se aplica signo alguno, se descarta las
observaciones y el tamao efectivo de la muestra disminuye.
b) Hallar Scalc = nmero de veces que se repite el signo menos frecuente, es
el valor calculado del estadstico de prueba y sirve para hallar el valor-P
y compararlo con el nivel de significacin .
c) Si el tamao efectivo de muestra es n > 20 el valor-P se obtiene mediante
la aproximacin Normal de la Binomial S = X = nmero de veces que se
repite el signo menos frecuente con p = q = 0.5.
Si S = X N(0.5n, 0.25n) entonces Z calc

( X 0.5) 0.5n
N (0, 1)
0.5 n

6. Decisin: se rechaza H0 con el 100 % de significacin, si S calc R.C. por lo


tanto no son iguales las preferencias por ambos productos o los valores
comparados de los grupos A y B no son iguales.
Otra forma de establecer la regla de decisin, es calculando el valor P, a
partir del valor Zcalc, de manera que:
Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]
Para cola a la derecha: P = P[Z > Zcalc]
Para cola a la izquierda: P = P[Z < Zcalc]
372

Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0.


Ejemplo 5
En un estudio para determinar si la marca de frugo B es ms preferida por las amas
de casa que la marca A, se hizo degustar aleatoriamente las marcas A y B a 16 amas
de casa siendo sus preferencias las siguientes: B, B, B, B, A, B, B, B, B, B, B, A, B,
B, A y B. Con el 5% de significacin pruebe si la preferencia de las amas de casa
por la marca de frugo A es inferior a la marca B.
Solucin
1. Hiptesis: si la preferencia de las amas de casa por las marcas de frugo A y
B es la misma es equivalente a postular Ho: p = 0.50 frente a la alternativa
que la preferencia por la marca A es inferior a la marca B, H1: p < 0.50
2. Nivel de significacin: = 0.05
3. Estadstica de prueba: S = nmero de veces que se repite el signo menos
frecuente.
4. Regin crtica: para n = 16 y = 0.05, en la tabla 6 de valores crticos para
la prueba del signo, la regin crtica es: R.C. = {S 3} R.A. = {S > 3}
5. Determinar Scalc con la informacin muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:
Ama de casa

Frugo preferido

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

B
B
B
B
A
B
B
B
B
B
B
A
B
B
A
B
373

Signo
+
+
+
+
+
+
+
+
+
+
+
+
+

Scalc = nmero de veces que se repite el signo menos frecuente = 3.


6. Decisin: como Scalc = 3 R.C., con el 5% de significacin se rechaza H0 y por lo
tanto se acepta que la preferencia por la marca A es inferior a la marca B.
7.5 TEST DE LA MEDIANA
En el acpite 6.5 y 6.6 se trataron las pruebas estadsticas paramtricas Z o T para
la verificacin de la igualdad de medias de dos poblaciones, extrayendo muestras
independientes de dichas poblaciones con varianzas conocidas o desconocidas.
La prueba de la mediana es la contraparte no paramtrica para la verificacin de
la igualdad de medianas de dos poblaciones, extrayendo muestras independientes.
La escala de medida de la variable es cuando menos ordinal.
El procedimiento a seguir en la prueba es el siguiente:
1. Hiptesis:

Ho: Me1 = Me2


H1: Me1 Me2 o Me1 > Me2 o Me1 < Me2

2. Escoger el nivel de significacin:


2

3. Estadstica de prueba:
2

(Oij eij ) 2

i 1 j 1

eij

[21, 1 )

Donde Oij son las frecuencias observadas y eij son las frecuencias esperadas
obtenidas con las frecuencias observadas, suponiendo que Ho es cierta.
4. Regin crtica: hallar el valor crtico [21, 1 ] tal que la probabilidad de
rechazar H0 cuando se supone cierta sea:

P [ 2 [21,1 ] ]

La Regin crtica de la prueba es: R.C. = {X2 > [21, 1 ] }


2
5. Determinar calc
, con la informacin muestral y bajo el supuesto que Ho es

cierta, mediante el siguiente procedimiento:


a) Calcular la mediana comn Me con toda la informacin de las dos muestras.
b) Para cada muestra determinar el nmero de observaciones que son menores
o iguales a la mediana comn y las que son mayores a dicha mediana y las
frecuencias observadas resultantes se colocan en una tabla de
contingencia 2x2 como la siguiente:
374

Muestra
1
2
Total

Me
O11
O21
O.1

Muestra
1
2
Total

Me
e11
e21
O.1
(Oij eij ) 2

> Me
Total
O12
O1.
O22
O2.
O..2
n
Oi x O j
c) Hallar las frecuencias esperadas eij
y colocarlas en la tabla:
n

2

d) Determinar calc

> Me
e12
e22
O..2

Total
O1.
O2.
n

eij

i 1 j 1

2
R.C. No se rechaza
6. Decisin: se rechaza H0 con riesgo igual a si si calc

H0 en caso contrario. Si se rechaza Ho se dice que la prueba es significativa


con riesgo cuyo valor es .
Ejemplo 6
Con la informacin del nmero de unidades vendidas por hombres y mujeres en
la tabla, determinar si la mediana del nmero de unidades vendidas por las
mujeres es mayor que la mediana de las unidades vendidas por los hombres. Usar
el 5% de significacin.
Hombres (1)
39
43
25
31
45
44
26
25
23
24
38
25
20

Mujeres (2)
30
28
32
48
42
35
48
21
40
30
40
45
28

Solucin
1. Hiptesis:

Ho: Me2 = Me1

H1: Me2 > Me1


375

2. Nivel de significacin: = 0.05.


2

3. Estadstica de prueba: 2

(Oij eij ) 2
eij

i 1 j 1

[21, 1 )

4. Regin crtica: el valor crtico es [21, 0.95] = 3.84 y R.C. = {X2 > 3.84}.
2
5. Determinar calc
, con la informacin muestral y bajo el supuesto que Ho es

cierta, de la siguiente manera:


a) Con toda la informacin de las dos muestras se calcula la mediana comn y
resulta Me = 31.5.
b) Para cada muestra se determina el nmero de observaciones que son
menores o iguales (orden 1) a la mediana comn 31.5 y las que son
mayores (orden 2) a dicha mediana:
Unid. Vendidas
39
43
25
31
45
44
26
25
23
24
38
25
20
30
28
32
48
42
35
48
21
40
30
40
45
28
Me = 31.5

Sexo
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
376

Orden
2
2
1
1
2
2
1
1
1
1
2
1
1
1
1
2
2
2
2
2
1
2
1
2
2
1

Las frecuencias observadas resultantes se colocan en una tabla de


contingencia 2x2 como la siguiente:
Muestra
1 = hombres
2 = Mujeres
Total

Me (Ord. 1)
8
5
O.1 = 13

Muestra
1 = hombres
2 = Mujeres
Total

Me (Ord. 1)
6.5
6.5
O.1 = 13
2
2 (O e ) 2
ij
ij

> Me (Ord. 2)
Total
5
O1. = 13
8
O2. = 13
O.2 =13
n = 26
Oi x O j
c) Hallar las frecuencias esperadas eij
y colocarlas en la tabla:
n

2

d) Determinar: calc
i 1 j 1

2
calc

> Me (Ord. 2)
6.5
6.5
O.2 =13

Total
O1. = 13
O2. = 13
n = 26

eij

(8 6.5) 2 (5 6.5) 2 (5 6.5) 2 (8 6.5) 2

= 1.385
6.5
6.5
6.5
6.5

P-valor = P( 12 > 1.385) = 1 - P( 12 1.385) = 1 0.761 = 0.239.


2
6. Decisin: como calc
= 1.38 R.A. y P-valor = 0.239 > = 0.05, no se

rechaza H0 por lo tanto con el 5% de significacin se acepta que la mediana


del nmero de unidades vendidas por las mujeres y los hombres son iguales.

377

En el programa Minitab, definir las variables Unidades vendidas y Sexo con


sus datos. Escoger del men Estadsticas No paramtricos Prueba de
la mediana de Mood. Al abrir la ventana de dilogo, en Respuesta:
seleccionar Unid. vendidas, en Factor: seleccionar Sexo. Finalmente escoger
Aceptar, tal como se aprecia en la ventana de dilogo de la pgina anterior.
En la ventana de Sesin aprece el resultado siguiente:
Prueba de mediana de Mood: Unid. vendidas en funcion de Sexo
Prueba de la mediana de Mood para Unid. vendidas
Chi-cuadrada = 1.38
GL = 1
P = 0.239
ICs de 95.0% individuales
Sexo
1
2

N<=
8
5

N>
5
8

Mediana
26.0
35.0

Q3-Q1
16.5
14.5

-+---------+---------+---------+----(--*----------------------------)
(----------*---------------)
-+---------+---------+---------+----25.0
30.0
35.0
40.0

Mediana general = 31.5


Un IC de 95.0% para la mediana(1) - mediana(2): (-15.8,8.4)

2
Resultados y conclusiones similares a los obtenidos: calc
= 1.38 y P = 0.239. Por

lo tanto con el 5% de significacin se acepta que la mediana del nmero de


unidades vendidas por las mujeres y los hombres son iguales.

378

7.7 PROBLEMAS RESUELTOS


1.

En el estudio realizado con los alumnos de la asignatura de Estadstica Bsica de


la FCE-UNAC, el ao 2012, con el 5% de significacin probar si existe relacin
entre el hobby (pasatiempo) del alumno y su sexo (gnero). Los resultados
observados obtenidos con el SPSS v21, se muestran en la siguiente tabla:
Tabla de contingencia HOBBY * SEXO
Valores Observados
SEXO
HOBBY

Total

Hombre

Mujer

Deportes

18

24

Msica

12

33

45

Baile

10

TV / Cine

27

29

Otros
Total

5
38

7
82

12
120

Solucin
1. H0: El hobby de los estudiantes es independiente del gnero de este. (NO
existe relacin entre el hobby y el gnero del estudiante).
H1: El hobby de los estudiantes depende del gnero de este (Existe relacin
entre el hobby y el genero del estudiante).
2. Nivel de significacin: = 0.05
5

3. Estadstica de prueba:
2

(Oij eij ) 2
eij

i 1 j 1

42

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

X 12 , ( f 1) (c 1) = X 02.95 , 4 = 9.49. Entonces, R.C. = {X2 > 9.49}


2
5. Hallar calc
con la tabla de valores observados y la de valores esperados.

Tabla de contingencia HOBBY * SEXO


Valores Esperados
SEXO
HOBBY

Total

Hombre

Mujer

Deportes

7.6

16.4

24

Msica

14.3

30.8

45

Baile

3.2

6.8

10

TV / Cine

9.2

19.8

29

Otros
Total

3.8
38

8.2
82

12
120

379

Los valores esperados se obtienen con los totales observados as:


Hombre-deportes = 24x38 / 120 = 7.6; Mujer-deportes = 24x82 / 120 = 16.4
Hombre-msica = 45x38 / 120 = 14.3; Mujer-msica = 45x82 / 120 = 30.8
Hombre-baile = 10x38 / 120 = 3.2; Mujer-baile = 10x82 / 120 = 6.8
Hombre-tv/cine= 29x38 / 120 = 9.2; Mujer-tv/cine = 29x82 / 120 = 19.8
Hombre-otros = 12x38 / 120 = 3.8; Mujer-otros = 12x82 / 120 = 8.2
2
Para hallar calc
ordenamos los valores observados y esperados en la tabla:

Hobby-sexo
Deporte-hombre
Msica-hombre
Baile-hombre
Tv/cine-hombre
Otros-hombre
Deporte-mujer
Msica-mujer
Baile-mujer
Tv/cine-mujer
Otros-mujer

Oij

eij

(Oij - eij)2/ eij

18
12
1
2
5
6
33
9
27
7

7.6
14.3
3.2
9.2
3.8
16.4
30.8
6.8
19.8
8.2

14.232
0.355
1.482
5.619
0.379
6.595
0.165
0.687
2.604
0.176

2
calc

2

Luego calc
i 1 j 1

(Oij eij )
eij

32.293

= 32.293

2
6. Decisin: como calc
= 32.293 R.C., con el 5% de significacin se rechaza

H0, por lo tanto el hobby de los estudiantes depende del gnero de este.
(Existe relacin entre el hobby y el gnero del estudiante).
Estando definidas las variables sexo y hobby, los resultados en el programa
SPSS se obtienen as:
Analizar Estadsticos descriptivos Tablas de contingencia. En la
ventana de Tablas de contingencia, ingresar en Filas: la variable hobby y en
Columnas: la variable sexo.
En Estadsticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los
resultados son la Tabla de contingencia de valores observados del enunciado y
las Pruebas de chi-cuadrado siguientes:
380

Pruebas de chi-cuadrado
Valor

gl

Sig. asinttica
(bilateral)

,000

Razn de verosimilitudes

33,297

,000

Asociacin lineal por

12,191

,000

Chi-cuadrado de Pearson

32,293

lineal
N de casos vlidos

120

a. 2 casillas (20,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 3,17.
2
Los resultados son similares, pues calc
= 32.293, y como el valor-P = Sig. =

0.000 < = 0.05 se rechaza Ho y se concluye tambin, con el 5% de


significacin, que el hobby de los estudiantes depende del gnero.
2.

En el estudio realizado con los alumnos de la asignatura de Estadstica Bsica de


la FCE-UNAC, el ao 2012, con el 5% de significacin probar si hay una
relacin de dependencia entre la importancia de sus estudios para el alumno y su
sexo (gnero). Los resultados observados obtenidos con el SPSS v21, se
muestran en la siguiente tabla:
Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO
Valores Observados
SEXO
IMPORTANCIA DE TUS

Total

Hombre

Mujer

Poca

Media

Mucha

21

43

64

Muchsima

15

34

49

Total

38

82

120

ESTUDIOS

Solucin
1. H0: No existe relacin entre la importancia de los estudios y el gnero del
estudiante (son independientes).
H1: Existe relacin entre la importancia de los estudios y el genero del
estudiante.
2. Nivel de significacin: = 0.05
381

3. Estadstica de prueba:
2

(Oij eij ) 2
eij

i 1 j 1

32

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

X 12 , ( f 1) (c 1) = X 02.95 , 3 = 7.81. Entonces, R.C. = {X2 > 7.81}


2
5. Hallar calc
con la tabla de valores observados y la de valores esperados.

Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO


Valores Esperados
SEXO
IMPORTANCIA DE TUS

Total

Hombre

Mujer

Poca

0.3

0.7

Media

1.9

4.1

Mucha

20.3

43.7

64

Muchsima

15.5

35.5

49

38

82

120

ESTUDIOS

Total

Los valores esperados se obtienen con los totales observados as:


Hombre-poca = 1x38 / 120 = 0.3; Mujer-poca = 1x82 / 120 = 0.7
Hombre-media = 6x38 / 120 = 1.9; Mujer-media = 6x82 / 120 = 4.1
Hombre-mucha = 64x38 / 120 = 20.3; Mujer-mucha = 64x82 / 120 = 43.7
Hombre-muchsima = 49x38 / 120 = 15.5; Mujer-muchsima = 49x82 / 120 =
35.5
2
Para hallar calc
ordenamos los valores observados y esperados en la tabla:

Oij

Imp.estudio-sexo
Poca-hombre
Media-hombre
Mucha-hombre
Muchisima-hombre
Poca-mujer
Media-mujer
Mucha-mujer
Muchsima-mujer

eij

0
2
21
15
1
4
43
34

0.3
1.9
20.3
15.5
0.7
4.1
43.7
33.5
2
calc

Luego

2
calc


i 1 j 1

(Oij eij ) 2
eij

= 0.535

382

(Oij - eij)2/ eij


0.317
0.005
0.027
0.017
0.147
0.002
0.012
0.008
0.535

2
6. Decisin: como calc
= 0.535 R.A., con el 5% de significacin no se rechaza

H0, por lo tanto la importancia de los estudios es independiente del gnero del
alumno. (La importancia de los estudios no depende del gnero del alumno).
Estando definidas las variables importancia de los estudios y sexo, los
resultados en el programa SPSS son la Tabla de contingencia de valores
observados del enunciado y las Pruebas de chi-cuadrado siguientes:
Pruebas de chi-cuadrado
Valor

gl

Sig. asinttica
(bilateral)

,911

Razn de verosimilitudes

,833

,842

Asociacin lineal por lineal

,000

,996

Chi-cuadrado de Pearson

N de casos vlidos

,535

120

a. 4 casillas (50,0%) tienen una frecuencia esperada inferior a 5.

Resultados similares a los obtenidos, es decir que la importancia de los


estudios es independiente del gnero del alumno, con el 5% de significacin.
3.

En una encuesta de Mason y Lind (1998) respecto a los ingresos de


representantes industriales que trabajan por su cuenta o son empleados de
empresas pequeas, medianas o grandes, se encontr los siguientes resultados:
Valores Observados
TIPO DE
EMPRESA
Cuenta propia
Pequeas
Medianas
Grandes
Total

< 20
9
12
40
89
150

INGRESOS (miles $)
20 - 40
> 40
11
10
10
13
45
50
104
107
170
180

Total
30
35
135
300
500

Examine la hiptesis de que no existe relacin entre el nivel de ingreso de los


representantes industriales y el nivel de su empleo (trabajando por su cuenta o
empleados en empresas pequeas, medianas o grandes). Realice la prueba al
nivel 0.05.
Solucin
1. H0: No existe relacin entre el nivel de ingreso de los representantes
industriales y el nivel de su empleo (son independientes).
383

H1: Existe relacin entre el nivel de ingreso de los representantes industriales


y el nivel de su empleo.
2. Nivel de significacin: = 0.05
4

3. Estadstica de prueba:
2

(Oij eij ) 2

i 1 j 1

eij

62

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

X 12 , ( f 1) (c 1) = X 02.95 , 6 = 12.6. Entonces, R.C. = {X2 > 12.6}


2
5. Hallar calc
con la tabla de valores observados y la de valores esperados.

Valores Esperados
TIPO DE
EMPRESA
Cuenta propia
Pequeas
Medianas
Grandes
Total

INGRESOS
20 - 40
> 40
10.2
10.8
11.9
12.6
45.9
48.6
102.0
108.0
170
180

< 20
9.0
10.5
40.5
90.0
150

Total
30
35
135
300
500

Los valores esperados se obtienen con los totales observados as:


Cuenta propia: 30x150/500 = 9.0, 30x170/500 = 10.2, 30x180/500 = 10.8
Pequeas: 35x150/500 = 10.5, 35x170/500 = 11.9, 35x180/500 = 12.6
Medianas: 135x150/500 = 40.5, 135x170/500 = 45.9, 135x180/500 =48.6
Grandes: 300x150/500 = 90, 300x170/500 = 102, 300x180/500 = 108
2
Para hallar calc
ordenamos los valores observados y esperados en la tabla:

Tipo emp.-ingresos
C. propia - < 20
Pequea - < 20
Mediana - < 20
Grande - < 20
C. propia - 20 a 40
Pequea - 20 a 40
Mediana - 20 a 40
Grande - 20 a 40
C. propia - > 20
Pequea - > 20
Mediana - > 20
Grande - > 20

Oij

eij

9
12
40
89
11
10
45
104
10
13
50
107

9.0
10.5
40.5
90.0
10.2
11.9
45.9
102.0
10.8
12.6
48.6
108.0
2
calc

384

(Oij - eij)2/ eij


0.000
0.214
0.006
0.011
0.063
0.303
0.018
0.039
0.059
0.013
0.040
0.009
0.776

Luego

2
calc

(Oij eij ) 2

i 1 j 1

eij

= 0.776

2
6. Decisin: como calc
= 0.776 R.A., con el 5% de significacin no se rechaza

H0, por lo tanto el nivel de ingreso de los representantes industriales es


independiente del nivel de su empleo (El nivel de ingreso de los
representantes industriales no depende del tipo de empresa donde labora).
4.

Los datos de partes defectuosas procedente de tres proveedores [Anderson y


Otros (2004)] son los siguientes:
Valores Observados:
CALIDAD DE
PARTES
Buena
Defectos pequeos
Defectos graves
Total

PROVEEDOR
B
C
170
135
18
6
7
9
195
150

A
90
3
7
100

Total
395
27
23
445

Use = 0.05 y demuestre si hay independencia entre proveedor y calidad de las


partes. Qu dice el resultado de su anlisis al departamento de compras?
Solucin
1. H0: No existe relacin entre el proveedor y la calidad de las partes ofrecidas
(son independientes).
H1: Existe relacin entre el proveedor y la calidad de las partes ofrecidas.
2. Nivel de significacin: = 0.05
3

3. Estadstica de prueba:
2

(Oij eij ) 2
eij

i 1 j 1

42

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

X 12 , ( f 1) (c 1) = X 02.95 , 4 = 9.49. Entonces, R.C. = {X2 > 9.49}


2
5. Hallar calc
con la tabla de valores observados y la de valores esperados.

Valores Esperados
CALIDAD DE
PARTES
Buena
Defectos pequeos
Defectos graves
Total

A
88.8
6.1
5.2
100

PROVEEDOR
B
C
173.1
133.1
11.8
9.1
10.1
7.8
195
150
385

Total
395
27
23
445

Los valores esperados se obtienen con los totales observados as:


Buena: 395x100/445 = 88.8, 395x195/445 = 173.1, 395x150/445 = 133.1
Def. pequeos.: 27x100/445 = 6.1, 27x195/445 = 11.8, 27x150/445 = 9.1
Def. graves.: 23x100/445 = 5.2, 23x195/445 = 10.1, 23x150/445 = 7.8
2
Para hallar calc
ordenamos los valores observados y esperados en la tabla:

Oij

Calidad - proveedor
Buena - A
Def. peq. - A
Def. grave - A
Buena - B
Def. peq. - B
Def. grave - B
Buena - C
Def. peq. - C
Def. grave - C

eij

90
3
7
170
18
7
135
6
9

88.8
6.1
5.2
173.1
11.8
10.1
133.1
9.1
7.8
2
calc

Luego

2
calc


i 1 j 1

(Oij eij ) 2

(Oij - eij)2/ eij


0.017
1.551
0.649
0.055
3.216
0.940
0.026
1.057
0.201
7.712

= 7.712

eij

2
6. Decisin: como calc
= 7.712 R.A., con el 5% de significacin no se rechaza

H0, por lo tanto la calidad de las partes ofrecidas es independiente del


proveedor (La calidad de las partes ofrecidas no depende del proveedor). Se
recomienda al departamento de compras
5.

El experimento de lanzar 4 monedas al aire se repite 500 veces, el resultado de


observar el nmero de sellos es el siguiente:
N de sellos (Xi)

Total

Frecuencias (ni = Oi)

25

129

192

118

36

500

Con el 5% de significacin, se ajusta el juego al azar?


Solucin
1. Hiptesis:

Ho: El juego se ajusta al azar X ~ B(4, 0.5)


H1: El juego no se ajusta al azar (X no es binomial)

2. Nivel de significacin: = 0.05


5

3. Estadstica de prueba: 2
i 1

(Oi ei ) 2
521
ei
386

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

12 , k p 1 = X 02.95 , 4 = 9.49. Entonces, R.C. = {X2 > 9.49}


2
5. Hallar calc
con la informacin experimental n = 500 y bajo el supuesto que

Ho es cierta, es decir X ~ B(4, 0.5), luego:


P(0) = 4C0 (0.5)4 = 0.0625
P(1) = 4C1 (0.5)4 = 0.2500
P(2) = 4C2 (0.5)4 = 0.3750
P(3) = 4C3 (0.5)4 = 0.2500
P(4) = 4C4 (0.5)4 = 0.0625
Por lo tanto las frecuencias esperadas son ei = npi = 500 pi. La Tabla de
frecuencias observadas y esperadas es:
N Sellos (Xi)

Oi

25

129

192

118

36

pi

0.0625

0.2500

0.3750

0.2500

0.0625

ei = npi

31.25

125.00

187.50

125.00

31.25

(Oi ei ) 2
(25 31.25) 2 (129 125) 2 (192 187 .5) 2
=

ei
31.25
125
187 .5
i 1
5

2
calc

(118 125) 2 (36 31.25) 2


= 2.6

125
31.25
2
2.6 R. A. , con el 5% de significacin no se rechaza
6. Decisin: como calc

H0, por lo tanto, se concluye que el juego se ajusta al azar.


6.

Los 120 alumnos de la asignatura de Estadstica Bsica de la FCE-UNAC, el ao


2012, opinaron sobre la importancia de su fsico, con los siguientes resultados:
Imp. del fsico
Alumnos (ni = Oi)

Poca

Media

Mucha

Muchsima

Total

19

48

46

120

Con el 5% de significacin probar si existe diferencia significativa entre la


importancia del fsico de los alumnos.
Solucin
1. Hiptesis: Ho: No hay diferencia en la importancia del fsico de los alumnos
H1: Si hay diferencia en la importancia del fsico de los alumnos
2. Nivel de significacin: = 0.05
387

(Oi ei ) 2
3. Estadstica de prueba:
421
ei
i 1
4

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

12 , k p 1 = X 02.95 , 3 = 7.81. Entonces, R.C. = {X2 > 7.81}


2
5. Hallar calc
con la informacin observada de los 120 alumnos y bajo el

supuesto que Ho es cierta (la importancia del fsico es la misma para los
alumnos) es decir, con la misma frecuencia esperada igual a 120/5 = 24. La
Tabla de frecuencias observadas y esperadas es:
Imp. del fsico

Poca

Media

Mucha

Muchsima

Oi

19

48

46

ei

24

24

24

24

(Oi ei ) 2

ei
i 1
4

2
calc

(19 24) 2 (48 24) 2 (46 24) 2 (7 24) 2


=
=

24
24
24
24

2
calc
= 57.25
2
6. Decisin: como calc
= 57.25 R.C., con el 5% de significacin se rechaza

H0, por lo tanto, se concluye que si existe diferencia significativa entre la


importancia del fsico de los alumnos.
7.

Las notas de los 120 alumnos de la asignatura de Estadstica Bsica de la FCEUNAC, el ao 2012, fueron las siguientes:
NOTAS
Xi
ni
7-8
7.5
2
8-9
8.5
6
9 - 10
9.5
7
10 - 11
10.5
21
11 - 12
11.5
33
12 - 13
12.5
22
13 - 14
13.5
19
14 - 15
14.5
7
15 - 16
15.5
3
Probar si las notas se distribuyen normalmente. Use = 0.05.
Solucin
1. Hiptesis: Ho: Las notas de los alumnos se distribuyen normalmente
H1: Las notas de los alumnos no se distribuyen normalmente
388

2. Nivel de significacin: = 0.05


9

3. Estadstica de prueba: 2
i 1

(Oi ei ) 2
92 21
ei

4. Regin crtica: en la Tabla 2 de Chi-cuadrado, hallar el valor crtico

12 , k p 1 = X 02.95 , 6 = 12.6. Entonces, R.C. = {X2 > 12.6}


5. Hallar

2
calc
con la informacin observada de los 120 alumnos.

La nota promedio de los alumnos es:

X n
i

1412
11.77
120

La varianza de las notas es:

2
i

ni n 2

n 1

116950 120(11.77) 2
2.82 = 1.679
120 1

Bajo el supuesto que Ho es cierta, X = notas ~ N(11.77, 2.82), luego:

X 11.77
N (0, 1) permite calcular las probabilidades pi para los 9
1.679

intervalos considerados as:


P(X 8) = P(Z -2.25) = (-2.25) = 0.01222
P(8 X < 9) = P(-2.25 Z < -1.65) = (-1.65) (-2.25) =
= 0.04947 - 0.01222 = 0.03725.
P(9 X < 10) = P(-1.65 Z < -1.05) = (-1.05) (-1.65) =
= 0.14686 - 0.04947 = 0.09739.
P(10 X < 11) = P(-1.05 Z < -0.46) = (-0.46) (-1.05) =
= 0.32276 - 0.14686 = 0.17590.
P(11 X < 12) = P(-0.46 Z < 0.14) = (0.14) (-0.46) =
= 0.55567 - 0.32276 = 0.23291.
P(12 X < 13) = P(0.14 Z < 0.73) = (0.73) (0.14) =
= 0.76730 - 0.55567 = 0.21163.
P(13 X < 14) = P(0.73 Z < 1.33) = (1.33) (0.73) =
= 0.90824 - 0.76730 = 0.14094.
P(14 X < 15) = P(1.33 Z < 1.92) = (1.92) (1.33) =
= 0.97257 - 0.90824 = 0.06433.
P(X 15) = P(Z 1.92) = 1 (1.92) = 1 - 0.97257 = 0.02743.

389

Las probabilidades pi y las frecuencias esperadas ei = n pi = 120 pi se


presentan en la siguiente tabla:
NOTAS
7-8
8-9
9 - 10
10 - 11
11 - 12
12 - 13
13 - 14
14 - 15
15 - 16
Total

Xi
7.5
8.5
9.5
10.5
11.5
12.5
13.5
14.5
15.5

ni = O i
2
6
7
21
33
22
19
7
3
120

pi
0.01222
0.03725
0.09739
0.17590
0.23291
0.21163
0.14094
0.06433
0.02743
1.00000

ei = npi
1.5
4.5
11.7
21.1
27.9
25.4
16.9
7.7
3.3
120.0

(Oi - ei)2/ei
0.1942
0.5237
1.8796
0.0006
0.9127
0.4540
0.2576
0.0671
0.0258
4.3152

En la ltima columna se tiene:


9

2
calc

i 1

(Oi ei ) 2
= 4.32
ei

2
6. Decisin: como calc
= 4.32 R.A., con el 5% de significacin no se rechaza

H0, por lo tanto, se concluye que las notas de los alumnos se distribuyen
normalmente.
8.

Una muestra de los gastos de estudio mensual (S/.) de 16 alumnos arroja los
siguientes resultados: 120, 210, 100, 150, 120, 200, 200, 180, 250, 300, 250,
140, 300, 200, 160 y 300. Probar si la mediana de los gastos de estudio es
diferente de S/. 220. Use = 0.05.
Solucin
1. Hiptesis:

Ho: Me = 220
H1: Me 220

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: W = suma de los rangos positivos
4. Regin crtica: para n = 16 y = 0.05, en la tabla 5, de Wilcoxon la regin
crtica es: R.C. = {W < 29 o W > 107} R.A. = {29 W 107}
5. Determinar la W de Wilcoxon con la informacin muestral y bajo el supuesto
que Ho es cierta, tal como se aprecia en la tabla de la pgina siguiente.
Wcalc = suma de los rangos positivos = 45.5

390

Gastos
(Xi)

Alumnos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

120
210
100
150
120
200
200
180
250
300
250
140
300
200
160
300
Total

Diferencia
Rango de
di = Xi |di|
220
-100
14.5
-10
1
-120
16
-70
9
-100
14.5
-20
3
-20
3
-40
7
30
5.5
80
11.5
30
5.5
-80
11.5
80
11.5
-20
3
-60
8
80
11.5

Rangos con signo


(+)

(-)
14.5
1
16
9
14.5
3
3
7

5.5
11.5
5.5
11.5
11.5
3
8
11.5
45.5

90.5

6. Decisin: como Wcalc = 45.5 R.A., con el 5% de significacin no se rechaza


H0 y por lo tanto la mediana de los gastos de estudio es de S/. 220.
9.

En el problema 8, use la prueba de los signos para probar si la mediana de los


gastos de estudio es diferente de S/. 220. Use = 0.05.
Solucin
1. Hiptesis:

Ho: Me = 220
H1: Me 220

2. Nivel de significacin: = 0.05


3. Estadstica de prueba: S = nmero de veces que se repite el signo menos
frecuente.
4. Regin crtica: para n = 16 y = 0.05, en la tabla 6 de valores crticos para
la prueba del signo, la regin crtica es: R.C. = {S 3} R.A. = {S > 3}
5. Determinar Scalc con la informacin muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:

391

Signo Diferencia
di = Xi - 220
1
120
2
210
3
100
4
150
5
120
6
200
7
200
8
180
9
250
+
10
300
+
11
250
+
12
140
13
300
+
14
200
15
160
16
300
+
Scalc = nmero de veces que se repite el signo menos frecuente = 5.
Alumnos

Gastos (Xi)

6. Decisin: como Scalc = 5 R.A., con el 5% de significacin no se rechaza H0 y


por lo tanto la mediana de los salarios es de S/. 220.
10. Con la informacin del peso de los hombres y mujeres en la tabla, determinar si
la mediana del peso de los hombres es mayor que la mediana del peso de las
mujeres. Usar el 5% de significacin.
Hombres (1)
68
55
70
73
58
59
74
65
66
69

Mujeres (2)
54
42
54
51
43
64
56
47
52
65

Solucin
1. Hiptesis:

Ho: Me1 = Me2

H1: Me1 > Me2

2. Nivel de significacin: = 0.05.

392

3. Estadstica de prueba:
2

(Oij eij ) 2

i 1 j 1

eij

[21, 1 )

4. Regin crtica: el valor crtico es [21, 0.95] = 3.84 y R.C. = {X2 > 3.84}.
2
5. Determinar calc
, con la informacin muestral y bajo el supuesto que Ho es

cierta, de la siguiente manera:


a) Con toda la informacin de las dos muestras se calcula la mediana comn y
resulta Me = 58.5.
b) Para cada muestra se determina el nmero de observaciones que son
menores o iguales (orden 1) a la mediana comn 58.5 y las que son
mayores (orden 2) a dicha mediana:
Peso
Sexo
Orden
68
1
2
55
1
1
70
1
2
73
1
2
58
1
1
59
1
2
74
1
2
65
1
2
66
1
2
69
1
2
54
2
1
42
2
1
54
2
1
51
2
1
43
2
1
64
2
2
56
2
1
47
2
1
52
2
1
65
2
2
Me = 58.5
Las frecuencias observadas resultantes se colocan en una tabla de
contingencia 2x2 como la siguiente:
Muestra
1 = hombres
2 = Mujeres
Total

Me (Ord. 1)
2
8
O.1 = 10
393

> Me (Ord. 2)
8
2
O.2 =10

Total
O1. = 10
O2. = 10
n = 20

c) Hallar las frecuencias esperadas eij


Muestra
1 = hombres
2 = Mujeres
Total

Me (Ord. 1)
5
5
O.1 = 10
2
2 (O e ) 2
ij
ij

2

d) Determinar: calc

y colocarlas en la tabla:

> Me (Ord. 2)
5
5
O.2 =10

Total
O1. = 10
O2. = 10
n = 20

eij

i 1 j 1

2
calc

Oi x O j

(2 5) 2 (8 5) 2 (8 5) 2 (2 5) 2

= 7.20
5
5
5
5

P-valor = P( 12 > 7.20) = 1 - P( 12 7.20) = 1 0.993 = 0.007.


2
6. Decisin: como calc
= 7.20 R.C. y P-valor = 0.007 < = 0.05, se rechaza

H0 y se acepta H1, por lo tanto con el 5% de significacin se aceta que la


mediana del peso de los hombres es mayor que la mediana del peso de las
mujeres.
Los resultados en el Minitab para la prueba de medianas es el siguiente:

Prueba de mediana de Mood: Peso en funcion de Sexo


Prueba de la mediana de Mood para Peso
Chi-cuadrada = 7.20
GL = 1
P = 0.007
ICs de 95.0% individuales
Sexo
1
2

N<=
2
8

N>
8
2

Mediana
67.0
53.0

Q3-Q1
12.0
12.0

-----+---------+---------+---------+(-----------*----)
(----------*-------)
-----+---------+---------+---------+49.0
56.0
63.0
70.0

Mediana general = 58.5


Un IC de 95.0% para la mediana(1) - mediana(2): (3.0,23.0)

394

7.8 PROBLEMAS PROPUESTOS


1.

En el estudio realizado con los alumnos de la asignatura de Estadstica Bsica de


la FCE-UNAC, el ao 2012, con el 5% de significacin probar si existe relacin
entre la importancia del aspecto fsico del alumno y su sexo (gnero). Los
resultados observados obtenidos, se muestran en la siguiente tabla:
Tabla de contingencia IMPORTANCIA DE TU FSICO * SEXO
IMPORTANCIA DE
TU FSICO

2.

SEXO

Total

Hombre

Mujer

Poca

12

19

Media

14

34

48

Mucha

10

36

46

Muchsima

Total

38

82

120

En el estudio realizado con los alumnos de la asignatura de Estadstica Bsica de


la FCE-UNAC, el ao 2012, con el 5% de significacin probar si hay una
relacin de dependencia entre la especializacin profesional del alumno de
economa y su sexo (gnero). Los resultados observados obtenidos con el SPSS
v21, se muestran en la siguiente tabla:
Tabla de contingencia ESPECIALIZACIN * SEXO
SEXO

3.

Total

ESPECIALIZACIN

Hombre

Mujer

Teora Econmica

10

18

Gestin Empresarial

30

72

102

Total

38

82

120

Para determinar si el sexo (gnero) de las personas adultas es determinante para


que estas consuman licor, se realiza una encuesta a 500 adultos, obtenindose los
siguientes resultados:
Consume licor
S
No
Total

Hombre
195
65
260

Mujer
40
200
240

Total
235
265
500

Use = 0.05 y demuestre si el gnero de las personas adultas es


determinante para que consuman licor.
395

4.

Probar con el 5% de significacin si el resultado de la evaluacin semestral


(aprobado o desaprobado) en la asignatura de estadstica bsica depende del
profesor, con los resultados del semestre 2012-A en la Facultad de Ciencias
Econmicas de la UNAC siguientes:
Profesor
P1
P2
P3
Total

5.

Aprobados Desaprobados
33
17
49
11
15
37
97
65

Total
50
60
52
162

Se lanzan 2 dado 500 veces, el resultado de observar la suma del nmero de


puntos en los 2 dados es la siguiente:
Suma (Xi)
2
3
4
5
6
7
8
9
10
11
12

Frecuencia (Oi)
6
20
45
42
72
98
75
44
48
35
15

Con el 5% de significacin, se ajusta el juego al azar?


6.

Los pesos de los 120 alumnos de la asignatura de Estadstica Bsica de la FCEUNAC, el ao 2012, fueron las siguientes:
PESO (Kg)
Menos 45
45 - 50
50 - 55
55 -60
60 - 65
65 - 70
70 - 75
75 - 80
80 a ms

ni = Oi
2
18
20
25
31
9
7
4
4

Con el 5% de significacin, probar si los pesos se distribuyen normalmente.


7.

Una encuesta de opinin a 300 clientes de un supermercado, sobre la calidad del


servicio, arroja los siguientes resultados:
396

Calidad servicio

Excelente

Bueno

Regular

Malo

Psimo

Frecuencias (Oi)

72

67

52

56

53

Con el 5% de significacin probar si existe diferencia significativa entre la


opinin de los clientes sobre la calidad del servicio en el supermercado.
8.

Una muestra de los ingresos familiares (S/.) de 20 empleados arroja los


siguientes resultados: 1300, 700, 700, 2500, 1500, 1200, 1500, 1500, 1500,
1000, 1400, 1800, 1500, 1000, 1500, 700, 700, 1000, 1840 y 2000. Probar si la
mediana de los ingresos es diferente de S/. 1400 con la prueba de Wilcoxon y de
los signos. Use = 0.05.

9.

Los pesos de 15 personas arroja los siguientes resultados: 59, 50, 44, 42, 54, 71,
73, 58, 51, 75, 59, 74, 90, 65 y 43. Probar si la mediana de los pesos es diferente
de 65 kilos con la prueba de Wilcoxon y de los signos. Use = 0.05.

10. Los precios (S/.) del kilo de carne pagado por 12 amas de casa arroja los
siguientes resultados: 12.50, 12.00, 11.80, 13.20, 12.80, 11.50, 13.50, 12.40,
11.00, 14.00, 11.30 y 13.30. Probar si la mediana de los precios es diferente de
S/. 12.10 con la prueba de Wilcoxon y de los signos. Use = 0.05.
11. Con la informacin de la talla de los hombres y mujeres en la tabla, determinar
si la mediana de la talla de los hombres es mayor que la mediana de la talla de
las mujeres. Usar el 5% de significacin.
Hombres (1)
171
167
160
165
168
176
174
169
168
176

Mujeres (2)
152
150
152
165
158
150
155
158
165
149

397

REFERENCIAS BIBLIOGRFICAS
1.

Anderson, D. y Otros (2004). Estadstica para Administracin y Economa.


Editorial Thomson. Octava edicin. Mxico.

2.

Berenson & Levin (1992). "Estadstica para Administracin y Economa".


Prentice Hall Hispanoamericana S.A., Mxico.

3.

Bazn, J. y Corbera, J. (1997).

Problemas de probabilidad. Universidad

Nacional del Callao: Trabajo de investigacin para la Facultad de Ciencias


Econmicas. Callao.
4.

Canovas, George (1995). Probabilidad y Estadstica: Aplicaciones y mtodos.


Mc Graw Hill, Mxico.

5.

Chu, J. y Otros (2007). Estadstica descriptiva y probabilidades. Lima, Per.


Fondo Editorial Universidad de Lima.

6.

Lpez de la Manzanara (1977). "Problemas de Estadstica". Editorial Pirmide


S.A., Madrid.

7.

Moya y Saravia (1988). "Probabilidad e Inferencia Estadstica". Editorial San


Marcos, Lima.

8.

Hoog & Craig (1981). "Introduction to Mathematical Statistics". Mc Graw Hill,


Mxico.

9.

Kohler, Heinz (1996). Estadstica para Negocios y Economa. Compaa


Editorial Continental S.A., Mxico.

10. Levin R. & Rubin D. (1996). "Estadstica para Administradores". PrenticeHall


Hispanoamericana S.A. Sexta edicin, Mxico.
11. Levin R. & Rubin D. (2004). Estadstica para Administracin y Economa.
Editorial Pearson Prentice-Hall. Sptima edicin, Mxico.
12. Mason, R. y Lind, D. (1998). Estadstica para Administracin y Economa.
Editorial Alfaomega. Octava edicin. Mxico.
13. Martnez, Ciro (2005). Estadstica y Muestreo. Ecoe Ediciones. Dcimo
segunda edicin. Bogota, Colombia.
14. Meendenhall, William (1990). "Estadstica para Administradores". Grupo
Editorial Iberoamrica S.A., Mxico.
15. Ministerio de Educacin (2000). Nutricin y Retardo en el Crecimiento.
Resultados del II Censo Nacional de Talla en Escolares 1999. Lima.
398

16. Ministerio de Salud (2011). Informe del estado nutricional en el Per.


Componente nutricional ENAHO-CENAN Julio 2009 Junio 2010, CENAN
INEI. Lima, Per, 2011.
17. Mood & Graybill (1978). "Introduccin a la Teora Estadstica". Editorial
Aguilar. Madrid, Espaa.
18. Prez, Csar (2002). Estadstica aplicada a travs de Excel. Editorial PearsonPrentice Hall. Madrid, Espaa.
19. Spiegel, Murray (1991). "Estadstica". Coleccin Schaum. Mc Graw-Hill,
Mxico.
20. Toma, J. y Rubio, J. (2008). Estadstica aplicada. Segunda parte. Universidad
del Pacfico: Apuntes de estudio 69. Lima.
21. Webster, Allen. (2000). Estadstica aplicada a los negocios y la economa.
Editorial McGraw-Hill. Tercera edicin. Bogota, Colombia.

REFERENCIAS WEB
22. Acua, Edgar (2012). Pruebas no paramtricas. Universidad de Puerto Rico.
http://www.google.com.pe/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&c
d=6&sqi=2&ved=0CEoQFjAF&url=http%3A%2F%2Facademic.uprm.edu%2Fe
acuna%2Fminiman11sl.pdf&ei=e7dpUov5Foj28wTn8oCYAQ&usg=AFQjCNE
-MH9RWOglMaHg479MiFrk0l_FJA
23. Bazn, Juan (2011). Texto de estadstica computacional con R, Excel, Minitab
y SPSS (PDF). Universidad Nacional del Callao: Trabajo de investigacin para
la Facultad de Ciencias Econmicas. Callao.
http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_
Investigacion/Enero_2011/BAZAN_BACA_FCE/Estad%EDstica%20computaci
onal.pdf
24. http://es.wikipedia.org/wiki/William_Sealy_Gosset; revisado en agosto de 2012.
25. http://buscon.rae.es/drae/ Real Academia Espaola Todos los derechos
reservados. Vigsima segunda edicin (2001).

399

APNDICE

400

TABLA 1. DISTRIBUCIN ACUMULATIVA NORMAL ESTNDAR


z

F(z) = (z) = P [Z ? z] =

1 t 2 / 2
e dt
2

z
-3.59
-3.58
-3.57
-3.56
-3.55
-3.54
-3.53
-3.52
-3.51
-3.50

F(z)
0.00017
0.00017
0.00018
0.00019
0.00019
0.00020
0.00021
0.00022
0.00022
0.00023

z
-2.99
-2.98
-2.97
-2.96
-2.95
-2.94
-2.93
-2.92
-2.91
-2.90

F(z)
0.00139
0.00144
0.00149
0.00154
0.00159
0.00164
0.00169
0.00175
0.00181
0.00187

z
-2.39
-2.38
-2.37
-2.36
-2.35
-2.34
-2.33
-2.32
-2.31
-2.30

F(z)
0.00842
0.00866
0.00889
0.00914
0.00939
0.00964
0.00990
0.01017
0.01044
0.01072

z
-1.79
-1.78
-1.77
-1.76
-1.75
-1.74
-1.73
-1.72
-1.71
-1.70

F(z)
0.03673
0.03754
0.03836
0.03920
0.04006
0.04093
0.04182
0.04272
0.04363
0.04457

z
-1.19
-1.18
-1.17
-1.16
-1.15
-1.14
-1.13
-1.12
-1.11
-1.10

F(z)
0.11702
0.11900
0.12100
0.12302
0.12507
0.12714
0.12924
0.13136
0.13350
0.13567

z
-0.59
-0.58
-0.57
-0.56
-0.55
-0.54
-0.53
-0.52
-0.51
-0.50

F(z)
0.27760
0.28096
0.28434
0.28774
0.29116
0.29460
0.29806
0.30153
0.30503
0.30854

-3.49
-3.48
-3.47
-3.46
-3.45
-3.44
-3.43
-3.42
-3.41
-3.40

0.00024
0.00025
0.00026
0.00027
0.00028
0.00029
0.00030
0.00031
0.00032
0.00034

-2.89
-2.88
-2.87
-2.86
-2.85
-2.84
-2.83
-2.82
-2.81
-2.80

0.00193
0.00199
0.00205
0.00212
0.00219
0.00226
0.00233
0.00240
0.00248
0.00256

-2.29
-2.28
-2.27
-2.26
-2.25
-2.24
-2.23
-2.22
-2.21
-2.20

0.01101
0.01130
0.01160
0.01191
0.01222
0.01255
0.01287
0.01321
0.01355
0.01390

-1.69
-1.68
-1.67
-1.66
-1.65
-1.64
-1.63
-1.62
-1.61
-1.60

0.04551
0.04648
0.04746
0.04846
0.04947
0.05050
0.05155
0.05262
0.05370
0.05480

-1.09
-1.08
-1.07
-1.06
-1.05
-1.04
-1.03
-1.02
-1.01
-1.00

0.13786
0.14007
0.14231
0.14457
0.14686
0.14917
0.15151
0.15386
0.15625
0.15866

-0.49
-0.48
-0.47
-0.46
-0.45
-0.44
-0.43
-0.42
-0.41
-0.40

0.31207
0.31561
0.31918
0.32276
0.32636
0.32997
0.33360
0.33724
0.34090
0.34458

-3.39
-3.38
-3.37
-3.36
-3.35
-3.34
-3.33
-3.32
-3.31
-3.30

0.00035
0.00036
0.00038
0.00039
0.00040
0.00042
0.00043
0.00045
0.00047
0.00048

-2.79
-2.78
-2.77
-2.76
-2.75
-2.74
-2.73
-2.72
-2.71
-2.70

0.00264
0.00272
0.00280
0.00289
0.00298
0.00307
0.00317
0.00326
0.00336
0.00347

-2.19
-2.18
-2.17
-2.16
-2.15
-2.14
-2.13
-2.12
-2.11
-2.10

0.01426
0.01463
0.01500
0.01539
0.01578
0.01618
0.01659
0.01700
0.01743
0.01786

-1.59
-1.58
-1.57
-1.56
-1.55
-1.54
-1.53
-1.52
-1.51
-1.50

0.05592
0.05705
0.05821
0.05938
0.06057
0.06178
0.06301
0.06426
0.06552
0.06681

-0.99
-0.98
-0.97
-0.96
-0.95
-0.94
-0.93
-0.92
-0.91
-0.90

0.16109
0.16354
0.16602
0.16853
0.17106
0.17361
0.17619
0.17879
0.18141
0.18406

-0.39
-0.38
-0.37
-0.36
-0.35
-0.34
-0.33
-0.32
-0.31
-0.30

0.34827
0.35197
0.35569
0.35942
0.36317
0.36693
0.37070
0.37448
0.37828
0.38209

-3.29
-3.28
-3.27
-3.26
-3.25
-3.24
-3.23
-3.22
-3.21
-3.20

0.00050
0.00052
0.00054
0.00056
0.00058
0.00060
0.00062
0.00064
0.00066
0.00069

-2.69
-2.68
-2.67
-2.66
-2.65
-2.64
-2.63
-2.62
-2.61
-2.60

0.00357
0.00368
0.00379
0.00391
0.00402
0.00415
0.00427
0.00440
0.00453
0.00466

-2.09
-2.08
-2.07
-2.06
-2.05
-2.04
-2.03
-2.02
-2.01
-2.00

0.01831
0.01876
0.01923
0.01970
0.02018
0.02068
0.02118
0.02169
0.02222
0.02275

-1.49
-1.48
-1.47
-1.46
-1.45
-1.44
-1.43
-1.42
-1.41
-1.40

0.06811
0.06944
0.07078
0.07215
0.07353
0.07493
0.07636
0.07780
0.07927
0.08076

-0.89
-0.88
-0.87
-0.86
-0.85
-0.84
-0.83
-0.82
-0.81
-0.80

0.18673
0.18943
0.19215
0.19489
0.19766
0.20045
0.20327
0.20611
0.20897
0.21186

-0.29
-0.28
-0.27
-0.26
-0.25
-0.24
-0.23
-0.22
-0.21
-0.20

0.38591
0.38974
0.39358
0.39743
0.40129
0.40517
0.40905
0.41294
0.41683
0.42074

-3.19
-3.18
-3.17
-3.16
-3.15
-3.14
-3.13
-3.12
-3.11
-3.10

0.00071
0.00074
0.00076
0.00079
0.00082
0.00084
0.00087
0.00090
0.00094
0.00097

-2.59
-2.58
-2.57
-2.56
-2.55
-2.54
-2.53
-2.52
-2.51
-2.50

0.00480
0.00494
0.00508
0.00523
0.00539
0.00554
0.00570
0.00587
0.00604
0.00621

-1.99
-1.98
-1.97
-1.96
-1.95
-1.94
-1.93
-1.92
-1.91
-1.90

0.02330
0.02385
0.02442
0.02500
0.02559
0.02619
0.02680
0.02743
0.02807
0.02872

-1.39
-1.38
-1.37
-1.36
-1.35
-1.34
-1.33
-1.32
-1.31
-1.30

0.08226
0.08379
0.08534
0.08692
0.08851
0.09012
0.09176
0.09342
0.09510
0.09680

-0.79
-0.78
-0.77
-0.76
-0.75
-0.74
-0.73
-0.72
-0.71
-0.70

0.21476
0.21770
0.22065
0.22363
0.22663
0.22965
0.23270
0.23576
0.23885
0.24196

-0.19
-0.18
-0.17
-0.16
-0.15
-0.14
-0.13
-0.12
-0.11
-0.10

0.42465
0.42858
0.43251
0.43644
0.44038
0.44433
0.44828
0.45224
0.45620
0.46017

-3.09
-3.08
-3.07
-3.06
-3.05
-3.04
-3.03
-3.02
-3.01
-3.00

0.00100
0.00104
0.00107
0.00111
0.00114
0.00118
0.00122
0.00126
0.00131
0.00135

-2.49
-2.48
-2.47
-2.46
-2.45
-2.44
-2.43
-2.42
-2.41
-2.40

0.00639
0.00657
0.00676
0.00695
0.00714
0.00734
0.00755
0.00776
0.00798
0.00820

-1.89
-1.88
-1.87
-1.86
-1.85
-1.84
-1.83
-1.82
-1.81
-1.80

0.02938
0.03005
0.03074
0.03144
0.03216
0.03288
0.03362
0.03438
0.03515
0.03593

-1.29
-1.28
-1.27
-1.26
-1.25
-1.24
-1.23
-1.22
-1.21
-1.20

0.09853
0.10027
0.10204
0.10383
0.10565
0.10749
0.10935
0.11123
0.11314
0.11507

-0.69
-0.68
-0.67
-0.66
-0.65
-0.64
-0.63
-0.62
-0.61
-0.60

0.24510
0.24825
0.25143
0.25463
0.25785
0.26109
0.26435
0.26763
0.27093
0.27425

-0.09
-0.08
-0.07
-0.06
-0.05
-0.04
-0.03
-0.02
-0.01
0.00

0.46414
0.46812
0.47210
0.47608
0.48006
0.48405
0.48803
0.49202
0.49601
0.50000

401

TABLA 1. DISTRIBUCIN ACUMULATIVA NORMAL ESTNDAR


z

F(z) = (z) = P [Z ? z] =

1 t 2 / 2
e
dt
2

continuacin

z
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10

F(z)
0.50399
0.50798
0.51197
0.51595
0.51994
0.52392
0.52790
0.53188
0.53586
0.53983

z
0.61
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69
0.70

F(z)
0.72907
0.73237
0.73565
0.73891
0.74215
0.74537
0.74857
0.75175
0.75490
0.75804

z
1.21
1.22
1.23
1.24
1.25
1.26
1.27
1.28
1.29
1.30

F(z)
0.88686
0.88877
0.89065
0.89251
0.89435
0.89617
0.89796
0.89973
0.90147
0.90320

z
1.81
1.82
1.83
1.84
1.85
1.86
1.87
1.88
1.89
1.90

F(z)
0.96485
0.96562
0.96638
0.96712
0.96784
0.96856
0.96926
0.96995
0.97062
0.97128

z
2.41
2.42
2.43
2.44
2.45
2.46
2.47
2.48
2.49
2.50

F(z)
0.99202
0.99224
0.99245
0.99266
0.99286
0.99305
0.99324
0.99343
0.99361
0.99379

z
3.01
3.02
3.03
3.04
3.05
3.06
3.07
3.08
3.09
3.10

F(z)
0.99869
0.99874
0.99878
0.99882
0.99886
0.99889
0.99893
0.99896
0.99900
0.99903

0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.20

0.54380
0.54776
0.55172
0.55567
0.55962
0.56356
0.56749
0.57142
0.57535
0.57926

0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80

0.76115
0.76424
0.76730
0.77035
0.77337
0.77637
0.77935
0.78230
0.78524
0.78814

1.31
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.39
1.40

0.90490
0.90658
0.90824
0.90988
0.91149
0.91308
0.91466
0.91621
0.91774
0.91924

1.91
1.92
1.93
1.94
1.95
1.96
1.97
1.98
1.99
2.00

0.97193
0.97257
0.97320
0.97381
0.97441
0.97500
0.97558
0.97615
0.97670
0.97725

2.51
2.52
2.53
2.54
2.55
2.56
2.57
2.58
2.59
2.60

0.99396
0.99413
0.99430
0.99446
0.99461
0.99477
0.99492
0.99506
0.99520
0.99534

3.11
3.12
3.13
3.14
3.15
3.16
3.17
3.18
3.19
3.20

0.99906
0.99910
0.99913
0.99916
0.99918
0.99921
0.99924
0.99926
0.99929
0.99931

0.21
0.22
0.23
0.24
0.25
0.26
0.27
0.28
0.29
0.30

0.58317
0.58706
0.59095
0.59483
0.59871
0.60257
0.60642
0.61026
0.61409
0.61791

0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90

0.79103
0.79389
0.79673
0.79955
0.80234
0.80511
0.80785
0.81057
0.81327
0.81594

1.41
1.42
1.43
1.44
1.45
1.46
1.47
1.48
1.49
1.50

0.92073
0.92220
0.92364
0.92507
0.92647
0.92785
0.92922
0.93056
0.93189
0.93319

2.01
2.02
2.03
2.04
2.05
2.06
2.07
2.08
2.09
2.10

0.97778
0.97831
0.97882
0.97932
0.97982
0.98030
0.98077
0.98124
0.98169
0.98214

2.61
2.62
2.63
2.64
2.65
2.66
2.67
2.68
2.69
2.70

0.99547
0.99560
0.99573
0.99585
0.99598
0.99609
0.99621
0.99632
0.99643
0.99653

3.21
3.22
3.23
3.24
3.25
3.26
3.27
3.28
3.29
3.30

0.99934
0.99936
0.99938
0.99940
0.99942
0.99944
0.99946
0.99948
0.99950
0.99952

0.31
0.32
0.33
0.34
0.35
0.36
0.37
0.38
0.39
0.40

0.62172
0.62552
0.62930
0.63307
0.63683
0.64058
0.64431
0.64803
0.65173
0.65542

0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1.00

0.81859
0.82121
0.82381
0.82639
0.82894
0.83147
0.83398
0.83646
0.83891
0.84134

1.51
1.52
1.53
1.54
1.55
1.56
1.57
1.58
1.59
1.60

0.93448
0.93574
0.93699
0.93822
0.93943
0.94062
0.94179
0.94295
0.94408
0.94520

2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20

0.98257
0.98300
0.98341
0.98382
0.98422
0.98461
0.98500
0.98537
0.98574
0.98610

2.71
2.72
2.73
2.74
2.75
2.76
2.77
2.78
2.79
2.80

0.99664
0.99674
0.99683
0.99693
0.99702
0.99711
0.99720
0.99728
0.99736
0.99744

3.31
3.32
3.33
3.34
3.35
3.36
3.37
3.38
3.39
3.40

0.99953
0.99955
0.99957
0.99958
0.99960
0.99961
0.99962
0.99964
0.99965
0.99966

0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49
0.50

0.65910
0.66276
0.66640
0.67003
0.67364
0.67724
0.68082
0.68439
0.68793
0.69146

1.01
1.02
1.03
1.04
1.05
1.06
1.07
1.08
1.09
1.10

0.84375
0.84614
0.84849
0.85083
0.85314
0.85543
0.85769
0.85993
0.86214
0.86433

1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.70

0.94630
0.94738
0.94845
0.94950
0.95053
0.95154
0.95254
0.95352
0.95449
0.95543

2.21
2.22
2.23
2.24
2.25
2.26
2.27
2.28
2.29
2.30

0.98645
0.98679
0.98713
0.98745
0.98778
0.98809
0.98840
0.98870
0.98899
0.98928

2.81
2.82
2.83
2.84
2.85
2.86
2.87
2.88
2.89
2.90

0.99752
0.99760
0.99767
0.99774
0.99781
0.99788
0.99795
0.99801
0.99807
0.99813

3.41
3.42
3.43
3.44
3.45
3.46
3.47
3.48
3.49
3.50

0.99968
0.99969
0.99970
0.99971
0.99972
0.99973
0.99974
0.99975
0.99976
0.99977

0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.60

0.69497
0.69847
0.70194
0.70540
0.70884
0.71226
0.71566
0.71904
0.72240
0.72575

1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20

0.86650
0.86864
0.87076
0.87286
0.87493
0.87698
0.87900
0.88100
0.88298
0.88493

1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80

0.95637
0.95728
0.95818
0.95907
0.95994
0.96080
0.96164
0.96246
0.96327
0.96407

2.31
2.32
2.33
2.34
2.35
2.36
2.37
2.38
2.39
2.40

0.98956
0.98983
0.99010
0.99036
0.99061
0.99086
0.99111
0.99134
0.99158
0.99180

2.91
2.92
2.93
2.94
2.95
2.96
2.97
2.98
2.99
3.00

0.99819
0.99825
0.99831
0.99836
0.99841
0.99846
0.99851
0.99856
0.99861
0.99865

3.51
3.52
3.53
3.54
3.55
3.56
3.57
3.58
3.59
3.60

0.99978
0.99978
0.99979
0.99980
0.99981
0.99981
0.99982
0.99983
0.99983
0.99984

402

TABLA 2.
DISTRIBUCIN ACUMULATIVA CHI-CUADRADO

Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el rea en el extremos inferior.

G.L.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

0.0005

0.001

0.005

0.01

PROBABILIDAD P
0.025
0.05

3.93E-07 1.57E-06 3.93E-05 1.57E-04 9.82E-04 3.93E-03

0.001
0.015
0.064
0.158
0.299
0.485
0.710
0.972
1.26
1.59
1.93
2.31
2.70
3.11
3.54
3.98
4.44
4.91
5.40
5.90
6.40
6.92
7.45
7.99
8.54
9.09
9.66
10.2
10.8
11.4
12.0
12.6
13.2
13.8
14.4
15.0
15.6
16.3
16.9
17.5
18.2
18.8
19.5
20.1
20.8
21.5
22.1
22.8
23.5

0.002
0.024
0.091
0.210
0.381
0.598
0.857
1.15
1.48
1.83
2.21
2.62
3.04
3.48
3.94
4.42
4.90
5.41
5.92
6.45
6.98
7.53
8.08
8.65
9.22
9.80
10.4
11.0
11.6
12.2
12.8
13.4
14.1
14.7
15.3
16.0
16.6
17.3
17.9
18.6
19.2
19.9
20.6
21.3
21.9
22.6
23.3
24.0
24.7

0.010
0.072
0.207
0.412
0.676
0.989
1.34
1.73
2.16
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
8.03
8.64
9.26
9.89
10.5
11.2
11.8
12.5
13.1
13.8
14.5
15.1
15.8
16.5
17.2
17.9
18.6
19.3
20.0
20.7
21.4
22.1
22.9
23.6
24.3
25.0
25.8
26.5
27.2
28.0

0.020
0.115
0.297
0.554
0.872
1.24
1.65
2.09
2.56
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
8.90
9.54
10.2
10.9
11.5
12.2
12.9
13.6
14.3
15.0
15.7
16.4
17.1
17.8
18.5
19.2
20.0
20.7
21.4
22.2
22.9
23.7
24.4
25.1
25.9
26.7
27.4
28.2
28.9
29.7

0.051
0.216
0.484
0.831
1.24
1.69
2.18
2.70
3.25
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.59
10.3
11.0
11.7
12.4
13.1
13.8
14.6
15.3
16.0
16.8
17.5
18.3
19.0
19.8
20.6
21.3
22.1
22.9
23.7
24.4
25.2
26.0
26.8
27.6
28.4
29.2
30.0
30.8
31.6
32.4

403

0.103
0.352
0.711
1.15
1.64
2.17
2.73
3.33
3.94
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.1
10.9
11.6
12.3
13.1
13.8
14.6
15.4
16.2
16.9
17.7
18.5
19.3
20.1
20.9
21.7
22.5
23.3
24.1
24.9
25.7
26.5
27.3
28.1
29.0
29.8
30.6
31.4
32.3
33.1
33.9
34.8

0.10
0.016
0.211
0.584
1.06
1.61
2.20
2.83
3.49
4.17
4.87
5.58
6.30
7.04
7.79
8.55
9.31
10.1
10.9
11.7
12.4
13.2
14.0
14.8
15.7
16.5
17.3
18.1
18.9
19.8
20.6
21.4
22.3
23.1
24.0
24.8
25.6
26.5
27.3
28.2
29.1
29.9
30.8
31.6
32.5
33.4
34.2
35.1
35.9
36.8
37.7

0.20
0.064
0.446
1.01
1.65
2.34
3.07
3.82
4.59
5.38
6.18
6.99
7.81
8.63
9.47
10.3
11.2
12.0
12.9
13.7
14.6
15.4
16.3
17.2
18.1
18.9
19.8
20.7
21.6
22.5
23.4
24.3
25.1
26.0
26.9
27.8
28.7
29.6
30.5
31.4
32.3
33.3
34.2
35.1
36.0
36.9
37.8
38.7
39.6
40.5
41.4

0.30
0.148
0.713
1.42
2.19
3.00
3.83
4.67
5.53
6.39
7.27
8.15
9.03
9.93
10.8
11.7
12.6
13.5
14.4
15.4
16.3
17.2
18.1
19.0
19.9
20.9
21.8
22.7
23.6
24.6
25.5
26.4
27.4
28.3
29.2
30.2
31.1
32.1
33.0
33.9
34.9
35.8
36.8
37.7
38.6
39.6
40.5
41.5
42.4
43.4
44.3

0.40
0.275
1.02
1.87
2.75
3.66
4.57
5.49
6.42
7.36
8.30
9.24
10.2
11.1
12.1
13.0
14.0
14.9
15.9
16.9
17.8
18.8
19.7
20.7
21.7
22.6
23.6
24.5
25.5
26.5
27.4
28.4
29.4
30.3
31.3
32.3
33.3
34.2
35.2
36.2
37.1
38.1
39.1
40.0
41.0
42.0
43.0
43.9
44.9
45.9
46.9

TABLA 2.
DISTRIBUCIN ACUMULATIVA CHI-CUADRADO

Los valores en la tabla son de Chi-cuadrado, siendo la pro0

babilidad p el rea en el extremos inferior.

G.L.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

0.50

0.60

0.70

0.80

Probabilidad P
0.90
0.95
0.975

0.99

0.995

0.999

0.9995

0.455
1.39
2.37
3.36
4.35
5.35
6.35
7.34
8.34
9.34
10.3
11.3
12.3
13.3
14.3
15.3
16.3
17.3
18.3
19.3
20.3
21.3
22.3
23.3
24.3
25.3
26.3
27.3
28.3
29.3
30.3
31.3
32.3
33.3
34.3
35.3
36.3
37.3
38.3
39.3
40.3
41.3
42.3
43.3
44.3
45.3
46.3
47.3
48.3
49.3

0.708
1.83
2.95
4.04
5.13
6.21
7.28
8.35
9.41
10.5
11.5
12.6
13.6
14.7
15.7
16.8
17.8
18.9
19.9
21.0
22.0
23.0
24.1
25.1
26.1
27.2
28.2
29.2
30.3
31.3
32.3
33.4
34.4
35.4
36.5
37.5
38.5
39.6
40.6
41.6
42.7
43.7
44.7
45.7
46.8
47.8
48.8
49.8
50.9
51.9

1.07
2.41
3.66
4.88
6.06
7.23
8.38
9.52
10.7
11.8
12.9
14.0
15.1
16.2
17.3
18.4
19.5
20.6
21.7
22.8
23.9
24.9
26.0
27.1
28.2
29.2
30.3
31.4
32.5
33.5
34.6
35.7
36.7
37.8
38.9
39.9
41.0
42.0
43.1
44.2
45.2
46.3
47.3
48.4
49.5
50.5
51.6
52.6
53.7
54.7

1.64
3.22
4.64
5.99
7.29
8.56
9.80
11.0
12.2
13.4
14.6
15.8
17.0
18.2
19.3
20.5
21.6
22.8
23.9
25.0
26.2
27.3
28.4
29.6
30.7
31.8
32.9
34.0
35.1
36.3
37.4
38.5
39.6
40.7
41.8
42.9
44.0
45.1
46.2
47.3
48.4
49.5
50.5
51.6
52.7
53.8
54.9
56.0
57.1
58.2

2.71
4.61
6.25
7.78
9.24
10.6
12.0
13.4
14.7
16.0
17.3
18.5
19.8
21.1
22.3
23.5
24.8
26.0
27.2
28.4
29.6
30.8
32.0
33.2
34.4
35.6
36.7
37.9
39.1
40.3
41.4
42.6
43.7
44.9
46.1
47.2
48.4
49.5
50.7
51.8
52.9
54.1
55.2
56.4
57.5
58.6
59.8
60.9
62.0
63.2

6.63
9.21
11.3
13.3
15.1
16.8
18.5
20.1
21.7
23.2
24.7
26.2
27.7
29.1
30.6
32.0
33.4
34.8
36.2
37.6
38.9
40.3
41.6
43.0
44.3
45.6
47.0
48.3
49.6
50.9
52.2
53.5
54.8
56.1
57.3
58.6
59.9
61.2
62.4
63.7
65.0
66.2
67.5
68.7
70.0
71.2
72.4
73.7
74.9
76.2

7.88
10.6
12.8
14.9
16.7
18.5
20.3
22.0
23.6
25.2
26.8
28.3
29.8
31.3
32.8
34.3
35.7
37.2
38.6
40.0
41.4
42.8
44.2
45.6
46.9
48.3
49.6
51.0
52.3
53.7
55.0
56.3
57.6
59.0
60.3
61.6
62.9
64.2
65.5
66.8
68.1
69.3
70.6
71.9
73.2
74.4
75.7
77.0
78.2
79.5

10.8
13.8
16.3
18.5
20.5
22.5
24.3
26.1
27.9
29.6
31.3
32.9
34.5
36.1
37.7
39.3
40.8
42.3
43.8
45.3
46.8
48.3
49.7
51.2
52.6
54.1
55.5
56.9
58.3
59.7
61.1
62.5
63.9
65.2
66.6
68.0
69.3
70.7
72.1
73.4
74.7
76.1
77.4
78.7
80.1
81.4
82.7
84.0
85.4
86.7

12.1
15.2
17.7
20.0
22.1
24.1
26.0
27.9
29.7
31.4
33.1
34.8
36.5
38.1
39.7
41.3
42.9
44.4
46.0
47.5
49.0
50.5
52.0
53.5
54.9
56.4
57.9
59.3
60.7
62.2
63.6
65.0
66.4
67.8
69.2
70.6
72.0
73.4
74.7
76.1
77.5
78.8
80.2
81.5
82.9
84.2
85.6
86.9
88.2
89.6

404

3.84
5.99
7.81
9.49
11.1
12.6
14.1
15.5
16.9
18.3
19.7
21.0
22.4
23.7
25.0
26.3
27.6
28.9
30.1
31.4
32.7
33.9
35.2
36.4
37.7
38.9
40.1
41.3
42.6
43.8
45.0
46.2
47.4
48.6
49.8
51.0
52.2
53.4
54.6
55.8
56.9
58.1
59.3
60.5
61.7
62.8
64.0
65.2
66.3
67.5

5.02
7.38
9.35
11.1
12.8
14.4
16.0
17.5
19.0
20.5
21.9
23.3
24.7
26.1
27.5
28.8
30.2
31.5
32.9
34.2
35.5
36.8
38.1
39.4
40.6
41.9
43.2
44.5
45.7
47.0
48.2
49.5
50.7
52.0
53.2
54.4
55.7
56.9
58.1
59.3
60.6
61.8
63.0
64.2
65.4
66.6
67.8
69.0
70.2
71.4

TABLA 2.
DISTRIBUCIN ACUMULATIVA CHI-CUADRADO

Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el rea en el extremos inferior.

G.L.
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

0.0005
24.1
24.8
25.5
26.2
26.9
27.6
28.2
28.9
29.6
30.3
31.0
31.7
32.5
33.2
33.9
34.6
35.3
36.0
36.7
37.5
38.2
38.9
39.6
40.4
41.1
41.8
42.6
43.3
44.1
44.8
45.5
46.3
47.0
47.8
48.5
49.3
50.0
50.8
51.5
52.3
53.0
53.8
54.5
55.3
56.1
56.8
57.6
58.4
59.1
59.9

0.001
25.4
26.1
26.8
27.5
28.2
28.9
29.6
30.3
31.0
31.7
32.5
33.2
33.9
34.6
35.4
36.1
36.8
37.6
38.3
39.0
39.8
40.5
41.3
42.0
42.8
43.5
44.3
45.0
45.8
46.5
47.3
48.0
48.8
49.6
50.3
51.1
51.9
52.6
53.4
54.2
54.9
55.7
56.5
57.2
58.0
58.8
59.6
60.4
61.1
61.9

0.005
28.7
29.5
30.2
31.0
31.7
32.5
33.2
34.0
34.8
35.5
36.3
37.1
37.8
38.6
39.4
40.2
40.9
41.7
42.5
43.3
44.1
44.8
45.6
46.4
47.2
48.0
48.8
49.6
50.4
51.2
52.0
52.8
53.6
54.4
55.2
56.0
56.8
57.6
58.4
59.2
60.0
60.8
61.6
62.4
63.2
64.1
64.9
65.7
66.5
67.3

0.01
30.5
31.2
32.0
32.8
33.6
34.3
35.1
35.9
36.7
37.5
38.3
39.1
39.9
40.6
41.4
42.2
43.0
43.8
44.6
45.4
46.2
47.1
47.9
48.7
49.5
50.3
51.1
51.9
52.7
53.5
54.4
55.2
56.0
56.8
57.6
58.5
59.3
60.1
60.9
61.8
62.6
63.4
64.2
65.1
65.9
66.7
67.6
68.4
69.2
70.1

PROBABILIDAD P
0.025
0.05
33.2
35.6
34.0
36.4
34.8
37.3
35.6
38.1
36.4
39.0
37.2
39.8
38.0
40.6
38.8
41.5
39.7
42.3
40.5
43.2
41.3
44.0
42.1
44.9
43.0
45.7
43.8
46.6
44.6
47.4
45.4
48.3
46.3
49.2
47.1
50.0
47.9
50.9
48.8
51.7
49.6
52.6
50.4
53.5
51.3
54.3
52.1
55.2
52.9
56.1
53.8
56.9
54.6
57.8
55.5
58.7
56.3
59.5
57.2
60.4
58.0
61.3
58.8
62.1
59.7
63.0
60.5
63.9
61.4
64.7
62.2
65.6
63.1
66.5
63.9
67.4
64.8
68.2
65.6
69.1
66.5
70.0
67.4
70.9
68.2
71.8
69.1
72.6
69.9
73.5
70.8
74.4
71.6
75.3
72.5
76.2
73.4
77.0
74.2
77.9

405

0.10
38.6
39.4
40.3
41.2
42.1
42.9
43.8
44.7
45.6
46.5
47.3
48.2
49.1
50.0
50.9
51.8
52.7
53.5
54.4
55.3
56.2
57.1
58.0
58.9
59.8
60.7
61.6
62.5
63.4
64.3
65.2
66.1
67.0
67.9
68.8
69.7
70.6
71.5
72.4
73.3
74.2
75.1
76.0
76.9
77.8
78.7
79.6
80.5
81.4
82.4

0.20
42.4
43.3
44.2
45.1
46.0
47.0
47.9
48.8
49.7
50.6
51.6
52.5
53.4
54.3
55.3
56.2
57.1
58.0
59.0
59.9
60.8
61.8
62.7
63.6
64.5
65.5
66.4
67.3
68.3
69.2
70.1
71.1
72.0
72.9
73.9
74.8
75.7
76.7
77.6
78.6
79.5
80.4
81.4
82.3
83.2
84.2
85.1
86.1
87.0
87.9

0.30
45.3
46.2
47.2
48.1
49.1
50.0
51.0
51.9
52.9
53.8
54.8
55.7
56.7
57.6
58.6
59.5
60.5
61.4
62.4
63.3
64.3
65.3
66.2
67.2
68.1
69.1
70.0
71.0
72.0
72.9
73.9
74.8
75.8
76.8
77.7
78.7
79.6
80.6
81.6
82.5
83.5
84.4
85.4
86.4
87.3
88.3
89.2
90.2
91.2
92.1

0.40
47.8
48.8
49.8
50.8
51.7
52.7
53.7
54.7
55.6
56.6
57.6
58.6
59.6
60.5
61.5
62.5
63.5
64.4
65.4
66.4
67.4
68.4
69.3
70.3
71.3
72.3
73.2
74.2
75.2
76.2
77.2
78.1
79.1
80.1
81.1
82.1
83.0
84.0
85.0
86.0
87.0
88.0
88.9
89.9
90.9
91.9
92.9
93.8
94.8
95.8

TABLA 2.
DISTRIBUCIN ACUMULATIVA CHI-CUADRADO

Los valores en la tabla son de Chi-cuadrado, siendo la pro0

babilidad p el rea en el extremos inferior.

G.L.
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

0.50

0.60

0.70

0.80

Probabilidad P
0.90
0.95
0.975

0.99

0.995

0.999

0.9995

50.3
51.3
52.3
53.3
54.3
55.3
56.3
57.3
58.3
59.3
60.3
61.3
62.3
63.3
64.3
65.3
66.3
67.3
68.3
69.3
70.3
71.3
72.3
73.3
74.3
75.3
76.3
77.3
78.3
79.3
80.3
81.3
82.3
83.3
84.3
85.3
86.3
87.3
88.3
89.3
90.3
91.3
92.3
93.3
94.3
95.3
96.3
97.3
98.3
99.3

52.9
53.9
55.0
56.0
57.0
58.0
59.1
60.1
61.1
62.1
63.2
64.2
65.2
66.2
67.2
68.3
69.3
70.3
71.3
72.4
73.4
74.4
75.4
76.4
77.5
78.5
79.5
80.5
81.5
82.6
83.6
84.6
85.6
86.6
87.7
88.7
89.7
90.7
91.7
92.8
93.8
94.8
95.8
96.8
97.9
98.9
99.9
100.9
101.9
102.9

55.8
56.8
57.9
58.9
60.0
61.0
62.1
63.1
64.2
65.2
66.3
67.3
68.4
69.4
70.5
71.5
72.6
73.6
74.6
75.7
76.7
77.8
78.8
79.9
80.9
82.0
83.0
84.0
85.1
86.1
87.2
88.2
89.2
90.3
91.3
92.4
93.4
94.4
95.5
96.5
97.6
98.6
99.6
100.7
101.7
102.8
103.8
104.8
105.9
106.9

59.2
60.3
61.4
62.5
63.6
64.7
65.7
66.8
67.9
69.0
70.0
71.1
72.2
73.3
74.4
75.4
76.5
77.6
78.6
79.7
80.8
81.9
82.9
84.0
85.1
86.1
87.2
88.3
89.3
90.4
91.5
92.5
93.6
94.7
95.7
96.8
97.9
98.9
100.0
101.1
102.1
103.2
104.2
105.3
106.4
107.4
108.5
109.5
110.6
111.7

64.3
65.4
66.5
67.7
68.8
69.9
71.0
72.2
73.3
74.4
75.5
76.6
77.7
78.9
80.0
81.1
82.2
83.3
84.4
85.5
86.6
87.7
88.8
90.0
91.1
92.2
93.3
94.4
95.5
96.6
97.7
98.8
99.9
101.0
102.1
103.2
104.3
105.4
106.5
107.6
108.7
109.8
110.9
111.9
113.0
114.1
115.2
116.3
117.4
118.5

77.4
78.6
79.8
81.1
82.3
83.5
84.7
86.0
87.2
88.4
89.6
90.8
92.0
93.2
94.4
95.6
96.8
98.0
99.2
100.4
101.6
102.8
104.0
105.2
106.4
107.6
108.8
110.0
111.1
112.3
113.5
114.7
115.9
117.1
118.2
119.4
120.6
121.8
122.9
124.1
125.3
126.5
127.6
128.8
130.0
131.1
132.3
133.5
134.6
135.8

80.7
82.0
83.3
84.5
85.7
87.0
88.2
89.5
90.7
92.0
93.2
94.4
95.6
96.9
98.1
99.3
100.6
101.8
103.0
104.2
105.4
106.6
107.9
109.1
110.3
111.5
112.7
113.9
115.1
116.3
117.5
118.7
119.9
121.1
122.3
123.5
124.7
125.9
127.1
128.3
129.5
130.7
131.9
133.1
134.2
135.4
136.6
137.8
139.0
140.2

88.0
89.3
90.6
91.9
93.2
94.5
95.8
97.0
98.3
99.6
100.9
102.2
103.4
104.7
106.0
107.3
108.5
109.8
111.1
112.3
113.6
114.8
116.1
117.3
118.6
119.9
121.1
122.3
123.6
124.8
126.1
127.3
128.6
129.8
131.0
132.3
133.5
134.7
136.0
137.2
138.4
139.7
140.9
142.1
143.3
144.6
145.8
147.0
148.2
149.4

90.9
92.2
93.5
94.8
96.2
97.5
98.8
100.1
101.4
102.7
104.0
105.3
106.6
107.9
109.2
110.5
111.7
113.0
114.3
115.6
116.9
118.1
119.4
120.7
121.9
123.2
124.5
125.7
127.0
128.3
129.5
130.8
132.0
133.3
134.5
135.8
137.0
138.3
139.5
140.8
142.0
143.3
144.5
145.8
147.0
148.2
149.5
150.7
151.9
153.2

406

68.7
69.8
71.0
72.2
73.3
74.5
75.6
76.8
77.9
79.1
80.2
81.4
82.5
83.7
84.8
86.0
87.1
88.3
89.4
90.5
91.7
92.8
93.9
95.1
96.2
97.4
98.5
99.6
100.7
101.9
103.0
104.1
105.3
106.4
107.5
108.6
109.8
110.9
112.0
113.1
114.3
115.4
116.5
117.6
118.8
119.9
121.0
122.1
123.2
124.3

72.6
73.8
75.0
76.2
77.4
78.6
79.8
80.9
82.1
83.3
84.5
85.7
86.8
88.0
89.2
90.3
91.5
92.7
93.9
95.0
96.2
97.4
98.5
99.7
100.8
102.0
103.2
104.3
105.5
106.6
107.8
108.9
110.1
111.2
112.4
113.5
114.7
115.8
117.0
118.1
119.3
120.4
121.6
122.7
123.9
125.0
126.1
127.3
128.4
129.6

TABLA 3.
DISTRIBUCIN ACUMULATIVA T DE STUDENT
p

Los valores en la tabla son valores t, siendo la probabilidad p el rea acumulada en el extremos inferior.
0

G.L.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
40
45
50
55
60
70
80
90
100
200
300
400
500
1000
5000

0.75
1.000
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.682
0.682
0.682
0.682
0.682
0.681
0.680
0.679
0.679
0.679
0.678
0.678
0.677
0.677
0.676
0.675
0.675
0.675
0.675
0.675

0.80
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.853
0.853
0.853
0.852
0.852
0.851
0.850
0.849
0.848
0.848
0.847
0.846
0.846
0.845
0.843
0.843
0.843
0.842
0.842
0.842

0.85
1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.054
1.054
1.053
1.052
1.052
1.050
1.049
1.047
1.046
1.045
1.044
1.043
1.042
1.042
1.039
1.038
1.038
1.038
1.037
1.037

PROBABILIDAD P
0.90
0.95
0.975
3.078
6.314
12.706
1.886
2.920
4.303
1.638
2.353
3.182
1.533
2.132
2.776
1.476
2.015
2.571
1.440
1.943
2.447
1.415
1.895
2.365
1.397
1.860
2.306
1.383
1.833
2.262
1.372
1.812
2.228
1.363
1.796
2.201
1.356
1.782
2.179
1.350
1.771
2.160
1.345
1.761
2.145
1.341
1.753
2.131
1.337
1.746
2.120
1.333
1.740
2.110
1.330
1.734
2.101
1.328
1.729
2.093
1.325
1.725
2.086
1.323
1.721
2.080
1.321
1.717
2.074
1.319
1.714
2.069
1.318
1.711
2.064
1.316
1.708
2.060
1.315
1.706
2.056
1.314
1.703
2.052
1.313
1.701
2.048
1.311
1.699
2.045
1.310
1.697
2.042
1.309
1.696
2.040
1.309
1.694
2.037
1.308
1.692
2.035
1.307
1.691
2.032
1.306
1.690
2.030
1.303
1.684
2.021
1.301
1.679
2.014
1.299
1.676
2.009
1.297
1.673
2.004
1.296
1.671
2.000
1.294
1.667
1.994
1.292
1.664
1.990
1.291
1.662
1.987
1.290
1.660
1.984
1.286
1.653
1.972
1.284
1.650
1.968
1.284
1.649
1.966
1.283
1.648
1.965
1.282
1.646
1.962
407
1.282
1.645
1.960

0.990
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.453
2.449
2.445
2.441
2.438
2.423
2.412
2.403
2.396
2.390
2.381
2.374
2.368
2.364
2.345
2.339
2.336
2.334
2.330
2.327

0.995
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.744
2.738
2.733
2.728
2.724
2.704
2.690
2.678
2.668
2.660
2.648
2.639
2.632
2.626
2.601
2.592
2.588
2.586
2.581
2.577

0.9995
636.619
31.599
12.924
8.610
6.869
5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.850
3.819
3.792
3.768
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.633
3.622
3.611
3.601
3.591
3.551
3.520
3.496
3.476
3.460
3.435
3.416
3.402
3.390
3.340
3.323
3.315
3.310
3.300
3.292

TABLA 4. DISTRIBUCIN ACUMULATIVA F:

P [F f]

Los valores en la tabla son valores F, siendo la probabilidad p el rea acumulada en el extremos inferior.
G.L.
De nom.

10

P
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995

Grados
1
2
3
4
5
6
7
8
9
161
200
216
225
230
234
237
239
241
648
799
864
900
922
937
948
957
963
4052
5000
5403
5625
5764
5859
5928
5981
6022
16211 20000 21615 22500 23056 23437 23715 23925 24091
18.51
19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38
38.51
39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39
98.50
99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39
198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39
10.13
9.55
9.28
9.12
9.01
8.94
8.89
8.85
8.81
17.44
16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47
34.12
30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35
55.55
49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88
7.71
6.94
6.59
6.39
6.26
6.16
6.09
6.04
6.00
12.22
10.65
9.98
9.60
9.36
9.20
9.07
8.98
8.90
21.20
18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66
31.33
26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14
6.61
5.79
5.41
5.19
5.05
4.95
4.88
4.82
4.77
10.01
8.43
7.76
7.39
7.15
6.98
6.85
6.76
6.68
16.26
13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16
22.78
18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77
5.99
5.14
4.76
4.53
4.39
4.28
4.21
4.15
4.10
8.81
7.26
6.60
6.23
5.99
5.82
5.70
5.60
5.52
13.75
10.92
9.78
9.15
8.75
8.47
8.26
8.10
7.98
18.63
14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39
5.59
4.74
4.35
4.12
3.97
3.87
3.79
3.73
3.68
8.07
6.54
5.89
5.52
5.29
5.12
4.99
4.90
4.82
12.25
9.55
8.45
7.85
7.46
7.19
6.99
6.84
6.72
16.24
12.40 10.88 10.05
9.52
9.16
8.89
8.68
8.51
5.32
4.46
4.07
3.84
3.69
3.58
3.50
3.44
3.39
7.57
6.06
5.42
5.05
4.82
4.65
4.53
4.43
4.36
11.26
8.65
7.59
7.01
6.63
6.37
6.18
6.03
5.91
14.69
11.04
9.60
8.81
8.30
7.95
7.69
7.50
7.34
5.12
4.26
3.86
3.63
3.48
3.37
3.29
3.23
3.18
7.21
5.71
5.08
4.72
4.48
4.32
4.20
4.10
4.03
10.56
8.02
6.99
6.42
6.06
5.80
5.61
5.47
5.35
13.61
10.11
8.72
7.96
7.47
7.13
6.88
6.69
6.54
4.96
4.10
3.71
3.48
3.33
3.22
3.14
3.07
3.02
6.94
5.46
4.83
4.47
4.24
4.07
3.95
3.85
3.78
10.04
7.56
6.55
5.99
5.64
5.39
5.20
5.06
4.94
12.83
9.43
8.08
7.34
6.87
6.54
6.30
6.12
5.97

TABLA 4. DISTRIBUCIN ACUMULATIVA F:

de libe rtad de l nume rador


10
11
12
13
14
242
243
244
245
245
969
973
977
980
983
6056
6083
6106
6126
6143
24224 24334 24426 24505 24572
19.40 19.40 19.41 19.42 19.42
39.40 39.41 39.41 39.42 39.43
99.40 99.41 99.42 99.42 99.43
199.40 199.41 199.42 199.42 199.43
8.79
8.76
8.74
8.73
8.71
14.42 14.37 14.34 14.30 14.28
27.23 27.13 27.05 26.98 26.92
43.69 43.52 43.39 43.27 43.17
5.96
5.94
5.91
5.89
5.87
8.84
8.79
8.75
8.71
8.68
14.55 14.45 14.37 14.31 14.25
20.97 20.82 20.70 20.60 20.51
4.74
4.70
4.68
4.66
4.64
6.62
6.57
6.52
6.49
6.46
10.05
9.96
9.89
9.82
9.77
13.62 13.49 13.38 13.29 13.21
4.06
4.03
4.00
3.98
3.96
5.46
5.41
5.37
5.33
5.30
7.87
7.79
7.72
7.66
7.60
10.25 10.13 10.03
9.95
9.88
3.64
3.60
3.57
3.55
3.53
4.76
4.71
4.67
4.63
4.60
6.62
6.54
6.47
6.41
6.36
8.38
8.27
8.18
8.10
8.03
3.35
3.31
3.28
3.26
3.24
4.30
4.24
4.20
4.16
4.13
5.81
5.73
5.67
5.61
5.56
7.21
7.10
7.01
6.94
6.87
3.14
3.10
3.07
3.05
3.03
3.96
3.91
3.87
3.83
3.80
5.26
5.18
5.11
5.05
5.01
6.42
6.31
6.23
6.15
6.09
2.98
2.94
2.91
2.89
2.86
3.72
3.66
3.62
3.58
3.55
4.85
4.77
4.71
4.65
4.60
5.85
5.75
5.66
5.59
5.53

15
246
985
6157
24630
19.43
39.43
99.43
199.43
8.70
14.25
26.87
43.08
5.86
8.66
14.20
20.44
4.62
6.43
9.72
13.15
3.94
5.27
7.56
9.81
3.51
4.57
6.31
7.97
3.22
4.10
5.52
6.81
3.01
3.77
4.96
6.03
2.85
3.52
4.56
5.47

16
246
987
6170
24681
19.43
39.44
99.44
199.44
8.69
14.23
26.83
43.01
5.84
8.63
14.15
20.37
4.60
6.40
9.68
13.09
3.92
5.24
7.52
9.76
3.49
4.54
6.28
7.91
3.20
4.08
5.48
6.76
2.99
3.74
4.92
5.98
2.83
3.50
4.52
5.42

17
247
989
6181
24727
19.44
39.44
99.44
199.44
8.68
14.21
26.79
42.94
5.83
8.61
14.11
20.31
4.59
6.38
9.64
13.03
3.91
5.22
7.48
9.71
3.48
4.52
6.24
7.87
3.19
4.05
5.44
6.72
2.97
3.72
4.89
5.94
2.81
3.47
4.49
5.38

18
247
990
6192
24767
19.44
39.44
99.44
199.44
8.67
14.20
26.75
42.88
5.82
8.59
14.08
20.26
4.58
6.36
9.61
12.98
3.90
5.20
7.45
9.66
3.47
4.50
6.21
7.83
3.17
4.03
5.41
6.68
2.96
3.70
4.86
5.90
2.80
3.45
4.46
5.34

19
248
992
6201
24803
19.44
39.45
99.45
199.45
8.67
14.18
26.72
42.83
5.81
8.58
14.05
20.21
4.57
6.34
9.58
12.94
3.88
5.18
7.42
9.62
3.46
4.48
6.18
7.79
3.16
4.02
5.38
6.64
2.95
3.68
4.83
5.86
2.79
3.44
4.43
5.31

20
248
993
6209
24836
19.45
39.45
99.45
199.45
8.66
14.17
26.69
42.78
5.80
8.56
14.02
20.17
4.56
6.33
9.55
12.90
3.87
5.17
7.40
9.59
3.44
4.47
6.16
7.75
3.15
4.00
5.36
6.61
2.94
3.67
4.81
5.83
2.77
3.42
4.41
5.27

P [F f]

Los valores en la tabla son valores F, siendo la probabilidad p el rea acumulada en el extremos inferior.
G.L.
De nom.

11

12

13

14

15

16

17

18

19

20

P
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995

1
4.84
6.72
9.65
12.23
4.75
6.55
9.33
11.75
4.67
6.41
9.07
11.37
4.60
6.30
8.86
11.06
4.54
6.20
8.68
10.80
4.49
6.12
8.53
10.58
4.45
6.04
8.40
10.38
4.41
5.98
8.29
10.22
4.38
5.92
8.18
10.07
4.35
5.87
8.10
9.94

2
3.98
5.26
7.21
8.91
3.89
5.10
6.93
8.51
3.81
4.97
6.70
8.19
3.74
4.86
6.51
7.92
3.68
4.77
6.36
7.70
3.63
4.69
6.23
7.51
3.59
4.62
6.11
7.35
3.55
4.56
6.01
7.21
3.52
4.51
5.93
7.09
3.49
4.46
5.85
6.99

3
3.59
4.63
6.22
7.60
3.49
4.47
5.95
7.23
3.41
4.35
5.74
6.93
3.34
4.24
5.56
6.68
3.29
4.15
5.42
6.48
3.24
4.08
5.29
6.30
3.20
4.01
5.18
6.16
3.16
3.95
5.09
6.03
3.13
3.90
5.01
5.92
3.10
3.86
4.94
5.82

4
3.36
4.28
5.67
6.88
3.26
4.12
5.41
6.52
3.18
4.00
5.21
6.23
3.11
3.89
5.04
6.00
3.06
3.80
4.89
5.80
3.01
3.73
4.77
5.64
2.96
3.66
4.67
5.50
2.93
3.61
4.58
5.37
2.90
3.56
4.50
5.27
2.87
3.51
4.43
5.17

5
3.20
4.04
5.32
6.42
3.11
3.89
5.06
6.07
3.03
3.77
4.86
5.79
2.96
3.66
4.69
5.56
2.90
3.58
4.56
5.37
2.85
3.50
4.44
5.21
2.81
3.44
4.34
5.07
2.77
3.38
4.25
4.96
2.74
3.33
4.17
4.85
2.71
3.29
4.10
4.76

6
3.09
3.88
5.07
6.10
3.00
3.73
4.82
5.76
2.92
3.60
4.62
5.48
2.85
3.50
4.46
5.26
2.79
3.41
4.32
5.07
2.74
3.34
4.20
4.91
2.70
3.28
4.10
4.78
2.66
3.22
4.01
4.66
2.63
3.17
3.94
4.56
2.60
3.13
3.87
4.47

7
3.01
3.76
4.89
5.86
2.91
3.61
4.64
5.52
2.83
3.48
4.44
5.25
2.76
3.38
4.28
5.03
2.71
3.29
4.14
4.85
2.66
3.22
4.03
4.69
2.61
3.16
3.93
4.56
2.58
3.10
3.84
4.44
2.54
3.05
3.77
4.34
2.51
3.01
3.70
4.26

8
2.95
3.66
4.74
5.68
2.85
3.51
4.50
5.35
2.77
3.39
4.30
5.08
2.70
3.29
4.14
4.86
2.64
3.20
4.00
4.67
2.59
3.12
3.89
4.52
2.55
3.06
3.79
4.39
2.51
3.01
3.71
4.28
2.48
2.96
3.63
4.18
2.45
2.91
3.56
4.09

408

Grados
9
2.90
3.59
4.63
5.54
2.80
3.44
4.39
5.20
2.71
3.31
4.19
4.94
2.65
3.21
4.03
4.72
2.59
3.12
3.89
4.54
2.54
3.05
3.78
4.38
2.49
2.98
3.68
4.25
2.46
2.93
3.60
4.14
2.42
2.88
3.52
4.04
2.39
2.84
3.46
3.96

de libe rtad de l nume rador


10
11
12
13
2.85
2.82
2.79
2.76
3.53
3.47
3.43
3.39
4.54
4.46
4.40
4.34
5.42
5.32
5.24
5.16
2.75
2.72
2.69
2.66
3.37
3.32
3.28
3.24
4.30
4.22
4.16
4.10
5.09
4.99
4.91
4.84
2.67
2.63
2.60
2.58
3.25
3.20
3.15
3.12
4.10
4.02
3.96
3.91
4.82
4.72
4.64
4.57
2.60
2.57
2.53
2.51
3.15
3.09
3.05
3.01
3.94
3.86
3.80
3.75
4.60
4.51
4.43
4.36
2.54
2.51
2.48
2.45
3.06
3.01
2.96
2.92
3.80
3.73
3.67
3.61
4.42
4.33
4.25
4.18
2.49
2.46
2.42
2.40
2.99
2.93
2.89
2.85
3.69
3.62
3.55
3.50
4.27
4.18
4.10
4.03
2.45
2.41
2.38
2.35
2.92
2.87
2.82
2.79
3.59
3.52
3.46
3.40
4.14
4.05
3.97
3.90
2.41
2.37
2.34
2.31
2.87
2.81
2.77
2.73
3.51
3.43
3.37
3.32
4.03
3.94
3.86
3.79
2.38
2.34
2.31
2.28
2.82
2.76
2.72
2.68
3.43
3.36
3.30
3.24
3.93
3.84
3.76
3.70
2.35
2.31
2.28
2.25
2.77
2.72
2.68
2.64
3.37
3.29
3.23
3.18
3.85
3.76
3.68
3.61

14
2.74
3.36
4.29
5.10
2.64
3.21
4.05
4.77
2.55
3.08
3.86
4.51
2.48
2.98
3.70
4.30
2.42
2.89
3.56
4.12
2.37
2.82
3.45
3.97
2.33
2.75
3.35
3.84
2.29
2.70
3.27
3.73
2.26
2.65
3.19
3.64
2.22
2.60
3.13
3.55

15
2.72
3.33
4.25
5.05
2.62
3.18
4.01
4.72
2.53
3.05
3.82
4.46
2.46
2.95
3.66
4.25
2.40
2.86
3.52
4.07
2.35
2.79
3.41
3.92
2.31
2.72
3.31
3.79
2.27
2.67
3.23
3.68
2.23
2.62
3.15
3.59
2.20
2.57
3.09
3.50

16
2.70
3.30
4.21
5.00
2.60
3.15
3.97
4.67
2.51
3.03
3.78
4.41
2.44
2.92
3.62
4.20
2.38
2.84
3.49
4.02
2.33
2.76
3.37
3.87
2.29
2.70
3.27
3.75
2.25
2.64
3.19
3.64
2.21
2.59
3.12
3.54
2.18
2.55
3.05
3.46

17
2.69
3.28
4.18
4.96
2.58
3.13
3.94
4.63
2.50
3.00
3.75
4.37
2.43
2.90
3.59
4.16
2.37
2.81
3.45
3.98
2.32
2.74
3.34
3.83
2.27
2.67
3.24
3.71
2.23
2.62
3.16
3.60
2.20
2.57
3.08
3.50
2.17
2.52
3.02
3.42

18
2.67
3.26
4.15
4.92
2.57
3.11
3.91
4.59
2.48
2.98
3.72
4.33
2.41
2.88
3.56
4.12
2.35
2.79
3.42
3.95
2.30
2.72
3.31
3.80
2.26
2.65
3.21
3.67
2.22
2.60
3.13
3.56
2.18
2.55
3.05
3.46
2.15
2.50
2.99
3.38

19
2.66
3.24
4.12
4.89
2.56
3.09
3.88
4.56
2.47
2.96
3.69
4.30
2.40
2.86
3.53
4.09
2.34
2.77
3.40
3.91
2.29
2.70
3.28
3.76
2.24
2.63
3.19
3.64
2.20
2.58
3.10
3.53
2.17
2.53
3.03
3.43
2.14
2.48
2.96
3.35

20
2.65
3.23
4.10
4.86
2.54
3.07
3.86
4.53
2.46
2.95
3.66
4.27
2.39
2.84
3.51
4.06
2.33
2.76
3.37
3.88
2.28
2.68
3.26
3.73
2.23
2.62
3.16
3.61
2.19
2.56
3.08
3.50
2.16
2.51
3.00
3.40
2.12
2.46
2.94
3.32

Tabla 5. De Wilcoxon para n 40 y = 0.05 o 0.01.


n

0.05

0.01

0.05

0.01

0.05

0.01

0 - 21

18

40 - 131

27 - 144

30

137 - 328 109 - 356

2 - 26

19

46 - 144

32 - 158

31

147 - 349 118 - 378

3 - 33

0 - 36

20

52 - 158

37 - 173

32

159 - 369 128 - 400

5 - 40

1 - 44

21

58 - 173

42 - 189

33

170 - 391 138 - 423

10

8 - 47

3 - 52

22

65 - 188

48 - 205

34

182 - 413 148 - 447

11

10 -56

5 - 61

23

73 - 203

54 - 222

35

195 - 435 159 - 471

12

13 - 65

7 - 71

24

81 - 219

61 - 239

36

208 - 458 171 - 495

13

17 - 74

9 - 82

25

89 - 236

68 - 257

37

221 - 482 182 - 521

14

21 - 84

12 - 93

26

98 - 253

75 - 276

38

235 - 506 194 - 547

15

25 - 95

15 - 105

27

107 - 271

83 - 295

39

249 - 531 207 - 573

16

29 - 107

19 - 117

28

116 - 290

91 - 315

40

264 - 556 220 - 600

17

34 - 119

23 - 130

29

126 - 309 100 - 335

Fuente: Journal of the American Statistical Association, setiembre de 1965.

Tabla 6. Valores crticos para la prueba del signo S: n 25 y = 0.01 o 0.05


n

0.01

0.05

0.01

0.05

14

15

16

17

18

19

20

21

22

10

23

11

24

12

25

13

La hiptesis nula se rechaza si S es menor o igual al valor de la tabla.

409

Vous aimerez peut-être aussi