Vous êtes sur la page 1sur 85

Pgina 1 de 85

Universidad Nacional Jos Faustino Snchez Carrin


Facultad de Ingeniera Industrial, Sistemas e Informtica

Huacho, agosto de 2013


Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 2 de 85

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 3 de 85

PRESENTACIN

La presente publicacin, contiene material didctico, para el curso de INFERENCIA


ESTADSTICA, destinados a los alumnos de la Facultad de Ingeniera Industrial, Sistemas e
Informtica de esta Casa de Estudios; desarrollada con el propsito de facilitar material didctico
complementario al desarrollo de las clases tericas impartidas en el aula.
No pretende sustituir al profesor, ni menos a la abundante bibliografa especializada existente en
nuestro medio; quienes estamos inmersos en este proceso, somos conscientes, que los alumnos
deben contar con los materiales adecuados como para afrontar exitosamente los retos que la nueva
competitividad los exige, en este mundo globalizado, el cual lo ha convertido en una pequea aldea
global.
No es suficiente con asistir a clases, escuchar y revisar lo transmitido; tambin es necesario
contar con las herramientas adecuadas; siendo la Inferencia Estadstica, parte de la matemtica
aplicada, los alumnos deben contar con los equipos adecuados, para afrontar los retos de la temtica
que el curso exige, por lo menos deben contar con una calculadora cientfica, llevar sus tablas
estadsticas, e idealmente una Laptop, y ganas y buena voluntad de aprender; con estos
implementos, aunado a la gua proporcionada, los alumnos estarn expeditos como para afrontar
retos ms grandes, que en la universidad, por limitaciones de tiempo no se pueden tratar.
Esta gua est programado para desarrollarse en una sesin de 14 semanas de clase, teniendo
en cuenta que el ciclo acadmico consta de 17 semanas, tres de los cuales son dedicadas a
evaluacin; en tal sentido se los ha dividido en seis unidades temticas principales; cada uno de ellos
presenta una breve introduccin del temario, con nociones bsicas y ejemplos tipos; tambin los
alumnos aprendern a manejar el software estadstico SPPS, y el Minitab; sin embargo, ello no
desmerece a los otros existentes en el mercado; la razn de su uso, reside simplemente en su
disponibilidad.

Moiss E. Armas
Profesor del curso.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 4 de 85

I.

ESTIMACIN DE PARMETROS

ESTIMACIN
CONFIANZA

PUNTUAL

ESTIMACIN

POR

INTERVALOS

DE

Las poblaciones, por lo general son grandes o muy grandes, por lo tanto trabajar con todos sus
elementos resultara contraproducente, penoso, costoso y demorara mucho tiempo en procesar la
informacin, aparte de que no tendra significado trabajar con todos ellos; en su lugar se trabaja con
sus muestras debidamente seleccionadas mediante procedimientos tcnicos, teniendo en cuenta que
cada elemento de la poblacin tiene la misma posibilidad de ser seleccionada; los elementos
muestrales, representan a la poblacin y trabajando con ellos, tranquilamente pueden extraerse
conclusiones y tomar decisiones.
Los indicadores obtenidos procesando a estos elementos muestrales, se llaman estadsticos; los
indicadores de la poblacin, se llaman parmetros; determinando los estadsticos, se estar en
condiciones de determinar o estimar los parmetros poblacionales, los cuales dentro de ste se
tienen: la media, la varianza, la desviacin estndar y la proporcin poblacional; de igual modo en el
caso de trabajar con dos o ms poblaciones se pueden obtener otros indicadores, como las
diferencias de medias poblacionales, las razones de varianza, y los diseos experimentales.
Cuando exista la necesidad de estimar un parmetro poblacional, puede hacerse siguiendo la tcnica
de la estimacin puntual, o la estimacin por intervalos de confianza, o mediante la prueba de
hiptesis.

ESTIMACIN PUNTUAL DE UN PARMETRO POBLACIONAL


Se dice que una estimacin es puntual, cuando el estadstico calculado es igual al parmetro
poblacional; un caso particular es cuando la media de una muestra conocida por

es igual a la

media poblacional ; cuando esto sucede se dice que la media muestral es un buen estimador de la
media poblacional; igual sucede cuando se estima la proporcin poblacional p, en base a la
proporcin muestral ps; sin embargo no siempre los estadsticos resultan ser buenos estimadores
poblacionales, como sucede con la varianza muestral, debido a que ste depende del tamao de la
muestra; cuando ms grande sea la muestra, menor ser el error de estimacin, y al contrario,
cuando ms pequeo sea sta, mayor ser el error; por ello se dice que la s 2 no es un buen
estimador de la 2.

ESTIMACIN POR INTERVALOS DE CONFIANZA DE LA MEDIA POBLACIONAL


Como una estimacin puntual no siempre ofrecer un resultado confiable, ya que habr una
posibilidad de que esta estimacin no se ha obtenido correctamente debido a las caractersticas de la
muestra, puede estimarse la media poblacional dentro de ciertos lmites, llamados intervalos de
confianza.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 5 de 85
Si una poblacin se distribuye normalmente, se
sabe que aproximadamente el 95% de las
observaciones se encuentran dentro del intervalo
2; esto es que existir una probabilidad de
que el 95% de las observaciones se encontrar
dentro del intervalo [ - 2, + 2] tal como se
esquematiza en la figura adjunta.
Los valores de la media se desvan en 2, tanto
hacia la derecha como a la izquierda; esa
desviacin es conocida como error de
estimacin; y ambos constituyen el nivel de
confianza; el nmero 2, que correctamente se
puede determinar al fijarse un nivel de confianza,
de una tabla de distribucin normal, se denomina
Fig. 1.1
El 95% de las observaciones se
coeficiente de estimacin y se denota por zc;
encontrar aproximadamente dentro del intervalo
tratndose de muestras del cual se quiere
estimar a la poblacin,

x =

especificado

A manera de ejemplo; cuando se desee conocer el promedio de los niveles de ingresos mensuales de
los ingenieros informticos, alguien podra manifestar
que estos ingresos podran estar
comprendidos entre los S/ 2 000 y S/ 5 000; otro entrevistado podra manifestar que estos ingresos
podran estar comprendidos entre los S/ 3 000 y S/ 4 000, y as sucesivamente. Esta forma de hacer
estas apreciaciones, es una estimacin basada en ciertos mrgenes llamados intervalos de
confianza; para hacer esta estimacin se toma una muestra poblacional de cierto tamao n;
asumiendo que esta se distribuye normalmente, se determina su media muestral y con ella se estima
la media poblacional, siguiendo implcitamente los procedimientos arriba mostrados.
Al desear estimar la media poblacional mediante intervalos de confianza, podra suceder que la
varianza poblacional es conocida, o es supuestamente conocida.
Estimacin de la media poblacional, conocido su varianza poblacional
Si de una poblacin infinita que se distribuye normalmente, donde desde ya se conoce por
experiencias anteriores su varianza poblacional 2, se extrae una muestra aleatoria de tamao n y
de esta muestra se determina su media muestral

entonces podra existir la necesidad de

estimar su media poblacional , para ello se podra asumir que esta media debera estar
comprendido dentro de un intervalo definido por [L1, L2]; esto es L1 < < L2.
La amplitud del intervalo estar determinada por el nivel de confianza con el cual se desea estimar la
media poblacional, lo cual podra ser un 95%, un 90%, su eleccin depender del carcter de la
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 6 de 85
investigacin; en trminos generales se le denota por 1 - , lo cual significar que existir una
probabilidad de 1 de que la media poblacional se encuentra dentro de este intervalo; el resto, ser
una probabilidad de que esta media est fuera del intervalo; la Fig 1.2 ilustra el carcter de este
planteamiento.

Fig. 1.2 Estimacin de la media poblacional mediante un intervalo de confianza


Esta figura indica que siempre habr una posibilidad de que la media poblacional estar dentro de
estos dos lmites L1 y L2, el cual se lo denota por: P(L1 L2) = 1 - ; de este modo, podra
afirmarse que en el peor de los casos esta media estar en L1 y en el mejor de los casos en L2, donde
L1 =

- y L2 =

+ ; lo normal sera que la media poblacional coincida con la media

muestral; la distancia geomtrica de la media muestral a los extremos de los lmites L 1 y L2, se
conocen como error de estimacin .
Al hacer la estimacin, la probabilidad 1 , se llama nivel de confianza y se prefija de antemano y
ello determina la probabilidad de que la media poblacional estar comprendido por estos lmites;
define la probabilidad de equivocarse al fijar este intervalo. De igual manera define el mximo error
de estimacin del parmetro, y es igual: = L1 - = L2 - ; si se desea que este error sea lo ms
pequeo posible, implicar que el tamao de la muestra sea cada vez ms grande.
Establecido el nivel de confianza con el cual se desea estimar la media poblacional, sus extremos
crticos sealados por L1 y L2, pueden obtenerse utilizando la tabla de distribucin normal estndar
conocidos por zc; el error de estimacin est asociado e este valor y a la desviacin estndar de

n
la poblacin del siguiente modo: = zc*
.
De esta expresin puede concluirse que un nivel de confianza muy grande, generar un valor crtico
zc muy grande, por lo cual el error de estimacin tambin se har ms grande; y a la inversa, cuanto
ms pequeo sea el nivel de confianza, generar un valor crtico z c ms pequeo, y por ende un error
de estimacin ms pequeo; por lo general, cuando se quiere hacer estimaciones por esta
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 7 de 85
modalidad, se toma un intervalo de confianza del 95% o del 99%, dependiendo de la naturaleza del
estudio.
Por otro lado, tambin analizando la expresin del error, puede concluirse, que un error cada vez ms
pequeo, demandar que el tamao de la muestra sea ms grande, y una muestra ms pequea,
generar un error de estimacin cada vez ms grande.
Reemplazando estas expresiones en el intervalo de confianza,
comprendido dentro de los intervalos:

x
: [

zc*

x
,

la media poblacional estar

+ zc*

Cuando la poblacin es finita, deber aplicrsele el ajuste poblacional:

x
de la poblacin del siguiente modo:

zc*

N n
N 1

N n
N 1 , siendo N el tamao

x
,

+ zc*

N n
N 1

Ejemplo 1.1 Con la finalidad de conocer el promedio de gastos mensuales en telefona mvil, se
toma una muestra de 35 usuarios de este equipo, quienes reportaron los siguientes gastos
mensuales en Nuevos Soles:
50 55 3
34 25 20 30
34 55 6
5
45 50 52 5
3
3
2
6
50
0
0
0
0
5
0
7
1
33 42 4
45 47 50 55
56 50 4
3
30 36 38 40
1
0
2
Encuentre un intervalo de confianza del 95% para estimar el promedio de gastos de esta poblacin.
Solucin: El promedio

de gastos de esta muestra n = 35, es de S/ 42,23 mensuales; como la

muestra es grande, se puede asumir que la poblacin sigue una distribucin normal con varianza

= 116,77 y desviacin estndar = S/ 10,81; el coeficiente crtico al 95% es z c = 1,96; por lo

x
tanto el intervalo de confianza ser:

zc*

; reemplazando valores se obtiene: [S/38,65;

S/45,81].
Los clculos de este intervalo de confianza pueden simplificarse haciendo uso del Minitab; para ello
ingrese estos datos en una columna, luego siga la secuencia: Stat Basic Statistics 1-Sample Z; en
esta ventana introduzca el nombre de la columna donde estn sus datos; introduzca el valor de la
desviacin estndar; en Opciones defina el Nivel de confianza 95,0, luego pulse aceptar y el sistema
le mostrar: (38,65; 45,81)
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 8 de 85
Estimacin de la media poblacional, cuando su varianza poblacional es desconocida
En este caso, de la poblacin que se supone sigue tambin una distribucin normal, se sigue el
mismo procedimiento anterior: se extrae una muestra aleatoria de tamao n, y de esta se obtiene su
media muestral

y varianza muestral s2, pero teniendo en cuenta que la muestra sigue una

distribucin t con r = n -1 grados de libertad, donde el error de estimacin ser: = tc*


Si la poblacin es infinita

s
n
.

o finita, se desarrollan los mismos ajustes poblacionales que el caso

s
n

x
anterior; por lo tanto la media poblacional estar comprendido: : [

s
n

x
],para poblaciones infinitas, y :

tc*

N n
N 1

t c*

s
n

x
,

+ tc*

s
n

x
+ tc*

N n
N 1

],

para

poblaciones finitas.
Ejemplo 1.2 Los ingresos mensuales de los ingenieros informticos se distribuyen normalmente; a fin
de estimar los ingresos mensuales de los 500 ingenieros informticos, debidamente colegiados, se
selecciona al azar una muestra de 12 ingenieros, y se encuentra que cada uno de ellos manifestaron
estar percibiendo mensualmente los siguientes montos en S/: 4 300 2 800 3 500 4 100 1 890
2 550
1 980
3 100
3 000
2 200
3 400
4 600. Encuentre un intervalo de confianza del
95%, para estimar el nivel de ingresos de toda la poblacin de ingenieros.
Solucin.
De esta muestra se obtiene que el promedio de ingresos mensuales

es de S/ 3 188,3333 con

una desviacin estndar de s = S/ 897,82397. La muestra tiene una distribucin t con r = 11 g.l, por lo
tanto, al 95%, su tc = 2,201; el error de estimacin de acuerdo a la frmula establecida con los
ajustes poblacionales ser = S/ 564,1314; por lo tanto se espera que el promedio de ingresos
mensuales de los ingenieros informticos est dentro del intervalo: [S/ 2 554,20 S/ 3 682,46].
Resuelva este problema utilizando el Minitab
Estimacin de la proporcin poblacional
La proporcin poblacional p, tambin puede ser estimada mediante su proporcin muestral p s
siguiendo el mismo anlisis precedente, teniendo en cuenta que en este caso que = p y
la desviacin estndar =
Inferencia Estadstica

p sqs

= ps;

.
Ciclo 2013-I I

Moiss E. Armas

Pgina 9 de 85

EJERCICIOS
1.1.
Seale (F) o verdadero (V) para cada una de las siguientes proposiciones:
( ) Un parmetro puede estimarse a base de su poblacin.
( ) La estimacin de una parmetro solo puede hacerse puntualmente.
( ) Una proposicin deja de ser proposicin cuando es falsa.
( ) No es necesario hacer estimaciones para conocer los parmetros poblacionales.
( ) La varianza muestral es un buen estimador del parmetro poblacional.
( ) Cuanto ms grande es el nivel de confianza, mejor es la estimacin del parmetro.
( ) El error de estimacin, depende del nivel de confianza.
( ) Los estadsticos pueden ser estimados.
( ) El promedio de notas de una muestra de alumnos, puede estimar a toda la poblacin.
( ) Para conocer la calidad de servicio de un restaurante debe hacerse una estimacin.
1.2.
Indique la alternativa correcta, para cada una de las preguntas:
En una estimacin de parmetros debe usar:
a) Datos poblacionales.
b) Datos muestrales.
c) Datos poblacionales o muestrales.
d) Solamente datos poblacionales.
La estimacin de parmetros puede servir:
a)
b)
c)
d)
e)

Solo para conocer la media muestral.


Solo para conocer la varianza.
Solo para conocer la media y la varianza.
Conocer una medida poblacional.
Para conocer sus valores representativos.

Una estimacin de parmetros se hace:


a) Solo seleccionado una muestra aleatoria de pequeo tamao.
b) Solo seleccionado una muestra aleatoria de tamao grande.
c) Solo seleccionando una muestra aleatoria de cualquier tamao.
d) No hay necesidad de estimar parmetros.
1.3.
Cul es el objeto de hacer estimaciones de parmetros?
1.4.
En qu casos se pueden hacer estimaciones puntuales, y qu efecto tendran en los
resultados?
1.5.
Considere que los alumnos de ingeniera de la Universidad, en estos momentos afrontan
grandes problemas econmicos que les dificulta contar con los suficientes recursos financieros
como para seguir estudiando dentro de las aulas universitarias, y que por el momento, usted, no
cuenta con la informacin exacta como para establecer un indicador, de qu manera lo
obtendra, considerando que al presente cuenta con las herramientas adecuadas?
1.6.
El promedio de nota de los alumnos de ingeniera se distribuye normalmente con una
desviacin estndar de 2,53. Se toma una muestra aleatoria de 12 alumnos, y los resultados de
sus respectivos promedios de notas fueron: 13,2, 14,1, 07,8, 10,4, 11,8, 13,3, 06,9, 10,5,
13,2, 12,4, 08,5, y 14,2, respectivamente. a) Estime un intervalo de confianza del 95% para
poder apreciar el promedio de notas de todos los alumnos de ingeniera. b) Considere el caso
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 10 de 85
que la poblacin estudiantil est conformado por 456 alumnos; estime un intervalo de confianza
del 95% para apreciar el promedio de notas de toda la poblacin estudiantil.
1.7.
Se desea estimar el promedio a asistencia a cursos de capacitacin, de los profesionales de
ingeniera radicados en la ciudad de Lima, durante el ao 2010; con tal propsito se tom una
muestra aleatoria de siete ingenieros que participaron en determinados cursos, y las respuestas
que se obtuvieron fueron los siguientes: 2, 3, 0, 2,
5, 4, 1 asistencias a diferentes
cursos respectivamente. Se estima que la asistencia a los cursos de capacitacin sigue una
distribucin normal.
a) Mediante una estimacin puntual, indique, de qu manera se puede estimar el promedio de
asistencia a los cursos de capacitacin de los ingenieros de la ciudad de Lima.
b) Mediante un intervalo de confianza del 92% y otro, del 95%, estime el promedio de asistencia
a los cursos de capacitacin; explique la diferencia de sus resultados con respecto al anterior,
y la diferencia entre estos ltimos.
c) Considere que la poblacin de ingenieros est conformado por 356 profesionales; resuelva los
mismos problemas considerando los tems a) y b).
1.8.
Se llev una encuesta para estudiar el grado de conocimiento en el curso de Base de Datos, a
una muestra de 34 alumnos estudiantes de ingeniera informtica, de los cuales solo 8
manifestaban saber algo de este tema. Encuentre un intervalo de confianza del 98%, para estimar
la poblacin estudiantil, que se supo conocen este tema, y adems explique el error de
estimacin que podra cometerse.
1.9.
Una empresa de material elctrico fabrica bombillas de alumbrado cuyo tiempo de duracin
est aproximadamente distribuida de forma normal, con una desviacin estndar de 40 horas. Si
una muestra de 51 bombillas tiene una duracin promedio de 780 horas, encuentre un intervalo
de confianza de 96% para la media de la poblacin de todas las bombillas que produce esta
empresa; adems explique qu tan grande sera el tamao de la muestra, para que el error de
estimar la media total, sea menor el error encontrado.
1.10. Una mquina produce piezas metlicas de forma cilndrica; se toma muestra aleatoria de las
piezas y los dimetros son: 1,01, 0,98, 1,03, 1,02, 0,98, 0,97, 0,99, 1,04, 0,97 centmetros.
Encuentre un intervalo de confianza del 98% para estimar el dimetro medio de las piezas de esta
mquina; suponga una distribucin aproximadamente normal.
1.11. El 13% de las motobombas hidrulicas, que una empresa fabrica, tienden a fallar a los dos
aos de funcionamiento, por problemas de diseo y componentes en la materia prima al momento
de su fabricacin; se toma una muestra aleatoria de 40 piezas de un lote de 500 motobombas.
a) Encuentre un intervalo de confianza del 99% para estimar el porcentaje de piezas hidrulicas
que podran estar fallando. b) Si el intervalo de confianza estimado para este lote fabricado
estuvo dentro de los mrgenes 10% y 16%, con qu nivel de confianza se lo determin?
1.12. A continuacin se tiene el estado nutricional de los alumnos de ingeniera informtica de una
universidad.
1. EN ++
2. O
3. EN +
4. O
5. EN ++
6. N
7. O
Inferencia Estadstica

8. N
9. EN +
10. EN ++
11. N
12. N
13. EN ++
14. N

15. O
16. EN +
17. O
18. EN ++
19. O
20. EN +
21. N
Ciclo 2013-I I

22. N
23. EN +
24. EN ++
25. EN +
26. EN +
27. O
28. O

29. EN +
30. O
31. N
32. O
33. N
34. EN ++
35. O

36. EN +
37. O
38. EN ++
39. N
40. O
41. N
42. EN +

43. EN ++
44. N
45. EN +
46. O
47. EN ++
48. EN +
49. O
Moiss E. Armas

Pgina 11 de 85
Donde: N= normal
EN + = Desnutrido en 1er grado.
O = obeso
EN ++ = Desnutrido en 2do grado.
a) Encuentre un intervalo de confianza del 95% para estimar el promedio de desnutridos en
primer grado.
b) Encuentre un intervalo de confianza del 93% para estimar el promedio de obesos.
c) Compare y analice estos dos resultados.
1.13. Una muestra seleccionadas al azar, de 37 transportistas que conducen camiones de carga en
el territorio peruano, manifestaron que en promedio sus camiones haban recorrido 17 809
kilmetros en un ao, con una desviacin estndar de 2 354 kilmetros, asumiendo que el
kilometraje de los transportistas se distribuye normalmente y el Ministerio de Transportes y
Comunicaciones, tiene empadronados a 1 148 transportistas.
a) Construya un intervalo de confianza del 99% para estimar el promedio de kilmetros que
anualmente recorren los camioneros en todo el Per.
b) Qu puede afirmar con una probabilidad de 99% de confianza, acerca del tamao posible del
error a cometerse, si se estima que el nmero promedio de camiones manejados por sus
respectivos propietarios es de 17 809 kilmetros?
1.14. Los ingresos mensuales de un grupo de ingenieros informticos fueron estimados entre los S/
2 300 y S/ 3 900; estime la probabilidad con el cual se determin este intervalo, si la muestra
tomada fue de 14 ingenieros y stos presentaron una desviacin estndar en sus ingresos de S/
654.
1.15. De una muestra de 86 familias de un barrio de Lima, se supo que solo el 25% de ellos
manifestaron contar con equipos de cmputo dotados de internet; encuentre un intervalo de
confianza del 95% para poder estudiar la poblacin total de este barrio compuesto de 1 200
familias, los que cuentan con servicios de internet.
1.16. A fin de conocer el temperamento del electorado peruano, ante el advenimiento de las
elecciones municipales de una provincia del Per, se toma una muestra 112 electores, de los
cuales 40 dijeron que votaran por el candidato A; encuentre un intervalo de confianza del 96%
para conocer la fraccin de electores que apoyan a este candidato.
1.17. Un distribuidor de discos DVD, utiliza un conjunto de pruebas para evaluar la funcin elctrica
de su producto; todos los reproductores de DVD, deben pasar las pruebas diseadas para tales
fines, antes de ser lanzados al mercado, para su respectiva comercializacin. Se tom una
muestra aleatoria de 356 DVD, de los cuales se encontr que ocho fallan en una o ms de las
pruebas; encuentre un intervalo de confianza del 99% para determinar la proporcin de
reproductores DVD de la poblacin que pasan todas las pruebas.
1.18. Un estudio realizado a 478 clientes que adquirieron equipos de cmputo en la ciudad de
Lima, el ao 2011, en relacin al grado de satisfaccin, y el costo de los equipos, mostr los
siguientes resultados:
Tabla 1.1
Grado de satisfaccin de acuerdo al costo de los equipos de cmputo, de una
muestra de clientes, en la ciudad de en el ao.

Costo de los equipos


Grado
satisfaccin

de
Costoso
N

Inferencia Estadstica

%
Ciclo 2013-I I

Econmico
N

Total

%
Moiss E. Armas

Pgina 12 de 85
Satisfecho
Insatisfecho
Total

223
105

268

a) Complete las celdas vacas de esta tabla.


b) Encuentre un intervalo de confianza del 98%, para estimar el porcentaje de clientes que
consideran econmico los equipos.
c) Determine un intervalo de confianza del 90%, para estimar el porcentaje de clientes
insatisfechos con el servicio.
d) Determine un intervalo de confianza del 95% para estimar la diferencia entre clientes
satisfecho e insatisfecho, respecto al costo de los equipos, considerando un margen de error
de estimacin en 3%.
e) Si el intervalo de confianza de clientes que consideraron costoso e insatisfechos con estos
equipos fue determinado entre el 60,00 y 70,00%, determine el error con el cual se lo estim,
y la probabilidad de que ese evento haya ocurrido.
f) De qu tamao deber tomarse una muestra poblacional para estudiar el grado de clientes
satisfechos con la compra de estos equipos, asumiendo un nivel de confianza del 95% y un
margen de error del 4%?
1.19. A continuacin se presentan los resultados de una muestra de un grupo de vendedores que
laboran dentro de un centro comercial, donde se ofrecen y venden equipos y servicios de
cmputo; los resultados presentan la respectiva actitud de los vendedores ante el pblico, al
momento de atender a los clientes, bajo sus requerimientos:
Tabla 1.2
Nivel de estrs y afn de servicios de una muestra de empleados
de un centro comercial..

Empleado
1
2
3

Nivel de estrs
1
2
2

Afn de Servicio
2
1
1

4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

1
2
1
2
1
1
1
2
1
2
2
2
1
2
1
2
2
1

2
1
2
1
1
2
2
1
1
2
1
2
1
1
2
1
1
2

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 13 de 85
22
23
24
Donde: Estrs: 1 = Alta

2
1
1

1
2
1
Afn de Servicio:

2 = Normal

1 = Buena
2 = Poca

a) Estime un intervalo de confianza del 92% para conocer el grado de estrs Alta de los
empleados.
b) Determine el intervalo de confianza del 95% para conocer que los empleados muestran un
buen afn de servicio.
c) Determine el error absoluto al estimar con un intervalo de confianza del 96%, el grado de
estrs normal de los empleados.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 14 de 85

II.

SELECCIN DE TAMAO DE MUESTRA, ESTIMACIN DE LA


VARIANZA POBLACIONAL Y RAZONES DE VARIANZA POR
INTERVALOS DE CONFIANZA

SELECCIN DE TAMAO DE MUESTRA


El tamao de muestra que debe seleccionarse de una poblacin, est asociado a un margen de error
con el que se los deseara estimar, as como un cierto nivel de confianza; es evidente que cuanto ms
grande sea el tamao de la muestra, mayor ser la seguridad de que los resultados muestrales
reflejan las caractersticas poblacionales; sin embargo tambin es preciso indicar, que cuanto ms
grande sea este tamao, los problemas de trabajar con stas sern ms complicadas, ya que
demandarn tiempo y esfuerzo para estudiarlo, todo lo cual podra atentar contra la economa de los
interesados en la investigacin. En Estadstica no es necesario trabajar con toda la poblacin; basta
con seleccionar su muestra representativa, y con los resultados de sta, inferir para toda la poblacin,
el problema es determinar de qu tamao debera seleccionarse la muestra, para estar realmente
seguros de que ste tamao representar efectivamente a la poblacin.
El tamao de muestra se puede seleccionar de una poblacin infinita o de una poblacin finita, para
ello se sigue los siguientes procedimientos:
a)
b)
c)
d)

Seleccionar una muestra aleatoria de cualquier tamao, y determinar su varianza.


Estimar con qu margen de error deber estimarse la media poblacional.
Estimar con qu nivel de confianza 1 - deber estimarse tambin la media poblacional.
Relacionar los siguientes casos:

s
n
i)

Si la poblacin es infinita: = zc*


, donde zc es el valor crtico de una distribucin
normal estandarizada, el cual se obtiene de acuerdo al nivel de confianza estimado, s es
la desviacin estndar de la muestra y , el margen de error estimado; por lo tanto
despejando n =

ii)

z cs
)2.

Si la poblacin es finita, de tamao N entonces =


2

despejando n, se obtendr: n =

Inferencia Estadstica

N n
N 1 , por lo tanto

z cs N
2
2
2
z c s + ( N 1)

Ciclo 2013-I I

zc*

s
n

Moiss E. Armas

Pgina 15 de 85
Ejemplo 2.1 Se desea estudiar el nivel de gastos que desarrollan los padres de familia en todo lo
concerniente al proceso de inicio del ao escolar de sus hijos, en la provincia de Huaura; de ello no
se cuenta con ningn antecedente, por lo que se asume que este estudio tienen la caracterstica de
ser original y novedoso; como no se sabe qu tamao de muestra seleccionar, un grupo de entusiasta
en estadstica, selecciona una muestra aleatoria de siete padres de familia, y encuentra que stos
desarrollaban gastos en los siguientes montos S/: 565
420
350
620
187
401 367,
respectivamente, por cada uno de ellos.
Se desea saber, de qu tamao deber seleccionarse una muestra de padres de familia, a fin de
conocer realmente el promedio de gastos en sus hijos, al inicio del ao escolar, porque esta muestra
de tamao siete, al parecer no es lo suficientemente representativo; para ello considere un nivel de
confianza del 95% y un margen de error de a lo ms de S/ 50.
Solucin.
Como la poblacin se asume que es infinita, la frmula que permitir determinar el tamao de la

s
n
muestra a seleccionar ser = zc*
; al 95% zc = 1,96; la desviacin estndar se obtiene de los
datos del problema y es igual a s = S/ 143,32680, el error mximo est dado por = S/ 50;
despejando n se obtiene que sta debe ser mayor de 32 padres de familia.
Ejemplo 2.2 Considere que se est interesado en estudiar el comportamiento de las personas que
hacen uso de los Smartphone, entre todos aquellos que hacen uso de esta moderna tecnologa de
informacin; para ello se cuenta con una poblacin de 350 usuarios de la ms diversidad de equipos
y modelos; hasta el momento no se sabe qu tamao de muestra deber seleccionarse, ya que
entrevistar a los 350 usuarios sera complicado y engorroso; por lo tanto asuma que el nivel de
confianza con el que se lo estimar ser del 95%, con un error mximo de 5%.
Solucin.
La metodologa ser seleccionar a una muestra y de ellos qu proporcin estn haciendo uso de los
Smartphone; supngase que se seleccion inicialmente una muestra de 16 personas y de ellas se
obtuvo que solo 5 hacan uso de esta tecnologa; por lo tanto p s =
luego =

p sqs

5
16

= 0,3125 y su qs = 0,6875;

; siendo N = 350, n = 16, = 0,05 y zc = 1,96.

Aplicando la frmula para determinar tamao de muestra con ajuste poblacional se obtiene que el
tamao de muestra que realmente debe seleccionarse para estudiar el comportamiento de los
usuarios de los Smartphone debe ser mayor de 87.
ESTIMACIN DE LA DIFERENCIA DE DOS MEDIAS
INTERVALOS DE CONFIANZA

Inferencia Estadstica

Ciclo 2013-I I

POBLACIONALES MEDIANTE

Moiss E. Armas

Pgina 16 de 85
Cuando se est interesado en estimar las diferencias de dos medias poblaciones que se distribuyen
normalmente, mediante intervalos de confianza, podra suceder que se conocen sus respectivas
varianzas poblacionales, o supuestamente se los conoce.
a) Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza,
cuando se conocen sus varianzas poblacionales
Para estimar mediante intervalos de confianza, con un nivel de confianza 1 la diferencia de
dos medias poblaciones (1 - 2), cuando sus respectivas varianzas poblacionales son conocidas
2

2 y 2 , se extraen dos muestras de tamaos n1 y n2, respectivamente de cada poblacin; la


x 1
diferencia (1 - 2) estar comprendido dentro del intervalo: [
x
( 1x 2 )

x
( 1x 2)
x 2 z c

], siendo

el error estndar de la diferencia de estas dos medias, equivalente a:

x
( 1x 2 )=

12 22
+
n1 n2

b) Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza,


cuando supuestamente se conocen sus varianzas poblacionales
Cuando supuestamente se conocen sus varianzas poblacionales, se extraen dos muestras de
cada poblacin de tamaos n1 y n2, luego se calculan sus respectivas varianzas muestrales s 12 y
s22; la diferencia de estas medias muestrales siguen una distribucin t, con r = n 1 + n2 2 g.l; la
estimacin de la diferencia de sus medias poblacionales, mediante intervalos de confianza se

x 1
encontrar dentro del intervalo: (1 - 2) [

x
1x
(
2)
], donde:
x 2 t cs

s2 s2
0( 1x2 )= 0 + 0 , y s02( x 1x 2 )
n1 n2
s

( n11 )s 12+ ( n21 )s 22


n1 +n22

define el promedio

de la diferencia de la varianza de sus medias muestrales.


Con el software Minitab se puede hacer estimaciones de intervalos de confianza de la diferencia de
dos medias poblacionales, cuando las muestras poblacionales tienen el mismo tamao, para ello
introduzca los datos de sus muestras en dos columnas y a continuacin siga la secuencia:
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 17 de 85
Stat Basic Statistics Paired t. En esta ventana Escoja Samples columns, En primera muestra

Escriba el nombre de la primera variable; en la Segunda columna, escriba el nombre de la segunda


variable; en options escoja el intervalo de confianza, luego pulse dos veces Ok y obtendr el intervalo
de confianza deseado.
ESTIMACIN DE LA VARIANZA POBLACIONAL MEDIANTE INTERVALOS DE CONFIANZA
Para hacer esta estimacin se utiliza la distribucin chi cuadrado. Si de una poblacin que sigue una
distribucin normal se extrae una muestra de tamao n y se obtiene su varianza s 2, entonces el

(n1)s
2

estadstico 2=

sigue una distribucin chi cuadrado con r = n 1 g.l.; con esta referencia

puede estimarse su varianza poblacional 2 con un nivel de confianza 1 ; una idea de la forma de
estimarlo se obtiene con la ayuda de un grfico de la curva de distribucin de la chi, como lo
mostrado:

1-

x21

x2

x22

Fig. 2.1 Estimacin de la varianza poblacional mediante un intervalo de confianza

x21

x2

x22

El chi cuadrado poblacional estar dentro de los intervalos


para un nivel de
confianza 1 y un tamao de muestra n; de acuerdo a esto se obtiene los coeficientes crticos del
chi cuadrado, haciendo uso de la respectiva tabla, donde 12(/2;n-1) y 22(1-/2; n-1), y 2= (n
1)s2/ 2 , utilizando estas expresiones en la relacin de desigualdad de estimacin del intervalo se
obtiene los lmites donde podrn estar estimado la varianza poblacional.
ESTIMACIN DE LA
RAZN DE DOS VARIANZAS
INTERVALOS DE CONFIANZA

POBLACIONALES MEDIANTE

Tambin se puede estimar las razones de variacin de dos poblaciones que se distribuyen
normalmente, dentro de un intervalo de confianza 1 ; para ello se extraen sus respectivas
muestras de tamaos n1 y n2 respectivamente; de igual modo, se calculan sus respectivas varianzas

muestrales s12 y s22, donde s12 > s22. El estadstico F =

s 12
12
s 22
22

sigue una distribucin F con r1 = n1 -1

y r2 = n2-1 grados de libertad, respectivamente.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 18 de 85
De acuerdo al nivel de confianza 1 , de la tabla F, se determina sus valores crticos F1 y F2, y
haciendo la respectiva deduccin de F, se podr estimar la razn

12
22

dentro del intervalo de

confianza, la siguiente figura muestra el criterio de estimacin.

Fig. 2.2 Estimacin de la razn de dos varianzas poblacionales mediante intervalos de confianza

Ejemplo 2.3 En una encuesta, sobre gastos mensuales en telefona mvil desarrollada a un grupo de
hombres y otro grupo de mujeres, se encontr que cada uno de los entrevistados manifest gastar los
siguientes montos mensuales, en S/:
Hombres: 40 38 20 25 23 31 36 30 32 y 33;
Mujeres: 42 39 41 43 28 26 29 36 31 34 37 33 y 30.
a) Encuentre un intervalo de confianza del 95% para estimar el promedio de gastos mensuales en
telefona fija, de las mujeres, respecto a los hombres.
b) Encuentre un intervalo de confianza del 95% para estimar la variacin de gasto mensual entre
este grupo de poblaciones.
Solucin:
a) El promedio de gastos mensuales en telefona de los hombres es de S/ 30,80, y el de las mujeres
es de S/ 34,54. Al 95% de nivel de confianza, t c1(0,025; 21) = -2,080 y tc2(0,975;21) = 2,080; la varianza
promedio

de

esta

diferencia

entre

mujeres

hombres

s02(

x 2x 1 )

x
2

( n11 )s 1 + ( n21 )s 2
n1 +n22

, ser:

0( 2x 1)=
s

s0 s0
+
n1 n2

= 2,532 S/.

Por lo tanto, el intervalo de confianza para esta diferencia de ambas medias poblacionales ser:

x 2
: (2 - 1) [

Inferencia Estadstica

x
( 1x 2) = [0; 9,01] S/.
x 1 t cs

Ciclo 2013-I I

Moiss E. Armas

Pgina 19 de 85
b) Se trata de hallar un intervalo de confianza para dos razones de varianza; la varianza de gastos
mensuales de los hombres en telefona mvil es de s 12 = 42,400 (S/)2, y el de las mujeres s 22 =
31,603 (S/)2. El intervalo de confianza del 95% estar limitado por F 1 y F2; estando F dentro de
estos lmites como lo muestra la Fig. 2.3.
F1(0,025; r1, r2) F F2(0,975, r1, r2) donde r1 = 9 corresponde a los grados de libertad del nmero de
2

hombres y r2 = 12, al nmero de grados de libertad de las mujeres; como F =

s1
2
1
2
s 2 , entonces:
2
2

F1(0,025; 9, 12) F F2(0,975, 9, 12); reemplazando F por su equivalente y despejando para hallar la razn
de cambio, se obtiene:

S1
2
S2
F 2(0,975 ;9,12)

2
1
2
2

S1
2
S2
F 1(0,005 ;9,12)

Reemplazando datos por sus respectivos equivalentes, se tiene que este intervalo de
confianza estar dentro de los rangos: [0,3434; 4,5718] (S/)2; en trminos de S/: [0,59; 2,19].

EJERCICIOS
2.1.
El promedio de duracin de un lote de 400 bateras de las Laptop se distribuye normalmente
con una desviacin estndar de 0,95 horas. Se toma una muestra de un grupo de bateras y se
encontr que en promedio presentaban las siguientes duraciones en horas: 3,05 4,10, 3,84
3,26 3,09
3,45 3,67
3,83
3,21 4,05
3,87, antes de ser recargadas.
a) Estime un intervalo de confianza del 95% para poder conocer el tiempo promedio de duracin
del lote de bateras.
b) De qu tamao deber tomarse una muestra de estas bateras, para estudiar el tiempo de
duracin de estas, asumiendo un nivel de confianza del 99% y un margen de error no ms de
15 minutos?
R: a) El caso corresponde a la determinacin del intervalo de confianza, conociendo la varianza poblacional; por lo tanto
al nivel de confianza del 95%, z c = 1,96; el promedio de duracin de las bateras, antes de ser recargadas es

3,584 horas; por lo tanto [3,02 4,14] horas; b) Aplicando el criterio de seleccin de tamao de muestra

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 20 de 85
considerando tamao poblacional N = 400, y un nivel de confianza del 99%, se debe seleccionar una muestra de 67
alumnos.

2.2.
Una muestra de 12 pacientes que acudieron a un hospital, a fin de medir sus niveles de
colesterol en la sangre, mostr los siguientes resultados: 165, 200, 265, 240, 178, 201,
198, 179, 258, 216, 220 y 232, respectivamente.
a) Si el hospital en promedio recibe mensualmente 932 pacientes para hacerse estos anlisis,
de qu tamao deber tomarse la muestra a fin de estimar el nivel promedio de colesterol en
la sangre de esta poblacin?
b) Determine un intervalo de confianza del 95% para estimar el promedio de niveles de colesterol
en la sangre de estos pacientes.
c) Si el error de estimacin en los niveles de colesterol, de estos pacientes, se determin con
un margen de 15, con qu nivel de confianza fue hecho esta estimacin?
d) Si el error de estimacin de los niveles de colesterol, de estos pacientes, se determin con un
margen de 10, y un nivel de confianza del 90%, de qu tamao se determin la muestra de
esta poblacin?
e) Si solamente el 33% de estos pacientes muestran niveles normales de colesterol, estime un
intervalo de confianza del 95%, para conocer el comportamiento poblacional, asumiendo que
se cometa un margen de error de no ms del 4%.
f) Determine un intervalo de confianza del 95% para conocer la variacin de los niveles de
colesterol de los pacientes de este hospital.
2.3.
Ante el advenimiento de las prximas elecciones generales, a fin de elegir al nuevo presidente
de la repblica, entre dos candidatos A y B, se desea evaluar la intencin de votos a favor del
candidato A, en la provincia de Huaral; para tales fines, no contando con ninguna informacin al
respecto, se toma una muestra aleatoria de 15 ciudadanos de esta provincia, encontrndose
como respuesta, que seis de ellos manifestaban que iban a votar por este candidato.
a) Si la poblacin de electores est conformada por 8 500 personas, de qu tamao deber
tomarse una muestra?, a fin de estimar el comportamiento poblacional, por este candidato,
asumiendo que el nivel de confianza sea del 93%, y el margen de error de estimacin sea a lo
ms de: i) 7%, ii) 4%, iii) 2%. ( i - 161; ii- 492; iii-1966)
b) Resuelva el mismo problema asumiendo que la poblacin estudiada est conformada por 1
200 ciudadanos. (142)
c) Analice los resultados obtenidos en cada caso.
2.4.
En la facultad de ingeniera industrial de la UNI, la muestra de un grupo de alumnos, mostr el
siguiente rcord acadmico, por cada uno de ellos: 12,1, 13,2, 10,6, 09,8, 10,5, 11,1, 12,2 y
10,8; en tanto, en la UNMSM, otro grupo de alumnos de la misma facultad, mostr los siguientes
promedios: 13,2, 14,1, 09,5, 10,3, 11,4, 12,1, 08,6, 09,9, 12,7 y 12,4. Asumiendo que
la distribucin de notas sigue una distribucin normal, determine:
a) Un intervalo de confianza del 95% para estimar el promedio de las diferencias de notas de los
San Marcos y los de la UNI. -1,4; 1,7
b) Un intervalo de confianza del 95% para estimar la variacin de notas de los alumnos de la
UNI. 0,74; 2,27
c) Un intervalo de confianza del 95% para estimar la variacin de notas de los de San Macos.
1,28; 3,26

d) Un intervalo de confianza del 95% para estimar la razn de variacin de notas de estas
poblaciones estudiantiles. 0,53; 0,61

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 21 de 85
2.5.
En una investigacin desarrollada para conocer los efectos de trabajos prolongados, en los
niveles de triglicridos, en la sangre de los ingenieros informticos, entre quienes practicaban
deportes y tambin entre quienes no los practicaban, mostr los siguientes resultados:
Tabla
Niveles de triglicridos al desarrollar trabajos prolongados, en la sangre
de los ingenieros informticos, entre quienes practican deportes y quienes
no los practica

Deportes
n
Promedio
Desviacin estndar
Hacen deporte
14
152
27,3
No hacen deporte
15
208
22,1
Se considera que las poblaciones siguen distribuciones normales y que ambas varianzas son
supuestamente conocidas; por lo tanto, se pretende estimar la diferencia entre las medias de los
niveles de triglicridos, entre las dos poblaciones, as como la variacin de cambio de estos
niveles, siendo el nivel de confianza del 95%.
2.6.
El promedio general de calificaciones de una muestra de ocho estudiantes en edad escolar
fue de 12 con una desviacin estndar 2,4.
a) Si se desea estimar el promedio general de la poblacin estudiantil con una error de ms o
menos 0,5 puntos, de qu nmero de estudiantes averiguarse sus notas, si nivel de
confianza debe ser del 95%? R:89
b) Si la poblacin estudiantil estuvo conformada por 523 alumnos, de qu tamao se determin
su muestra, sabiendo que el promedio general de notas estimado estuvo comprendido entre
11 y 13.
2.7.
De 15 libros tomadas al azar, publicadas por la Editorial Las Amricas, dos de ellos
presentaban fallas de compaginacin.
a) Cuntos libros debern revisarse para mantener un nivel de error mximo del 5%, a un nivel
de confianza del 99%?
b) Encuentre un intervalo de confianza, para estimar la proporcin de libros con fallas de
compaginacin, si se espera que el margen de error en su compaginacin no debe ser mayor
del 3%.
2.8.
Una mquina envasadora de lubricantes debe hacerlo en frascos de 50 centmetros cbicos
(cc), de otro modo deber detenerse el proceso de envasado a fin de hacer los respectivos
ajustes a los sifones de llenado. Para averiguar si este proceso se viene desarrollando de
acuerdo a lo establecido, se toman muestras de un determinado nmero de frascos envasados
con este lubricante, los cuales presentaban los volmenes de: 44, 48, 50, 57, 50, 52, 48,
49, 46, 53, 56, 49, 46 y 52 cc respectivamente.
a) Determine el error estndar de la medida de esta muestra.
b) De qu tamao deber ser la nueva muestra, si es que el error estndar de la media
muestral desea reducirse a la mitad?
c) Determine un intervalo de confianza del 99% para estimar el promedio de llenado de la
mquina envasadora.
d) Determine un intervalo de confianza del 99% para estimar las variaciones de cambio de estos
llenados.
2.9. Una muestra de quince clientes que acudan a un cajero automtico de un banco, indic que en
promedio tardaban 2,36 minutos en hacer sus transacciones; si el tiempo de demora en estos
servicios se distribuye normalmente con una desviacin estndar de 0,48 minutos.
a) Determine el error estndar de la media muestral.
b) Determine un intervalo de confianza del 94% para estimar el tiempo promedio de demora de
los clientes en este cajero.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 22 de 85
c) Explique el error de estimacin.
2.10. Un negocio dedicado a la venta de equipos electrodomsticos, ha implementado un sistema
de ventas al crdito, mediante el uso de tarjetas de crdito; sin embargo pasado un determinado
tiempo el Gerente de Ventas reporta que este sistema no funciona en la medida esperada, dado
que existe un alto porcentaje de morosidad de los clientes, por lo que la empresa duplicar
esfuerzos en el cobro de los adeudos. El Gerente toma una muestra de 80 clientes que hacen
uso de esta modalidad de compras y encuentra a 50 morosos, a los que debern aplicar los
cargos por mora:
a) Determine un intervalo de confianza del 95% para estimar la verdadera proporcin de clientes
que utilizan este sistema de ventas, de los cuales se considera que debern estar incurriendo
en morosidad.
b) De qu tamao deber tomarse una nueva muestra, si se considera que el intervalo de
estimacin de la media poblacional sea calculado con un nivel de confianza del 97%, con un
margen de error no mayor del 4%?
2.11. Un sistema artesanal de elaboracin de vasos de cristal indic que una muestra de 13 vasos
est logrando que tengan un volumen de 22 cm3. Encuentre un intervalo de confianza para
estimar la desviacin estndar de su poblacin: i) Al 91% de confianza. ii) Al 93% de confianza. iii)
Al 98% de confianza.
2.12. El 18% de una muestra de 16 alumnos de Bromatologa se encuentran desnutridos, en tanto
que el 25% de una muestra de diez alumnos de Informtica se encuentran, en las mismas
condiciones. Encuentre un intervalo de confianza del 95%, para estimar la razn de variacin de
estos grados nutricionales, entre ambos grupos de alumnos. R:[0,41; 4,70]
2.13. De la Facultad de Medicina de la Universidad, compuesto por 468 alumnos, se selecciona al
azar una muestra de nueve de ellos, de los cuales se obtuvieron sus notas promocionales,
durante el pasado ciclo 2011-II, stas notas fueron: 14,2
13,8
12,5
14,2
10,9
13,2
12,6 12,2 y 12,7, respectivamente.
a) Si el promedio de notas de los alumnos de esta Facultad, fue estimado entre 11,92 y 13,92,
con qu nivel de confianza fue estimado?
b) De qu tamao deber tomarse una muestra de alumnos, si el error de estimacin del
promedio de notas de stos alumnos, no sea mayor de 0,8 puntos, a un nivel de confianza
del 95%? R) a) 1- = 98%, b) n > 151 alumnos
2.14. En la Facultad de ingeniera de una poblacin compuesta de 630 alumnos se quiere estudiar
el grado de apreciacin de las nuevas laptop Intel Core Duo 7, de una determinada marca; como
an no se tiene ninguna informacin, se toma al azar una muestra aleatoria de 12 alumnos a los
cuales se les pregunta si stas laptop tienen buen desempeo; solamente ocho de ellos
contestaron favorablemente.
a) Determine un intervalo de confianza del 95% para estimar el grado de apreciacin de la
poblacin estudiada, asumiendo que el mximo error permisible ser del 5%.
b) De qu tamao deber tomarse una muestra poblacional si el mximo error ser del 5% con
un nivel de confianza del 99%?
2.15. Se desarrolla un estudio a fin de conocer el nivel de ingreso mensuales de los ingenieros
informticos, quienes actualmente se encuentran laborando en los sectores pblicos y privados;
en tal sentido se pudo clasificar en una muestra de estos profesionales, que haban ingenieros
que perciban los siguientes montos:
A
B
C

A
A
B

Inferencia Estadstica

B
A
A

C
C
A

A
B
C

A
B
C

A
B
C

Ciclo 2013-I I

Moiss E. Armas

Pgina 23 de 85
Donde A: representa los ingenieros que ganaban menos de S/ 2000 mensuales; B: los montos
donde los ingenieros ganaban entre S/ 2000 y S/ 4000, y C: los montos donde los ingenieros
ganaban ms de S/ 4000 mensuales. Determine un intervalo de confianza para estimar el
promedio de ingreso de los ingenieros que ganaban ms de S/ 2000, asumiendo que este tenga
un nivel de confianza del 95%.
2.16. Los concesionarios de vehculos de dos marcas diferentes, que estos presentan buenos
kilometrajes por galn de gasolina; a fin de corroborar estas proposiciones, se toman muestras
aleatorias de estas dos marcas de vehculos y se evala su rendimiento, en el consumo de un
galn de gasolina, segn kilometraje recorrido; los resultados se muestran a continuacin:
Vehculo de marca A: 55 50 56 58 59 51 48 47 46, y 52 km/galon
Vehculo de marca B: 59 58 59 45 50 52 60 57 45 48 y 49 km/galn.
Encuentre:
a) Un intervalo de confianza del 95% para estimar la diferencia de consumo de gasolina entre las
marcas de vehculo de la B, respecto a la de marca A.
b) Un intervalo de confianza del 95% para estimar la variacin de cambio, en el consumo de
gasolina de estas dos marcas.
2.17. A continuacin se presenta el estado nutricional de una muestra de los alumnos de ingeniera
informtica de una universidad.
1. EN ++ 8. N
15. O
22. N
29. EN +
36. EN +
43. EN ++
2. O
9. EN +
16. EN +
23. EN +
30. O
37. O
44. N
3. EN +
10. EN ++
17. O
24. EN ++ 31. N
38. EN ++
45. EN +
4. O
11. N
18. EN ++
25. EN +
32. O
39. N
46. O
5. EN ++ 12. N
19. O
26. EN +
33. N
40. O
47. EN ++
6. N
13. EN ++
20. EN +
27. O
34. EN ++ 41. N
48. EN +
7. O
14. N
21. N
28. O
35. O
42. EN +
49. O
Donde: N= normal
EN + = Desnutrido en 1er grado.
O = obeso
EN ++ = Desnutrido en 2do grado.
a) Encuentre un intervalo de confianza del 95% para estimar la diferencia del promedio de
desnutridos en primer grado, con los desnutridos del segundo grado.
b) Encuentre un intervalo de confianza del 93% para estimar la diferencia del promedio de
obesos y los desnutridos.
c) Encuentre un intervalo de confianza del 95% para estimar los niveles de variacin de los
alumnos normales.
d) Encuentre un intervalo de confianza del 95% para estimar la razn de variacin de los
desnutridos y los no desnutridos.
e) Analice e interprete sus resultados.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 24 de 85

III.

ESTIMACIN DE PARMETROS POBLACIONALES MEDIANTE


PRUEBA DE HIPTESIS

HIPTESIS
Una hiptesis es solo una conjetura o suposicin de un hecho que podra suceder o haya sucedido,
pero que an no ha sido demostrado; as por ejemplo, si un empresario estara deseoso de
incursionar en el mercado de la provincia de Huaura, para ello, segn sus asesores en marketing les
aseguran que incursionando en ste mercado, sus utilidades financieras sera altas; en este caso,
solo existe una suposicin de que efectivamente habran ganancias, y basado en esto decide
incursionar en este mercado; sin embargo, existir alguna duda de que probablemente no ocurriese
tal como lo pensado; qu sucedera si luego de haber realizado las inversiones no logra obtener los
resultados esperados?; en el mejor de los caso, tambin podra ocurrir que las estimaciones
preliminares si se cumplieron tal como lo aseguraban sus asesores de marketing.
En una hiptesis solo se conjetura, y producto de los hechos o la evidencia, esa conjetura podra ser
cierta o falsa, ante esta situacin, los investigadores debern decidir qu acciones tomar ante esta
conjetura; la decisin adoptada podra conducir a cuatro resultados posibles:
i.
Haber aceptado una conjetura cierta.
ii.
Haber rechazado una conjetura cierta.
iii.
Haber aceptado una conjetura falsa.
iv.
Haber rechazado una conjetura falsa.
Es evidente que en estas cuatro alternativas, solo las decisiones i) y iv) son las correctas, en cambio
la ii) y la iii) son decisiones incorrectas, y podra traer graves consecuencias para quienes tomaron
esas decisiones equivocadas.
Considrese el caso de que un profesor del curso de Matemtica, considera que los alumnos tienen
bajo coeficiente intelectual y por lo tanto no es posible desarrollar el curso adecuadamente. Esta
suposicin constituye la hiptesis que debe ser demostrada, ya que el profesor supone que los
alumnos son de bajo rendimiento; sin embargo en el desarrollo de la investigacin, podra suceder
estas cuatro alternativas.
i. Se demostr que la suposicin inicial era cierta, por lo tanto el profesor tena la razn.
ii.
No se le da la razn al profesor, pese a que los alumnos presentan bajo coeficiente intelectual.
iii.
Acepta lo que el profesor dice, cuando en realidad los estudiantes, si tienen buen coeficiente
intelectual.
iv.
Rechazar lo afirmado por el profesor, cuando en realidad el profesor tena la razn.
Estos son los casos posibles donde podran presentarse al decidir tomar una decisin en el momento
de plantearse una hiptesis.

CONTRASTE DE HIPTESIS
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 25 de 85
En estadstica cuando se trabaja con hiptesis, se formulan dos hiptesis, una hiptesis nula H 0 y una
hiptesis alternativa H1; la H0 solo se lo formula con el nico propsito de negar lo que se quiere
demostrar, y la H1 es la hiptesis que se quiere demostrar, el que tambin es conocido como la
hiptesis de investigacin.
El objetivo de un contraste de hiptesis es rechazar la H 0, ya que rechazndole, se estara aceptando
la H1, con lo cual se confirmara lo que se quera demostrar; sin embargo surgir los problemas
planteados en el caso anterior, de tomar decisiones incorrectas.

TIPOS DE ERRORES EN UN CONTRASTE DE HIPTESIS


Se comete Error Tipo I, cuando se rechaza una hiptesis verdadera y se comete Error Tipo II,
cuando se acepta una hiptesis falsa, como se est desarrollando conjeturaciones, siempre existir
una probabilidad de cometer Error de Tipo I, a esa probabilidad se le llama nivel de significancia y se
le denota por ; este valor lo asume como riesgo de equivocarse el investigador al momento de hacer
el contraste de hiptesis; por lo general = 5%, cuando se hace contraste de hiptesis relacionados
con conductas humanas y biolgicas, y = 1%, cuando los estudios estn relacionados con las
ciencias fsicas y qumicas, sin embargo, esto es solo una medida referencial, puesto que estos
niveles pueden tener otros valores.
A la probabilidad de cometer Error de Tipo II, se le conoce por , y su valor est asociado al Error Tipo
I. Si se quisiera reducir estos errores, habra que aumentar el tamao de la muestra, ya que cuanto
ms grande sea esta, habrn menores riesgos de equivocacin, sin embargo, por lo que se
manifestado, no es posible ni conveniente trabajar con muestras grandes, para estudiar conductas
poblacionales.

TIPOS DE CONTRASTE DE HIPTESIS


Los contrastes de hiptesis pueden hacerse para demostrar que hay mejora, que hay reduccin o
simplemente no hay ninguna variacin, en las observaciones que vienen desarrollndose; cuando se
trata de buscar mejorar en el sentido elevarlo, o reducirlo, el contraste ser unilateral o de una sola
cola, y cuando el contraste consiste en ser indiferente a cualquiera de estos dos casos, el contraste
ser bilateral o de dos colas.
Al hacer el contraste de hiptesis, por lo general se comienza formulndole en trminos cualitativos,
posteriormente se lo expresa en trminos cuantitativos, que es lo que al final sirve para propsitos de
clculo.

Contraste unilateral por la izquierda,


o de una sola cola; en este caso, el Fig. 3.1 Contraste unilateral por la izquierda
objetivo de la investigacin es reducir;
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 26 de 85
as se podra formular una dieta
alimenticia que tenga por objeto reducir
el peso de las
personas que
sobrepasaron un lmite. La probabilidad
de rechazar la hiptesis nula a un nivel
de significancia estar comprendido
por el rea del sector izquierdo de la
curva.

Fig. 3.2 Contraste unilateral por la derecha.

Contraste unilateral por la derecha,


tambin de una sola cola; en este caso,
el objetivo de la investigacin es mejorar;
as se podra implementar un mtodo de
trabajo que tenga por objeto aumentar la
productividad.
La
probabilidad
de
rechazar la hiptesis nula a un nivel de
significancia estar comprendido por el
rea del sector derecho de la curva.

Contraste bilateral o de dos colas; en


este caso, el objetivo de la investigacin
es mantener el estado de las cosas como
tal; que no haya aumento o no haya
disminucin. La probabilidad de rechazar
la hiptesis nula a un nivel de
significancia estar comprendido por el
rea de los dos sectores extremos de la
curva.; en este caso, se divide en partes Fig. 3.3 Contraste bilateral.
iguales en los dos extremos.
El siguiente ejemplo ilustra el caso de formularse un contraste de hiptesis: En un centro educativo se
ha observado que los alumnos presentan fuertes grados de desnutricin; la direccin de servicio
social, sugiere que a los alumnos se les proporcione cierta dosis de dietas alimenticias a fin de
mejorar estos niveles actuales; la direccin general, sugiere que estas dietas no sern efectivas, por
lo tanto no es conveniente seguir con los consejos de servicio social. El contraste de hiptesis ser en
los trminos siguientes:
H0: La dieta alimenticia, propuesto por servicio social, no mejorar los niveles nutricionales de los
alumnos del centro educativo.
H1: La dieta alimenticia, propuesto por servicio social, si mejorar los niveles nutricionales de los
alumnos del centro educativo.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 27 de 85
Como podr observarse, este contraste de hiptesis es de tipo unilateral, en el sentido de que se
busca mejorar el estado nutricional de los alumnos; la hiptesis nula formulada, se lo hizo solo con el
propsito de negar lo que se desea demostrar, es decir, mejorar el estado nutricional de los alumnos;
la hiptesis alternativa, tratar de demostrar que efectivamente habr mejora proporcionando la dieta
alimenticia propuesto por servicio social; el objetivo de esta investigacin, ser rechazar la hiptesis
nula, para aceptar la hiptesis alternativa; expresndole en trminos cuantitativos esta hiptesis
puede expresarse del siguiente modo: El estado nutricional actual de los alumnos es de un valor a,
proporcionndole la dieta alimenticia, el nuevo estado nutricional ser mayor de este valor, o sea:
H0: = a
H1: > a
La hiptesis nula, siempre deber ser formulado en trminos de menor o igual, igual, o mayor o
igual, y la hiptesis alternativa, en trminos opuestos a la nula; es decir mayor que, diferente a, o
menor que.

PROBLEMA TIPO
Se est interesado en implementar un nuevo tipo de tratamiento teraputico, que resulta costoso,
pero se piensa que ser efectivo para rehabilitar a las personas que habitualmente fuman cigarrillos,
ya que se ha demostrado que el cigarro es una fuente primaria del incremento de los casos de
cncer.
Formule un contraste de hiptesis, explicando los tipos de errores que podran cometerse al tomar la
respectiva decisin, y cul de ellas sera la ms grave.
H0: El tratamiento teraputico no permitir rehabilitar a los pacientes fumadores de cigarrillos, por
lo que no vale la pena hacer gastos en costosos equipos.
H1: El tratamiento teraputico permitir rehabilitar a los pacientes fumadores de cigarrillos, no
interesando su alto costo, ya que este consumo, es la causa principal de los casos de cncer.
Error Tipo I. Rechazar la hiptesis nula cuando es cierta; se estar aceptando que el tratamiento
teraputico ser beneficioso, cuando en realidad no lo es as, haciendo gastos innecesarios, en la
creencia de que los ndices de cncer se controlarn.
Error Tipo II. Aceptar la hiptesis nula cuando es falsa; es decir que este tratamiento no permitir
rehabilitar a las personas que fuman cigarrillos, dejando de hacer gastos excesivos en su tratamiento,
con la posibilidad de que mueran ms personas por causas del cncer, solo por querer evitar gastos.
A la luz de estos dos contrastes, resulta que la decisin ms peligrosa sera el cometer Error
Tipo II, ya que por querer ahorrar, se estara condenando a la muerte a las personas, al decidir
no hacer dicho tratamiento.

EJERCICIOS
3.1.
Considere que en las actuales circunstancias, la seleccin peruana de ftbol se clasificar
para el mundial del 2014, a desarrollarse en Brasil; formule un contraste de hiptesis, indicando
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 28 de 85
las decisiones que podran tomarse, y los posibles errores por las que sucedera, y qu
consecuencias acarreara el decidir por una de ellas.
3.2.
Suponga que un investigador desea probar la hiptesis de que a lo ms el 65% de los
huachanos es alrgico a la leche fresca; explique cmo el investigador podra cometer:
a) Error de tipo I.
b) Error de tipo II.
3.3.
Una empresa es acusada de discriminar en la contratacin de sus profesionales.
a) Si el Juez comete Error de Tipo I, qu tipo de hiptesis est aceptando?
b) Si el Juez comete Error Tipo II, qu hiptesis est probando?
3.4.
Un experto en ingeniera informtica recomienda a una empresa implementar un DATA MART
de sistema de ventas, dado que considera que ste le permitir mejorar su sistema de
administracin y procesamiento de datos, producindole a la larga beneficios econmicos; los
administradores de la empresa son escpticos a esta propuesta, dado que consideran que no
requieren de sistemas complejos y costosos, como para seguir obteniendo beneficios, por lo
tanto, el pedido del experto, no es viable por el momento. Formule su contraste de hiptesis, y
seale los tipos de errores que podran optarse por cualquiera de estas decisiones, indicado cul
de ellos sera de consecuencias ms negativas.
R H0: La implementacin del DATA MART, en la empresa no reviste importancia, dado que la gestin administrativa
actual marcha por buenas condiciones, y ste nuevo es complejo y costoso.
H1: La implementacin de un DATA MART, ser beneficioso para la empresa, ya que le permitir mejorar la gestin
administrativa, producindole a la larga beneficios econmicos.
Error Tipo I. Creer que la implementacin del DATA MART, ser beneficioso para la empresa, cuando en realidad no lo
ser; solo le ocasionar complejidades y mayores costos.
Error Tipo II. Creer que el DATA MART, no mejorar la gestin administrativa, por lo tanto, perdindose la oportunidad
de mejorar la economa de la empresa.
Error ms grave: Perder la oportunidad de mejorar la gestin administrativa de la empresa, por no implementar un
DATA MART.

3.5.
En un restaurante, una mquina de bebidas gaseosas se ajusta de manera que la cantidad de
bebida que sirva por botella, se distribuir aproximadamente de forma normal, con una media de
200 ml y una desviacin estndar de 15 ml por botella. La mquina se verifica peridicamente
tomando una muestra de 9 botellas y calculando el contenido promedio; si el promedio muestral
por botella cae en el intervalo 191 y 209 ml, se considerar que la mquina trabaja de manera
satisfactoria, de otro modo se concluir que el promedio es diferente de los 200 ml. Encuentre la
probabilidad de cometer error de tipo I, cuando el promedio de llenado es de 200 ml.
3.6.
Los salarios diarios de los obreros de construccin civil en la ciudad de Lima se distribuyen
normalmente con una media de S/ 63 y una desviacin estndar de S/ 18. Se detecta que una
empresa constructora de la zona cuenta con 52 obreros, paga en promedio S/ 59,60, podra
asegurarse que esta empresa est pagando salarios inferiores al normal?; qu podra afirmar si
encuentra que en promedio si dicha empresa est pagando S/ 65,30 diarios?
3.7.
Un socilogo se interesa en la eficacia de un curso de entrenamiento diseado para lograr que
ms personas se interesen por la limpieza de su ciudad, dado que se observa en demasa, que
hoy en da las ciudades lucen atiborradas de suciedad por doquier, producto del descuido y
decida de sus habitantes; formule un contraste de hiptesis y responda:
a) Qu hiptesis prueba si comete Error Tipo I?
b) Qu hiptesis prueba si comete Error Tipo II?
c) Cul de estos dos errores sera el ms grave al tomar una decisin?

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 29 de 85
R: El contraste de hiptesis ser en los siguientes trminos: H0: El curso de entrenamiento no influir para que las
personas se interesen por la limpieza de las ciudades, frente a H1: El curso de entrenamiento si influir para que las
personas se interesen por la limpieza de las ciudades.
a) Si comete Error Tipo I, prueba que el curso de entrenamiento si influir para que las personas se interesen por la
limpieza de las ciudades, cuando en la vida real, no suceder as.
b) Si comete Error Tipo II, prueba que el curso de entrenamiento no influir para que las personas se interesen por la
limpieza de las ciudades, cuando realmente si estn interesados por ella.
c) El error ms grave sera, cometer Error Tipo II, ya que se dejara de entrenar a las personas para que aprendan a
mantener las ciudades limpias, con las consecuencias que ello acarreara para la salubridad.

3.8.
Una empresa de material elctrico fabrica bombillas de luz elctrica que tienen una duracin
que se distribuyen normalmente con una media de 800 horas y una desviacin estndar de 92
horas; pruebe la hiptesis nula de que la media es igual a 800 horas frente a la alternativa de que
la media es diferente de 800 horas, si una muestra de 48 bombillas tiene una duracin de 788
horas.
3.9.
El departamento de psicologa de una universidad considera que el 67% de sus estudiantes se
encuentran estresados emocionalmente ante el advenimiento de las evaluaciones del primer
examen parcial; a fin de confirmar esta aseveracin se toma se toma una muestra de un grupo de
estudiantes, y se encuentra que el grado de estrs emocional por cada uno de ellos estaba
conformado por los siguientes: E+, N, N, E++, N, N, E+, E+, N, E++, E++, E+, N, E++, N,
E+, E+; donde E+ = estrs moderado, E++ = estrs alto, N = Normal.
a) Qu podra afirmar respecto a lo afirmado por este departamento, asumiendo un riesgo de
equivocarse del 5%?
b) Si se estuviera interesado en rechazar una hiptesis nula de que no hay estrs emocional en
los alumnos, de qu tamao debera tomarse la muestra para rechazar esta hiptesis? Asuma
un riesgo de equivocarse del 5%.
R: p = 0,67 proporcin de estresados de la poblacin; ps = 10/17 = 0,588; proporcin de la muestra de estresados;
nivel de significancia = 5%.
Contraste de hiptesis: H0: p = 0,67 estn estresados por los exmenes; H1: p < 0,67 hay menor proporcin de
estresados. a) Al 5%, tc = -1,746 t t R = -0.719; por lo tanto se puede concluir que hay suficiente evidencia como
para afirmar que los alumnos se encuentran estresados ante el advenimiento de los exmenes. b) Para determinar
el tamao de muestra que permita estudiar el comportamiento de los que bajaron su nivel de estrs ser: n . 101
alumnos.

3.10. El Centro de Cmputo de una empresa recibe un lote de 50 laptop para ser distribuidos en
sus diferentes unidades administrativas; sin embargo el rea tcnica de esa institucin los
rechaza argumentando que estos equipos presentaban serios problemas de funcionamiento de
memoria, por su lentitud exagerada, por lo que deben ser rechazadas. El proveedor asegura que
todos sus funcionan correctamente, y que todo el problema podra deberse a la falta de manejo o
costumbre por parte del usuario. Formule un contraste de hiptesis, indicando los tipos de errores
que podran cometerse al optar por una de esas decisiones.
R:
H0: El lote de las laptop no presentan problemas de funcionamiento de las memorias; todo el problema puede
deberse a que los usuarios an no estn familiarizados.
H1: El lote de las laptop presentan problemas de funcionamiento de las memorias, por lo que deben ser rechazados..
Error Tipo I. Creer que el lote de las laptop presentan problemas de funcionamiento de sus memorias, cuando en
realidad estn en buen estado, con el consiguiente riesgo de que todo el lote sea devuelto al proveedor.
Error Tipo II. Creer que el lote de las laptop no presentan problemas de funcionamiento, cuando en realidad si los
estn, perjudicando a la empresa, en el sentido no querer hacer los correctivos necesarios a fin de que estos equipos
trabajen correctamente.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 30 de 85

3.11. Una compaa afirma que el tiempo necesario para fabricar un artculo es de 53 minutos, con
una desviacin estndar de 7 minutos. Se toma una muestra de 90 artculos y se encuentra que el
tiempo de fabricacin promedio de cada pieza fue de 56 minutos.
a) Al nivel del 5% se podra afirmar que el producto requiere un tiempo mayor de fabricacin
que lo afirmado por la compaa?
b) Si el tiempo real de fabricacin es de 50 minutos, en la prueba de significacin se cometi un
error de Tipo I?
3.12. Un profesor examina el curso de Matemtica II; sabe por experiencia que en promedio los
alumnos obtienen una calificacin de 12,3. En la actualidad, el profesor selecciona una muestra
de 15 alumnos, de una poblacin de 212 alumnos y encuentra que en promedio esta muestra de
alumnos obtuvo una calificacin de 12,8 con una desviacin estndar de 3,5. Acierta el profesor
al afirmar que estos alumnos tienen rendimiento superior, en comparacin al anterior? Considere
un nivel de significancia de 2%.
3.13. Los ingenieros informticos egresados de la Universidad, estn dispuestos a colaborar con su
Alma Mater, y deciden disear un nuevo Sistema de Informacin Gerencial, el cual permitir
proporcionar las respuestas
a las consultas,
temas relacionados con la matrcula y
procesamiento de notas de los alumnos en tiempo real; por otro lado, existe cierto pesimismo por
parte de otro grupo de autoridades, quienes alegan que ya se cuenta con un Sistema de
Informacin, y que la adopcin e implementacin de otro nuevo Sistema, solo crear confusin y
retardo en los trabajos. En qu casos se cometera Error Tipo I y Error Tipo II, al adoptar una
decisin al respecto, al momento de contrastar sus hiptesis, y cul de ellas sera la ms
beneficiosa para la Universidad?
H0: EL nuevo SIG solo crear confusin y retardo en el proceso de matrcula y procesamiento de datos de los
alumnos.
H1: El nuevo SIG proporcionar respuestas en tiempo real, informacin respecto a la matrcula y procesamiento de
datos de los alumnos.
Error Tipo I: Creer que el nuevo SIG proporcionar respuestas en tiempo real, cuando en realidad no lo ser as,
ya que solo proporcionar retardo y caos.
Error Tipo II. Creer que el nuevo SIG crear confusin y caos, cuando en realidad no ser as, ya que permitir
proporcionar respuestas en tiempo real, con las ventajas que ello conllevara.
Error ms favorable para la Universidad Error Tipo II.

3.14. Un fabricante est interesado en desarrollar un nuevo sedal para pesca que, segn afirma
tiene una resistencia promedio a la rotura de 55 kg. Se desea probar la hiptesis de que la = 55
kg frente a la de investigacin, el cual afirma que estas no son as, para ello se define una regin
crtica cuando se encuentra que el promedio de una muestra de 20 sedales es menor de 50,2
kilos, con una desviacin estndar de 13,7 kilos. Encuentre la probabilidad de cometer error de
Tipo I.
R: El contraste de hiptesis ser en los siguientes trminos: H 0: = 55 (promedio a la resistencia igual a 55 kilos);
frente a H1: < 55 (el promedio a la resistencia es menos de 55 kilos); para una muestra de tamao n = 20, s =
13,7 kilos, cuyo promedio muestral

x =50,2 kilos .

Por lo tanto su tR = -1,557, y es el que define el nivel crtico

de aceptacin o rechazo de la hiptesis nula, lo cual indica un rea o nivel de significancia de 7,14%.

3.15. Pruebe la hiptesis de que el contenido promedio de los envases de un tipo de lubricante que
una empresa debe producir diariamente, es de 10 litros; el ingeniero de planta toma una muestra
aleatoria de diez envases, y encuentra que estos contenan las siguientes cantidades: 10,2, 9,7,
10,1 10,3, 10,1, 9,8, 9,9, 10,4, 10,3, y 9,5 litros. Utilice un nivel de significancia de 1% y
suponga que la distribucin del contenido es normal. De qu tamao deber tomarse una

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 31 de 85
muestra para rechazar la hiptesis de que estos contenidos no estn cumpliendo con lo
establecido?
3.16. Se afirma que el diseo especial de un nuevo automvil, puede recorrer en promedio no
menos de 20 000 kilmetros por ao, antes de ser sometido a un programa de mantenimiento
correctivo. Para probar tal afirmacin se toma una muestra de 60 propietarios de automviles con
este diseo, los que llevan un registro del kilometraje recorrido; estara de acuerdo con esta
afirmacin, si la muestra indic que estos automviles requirieron mantenimiento al haber
recorrido tan solo 19 457 kilmetros en promedio, con una desviacin estndar de 3 000
kilmetros?
3.17. INDECOPI est decidido a que el porcentaje de usuarios de software legal se incremente, ya
que al presente considera que solo el 10% de los usuarios de estos productos, tienen procedencia
legal; en ese sentido emprende una campaa publicitaria de concientizacin para el uso de
software legal, en todos los potenciales clientes. A fin de evaluar la efectividad de esta campaa,
en Huacho, de una poblacin de 400 usuarios de software, toma una muestra de 80 y encuentra
que solo 15 de ellos estaban haciendo uso de software legal. De qu tamao deber tomar una
muestra de usuarios de software, para asegurar que la campaa publicitaria gener mayor
sensibilizacin en estos usuarios? Considere un margen de error de 5%.
R:
p = 0,10 hacen uso de software legal
N = 400; n = 80, y ps = 15/80 = 0,1875 y qs = 0,8125.
H0: La campaa publicitaria no ha sido efectiva, porque la proporcin de usuarios de software legal, sigue siendo el
mismo. ( = 0,10)
H1: La campaa publicitaria ha sido efectiva, puesto que ha mejorado la proporcin de usuarios de software legal (
> 0,10).
Si se calcula su zR teniendo en cuenta el ajuste poblacional, se obtiene que es igual a 2,239, y si se considera que
a un nivel de significancia del 5%, zc es 1,645; por lo tanto para rechazar la hiptesis nula, bastara con este zc; por
lo que el tamao de la muestra, haciendo los respectivos clculos por ajuste poblacional, deber ser de 148
usuarios.

3.18. Se realiza un estudio para determinar si los temas de la materia en un curso de fsica se
comprenden mejor cuando se emplea un laboratorio en parte del curso. Se seleccionan
estudiantes al azar para que participen, ya sea en un curso de tres horas semestre-hora sin
laboratorio, o en un curso de cuatro horas semestre-hora con laboratorio. En la seccin con
laboratorio, 11 estudiantes tuvieron una calificacin promedio de 85 con una desviacin estndar
de 4,7; mientras que en la seccin sin laboratorio, 17 estudiantes tuvieron una nota promedio de
77 con una desviacin estndar de 6,1. Se podra decir que el curso con laboratorio aumenta la
calificacin promedio hasta en 8 puntos? Considere una probabilidad de equivocarse del 5%.
3.19. Se cree que no menos el 65% de los habitantes de un centro poblado estn a favor de
anexarse a otro distrito. Qu conclusin extraera, si de una muestra de 150 habitantes se
encuentra que solo 86 estn a favor de anexarse a otro distrito? Considere un riesgo de
equivocarse del 5%.
R: H0: p 0,65 (alto nmero de habitantes favor de anexarse a otro distrito), contra H1: p < 0,65 (baja proporcin a
favor de anexarse); por lo tanto p s = 0,573 y z R = -2,022 frente a z c = -1,645; por lo tanto debera rechazarse la
hiptesis nula, en el sentido de que hay alto nmero de habitantes interesados en anexarse a otro distrito.

3.20. Suponga que hasta hace poco tiempo, 40% de todos los ciudadanos estn a favor de la
imprescriptibilidad de los delitos cometidos por los funcionarios pblicos; habra razn para
creer que la proporcin de ciudadanos en la actualidad ha aumentado, si en una muestra de 125
consultados, solo 54 ciudadanos manifestaban estar a favor de la imprescriptibilidad?; considere
un riesgo de equivocarse del 5%.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 32 de 85
3.21. Por antecedentes histricos se conoce que el tiempo promedio que requieren los estudiantes
para sustentar su tesis sigue una distribucin normal, con una media de 32 minutos y una
desviacin estndar de 6 minutos. Si una muestra de 20 tesistas demostr que demoraban en
sustentar su tesis un tiempo promedio de 35 minutos, podra afirmarse que esta sustentacin
est demorando ms del tiempo normal?
R: Considerando un nivel de significancia de 5% resulta que no se puede asegurar que los tesistas estn
demorando ms del tiempo establecido; considerando un nivel de significancia del 1%, si se puede asegurar que,
efectivamente si est demorando ms del tiempo establecido.(demuestre estas afirmaciones)

3.22. Los siguientes datos proporcionan los tiempos de respuesta a un sistema de informacin
gerencial, proporcionado por dos modelos de PC, probados en PC seleccionados al azar:
Modelo de PC
tiempo (en segundos)
Modelo A
2.04 3.02 1.92 1.87 2.01 2.00 1.89 1.95
Modelo B
2.62 1.47 1.83 2.00 1.42 1.76 1.48
Podra afirmarse que el tiempo de respuesta del modelo A es mayor al tiempo de respuesta del
modelo B en ms de 0,20 segundos, si la probabilidad de equivocarse es a lo ms del 5%?
3.23. Un fabricante de bateras de litio para las Laptop, distribuye sus productos en sus diferentes
clientes, asegurando que estos trabajan a un voltaje de 12 voltios, voltaje que permitir trabajar en
las mejores condiciones; sin embargo, pasado un cierto tiempo recibe quejas de sus clientes
quienes aseguran que estos productos no estn trabajando en las condiciones especificadas,
generando problemas a las Laptop; el fabricante decide averiguar si estos clientes tienen la razn,
motivo por el cual, selecciona al azar una muestra de bateras, y evala las condiciones de
trabajo; los resultados de esta muestra indicaron que la muestra de bateras trabajaban en los
siguientes voltajes: 12,5
13 11,9
12,0 12,1
11,5
11,6
12,1
12,8
11,2 y
12,0 Voltios, respectivamente.
a) A los resultados de estas evidencias, debera atenderse las quejas de los clientes, o stas
podran deberse a una simple casualidad?, asuma un riesgo de equivocarse del 5%.
b) Indique los tipos de errores que podran cometerse, y evale las consecuencias de decidir por
ellos.
R: Contraste de hiptesis en forma cualitativa:
H0: Las bateras de litio, estn diseadas para trabajar a 12 voltios, lo cual permitir trabajar en las mejores
condiciones a los equipos.
H1: Las bateras de litio, no estn trabajando a 12 voltios, los cuales estn generando que los equipos se estn
daando.
Contraste de hiptesis en forma cuantitativa:
H0: = 12,0 voltios
H1: 12,0 voltios
Muestras pequeas; distribucin t; por lo tanto tc(0,95,10)= 2,228 y tr = 0,392; por lo tanto debera aceptarse la
hiptesis nula, en el sentido de que las bateras estn trabajando en el voltaje especificado, la diferencia
encontrada, puede deberse a una simple casualidad.
Error Tipo I: Creer que las bateras no estn trabajando en los 12 voltios establecidos, haciendo caso a los
clientes, que podran estar reclamando si fundamento.
Error Tipo II: Creer que las bateras estn trabajando a 12 voltios, cuando en realidad no lo estn; por lo tanto no
se le estara haciendo caso a los justos reclamos de los clientes, con las consecuencias de poder daar a los
equipos de cmputo.
Decisin ms grave: Cometer Error Tipo II; podra perderse a los clientes y ganarse un juicio de parte de ellos por
daar sus equipos.

3.24. El administrador de una empresa de taxis, trata de decidir si el uso de llantas radiales, en lugar
de llantas regulares cinturadas mejora la economa de combustible. Se equipan 12 llantas radiales
y se manejan durante un recorrido de prueba preestablecido; sin cambiar a los conductores, los
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 33 de 85
mismos automviles se equipan con llantas regulares cinturadas y se manejan otra vez en el
recorrido de prueba. El consumo de gasolina, en kilmetros por litro, se registr de la siguiente
manera:
Tabla
Consumo de gasolina en kilmetros por litro, por una
muestra de automviles, segn tipo de llantas utilizadas

Automvi
l
1
2
3
4
5
6
7
8
9
10
11
12

Llantas radiales

Llantas cinturadas

4,7
4,6
5,2
5,9
6,1
4,8
5,0
4,9
5,1
6,3
4,8
5,4

6,1
5,2
4,2
4,7
5,2
4,6
4,3
4,7
4,9
5,2
6,1
4,4

Podra concluirse que los automviles equipados con llantas radiales dan una economa de
combustible mejor que aquellos equipadas con llantas cinturadas? Asuma que la poblacin se
distribuye normalmente. Si en promedio se espera que el uso de llantas radiales en los
automviles, consuma 5,4 litros por kilmetro, de qu tamao deber tomarse una muestra de
otros automviles, para rechazar la hiptesis de que estas muestras no estn cumpliendo con lo
esperado? Asuma un nivel de significancia del 1%.
3.25. Se dice que una mquina llenadora de bebidas gasificadas est fuera de control, si la
desviacin estndar de los contenidos excede de 1,15 cm 3. Si una muestra aleatoria de 20
botellas llenadas con esta mquina presenta una desviacin estndar de 1,48 cm 3, podramos
asumir, al nivel de significancia del 1%, que la mquina est fuera de control?, y al 5%?
R:. El contraste de hiptesis corresponde a una Chi cuadrado, por lo tanto H0: = 1,15 cm3 frente a H1: > 1,15
cm3. Al 1% el Chi crtico es 36,19 y el Chi real = 31,46; por lo tanto no se podra rechazar la hiptesis nula en el
sentido de que la mquina embotelladora est fuera de control; en cambio al 5%, el Chi real es 30,14, por lo que si
debera rechazarse la hiptesis nula, y asumir que la mquina llenadora est fuera de control.

3.26. Una agencia de publicidad desea probar, dos formas diferentes de presentacin de publicidad
de una locin para hombres. En la publicidad A, el producto es enfocado desde el punto de vista
sexy; en la segunda publicidad el producto es enfocado desde el punto de vista profesional; se
seleccion una muestra de 15 hombres, usuarios potenciales de esta locin. El procedimiento
seguido en la prueba, consiste en dejar que los entrevistados hojeen libremente la publicidad y
luego se sometan a un cuestionario diseado para medir el grado de recordacin de los anuncios
mostrados; los resultados en puntos, en una escala de 1 al 10, son los siguientes:
Tabla .
Grado de recordacin, en puntos, de la Locin para hombres segn tipo de publicidad utilizada
en una muestra de hombres, potenciales usuarios de este producto

Persona N
Publicidad A
Inferencia Estadstica

1
5

2
6

3
4

4
7

Ciclo 2013-I I

5
4

6
6

7
5

8
6

9
4

10
3

11
3

12
4

Moiss E. Armas

Pgina 34 de 85
Publicidad B

Considerando un riesgo de equivocarse del 5%, podra asegurarse que ambas publicidades,
generan el mismo tipo de atencin?
3.27. Un ingeniero industrial cree que ha perfeccionado un programa de entrenamiento que puede
acortar el tiempo de ensamble de una pieza en fabricacin. Para verificar esta suposicin, planea
seleccionar diez obreros en forma aleatoria, y realizar estudios de tiempos y movimientos, con
ellos, antes y despus de que hayan acabado su programa de entrenamiento; los resultados se
muestran a continuacin:
Tabla
Tiempo de ensamble en segundos, antes y despus de perfeccionamiento del programa
para la produccin de la pieza de., desarrollado por una muestra de obreros en

Obrero N
1
2
3
4
5
6
7
8
9
10
Antes
12
13
14
13
14
12
11
15
13
14
Despus
11
12
10
14
12
12
12
10
10
11
a) Obtenga los lmites de confianza al 99%, sabiendo que el error de estimacin no debe
sobrepasar los 5 segundos.
b) Confirme si el programa de entrenamiento sirve para reducir el tiempo de ensamble,
considerando un margen de equivocarse del 5%.
c) Puede asegurarse que la variacin de tiempo antes de implementar el nuevo programa es
mayor de 2 segundos?
d) Puede considerarse que hay diferencia entre la variacin de tiempos entre ambos
programas?
3.28. Una nueva variedad de manzana presenta un sabor muy agradable; para ello se ha decidido
someter a prueba su rendimiento, plantando este tipo de manzanas junto a otra manzana
corriente, en ocho huertos diseminados en una regin apropiada para la produccin de ambas
variedades; cuando los rboles empiezan a rendir, se mide su produccin en cajas; los datos
obtenidos son los siguientes:
Tabla .
Rendimiento en cajas, por huerto, segn variedad de manzanas

Huerto

Nueva variedad Manzana corriente


de manzana
1
15
12
2
12
14
3
14
13
4
13
12
5
10
11
6
12
14
7
14
15
8
17
10
a) Estime un intervalo de confianza del 99%, para conocer la diferencia promedio de produccin
de las manzanas nuevas y las manzanas corrientes, si el margen de error no debe ser mayor
de 0,5.
b) Si el rendimiento esperado por la nueva variedad de manzana es de 15 cajas por huerto,
podra asegurarse que se est cumpliendo con el programa de produccin? Asuma un riesgo
de equivocarse del 1%?
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 35 de 85
c) En cuntos huertos deber probarse el cultivo de esta nueva variedad de manzanas, para
rechazar la hiptesis de que esta nueva variedad no est cumpliendo con lo esperado?
Considere un riesgo de equivocarse del 1%?
d) Sealan estos resultados una mayor produccin de las nuevas manzanas, que las de las
manzanas corrientes? Asuma un margen de error de 0,01.
e) Hay variacin en el rendimiento por cajas, en la produccin de estas manzanas?
3.29. Una comunidad urbana quiere demostrar que la incidencia de cncer de seno es mayor que
en las comunidades rurales, si se encuentra que 20 de cada 200 mujeres adultas en la comunidad
urbana tienen cncer de seno, y 10 de 150 mujeres adultas de la comunidad rural tienen cncer
de seno, podra concluirse a un nivel de significancia del 5%, que este tipo de cncer, prevalece
en la comunidad urbana?
3.30. Se realiza un estudio para comparar el tiempo de demora entre hombres y mujeres para
ensamblar un producto. La experiencia indica que la distribucin de los tiempos, tanto como para
hombres como para mujeres es aproximadamente normal, pero que la varianza de los tiempos
para las mujeres en menor que el de los hombres; una muestra aleatoria de 11 mujeres y 16
hombres mostr los siguientes resultados: Varianza de tiempos de los hombres, 36,8 seg 2;
varianza de tiempo de las mujeres 27,4 seg 2; extraiga sus conclusiones a la luz de los
planteamientos del problema.
3.31. Una empresa desea saber el efecto que puede generar sobre la productividad, dar un relax a
su personal, para saborear una taza de caf especial; para ello selecciona al azar un grupo de
trabajadores a los cuales se les mide la productividad, sin saborear el caf, y saboreando el caf.
Los resultados se muestran en la siguiente tabla:
Tabla .
Productividad en unidades producidas, por trabajador

Trabajador Saboreando caf


Sin saborear caf
1
23
24
2
24
27
3
26
24
4
20
25
5
25
23
6
28
27
7
22
24
8
25
28
9
26
24
10
30
27
11
20
a) Podra asegurarse que saboreando el caf, la productividad es mejor?
b) Podra asegurarse que hay mayor variacin en la productividad saboreando caf?
3.32. Una empresa distribuidora de Laptops, sabe que el tiempo de sus bateras, se distribuyen
normalmente con una duracin promedio de 4,6 horas antes de ser recargadas; en este sentido
desea comprobar la duracin de stas en las sierras de Hunuco y de Cusco; para ello toman
muestras de estos aparatos y los somete a observacin; los resultados de la duracin de estas
bateras, antes de ser recargadas muestras se observan a continuacin:
Tabla
Tiempo de duracin en horas, de las bateras de Laptop, antes de ser recargadas

Hunuc

5,2

Inferencia Estadstica

3,9

4,8

4,6

3,7

Ciclo 2013-I I

3,9

5,1

4,8

5,3

4,4
Moiss E. Armas

Pgina 36 de 85
o
Cusco
5,1
4,2
4,5
3,6
4,7
4,0
4,6
4,2
4,3
a) Hay razn suficiente para considerar que las bateras de las Laptop, en Hunuco tienen
mayor tiempo de duracin que en Cusco?
b) Puede considerarse hay diferentes variaciones en la duracin de estas bateras?
c) De qu tamao deber tomarse una muestra, si se quiere rechazar la hiptesis, de que el
tiempo de duracin de las bateras en Cusco es diferente de 4,6 horas?
R: a) No hay razn suficiente como para afirmar que el promedio de duracin de las bateras de las Laptop en
Hunuco, duran ms que en Cusco (diferencia de medias poblacionales con muestras pequeas); b) No hay razn
suficiente como para afirmar que hay variacin en la duracin de estas bateras (prueba F); c) La muestra debe ser
mayor o igual 17, haciendo la prueba t.

3.33.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 37 de 85

IV.

OTRAS PRUEBAS DE HIPTESIS

AJUSTE DE CURVAS Y PRUEBAS DE CONTINGENCIA


Ejemplo 4.1 Se desea averiguar si el pertenecer a un grupo socioeconmico es fundamental como
para desear seguir una carrera profesional, por el cual optaban los estudiantes que culminaban su
educacin secundaria; en ese sentido se toma una muestra de grupos de estos estudiantes y se les
pregunta por la carrera universitaria que desearan continuar en el futuro; las respuestas afirmativas
por dichas carreras se muestran en la siguiente tabla.
Tabla 4.1
Inters por seguir una carrera universitaria por los estudiantes
secundarios, segn su grupo socioeconmico familiar

Grupo socioeconmico familiar


Carrera
profesional
A
B
C
Medicina
7
9
3
Ingeniera
6
10
7
Derecho
8
5
8
Contabilid
ad
3
5
4
Docencia
2
1
5

D
10
8
7

E
9
7
10

4
3

5
2

Podra asegurarse que las carreras universitarias deseadas por los estudiantes secundarios, est
asociado a su grupo socioeconmico, o es que estos resultados solo se deben a la casualidad?
Considere un riesgo de equivocarse del 5%.
Solucin:
Es una prueba de contingencia, ya que se trata de establecer si dos variables categricas, en este
caso, Grupo socioeconmico familiar y Carrera profesional, ambos con diferentes categoras, estn
asociados o son independientes; en este sentido, el contraste de hiptesis ser:
H0: El desear estudiar una carrera profesional, no tiene que ver nada con el grupo socioeconmico.
H1: El desear una carrera profesional, est asociado al grupo socioeconmico al que pertenece el
estudiante.
Haciendo los respectivos clculos, se obtiene que su Chi cuadrado real es 10,34, el cual contrastado
con su Chi cuadrado terico (0,95; 16), es 26,3. Por lo tanto, dado que ste es mayor que el real obtenido,
no debera rechazarse la hiptesis nula, y aceptar que la eleccin de la carrera universitaria de los
estudiantes secundarios, no tiene nada que ver con el grupo socioeconmico al cual pertenece.

USO DEL SPSS PARA DESARROLLAR PRUEBAS DE CONTINGENCIA


Ejemplo 4.2 Considere que los alumnos de ingeniera informtica han desarrollado una encuesta
relacionado con la motivaciones de visita de los forneos a la provincia de Huaura, y que estos
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 38 de 85
visitantes se caracterizan por pertenecer a diferentes grupos ocupacionales; adems
diversas motivaciones que los impulsaron a venir a estos lugares.

tuvieron

Como puede inferirse, en este caso se cuentan con dos variables categricas: Grupo ocupacional y
Razones de visita; el grupo ocupacional puede estar conformado por las siguientes categoras:
Comerciante, Empleado, Jubilado, Estudiante, Ama de casa y Profesional; la variable Razones de
visita, puede estar conformado por las siguientes categoras: Gastronoma, Arqueologa,
Curanderismo, Aventura y Distraccin. Para introducir estos datos en el SPSS, habr que definir
primeramente los tipos de datos de las variables, con sus respectivas caractersticas; as hagamos la
siguiente definicin:
Grupo ocupacional
GO
GrupoOC
1 Comerciante
2 Empleado
3 Jubilado
4 Estudiante
5 Ama de casa
6 Profesional

Razones de visita
RV
RazonV
7 Gastronoma
8 Arqueologa
9 Curanderismo
10 Aventura
11 Distraccin

Los datos que se introducirn en este software tendrn estas caractersticas; para ello abra su editor,
observar una matriz formada por filas y columnas; cada columna define un tipo de variable y cada
fila, un elemento de informacin, del ente que se est estudiando. En vista de variables, que aparece
al pie izquierdo del editor, haga clic con el ratn para ingresar al proceso de definicin de cada
variable, del siguiente modo:
1. En la primera fila, se definir las caractersticas de la variable Grupo ocupacional; para eso
defina en Nombre con GO, en Tipo, indique Numrico, en Ancho escriba un nmero como 3,
sin decimales; en Etiqueta escriba GrupoOC, y en Valores, haciendo clic en los puntos
suspensivos se ingresa a la ventana de valor; aqu es donde deber definir las categoras de
las variables establecidos en la tabla; as donde dice Valor, escriba 1, y donde dice Etiqueta,
escriba Comerciante, luego haga clic en Aadir; repita hasta completar con las seis
categoras de este grupo ocupacional, luego pulse el botn Aceptar; de esta manera la
variable Grupo ocupacional ha quedado definido.
2. En la segunda fila, se definir las caractersticas de la variable Razones de visita, siguiendo
los mismos pasos que el anterior: Nombre RV, Tipo Numrico, Ancho 3, sin decimales; en
Etiqueta escriba RazonV, y en valores, una vez ingresado a su ventana escriba Valor 7,
Etiqueta Gastronoma, Aadir y repetir este proceso hasta culminar con 11 Distraccin, y
finalmente Aceptar; de esta manera esta otra variable ha quedado completamente definido.
3. Ahora haga clic en Vista de datos del editor del SPSS, observar que la primera columna
est definido como GO, y la segunda columna como RV.
4. En la columna correspondiente a GO, de acuerdo a la cantidad de datos con las que cuenta,
escriba los nmeros del 1 al 6; y en la columna correspondiente a RV, escriba los nmeros
correspondientes entre 7 y 11; ambas columnas debern tener la misma cantidad de datos;
cuando termine de introducir sus datos, estar en condiciones de pasar hacia otras etapas de
anlisis, como a continuacin se indicar.
5. En el men principal vaya a Analizar Estadsticos descriptivos Tablas de
contingencia y le proporcionar los resultados en una tabla, donde deber interpretar los
mensajes proporcionados.
Tabla Tabla de contingencia GrupoOC * RazonV

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 39 de 85
Recuento

GrupoOC

Comerciante
Empleado

Gastronomia
3
3

RazonV
Curanderis
Arqueologia
mo
3
1
7
3

Aventura
0
1

Distraccin
0
1

Total
Gastronom
ia
7
15

Jubilado

18

Estudiante

17

Su casa

13

Profesional

10

18

21

21

10

10

80

Total

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por lineal

Valor
21.296(a)
21.662
7.284

gl
20
20
1

Sig. asinttica
(bilateral)
.380
.359
.007

G
r

f
i
c
o
d
e
l
a
t
b
l
a
d
e
c
o
n
t
i
g
e
n
c
i
a
R
a
z
o
n
V
G
a
s
t
r
o
n
m
i
a
A
q
u
e
l
g
C
d
rn
s
o
6
v
n
a
D
is
rtc
i

N de casos vlidos

80

a 30 casillas (100.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es .88.

Nmerodcaso

4
2
0C
o
m
e
rc
ia
n
te
E
m
p
le
a
d
o
u
b
ilo
a
d
o
E
s
tu
d
a
n
te
u
c
a
sP
ro
fe
s
io
n
a
l
G
rJu
p
c
u
p
a
c
iio
n
a
lS

__

Fig. 4.1 Grfico bivariado de la tabla de contingencia


Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 40 de 85
Ejemplo 4.3 En un centro de idiomas se ensea el idioma italiano a un conjunto de profesionales; se
quiere averiguar si el inters de estudiar este idioma est relacionado con la profesin y la
procedencia de los profesionales; para ello se selecciona una muestra de un grupo de ellos y se los
agrupa en una tabla de acuerdo a la especialidad y procedencia, como muestra la siguiente tabla:
Lugar
de
procedencia
Huaura
Lima
Huaral
Barranca

Mdico

3
4
1
8

Profesin
Abogado Ingeniero

2
6
7
10

Contado
r

1
2
2
6

5
1
6
3

Haciendo uso del SPSS, concluya si el inters por el estudio del idioma italiano, est asociado con las
caractersticas de la profesin y el lugar de su procedencia; para ello considere un nivel de
significancia del 5%.
Solucin:
El contraste de hiptesis deber hacerse en los siguientes trminos: H0: El inters por estudiar el
idioma italiano, nada tiene que ver con la profesin y el lugar de procedencia del interesado, frente a
H1: El inters por estudiar el idioma italiano, est asociado a la profesin y la procedencia del
interesado.
Siguiendo el modelo anterior, asuma un nivel de significancia del 5% y construya su base de datos, y
genere un resultado, con una tabla que presente los resultados observados y los resultados
esperados como se muestra en el siguiente:

Tabla de contingencia Lugar * Profesion


Profesion
Medico
Huaura

Lima
Lugar
Huaral

Barranca

Total

Inferencia Estadstica

Recuento

Abogado

Total

Ingeniero

Contador

11

2.6

4.1

1.8

2.5

11.0

13

3.1

4.9

2.1

2.9

13.0

16

3.8

6.0

2.6

3.6

16.0

10

27

Frecuencia esperada

6.4

10.1

4.4

6.0

27.0

Recuento

16

25

11

15

67

16.0

25.0

11.0

15.0

67.0

Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento

Frecuencia esperada

Ciclo 2013-I I

Moiss E. Armas

Pgina 41 de 85
Como podr apreciar, la tabla muestra un total de 67 valores observados (67 profesionales,
provenientes de los cuatro lugares, con sus respectivas frecuencias observadas.
La siguiente tabla muestra los resultados de los anlisis:
Pruebas de chi-cuadrado
Valor

gl

Sig. asinttica
(bilateral)

Chi-cuadrado de Pearson

12.403a

.192

Razn de verosimilitudes

13.381

.146

N de casos vlidos

67

a. 12 casillas (75.0%) tienen una frecuencia esperada inferior a 5. La


frecuencia mnima esperada es 1.81.

El valor del chi cuadrado terico, al nivel de significancia del 5% es 16,92, el cual contrastado con el
valor real, que es igual a 16,92, induce a manifestar que no se debera rechazar la hiptesis nula, en
el sentido de que ambas variables son independientes.
El siguiente es el grfico de la relacin entre estas dos variables.

Ejemplo 4.4 Se disea un producto publicitario, utilizando diferentes medios, a fin de evaluar la
satisfaccin de este sistema en personas que se dedicaban a diferentes actividades; para ello en una
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 42 de 85
determinada ciudad se selecciona una muestra de esta poblacin y se averigua el nmero de
personas satisfechas con el sistema publicitario presentado a travs de diferentes medios; los
resultados de esta investigacin se muestran en la siguiente tabla:
Tabla:
Satisfaccin de una muestra de personas por el diseo de un producto, presentado en
diferentes medios publicitarios.
Medios publicitarios presentados
Ocupacin
Radio
TV
Internet
Revista
Panel
Perifoneo
Obrero
5
3
5
2
12
13
Comerciante
3
15
7
5
16
11
Jubilado
6
16
6
12
8
5
Agricultor
14
6
2
5
12
15
Estudiante
2
7
17
11
8
7
Ama de casa
12
13
5
6
10
7
Profesional
4
5
18
16
6
5
Podra asegurarse que los medios publicitarios y la ocupacin de las personas influyen en la
satisfaccin de las personas por el diseo del producto? Considere un riesgo de equivocarse del 5%.
Solucin:
El contraste de hiptesis se har en los siguientes trminos:
H0: La aceptacin del diseo del producto en los diferentes medios publicitarios por parte de las
personas, nada tiene que ver con la ocupacin que tienen.
H1: La aceptacin del diseo del producto en los diferentes medios publicitarios por parte de las
personas, est asociado con la ocupacin que tienen

Uso del Minitab.


Este problema tambin puede resolverse haciendo uso del software Minitab; para ello, los datos de
las columnas de Radio hasta Perifoneo, escrbalo en el editor del Minitab; en la columna C1 todos los
datos referidos a la Radio, en la columna C2 de la TV y as sucesivamente, hasta la columna C6.
En el men principal: Stat Tables Chi-Square Test; en el recuadro derecho: Columns
containg the table escriba C1 C6 y pulsar Ok.
Obtendr la tabla con los datos originales, los valores esperados y su respectiva diferencia cuadrtica
segn lo teora de la distribucin de su estadstico, por cada fila, donde la primera fila corresponde a
obrero, y as sucesivamente.
Chi-Square Test: Radio, TV, Internet, Revista, Panel, Perifoneo
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
1

Radio
5
5.07
0.001

TV
3
7.16
2.419

Inferencia Estadstica

Internet
5
6.61
0.393

Revista
2
6.28
2.918

Panel
12
7.93
2.084

Ciclo 2013-I I

Perifoneo
13
6.94
5.286

Total
40

Moiss E. Armas

Pgina 43 de 85
2

3
7.22
2.469

15
10.21
2.251

7
9.42
0.622

5
8.95
1.744

16
11.31
1.949

11
9.89
0.124

57

6
6.72
0.076

16
9.49
4.465

6
8.76
0.870

12
8.32
1.625

8
10.51
0.600

5
9.20
1.916

53

14
6.84
7.485

6
9.67
1.392

2
8.93
5.374

5
8.48
1.428

12
10.71
0.155

15
9.37
3.380

54

2
6.59
3.197

7
9.31
0.574

17
8.60
8.219

11
8.17
0.984

8
10.31
0.519

7
9.02
0.454

52

12
6.72
4.157

13
9.49
1.298

5
8.76
1.614

6
8.32
0.648

10
10.51
0.025

7
9.20
0.525

53

4
6.84
1.181

5
9.67
2.255

18
8.93
9.226

16
8.48
6.670

6
10.71
2.072

5
9.37
2.039

54

Total

46

65

60

57

72

63

363

Chi-Sq = 96.685, DF = 30, P-Value = 0.000


El valor de

2R = 96,685 y el valor de

2c(0,05 ;30) = 43,77; por lo tanto debera rechazarse H0 y

aceptar H1 a un nivel de significancia del 5%. En este caso, los resultados mostrados con el Minitab o
el SPSS, no proporcionan los valores tericos del Chi cuadrado, en su lugar se presenta el P-Value;
cuando este valor es menor que el nivel de significancia, significa que tambin debera rechazarse H 0;
en este caso P-Value < 0,05; por lo tanto debera rechazarse la hiptesis nula a favor de la
alternativa.

EJERCICIOS
4.1.

De qu manera pueden aproximarse el comportamiento de las observaciones empricas a


comportamientos tericos?
4.2. Puede considerarse que una observacin real, coincide exactamente con una distribucin terica;
sustente su respuesta?
4.3. Suponiendo que una serie de observaciones sean ajustadas a una distribucin normal, cuntos
parmetros debern utilizarse para dicho ajuste?
4.4. Por qu considerara que la edad de los alumnos de un centro educativo sigue una distribucin
normal?
4.5. Segn cifras proporcionadas por el Ministerio de Transportes y Comunicaciones, los accidentes
de trnsito ocasionados por causa de los peatones, por da, durante el ao pasado, en un
tramo de la Carretera Central, fueron reportadas del siguiente modo:
Reporte de accidentes de trnsito por imprudencia del peatn, en un tramo de la Carretera
Central, en la zona de Lima, en el ao 2011
N accidentes
N de ocurrencias
Inferencia Estadstica

0
6

1
25

2
38

3
50

Ciclo 2013-I I

4
34

5
23

6
15

7
9
Moiss E. Armas

Pgina 44 de 85
Encuentre una curva de tendencia para explicar el comportamiento de estas observaciones y
valdelo a un nivel de significancia del 5%.
R: El comportamiento de estas observaciones debe seguir una Poisson; para ello se determina el promedio de
accidentes por da = 3,275; luego la funcin propuesta debera ser f(x) =

3,275 xe3,275
x!

, para x = 0,1,,7

accidentes/da. Plantendose la hiptesis nula en el sentido que esta ecuacin define el comportamiento de estos
accidentes, frente a la alternativa, que manifiesta que no lo describe, se construye el modelo terico y se encuentra
luego que su chi cuadrado real es R = 5,92 frente al chi cuadrado terico c(0,95,6) = 12,59. Haciendo la respectiva
comparacin se ve que se debe aceptar la hiptesis nula, por lo tanto la ecuacin planteada es vlida para describir el
comportamiento de estas observaciones.

4.6.

Una empresa cuenta con una plana heterognea de personal en cuanto a su experiencia laboral;
de este modo ha clasificado la siguiente tabla experiencia laboral en aos, dentro y fuera de la
institucin:
Ex. Aos
05
5 10 10 15 15 20 20 25 25 30 30 35
# Traba.
50
40
32
24
16
12
7
Ajuste estas observaciones a una distribucin triangular validndolo al 5%.
4.7. El servicio de emergencia de un hospital presenta un resumen de llegada de personas
accidentadas por causas de trnsito segn se muestra en la tabla:
Nmero de personas
0 1 2 3 4 5
ingresados por emergencia
Nmero de veces observado
6 25 36 21 15 7
a) Determine el nmero promedio de pacientes ingresados por da, as como su desviacin
estndar.
b) Encuentre una curva de tendencia del comportamiento de llegada de pacientes, y valdelo
al 5%

4.8.

Una casa comercial vende sus equipos de cmputo bajo la modalidad de al contado y al crdito;
cuando vende al crdito, algunos de sus clientes se atrasan en sus pagos, generando problemas
de liquidez a la empresa; el encargado de Estadstica lleva un registro histrico de los clientes
quienes tuvieron pagos atrasados, los que se muestran en la siguiente tabla
Problemas de pago de los clientes que compraron al crdito

Nmero de atrasos de pago


1
2
3
4
5
6
7
8
del cliente
Nmero de clientes con
1
6
18
35 60 48 23
7
problemas de pago
Formule una curva de tendencia para describir el comportamiento de pago de estos clientes,
validndole al 5%.
4.9. Con la finalidad de conocer la distribucin de edad de los alumnos de un centro educativo de
nivel superior se confecciona la siguiente tabla:
Tabla
Distribucin de edad de los alumnos del CE

Edad de los alumnos N de alumnos


en aos
14 17
35
17 20
39
20 23
50
23 26
42
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 45 de 85
26 29
38
29 32
30
Existe suficiente evidencia como para decir que la edad de estos alumnos sigue una
distribucin uniforme? R: 20,05; 5 = 11,07 2 r = 5,8462
4.10. Un alumno est tratando de construir un modelo de distribucin de probabilidades del
comportamiento de llegada de clientes al cajero automtico de un banco de la localidad; para
ello se pone a observar la llegada de estos al cajero cada cinco minutos, lo cual le permite
confeccionar el siguiente cuadro de llegadas:
Llegadas de clientes al cajero automtico del Banco XXX

Llegan clientes cada Cantidad de clientes


cinco minutos
que llegaron
0
12
1
45
2
34
3
21
4
13
5
8
Ayude a construir al alumno un modelo de distribucin de probabilidad de llegadas,
validndole respectivamente; considera un nivel de significancia del 5%.
4.11. El promedio de notas de los alumnos de ingeniera, obtenidos en el curso de Lenguaje de
Programacin durante el ciclo pasado, estn tabulados en la siguiente tabla:
Notas obtenidas
por los alumnos

Nmero de
alumnos
observados

[ 03
8
[ 47
13
[ 8 11
20
[12 15
10
[16 20
4
Encuentre una curva de comportamiento terico del comportamiento de estas notas, y valdelo al
1%.
4.12. Para qu se desarrolla una prueba de contingencia?
4.13. Qu significa decir que las variables son independientes, en una prueba de contingencia?
4.14. De qu manera se puede validar una prueba de contingencia?
4.15. Explique el significado de que dos variables son dependientes, luego de desarrollar la prueba
de contingencia.
4.16. Un investigador est interesado en conocer, si la lectura de los diarios chicha de circulacin
nacional, est asociado al nivel cultural de las personas y el lugar donde residen; para ello se
hace un muestreo en diferentes lugares dentro del mbito de influencia de la Universidad,
preguntndosele a cada uno de ellos por las habituales lecturas de estos diarios,
encontrndose los siguientes resultados:
Preferencia por los diarios chicha, de una muestra de personas de diferentes
mbitos del rea de influencia de la Universidad

Grado de Instruccin
Primaria
Secundaria Incompleta
Secundaria Completa
Superior Incompleta
Inferencia Estadstica

Vgueta
7
6
8
3

Carqun
9
10
5
5

Ciclo 2013-I I

Supe
3
7
8
4

Sayn
10
8
7
4

Humaya
9
7
10
5
Moiss E. Armas

Pgina 46 de 85
Superior Completa
2
1
5
3
2
Analice los resultados de esta tabla y formule sus propias conclusiones; considere un riesgo de
equivocarse del 5%.
R: La hiptesis nula debe plantearse en los siguientes trminos: La lectura de los diarios chicha, nada tiene que ver
con el grado de instruccin de las personas que los leen, as como el lugar donde habitualmente se encuentran, frente
a la alternativa, que si efectivamente se darn estas condiciones, dado que hay suficiente evidencia como para afirmar
que los resultados de la tabla, as lo evidencian. Construyendo su tabla de valores esperados, se obtiene que su chi
cuadrado real es R = 10,32, el cual contrastado con el c(0,95,16) = 26,36, se puede concluir que efectivamente la lectura de
estos diarios, no est asociado al grado de instruccin de las personas que los leen, ni al lugar de procedencia.

4.17. Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea conocer si la preferencia por algn
plan de seguros de sus clientes est asociada al nivel ocupacional en ejercicio. Se toma una
muestra aleatoria de un grupo de clientes usuarios de este plan, obtenindose los siguientes
resultados:
Plan de seguros optados por los clientes

Nivel ocupacional
A
B
C
D
Obreros
30
45
35
70
Comerciantes
48
39
47
65
Profesionales
59
46
52
60
Independientes
20
15
10
22
a) Podra asegurarse que el plan de seguros optado por los clientes nada tiene que ver con los
tipos de clientes?, considere un riesgo de equivocarse del 1%.
b) Qu debera pasar para decir que el plan de seguros optados por los clientes, est asociado
a su nivel ocupacional, considerando un riesgo de equivocarse del 5%?
c) De qu manera podra utilizarse el SPSS para resolver este problema?
4.18. Un canal de televisin est interesado en saber si los programas que transmite da a da
influyen en el grado de conducta de su tele audiencia; para tales fines selecciona una muestra
aleatoria de un grupo de televidentes de diferentes grupos de edades, y los somete a una
prueba psicolgica, despus de un perodo de observacin, encontrndose los siguientes
resultados:
Nivel de conducta observada en una muestra de televidentes,
como resultado de sus programaciones, de la Empresa Televisiva XXXX

Grupo de
Muy
Agresivo Normal Hiperactivo
personas
agresivo
Nios
15
28
22
20
Jvenes
24
14
20
17
Adultos
10
12
24
14
Tercera edad
6
16
14
9
Podra asegurarse que existe una relacin entre el nivel de conducta de los grupos de edades
de las personas y la programacin emitida por la empresa televisiva, asumiendo un riesgo de
equivocarse del 5%?
4.19. Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer fuertes pedidos de
sus clientes provenientes del exterior; sin embargo el departamento de control de calidad alega
que este sistema de trabajos no es conveniente dado que frecuentemente encuentran fallas de
calidad en las prendas confeccionadas por sus trabajadores, lo cual puede perjudicar la imagen
de la empresa ante sus clientes. A fin de determinar si realmente existe este tipo de problemas
como lo alega control de calidad, se toman muestras aleatorias de un grupo de trabajadores de
loa diferentes turnos y se les evala sus respectivos trabajos, y determinar el nmero de fallas
encontradas en las prendas producidas; los resultados de estos se encuentran en la siguiente
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 47 de 85

Resultados del muestreo hecho a una muestra de trabajadores,


para determinar el nmero de fallas encontrados en las prendas confeccionadas

Estado de las prendas


Maana
Tarde
Noche
confeccionadas
Mal
5
3
11
Regular
4
12
6
Aceptable
16
9
7
Ninguna
7
5
3
a) Podra asegurarse que lo manifestado por el departamento de control de calidad es vlido y
no trabajarse con este sistema de turnos, o es que estos problemas pueden deberse a otros
factores?; considere un riesgo de equivocarse del 5%.
b) Utilice el SPSS para contrastar sus resultados manuales con lo proporcionado por ste.
4.20. A consecuencia del crecimiento econmico de la economa peruana, se observa en algunos
sectores de la economa que el consumo de bebidas ha tenido un incremento sostenido;
algunos inversionistas decididos a ingresar en este rubro estn abocados a estudiar el
comportamiento de los potenciales clientes, y como tal encargan a unos estrategas en
marketing averiguar las caractersticas de los consumidores, considerando que las personas a
partir de cierta edad, ingresan a consumir determinado tipo de bebida; pero no solamente se
considera que es la edad, sino tambin se considera como factor, el ambiente social donde se
desenvuelve; en este sentido, formule un modelo matemtico que permita explicar este posible
comportamiento, teniendo en cuenta las dos relaciones establecidas, y de qu manera podra
orientarse a los inversionistas, ingresar tranquilamente a este rubro?
4.21. Ante el advenimiento de las prximas elecciones para elegir al nuevo presidente de la repblica,
los tres partidos polticos ms voceados por las empresas encuestadoras, deciden implementar
un nuevos spot publicitarios a travs de la TV, con la finalidad de influir en el nimo de la
poblacin electoral que an se mantienen indecisos o no les interesa el proceso electoral.
Despus de una semana de lanzado este spot se encarga a una encuestadora desarrollar un
estudio sobre los efectos de ste en el nimo de los electores; la empresa selecciona una
muestra de electores y recoge sus opiniones acerca del spot, obteniendo los siguientes
resultados:
Estado de nimo de los electores, respecto a los partidos
polticos A, B, y C, como resultado del lanzamiento del nuevo
spot publicitario
Partidos polticos

Estado de
A
B
C
nimo
Muy a gusto
10
12
9
Gustoso
7
8
12
No le gusta
6
9
6
No le interesa
13
10
12
Podra asegurarse que el spot publicitario, influy en el estado de nimo de los electores, o es
que esto nada tiene que ver con ese estado de cosas? Sustente su respuesta considerando una
probabilidad de equivocarse con el 5%.
4.22. Se quiere establecer si existe una relacin entre la duracin de los discos duros y los distintos
lugares donde son utilizados, dado que por parte de los clientes que los utilizan, sobre todo en
la sierra, donde hace mucho fro, dicen que estos discos, despus de un perodo corto de vida,
empiezan a tener problemas en sus pistas, debindose hacer continuas reparaciones, con el
SanDisk; para descartar las afirmaciones de los clientes quejosos, se decide hacer pruebas de
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 48 de 85
confiabilidad de los discos duros de las marcas Quantum, Maxtor, Fireball o Seagate, en
diferentes lugares que presentan climas propios, como climas fros, muy fros, templados,
clidos, y muy calurosos; estos discos duros, despus de un tiempo de uso, deber registrarse
el nmero de veces que fue reparado con el SanDisk. Los resultados de este ensayo se
muestran en la siguiente tabla:
Nmero de veces que fueron sometidos a un proceso de Scan Disk
los discos duros, en concordancia al clima donde fueron expuestos

Tipo de clima
Fro
Muy fro
Templado
Clido
Muy clido

Quantum
12
15
9
11
13

Maxtor
10
9
11
9
13

Fireball
8
13
12
9
12

Seagate
13
10
12
13
8

Con estos resultados, podra darse la razn a los clientes quejosos, o es que estos casos solo
son problemas provenientes de la casualidad? Considere un nivel de significancia del 1%
4.23. Analizando el problema de la contaminacin del medio ambiente, realizado por las personas
en la provincia de Huaura, los alumnos del V ciclo de Ing. Informtica de la Universidad se
abocan a averiguar si la manera cmo las personas que contaminaban el medio ambiente
estaban relacionados con su nivel cultural; para ello muestrearon a un grupo de personas, de
diferentes grados de instruccin y los relacionaron con las diversas modalidades de contaminar
el medio ambiente, contabilizando el nmero de veces que contaminaban, en un determinado
perodo de tiempo; los resultados de esta investigacin se muestran en la siguiente tabla:
Nmero de veces que contaminaban el medio ambiente de acuerdo a
sus diferentes niveles culturales
Diversas modalidades de contaminar

Nivel
Escupe
Tira papeles
Orina en
Fuma
Cultural
u otros
la calle
Primaria
13
8
7
5
Secundaria
15
10
3
11
Superior
9
15
4
10
Incompleta
Profesional
5
12
2
16
Universitari
o
A la luz de estos resultados, formlese una teora y generalcese para la poblacin de la
provincia, asumiendo un riesgo de equivocarse del 5%.
4.24. Se quiere establecer si realmente existe una relacin entre la apreciacin de parte de los
estudiantes, respecto a la actitud de sus profesores, ya que segn se especula, esta
apreciacin, incide mucho en su rendimiento acadmico; para ello, en una universidad, se toma
una muestra aleatoria de un grupo de estudiantes, a los cuales se les clasifica en cuatro
expectativas respecto a qu actitud debera tomarse en el docente, parta sentirse ms
motivado en el desarrollo de sus clases; las opiniones de los estudiantes respecto a estas
preguntas, fueron los siguientes:
Caractersticas valoradas por los estudiantes segn las actitudes de
sus profesores

Actitud del profesor


Domina el tema
Prepara bien sus clases
Es ordenado en la clase
Inferencia Estadstica

Muy
bueno
12
6
5

Buen

Regular

Malo

10
7
8

7
8
7

Ciclo 2013-I I

13
5
9

Moiss E. Armas

Pgina 49 de 85
Hace apuntes en la pizarra
8
4
2
9
Es puntual en las clases
10
6
7
5
Evala con justicia
5
3
3
7
Tiene buena diccin
9
4
6
12
Evale los resultados de esta tabla, teniendo en cuenta el grado de conocimiento con el que
cuenta hasta el momento.
4.25. Los alumnos del V ciclo de ingeniera informtica, en el ciclo que fenece, desarrollaron un
trabajo de investigacin, el cual consisti en averiguar las preferencias de continuar estudios
superiores en una universidad pblica del departamento de Lima; para ello, encuestaron a una
muestra de estudiantes del cuarto y quinto ao de la educacin secundaria, a quienes les
preguntaron sobre esta posible opcin; los alumnos encuestados fueron clasificados segn el
nivel de ingresos mensuales de sus respectivos padres, y registrados en los casilleros
correspondientes a las preferencias de continuar estudios superiores en las universidades, que
a continuacin se presenta:
Preferencias de continuacin de estudios superiores, en una institucin
universitaria de Lima, de una muestra de alumnos, clasificados segn los
ingresos de sus padres de familia.
Universidades nacionales del departamento de Lima

Nivel de
ingresos S/
800 1600
1600 - 2400
2400 3200
3200 4000
4000 - 4800

UNI

UNJFSC

UNMSM

UNFV

LA MOLINA

3
2
1
6
4

5
3
2
1
0

6
2
3
4
5

4
2
1
1
1

0
6
2
5
3

a) Cuntos estudiantes fueron encuestados, y qu tipo de anlisis deber hacerse para


obtener una conclusin, respecto a estas observaciones?
b) Formule un contraste de hiptesis para aceptar o rechazar la evidencia segn su respuesta
anterior; asuma un riesgo de equivocarse del 5%.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 50 de 85

DISEOS EXPERIMENTALES

Un experimento se hace con la finalidad de


obtener un resultado; los resultados del
experimento no pueden predecirse con
anticipacin, porque se est a la postre de
querer
descubrir
algo
nuevo;
los
experimentos tambin se pueden hacer
tomando varias poblaciones y confrontando
sus resultados para ver si existe alguna
diferencia entre ellas. En este caso se habla
de diseos experimentales, donde, de
poblaciones diferentes se extraen muestras
aleatorias, los cuales son sometidas a un
conjunto
de
observaciones
o
experimentaciones, los resultados de este
experimento permitirn aportar algn nuevo
conocimiento, los cuales induzcan a tomar
alguna conclusin.

DISEO COMPLETAMENTE AL AZAR


Un diseo con estas caractersticas sucede cuando se quiere experimentar los efectos de una serie
de tratamientos, llamados variables en determinados sujetos, llamados muestras; en este caso se
seleccionan muestras que supuestamente renen ciertas caractersticas, llamadas muestras
homogneas; estas muestras son asignadas aleatoriamente solo una vez a uno de los tratamientos;
luego de desarrollar el experimento, se somete a una evaluacin para ver si los efectos de los
tratamientos tuvieron algn efecto en las muestras asignadas.
Una forma de medir estos efectos es ver si por lo menos uno de los promedios generales de un
tratamiento tuvo algn efecto superior a los otros tratamientos, si as lo fuere, entonces se dice que el
tratamiento fue exitoso, de otra manera no lo ser.
Dentro del contraste de hiptesis, este deber plantearse en los trminos siguientes:
H0: El promedio general por cada tratamiento seguir siendo el mismo.
H1: Por lo menos, con uno de los tratamientos, se obtendr un promedio mayor que los otros.
El objetivo de este contraste de hiptesis ser el de rechazar la nula, ya que se quiere demostrar que
el diseo experimental, tiende a mejorar el estado de la situacin actual; para ello se considera que
todas las muestras tienen la misma oportunidad de ser seleccionadas, y que sus varianzas
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 51 de 85
poblacionales son iguales, y que adems, las muestras asignadas a cada uno de los tratamientos han
sido tambin al azar.
Ejemplo 5.1 Un investigador est interesado en probar tres mtodos de enseanza a fin de mejorar
el rendimiento acadmico de los alumnos de un instituto educativo; para ello selecciona al azar un
grupo de estudiantes, y al azar, sin que stos lo solicitaron ni conocan el mtodo de enseanza,
fueron asignados a solo uno de los mtodos, identificados por T1, T2 y T3; despus de un perodo de
observacin, los alumnos fueron calificados con notas comprendidos entre cero y 100, cuyos
resultados se muestra en la siguiente tabla:
Tabla 5.1
Puntajes obtenidos segn mtodo
De enseanza en un centro educativo

T1
23
12
16
24
21

T2
44
51
56
78
42
58

T3
78
56
65
66
43
67
77
52
Podra asegurarse que la implementacin de estos tres mtodos, hubo mejora en el rendimiento
acadmico de los alumnos, asumiendo un riesgo de equivocarse del 5%?
Solucin:
Se trata de averiguar si por lo menos con uno de estos tres mtodos de enseanza, se logr mejora;
en trminos de contraste de hiptesis:
H0: El rendimiento acadmico de los alumnos seguir siendo el mismo, pese a la implementacin de
nuevos mtodos de enseanza.
H1: Por lo menos, con uno de los mtodos de enseanza, se lograr elevar el rendimiento acadmico
de los alumnos.
En trminos cuantitativos, este contraste podr expresarse:
H0: 1 = 2 = 3
H1: Por lo menos uno de estos k, ser mayor que los dems, donde k = 1, 2, 3.
Haciendo los clculos respectivos, se obtiene su tabla de anlisis de varianza, donde el F r = 25,26
deber contrastarse con el Fc(0,95;2, 16 ) = 3,50.
TABLA DE ANVA
FUENTE
SC
gl
Tratamiento
6212.16
Error
1967.63
Total
8179.7
9
Inferencia Estadstica

2
16
18

CM
Fr
3106.08 25.26
122.98

Ciclo 2013-I I

Moiss E. Armas

Pgina 52 de 85
Del anlisis de esta tabla, se puede observar claramente que Fr es mayor que el Fc, por lo tanto, la
hiptesis nula debe ser rechazada, a favor de la hiptesis alternativa, debindose aceptar que
efectivamente hubo mejora en el rendimiento acadmico de los alumnos con uno de los tratamientos,
siempre con el riesgo de que habr un 5% de probabilidad de equivocarse al optar por esta decisin.
Ejemplo 5.2 Un investigador est evaluando la produccin de un conjunto de cuatro mquinas de
marcas diferentes; las mquinas elaboran ciertos artculos cada hora, y a fin de evaluar el rendimiento
de cada una de ellas, en determinadas horas, lleva el registro de produccin los cuales se muestran
en la siguiente tabla:
Tabla 5.2
Cantidad de productos, expresados en unidades,
elaborados por hora, segn marca de la mquina

A
250
264
256
235
239
230
240
250
245
239

B
267
254
267
242
267
261
260
258
270

C
257
279
269
252
277
289
240
236

D
241
258
262
264
273
260
263
279
245
239

El investigador considera que existe diferencia en cuanto a la produccin de acuerdo a la marca de la


mquina, y para desvirtuar tales fines, decide hacer un anlisis de varianza, asumiendo un riesgo de
equivocarse del 5%.
El contraste de hiptesis deber hacerse en los siguientes trminos:
H0: Todas las mquinas tienen la misma capacidad de produccin por hora, independientemente de
su marca.
H1: Por lo menos hay diferencia de produccin por hora, con una de las marcas de mquina.
Los resultados del anlisis
tabla.
TABLA DE ANVA
FUENTE
SC
Tratamiento
1832.45
Error
5701.88
Total
7534.32

de varianza, desarrollados manualmente, se muestran en la siguiente

gl
3
33
36

CM
610.82
172.78

Fr
3.54

Fc(0.05, 3, 33) = 2.904

Contrastando Fr con Fc(0,05; 3,33), se obtiene que Fr es mayor que Fc, por lo que debera rechazarse la
hiptesis nula, en el sentido de que existe un riesgo de equivocarse del 5%, al estar rechazando una
hiptesis verdadera.
Uso del software estadstico Minitab
Abra su editor del Minitab, y en cada columna C1, C2, C3 y C4, correspondientes para las marcas de
mquina A, B, C y D, introduzca los datos tal como se proporciona en la tabla 5.2; en el men
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 53 de 85
principal siga la secuencia: Stat ANOVA oneway (unstacked); donde observar la ventana
one-way Analysis of Variance, y en la primera ventana aparecen en columnas, las variables C1,
C2, C3, C4; en la Respons (in separate columns): escriba C1-C4.
El nivel de confianza mostrado por defecto es 95.0, lo cual es equivalente a decir que su nivel de
significancia es 0,05; si desea puede modificarlo; de igual manera, si desea obtener grficos puede
pulsar el botn Graphics y escoger la opcin deseada; finalmente pulse el botn OK donde obtendr
la siguiente tabla de anlisis de varianza
One-way ANOVA: A, B, C, D
Source DF SS MS F
P
Factor 3 1832 611 3.54 0.025
Error 33 5702 173
Total 36 7534
S = 13.14 R-Sq = 24.32% R-Sq(adj) = 17.44%
Como podr observar, el F calculado coincide con lo hallado manualmente, este valor deber ser
contrasto con el Fc(0,95; 3, 33) = 2,904 que le proporciona una tabla F.
A fin de no estar buscando en la tabla el Fc, basta con comparar el valor de P con el nivel de
significancia = 0,05; si P < , se rechaza H0, de otro modo se lo aceptar; en este caso P = 0,025 es
menor que 0,05, por lo tanto deber rechazarse H0.
De igual manera obtendr la siguiente informacin:

Level
A
B
C
D

N
10
9
8
10

Mean
244.80
260.67
262.38
258.40

StDev
10.29
8.72
19.18
13.18

Individual 95% CIs For Mean Based on


Pooled StDev
----+---------+---------+---------+----(--------*-------)
(--------*--------)
(--------*---------)
(-------*--------)
----+---------+---------+---------+-----

PRUEBA DE TUKEY
Cuando se rechaza la hiptesis nula, significa que por lo menos con uno de los tratamientos se ha
podido lograr un efecto significativo en el experimento; el problema ser determinar con cules de
sos tratamiento se lograr mayores efectos; la prueba de Tukey permite proporcionar se
tratamiento; para ello se compara su DHS, el cual se obtiene de una tabla que proporciona los puntos
porcentuales del rango de t de Student, y se compara calculando todas las medias pareadas,
ordenadas en forma descendente, de los tratamientos, este DHS se obtiene del siguiente modo:

q( ;k , nk)
DHS=

2CME
, donde = nivel de significancia, CME el cuadrado medio del error, k
nj

= nmero de tratamientos, nj el nmero de observaciones del tratamiento j, y n el nmero total de


observaciones; cuando la diferencia entre dos medias pareadas es mayor que el DHS, significar que
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 54 de 85
hay diferencia significativa entre estas, por lo tanto, la media mayor ser la que proporciona mejores
resultados.
Analizando el caso del ejemplo; solo se est considerando que el tamao de la muestras de los
tratamientos es el mximo, cuando en realidad debera hacerse cada anlisis para cada tamao de
muestra; as nj = 10, por lo tanto: DHS =

q(0,05 ; 4,32)

2173
10

= 15,81, donde q(0,05; 4, 32) = 3,802.

Las diferencias de las medias pareadas, ordenadas de mayor a menor es:


Media
C
B
D
A
C = 262,38
1,71
3,98
17,58
B = 260,67
2,27
15,87
D = 258,40
13,6
A = 244,80
Comparando los resultados de esta tabla con el DHS, se observa que solamente hay diferencias
significativas entre el tratamiento C con el tratamiento A y el tratamiento B con el tratamiento A, y en
todo caso, el que mejor resultados proporciona es la mquina C comparado con lo dems.
Con el Minitab, tambin se puede hacer prueba de Tukey.

EJERCICIOS
5.1.
Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea ofrece a sus clientes cuatro planes de
seguros, selecciona una muestra de clientes, se le da una explicacin detallada de las ventajas de
este plan y al final se les pide que evalen sus bondades, los cuales deben expresarse en una
nota cuantitativa, calificada entre cero y cien; los resultados de este ensayo dieron los siguientes
resultados:
Calificaciones, entre 0 y 100 a los planes de seguro
para una muestra de clientes seleccionadas al azar
A
B
C
D
30
45
55
78
68
39
67
69
59
66
92
80
20
45
47
42
89
56
59
78
72
81
a) Identifique: La variable independiente; la variable dependiente; la unidad de medida; la unidad
experimental y el de tipo de experimento.
b) Podra asegurarse que por lo menos uno de los planes de seguros de seguros optado por
los clientes tienen mejor apreciacin que los otros, por los clientes potenciales?, considere
un riesgo de equivocarse del 1%.
c) Qu poltica debera desarrollarse, si las circunstancias muestran que los planes no tienen la
debida aceptacin por los clientes?
5.2.
Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer la gran demanda
por parte del mercado europeo; para ello, queriendo saber en qu turno de trabajo, el rendimiento
de los trabajadores es mejor, selecciona una muestra de ellos, y los somete a observacin, sin
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 55 de 85
que ellos se den cuenta, a fin de cuantificar el nmero de piezas producidas en un turno de
trabajo. Debe considerarse que todos los trabajadores estaban sometidos a las mismas
condiciones laborales, por lo que se puede inferir que no exista por parte de la administracin,
ningn sesgo en la medida o apreciacin por parte de las observaciones registradas a los
trabajadores. Despus de un tiempo de observacin, se pudo obtener los siguientes resultados:
Resultados de produccin de nmero de piezas por turno, de una muestra de trabajadores de la
empresa ..

Maana
Tarde
Noche

17
12
19

11
16
17

15
15
16

20
20
12

8
21
10

12
18
23

14
19
21

18
16

11
17

10

a)
b)
c)
d)
e)

Cuntos trabajadores fueron observados?


Formule un modelo para describir el comportamiento de estas observaciones?
En qu turnos de trabajo hay mejor rendimiento?
Cul es el objetivo de desarrollar el ANVA?
A un nivel de significancia del 1%, podra asegurarse que por lo menos en uno de los turnos
de trabajo hay mejor rendimiento?
5.3. Estn en consideracin seis mquinas diferentes para utilizarlas en las manufacturas de juntas
de caucho. Las mquinas se comparan con respecto a la tensin del producto. Se emplea una
muestra aleatoria de cuatro juntas procedentes de cada mquina, para determinar si la resistencia
media de la tensin vara de una mquina a otra; las siguientes son mediciones de esa resistencia
en kilogramos por centmetro cuadrado con cada centmetro.
Mquinas
1
2
3
4
5
6
16,3
13,1
14,2
14,1
14,9
13,8
18,1
14,2
15,0
13,6
14,2
12,8
14,5
15,0
13,2
13,3
13,9
14,1
13,2
13,7
14,1
12,9
12,8
12,9
Llleve a cabo el anlisis de varianza con un nivel de significancia del 1%, e indique si las
resistencia medias a la tensin difieren o no en forma significativa para las seis mquinas.
2

nj

5.4.

Demuestre que:

( . j ..)2
i=1 j=1

T ..

T . j2

= j=1 n j

- C; donde C =

nj
j=1

5.5.
Una nueva empresa vinculada al negocio informtico est interesada en abrir nuevas
sucursales en los diferentes mbitos del pas, con la finalidad de impartir enseanza en ciencias
de la computacin; los posibles lugares donde se abriran estos negocios son: Arequipa, Trujillo,
Cajamarca, Chiclayo, Cusco y Huancayo; en vista de que carece de informacin sociocultural de
cada uno de los lugares, selecciona muestras aleatorias de posibles candidatos de cada lugar a
fin de someterlos a una prueba de percepcin de conocimientos, los cuales son cuantificados en
notas que van de cero a veinte, cuyos resultados se muestran en la siguiente tabla:
Calificativos obtenidos por los candidatos seleccionados por una
Prueba de percepcin, desarrollada durante el perodo..
Lugares

Arequipa
Trujillo
Inferencia Estadstica

12,
6
11,
5

08,
5
12,
2

12,
4
10,
2

13,
2
07,
7

07,
2
11,
5

10,
7

Ciclo 2013-I I

13,
6

11,
6

08,
7
Moiss E. Armas

Pgina 56 de 85
Cajamarc
a
Chiclayo

09, 13, 13, 09, 11,


2
1
2
8
7
14, 11, 10, 10, 14, 13,
2
6
1
2
4
4
Cusco
15, 12, 12, 11, 16, 05, 12, 10,
1
3
5
8
2
5
2
3
Huancay
13, 10, 11, 10, 12, 11, 07,
o
3
7
2
9
8
5
5
Podra asegurarse, que los potenciales candidatos, mantienen diferentes percepciones de
conocimientos, asumiendo un riesgo de equivocarse del 5%?
5.6.
Con la finalidad de evaluar el aumento en los niveles de colesterol en la sangre de las
personas mayores de los treinta aos, se disean cinco tipos de dietas con diferentes
formulaciones, los cuales son asignadas a un grupo de personas con niveles de colesterol
normal, durante un perodo de cuatro meses; pasado este tiempo se les vuelve a medir y se
encuentra los siguientes resultados:
Niveles de colesterol en la sangre de una muestra personas
seleccionadas al azar, sometidos a base de las principales dietas

Pescado
190
205
240
230
189
210
200
208
230
215
217
245

Carne
250
265
230
210
250
198
201
265
213
232
200
213
218
217

Granos
200
213
224
218
200
190
198
201
202
210
206

Aves
198
201
256
200
187
180
245
210
216
200

Verduras
202
189
218
220
201
189
178
185
200
205
218
230
205
205
189
190

Constituyen estos resultados, suficiente evidencia como para manifestar que los niveles de
colesterol en la sangre de las personas son iguales, pese a la diversidad de dietas; considere un nivel
de significancia del 5%? R: (Evale los resultados de la siguiente table)
Tabla ANVA
Source DF SS MS F
P
Factor 4 5052 1263 3.64 0.010
Error 58 20103 347
Total 62 25155
S = 18.62 R-Sq = 20.08% R-Sq(adj) = 14.57%

FR = 3,64; contrastado con Fc(0,005; 4, 58) = 2,54; por lo tanto debera rechazarse la hiptesis nula y
aceptarse la alternativa; lo mismo se puede concluir comparando P = 0,010 el cual es menor que el
nivel de significancia 0,05.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 57 de 85

Level
C1
C2
C3
C4
C5

N
12
14
11
10
16

Mean
214.92
225.86
205.64
209.30
201.50

StDev
18.29
23.32
9.82
24.10
14.52

Individual 95% CIs For Mean Based on Pooled StDev


+---------+---------+---------+--------(--------*--------)
(-------*--------)
(--------*---------)
(--------*---------)
(-------*-------)
+---------+---------+---------+--------192
204
216
228

Pooled StDev = 18.62

5.7.
Una empresa dedicada a la venta de partes de equipos de PC, seleccionar un tipo de tner
de impresoras lser, a fin de comercializar y competir en el mercado informtico; su eleccin
estar basado en aquella marca que presente mayores rendimientos, y para ello cuenta con cinco
ofertas; como no sabe por cul decidir, selecciona tner al azar, y lo somete a prueba de
impresin, obteniendo los siguiente resultados:
Cantidad de hojas impresas con las mismas caractersticas
de la muestra de tner de impresoras

HP
EPSON
LEXMARK
CANON
XEROX

206
187
230
195
201

200
198
185
215
198

184
208
198
215
195

199
217
200
207
218

230 208 192


205 215
195
192 196 212

Qu sugerencias proporcionara a los directivos de la empresa a la luz de estos resultados?;


considere un nivel de significancia del 1%.
5.8.
Explique el valor de la prueba Tukey.
5.9. Considere los adjuntos de la tabla, sobre crecimiento de las plantas en centmetros por
perodo determinado, despus de la aplicacin de diferentes tipos de hormona del crecimiento.

Hormonas

1
2
3
4
5
6

13
21
18
7
6
11

17
13
15
11
11
9

7
20
20
18
15
14

14
18
19
8
10
7

21
13
8
10
15
15

a) Realice una prueba F al nivel del 5%.


b) Qu sucede cuando se aplica la prueba Tukey?
5.10. Se desea evaluar la cantidad de alcohol que podra generar ciertas procesadas al vaco para
producir mermeladas; en ese sentido se toman muestras aleatorias de seis tipos de frutas y se
evala la cantidad de alcohol que general al producirse el proceso de fermentacin; los resultados
se muestran a continuacin:
Porcentaje de alcohol producido por fermentacin al vaco de seis tipos de frutas:
A
B
C
D
E
F
2.3
1.4
2.8
2.1
2.5
4.0
1.8
1.2
2.2
1.4
1.7
3.2
3.5
2.4
2.5
2.4
2.8
3.5
1.6
2.5
2.6
2.1
1.6
2.6
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 58 de 85
1.9
2.7
2.6
1.8
2.9
1.7

3.0
2.5
1.6
2.8
2.1
1.8

2.7
3.2
3.3
2.8
3.0
3.5

1.9
2.3
1.5
2.9
1.5
1.9

2.9
1.7
1.8
3.2
4.0
4.2

2.5
2.0
2.3
2.9
2.4
2.8

Es posible considerar que por lo menos una de las frutas genera menor proporcin de alcohol
que los dems?, considerando un nivel de significancia del 5%; en caso afirmativo, indique cul
de los tipos de fruta sera el que genera ms alcohol.
5.11. skkksk

DISEO DE BLOQUES AL AZAR


Como no siempre las muestras seleccionadas son homogneas, tal como se supuso en el diseo
completamente al azar, ya que pueden variar por algunas caractersticas, se usa el diseo de bloques
al azar, en los cuales las muestras son agrupadas de acuerdo ciertas caractersticas; esta forma de
agruparlas se llaman bloques, y cada uno de estos bloques representan muestras homogneas; as
por ejemplo cuando se quiere evaluar los efectos de ciertos medicamentos en los pacientes de un
hospital, antes de hacer los respectivos tratamientos con estos medicamentos, a los pacientes se les
puede agrupar de acuerdo a su lugar de procedencia, o de acuerdo al grupo de edad, de acuerdo a
su estado civil, etc.
En este caso el diseo de bloques al azar consta de dos factores, el bloque y el tratamiento, y el
objetivo de desarrollar este modelo, es reducir la variacin de los efectos en los tratamientos
agrupando a la muestra en grupos homogneos, de esa manera habr mayor probabilidad de
rechazar la hiptesis nula.
Ejemplo 5.3 Un empresario vinculado a la exportacin de productos agrcolas sembradas con
productos orgnicos est interesado en saber si los rendimientos de tomates, abonados con humus,
dependen de los meses de siembra, ya que sabe que estos productos requieren un perodo de cuatro
meses para ser cosechados; para tales fines prepara parcelas con las mismas dimensiones en
diferentes lugares del departamento de Lima, pero como sabe adems que estas parcelas, por ms
que todas tengan las mismas dimensiones, siempre estn afectadas por caractersticas particulares
del medio donde se va cultivar; por ello, a fin de reducir los efectos en los resultados de los
tratamientos, los que pueden surgir producto de estas particularidades, los agrupa de acuerdo a su
procedencia, y hace el ensayo durante un perodo de seis meses.
Los resultados de la cosecha en kilos por parcela, obtenida en cada mes observado, se muestran en
la siguiente tabla:
Rendimiento de tomate en kilos, por parcela, tratadas con abono orgnico, entre los
meses de enero a junio del presente ao, en diferentes lugares del departamento de Lima

LUGARES
Huaral
Inferencia Estadstica

ENE
274,3

FEB
285,2
Ciclo 2013-I I

MAR
270

ABR
285,5

MAY
233,7

JUN
223,4
Moiss E. Armas

Pgina 59 de 85
Barranca
Huaura

245,2
227,8

261
241,8

255,3
228,9

260,8
278,2

244,2
228,6

250,2
229,9

Cajatambo

301,2

289,4

302,2

306,8

302,7

271,7

Oyn
Canta

308,5
312,0

273,9
315,8

288,5
317,8

298,5
322,4

282,3
288,6

290,3
292,5

Teniendo en cuenta estas evidencias, extraiga sus propias conclusiones y diga en qu mes sera
ms conveniente sembrar los tomates. En todos los casos considere un riesgo de equivocarse del
1%.
Solucin: El contraste de hiptesis se dar en los siguientes trminos:
Ho: El rendimiento de tomate, tratados con abono orgnico, cultivados en los diferentes meses del
ao, ser el mismo, pese a que las parcelas fueron ubicadas de acuerdo los lugares donde se
cultivaron.
H1: Por lo menos, en uno de los meses del ao, el rendimiento de tomate, tratados con abono
orgnico, cultivados en los diferentes meses del ao, ser mayor que los otros meses,
agrupando a las parcelas segn lugar donde se cultivaron.
Es claro que este experimento corresponde a un diseo de bloques al azar, donde los tratamientos
corresponden a los meses del ao en que se sembraron el producto, y los bloques los lugares donde
se hacen los cultivos.
Desarrollando los clculos que conllevan a este diseo, se obtiene la siguiente tabla:
Tabla de ANVA
Fuente
variacin
Mes del ao
Lugares
Error
Total

Suma Cuadrado
4098,291
22239,56
4328,68
30666,53

g.l
5
5
25
35

Cuad Medio
819,66

Fr
4,73

173,15
Fc(0,95;5,25) =
Fc(0,99;5,25) =

2,65
3,85

Prueba de Tukey.
Si se considera que el nivel de significancia fuese del 1%, entonces contrastando Fr = 4,73 con el
Fc(0,01, 5,25) = 3,85, se puede concluir, que efectivamente, por lo menos en uno de los meses del
ao, se obtiene mejor rendimiento en las cosechas; para determinar en cul de los meses es eso
posible, se har la prueba de Tukey; para esto, de los clculos desarrollados se obtiene que los
promedios por meses de cosecha, fueron los siguientes:
Meses
Promedi
o
Smbolo

ENE

FEB

MAR

ABR

MAY

JU

278.2
y.1

277.9
y.2

277.1
y.3

292.0
y.4

263.4
y.5

259.7
y.6

Ordenndoles de mayor a menor y parendole, para obtener sus diferencias, entre cada uno de ellos,
se obtiene el lado derecho de la matriz a partir de su diagonal:
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 60 de 85
y.4
y.1
y.2
y.3
y.5
y.6
y.4
0
13,8
14,1
14,9
28,6
32,3
y.1
0
0,3
1,1
14,8
18,5
y.2
0
0,8
14,5
18,2
y.3
0
13,7
17,4
y.5
0
3,7
y.6
0
El coeficiente de Tukey al nivel de = 5%, es: q(=0,05; 6,30) = 4,30 y el DHS es 23,099,
comparando este valor con la tabla de las diferencias de medias pareadas, se pueden concluir que
solamente las diferencias de y.4 con y.5 y y.4 con y.6 son significativas, lo cual quiere decir, que
solamente en el mes de abril es donde se obtiene mejores rendimientos; en los otros meses es
insignificante.
Ejemplo . Considere el siguiente diseo de bloques al azar, donde A, D son los tratamientos.
A
B
C
D
Arial
5
8
7
11
Courier
16
20
18
23
Aharoni
25
31
26
33
Batan
10
20
15
10
Impact
3
10
10
7
TABLA
DE ANVA
Suma
Fuente
Cuad
g.l
Cuad Med
Fr
Tratamie
nto
103.6
3
34.53
Bloque
1266.8
4
4.69
Error
88.4
12
7.37
Total
1458.8
19
Fc(0,95;3,1
2) = 3.49
Fc(0,99;3,1
2) =
Uso del Minitab para desarrollar anlisis de varianza con dos factores (twoway).
Al abrir el editor del Minitab, deber seguirse la siguiente secuencia:
Los datos de la Tabla .deben presentarse del siguiente modo:
N de fila
C1
C2
C3
de hoja

(datos de filas)

1
2
3
4
5
6
7
8
9

5
8
7
11
16
20
18
23
25

Inferencia Estadstica

(filas al que pertenece) (columnas donde estn)

1
1
1
1
2
2
2
2
3
Ciclo 2013-I I

1
2
3
4
1
2
3
4
1
Moiss E. Armas

Pgina 61 de 85
10
11
12
13
14
15
16
17
18
19
20

31
26
33
10
20
15
10
3
10
10
7

3
3
3
4
4
4
4
5
5
5
5

2
3
4
1
2
3
4
1
2
3
4

En la columna C1, se colocan todos los datos en orden consecutivo, comenzando de la primera fila;
en la columna C2, se indican a qu fila pertenecen sos datos; en la columna C3 se indican las
columnas en que estn estos datos, luego se va al men principal y seguir la siguiente secuencia:
Stat ANOVA Two-way. En su respectiva ventana Two-way Analysis of Variance, en Response
escriba C1; en Row factor escriba C2, y en Column factor escriba C3; el nivel de significancia por
defecto es 0,05; luego pulse el botn Ok y obtendr la tabla ANOVA, como lo mostrado a
continuacin.
Two-way ANOVA: C1 versus C2, C3
Source
C2
C3
Error
Total

DF
4
3
12
19

SS
1266.8
103.6
88.4
1458.8

MS
316.700
34.533
7.367

F
42.99
4.69

P
0.000
0.022

Conclusin: El estadstico de prueba buscado se muestra en la fila C3 y la columna F; por lo tanto F r


= 4,69; este debe contrastarse con el Fc(0,95; 3,12) = 3,49; con lo cual se induce a rechazar la hiptesis
nula; sin embargo sin necesidad de acudir al clculo de F c, se puede comparar el valor de P = 0,022
que es menor que el nivel de significancia = 0,05; por lo tanto debe rechazarse la hiptesis nula.

EJERCICIOS
5.12. Explique la diferencia entre un diseo completamente al azar, frente a un diseo de bloques al
azar.
5.13. Se hace un estudio para saber si el nivel de gasto por da que desarrollan los turistas
extranjeros en el Per, provenientes de USA, Inglaterra, Alemania y Francia, depende de su
procedencia; para ello se toman muestras aleatorias de nueve turistas de cada pas, con la
finalidad de conocer el promedio de gasto por da en US$, encontrndose los siguientes
resultados:
Promedio de gasto por da en el pas, en US$, de los turistas extranjeros

Pas
USA
Alemani
a
Inglaterr
a
Francia
Inferencia Estadstica

1
12
0
13
3
10
0
10

2
90
11
0
13
0
11

3
11
0
95

4
99

13
0
11

12
7
11

95

5
10
5
10
0
10
5
10

6
12
9
11
0
95

7
11
8
10
0
97

10

10

Ciclo 2013-I I

8
13
0
12
5
99

9
10
0
13
0
10
2
118 11
Moiss E. Armas

Pgina 62 de 85
2
8
5
2
0
0
6
5
Encuentre la respuesta para este caso, asumiendo un nivel de significancia del 5%.
5.14. La siguiente tabla proporciona las notas promocionales de Estadstica y Matemtica, de un
grupo de estudiantes de ingeniera cursados el ciclo anterior.
Calificativo en Estadstica
Calificativo
00 05
05 10
10 - 15 15 20
Matemtica
00 05
23
15
24
8
05 10
17
14
19
16
10 15
12
8
26
5
15 20
6
4
5
2
Podra asegurarse que las notas obtenidas por los alumnos, tanto en Estadstica como en
Matemtica, guardan una relacin entre s, o es que son totalmente independientes? Sea =
5%.
5.15. Un casa comercial, especializada en el ensamblaje de equipos de cmputo, est por optar qu
tipo de marca de discos duros (HD) de las marcas Quantum, Maxtor, Fireball o Seagate, deber
adoptarse, a fin de incorporar a los nuevos modelos de PC, que piensa lanzar al mercado; para
ello es preciso conocer el promedio de vida de estos HD, que se cree, mucho depender del lugar
donde sea llevado la PC. Como los productos de la empresa son comercializados en todo el Per,
en cuatro regiones del pas, se le somete a un proceso de simulacin del perodo de vida en aos,
encontrndose los siguientes resultados:
Duracin simulada, en aos, de los discos duros en las cuatro regiones del pas:

Lima
Arequipa
Huancavelica
Cerro de Pasco
Puno

Quantum
5,2
5,3
4,7
4,4
4,8

Maxtor
5,1
5,8
5,2
4,6
5,0

Fireball Seagate
4,8
4,9
5,2
5,4
5,1
5,3
4,7
4,9
4,8
4,9

Los tcnicos que hicieron la prueba de duracin de estos HD, manifiestan que el promedio de
vida de estos discos duros, es el mismo, pese a que trabajan en diferentes lugares del pas,
usted, con los conocimientos que posee al presente, podra darles la razn? Considere un
riesgo de equivocarse del 5%.
5.16. La Municipalidad de Huaura est investigando acerca del perodo de pago trimestral en el
cumplimiento de pagos por concepto del impuesto predial, en todos sus clientes, conformados por
contribuyentes de los siguientes tipos: Rural, Residencial, Comercial e Industrial. Para ello toma
una muestra aleatoria entre todos los clientes que pagaron oportunamente sus impuestos el
pasado ao, obteniendo la siguiente informacin:
Monto pagado por los clientes, en S/ por concepto de
impuestos prediales en los trimestres correspondientes

Tipo de cliente
Rural
Residencial
Comercial
Industrial

I
21
32
16
35

Trimestres del ao
II
III
56
19
21
67
42
17
76
18

IV
29
30
21
86

Despus de eliminar los efectos, pagos por tipo de cliente, podran las autoridades
municipales, concluir que los trimestres del ao, tienen diferentes efectos en el pago del
impuesto predial?; considere = 0,025.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 63 de 85
5.17. El departamento de ventas de una casa comercial dedicada a la venta de ropas exclusivas de
hombres, est interesado en conocer si existe diferencias en las comisiones de ventas que
perciben sus vendedores en los das de atencin al pblico; para ello se toma una muestra de
cinco vendedores y se registra las comisiones percibidas durante los seis das de la semana, los
resultados de estas comisiones se indican en la siguiente tabla:
Ingreso en S/ de los vendedores por comisin de ventas en los
das de la semana

Lunes
Martes
Mircole
s
Jueves
Viernes
Sbado

A
20
21
15

B
32
27
20

C
11
30
12

D
35
12
45

E
38
17
23

10
23
30

42
17
28

45
15
30

60
12
26

53
28
36

Podra asegurarse que existe diferencia en las comisiones de los vendedores, o es que esta
diferencia solo se debe al azar?, asuma un nivel de significancia del 5%.
5.18. Se hace un estudio para saber si la estatura de las personas estaba ligado al lugar de donde
provenan; para ello, en la ciudad de Huacho se toman muestras aleatorias de un grupo de
pobladores, provenientes de Huaraz, Oyn, Hunuco, Celendn y Sihuas, a quienes se les agrupa
de acuerdo a sus edades y se les toma sus respectivas estaturas, encontrndose los siguientes
resultados:
Estatura promedio, en metros, de una muestra de personas segn
procedencia de origen y rango de edades

Rango de Huarz Oyn


Hunuco Celendn Sihuas
edad en
aos
8 10
1,34
1,28
1,36
1,42
1,45
11 13
1,42
1,41
1,43
1,44
1,46
14 16
1,67
1,70
1,58
1,65
1,73
17 19
1,70
1,69
1,62
1,72
1,71
20 22
1,68
1,69
1,66
1,70
1,72
Formule un contraste de hiptesis y explique sus conclusiones, asumiendo un riesgo de
equivocarse del 5%.
5.19. En un centro de experimentacin agrcola se estudia los efectos de cuatro tipo de fertilizantes
en el rendimiento de un tipo de tomate; para ello se dividen cinco parcelas de igual tamao y
forma, se los codifica y se les asigna al azar un tipo de fertilizante, de tal manera que esto se hace
una sola vez. La siguiente tabla muestra los resultados de la cosecha segn parcela y fertilizante
empleado:
Rendimiento de tomate en kilos por parcela, segn
tipo de fertilizante utilizado

Parcela
1
2
3
4
5

Inferencia Estadstica

A
50
55
45
48
40

Tipo de fertilizante
B
C
45
44
56
44
45
56
43
58
41
47

Ciclo 2013-I I

D
51
52
41
40
44

Moiss E. Armas

Pgina 64 de 85
Proporcionan estos datos, suficiente evidencia como para concluir que el rendimiento de
tomate, est asociado al tipo de fertilizante y la parcela utilizada, considerando un nivel de
significancia del 1%?
5.20. Una consultora en marketing, est interesada en evaluar el grado de preferencia de parte de
los potenciales consumidores de un nuevo producto, que la empresa a la cual estn asesorando;
a fin de evaluar esta preferencia de parte del pblico consumidor, se decide presentar el producto
bajos cinco tipo de envases: de vidrio, en bolsa de papel aluminio, en cartn, en bolsa de papel, y
en envase de aluminio y en frasco de polietieleno. Dado que el pblico es muy heterogneo, a fin
de reducir los efectos por estas diferencias, se los decide probarlos en siete lugares del pas de ls
cuales se seleccionar muestra aleatorias; se presenta el producto en una de estas
presentaciones, solo a uno de los seleccionados y se les pide que muestren su grado de
apreciacin, en una escala valorativa de cero a 100; los resultados de esta investigacin fueron
los siguientes:
Tabla valorativa, de uno a 100, sobre el grado de apreciacin de un producto, presentado en
diferentes envases, de clientes potenciales, seleccionadas al azar, de diferentes lugares del pas.
Presentacin del producto
Frasco
Papel
Bolsa
Envase
polietilen
Lugares
Vidrio
aluminio
Cartn
papel
aluminio
o
Huarz
59
65
40
50
78
65
Trujillo
78
43
55
51
80
74
Lima
80
69
54
49
85
70
Arequipa
61
50
56
58
74
63
Cusco
67
62
67
69
76
66
Pucallpa
50
44
68
75
70
72
Tacna
68
50
72
42
83
67
Es posible considerar que el grado de valoracin del producto, presentado en los diferentes
envases, tienen el mismo calificativo, pese a que clientes potenciales fueron clasificados de
acuerdo a su lugar de procedencia? Asuma un riesgo de equivocarse del 5%

5.21. Las instalaciones para generar energa nuclear producen gran cantidad de calor que, en
general se descarga a cuerpos de agua. Ese calor eleva la temperatura del lquido, lo cual da
como resultado una mayor concentracin de clorofila que, a la vez, alarga la temporada de
crecimiento. Para estudiar este efecto, se tomaron muestras de agua en forma mensual en 3
estaciones durante un perodo de 12 meses. La estacin A es la que se ubica ms cerca de una
descarga potencial de agua caliente, la estacin C es la ms lejana, y la estacin B, se encuentra
dentro de estas dos estaciones; se registraron las dos concentraciones de clorofila :
Estacin del ao
Mes
Enero
Febrero
Marzo
Abril
Mayo
Inferencia Estadstica

A
9,867
14,035
10,700
13,853
7,067

B
3,723
8,416
20,723
9,168
4,778
Ciclo 2013-I I

C
4,410
11,100
4,470
8,010
34,080
Moiss E. Armas

Pgina 65 de 85
Junio
11,670
9,145
8,090
Julio
7,357
8,463
3,350
Agosto
3,358
4,086
4,500
Setiembre
4,210
4,233
6,830
Octubre
3,630
2,320
5,800
Noviembre
2,953
3,843
3,480
Diciembre
2,640
3,610
3,020
Realice un anlisis de varianza y pruebe la hiptesis de que con un nivel de significancia de 0,05,
si hay diferencia en las concentraciones medias de clorofila en las 3 estaciones.
5.22. En un estudio realizado sobre efectos de componentes alimenticios, se asignaron 3 dietas
durante un perodo de 3 das a cada uno de 6 sujetos, con el diseo mostrado abajo. Los sujetos
que desempean el papel de bloques, recibieron las siguientes 3 dietas, en orden aleatorio:
Dieta 1: grasas mixtas y carbohidratos,
Dieta 2: muchas grasas,
Dieta 3. Muchos carbohidratos.
Al terminar el perodo de 3 das, se puso a cada sujeto en una banda caminadora y se midi el
tiempo en segundos, en que quedaban exhaustos. Se registraron los siguientes datos:
Sujeto
Dieta

A
B
C
D
E
F
1
84
35
91
57
56
45
2
91
48
71
45
61
61
3
122
53
110
71
91
122
Efecte un anlisis de varianza para determinar si existe diferencia significativa entre las dietas.
5.23. Unos emprendedores estn interesados en invertir en la ciudad de Barranca, colocando una
sucursal de servicios informticos, de tal manera que proporcione resultados en tiempo real y al
costo mnimo; previo a ello desean saber si los potenciales clientes podran asociar su presencia
al tipo de publicidad desarrollada; los clientes potenciales con las cuales se trata de determinar su
grado de satisfaccin, sern los estudiantes universitarios, los profesionales, los comerciantes,
los agricultores y los docentes del magisterio; para ello se emprende un programa de difusin
masiva en los diferentes medios publicitarios, resaltando las bondades del futuro negocio; los
resultados de este programa se muestra en la siguiente tabla:
Resultados de grados de satisfaccin porcentual en una muestra de clientes potenciales, de
acuerdo al tipo de campaa publicitaria, a favor de la empresa de Servicios Informticos.

Tipo de campaa publicitaria


Tipo cliente

Perifone
Volante Banderola
o
Estudiantes
15
5
4
9
9
10
Profesionales
7
12
16
4
5
7
Comerciantes
13
5
4
12
15
13
Agricultores
8
7
3
9
12
11
Docentes del magisterio
9
10
8
13
7
12
Otros
6
11
2
7
9
8
De acuerdo a los resultados de esta tabla, qu podra sugerirle a estos emprendedores,
asumiendo un riesgo de equivocarse el 5%?
Inferencia Estadstica

Radio

TV

Diario

Ciclo 2013-I I

Moiss E. Armas

Pgina 66 de 85
5.24. Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea conocer si el ndice de preferencia por
algn plan de seguros de sus clientes est asociada a su nivel ocupacional. Se toma una muestra
de un grupo de clientes usuarios de este plan, obtenindose los resultados mostrados en la
siguiente pgina:
Indice de preferencia porcentual, segn plan de seguros optados por los clientes

Nivel
A
B
C
D
ocupacional
Obreros
30
45
35
70
Comerciantes
48
39
47
65
Profesionales
59
46
52
60
Independientes
20
15
10
22
a. Podra asegurarse que el plan de seguros optado por los clientes nada tiene que ver con los
tipos de clientes?, considere un riesgo de equivocarse del 1%.
b. Qu debera pasar para decir que el plan de seguros optados por los clientes, est asociado
a su nivel ocupacional, considerando un riesgo de equivocarse del 5%?
5.25. En un experimento para comparar la calidad de cuatro marcas diferentes de cintas de grabar
de carrete a carrete, se seleccionan cinco carretes de 800 metros de cada marca, determinndose
el nmero de imperfecciones en cada uno.

Marca de Carrete

A
B
C
D

10
14
13
17

7
13
20
14

12
13
9
10

15
10
8
21

9
10
21
13

Se cree que el nmero de imperfecciones sigue una distribucin Poisson, para cada marca.
Analice los datos al nivel de significancia del 1%, con el objeto de averiguar si el nmero esperado
de imperfecciones por carrete es el mismo para cada marca; de otra manera, explique cules de
las marcas es la que presenta mayor desconfianza.
5.26. Un distribuidor de equipos de cmputo est interesado en saber, si diferentes marcas de
discos duros, HD, tienen diferentes tiempos de duracin, de acuerdo a las condiciones
ambientales donde son utilizadas; para ello toma seis marcas diferentes de HD y se les somete a
una prueba de simulacin de tiempo de duracin, a fin de determinar qu marca es la ms
adecuada para comercializarlo; dado que considera que las condiciones ambientales no son las
mismas en diferentes lugares del pas, los que podran influir en los clculos de la variabilidad
total, los agrupa de acuerdo al lugar donde se hacen los ensayos; luego de un tiempo de
observacin, logr configurar la siguiente tabla de ANVA, de manera incompleta:
Tabla ANVA
Fuente
S.C.
g.l.
CM
Fr
Marcas de HD
Lugar de prueba
30,75
7,86
Error
415
Total
29
a) Complete las celdas vacas de esta tabla.
b) Formule un contraste de hiptesis para este experimento, y extraiga sus conclusiones,
asumiendo un margen de equivocarse del 1%.
Solucin:

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 67 de 85
a)
b)

La SCT es 1353,475; la SCTR = 815,475 y la SCB = 123; el resto continua.


Contraste de hiptesis:
H0: La duracin de las marcas de los HD ser la misma, pese a que estas estn clasificadas segn su lugar de
procedencia.
H1: Por lo menos, una de las marcas de HD, tienen mayor duracin que las otras, pese a que estas fueron
clasificadas segn el lugar de las condiciones climatolgicas donde estaban expuestas.
Considerando que Fc(0,99; 5,20) = 3,70; debe aceptarse esta ltima hiptesis.

5.27. Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer las grandes
cantidades de pedidos de sus clientes provenientes del exterior; sin embargo el departamento de
control de calidad alega que este sistema de implementar turnos de trabajo no es conveniente
dado que frecuentemente se encuentran fallas de calidad en las prendas confeccionadas por sus
trabajadores, lo cual puede perjudicar la imagen de la empresa ante sus clientes. A fin de
determinar si realmente existe este tipo de problemas como lo alega este departamento, se toman
muestras de un grupo de trabajadores de los diferentes turnos y se les evala sus respectivos
trabajos, a fin de determinar el nmero de fallas encontradas en las prendas producidas; los
resultados de estos se encuentran en la siguiente tabla:
Resultados valorativos del muestreo hecho a un grupo de trabajadores, para
determinar el nmero de fallas encontrados en las prendas confeccionadas

Estado de las prendas


confeccionadas
Mal
Regular
Aceptable
Excelente
Ninguna

Maana

Tarde

Noche

5
4
16
17
7

3
12
9
14
5

11
6
7
13
3

a. Podra asegurarse que lo manifestado por el departamento de control de calidad es vlido y


no trabajarse con este sistema de turnos, o es que estos problemas pueden deberse a otros
factores?; considere un riesgo de equivocarse del 5%.
b. En el caso de darse la razn a control de calidad, por qu otro sistema debera optarse?

CUADRADO LATINO
En los diseos de bloque al azar, a fin de reducir los efectos de la variacin por efectos de su
heterogenidad, se les agrupa en grupos homogneos, llamados bloques; en el cuadrado latino se
tiene en cuenta dos factores de variacin y de igual modo, a los elementos muestrales se le agrupa
teniendo en cuenta estos dos factores, y se asigna el respectivo tratamiento.
Este diseo permitir configurar una serie de opciones, dependiendo del nmero de elementos con
los que cuentan los factores; as los factores son de tres elementos, entonces el cuadrado latino
estar formado por 3 x 3 = 9 celdas, donde en cada celda, solo se le asignar un tratamiento, sin que
este se repita en su respectiva fila y columna.
Ejemplo 5.3 Un empresario est interesado en introducir un nuevo producto al mercado, para ello
utilizar diferentes medios publicitarios a fin de evaluar, en cules de ellos, los clientes recuerdan ms
la publicidad del producto; dichos medios publicitarios sern: la Radio, la TV, los Diarios, los
Perifoneos, las Revistas especializadas, y la emisin de Volantes, en esta publicidad se explicar las
bondades del nuevo producto; sin embargo sus analistas de marketing consideran que los
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 68 de 85
potenciales clientes, tambin podran estar influenciados por el lugar donde habitan, adems de los
meses del ao en que se hace la publicidad; en este sentido, a fin de reducir la influencia en la suma
de los cuadrados de las varianzas totales, a estos potenciales clientes se los agrupa de acuerdo a
estos rasgos homogneos y aleatoriamente se seleccionan a un grupo de clientes y tambin
aleatoriamente se les asigna a uno de los medios publicitarios; luego se les pregunta si recordaba o
haber visto la publicidad del producto a travs del medio publicitado; las respuestas mostradas en el
diseo experimental, de manera incompleta se muestra en la siguiente tabla:
Nmero de veces que recordaba el cliente sobre la publicidad del producto,
Utilizando diferentes medios publicitarios, y agrupados segn lugar de
residencia y mes del ao

Lugar de residencia de los clientes potenciales


Mes del ao

Chimbot
e
C, 5
15
14
7
12
14

Huarme
y
9
7
E, 5
11
6
16

Huaura

Lima

Ica

Hunuco

Enero
12
14
5
15
Febrero
5
8
9
D, 4
Marzo
3
0
11
13
Abril
A, 6
10
13
8
Mayo
5
14
B, 9
2
Junio
9
F, 5
4
11
Donde:
A = representa el medio publicitario como la Radio, B = la TV, C = los Diarios, D = Perifoneos,
E = Revistas especializadas, y F = los Volantes.
a) Complete con los tratamientos en cada una de las celdas de esta matriz.
b) Evale los resultados de este experimento, asumiendo un riesgo de equivocarse del 5%.
c) En los casos de que el experimento resultase positivo, indique, con cul de los medios
publicitarios deber contar la empresa, a fin de llegar a un mayor nmero de clientes.
Solucin:
Una posible forma de diseo de cuadrado latino tiene la siguiente configuracin:
Lugar de residencia del elemento en experimentacin
Mes del ao

Chimbot
e

Huarme
y

Huaura

Enero

C,

F,

B,

Febrero

A,

15

B,

C,

Marzo

B,

14 E,

D,

Abril

F,

C,

11

A,

Mayo

E,

12

D,

F,

Junio

D,

14

A,

Inferencia Estadstica

16 E,

Lima

D,
14
E,
5
8
C,
3
0
B,
6
10
A,
5
14
F,
9
5

12

Ciclo 2013-I I

Ica
E,
5
F,
9
A,
11
D,
13
B,
9
C,
4

Hunuc
o
A,

15

D,

F,

13

E,

C,

B,

11

Moiss E. Armas

Pgina 69 de 85
Siendo el problema un tema correspondiente a un cuadrado latino; los desarrollos de los elementos
de informacin son:
Mes del
ao
Enero

Huaur
a
12

Febrero

15

Marzo

14

Abril

11

Mayo

12

Junio

14

16

Chimbote Huarmey

T.j..
67
54
T.j..^2
4489
2916
La suma de sus tratamientos:
T..A

T..D
T..E
T..F

77 T..a^2= 5929
63 T..b^2= 3969
T..c^2=
27
729
54 T..d^2= 2916
47 T..e^2=2209
48 T..f^2= 2304

T.. =

316.000

T..B
T..C

Y..a
=
y..b =
y..c =
y..d =
y..e =
y..f =

Lima

Ica

14

Hunuc
o
15

Ti..

Ti..^2

60

3600

48

2304

11

13

46

2116

10

13

55

3025

14

48

2304

11

59

3481
53
2809

40
51
51
1600 2601 2601

12.8
10.5
4.5
9.0
7.8
8.0

Como podr apreciarse, el Fr es


mayor que el Fc proporcionado
SCT =
por la tabla; por lo tanto deber
SCTR =
235.556
rechazarse la hiptesis nula;
SCColu =
62.222
debindose
aceptar
al
alternativa, en el sentido, que por
SCFila =
31.222
lo menos con uno de los medios
SCE =
293.222
F(0.95; 5,20)=
2.71
publicitarios, las personas tienen
tendencia a recordarse de la
TABLA ANVA
publicidad del producto. Con la
Fuente
Scuadrados g.l
Cmedio
Fr
prueba de Tukey se determina
Tratamiento
235.556
5
47.111
que el medio publicitario que
Columna
62.222
5
3.213
tiene mayor efecto recordatorio
Fila
31.222
5
es: la Radio, en comparacin a
Error
293.222
20
14.661
los otros medios, ya que el DHS
TOTAL
622.222
35
35
= 6,722 y la nica diferencia de
las medias pareadas entre Y..a Y..c = 8,3, es el nico valor que supera al DHS.
C=

Inferencia Estadstica

2773.778
622.222

Ciclo 2013-I I

Moiss E. Armas

Pgina 70 de 85

EJERCICIOS
5.28. El departamento de matemticas de una universidad, quiere evaluar las habilidades didcticas
de cuatro profesores; para eliminar cualesquiera de los efectos debidos a los horarios y cursos
distintos de matemticas a lo largo del da, se decidi realizar un experimento utilizando el diseo
del cuadrado latino, en el que las letras A, B, C, y D representaban a los cuatro profesores. Cada
uno de ellos ense una parte de cada uno de los cuatro cursos programados en cuatro horarios
distintos del da. Los datos siguientes muestran las calificaciones, entre cero y cien puntos,
asignadas a los maestros por los 16 estudiantes de capacidad aproximadamente igual. Utilice un
nivel de significancia de 0,05 para probar la hiptesis de que los distintos profesores no tienen
ningn efecto en las calificaciones.
Curso
Horario
1
2
3
4

Algebra
A: 84
B: 91
C: 59
D: 75

Geometra Estadstica
B: 79
C: 53
C: 84
D: 84
D: 48
A: 79
A: 55
B: 65

Clculo
D: 93
A: 81
B: 82
C: 61

5.29. Una empresa de manufactura desea investigar los efectos de 5 aditivos para el color en el
tiempo de preparacin de una nueva mezcla de concreto. Se esperan variaciones en los tiempos
de preparacin debido a los cambios diarios de temperatura y humedad, as como a los distintos
trabajadores que preparan los moldes de prueba. para eliminar estas fuentes extraas de
variacin, se dise un cuadrado latino de 5 x 5, en el cual, las letras A, B, C, D y E representan
los 5 aditivos. En la tabla que sigue se presentan los tiempos de preparacin en horas, para los 25
moldes:
Da
Trabajador
1
2
3
4
5

1
D:10,7
11,3
11,8
14,1
14,5

2
10,3
10,5
10,9
11,6
11,5

3
11,2
12,0
C: 10,5
11,0
11,5

4
10,9
11,5
11,3
11,7
12,7

5
10,5
10,3
7,5
11,5
B: 10,9

Complete las celdas de esta matriz, y con un nivel de significancia de 0,05, es posible decir que
los aditivos para el color no tienen efecto alguno en el tiempo de preparacin de la mezcla de
concreto?, Si lo fuese as, cules seran los aditivos que influyen en el tiempo de preparacin de
la mezcla de concreto?
5.30. Se hace un modelo de experimento para conocer la produccin de 6 variedades de trigo,
utilizando 6 fertilizantes en 6 aos diferentes, cuyos resultados se muestran en la tabla siguiente:
Producciones de trigo en kilogramos por parcela, utilizando seis fertilizantes en
seis aos diferentes

Aos
Fertilizantes
Inferencia Estadstica

3
Ciclo 2013-I I

6
Moiss E. Armas

Pgina 71 de 85
F1
F2
F3
F4
F5
F6

C; 70
81
70
63
62
75

75
60
62
63
67
80

80
71
A;63
66
61
50

65
80
87
52
F; 48
75

43
56
72
79
85
80

56
85
72
73
76
59

Haga un diseo experimental, completando las celdas de la matriz, y evale sus resultados,
planteando correctamente sus contrastes de hiptesis, y asumiendo un riesgo de equivocarse del
5%. Considere que A, B,F, son las variedades de trigo, cuyas cosechas son las que figuran en
la tabla.

VI.

MODELOS DE REGRESIONES

Ser original es una cualidad, quererlo ser es un defecto.


Las personas afortunadas no se corrigen nunca, siempre creen
tener razn, incluso en sus malas acciones.
Triunfan aquellos que saben cundo luchar y cundo no.
La mujer llora antes del matrimonio, el hombre despus.

A menudo existe la necesidad de estudiar la relacin entre dos variables, una dependiente y la otra
independiente; cuando se trata de encontrar esta relacin, se est en el caso de encontrar un modelo
de regresin que permita encontrar una funcin que permita relacionar estas dos variables; si la
variable dependiente solo depende de una sola variable independiente, se estar en el caso de un
modelo de regresin simple; si la variable dependiente est en funcin de ms de una variable
independiente, entonces se trata de encontrar un modelo de regresin mltiple; para el primer caso
se dice que yi = f(xi), y para el segundo caso, y i = f(x1, x2, x3, .., xn), donde los xi son las variables
independientes y los yi representan los valores reales para cada valor de la variable independiente.
De este modo, si se estuviera interesado en saber qu relacin existe entre el peso de las madres
gestantes y sus respectivos bebs; o qu relacin existe entre las notas obtenidas por los alumnos,
cuando dedican un determinado nmero de horas de estudio a la semana, se estara tratando de
encontrar un modelo de regresin simple, ya que el peso de las madres gestantes, depender del
peso de sus bebs al momento de nacer, por lo cual se dice que el peso de las madres gestantes, es
una funcin de los bebs al momento de nacer, o Peso i = yi = f(xi); de igual manera podra afirmarse
que las notas obtenidas por los alumnos, estarn en funcin a las horas dedicadas al estudio; esto es
Notasi = yi = f(hi).
En estas y cualesquiera de otras situaciones similares, se trata de encontrar una relacin entre la
variable dependiente y la variable independiente. Cuando la variable dependiente est relacionado
con cualquier elemento que perturbe a la variable independiente, se dice que la relacin es causal;
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 72 de 85
esto es que una variable independiente genera un efecto en la variable dependiente; si la variable
independiente est asociado al tiempo, la relacin se dice que es una serie de tiempo o y i = f(ti),
donde ti es la variable independiente tiempo.
Una idea aproximada de obtener una relacin causal o serie de tiempos entre las dos variables, es
construir un diagrama de puntos en el sistema de coordenadas cartesianas. En el eje X se anotarn
las ocurrencias de la variable independiente xi y en el eje Y, el valor de la variable dependiente y i para
a cada ocurrencia de xi; este sistema de representar los puntos de pares ordenados (x i , yi)para cada
observacin, se denota ploteo o construccin de su nube de puntos; la siguiente figura muestra estas
dos correspondencias.

Nube de puntos de las relaciones de X -Y


14

Variable dependiente y

13
12
11
10
9
8
7
6
5
1

3
4
Variable independiente x

Fig.
Observando este grfico se estar interesado en encontrar una curva de tendencia permita explicar
tericamente el comportamiento de la variable dependiente; a simple vista, observando el
comportamiento de la distribucin de los puntos de la grfica, puede deducirse que una curva de
tendencia que podra explicar el comportamiento de ambas variables es una recta lineal de la forma
i = a + b*xi; esta recta podra obtenerse, tratando de que la mayor cantidad de puntos, estn lo ms
cerca posible a esta recta, de all podra obtenerse por extrapolacin el valor de a que le corresponde
a la intercepcin con el eje Y; b denota la pendiente de la recta estimada; haciendo estos ajustes se
puede obtener recta la ideal, que est lo ms prximo a todos estos puntos; por lo tanto para cada
valor observado yi habr un valor terico esperado i, ambos diferentes, tal como podra suceder en
la vida real; y por lo tanto yi = i + = a + b*xi + ; donde es el error de estimacin igual a la
diferencia de yi - i; cuanto ms pequeo sea esta diferencia, mejor explicar el comportamiento de
estas observaciones; lo ideal sera que todas estas diferencias sean iguales a cero; sin embargo en la
vida real es difcil concebir que esto suceda, porque es imposible concebir que un conjunto de
observaciones sigan exactamente un modelo terico.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 73 de 85
La diferencia entre las dos relaciones yi - i se denomina desviacin alrededor de la media, y se sabe

que la sumatoria de todas estas desviaciones es igual cero; esto es

) = 0. El inters de

i=1

hacer esta sumatoria es obtener los coeficientes a y b, ya que determinndole se tendr la ecuacin
estimada i; sin embargo como se puede observar, desarrollando esta sumatoria no ser posible;
como el inters de que estas desviaciones sean lo ms pequeo posible, a fin de evitar esta
contradiccin de las sumatorias, se puede elevar la sumatoria al cuadrado y la relacin de igualdad

siempre se seguir manteniendo en ambos miembros; esto es

)2 = 0; reemplazando por el

i=1

(Y i i )

equivalente de i, se obtiene:

(Y iabx i)2

i=1

i=1

; como la ecuacin de la recta

estimada i solo depender de a y b, y como debe ser el que proporciona los errores mnimos, se
deriva parcialmente respecto a y b, igualando ambas ecuaciones a cero; se resuelve ambas
ecuaciones y se obtiene los coeficientes deseados:
n

n x i y i x i y i
b=

i=1

i=1

i=1

ya=

n x i ( x i )
2

i=1

i=1

i=1

y ib x i
n

i =1

De esta manera, un coeficiente positivo de b indicar que a medida que xi aumenta yi tambin
aumentar, y un coeficiente negativo de b indicar que a medida que xi aumenta, yi disminuir; el
valor de a indicar el punto donde se intercepta con el eje Y.
Ejemplo 6.1 Considere el caso de que se asuma que el rendimiento acadmico de los alumnos,
estar asociado al nmero de horas dedicadas al estudio semanalmente; en este sentido se han
hecho las averiguaciones con una muestra de alumnos seleccionados al azar, cuyos resultados se
muestran en la siguiente tabla:
Horas/estudi
o
Promedio
acadmico

25

20

22

30

31

36

40

18

22

15

10

21

12

11

12

15

16

14

18

10

10

10

Construyendo su nube de puntos de estas dos relaciones se obtiene la figura que muestra su
comportamiento; tambin se ajusta una recta lineal de la forma i = a + b*xi que permita explicar el
comportamiento terico de estas observaciones:
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

.1
1
7
5
0
.1
5
0
.1
2
5
0
0
.7
S
q
r
l
i
n
e
a
l
=
0
.
8
6
9
.5
01
0
.1
5
.02
0
.H
5
.0
3
0
.3
5
.04
0
.
o
ra
s
e
t2u
d
io
/s
e
m
a
n

NotaFinl

Pgina 74 de 85

__
Fig.
Calculando los coeficientes a y b segn las frmulas deducidas, la ecuacin de la recta de regresin
estar expresada por i = 3,398 + 0,353*xi.
De acuerdo a lo planteado, se est aceptando que esta recta obtenida est estimando correctamente
las observaciones registradas, lo cual podra no ser siempre correcta; entonces surge el problema de
determinar en qu medida podra ser aceptada como vlida para poder implementarlo? Un criterio
que permite determinarlo su aceptacin es estudiar el grado de correlacin que existe entre las dos
variables, y esto se consigue con su coeficiente de correlacin; este coeficiente permite apreciar en
qu proporcin las dos variables van correlacionadas, es decir si xi aumenta, tambin yi debe
aumentar, o tambin si xi aumenta yi debe disminuir. El coeficiente de correlacin R se determina del
siguiente modo:
n

n x i yi x i y i
i=1

R=

i=1

i=1

n x i2( xi ) n y i2( y i)
i=1

i=1

i=1

i=1

Un coeficiente de correlacin de R = 1, o R = -1, significa que la correlacin es perfecta; es decir que


todos los valores observados yi coinciden con los valores estimados de i; en cambio un coeficiente
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 75 de 85
de correlacin de R = 0, significa que no existe ninguna correlacin entre x i y yi; es decir que nada
tiene que ver en que xi aumente e yi aumente o disminuya; en este sentido, cuanto ms se aproxime
el coeficiente de correlacin R a 1 -1, mejor ser la ecuacin de regresin; y al revs, cuando ms
se aproxime este coeficiente a cero, tendr menor valor la ecuacin de regresin. El coeficiente de
determinacin R2 mide el grado cohesin entre las dos variables x e y.
Retomando el ejemplo del caso tratado, se obtiene que R = 0,9391, lo cual significa que el 93,91% de
los valores de xi estn correlacionados con yi; es decir que efectivamente en el 93,91% de las horas
dedicadas al estudio, el rendimiento acadmico de los alumnos estarn influenciados por el estudio;
en cambio el coeficiente de determinacin R 2 = 0,869, explica que el 86,90 % del rendimiento
acadmico de los alumnos significa que se debe a las horas semanales dedicadas al estudio.
En los casos que la nube de puntos no es posible explicarlo mediante una ecuacin de regresin
lineal, habr que buscar otros modelos simples que permitan explicar el comportamiento de las
observaciones; la Figura muestra tres casos posibles que podran suceder al construir su nube de
puntos.
En el primer caso, una posible ecuacin que podra aproximarse puede ser de la forma potencial de
ecuacin i = a*xb, lo cual puede ser fcilmente puede ser llevado a la forma lineal, tomando
logaritmos: Ln i = Ln a + b*Ln(xi) y resolver como una ecuacin lineal; en la segunda figura la curva de
tendencia podra aproximarse a una forma exponencial de la forma i = a*bx; de igual manera esta
ecuacin puede ser linealizado tomando logaritmos: i = Ln(a) + x*Ln(b); el tercer caso, la curva de
tendencia puede aproximarse a una exponencial negativa o una hiperblica; si el caso fuese la

1
i

hiperblica, la ecuacin puede ser de la forma:

Curva creciente, exponencial, polinmica, etc.

1600

16000

1400

14000

1200

12000

1000

10000

800

8000

Curva decreciente, forma hiperblica o exponencial, etc.


20000

600

6000

400

4000

200

2000

y3

15000

y2

y1

Curva creciente, potencial, etc.

= a + b* x.

5000

0
0

10

20

30
x1

40

50

60

10000

0
0

10

20

30
x1

40

50

60

10

20

30
x1

40

50

60

Fig. Curvas de tendencia para diferentes grficos de dispersin


No siempre estos modelos pueden coincidir con los valores observados; pueden determinarse
diferentes curvas de tendencia; las observaciones registradas podran seguir series polinmicas de
las formas: i = a + b*x + c*x2, que es de la forma cuadrtica, o de la forma i = a + b*x + c*x2 +
d*x3, que es de la forma cbica, etc.; en todos estos casos se deber determinar los valores de los
coeficientes a, b, c, d
Para validar la ecuacin, deber desarrollarse su anlisis de varianza, y escoger el modelo que mejor
se ajuste a las condiciones del problema; el SPSS le permite mostrar diferentes modelos de
regresin, con sus respectivas de anlisis de varianza.
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 76 de 85
ANOVA
Suma de

gl

Media

cuadrados
Regresin
Residual
Total

Sig.

cuadrtica

103.343

103.343

15.574

10

1.557

118.917

11

66.356

.000

La variable independiente es Hestudio.

Ejemplo 6.2 Considere que una empresa est interesado en conocer la relacin existente entre los
gastos en publicidad y los ingresos obtenidos, por ventas de laptop; para ello la tabla siguiente
muestra el comportamiento de estas dos variables.
Tabla 6.2
Ingresos en Nuevos Soles por ventas de Laptop,
segn gastos desarrollados en publicidad

Gastos en Publicidad
X
2560
3201
4500
4800
5238
5493
6394
6521
7368
8891

Ingresos por gastos


en publicidad Y
10239
12303
21753
21392
28736
25439
34547
27653
38450
36827

Uso del SPSS para encontrar ecuaciones de regresin.

Defina sus variables por X y Y, como la tabla


precedente e introduzca sus datos; luego en el
men principal siga la secuencia: Analizar
Regresin Estimacin curvilnea; en la
ventana Dependientes, introduzca Ingreso (Y),
y en Independientes, introduzca Publicidad (X);
luego se puede escoger los modelos de
regresin deseados; en la opcin Modelos:
Haga chec en Lineal y si desea obtener su
anlisis de varianza, en la opcin Mostrar tabla
ANOVA pulse Aceptar, observar la figura y la
respectiva tabla de resultados:
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

l40.0o
M
o
d
e
d
e
rg
e
s
i
n
lie
a
lp
ra
lIn
e
c
a
s
o
d
e
I
n
g
r
e
s
o
m
o
n
e
t
a
r
i
o
s
v
e
r
s
u
g
a
s
t
o
d
s
o
d
p
u
b
l
i
c
d
a
g
rS
/
Pgina 77 de 85

3
0.0
2
0.0
S
q
r
l
i
n
e
a
l
=
0
.
8
2
1
0.02
0
.04
0
.0
0
.0
G
a
s
to
e
n
p
u
b
li6c
d
a
e
n
S
/80.0
La siguiente tabla proporciona sus coeficientes de correlacin y determinacin:
Resumen del modelo
R cuadrado
R cuadrado
corregida
.939
.882
.868
La variable independiente es Publicidad.
R

Error tpico de
la estimacin
3494.969

La siguiente tabla proporciona los coeficientes del modelo de regresin lineal:


Coeficientes
Coeficientes
estandarizado
s

Coeficientes no
estandarizados

Publicidad
(Constante)

B
4.761
-437.653

Error tpico
.615
3555.376

Beta
.939

t
7.745
-.123

Sig.
.000
.905

Como solo se escogi la opcin modelo de regresin lineal el modelo estimado tiene como ecuacin
i = a + b*xi, entonces a = -437,653 y el coeficiente b = 4,761, por lo tanto la ecuacin requerida ser
i = -437,653 + 4,761*xi.
La siguiente tabla muestra su anlisis de varianza:
ANOVA

Regresin
Residual

Suma de
cuadrados
732671495.788
97718479.113

Total

830389974.901
La variable independiente es Publicidad.

Inferencia Estadstica

gl
1
8

Media cuadrtica
732671495.788
12214809.889

F
59.982

Sig.
.000

Ciclo 2013-I I

Moiss E. Armas

Pgina 78 de 85
En este caso, su Fr = 59,982, el cual contrastado con el Fc(0,005, 1,8) = 5,12, puede apreciarse que el
modelo es vlido.
De igual modo, de la ventana Estimacin curvilnea, se pueden escoger otras opciones de regresin
como: Cuadrtico, Cbico, Logartmico, Crecimiento, Inverso, Exponencial, etc. A manera de prueba
seleccione la opcin Cbico y podr obtener los principales resultados:
La tabla muestra sus coeficientes de correlacin y coeficientes de determinacin:
Coeficientes de regresin y determinacin:
Resumen del modelo
R cuadrado
R cuadrado
corregida
.967
.935
.903
La variable independiente es Publicidad.
R

Error tpico de
la estimacin
2997.256

Tabla de anlisis de varianza, donde se indica que debe aceptarse el modelo de regresin, ya que Fr
es mayor que Fc.
ANOVA
Suma de
cuadrados
gl
Regresin
776488721.
3
786
Residual
53901253.1
6
14
Total
830389974.
9
901
La variable independiente es Publicidad.

Media
cuadrtica
258829573.
929
8983542.18
6

F
28.812

Sig.
.001

Grfico del modelo cbico:

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

In
g
re
s
oO
b
s
e
ro
v
a
d
C

ic

4
0.0
3
0.0
2
0.0
1
0.0
2
0
.04
0
.0P
6
0
.08
0
.0
u
b
lic
d
a

Pgina 79 de 85

__

Los coeficientes del modelo de regresin cbico:


Coeficientes

Coeficientes
estandarizado
s

Coeficientes no
estandarizados

Publicidad
Publicidad ** 2

B
-4.492
.002

Publicidad ** 3
(Constante)

Error tpico
14.691
.003

Beta
-.886
5.225

-1.63E-007

.000

-3.511

9057.332

24138.905

t
-.306
.842

Sig.
.770
.432

-1.025

.345

.375

.720

Ejemplo 6.3 Una empresa observa que los costos totales de llevar inventarios de un determinado
producto estn relacionados de acuerdo a la cantidad que ordena comprar, cada vez que los
requerimientos as los exigen; los costos de acuerdo a estos pedidos se muestran en la siguiente
tabla:
Cantidad de
producto solicitado
en unid.

Costo total de
llevar inventarios
en S/

200
350
460
570
602

13850.0
9387.5
8353.3
7983.6
7948.5

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 80 de 85
625
640
800
900
1200
1400
1800
2130

7938.3
7937.5
8150.0
8425.0
9600.0
10550.0
12650.0
14495.6

Formule un modelo de regresin y valdelo al 5%.


Solucin:
Construyendo su diagrama de puntos y tratando de buscar una curva que se aproxime a estas
observaciones, se obtiene la siguiente figura:

Esta curva sigue una forma cuadrtica de la forma: i = a + b*x + c*x2, por lo tanto se puede probar
este modelo para determinar los coeficientes a, b y c, con el SPSS.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 81 de 85
Escogiendo la opcin Analizar Regresin Estimacin curvilnea, se define como variable
dependiente Costo y como variable independiente Cantidad; se escoge como modelo: Cuadrtico, y
para que muestre las constantes de la ecuacin, represente los modelo y ver la tabla ANVA, chequear
en sus respectivos casilleros; los resultados sern los siguientes:
Descripcin del modelo
Nombre del modelo

MOD_3

Variable dependiente

Costo

Ecuacin

Cuadrtico

Variable independiente

Cantidad

Constante

Incluidos

Variable cuyos valores etiquetan las observaciones en los

Sin especificar

grficos
Tolerancia para la entrada de trminos en ecuaciones

.0001

La siguiente tabla muestra los coeficientes de la ecuacin:


Coeficientes
Coeficientes no estandarizados

Coeficientes

Sig.

estandarizados
B
Cantidad

Error tpico
-9.902

2.848

-2.407

-3.477

.006

.005

.001

3.030

4.378

.001

12829.842

1337.613

9.592

.000

Cantidad ** 2
(Constante)

Beta

La ecuacin se obtiene activando la Ventana Propiedades o pulsando Crtl T, una vez estando en el
editor de grficos de la ecuacin; en este caso la ecuacin que se obtiene siguiendo esta instruccin
es:
i =12829.8421089082 + -9.902268589937924 * x + 0.005253131143189109 * x*x
La tabla ANVA muestra que el p sig. = 0,001 menor que = 0,05, por lo tanto es dable aceptar que el
modelo buscado se ajusta a las necesidades.
ANOVA
Suma de

gl

Media

cuadrados

Sig.

cuadrtica

Regresin

51436192.847

25718096.424

Residual

16277068.965

10

1627706.896

Total

67713261.812

12

15.800

.001

La variable independiente es Cantidad.

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 82 de 85

EJERCICIOS
6.1 Qu diferencias existen entre una relacin causal y una serie de tiempos? Mediante ejemplos,

sustente sus respuestas.


6.2 Explique geomtricamente el significado de a y b, en los modelos de regresin.
6.3 Por qu se dice que una ecuacin de regresin simple, se basa en el mtodo de los mnimos

cuadrados? Deduzca los coeficientes de a y b en un modelo de regresin lineal simple.


6.4 Qu explica el coeficiente de determinacin y el coeficiente de correlacin en una ecuacin de

regresin?
6.5 Se realiz un estudio sobre la cantidad de azcar convertida, en cierto proceso, a distintas

temperaturas. Los datos se codificaron y registraron como sigue:


Temperatura
Azcar convertida

1,0 1,1
8,1 7,8

1,2
8,5

1,3
9,8

1,4
9,5

1,5
8,9

1,6
8,6

1,7
10,2

1,8
9,3

1,9
9,2

2,0
10,5

a)
b)
c)
d)
e)

Construya su diagrama de dispersin y tantee su curva de tendencia.


Estime y analice su coeficiente de covarianza.
Estime y analice su coeficiente de determinacin.
Estime la recta de regresin lineal.
Calcule la cantidad media de azcar convertida que se produce cuando la temperatura
registrada es 1,75.
f) Grafique los residuos contra la temperatura; comente el resultado.
g) Valide su modelo, considerando un riesgo de equivocarse del 5%.
h) Estime un intervalo de confianza del 95%, para esta recta de regresin.
i) Utilice el SPSS, para obtener su modelo de regresin y compruebe con lo obtenido
manualmente.
6.6 Un comerciante al detalle realiz un estudio para determinar la relacin que hay entre los gastos
de publicidad semanal y las ventas; registr los datos siguientes:
Costo publicidad S/
Ventas
S/

40
20
25
20
30
50
40
20
385 400 395 365 475 440 490 420

50
40
25
50
560 525 480 510

a) Elabore un diagrama de dispersin.


b) Determine su coeficiente covarianza.
c) Elabore su ecuacin de regresin para pronosticar las ventas semanales, a partir de los
gastos en publicidad.
d) Estime las ventas semanales cuando los costos en publicidad sean de S/ 35.
e) Valide su modelo al 1%.
f) Encuentre un intervalo de confianza del 95%.
6.7 El empuje de un motor (y) es funcin de la temperatura de escape (x) en F, cuando otras
variables de importancia se mantienen constantes. Considere los siguientes datos:
y
4300
4650
3200
3150
4950
Inferencia Estadstica

x
1760
1652
1485
1390
1420

y
4010
3810
4500
3008

Ciclo 2013-I I

x
1665
1550
1700
1270

Moiss E. Armas

Pgina 83 de 85
a) Ajuste a una recta de regresin simple y valdelo, asumiendo un riesgo de equivocarse del
5%; luego estime un intervalo de confianza del 95%, para predecir el comportamiento del
empuje del motor en la medida que la temperatura vaya incrementndose.
b) Con el intervalo de confianza obtenido, estime el empuje del motor, cuando la temperatura sea
de 1300F.
6.8 La cantidad de poblacin de una determinada regin tuvo el siguiente comportamiento a travs de
los aos:
Ao
N habitantes

1950
23 723

1960
12 465

1970
7 654

1980
6 907

1990
4 632

2000
3 681

2010
2 637

a) Encuentre su covarianza, as como su coeficiente de correlacin y coeficiente de


determinacin; analice estos resultados.
b) Dibuje su diagrama de dispersin y encuentre una ecuacin de regresin simple, luego
valdelo al 5%.
c) Confronte sus resultados con un modelo de regresin exponencial, y diga cul de ellos es el
mejor, sustentando sus respuestas cuantitativamente.
d) Construya un intervalo de confianza del 95%, y estime cuntos habitantes se tendra en el
2005.
e) Estime la poblacin que tuvo en 1940.
f) Estime la poblacin que tendr al 2020.
g) Qu puede explicar sobre el comportamiento de estos datos?
6.9 Segn tendencias obtenidas, de acuerdo a estudios estadsticos, la poblacin de un pas presenta
un crecimiento explosivo como se muestra a continuacin:
Ao
N habitantes

1940
7 320

1950
8 654

1960
10 116

1970
13 189

1980
15 472

1990
21 682

2000
25 485

2010
28 626

a) De acuerdo a su diagrama de dispersin, qu caractersticas presenta este crecimiento


poblacional, y qu tipo de modelo de regresin podra utilizarse?
b) Qu caractersticas presenta su coeficiente de correlacin lineal?
c) Encuentre un modelo regresin, y valdelo al 5%.
d) Cuntos habitantes se espera tener el ao 2020 y cuntos el ao 2030?
e) Cuntos habitantes hubieron el ao 2005?
f) Qu acciones de previsin debera tomarse para los prximos dos decenios, ante este
crecimiento poblacional?
6.10
La alta densidad de la poblacin de un determinado pas genera un sin nmero de problemas
de consumo de recursos, as como su eliminacin; de esa manera, una empresa disea una
mquina compresora para procesar lodos de las lagunas de oxidacin de sus aguas servidas; as
se relaciona el contenido de humedad de grnulos comprimidos en % con la velocidad de
filtracin de la mquina en kh-DS/m/h. Los siguientes datos muestran resultados de la
investigacin, de las relaciones entre estas dos variables:
Velocidad

125,3

98,2

201,4

147,3

145,9

% humedad

77,9

76,8

81,5

79,8

78,2

124,
7
78,3

112,2

120,4

161,2

178,9

159,5

77,5

77,0

80,1

80,2

79,9

145,
8
79,0

75,1
76,7

a) Encuentre una curva de tendencia para explicar el comportamiento de estas observaciones,


utilizando el mtodo de los mnimos cuadrados. R: Y = 72.824 + 0.0424X;
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 84 de 85
b) Qu explica su coeficiente de determinacin? r2 = 89,13% (El 89,13% de los valores observados de y,
c)

quedan explicados dentro de la ecuacin de regresin) ; r = 94,41% (El 94,41% de las observaciones estn
correlacionados)
Valide esta curva de tendencia, considerando un riesgo de equivocarse del 1 %. R: el modelo se
acepta dado que Fr= 90,174.

d) Utilizando el SPSS, encuentre un modelo polinomial de grado 3 y confronte sus resultados con
el modelo lineal.
e) Establezca los intervalos de confianza al 95%, de modo que pueda establecerse un margen
de pronstico.
f) Estime el porcentaje de humedad que se alcanzara cuando la velocidad sea de 160.
g) Si el porcentaje de humedad encontrado fue de 90%, a qu velocidad de oxidacin se
espera estar trabajando?
Por problemas de extrema pobreza, la poblacin de un centro poblado ubicado en la sierra
norte de Lima, tiende a migrar hacia otras ciudades, donde supuestamente pueden mejorar sus
condiciones de vida; de este modo se ha podido comprobar que la poblacin local, solamente se
va quedando con personas mayores y con nios, segn se muestra en la siguiente tabla:

6.11

Ao de
censo
1950
1960
1970
1980
1990
2000

Poblacin
censada
21 602
18 574
16 105
11 638
9 244
9 058

Formule y valide al 5%, un modelo de regresin simple para explicar el comportamiento


poblacional de esta localidad, y estime:
a) Nmero de habitantes que se espera, tendr la localidad al ao 2010.
b) En qu ao, se espera que la localidad se quede sin ningn habitante?
En el mercado informtico se observa que a medida que los mrgenes de ganancia por un
tipo de software desarrollado, se incrementan, los volmenes de oferta tambin siguen el mismo
comportamiento; los resultados histricos as lo determinan, segn se muestra en la siguiente
tabla:

6.12

Evolucin del comportamiento de la oferta de software

Margen de ganancia Cantidad


de
en US$ por software software ofrecido
vendido
50
10
180
14
100
23
130
28
150
32
200
61
270
89
315
95
Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Pgina 85 de 85
a) Formule un modelo de comportamiento polinmico de estas observaciones, validndole al
5%, y estime la cantidad de software que se espera ofrecer si la ganancia esperada fuera de
$ 350.
b) Explique el comportamiento de su coeficiente de determinacin y el su coeficiente de
correlacin.
c) Encuentre un intervalo de confianza del 95% de confianza para estimar los mrgenes de
ganancia, cuando la cantidad de software vendido, se incremente.
d) Podra aceptarse este modelo, dentro del marco de la racionalidad, como vlido, para
estimar futuras mrgenes de ganancia?
6.13
En determinado lugar del pas, a travs del tiempo, se ha observado que a medida que los
precios de las computadoras han ido disminuyendo, el volumen de ventas ha ido aumentando,
conforme se puede apreciar en la siguiente tabla.
Precio
de
las Cantidades de
computadoras en computadoras
miles de US $
vendidas
8,0
12
7,0
13
5,0
18
4,0
22
2,5
34
1,5
51
1,0
69
0,5
108
Formule y valide, a un nivel de significancia del 1%, un modelo matemtico del comportamiento
de ventas de las computadoras, y estime las cantidades que podran venderse si los precios
fueran de $ 0,40 y $ 10. Sug. Pruebe con el modelo hiperblico
6.14
Una empresa dedicada a la venta de refrescos de jugo de cocona, reporta que sus ventas
anuales durante los ltimos cuatro aos, variaron de acuerdo a la estacin climatolgica, segn
reporta en la siguiente tabla:
Venta en miles de botellas de refrescos de cocona de 500 ml., entre
los aos 2008 y 2011 en la provincia de Lima

AOS

VERANO

2008
2009
2010
2011

200
210
217
231

OTOO
182
193
208
219

INVIERNO
170
181
193
207

PRIMAVER
A
196
205
211
225

Pronostique las ventas de estas bebidas para los prximos cuatro aos.
6.15

Inferencia Estadstica

Ciclo 2013-I I

Moiss E. Armas

Vous aimerez peut-être aussi