Académique Documents
Professionnel Documents
Culture Documents
Ciclo 2013-I I
Moiss E. Armas
Pgina 2 de 85
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 3 de 85
PRESENTACIN
Moiss E. Armas
Profesor del curso.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 4 de 85
I.
ESTIMACIN DE PARMETROS
ESTIMACIN
CONFIANZA
PUNTUAL
ESTIMACIN
POR
INTERVALOS
DE
Las poblaciones, por lo general son grandes o muy grandes, por lo tanto trabajar con todos sus
elementos resultara contraproducente, penoso, costoso y demorara mucho tiempo en procesar la
informacin, aparte de que no tendra significado trabajar con todos ellos; en su lugar se trabaja con
sus muestras debidamente seleccionadas mediante procedimientos tcnicos, teniendo en cuenta que
cada elemento de la poblacin tiene la misma posibilidad de ser seleccionada; los elementos
muestrales, representan a la poblacin y trabajando con ellos, tranquilamente pueden extraerse
conclusiones y tomar decisiones.
Los indicadores obtenidos procesando a estos elementos muestrales, se llaman estadsticos; los
indicadores de la poblacin, se llaman parmetros; determinando los estadsticos, se estar en
condiciones de determinar o estimar los parmetros poblacionales, los cuales dentro de ste se
tienen: la media, la varianza, la desviacin estndar y la proporcin poblacional; de igual modo en el
caso de trabajar con dos o ms poblaciones se pueden obtener otros indicadores, como las
diferencias de medias poblacionales, las razones de varianza, y los diseos experimentales.
Cuando exista la necesidad de estimar un parmetro poblacional, puede hacerse siguiendo la tcnica
de la estimacin puntual, o la estimacin por intervalos de confianza, o mediante la prueba de
hiptesis.
es igual a la
media poblacional ; cuando esto sucede se dice que la media muestral es un buen estimador de la
media poblacional; igual sucede cuando se estima la proporcin poblacional p, en base a la
proporcin muestral ps; sin embargo no siempre los estadsticos resultan ser buenos estimadores
poblacionales, como sucede con la varianza muestral, debido a que ste depende del tamao de la
muestra; cuando ms grande sea la muestra, menor ser el error de estimacin, y al contrario,
cuando ms pequeo sea sta, mayor ser el error; por ello se dice que la s 2 no es un buen
estimador de la 2.
Ciclo 2013-I I
Moiss E. Armas
Pgina 5 de 85
Si una poblacin se distribuye normalmente, se
sabe que aproximadamente el 95% de las
observaciones se encuentran dentro del intervalo
2; esto es que existir una probabilidad de
que el 95% de las observaciones se encontrar
dentro del intervalo [ - 2, + 2] tal como se
esquematiza en la figura adjunta.
Los valores de la media se desvan en 2, tanto
hacia la derecha como a la izquierda; esa
desviacin es conocida como error de
estimacin; y ambos constituyen el nivel de
confianza; el nmero 2, que correctamente se
puede determinar al fijarse un nivel de confianza,
de una tabla de distribucin normal, se denomina
Fig. 1.1
El 95% de las observaciones se
coeficiente de estimacin y se denota por zc;
encontrar aproximadamente dentro del intervalo
tratndose de muestras del cual se quiere
estimar a la poblacin,
x =
especificado
A manera de ejemplo; cuando se desee conocer el promedio de los niveles de ingresos mensuales de
los ingenieros informticos, alguien podra manifestar
que estos ingresos podran estar
comprendidos entre los S/ 2 000 y S/ 5 000; otro entrevistado podra manifestar que estos ingresos
podran estar comprendidos entre los S/ 3 000 y S/ 4 000, y as sucesivamente. Esta forma de hacer
estas apreciaciones, es una estimacin basada en ciertos mrgenes llamados intervalos de
confianza; para hacer esta estimacin se toma una muestra poblacional de cierto tamao n;
asumiendo que esta se distribuye normalmente, se determina su media muestral y con ella se estima
la media poblacional, siguiendo implcitamente los procedimientos arriba mostrados.
Al desear estimar la media poblacional mediante intervalos de confianza, podra suceder que la
varianza poblacional es conocida, o es supuestamente conocida.
Estimacin de la media poblacional, conocido su varianza poblacional
Si de una poblacin infinita que se distribuye normalmente, donde desde ya se conoce por
experiencias anteriores su varianza poblacional 2, se extrae una muestra aleatoria de tamao n y
de esta muestra se determina su media muestral
estimar su media poblacional , para ello se podra asumir que esta media debera estar
comprendido dentro de un intervalo definido por [L1, L2]; esto es L1 < < L2.
La amplitud del intervalo estar determinada por el nivel de confianza con el cual se desea estimar la
media poblacional, lo cual podra ser un 95%, un 90%, su eleccin depender del carcter de la
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 6 de 85
investigacin; en trminos generales se le denota por 1 - , lo cual significar que existir una
probabilidad de 1 de que la media poblacional se encuentra dentro de este intervalo; el resto, ser
una probabilidad de que esta media est fuera del intervalo; la Fig 1.2 ilustra el carcter de este
planteamiento.
- y L2 =
muestral; la distancia geomtrica de la media muestral a los extremos de los lmites L 1 y L2, se
conocen como error de estimacin .
Al hacer la estimacin, la probabilidad 1 , se llama nivel de confianza y se prefija de antemano y
ello determina la probabilidad de que la media poblacional estar comprendido por estos lmites;
define la probabilidad de equivocarse al fijar este intervalo. De igual manera define el mximo error
de estimacin del parmetro, y es igual: = L1 - = L2 - ; si se desea que este error sea lo ms
pequeo posible, implicar que el tamao de la muestra sea cada vez ms grande.
Establecido el nivel de confianza con el cual se desea estimar la media poblacional, sus extremos
crticos sealados por L1 y L2, pueden obtenerse utilizando la tabla de distribucin normal estndar
conocidos por zc; el error de estimacin est asociado e este valor y a la desviacin estndar de
n
la poblacin del siguiente modo: = zc*
.
De esta expresin puede concluirse que un nivel de confianza muy grande, generar un valor crtico
zc muy grande, por lo cual el error de estimacin tambin se har ms grande; y a la inversa, cuanto
ms pequeo sea el nivel de confianza, generar un valor crtico z c ms pequeo, y por ende un error
de estimacin ms pequeo; por lo general, cuando se quiere hacer estimaciones por esta
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 7 de 85
modalidad, se toma un intervalo de confianza del 95% o del 99%, dependiendo de la naturaleza del
estudio.
Por otro lado, tambin analizando la expresin del error, puede concluirse, que un error cada vez ms
pequeo, demandar que el tamao de la muestra sea ms grande, y una muestra ms pequea,
generar un error de estimacin cada vez ms grande.
Reemplazando estas expresiones en el intervalo de confianza,
comprendido dentro de los intervalos:
x
: [
zc*
x
,
+ zc*
x
de la poblacin del siguiente modo:
zc*
N n
N 1
N n
N 1 , siendo N el tamao
x
,
+ zc*
N n
N 1
Ejemplo 1.1 Con la finalidad de conocer el promedio de gastos mensuales en telefona mvil, se
toma una muestra de 35 usuarios de este equipo, quienes reportaron los siguientes gastos
mensuales en Nuevos Soles:
50 55 3
34 25 20 30
34 55 6
5
45 50 52 5
3
3
2
6
50
0
0
0
0
5
0
7
1
33 42 4
45 47 50 55
56 50 4
3
30 36 38 40
1
0
2
Encuentre un intervalo de confianza del 95% para estimar el promedio de gastos de esta poblacin.
Solucin: El promedio
muestra es grande, se puede asumir que la poblacin sigue una distribucin normal con varianza
x
tanto el intervalo de confianza ser:
zc*
S/45,81].
Los clculos de este intervalo de confianza pueden simplificarse haciendo uso del Minitab; para ello
ingrese estos datos en una columna, luego siga la secuencia: Stat Basic Statistics 1-Sample Z; en
esta ventana introduzca el nombre de la columna donde estn sus datos; introduzca el valor de la
desviacin estndar; en Opciones defina el Nivel de confianza 95,0, luego pulse aceptar y el sistema
le mostrar: (38,65; 45,81)
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 8 de 85
Estimacin de la media poblacional, cuando su varianza poblacional es desconocida
En este caso, de la poblacin que se supone sigue tambin una distribucin normal, se sigue el
mismo procedimiento anterior: se extrae una muestra aleatoria de tamao n, y de esta se obtiene su
media muestral
y varianza muestral s2, pero teniendo en cuenta que la muestra sigue una
s
n
.
s
n
x
anterior; por lo tanto la media poblacional estar comprendido: : [
s
n
x
],para poblaciones infinitas, y :
tc*
N n
N 1
t c*
s
n
x
,
+ tc*
s
n
x
+ tc*
N n
N 1
],
para
poblaciones finitas.
Ejemplo 1.2 Los ingresos mensuales de los ingenieros informticos se distribuyen normalmente; a fin
de estimar los ingresos mensuales de los 500 ingenieros informticos, debidamente colegiados, se
selecciona al azar una muestra de 12 ingenieros, y se encuentra que cada uno de ellos manifestaron
estar percibiendo mensualmente los siguientes montos en S/: 4 300 2 800 3 500 4 100 1 890
2 550
1 980
3 100
3 000
2 200
3 400
4 600. Encuentre un intervalo de confianza del
95%, para estimar el nivel de ingresos de toda la poblacin de ingenieros.
Solucin.
De esta muestra se obtiene que el promedio de ingresos mensuales
es de S/ 3 188,3333 con
una desviacin estndar de s = S/ 897,82397. La muestra tiene una distribucin t con r = 11 g.l, por lo
tanto, al 95%, su tc = 2,201; el error de estimacin de acuerdo a la frmula establecida con los
ajustes poblacionales ser = S/ 564,1314; por lo tanto se espera que el promedio de ingresos
mensuales de los ingenieros informticos est dentro del intervalo: [S/ 2 554,20 S/ 3 682,46].
Resuelva este problema utilizando el Minitab
Estimacin de la proporcin poblacional
La proporcin poblacional p, tambin puede ser estimada mediante su proporcin muestral p s
siguiendo el mismo anlisis precedente, teniendo en cuenta que en este caso que = p y
la desviacin estndar =
Inferencia Estadstica
p sqs
= ps;
.
Ciclo 2013-I I
Moiss E. Armas
Pgina 9 de 85
EJERCICIOS
1.1.
Seale (F) o verdadero (V) para cada una de las siguientes proposiciones:
( ) Un parmetro puede estimarse a base de su poblacin.
( ) La estimacin de una parmetro solo puede hacerse puntualmente.
( ) Una proposicin deja de ser proposicin cuando es falsa.
( ) No es necesario hacer estimaciones para conocer los parmetros poblacionales.
( ) La varianza muestral es un buen estimador del parmetro poblacional.
( ) Cuanto ms grande es el nivel de confianza, mejor es la estimacin del parmetro.
( ) El error de estimacin, depende del nivel de confianza.
( ) Los estadsticos pueden ser estimados.
( ) El promedio de notas de una muestra de alumnos, puede estimar a toda la poblacin.
( ) Para conocer la calidad de servicio de un restaurante debe hacerse una estimacin.
1.2.
Indique la alternativa correcta, para cada una de las preguntas:
En una estimacin de parmetros debe usar:
a) Datos poblacionales.
b) Datos muestrales.
c) Datos poblacionales o muestrales.
d) Solamente datos poblacionales.
La estimacin de parmetros puede servir:
a)
b)
c)
d)
e)
Ciclo 2013-I I
Moiss E. Armas
Pgina 10 de 85
que la poblacin estudiantil est conformado por 456 alumnos; estime un intervalo de confianza
del 95% para apreciar el promedio de notas de toda la poblacin estudiantil.
1.7.
Se desea estimar el promedio a asistencia a cursos de capacitacin, de los profesionales de
ingeniera radicados en la ciudad de Lima, durante el ao 2010; con tal propsito se tom una
muestra aleatoria de siete ingenieros que participaron en determinados cursos, y las respuestas
que se obtuvieron fueron los siguientes: 2, 3, 0, 2,
5, 4, 1 asistencias a diferentes
cursos respectivamente. Se estima que la asistencia a los cursos de capacitacin sigue una
distribucin normal.
a) Mediante una estimacin puntual, indique, de qu manera se puede estimar el promedio de
asistencia a los cursos de capacitacin de los ingenieros de la ciudad de Lima.
b) Mediante un intervalo de confianza del 92% y otro, del 95%, estime el promedio de asistencia
a los cursos de capacitacin; explique la diferencia de sus resultados con respecto al anterior,
y la diferencia entre estos ltimos.
c) Considere que la poblacin de ingenieros est conformado por 356 profesionales; resuelva los
mismos problemas considerando los tems a) y b).
1.8.
Se llev una encuesta para estudiar el grado de conocimiento en el curso de Base de Datos, a
una muestra de 34 alumnos estudiantes de ingeniera informtica, de los cuales solo 8
manifestaban saber algo de este tema. Encuentre un intervalo de confianza del 98%, para estimar
la poblacin estudiantil, que se supo conocen este tema, y adems explique el error de
estimacin que podra cometerse.
1.9.
Una empresa de material elctrico fabrica bombillas de alumbrado cuyo tiempo de duracin
est aproximadamente distribuida de forma normal, con una desviacin estndar de 40 horas. Si
una muestra de 51 bombillas tiene una duracin promedio de 780 horas, encuentre un intervalo
de confianza de 96% para la media de la poblacin de todas las bombillas que produce esta
empresa; adems explique qu tan grande sera el tamao de la muestra, para que el error de
estimar la media total, sea menor el error encontrado.
1.10. Una mquina produce piezas metlicas de forma cilndrica; se toma muestra aleatoria de las
piezas y los dimetros son: 1,01, 0,98, 1,03, 1,02, 0,98, 0,97, 0,99, 1,04, 0,97 centmetros.
Encuentre un intervalo de confianza del 98% para estimar el dimetro medio de las piezas de esta
mquina; suponga una distribucin aproximadamente normal.
1.11. El 13% de las motobombas hidrulicas, que una empresa fabrica, tienden a fallar a los dos
aos de funcionamiento, por problemas de diseo y componentes en la materia prima al momento
de su fabricacin; se toma una muestra aleatoria de 40 piezas de un lote de 500 motobombas.
a) Encuentre un intervalo de confianza del 99% para estimar el porcentaje de piezas hidrulicas
que podran estar fallando. b) Si el intervalo de confianza estimado para este lote fabricado
estuvo dentro de los mrgenes 10% y 16%, con qu nivel de confianza se lo determin?
1.12. A continuacin se tiene el estado nutricional de los alumnos de ingeniera informtica de una
universidad.
1. EN ++
2. O
3. EN +
4. O
5. EN ++
6. N
7. O
Inferencia Estadstica
8. N
9. EN +
10. EN ++
11. N
12. N
13. EN ++
14. N
15. O
16. EN +
17. O
18. EN ++
19. O
20. EN +
21. N
Ciclo 2013-I I
22. N
23. EN +
24. EN ++
25. EN +
26. EN +
27. O
28. O
29. EN +
30. O
31. N
32. O
33. N
34. EN ++
35. O
36. EN +
37. O
38. EN ++
39. N
40. O
41. N
42. EN +
43. EN ++
44. N
45. EN +
46. O
47. EN ++
48. EN +
49. O
Moiss E. Armas
Pgina 11 de 85
Donde: N= normal
EN + = Desnutrido en 1er grado.
O = obeso
EN ++ = Desnutrido en 2do grado.
a) Encuentre un intervalo de confianza del 95% para estimar el promedio de desnutridos en
primer grado.
b) Encuentre un intervalo de confianza del 93% para estimar el promedio de obesos.
c) Compare y analice estos dos resultados.
1.13. Una muestra seleccionadas al azar, de 37 transportistas que conducen camiones de carga en
el territorio peruano, manifestaron que en promedio sus camiones haban recorrido 17 809
kilmetros en un ao, con una desviacin estndar de 2 354 kilmetros, asumiendo que el
kilometraje de los transportistas se distribuye normalmente y el Ministerio de Transportes y
Comunicaciones, tiene empadronados a 1 148 transportistas.
a) Construya un intervalo de confianza del 99% para estimar el promedio de kilmetros que
anualmente recorren los camioneros en todo el Per.
b) Qu puede afirmar con una probabilidad de 99% de confianza, acerca del tamao posible del
error a cometerse, si se estima que el nmero promedio de camiones manejados por sus
respectivos propietarios es de 17 809 kilmetros?
1.14. Los ingresos mensuales de un grupo de ingenieros informticos fueron estimados entre los S/
2 300 y S/ 3 900; estime la probabilidad con el cual se determin este intervalo, si la muestra
tomada fue de 14 ingenieros y stos presentaron una desviacin estndar en sus ingresos de S/
654.
1.15. De una muestra de 86 familias de un barrio de Lima, se supo que solo el 25% de ellos
manifestaron contar con equipos de cmputo dotados de internet; encuentre un intervalo de
confianza del 95% para poder estudiar la poblacin total de este barrio compuesto de 1 200
familias, los que cuentan con servicios de internet.
1.16. A fin de conocer el temperamento del electorado peruano, ante el advenimiento de las
elecciones municipales de una provincia del Per, se toma una muestra 112 electores, de los
cuales 40 dijeron que votaran por el candidato A; encuentre un intervalo de confianza del 96%
para conocer la fraccin de electores que apoyan a este candidato.
1.17. Un distribuidor de discos DVD, utiliza un conjunto de pruebas para evaluar la funcin elctrica
de su producto; todos los reproductores de DVD, deben pasar las pruebas diseadas para tales
fines, antes de ser lanzados al mercado, para su respectiva comercializacin. Se tom una
muestra aleatoria de 356 DVD, de los cuales se encontr que ocho fallan en una o ms de las
pruebas; encuentre un intervalo de confianza del 99% para determinar la proporcin de
reproductores DVD de la poblacin que pasan todas las pruebas.
1.18. Un estudio realizado a 478 clientes que adquirieron equipos de cmputo en la ciudad de
Lima, el ao 2011, en relacin al grado de satisfaccin, y el costo de los equipos, mostr los
siguientes resultados:
Tabla 1.1
Grado de satisfaccin de acuerdo al costo de los equipos de cmputo, de una
muestra de clientes, en la ciudad de en el ao.
de
Costoso
N
Inferencia Estadstica
%
Ciclo 2013-I I
Econmico
N
Total
%
Moiss E. Armas
Pgina 12 de 85
Satisfecho
Insatisfecho
Total
223
105
268
Empleado
1
2
3
Nivel de estrs
1
2
2
Afn de Servicio
2
1
1
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
1
2
1
2
1
1
1
2
1
2
2
2
1
2
1
2
2
1
2
1
2
1
1
2
2
1
1
2
1
2
1
1
2
1
1
2
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 13 de 85
22
23
24
Donde: Estrs: 1 = Alta
2
1
1
1
2
1
Afn de Servicio:
2 = Normal
1 = Buena
2 = Poca
a) Estime un intervalo de confianza del 92% para conocer el grado de estrs Alta de los
empleados.
b) Determine el intervalo de confianza del 95% para conocer que los empleados muestran un
buen afn de servicio.
c) Determine el error absoluto al estimar con un intervalo de confianza del 96%, el grado de
estrs normal de los empleados.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 14 de 85
II.
s
n
i)
ii)
z cs
)2.
despejando n, se obtendr: n =
Inferencia Estadstica
N n
N 1 , por lo tanto
z cs N
2
2
2
z c s + ( N 1)
Ciclo 2013-I I
zc*
s
n
Moiss E. Armas
Pgina 15 de 85
Ejemplo 2.1 Se desea estudiar el nivel de gastos que desarrollan los padres de familia en todo lo
concerniente al proceso de inicio del ao escolar de sus hijos, en la provincia de Huaura; de ello no
se cuenta con ningn antecedente, por lo que se asume que este estudio tienen la caracterstica de
ser original y novedoso; como no se sabe qu tamao de muestra seleccionar, un grupo de entusiasta
en estadstica, selecciona una muestra aleatoria de siete padres de familia, y encuentra que stos
desarrollaban gastos en los siguientes montos S/: 565
420
350
620
187
401 367,
respectivamente, por cada uno de ellos.
Se desea saber, de qu tamao deber seleccionarse una muestra de padres de familia, a fin de
conocer realmente el promedio de gastos en sus hijos, al inicio del ao escolar, porque esta muestra
de tamao siete, al parecer no es lo suficientemente representativo; para ello considere un nivel de
confianza del 95% y un margen de error de a lo ms de S/ 50.
Solucin.
Como la poblacin se asume que es infinita, la frmula que permitir determinar el tamao de la
s
n
muestra a seleccionar ser = zc*
; al 95% zc = 1,96; la desviacin estndar se obtiene de los
datos del problema y es igual a s = S/ 143,32680, el error mximo est dado por = S/ 50;
despejando n se obtiene que sta debe ser mayor de 32 padres de familia.
Ejemplo 2.2 Considere que se est interesado en estudiar el comportamiento de las personas que
hacen uso de los Smartphone, entre todos aquellos que hacen uso de esta moderna tecnologa de
informacin; para ello se cuenta con una poblacin de 350 usuarios de la ms diversidad de equipos
y modelos; hasta el momento no se sabe qu tamao de muestra deber seleccionarse, ya que
entrevistar a los 350 usuarios sera complicado y engorroso; por lo tanto asuma que el nivel de
confianza con el que se lo estimar ser del 95%, con un error mximo de 5%.
Solucin.
La metodologa ser seleccionar a una muestra y de ellos qu proporcin estn haciendo uso de los
Smartphone; supngase que se seleccion inicialmente una muestra de 16 personas y de ellas se
obtuvo que solo 5 hacan uso de esta tecnologa; por lo tanto p s =
luego =
p sqs
5
16
= 0,3125 y su qs = 0,6875;
Aplicando la frmula para determinar tamao de muestra con ajuste poblacional se obtiene que el
tamao de muestra que realmente debe seleccionarse para estudiar el comportamiento de los
usuarios de los Smartphone debe ser mayor de 87.
ESTIMACIN DE LA DIFERENCIA DE DOS MEDIAS
INTERVALOS DE CONFIANZA
Inferencia Estadstica
Ciclo 2013-I I
POBLACIONALES MEDIANTE
Moiss E. Armas
Pgina 16 de 85
Cuando se est interesado en estimar las diferencias de dos medias poblaciones que se distribuyen
normalmente, mediante intervalos de confianza, podra suceder que se conocen sus respectivas
varianzas poblacionales, o supuestamente se los conoce.
a) Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza,
cuando se conocen sus varianzas poblacionales
Para estimar mediante intervalos de confianza, con un nivel de confianza 1 la diferencia de
dos medias poblaciones (1 - 2), cuando sus respectivas varianzas poblacionales son conocidas
2
x
( 1x 2)
x 2 z c
], siendo
x
( 1x 2 )=
12 22
+
n1 n2
x 1
encontrar dentro del intervalo: (1 - 2) [
x
1x
(
2)
], donde:
x 2 t cs
s2 s2
0( 1x2 )= 0 + 0 , y s02( x 1x 2 )
n1 n2
s
define el promedio
Ciclo 2013-I I
Moiss E. Armas
Pgina 17 de 85
Stat Basic Statistics Paired t. En esta ventana Escoja Samples columns, En primera muestra
(n1)s
2
estadstico 2=
sigue una distribucin chi cuadrado con r = n 1 g.l.; con esta referencia
puede estimarse su varianza poblacional 2 con un nivel de confianza 1 ; una idea de la forma de
estimarlo se obtiene con la ayuda de un grfico de la curva de distribucin de la chi, como lo
mostrado:
1-
x21
x2
x22
x21
x2
x22
POBLACIONALES MEDIANTE
Tambin se puede estimar las razones de variacin de dos poblaciones que se distribuyen
normalmente, dentro de un intervalo de confianza 1 ; para ello se extraen sus respectivas
muestras de tamaos n1 y n2 respectivamente; de igual modo, se calculan sus respectivas varianzas
s 12
12
s 22
22
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 18 de 85
De acuerdo al nivel de confianza 1 , de la tabla F, se determina sus valores crticos F1 y F2, y
haciendo la respectiva deduccin de F, se podr estimar la razn
12
22
Fig. 2.2 Estimacin de la razn de dos varianzas poblacionales mediante intervalos de confianza
Ejemplo 2.3 En una encuesta, sobre gastos mensuales en telefona mvil desarrollada a un grupo de
hombres y otro grupo de mujeres, se encontr que cada uno de los entrevistados manifest gastar los
siguientes montos mensuales, en S/:
Hombres: 40 38 20 25 23 31 36 30 32 y 33;
Mujeres: 42 39 41 43 28 26 29 36 31 34 37 33 y 30.
a) Encuentre un intervalo de confianza del 95% para estimar el promedio de gastos mensuales en
telefona fija, de las mujeres, respecto a los hombres.
b) Encuentre un intervalo de confianza del 95% para estimar la variacin de gasto mensual entre
este grupo de poblaciones.
Solucin:
a) El promedio de gastos mensuales en telefona de los hombres es de S/ 30,80, y el de las mujeres
es de S/ 34,54. Al 95% de nivel de confianza, t c1(0,025; 21) = -2,080 y tc2(0,975;21) = 2,080; la varianza
promedio
de
esta
diferencia
entre
mujeres
hombres
s02(
x 2x 1 )
x
2
( n11 )s 1 + ( n21 )s 2
n1 +n22
, ser:
0( 2x 1)=
s
s0 s0
+
n1 n2
= 2,532 S/.
Por lo tanto, el intervalo de confianza para esta diferencia de ambas medias poblacionales ser:
x 2
: (2 - 1) [
Inferencia Estadstica
x
( 1x 2) = [0; 9,01] S/.
x 1 t cs
Ciclo 2013-I I
Moiss E. Armas
Pgina 19 de 85
b) Se trata de hallar un intervalo de confianza para dos razones de varianza; la varianza de gastos
mensuales de los hombres en telefona mvil es de s 12 = 42,400 (S/)2, y el de las mujeres s 22 =
31,603 (S/)2. El intervalo de confianza del 95% estar limitado por F 1 y F2; estando F dentro de
estos lmites como lo muestra la Fig. 2.3.
F1(0,025; r1, r2) F F2(0,975, r1, r2) donde r1 = 9 corresponde a los grados de libertad del nmero de
2
s1
2
1
2
s 2 , entonces:
2
2
F1(0,025; 9, 12) F F2(0,975, 9, 12); reemplazando F por su equivalente y despejando para hallar la razn
de cambio, se obtiene:
S1
2
S2
F 2(0,975 ;9,12)
2
1
2
2
S1
2
S2
F 1(0,005 ;9,12)
Reemplazando datos por sus respectivos equivalentes, se tiene que este intervalo de
confianza estar dentro de los rangos: [0,3434; 4,5718] (S/)2; en trminos de S/: [0,59; 2,19].
EJERCICIOS
2.1.
El promedio de duracin de un lote de 400 bateras de las Laptop se distribuye normalmente
con una desviacin estndar de 0,95 horas. Se toma una muestra de un grupo de bateras y se
encontr que en promedio presentaban las siguientes duraciones en horas: 3,05 4,10, 3,84
3,26 3,09
3,45 3,67
3,83
3,21 4,05
3,87, antes de ser recargadas.
a) Estime un intervalo de confianza del 95% para poder conocer el tiempo promedio de duracin
del lote de bateras.
b) De qu tamao deber tomarse una muestra de estas bateras, para estudiar el tiempo de
duracin de estas, asumiendo un nivel de confianza del 99% y un margen de error no ms de
15 minutos?
R: a) El caso corresponde a la determinacin del intervalo de confianza, conociendo la varianza poblacional; por lo tanto
al nivel de confianza del 95%, z c = 1,96; el promedio de duracin de las bateras, antes de ser recargadas es
3,584 horas; por lo tanto [3,02 4,14] horas; b) Aplicando el criterio de seleccin de tamao de muestra
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 20 de 85
considerando tamao poblacional N = 400, y un nivel de confianza del 99%, se debe seleccionar una muestra de 67
alumnos.
2.2.
Una muestra de 12 pacientes que acudieron a un hospital, a fin de medir sus niveles de
colesterol en la sangre, mostr los siguientes resultados: 165, 200, 265, 240, 178, 201,
198, 179, 258, 216, 220 y 232, respectivamente.
a) Si el hospital en promedio recibe mensualmente 932 pacientes para hacerse estos anlisis,
de qu tamao deber tomarse la muestra a fin de estimar el nivel promedio de colesterol en
la sangre de esta poblacin?
b) Determine un intervalo de confianza del 95% para estimar el promedio de niveles de colesterol
en la sangre de estos pacientes.
c) Si el error de estimacin en los niveles de colesterol, de estos pacientes, se determin con
un margen de 15, con qu nivel de confianza fue hecho esta estimacin?
d) Si el error de estimacin de los niveles de colesterol, de estos pacientes, se determin con un
margen de 10, y un nivel de confianza del 90%, de qu tamao se determin la muestra de
esta poblacin?
e) Si solamente el 33% de estos pacientes muestran niveles normales de colesterol, estime un
intervalo de confianza del 95%, para conocer el comportamiento poblacional, asumiendo que
se cometa un margen de error de no ms del 4%.
f) Determine un intervalo de confianza del 95% para conocer la variacin de los niveles de
colesterol de los pacientes de este hospital.
2.3.
Ante el advenimiento de las prximas elecciones generales, a fin de elegir al nuevo presidente
de la repblica, entre dos candidatos A y B, se desea evaluar la intencin de votos a favor del
candidato A, en la provincia de Huaral; para tales fines, no contando con ninguna informacin al
respecto, se toma una muestra aleatoria de 15 ciudadanos de esta provincia, encontrndose
como respuesta, que seis de ellos manifestaban que iban a votar por este candidato.
a) Si la poblacin de electores est conformada por 8 500 personas, de qu tamao deber
tomarse una muestra?, a fin de estimar el comportamiento poblacional, por este candidato,
asumiendo que el nivel de confianza sea del 93%, y el margen de error de estimacin sea a lo
ms de: i) 7%, ii) 4%, iii) 2%. ( i - 161; ii- 492; iii-1966)
b) Resuelva el mismo problema asumiendo que la poblacin estudiada est conformada por 1
200 ciudadanos. (142)
c) Analice los resultados obtenidos en cada caso.
2.4.
En la facultad de ingeniera industrial de la UNI, la muestra de un grupo de alumnos, mostr el
siguiente rcord acadmico, por cada uno de ellos: 12,1, 13,2, 10,6, 09,8, 10,5, 11,1, 12,2 y
10,8; en tanto, en la UNMSM, otro grupo de alumnos de la misma facultad, mostr los siguientes
promedios: 13,2, 14,1, 09,5, 10,3, 11,4, 12,1, 08,6, 09,9, 12,7 y 12,4. Asumiendo que
la distribucin de notas sigue una distribucin normal, determine:
a) Un intervalo de confianza del 95% para estimar el promedio de las diferencias de notas de los
San Marcos y los de la UNI. -1,4; 1,7
b) Un intervalo de confianza del 95% para estimar la variacin de notas de los alumnos de la
UNI. 0,74; 2,27
c) Un intervalo de confianza del 95% para estimar la variacin de notas de los de San Macos.
1,28; 3,26
d) Un intervalo de confianza del 95% para estimar la razn de variacin de notas de estas
poblaciones estudiantiles. 0,53; 0,61
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 21 de 85
2.5.
En una investigacin desarrollada para conocer los efectos de trabajos prolongados, en los
niveles de triglicridos, en la sangre de los ingenieros informticos, entre quienes practicaban
deportes y tambin entre quienes no los practicaban, mostr los siguientes resultados:
Tabla
Niveles de triglicridos al desarrollar trabajos prolongados, en la sangre
de los ingenieros informticos, entre quienes practican deportes y quienes
no los practica
Deportes
n
Promedio
Desviacin estndar
Hacen deporte
14
152
27,3
No hacen deporte
15
208
22,1
Se considera que las poblaciones siguen distribuciones normales y que ambas varianzas son
supuestamente conocidas; por lo tanto, se pretende estimar la diferencia entre las medias de los
niveles de triglicridos, entre las dos poblaciones, as como la variacin de cambio de estos
niveles, siendo el nivel de confianza del 95%.
2.6.
El promedio general de calificaciones de una muestra de ocho estudiantes en edad escolar
fue de 12 con una desviacin estndar 2,4.
a) Si se desea estimar el promedio general de la poblacin estudiantil con una error de ms o
menos 0,5 puntos, de qu nmero de estudiantes averiguarse sus notas, si nivel de
confianza debe ser del 95%? R:89
b) Si la poblacin estudiantil estuvo conformada por 523 alumnos, de qu tamao se determin
su muestra, sabiendo que el promedio general de notas estimado estuvo comprendido entre
11 y 13.
2.7.
De 15 libros tomadas al azar, publicadas por la Editorial Las Amricas, dos de ellos
presentaban fallas de compaginacin.
a) Cuntos libros debern revisarse para mantener un nivel de error mximo del 5%, a un nivel
de confianza del 99%?
b) Encuentre un intervalo de confianza, para estimar la proporcin de libros con fallas de
compaginacin, si se espera que el margen de error en su compaginacin no debe ser mayor
del 3%.
2.8.
Una mquina envasadora de lubricantes debe hacerlo en frascos de 50 centmetros cbicos
(cc), de otro modo deber detenerse el proceso de envasado a fin de hacer los respectivos
ajustes a los sifones de llenado. Para averiguar si este proceso se viene desarrollando de
acuerdo a lo establecido, se toman muestras de un determinado nmero de frascos envasados
con este lubricante, los cuales presentaban los volmenes de: 44, 48, 50, 57, 50, 52, 48,
49, 46, 53, 56, 49, 46 y 52 cc respectivamente.
a) Determine el error estndar de la medida de esta muestra.
b) De qu tamao deber ser la nueva muestra, si es que el error estndar de la media
muestral desea reducirse a la mitad?
c) Determine un intervalo de confianza del 99% para estimar el promedio de llenado de la
mquina envasadora.
d) Determine un intervalo de confianza del 99% para estimar las variaciones de cambio de estos
llenados.
2.9. Una muestra de quince clientes que acudan a un cajero automtico de un banco, indic que en
promedio tardaban 2,36 minutos en hacer sus transacciones; si el tiempo de demora en estos
servicios se distribuye normalmente con una desviacin estndar de 0,48 minutos.
a) Determine el error estndar de la media muestral.
b) Determine un intervalo de confianza del 94% para estimar el tiempo promedio de demora de
los clientes en este cajero.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 22 de 85
c) Explique el error de estimacin.
2.10. Un negocio dedicado a la venta de equipos electrodomsticos, ha implementado un sistema
de ventas al crdito, mediante el uso de tarjetas de crdito; sin embargo pasado un determinado
tiempo el Gerente de Ventas reporta que este sistema no funciona en la medida esperada, dado
que existe un alto porcentaje de morosidad de los clientes, por lo que la empresa duplicar
esfuerzos en el cobro de los adeudos. El Gerente toma una muestra de 80 clientes que hacen
uso de esta modalidad de compras y encuentra a 50 morosos, a los que debern aplicar los
cargos por mora:
a) Determine un intervalo de confianza del 95% para estimar la verdadera proporcin de clientes
que utilizan este sistema de ventas, de los cuales se considera que debern estar incurriendo
en morosidad.
b) De qu tamao deber tomarse una nueva muestra, si se considera que el intervalo de
estimacin de la media poblacional sea calculado con un nivel de confianza del 97%, con un
margen de error no mayor del 4%?
2.11. Un sistema artesanal de elaboracin de vasos de cristal indic que una muestra de 13 vasos
est logrando que tengan un volumen de 22 cm3. Encuentre un intervalo de confianza para
estimar la desviacin estndar de su poblacin: i) Al 91% de confianza. ii) Al 93% de confianza. iii)
Al 98% de confianza.
2.12. El 18% de una muestra de 16 alumnos de Bromatologa se encuentran desnutridos, en tanto
que el 25% de una muestra de diez alumnos de Informtica se encuentran, en las mismas
condiciones. Encuentre un intervalo de confianza del 95%, para estimar la razn de variacin de
estos grados nutricionales, entre ambos grupos de alumnos. R:[0,41; 4,70]
2.13. De la Facultad de Medicina de la Universidad, compuesto por 468 alumnos, se selecciona al
azar una muestra de nueve de ellos, de los cuales se obtuvieron sus notas promocionales,
durante el pasado ciclo 2011-II, stas notas fueron: 14,2
13,8
12,5
14,2
10,9
13,2
12,6 12,2 y 12,7, respectivamente.
a) Si el promedio de notas de los alumnos de esta Facultad, fue estimado entre 11,92 y 13,92,
con qu nivel de confianza fue estimado?
b) De qu tamao deber tomarse una muestra de alumnos, si el error de estimacin del
promedio de notas de stos alumnos, no sea mayor de 0,8 puntos, a un nivel de confianza
del 95%? R) a) 1- = 98%, b) n > 151 alumnos
2.14. En la Facultad de ingeniera de una poblacin compuesta de 630 alumnos se quiere estudiar
el grado de apreciacin de las nuevas laptop Intel Core Duo 7, de una determinada marca; como
an no se tiene ninguna informacin, se toma al azar una muestra aleatoria de 12 alumnos a los
cuales se les pregunta si stas laptop tienen buen desempeo; solamente ocho de ellos
contestaron favorablemente.
a) Determine un intervalo de confianza del 95% para estimar el grado de apreciacin de la
poblacin estudiada, asumiendo que el mximo error permisible ser del 5%.
b) De qu tamao deber tomarse una muestra poblacional si el mximo error ser del 5% con
un nivel de confianza del 99%?
2.15. Se desarrolla un estudio a fin de conocer el nivel de ingreso mensuales de los ingenieros
informticos, quienes actualmente se encuentran laborando en los sectores pblicos y privados;
en tal sentido se pudo clasificar en una muestra de estos profesionales, que haban ingenieros
que perciban los siguientes montos:
A
B
C
A
A
B
Inferencia Estadstica
B
A
A
C
C
A
A
B
C
A
B
C
A
B
C
Ciclo 2013-I I
Moiss E. Armas
Pgina 23 de 85
Donde A: representa los ingenieros que ganaban menos de S/ 2000 mensuales; B: los montos
donde los ingenieros ganaban entre S/ 2000 y S/ 4000, y C: los montos donde los ingenieros
ganaban ms de S/ 4000 mensuales. Determine un intervalo de confianza para estimar el
promedio de ingreso de los ingenieros que ganaban ms de S/ 2000, asumiendo que este tenga
un nivel de confianza del 95%.
2.16. Los concesionarios de vehculos de dos marcas diferentes, que estos presentan buenos
kilometrajes por galn de gasolina; a fin de corroborar estas proposiciones, se toman muestras
aleatorias de estas dos marcas de vehculos y se evala su rendimiento, en el consumo de un
galn de gasolina, segn kilometraje recorrido; los resultados se muestran a continuacin:
Vehculo de marca A: 55 50 56 58 59 51 48 47 46, y 52 km/galon
Vehculo de marca B: 59 58 59 45 50 52 60 57 45 48 y 49 km/galn.
Encuentre:
a) Un intervalo de confianza del 95% para estimar la diferencia de consumo de gasolina entre las
marcas de vehculo de la B, respecto a la de marca A.
b) Un intervalo de confianza del 95% para estimar la variacin de cambio, en el consumo de
gasolina de estas dos marcas.
2.17. A continuacin se presenta el estado nutricional de una muestra de los alumnos de ingeniera
informtica de una universidad.
1. EN ++ 8. N
15. O
22. N
29. EN +
36. EN +
43. EN ++
2. O
9. EN +
16. EN +
23. EN +
30. O
37. O
44. N
3. EN +
10. EN ++
17. O
24. EN ++ 31. N
38. EN ++
45. EN +
4. O
11. N
18. EN ++
25. EN +
32. O
39. N
46. O
5. EN ++ 12. N
19. O
26. EN +
33. N
40. O
47. EN ++
6. N
13. EN ++
20. EN +
27. O
34. EN ++ 41. N
48. EN +
7. O
14. N
21. N
28. O
35. O
42. EN +
49. O
Donde: N= normal
EN + = Desnutrido en 1er grado.
O = obeso
EN ++ = Desnutrido en 2do grado.
a) Encuentre un intervalo de confianza del 95% para estimar la diferencia del promedio de
desnutridos en primer grado, con los desnutridos del segundo grado.
b) Encuentre un intervalo de confianza del 93% para estimar la diferencia del promedio de
obesos y los desnutridos.
c) Encuentre un intervalo de confianza del 95% para estimar los niveles de variacin de los
alumnos normales.
d) Encuentre un intervalo de confianza del 95% para estimar la razn de variacin de los
desnutridos y los no desnutridos.
e) Analice e interprete sus resultados.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 24 de 85
III.
HIPTESIS
Una hiptesis es solo una conjetura o suposicin de un hecho que podra suceder o haya sucedido,
pero que an no ha sido demostrado; as por ejemplo, si un empresario estara deseoso de
incursionar en el mercado de la provincia de Huaura, para ello, segn sus asesores en marketing les
aseguran que incursionando en ste mercado, sus utilidades financieras sera altas; en este caso,
solo existe una suposicin de que efectivamente habran ganancias, y basado en esto decide
incursionar en este mercado; sin embargo, existir alguna duda de que probablemente no ocurriese
tal como lo pensado; qu sucedera si luego de haber realizado las inversiones no logra obtener los
resultados esperados?; en el mejor de los caso, tambin podra ocurrir que las estimaciones
preliminares si se cumplieron tal como lo aseguraban sus asesores de marketing.
En una hiptesis solo se conjetura, y producto de los hechos o la evidencia, esa conjetura podra ser
cierta o falsa, ante esta situacin, los investigadores debern decidir qu acciones tomar ante esta
conjetura; la decisin adoptada podra conducir a cuatro resultados posibles:
i.
Haber aceptado una conjetura cierta.
ii.
Haber rechazado una conjetura cierta.
iii.
Haber aceptado una conjetura falsa.
iv.
Haber rechazado una conjetura falsa.
Es evidente que en estas cuatro alternativas, solo las decisiones i) y iv) son las correctas, en cambio
la ii) y la iii) son decisiones incorrectas, y podra traer graves consecuencias para quienes tomaron
esas decisiones equivocadas.
Considrese el caso de que un profesor del curso de Matemtica, considera que los alumnos tienen
bajo coeficiente intelectual y por lo tanto no es posible desarrollar el curso adecuadamente. Esta
suposicin constituye la hiptesis que debe ser demostrada, ya que el profesor supone que los
alumnos son de bajo rendimiento; sin embargo en el desarrollo de la investigacin, podra suceder
estas cuatro alternativas.
i. Se demostr que la suposicin inicial era cierta, por lo tanto el profesor tena la razn.
ii.
No se le da la razn al profesor, pese a que los alumnos presentan bajo coeficiente intelectual.
iii.
Acepta lo que el profesor dice, cuando en realidad los estudiantes, si tienen buen coeficiente
intelectual.
iv.
Rechazar lo afirmado por el profesor, cuando en realidad el profesor tena la razn.
Estos son los casos posibles donde podran presentarse al decidir tomar una decisin en el momento
de plantearse una hiptesis.
CONTRASTE DE HIPTESIS
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 25 de 85
En estadstica cuando se trabaja con hiptesis, se formulan dos hiptesis, una hiptesis nula H 0 y una
hiptesis alternativa H1; la H0 solo se lo formula con el nico propsito de negar lo que se quiere
demostrar, y la H1 es la hiptesis que se quiere demostrar, el que tambin es conocido como la
hiptesis de investigacin.
El objetivo de un contraste de hiptesis es rechazar la H 0, ya que rechazndole, se estara aceptando
la H1, con lo cual se confirmara lo que se quera demostrar; sin embargo surgir los problemas
planteados en el caso anterior, de tomar decisiones incorrectas.
Ciclo 2013-I I
Moiss E. Armas
Pgina 26 de 85
as se podra formular una dieta
alimenticia que tenga por objeto reducir
el peso de las
personas que
sobrepasaron un lmite. La probabilidad
de rechazar la hiptesis nula a un nivel
de significancia estar comprendido
por el rea del sector izquierdo de la
curva.
Ciclo 2013-I I
Moiss E. Armas
Pgina 27 de 85
Como podr observarse, este contraste de hiptesis es de tipo unilateral, en el sentido de que se
busca mejorar el estado nutricional de los alumnos; la hiptesis nula formulada, se lo hizo solo con el
propsito de negar lo que se desea demostrar, es decir, mejorar el estado nutricional de los alumnos;
la hiptesis alternativa, tratar de demostrar que efectivamente habr mejora proporcionando la dieta
alimenticia propuesto por servicio social; el objetivo de esta investigacin, ser rechazar la hiptesis
nula, para aceptar la hiptesis alternativa; expresndole en trminos cuantitativos esta hiptesis
puede expresarse del siguiente modo: El estado nutricional actual de los alumnos es de un valor a,
proporcionndole la dieta alimenticia, el nuevo estado nutricional ser mayor de este valor, o sea:
H0: = a
H1: > a
La hiptesis nula, siempre deber ser formulado en trminos de menor o igual, igual, o mayor o
igual, y la hiptesis alternativa, en trminos opuestos a la nula; es decir mayor que, diferente a, o
menor que.
PROBLEMA TIPO
Se est interesado en implementar un nuevo tipo de tratamiento teraputico, que resulta costoso,
pero se piensa que ser efectivo para rehabilitar a las personas que habitualmente fuman cigarrillos,
ya que se ha demostrado que el cigarro es una fuente primaria del incremento de los casos de
cncer.
Formule un contraste de hiptesis, explicando los tipos de errores que podran cometerse al tomar la
respectiva decisin, y cul de ellas sera la ms grave.
H0: El tratamiento teraputico no permitir rehabilitar a los pacientes fumadores de cigarrillos, por
lo que no vale la pena hacer gastos en costosos equipos.
H1: El tratamiento teraputico permitir rehabilitar a los pacientes fumadores de cigarrillos, no
interesando su alto costo, ya que este consumo, es la causa principal de los casos de cncer.
Error Tipo I. Rechazar la hiptesis nula cuando es cierta; se estar aceptando que el tratamiento
teraputico ser beneficioso, cuando en realidad no lo es as, haciendo gastos innecesarios, en la
creencia de que los ndices de cncer se controlarn.
Error Tipo II. Aceptar la hiptesis nula cuando es falsa; es decir que este tratamiento no permitir
rehabilitar a las personas que fuman cigarrillos, dejando de hacer gastos excesivos en su tratamiento,
con la posibilidad de que mueran ms personas por causas del cncer, solo por querer evitar gastos.
A la luz de estos dos contrastes, resulta que la decisin ms peligrosa sera el cometer Error
Tipo II, ya que por querer ahorrar, se estara condenando a la muerte a las personas, al decidir
no hacer dicho tratamiento.
EJERCICIOS
3.1.
Considere que en las actuales circunstancias, la seleccin peruana de ftbol se clasificar
para el mundial del 2014, a desarrollarse en Brasil; formule un contraste de hiptesis, indicando
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 28 de 85
las decisiones que podran tomarse, y los posibles errores por las que sucedera, y qu
consecuencias acarreara el decidir por una de ellas.
3.2.
Suponga que un investigador desea probar la hiptesis de que a lo ms el 65% de los
huachanos es alrgico a la leche fresca; explique cmo el investigador podra cometer:
a) Error de tipo I.
b) Error de tipo II.
3.3.
Una empresa es acusada de discriminar en la contratacin de sus profesionales.
a) Si el Juez comete Error de Tipo I, qu tipo de hiptesis est aceptando?
b) Si el Juez comete Error Tipo II, qu hiptesis est probando?
3.4.
Un experto en ingeniera informtica recomienda a una empresa implementar un DATA MART
de sistema de ventas, dado que considera que ste le permitir mejorar su sistema de
administracin y procesamiento de datos, producindole a la larga beneficios econmicos; los
administradores de la empresa son escpticos a esta propuesta, dado que consideran que no
requieren de sistemas complejos y costosos, como para seguir obteniendo beneficios, por lo
tanto, el pedido del experto, no es viable por el momento. Formule su contraste de hiptesis, y
seale los tipos de errores que podran optarse por cualquiera de estas decisiones, indicado cul
de ellos sera de consecuencias ms negativas.
R H0: La implementacin del DATA MART, en la empresa no reviste importancia, dado que la gestin administrativa
actual marcha por buenas condiciones, y ste nuevo es complejo y costoso.
H1: La implementacin de un DATA MART, ser beneficioso para la empresa, ya que le permitir mejorar la gestin
administrativa, producindole a la larga beneficios econmicos.
Error Tipo I. Creer que la implementacin del DATA MART, ser beneficioso para la empresa, cuando en realidad no lo
ser; solo le ocasionar complejidades y mayores costos.
Error Tipo II. Creer que el DATA MART, no mejorar la gestin administrativa, por lo tanto, perdindose la oportunidad
de mejorar la economa de la empresa.
Error ms grave: Perder la oportunidad de mejorar la gestin administrativa de la empresa, por no implementar un
DATA MART.
3.5.
En un restaurante, una mquina de bebidas gaseosas se ajusta de manera que la cantidad de
bebida que sirva por botella, se distribuir aproximadamente de forma normal, con una media de
200 ml y una desviacin estndar de 15 ml por botella. La mquina se verifica peridicamente
tomando una muestra de 9 botellas y calculando el contenido promedio; si el promedio muestral
por botella cae en el intervalo 191 y 209 ml, se considerar que la mquina trabaja de manera
satisfactoria, de otro modo se concluir que el promedio es diferente de los 200 ml. Encuentre la
probabilidad de cometer error de tipo I, cuando el promedio de llenado es de 200 ml.
3.6.
Los salarios diarios de los obreros de construccin civil en la ciudad de Lima se distribuyen
normalmente con una media de S/ 63 y una desviacin estndar de S/ 18. Se detecta que una
empresa constructora de la zona cuenta con 52 obreros, paga en promedio S/ 59,60, podra
asegurarse que esta empresa est pagando salarios inferiores al normal?; qu podra afirmar si
encuentra que en promedio si dicha empresa est pagando S/ 65,30 diarios?
3.7.
Un socilogo se interesa en la eficacia de un curso de entrenamiento diseado para lograr que
ms personas se interesen por la limpieza de su ciudad, dado que se observa en demasa, que
hoy en da las ciudades lucen atiborradas de suciedad por doquier, producto del descuido y
decida de sus habitantes; formule un contraste de hiptesis y responda:
a) Qu hiptesis prueba si comete Error Tipo I?
b) Qu hiptesis prueba si comete Error Tipo II?
c) Cul de estos dos errores sera el ms grave al tomar una decisin?
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 29 de 85
R: El contraste de hiptesis ser en los siguientes trminos: H0: El curso de entrenamiento no influir para que las
personas se interesen por la limpieza de las ciudades, frente a H1: El curso de entrenamiento si influir para que las
personas se interesen por la limpieza de las ciudades.
a) Si comete Error Tipo I, prueba que el curso de entrenamiento si influir para que las personas se interesen por la
limpieza de las ciudades, cuando en la vida real, no suceder as.
b) Si comete Error Tipo II, prueba que el curso de entrenamiento no influir para que las personas se interesen por la
limpieza de las ciudades, cuando realmente si estn interesados por ella.
c) El error ms grave sera, cometer Error Tipo II, ya que se dejara de entrenar a las personas para que aprendan a
mantener las ciudades limpias, con las consecuencias que ello acarreara para la salubridad.
3.8.
Una empresa de material elctrico fabrica bombillas de luz elctrica que tienen una duracin
que se distribuyen normalmente con una media de 800 horas y una desviacin estndar de 92
horas; pruebe la hiptesis nula de que la media es igual a 800 horas frente a la alternativa de que
la media es diferente de 800 horas, si una muestra de 48 bombillas tiene una duracin de 788
horas.
3.9.
El departamento de psicologa de una universidad considera que el 67% de sus estudiantes se
encuentran estresados emocionalmente ante el advenimiento de las evaluaciones del primer
examen parcial; a fin de confirmar esta aseveracin se toma se toma una muestra de un grupo de
estudiantes, y se encuentra que el grado de estrs emocional por cada uno de ellos estaba
conformado por los siguientes: E+, N, N, E++, N, N, E+, E+, N, E++, E++, E+, N, E++, N,
E+, E+; donde E+ = estrs moderado, E++ = estrs alto, N = Normal.
a) Qu podra afirmar respecto a lo afirmado por este departamento, asumiendo un riesgo de
equivocarse del 5%?
b) Si se estuviera interesado en rechazar una hiptesis nula de que no hay estrs emocional en
los alumnos, de qu tamao debera tomarse la muestra para rechazar esta hiptesis? Asuma
un riesgo de equivocarse del 5%.
R: p = 0,67 proporcin de estresados de la poblacin; ps = 10/17 = 0,588; proporcin de la muestra de estresados;
nivel de significancia = 5%.
Contraste de hiptesis: H0: p = 0,67 estn estresados por los exmenes; H1: p < 0,67 hay menor proporcin de
estresados. a) Al 5%, tc = -1,746 t t R = -0.719; por lo tanto se puede concluir que hay suficiente evidencia como
para afirmar que los alumnos se encuentran estresados ante el advenimiento de los exmenes. b) Para determinar
el tamao de muestra que permita estudiar el comportamiento de los que bajaron su nivel de estrs ser: n . 101
alumnos.
3.10. El Centro de Cmputo de una empresa recibe un lote de 50 laptop para ser distribuidos en
sus diferentes unidades administrativas; sin embargo el rea tcnica de esa institucin los
rechaza argumentando que estos equipos presentaban serios problemas de funcionamiento de
memoria, por su lentitud exagerada, por lo que deben ser rechazadas. El proveedor asegura que
todos sus funcionan correctamente, y que todo el problema podra deberse a la falta de manejo o
costumbre por parte del usuario. Formule un contraste de hiptesis, indicando los tipos de errores
que podran cometerse al optar por una de esas decisiones.
R:
H0: El lote de las laptop no presentan problemas de funcionamiento de las memorias; todo el problema puede
deberse a que los usuarios an no estn familiarizados.
H1: El lote de las laptop presentan problemas de funcionamiento de las memorias, por lo que deben ser rechazados..
Error Tipo I. Creer que el lote de las laptop presentan problemas de funcionamiento de sus memorias, cuando en
realidad estn en buen estado, con el consiguiente riesgo de que todo el lote sea devuelto al proveedor.
Error Tipo II. Creer que el lote de las laptop no presentan problemas de funcionamiento, cuando en realidad si los
estn, perjudicando a la empresa, en el sentido no querer hacer los correctivos necesarios a fin de que estos equipos
trabajen correctamente.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 30 de 85
3.11. Una compaa afirma que el tiempo necesario para fabricar un artculo es de 53 minutos, con
una desviacin estndar de 7 minutos. Se toma una muestra de 90 artculos y se encuentra que el
tiempo de fabricacin promedio de cada pieza fue de 56 minutos.
a) Al nivel del 5% se podra afirmar que el producto requiere un tiempo mayor de fabricacin
que lo afirmado por la compaa?
b) Si el tiempo real de fabricacin es de 50 minutos, en la prueba de significacin se cometi un
error de Tipo I?
3.12. Un profesor examina el curso de Matemtica II; sabe por experiencia que en promedio los
alumnos obtienen una calificacin de 12,3. En la actualidad, el profesor selecciona una muestra
de 15 alumnos, de una poblacin de 212 alumnos y encuentra que en promedio esta muestra de
alumnos obtuvo una calificacin de 12,8 con una desviacin estndar de 3,5. Acierta el profesor
al afirmar que estos alumnos tienen rendimiento superior, en comparacin al anterior? Considere
un nivel de significancia de 2%.
3.13. Los ingenieros informticos egresados de la Universidad, estn dispuestos a colaborar con su
Alma Mater, y deciden disear un nuevo Sistema de Informacin Gerencial, el cual permitir
proporcionar las respuestas
a las consultas,
temas relacionados con la matrcula y
procesamiento de notas de los alumnos en tiempo real; por otro lado, existe cierto pesimismo por
parte de otro grupo de autoridades, quienes alegan que ya se cuenta con un Sistema de
Informacin, y que la adopcin e implementacin de otro nuevo Sistema, solo crear confusin y
retardo en los trabajos. En qu casos se cometera Error Tipo I y Error Tipo II, al adoptar una
decisin al respecto, al momento de contrastar sus hiptesis, y cul de ellas sera la ms
beneficiosa para la Universidad?
H0: EL nuevo SIG solo crear confusin y retardo en el proceso de matrcula y procesamiento de datos de los
alumnos.
H1: El nuevo SIG proporcionar respuestas en tiempo real, informacin respecto a la matrcula y procesamiento de
datos de los alumnos.
Error Tipo I: Creer que el nuevo SIG proporcionar respuestas en tiempo real, cuando en realidad no lo ser as,
ya que solo proporcionar retardo y caos.
Error Tipo II. Creer que el nuevo SIG crear confusin y caos, cuando en realidad no ser as, ya que permitir
proporcionar respuestas en tiempo real, con las ventajas que ello conllevara.
Error ms favorable para la Universidad Error Tipo II.
3.14. Un fabricante est interesado en desarrollar un nuevo sedal para pesca que, segn afirma
tiene una resistencia promedio a la rotura de 55 kg. Se desea probar la hiptesis de que la = 55
kg frente a la de investigacin, el cual afirma que estas no son as, para ello se define una regin
crtica cuando se encuentra que el promedio de una muestra de 20 sedales es menor de 50,2
kilos, con una desviacin estndar de 13,7 kilos. Encuentre la probabilidad de cometer error de
Tipo I.
R: El contraste de hiptesis ser en los siguientes trminos: H 0: = 55 (promedio a la resistencia igual a 55 kilos);
frente a H1: < 55 (el promedio a la resistencia es menos de 55 kilos); para una muestra de tamao n = 20, s =
13,7 kilos, cuyo promedio muestral
x =50,2 kilos .
de aceptacin o rechazo de la hiptesis nula, lo cual indica un rea o nivel de significancia de 7,14%.
3.15. Pruebe la hiptesis de que el contenido promedio de los envases de un tipo de lubricante que
una empresa debe producir diariamente, es de 10 litros; el ingeniero de planta toma una muestra
aleatoria de diez envases, y encuentra que estos contenan las siguientes cantidades: 10,2, 9,7,
10,1 10,3, 10,1, 9,8, 9,9, 10,4, 10,3, y 9,5 litros. Utilice un nivel de significancia de 1% y
suponga que la distribucin del contenido es normal. De qu tamao deber tomarse una
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 31 de 85
muestra para rechazar la hiptesis de que estos contenidos no estn cumpliendo con lo
establecido?
3.16. Se afirma que el diseo especial de un nuevo automvil, puede recorrer en promedio no
menos de 20 000 kilmetros por ao, antes de ser sometido a un programa de mantenimiento
correctivo. Para probar tal afirmacin se toma una muestra de 60 propietarios de automviles con
este diseo, los que llevan un registro del kilometraje recorrido; estara de acuerdo con esta
afirmacin, si la muestra indic que estos automviles requirieron mantenimiento al haber
recorrido tan solo 19 457 kilmetros en promedio, con una desviacin estndar de 3 000
kilmetros?
3.17. INDECOPI est decidido a que el porcentaje de usuarios de software legal se incremente, ya
que al presente considera que solo el 10% de los usuarios de estos productos, tienen procedencia
legal; en ese sentido emprende una campaa publicitaria de concientizacin para el uso de
software legal, en todos los potenciales clientes. A fin de evaluar la efectividad de esta campaa,
en Huacho, de una poblacin de 400 usuarios de software, toma una muestra de 80 y encuentra
que solo 15 de ellos estaban haciendo uso de software legal. De qu tamao deber tomar una
muestra de usuarios de software, para asegurar que la campaa publicitaria gener mayor
sensibilizacin en estos usuarios? Considere un margen de error de 5%.
R:
p = 0,10 hacen uso de software legal
N = 400; n = 80, y ps = 15/80 = 0,1875 y qs = 0,8125.
H0: La campaa publicitaria no ha sido efectiva, porque la proporcin de usuarios de software legal, sigue siendo el
mismo. ( = 0,10)
H1: La campaa publicitaria ha sido efectiva, puesto que ha mejorado la proporcin de usuarios de software legal (
> 0,10).
Si se calcula su zR teniendo en cuenta el ajuste poblacional, se obtiene que es igual a 2,239, y si se considera que
a un nivel de significancia del 5%, zc es 1,645; por lo tanto para rechazar la hiptesis nula, bastara con este zc; por
lo que el tamao de la muestra, haciendo los respectivos clculos por ajuste poblacional, deber ser de 148
usuarios.
3.18. Se realiza un estudio para determinar si los temas de la materia en un curso de fsica se
comprenden mejor cuando se emplea un laboratorio en parte del curso. Se seleccionan
estudiantes al azar para que participen, ya sea en un curso de tres horas semestre-hora sin
laboratorio, o en un curso de cuatro horas semestre-hora con laboratorio. En la seccin con
laboratorio, 11 estudiantes tuvieron una calificacin promedio de 85 con una desviacin estndar
de 4,7; mientras que en la seccin sin laboratorio, 17 estudiantes tuvieron una nota promedio de
77 con una desviacin estndar de 6,1. Se podra decir que el curso con laboratorio aumenta la
calificacin promedio hasta en 8 puntos? Considere una probabilidad de equivocarse del 5%.
3.19. Se cree que no menos el 65% de los habitantes de un centro poblado estn a favor de
anexarse a otro distrito. Qu conclusin extraera, si de una muestra de 150 habitantes se
encuentra que solo 86 estn a favor de anexarse a otro distrito? Considere un riesgo de
equivocarse del 5%.
R: H0: p 0,65 (alto nmero de habitantes favor de anexarse a otro distrito), contra H1: p < 0,65 (baja proporcin a
favor de anexarse); por lo tanto p s = 0,573 y z R = -2,022 frente a z c = -1,645; por lo tanto debera rechazarse la
hiptesis nula, en el sentido de que hay alto nmero de habitantes interesados en anexarse a otro distrito.
3.20. Suponga que hasta hace poco tiempo, 40% de todos los ciudadanos estn a favor de la
imprescriptibilidad de los delitos cometidos por los funcionarios pblicos; habra razn para
creer que la proporcin de ciudadanos en la actualidad ha aumentado, si en una muestra de 125
consultados, solo 54 ciudadanos manifestaban estar a favor de la imprescriptibilidad?; considere
un riesgo de equivocarse del 5%.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 32 de 85
3.21. Por antecedentes histricos se conoce que el tiempo promedio que requieren los estudiantes
para sustentar su tesis sigue una distribucin normal, con una media de 32 minutos y una
desviacin estndar de 6 minutos. Si una muestra de 20 tesistas demostr que demoraban en
sustentar su tesis un tiempo promedio de 35 minutos, podra afirmarse que esta sustentacin
est demorando ms del tiempo normal?
R: Considerando un nivel de significancia de 5% resulta que no se puede asegurar que los tesistas estn
demorando ms del tiempo establecido; considerando un nivel de significancia del 1%, si se puede asegurar que,
efectivamente si est demorando ms del tiempo establecido.(demuestre estas afirmaciones)
3.22. Los siguientes datos proporcionan los tiempos de respuesta a un sistema de informacin
gerencial, proporcionado por dos modelos de PC, probados en PC seleccionados al azar:
Modelo de PC
tiempo (en segundos)
Modelo A
2.04 3.02 1.92 1.87 2.01 2.00 1.89 1.95
Modelo B
2.62 1.47 1.83 2.00 1.42 1.76 1.48
Podra afirmarse que el tiempo de respuesta del modelo A es mayor al tiempo de respuesta del
modelo B en ms de 0,20 segundos, si la probabilidad de equivocarse es a lo ms del 5%?
3.23. Un fabricante de bateras de litio para las Laptop, distribuye sus productos en sus diferentes
clientes, asegurando que estos trabajan a un voltaje de 12 voltios, voltaje que permitir trabajar en
las mejores condiciones; sin embargo, pasado un cierto tiempo recibe quejas de sus clientes
quienes aseguran que estos productos no estn trabajando en las condiciones especificadas,
generando problemas a las Laptop; el fabricante decide averiguar si estos clientes tienen la razn,
motivo por el cual, selecciona al azar una muestra de bateras, y evala las condiciones de
trabajo; los resultados de esta muestra indicaron que la muestra de bateras trabajaban en los
siguientes voltajes: 12,5
13 11,9
12,0 12,1
11,5
11,6
12,1
12,8
11,2 y
12,0 Voltios, respectivamente.
a) A los resultados de estas evidencias, debera atenderse las quejas de los clientes, o stas
podran deberse a una simple casualidad?, asuma un riesgo de equivocarse del 5%.
b) Indique los tipos de errores que podran cometerse, y evale las consecuencias de decidir por
ellos.
R: Contraste de hiptesis en forma cualitativa:
H0: Las bateras de litio, estn diseadas para trabajar a 12 voltios, lo cual permitir trabajar en las mejores
condiciones a los equipos.
H1: Las bateras de litio, no estn trabajando a 12 voltios, los cuales estn generando que los equipos se estn
daando.
Contraste de hiptesis en forma cuantitativa:
H0: = 12,0 voltios
H1: 12,0 voltios
Muestras pequeas; distribucin t; por lo tanto tc(0,95,10)= 2,228 y tr = 0,392; por lo tanto debera aceptarse la
hiptesis nula, en el sentido de que las bateras estn trabajando en el voltaje especificado, la diferencia
encontrada, puede deberse a una simple casualidad.
Error Tipo I: Creer que las bateras no estn trabajando en los 12 voltios establecidos, haciendo caso a los
clientes, que podran estar reclamando si fundamento.
Error Tipo II: Creer que las bateras estn trabajando a 12 voltios, cuando en realidad no lo estn; por lo tanto no
se le estara haciendo caso a los justos reclamos de los clientes, con las consecuencias de poder daar a los
equipos de cmputo.
Decisin ms grave: Cometer Error Tipo II; podra perderse a los clientes y ganarse un juicio de parte de ellos por
daar sus equipos.
3.24. El administrador de una empresa de taxis, trata de decidir si el uso de llantas radiales, en lugar
de llantas regulares cinturadas mejora la economa de combustible. Se equipan 12 llantas radiales
y se manejan durante un recorrido de prueba preestablecido; sin cambiar a los conductores, los
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 33 de 85
mismos automviles se equipan con llantas regulares cinturadas y se manejan otra vez en el
recorrido de prueba. El consumo de gasolina, en kilmetros por litro, se registr de la siguiente
manera:
Tabla
Consumo de gasolina en kilmetros por litro, por una
muestra de automviles, segn tipo de llantas utilizadas
Automvi
l
1
2
3
4
5
6
7
8
9
10
11
12
Llantas radiales
Llantas cinturadas
4,7
4,6
5,2
5,9
6,1
4,8
5,0
4,9
5,1
6,3
4,8
5,4
6,1
5,2
4,2
4,7
5,2
4,6
4,3
4,7
4,9
5,2
6,1
4,4
Podra concluirse que los automviles equipados con llantas radiales dan una economa de
combustible mejor que aquellos equipadas con llantas cinturadas? Asuma que la poblacin se
distribuye normalmente. Si en promedio se espera que el uso de llantas radiales en los
automviles, consuma 5,4 litros por kilmetro, de qu tamao deber tomarse una muestra de
otros automviles, para rechazar la hiptesis de que estas muestras no estn cumpliendo con lo
esperado? Asuma un nivel de significancia del 1%.
3.25. Se dice que una mquina llenadora de bebidas gasificadas est fuera de control, si la
desviacin estndar de los contenidos excede de 1,15 cm 3. Si una muestra aleatoria de 20
botellas llenadas con esta mquina presenta una desviacin estndar de 1,48 cm 3, podramos
asumir, al nivel de significancia del 1%, que la mquina est fuera de control?, y al 5%?
R:. El contraste de hiptesis corresponde a una Chi cuadrado, por lo tanto H0: = 1,15 cm3 frente a H1: > 1,15
cm3. Al 1% el Chi crtico es 36,19 y el Chi real = 31,46; por lo tanto no se podra rechazar la hiptesis nula en el
sentido de que la mquina embotelladora est fuera de control; en cambio al 5%, el Chi real es 30,14, por lo que si
debera rechazarse la hiptesis nula, y asumir que la mquina llenadora est fuera de control.
3.26. Una agencia de publicidad desea probar, dos formas diferentes de presentacin de publicidad
de una locin para hombres. En la publicidad A, el producto es enfocado desde el punto de vista
sexy; en la segunda publicidad el producto es enfocado desde el punto de vista profesional; se
seleccion una muestra de 15 hombres, usuarios potenciales de esta locin. El procedimiento
seguido en la prueba, consiste en dejar que los entrevistados hojeen libremente la publicidad y
luego se sometan a un cuestionario diseado para medir el grado de recordacin de los anuncios
mostrados; los resultados en puntos, en una escala de 1 al 10, son los siguientes:
Tabla .
Grado de recordacin, en puntos, de la Locin para hombres segn tipo de publicidad utilizada
en una muestra de hombres, potenciales usuarios de este producto
Persona N
Publicidad A
Inferencia Estadstica
1
5
2
6
3
4
4
7
Ciclo 2013-I I
5
4
6
6
7
5
8
6
9
4
10
3
11
3
12
4
Moiss E. Armas
Pgina 34 de 85
Publicidad B
Considerando un riesgo de equivocarse del 5%, podra asegurarse que ambas publicidades,
generan el mismo tipo de atencin?
3.27. Un ingeniero industrial cree que ha perfeccionado un programa de entrenamiento que puede
acortar el tiempo de ensamble de una pieza en fabricacin. Para verificar esta suposicin, planea
seleccionar diez obreros en forma aleatoria, y realizar estudios de tiempos y movimientos, con
ellos, antes y despus de que hayan acabado su programa de entrenamiento; los resultados se
muestran a continuacin:
Tabla
Tiempo de ensamble en segundos, antes y despus de perfeccionamiento del programa
para la produccin de la pieza de., desarrollado por una muestra de obreros en
Obrero N
1
2
3
4
5
6
7
8
9
10
Antes
12
13
14
13
14
12
11
15
13
14
Despus
11
12
10
14
12
12
12
10
10
11
a) Obtenga los lmites de confianza al 99%, sabiendo que el error de estimacin no debe
sobrepasar los 5 segundos.
b) Confirme si el programa de entrenamiento sirve para reducir el tiempo de ensamble,
considerando un margen de equivocarse del 5%.
c) Puede asegurarse que la variacin de tiempo antes de implementar el nuevo programa es
mayor de 2 segundos?
d) Puede considerarse que hay diferencia entre la variacin de tiempos entre ambos
programas?
3.28. Una nueva variedad de manzana presenta un sabor muy agradable; para ello se ha decidido
someter a prueba su rendimiento, plantando este tipo de manzanas junto a otra manzana
corriente, en ocho huertos diseminados en una regin apropiada para la produccin de ambas
variedades; cuando los rboles empiezan a rendir, se mide su produccin en cajas; los datos
obtenidos son los siguientes:
Tabla .
Rendimiento en cajas, por huerto, segn variedad de manzanas
Huerto
Ciclo 2013-I I
Moiss E. Armas
Pgina 35 de 85
c) En cuntos huertos deber probarse el cultivo de esta nueva variedad de manzanas, para
rechazar la hiptesis de que esta nueva variedad no est cumpliendo con lo esperado?
Considere un riesgo de equivocarse del 1%?
d) Sealan estos resultados una mayor produccin de las nuevas manzanas, que las de las
manzanas corrientes? Asuma un margen de error de 0,01.
e) Hay variacin en el rendimiento por cajas, en la produccin de estas manzanas?
3.29. Una comunidad urbana quiere demostrar que la incidencia de cncer de seno es mayor que
en las comunidades rurales, si se encuentra que 20 de cada 200 mujeres adultas en la comunidad
urbana tienen cncer de seno, y 10 de 150 mujeres adultas de la comunidad rural tienen cncer
de seno, podra concluirse a un nivel de significancia del 5%, que este tipo de cncer, prevalece
en la comunidad urbana?
3.30. Se realiza un estudio para comparar el tiempo de demora entre hombres y mujeres para
ensamblar un producto. La experiencia indica que la distribucin de los tiempos, tanto como para
hombres como para mujeres es aproximadamente normal, pero que la varianza de los tiempos
para las mujeres en menor que el de los hombres; una muestra aleatoria de 11 mujeres y 16
hombres mostr los siguientes resultados: Varianza de tiempos de los hombres, 36,8 seg 2;
varianza de tiempo de las mujeres 27,4 seg 2; extraiga sus conclusiones a la luz de los
planteamientos del problema.
3.31. Una empresa desea saber el efecto que puede generar sobre la productividad, dar un relax a
su personal, para saborear una taza de caf especial; para ello selecciona al azar un grupo de
trabajadores a los cuales se les mide la productividad, sin saborear el caf, y saboreando el caf.
Los resultados se muestran en la siguiente tabla:
Tabla .
Productividad en unidades producidas, por trabajador
Hunuc
5,2
Inferencia Estadstica
3,9
4,8
4,6
3,7
Ciclo 2013-I I
3,9
5,1
4,8
5,3
4,4
Moiss E. Armas
Pgina 36 de 85
o
Cusco
5,1
4,2
4,5
3,6
4,7
4,0
4,6
4,2
4,3
a) Hay razn suficiente para considerar que las bateras de las Laptop, en Hunuco tienen
mayor tiempo de duracin que en Cusco?
b) Puede considerarse hay diferentes variaciones en la duracin de estas bateras?
c) De qu tamao deber tomarse una muestra, si se quiere rechazar la hiptesis, de que el
tiempo de duracin de las bateras en Cusco es diferente de 4,6 horas?
R: a) No hay razn suficiente como para afirmar que el promedio de duracin de las bateras de las Laptop en
Hunuco, duran ms que en Cusco (diferencia de medias poblacionales con muestras pequeas); b) No hay razn
suficiente como para afirmar que hay variacin en la duracin de estas bateras (prueba F); c) La muestra debe ser
mayor o igual 17, haciendo la prueba t.
3.33.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 37 de 85
IV.
D
10
8
7
E
9
7
10
4
3
5
2
Podra asegurarse que las carreras universitarias deseadas por los estudiantes secundarios, est
asociado a su grupo socioeconmico, o es que estos resultados solo se deben a la casualidad?
Considere un riesgo de equivocarse del 5%.
Solucin:
Es una prueba de contingencia, ya que se trata de establecer si dos variables categricas, en este
caso, Grupo socioeconmico familiar y Carrera profesional, ambos con diferentes categoras, estn
asociados o son independientes; en este sentido, el contraste de hiptesis ser:
H0: El desear estudiar una carrera profesional, no tiene que ver nada con el grupo socioeconmico.
H1: El desear una carrera profesional, est asociado al grupo socioeconmico al que pertenece el
estudiante.
Haciendo los respectivos clculos, se obtiene que su Chi cuadrado real es 10,34, el cual contrastado
con su Chi cuadrado terico (0,95; 16), es 26,3. Por lo tanto, dado que ste es mayor que el real obtenido,
no debera rechazarse la hiptesis nula, y aceptar que la eleccin de la carrera universitaria de los
estudiantes secundarios, no tiene nada que ver con el grupo socioeconmico al cual pertenece.
Ciclo 2013-I I
Moiss E. Armas
Pgina 38 de 85
visitantes se caracterizan por pertenecer a diferentes grupos ocupacionales; adems
diversas motivaciones que los impulsaron a venir a estos lugares.
tuvieron
Como puede inferirse, en este caso se cuentan con dos variables categricas: Grupo ocupacional y
Razones de visita; el grupo ocupacional puede estar conformado por las siguientes categoras:
Comerciante, Empleado, Jubilado, Estudiante, Ama de casa y Profesional; la variable Razones de
visita, puede estar conformado por las siguientes categoras: Gastronoma, Arqueologa,
Curanderismo, Aventura y Distraccin. Para introducir estos datos en el SPSS, habr que definir
primeramente los tipos de datos de las variables, con sus respectivas caractersticas; as hagamos la
siguiente definicin:
Grupo ocupacional
GO
GrupoOC
1 Comerciante
2 Empleado
3 Jubilado
4 Estudiante
5 Ama de casa
6 Profesional
Razones de visita
RV
RazonV
7 Gastronoma
8 Arqueologa
9 Curanderismo
10 Aventura
11 Distraccin
Los datos que se introducirn en este software tendrn estas caractersticas; para ello abra su editor,
observar una matriz formada por filas y columnas; cada columna define un tipo de variable y cada
fila, un elemento de informacin, del ente que se est estudiando. En vista de variables, que aparece
al pie izquierdo del editor, haga clic con el ratn para ingresar al proceso de definicin de cada
variable, del siguiente modo:
1. En la primera fila, se definir las caractersticas de la variable Grupo ocupacional; para eso
defina en Nombre con GO, en Tipo, indique Numrico, en Ancho escriba un nmero como 3,
sin decimales; en Etiqueta escriba GrupoOC, y en Valores, haciendo clic en los puntos
suspensivos se ingresa a la ventana de valor; aqu es donde deber definir las categoras de
las variables establecidos en la tabla; as donde dice Valor, escriba 1, y donde dice Etiqueta,
escriba Comerciante, luego haga clic en Aadir; repita hasta completar con las seis
categoras de este grupo ocupacional, luego pulse el botn Aceptar; de esta manera la
variable Grupo ocupacional ha quedado definido.
2. En la segunda fila, se definir las caractersticas de la variable Razones de visita, siguiendo
los mismos pasos que el anterior: Nombre RV, Tipo Numrico, Ancho 3, sin decimales; en
Etiqueta escriba RazonV, y en valores, una vez ingresado a su ventana escriba Valor 7,
Etiqueta Gastronoma, Aadir y repetir este proceso hasta culminar con 11 Distraccin, y
finalmente Aceptar; de esta manera esta otra variable ha quedado completamente definido.
3. Ahora haga clic en Vista de datos del editor del SPSS, observar que la primera columna
est definido como GO, y la segunda columna como RV.
4. En la columna correspondiente a GO, de acuerdo a la cantidad de datos con las que cuenta,
escriba los nmeros del 1 al 6; y en la columna correspondiente a RV, escriba los nmeros
correspondientes entre 7 y 11; ambas columnas debern tener la misma cantidad de datos;
cuando termine de introducir sus datos, estar en condiciones de pasar hacia otras etapas de
anlisis, como a continuacin se indicar.
5. En el men principal vaya a Analizar Estadsticos descriptivos Tablas de
contingencia y le proporcionar los resultados en una tabla, donde deber interpretar los
mensajes proporcionados.
Tabla Tabla de contingencia GrupoOC * RazonV
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 39 de 85
Recuento
GrupoOC
Comerciante
Empleado
Gastronomia
3
3
RazonV
Curanderis
Arqueologia
mo
3
1
7
3
Aventura
0
1
Distraccin
0
1
Total
Gastronom
ia
7
15
Jubilado
18
Estudiante
17
Su casa
13
Profesional
10
18
21
21
10
10
80
Total
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por lineal
Valor
21.296(a)
21.662
7.284
gl
20
20
1
Sig. asinttica
(bilateral)
.380
.359
.007
G
r
f
i
c
o
d
e
l
a
t
b
l
a
d
e
c
o
n
t
i
g
e
n
c
i
a
R
a
z
o
n
V
G
a
s
t
r
o
n
m
i
a
A
q
u
e
l
g
C
d
rn
s
o
6
v
n
a
D
is
rtc
i
N de casos vlidos
80
a 30 casillas (100.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es .88.
Nmerodcaso
4
2
0C
o
m
e
rc
ia
n
te
E
m
p
le
a
d
o
u
b
ilo
a
d
o
E
s
tu
d
a
n
te
u
c
a
sP
ro
fe
s
io
n
a
l
G
rJu
p
c
u
p
a
c
iio
n
a
lS
__
Ciclo 2013-I I
Moiss E. Armas
Pgina 40 de 85
Ejemplo 4.3 En un centro de idiomas se ensea el idioma italiano a un conjunto de profesionales; se
quiere averiguar si el inters de estudiar este idioma est relacionado con la profesin y la
procedencia de los profesionales; para ello se selecciona una muestra de un grupo de ellos y se los
agrupa en una tabla de acuerdo a la especialidad y procedencia, como muestra la siguiente tabla:
Lugar
de
procedencia
Huaura
Lima
Huaral
Barranca
Mdico
3
4
1
8
Profesin
Abogado Ingeniero
2
6
7
10
Contado
r
1
2
2
6
5
1
6
3
Haciendo uso del SPSS, concluya si el inters por el estudio del idioma italiano, est asociado con las
caractersticas de la profesin y el lugar de su procedencia; para ello considere un nivel de
significancia del 5%.
Solucin:
El contraste de hiptesis deber hacerse en los siguientes trminos: H0: El inters por estudiar el
idioma italiano, nada tiene que ver con la profesin y el lugar de procedencia del interesado, frente a
H1: El inters por estudiar el idioma italiano, est asociado a la profesin y la procedencia del
interesado.
Siguiendo el modelo anterior, asuma un nivel de significancia del 5% y construya su base de datos, y
genere un resultado, con una tabla que presente los resultados observados y los resultados
esperados como se muestra en el siguiente:
Lima
Lugar
Huaral
Barranca
Total
Inferencia Estadstica
Recuento
Abogado
Total
Ingeniero
Contador
11
2.6
4.1
1.8
2.5
11.0
13
3.1
4.9
2.1
2.9
13.0
16
3.8
6.0
2.6
3.6
16.0
10
27
Frecuencia esperada
6.4
10.1
4.4
6.0
27.0
Recuento
16
25
11
15
67
16.0
25.0
11.0
15.0
67.0
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Ciclo 2013-I I
Moiss E. Armas
Pgina 41 de 85
Como podr apreciar, la tabla muestra un total de 67 valores observados (67 profesionales,
provenientes de los cuatro lugares, con sus respectivas frecuencias observadas.
La siguiente tabla muestra los resultados de los anlisis:
Pruebas de chi-cuadrado
Valor
gl
Sig. asinttica
(bilateral)
Chi-cuadrado de Pearson
12.403a
.192
Razn de verosimilitudes
13.381
.146
N de casos vlidos
67
El valor del chi cuadrado terico, al nivel de significancia del 5% es 16,92, el cual contrastado con el
valor real, que es igual a 16,92, induce a manifestar que no se debera rechazar la hiptesis nula, en
el sentido de que ambas variables son independientes.
El siguiente es el grfico de la relacin entre estas dos variables.
Ejemplo 4.4 Se disea un producto publicitario, utilizando diferentes medios, a fin de evaluar la
satisfaccin de este sistema en personas que se dedicaban a diferentes actividades; para ello en una
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 42 de 85
determinada ciudad se selecciona una muestra de esta poblacin y se averigua el nmero de
personas satisfechas con el sistema publicitario presentado a travs de diferentes medios; los
resultados de esta investigacin se muestran en la siguiente tabla:
Tabla:
Satisfaccin de una muestra de personas por el diseo de un producto, presentado en
diferentes medios publicitarios.
Medios publicitarios presentados
Ocupacin
Radio
TV
Internet
Revista
Panel
Perifoneo
Obrero
5
3
5
2
12
13
Comerciante
3
15
7
5
16
11
Jubilado
6
16
6
12
8
5
Agricultor
14
6
2
5
12
15
Estudiante
2
7
17
11
8
7
Ama de casa
12
13
5
6
10
7
Profesional
4
5
18
16
6
5
Podra asegurarse que los medios publicitarios y la ocupacin de las personas influyen en la
satisfaccin de las personas por el diseo del producto? Considere un riesgo de equivocarse del 5%.
Solucin:
El contraste de hiptesis se har en los siguientes trminos:
H0: La aceptacin del diseo del producto en los diferentes medios publicitarios por parte de las
personas, nada tiene que ver con la ocupacin que tienen.
H1: La aceptacin del diseo del producto en los diferentes medios publicitarios por parte de las
personas, est asociado con la ocupacin que tienen
Radio
5
5.07
0.001
TV
3
7.16
2.419
Inferencia Estadstica
Internet
5
6.61
0.393
Revista
2
6.28
2.918
Panel
12
7.93
2.084
Ciclo 2013-I I
Perifoneo
13
6.94
5.286
Total
40
Moiss E. Armas
Pgina 43 de 85
2
3
7.22
2.469
15
10.21
2.251
7
9.42
0.622
5
8.95
1.744
16
11.31
1.949
11
9.89
0.124
57
6
6.72
0.076
16
9.49
4.465
6
8.76
0.870
12
8.32
1.625
8
10.51
0.600
5
9.20
1.916
53
14
6.84
7.485
6
9.67
1.392
2
8.93
5.374
5
8.48
1.428
12
10.71
0.155
15
9.37
3.380
54
2
6.59
3.197
7
9.31
0.574
17
8.60
8.219
11
8.17
0.984
8
10.31
0.519
7
9.02
0.454
52
12
6.72
4.157
13
9.49
1.298
5
8.76
1.614
6
8.32
0.648
10
10.51
0.025
7
9.20
0.525
53
4
6.84
1.181
5
9.67
2.255
18
8.93
9.226
16
8.48
6.670
6
10.71
2.072
5
9.37
2.039
54
Total
46
65
60
57
72
63
363
2R = 96,685 y el valor de
aceptar H1 a un nivel de significancia del 5%. En este caso, los resultados mostrados con el Minitab o
el SPSS, no proporcionan los valores tericos del Chi cuadrado, en su lugar se presenta el P-Value;
cuando este valor es menor que el nivel de significancia, significa que tambin debera rechazarse H 0;
en este caso P-Value < 0,05; por lo tanto debera rechazarse la hiptesis nula a favor de la
alternativa.
EJERCICIOS
4.1.
0
6
1
25
2
38
3
50
Ciclo 2013-I I
4
34
5
23
6
15
7
9
Moiss E. Armas
Pgina 44 de 85
Encuentre una curva de tendencia para explicar el comportamiento de estas observaciones y
valdelo a un nivel de significancia del 5%.
R: El comportamiento de estas observaciones debe seguir una Poisson; para ello se determina el promedio de
accidentes por da = 3,275; luego la funcin propuesta debera ser f(x) =
3,275 xe3,275
x!
, para x = 0,1,,7
accidentes/da. Plantendose la hiptesis nula en el sentido que esta ecuacin define el comportamiento de estos
accidentes, frente a la alternativa, que manifiesta que no lo describe, se construye el modelo terico y se encuentra
luego que su chi cuadrado real es R = 5,92 frente al chi cuadrado terico c(0,95,6) = 12,59. Haciendo la respectiva
comparacin se ve que se debe aceptar la hiptesis nula, por lo tanto la ecuacin planteada es vlida para describir el
comportamiento de estas observaciones.
4.6.
Una empresa cuenta con una plana heterognea de personal en cuanto a su experiencia laboral;
de este modo ha clasificado la siguiente tabla experiencia laboral en aos, dentro y fuera de la
institucin:
Ex. Aos
05
5 10 10 15 15 20 20 25 25 30 30 35
# Traba.
50
40
32
24
16
12
7
Ajuste estas observaciones a una distribucin triangular validndolo al 5%.
4.7. El servicio de emergencia de un hospital presenta un resumen de llegada de personas
accidentadas por causas de trnsito segn se muestra en la tabla:
Nmero de personas
0 1 2 3 4 5
ingresados por emergencia
Nmero de veces observado
6 25 36 21 15 7
a) Determine el nmero promedio de pacientes ingresados por da, as como su desviacin
estndar.
b) Encuentre una curva de tendencia del comportamiento de llegada de pacientes, y valdelo
al 5%
4.8.
Una casa comercial vende sus equipos de cmputo bajo la modalidad de al contado y al crdito;
cuando vende al crdito, algunos de sus clientes se atrasan en sus pagos, generando problemas
de liquidez a la empresa; el encargado de Estadstica lleva un registro histrico de los clientes
quienes tuvieron pagos atrasados, los que se muestran en la siguiente tabla
Problemas de pago de los clientes que compraron al crdito
Ciclo 2013-I I
Moiss E. Armas
Pgina 45 de 85
26 29
38
29 32
30
Existe suficiente evidencia como para decir que la edad de estos alumnos sigue una
distribucin uniforme? R: 20,05; 5 = 11,07 2 r = 5,8462
4.10. Un alumno est tratando de construir un modelo de distribucin de probabilidades del
comportamiento de llegada de clientes al cajero automtico de un banco de la localidad; para
ello se pone a observar la llegada de estos al cajero cada cinco minutos, lo cual le permite
confeccionar el siguiente cuadro de llegadas:
Llegadas de clientes al cajero automtico del Banco XXX
Nmero de
alumnos
observados
[ 03
8
[ 47
13
[ 8 11
20
[12 15
10
[16 20
4
Encuentre una curva de comportamiento terico del comportamiento de estas notas, y valdelo al
1%.
4.12. Para qu se desarrolla una prueba de contingencia?
4.13. Qu significa decir que las variables son independientes, en una prueba de contingencia?
4.14. De qu manera se puede validar una prueba de contingencia?
4.15. Explique el significado de que dos variables son dependientes, luego de desarrollar la prueba
de contingencia.
4.16. Un investigador est interesado en conocer, si la lectura de los diarios chicha de circulacin
nacional, est asociado al nivel cultural de las personas y el lugar donde residen; para ello se
hace un muestreo en diferentes lugares dentro del mbito de influencia de la Universidad,
preguntndosele a cada uno de ellos por las habituales lecturas de estos diarios,
encontrndose los siguientes resultados:
Preferencia por los diarios chicha, de una muestra de personas de diferentes
mbitos del rea de influencia de la Universidad
Grado de Instruccin
Primaria
Secundaria Incompleta
Secundaria Completa
Superior Incompleta
Inferencia Estadstica
Vgueta
7
6
8
3
Carqun
9
10
5
5
Ciclo 2013-I I
Supe
3
7
8
4
Sayn
10
8
7
4
Humaya
9
7
10
5
Moiss E. Armas
Pgina 46 de 85
Superior Completa
2
1
5
3
2
Analice los resultados de esta tabla y formule sus propias conclusiones; considere un riesgo de
equivocarse del 5%.
R: La hiptesis nula debe plantearse en los siguientes trminos: La lectura de los diarios chicha, nada tiene que ver
con el grado de instruccin de las personas que los leen, as como el lugar donde habitualmente se encuentran, frente
a la alternativa, que si efectivamente se darn estas condiciones, dado que hay suficiente evidencia como para afirmar
que los resultados de la tabla, as lo evidencian. Construyendo su tabla de valores esperados, se obtiene que su chi
cuadrado real es R = 10,32, el cual contrastado con el c(0,95,16) = 26,36, se puede concluir que efectivamente la lectura de
estos diarios, no est asociado al grado de instruccin de las personas que los leen, ni al lugar de procedencia.
4.17. Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea conocer si la preferencia por algn
plan de seguros de sus clientes est asociada al nivel ocupacional en ejercicio. Se toma una
muestra aleatoria de un grupo de clientes usuarios de este plan, obtenindose los siguientes
resultados:
Plan de seguros optados por los clientes
Nivel ocupacional
A
B
C
D
Obreros
30
45
35
70
Comerciantes
48
39
47
65
Profesionales
59
46
52
60
Independientes
20
15
10
22
a) Podra asegurarse que el plan de seguros optado por los clientes nada tiene que ver con los
tipos de clientes?, considere un riesgo de equivocarse del 1%.
b) Qu debera pasar para decir que el plan de seguros optados por los clientes, est asociado
a su nivel ocupacional, considerando un riesgo de equivocarse del 5%?
c) De qu manera podra utilizarse el SPSS para resolver este problema?
4.18. Un canal de televisin est interesado en saber si los programas que transmite da a da
influyen en el grado de conducta de su tele audiencia; para tales fines selecciona una muestra
aleatoria de un grupo de televidentes de diferentes grupos de edades, y los somete a una
prueba psicolgica, despus de un perodo de observacin, encontrndose los siguientes
resultados:
Nivel de conducta observada en una muestra de televidentes,
como resultado de sus programaciones, de la Empresa Televisiva XXXX
Grupo de
Muy
Agresivo Normal Hiperactivo
personas
agresivo
Nios
15
28
22
20
Jvenes
24
14
20
17
Adultos
10
12
24
14
Tercera edad
6
16
14
9
Podra asegurarse que existe una relacin entre el nivel de conducta de los grupos de edades
de las personas y la programacin emitida por la empresa televisiva, asumiendo un riesgo de
equivocarse del 5%?
4.19. Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer fuertes pedidos de
sus clientes provenientes del exterior; sin embargo el departamento de control de calidad alega
que este sistema de trabajos no es conveniente dado que frecuentemente encuentran fallas de
calidad en las prendas confeccionadas por sus trabajadores, lo cual puede perjudicar la imagen
de la empresa ante sus clientes. A fin de determinar si realmente existe este tipo de problemas
como lo alega control de calidad, se toman muestras aleatorias de un grupo de trabajadores de
loa diferentes turnos y se les evala sus respectivos trabajos, y determinar el nmero de fallas
encontradas en las prendas producidas; los resultados de estos se encuentran en la siguiente
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 47 de 85
Estado de
A
B
C
nimo
Muy a gusto
10
12
9
Gustoso
7
8
12
No le gusta
6
9
6
No le interesa
13
10
12
Podra asegurarse que el spot publicitario, influy en el estado de nimo de los electores, o es
que esto nada tiene que ver con ese estado de cosas? Sustente su respuesta considerando una
probabilidad de equivocarse con el 5%.
4.22. Se quiere establecer si existe una relacin entre la duracin de los discos duros y los distintos
lugares donde son utilizados, dado que por parte de los clientes que los utilizan, sobre todo en
la sierra, donde hace mucho fro, dicen que estos discos, despus de un perodo corto de vida,
empiezan a tener problemas en sus pistas, debindose hacer continuas reparaciones, con el
SanDisk; para descartar las afirmaciones de los clientes quejosos, se decide hacer pruebas de
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 48 de 85
confiabilidad de los discos duros de las marcas Quantum, Maxtor, Fireball o Seagate, en
diferentes lugares que presentan climas propios, como climas fros, muy fros, templados,
clidos, y muy calurosos; estos discos duros, despus de un tiempo de uso, deber registrarse
el nmero de veces que fue reparado con el SanDisk. Los resultados de este ensayo se
muestran en la siguiente tabla:
Nmero de veces que fueron sometidos a un proceso de Scan Disk
los discos duros, en concordancia al clima donde fueron expuestos
Tipo de clima
Fro
Muy fro
Templado
Clido
Muy clido
Quantum
12
15
9
11
13
Maxtor
10
9
11
9
13
Fireball
8
13
12
9
12
Seagate
13
10
12
13
8
Con estos resultados, podra darse la razn a los clientes quejosos, o es que estos casos solo
son problemas provenientes de la casualidad? Considere un nivel de significancia del 1%
4.23. Analizando el problema de la contaminacin del medio ambiente, realizado por las personas
en la provincia de Huaura, los alumnos del V ciclo de Ing. Informtica de la Universidad se
abocan a averiguar si la manera cmo las personas que contaminaban el medio ambiente
estaban relacionados con su nivel cultural; para ello muestrearon a un grupo de personas, de
diferentes grados de instruccin y los relacionaron con las diversas modalidades de contaminar
el medio ambiente, contabilizando el nmero de veces que contaminaban, en un determinado
perodo de tiempo; los resultados de esta investigacin se muestran en la siguiente tabla:
Nmero de veces que contaminaban el medio ambiente de acuerdo a
sus diferentes niveles culturales
Diversas modalidades de contaminar
Nivel
Escupe
Tira papeles
Orina en
Fuma
Cultural
u otros
la calle
Primaria
13
8
7
5
Secundaria
15
10
3
11
Superior
9
15
4
10
Incompleta
Profesional
5
12
2
16
Universitari
o
A la luz de estos resultados, formlese una teora y generalcese para la poblacin de la
provincia, asumiendo un riesgo de equivocarse del 5%.
4.24. Se quiere establecer si realmente existe una relacin entre la apreciacin de parte de los
estudiantes, respecto a la actitud de sus profesores, ya que segn se especula, esta
apreciacin, incide mucho en su rendimiento acadmico; para ello, en una universidad, se toma
una muestra aleatoria de un grupo de estudiantes, a los cuales se les clasifica en cuatro
expectativas respecto a qu actitud debera tomarse en el docente, parta sentirse ms
motivado en el desarrollo de sus clases; las opiniones de los estudiantes respecto a estas
preguntas, fueron los siguientes:
Caractersticas valoradas por los estudiantes segn las actitudes de
sus profesores
Muy
bueno
12
6
5
Buen
Regular
Malo
10
7
8
7
8
7
Ciclo 2013-I I
13
5
9
Moiss E. Armas
Pgina 49 de 85
Hace apuntes en la pizarra
8
4
2
9
Es puntual en las clases
10
6
7
5
Evala con justicia
5
3
3
7
Tiene buena diccin
9
4
6
12
Evale los resultados de esta tabla, teniendo en cuenta el grado de conocimiento con el que
cuenta hasta el momento.
4.25. Los alumnos del V ciclo de ingeniera informtica, en el ciclo que fenece, desarrollaron un
trabajo de investigacin, el cual consisti en averiguar las preferencias de continuar estudios
superiores en una universidad pblica del departamento de Lima; para ello, encuestaron a una
muestra de estudiantes del cuarto y quinto ao de la educacin secundaria, a quienes les
preguntaron sobre esta posible opcin; los alumnos encuestados fueron clasificados segn el
nivel de ingresos mensuales de sus respectivos padres, y registrados en los casilleros
correspondientes a las preferencias de continuar estudios superiores en las universidades, que
a continuacin se presenta:
Preferencias de continuacin de estudios superiores, en una institucin
universitaria de Lima, de una muestra de alumnos, clasificados segn los
ingresos de sus padres de familia.
Universidades nacionales del departamento de Lima
Nivel de
ingresos S/
800 1600
1600 - 2400
2400 3200
3200 4000
4000 - 4800
UNI
UNJFSC
UNMSM
UNFV
LA MOLINA
3
2
1
6
4
5
3
2
1
0
6
2
3
4
5
4
2
1
1
1
0
6
2
5
3
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 50 de 85
DISEOS EXPERIMENTALES
Ciclo 2013-I I
Moiss E. Armas
Pgina 51 de 85
poblacionales son iguales, y que adems, las muestras asignadas a cada uno de los tratamientos han
sido tambin al azar.
Ejemplo 5.1 Un investigador est interesado en probar tres mtodos de enseanza a fin de mejorar
el rendimiento acadmico de los alumnos de un instituto educativo; para ello selecciona al azar un
grupo de estudiantes, y al azar, sin que stos lo solicitaron ni conocan el mtodo de enseanza,
fueron asignados a solo uno de los mtodos, identificados por T1, T2 y T3; despus de un perodo de
observacin, los alumnos fueron calificados con notas comprendidos entre cero y 100, cuyos
resultados se muestra en la siguiente tabla:
Tabla 5.1
Puntajes obtenidos segn mtodo
De enseanza en un centro educativo
T1
23
12
16
24
21
T2
44
51
56
78
42
58
T3
78
56
65
66
43
67
77
52
Podra asegurarse que la implementacin de estos tres mtodos, hubo mejora en el rendimiento
acadmico de los alumnos, asumiendo un riesgo de equivocarse del 5%?
Solucin:
Se trata de averiguar si por lo menos con uno de estos tres mtodos de enseanza, se logr mejora;
en trminos de contraste de hiptesis:
H0: El rendimiento acadmico de los alumnos seguir siendo el mismo, pese a la implementacin de
nuevos mtodos de enseanza.
H1: Por lo menos, con uno de los mtodos de enseanza, se lograr elevar el rendimiento acadmico
de los alumnos.
En trminos cuantitativos, este contraste podr expresarse:
H0: 1 = 2 = 3
H1: Por lo menos uno de estos k, ser mayor que los dems, donde k = 1, 2, 3.
Haciendo los clculos respectivos, se obtiene su tabla de anlisis de varianza, donde el F r = 25,26
deber contrastarse con el Fc(0,95;2, 16 ) = 3,50.
TABLA DE ANVA
FUENTE
SC
gl
Tratamiento
6212.16
Error
1967.63
Total
8179.7
9
Inferencia Estadstica
2
16
18
CM
Fr
3106.08 25.26
122.98
Ciclo 2013-I I
Moiss E. Armas
Pgina 52 de 85
Del anlisis de esta tabla, se puede observar claramente que Fr es mayor que el Fc, por lo tanto, la
hiptesis nula debe ser rechazada, a favor de la hiptesis alternativa, debindose aceptar que
efectivamente hubo mejora en el rendimiento acadmico de los alumnos con uno de los tratamientos,
siempre con el riesgo de que habr un 5% de probabilidad de equivocarse al optar por esta decisin.
Ejemplo 5.2 Un investigador est evaluando la produccin de un conjunto de cuatro mquinas de
marcas diferentes; las mquinas elaboran ciertos artculos cada hora, y a fin de evaluar el rendimiento
de cada una de ellas, en determinadas horas, lleva el registro de produccin los cuales se muestran
en la siguiente tabla:
Tabla 5.2
Cantidad de productos, expresados en unidades,
elaborados por hora, segn marca de la mquina
A
250
264
256
235
239
230
240
250
245
239
B
267
254
267
242
267
261
260
258
270
C
257
279
269
252
277
289
240
236
D
241
258
262
264
273
260
263
279
245
239
gl
3
33
36
CM
610.82
172.78
Fr
3.54
Contrastando Fr con Fc(0,05; 3,33), se obtiene que Fr es mayor que Fc, por lo que debera rechazarse la
hiptesis nula, en el sentido de que existe un riesgo de equivocarse del 5%, al estar rechazando una
hiptesis verdadera.
Uso del software estadstico Minitab
Abra su editor del Minitab, y en cada columna C1, C2, C3 y C4, correspondientes para las marcas de
mquina A, B, C y D, introduzca los datos tal como se proporciona en la tabla 5.2; en el men
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 53 de 85
principal siga la secuencia: Stat ANOVA oneway (unstacked); donde observar la ventana
one-way Analysis of Variance, y en la primera ventana aparecen en columnas, las variables C1,
C2, C3, C4; en la Respons (in separate columns): escriba C1-C4.
El nivel de confianza mostrado por defecto es 95.0, lo cual es equivalente a decir que su nivel de
significancia es 0,05; si desea puede modificarlo; de igual manera, si desea obtener grficos puede
pulsar el botn Graphics y escoger la opcin deseada; finalmente pulse el botn OK donde obtendr
la siguiente tabla de anlisis de varianza
One-way ANOVA: A, B, C, D
Source DF SS MS F
P
Factor 3 1832 611 3.54 0.025
Error 33 5702 173
Total 36 7534
S = 13.14 R-Sq = 24.32% R-Sq(adj) = 17.44%
Como podr observar, el F calculado coincide con lo hallado manualmente, este valor deber ser
contrasto con el Fc(0,95; 3, 33) = 2,904 que le proporciona una tabla F.
A fin de no estar buscando en la tabla el Fc, basta con comparar el valor de P con el nivel de
significancia = 0,05; si P < , se rechaza H0, de otro modo se lo aceptar; en este caso P = 0,025 es
menor que 0,05, por lo tanto deber rechazarse H0.
De igual manera obtendr la siguiente informacin:
Level
A
B
C
D
N
10
9
8
10
Mean
244.80
260.67
262.38
258.40
StDev
10.29
8.72
19.18
13.18
PRUEBA DE TUKEY
Cuando se rechaza la hiptesis nula, significa que por lo menos con uno de los tratamientos se ha
podido lograr un efecto significativo en el experimento; el problema ser determinar con cules de
sos tratamiento se lograr mayores efectos; la prueba de Tukey permite proporcionar se
tratamiento; para ello se compara su DHS, el cual se obtiene de una tabla que proporciona los puntos
porcentuales del rango de t de Student, y se compara calculando todas las medias pareadas,
ordenadas en forma descendente, de los tratamientos, este DHS se obtiene del siguiente modo:
q( ;k , nk)
DHS=
2CME
, donde = nivel de significancia, CME el cuadrado medio del error, k
nj
Ciclo 2013-I I
Moiss E. Armas
Pgina 54 de 85
hay diferencia significativa entre estas, por lo tanto, la media mayor ser la que proporciona mejores
resultados.
Analizando el caso del ejemplo; solo se est considerando que el tamao de la muestras de los
tratamientos es el mximo, cuando en realidad debera hacerse cada anlisis para cada tamao de
muestra; as nj = 10, por lo tanto: DHS =
q(0,05 ; 4,32)
2173
10
EJERCICIOS
5.1.
Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea ofrece a sus clientes cuatro planes de
seguros, selecciona una muestra de clientes, se le da una explicacin detallada de las ventajas de
este plan y al final se les pide que evalen sus bondades, los cuales deben expresarse en una
nota cuantitativa, calificada entre cero y cien; los resultados de este ensayo dieron los siguientes
resultados:
Calificaciones, entre 0 y 100 a los planes de seguro
para una muestra de clientes seleccionadas al azar
A
B
C
D
30
45
55
78
68
39
67
69
59
66
92
80
20
45
47
42
89
56
59
78
72
81
a) Identifique: La variable independiente; la variable dependiente; la unidad de medida; la unidad
experimental y el de tipo de experimento.
b) Podra asegurarse que por lo menos uno de los planes de seguros de seguros optado por
los clientes tienen mejor apreciacin que los otros, por los clientes potenciales?, considere
un riesgo de equivocarse del 1%.
c) Qu poltica debera desarrollarse, si las circunstancias muestran que los planes no tienen la
debida aceptacin por los clientes?
5.2.
Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer la gran demanda
por parte del mercado europeo; para ello, queriendo saber en qu turno de trabajo, el rendimiento
de los trabajadores es mejor, selecciona una muestra de ellos, y los somete a observacin, sin
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 55 de 85
que ellos se den cuenta, a fin de cuantificar el nmero de piezas producidas en un turno de
trabajo. Debe considerarse que todos los trabajadores estaban sometidos a las mismas
condiciones laborales, por lo que se puede inferir que no exista por parte de la administracin,
ningn sesgo en la medida o apreciacin por parte de las observaciones registradas a los
trabajadores. Despus de un tiempo de observacin, se pudo obtener los siguientes resultados:
Resultados de produccin de nmero de piezas por turno, de una muestra de trabajadores de la
empresa ..
Maana
Tarde
Noche
17
12
19
11
16
17
15
15
16
20
20
12
8
21
10
12
18
23
14
19
21
18
16
11
17
10
a)
b)
c)
d)
e)
nj
5.4.
Demuestre que:
( . j ..)2
i=1 j=1
T ..
T . j2
= j=1 n j
- C; donde C =
nj
j=1
5.5.
Una nueva empresa vinculada al negocio informtico est interesada en abrir nuevas
sucursales en los diferentes mbitos del pas, con la finalidad de impartir enseanza en ciencias
de la computacin; los posibles lugares donde se abriran estos negocios son: Arequipa, Trujillo,
Cajamarca, Chiclayo, Cusco y Huancayo; en vista de que carece de informacin sociocultural de
cada uno de los lugares, selecciona muestras aleatorias de posibles candidatos de cada lugar a
fin de someterlos a una prueba de percepcin de conocimientos, los cuales son cuantificados en
notas que van de cero a veinte, cuyos resultados se muestran en la siguiente tabla:
Calificativos obtenidos por los candidatos seleccionados por una
Prueba de percepcin, desarrollada durante el perodo..
Lugares
Arequipa
Trujillo
Inferencia Estadstica
12,
6
11,
5
08,
5
12,
2
12,
4
10,
2
13,
2
07,
7
07,
2
11,
5
10,
7
Ciclo 2013-I I
13,
6
11,
6
08,
7
Moiss E. Armas
Pgina 56 de 85
Cajamarc
a
Chiclayo
Pescado
190
205
240
230
189
210
200
208
230
215
217
245
Carne
250
265
230
210
250
198
201
265
213
232
200
213
218
217
Granos
200
213
224
218
200
190
198
201
202
210
206
Aves
198
201
256
200
187
180
245
210
216
200
Verduras
202
189
218
220
201
189
178
185
200
205
218
230
205
205
189
190
Constituyen estos resultados, suficiente evidencia como para manifestar que los niveles de
colesterol en la sangre de las personas son iguales, pese a la diversidad de dietas; considere un nivel
de significancia del 5%? R: (Evale los resultados de la siguiente table)
Tabla ANVA
Source DF SS MS F
P
Factor 4 5052 1263 3.64 0.010
Error 58 20103 347
Total 62 25155
S = 18.62 R-Sq = 20.08% R-Sq(adj) = 14.57%
FR = 3,64; contrastado con Fc(0,005; 4, 58) = 2,54; por lo tanto debera rechazarse la hiptesis nula y
aceptarse la alternativa; lo mismo se puede concluir comparando P = 0,010 el cual es menor que el
nivel de significancia 0,05.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 57 de 85
Level
C1
C2
C3
C4
C5
N
12
14
11
10
16
Mean
214.92
225.86
205.64
209.30
201.50
StDev
18.29
23.32
9.82
24.10
14.52
5.7.
Una empresa dedicada a la venta de partes de equipos de PC, seleccionar un tipo de tner
de impresoras lser, a fin de comercializar y competir en el mercado informtico; su eleccin
estar basado en aquella marca que presente mayores rendimientos, y para ello cuenta con cinco
ofertas; como no sabe por cul decidir, selecciona tner al azar, y lo somete a prueba de
impresin, obteniendo los siguiente resultados:
Cantidad de hojas impresas con las mismas caractersticas
de la muestra de tner de impresoras
HP
EPSON
LEXMARK
CANON
XEROX
206
187
230
195
201
200
198
185
215
198
184
208
198
215
195
199
217
200
207
218
Hormonas
1
2
3
4
5
6
13
21
18
7
6
11
17
13
15
11
11
9
7
20
20
18
15
14
14
18
19
8
10
7
21
13
8
10
15
15
Ciclo 2013-I I
Moiss E. Armas
Pgina 58 de 85
1.9
2.7
2.6
1.8
2.9
1.7
3.0
2.5
1.6
2.8
2.1
1.8
2.7
3.2
3.3
2.8
3.0
3.5
1.9
2.3
1.5
2.9
1.5
1.9
2.9
1.7
1.8
3.2
4.0
4.2
2.5
2.0
2.3
2.9
2.4
2.8
Es posible considerar que por lo menos una de las frutas genera menor proporcin de alcohol
que los dems?, considerando un nivel de significancia del 5%; en caso afirmativo, indique cul
de los tipos de fruta sera el que genera ms alcohol.
5.11. skkksk
LUGARES
Huaral
Inferencia Estadstica
ENE
274,3
FEB
285,2
Ciclo 2013-I I
MAR
270
ABR
285,5
MAY
233,7
JUN
223,4
Moiss E. Armas
Pgina 59 de 85
Barranca
Huaura
245,2
227,8
261
241,8
255,3
228,9
260,8
278,2
244,2
228,6
250,2
229,9
Cajatambo
301,2
289,4
302,2
306,8
302,7
271,7
Oyn
Canta
308,5
312,0
273,9
315,8
288,5
317,8
298,5
322,4
282,3
288,6
290,3
292,5
Teniendo en cuenta estas evidencias, extraiga sus propias conclusiones y diga en qu mes sera
ms conveniente sembrar los tomates. En todos los casos considere un riesgo de equivocarse del
1%.
Solucin: El contraste de hiptesis se dar en los siguientes trminos:
Ho: El rendimiento de tomate, tratados con abono orgnico, cultivados en los diferentes meses del
ao, ser el mismo, pese a que las parcelas fueron ubicadas de acuerdo los lugares donde se
cultivaron.
H1: Por lo menos, en uno de los meses del ao, el rendimiento de tomate, tratados con abono
orgnico, cultivados en los diferentes meses del ao, ser mayor que los otros meses,
agrupando a las parcelas segn lugar donde se cultivaron.
Es claro que este experimento corresponde a un diseo de bloques al azar, donde los tratamientos
corresponden a los meses del ao en que se sembraron el producto, y los bloques los lugares donde
se hacen los cultivos.
Desarrollando los clculos que conllevan a este diseo, se obtiene la siguiente tabla:
Tabla de ANVA
Fuente
variacin
Mes del ao
Lugares
Error
Total
Suma Cuadrado
4098,291
22239,56
4328,68
30666,53
g.l
5
5
25
35
Cuad Medio
819,66
Fr
4,73
173,15
Fc(0,95;5,25) =
Fc(0,99;5,25) =
2,65
3,85
Prueba de Tukey.
Si se considera que el nivel de significancia fuese del 1%, entonces contrastando Fr = 4,73 con el
Fc(0,01, 5,25) = 3,85, se puede concluir, que efectivamente, por lo menos en uno de los meses del
ao, se obtiene mejor rendimiento en las cosechas; para determinar en cul de los meses es eso
posible, se har la prueba de Tukey; para esto, de los clculos desarrollados se obtiene que los
promedios por meses de cosecha, fueron los siguientes:
Meses
Promedi
o
Smbolo
ENE
FEB
MAR
ABR
MAY
JU
278.2
y.1
277.9
y.2
277.1
y.3
292.0
y.4
263.4
y.5
259.7
y.6
Ordenndoles de mayor a menor y parendole, para obtener sus diferencias, entre cada uno de ellos,
se obtiene el lado derecho de la matriz a partir de su diagonal:
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 60 de 85
y.4
y.1
y.2
y.3
y.5
y.6
y.4
0
13,8
14,1
14,9
28,6
32,3
y.1
0
0,3
1,1
14,8
18,5
y.2
0
0,8
14,5
18,2
y.3
0
13,7
17,4
y.5
0
3,7
y.6
0
El coeficiente de Tukey al nivel de = 5%, es: q(=0,05; 6,30) = 4,30 y el DHS es 23,099,
comparando este valor con la tabla de las diferencias de medias pareadas, se pueden concluir que
solamente las diferencias de y.4 con y.5 y y.4 con y.6 son significativas, lo cual quiere decir, que
solamente en el mes de abril es donde se obtiene mejores rendimientos; en los otros meses es
insignificante.
Ejemplo . Considere el siguiente diseo de bloques al azar, donde A, D son los tratamientos.
A
B
C
D
Arial
5
8
7
11
Courier
16
20
18
23
Aharoni
25
31
26
33
Batan
10
20
15
10
Impact
3
10
10
7
TABLA
DE ANVA
Suma
Fuente
Cuad
g.l
Cuad Med
Fr
Tratamie
nto
103.6
3
34.53
Bloque
1266.8
4
4.69
Error
88.4
12
7.37
Total
1458.8
19
Fc(0,95;3,1
2) = 3.49
Fc(0,99;3,1
2) =
Uso del Minitab para desarrollar anlisis de varianza con dos factores (twoway).
Al abrir el editor del Minitab, deber seguirse la siguiente secuencia:
Los datos de la Tabla .deben presentarse del siguiente modo:
N de fila
C1
C2
C3
de hoja
(datos de filas)
1
2
3
4
5
6
7
8
9
5
8
7
11
16
20
18
23
25
Inferencia Estadstica
1
1
1
1
2
2
2
2
3
Ciclo 2013-I I
1
2
3
4
1
2
3
4
1
Moiss E. Armas
Pgina 61 de 85
10
11
12
13
14
15
16
17
18
19
20
31
26
33
10
20
15
10
3
10
10
7
3
3
3
4
4
4
4
5
5
5
5
2
3
4
1
2
3
4
1
2
3
4
En la columna C1, se colocan todos los datos en orden consecutivo, comenzando de la primera fila;
en la columna C2, se indican a qu fila pertenecen sos datos; en la columna C3 se indican las
columnas en que estn estos datos, luego se va al men principal y seguir la siguiente secuencia:
Stat ANOVA Two-way. En su respectiva ventana Two-way Analysis of Variance, en Response
escriba C1; en Row factor escriba C2, y en Column factor escriba C3; el nivel de significancia por
defecto es 0,05; luego pulse el botn Ok y obtendr la tabla ANOVA, como lo mostrado a
continuacin.
Two-way ANOVA: C1 versus C2, C3
Source
C2
C3
Error
Total
DF
4
3
12
19
SS
1266.8
103.6
88.4
1458.8
MS
316.700
34.533
7.367
F
42.99
4.69
P
0.000
0.022
EJERCICIOS
5.12. Explique la diferencia entre un diseo completamente al azar, frente a un diseo de bloques al
azar.
5.13. Se hace un estudio para saber si el nivel de gasto por da que desarrollan los turistas
extranjeros en el Per, provenientes de USA, Inglaterra, Alemania y Francia, depende de su
procedencia; para ello se toman muestras aleatorias de nueve turistas de cada pas, con la
finalidad de conocer el promedio de gasto por da en US$, encontrndose los siguientes
resultados:
Promedio de gasto por da en el pas, en US$, de los turistas extranjeros
Pas
USA
Alemani
a
Inglaterr
a
Francia
Inferencia Estadstica
1
12
0
13
3
10
0
10
2
90
11
0
13
0
11
3
11
0
95
4
99
13
0
11
12
7
11
95
5
10
5
10
0
10
5
10
6
12
9
11
0
95
7
11
8
10
0
97
10
10
Ciclo 2013-I I
8
13
0
12
5
99
9
10
0
13
0
10
2
118 11
Moiss E. Armas
Pgina 62 de 85
2
8
5
2
0
0
6
5
Encuentre la respuesta para este caso, asumiendo un nivel de significancia del 5%.
5.14. La siguiente tabla proporciona las notas promocionales de Estadstica y Matemtica, de un
grupo de estudiantes de ingeniera cursados el ciclo anterior.
Calificativo en Estadstica
Calificativo
00 05
05 10
10 - 15 15 20
Matemtica
00 05
23
15
24
8
05 10
17
14
19
16
10 15
12
8
26
5
15 20
6
4
5
2
Podra asegurarse que las notas obtenidas por los alumnos, tanto en Estadstica como en
Matemtica, guardan una relacin entre s, o es que son totalmente independientes? Sea =
5%.
5.15. Un casa comercial, especializada en el ensamblaje de equipos de cmputo, est por optar qu
tipo de marca de discos duros (HD) de las marcas Quantum, Maxtor, Fireball o Seagate, deber
adoptarse, a fin de incorporar a los nuevos modelos de PC, que piensa lanzar al mercado; para
ello es preciso conocer el promedio de vida de estos HD, que se cree, mucho depender del lugar
donde sea llevado la PC. Como los productos de la empresa son comercializados en todo el Per,
en cuatro regiones del pas, se le somete a un proceso de simulacin del perodo de vida en aos,
encontrndose los siguientes resultados:
Duracin simulada, en aos, de los discos duros en las cuatro regiones del pas:
Lima
Arequipa
Huancavelica
Cerro de Pasco
Puno
Quantum
5,2
5,3
4,7
4,4
4,8
Maxtor
5,1
5,8
5,2
4,6
5,0
Fireball Seagate
4,8
4,9
5,2
5,4
5,1
5,3
4,7
4,9
4,8
4,9
Los tcnicos que hicieron la prueba de duracin de estos HD, manifiestan que el promedio de
vida de estos discos duros, es el mismo, pese a que trabajan en diferentes lugares del pas,
usted, con los conocimientos que posee al presente, podra darles la razn? Considere un
riesgo de equivocarse del 5%.
5.16. La Municipalidad de Huaura est investigando acerca del perodo de pago trimestral en el
cumplimiento de pagos por concepto del impuesto predial, en todos sus clientes, conformados por
contribuyentes de los siguientes tipos: Rural, Residencial, Comercial e Industrial. Para ello toma
una muestra aleatoria entre todos los clientes que pagaron oportunamente sus impuestos el
pasado ao, obteniendo la siguiente informacin:
Monto pagado por los clientes, en S/ por concepto de
impuestos prediales en los trimestres correspondientes
Tipo de cliente
Rural
Residencial
Comercial
Industrial
I
21
32
16
35
Trimestres del ao
II
III
56
19
21
67
42
17
76
18
IV
29
30
21
86
Despus de eliminar los efectos, pagos por tipo de cliente, podran las autoridades
municipales, concluir que los trimestres del ao, tienen diferentes efectos en el pago del
impuesto predial?; considere = 0,025.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 63 de 85
5.17. El departamento de ventas de una casa comercial dedicada a la venta de ropas exclusivas de
hombres, est interesado en conocer si existe diferencias en las comisiones de ventas que
perciben sus vendedores en los das de atencin al pblico; para ello se toma una muestra de
cinco vendedores y se registra las comisiones percibidas durante los seis das de la semana, los
resultados de estas comisiones se indican en la siguiente tabla:
Ingreso en S/ de los vendedores por comisin de ventas en los
das de la semana
Lunes
Martes
Mircole
s
Jueves
Viernes
Sbado
A
20
21
15
B
32
27
20
C
11
30
12
D
35
12
45
E
38
17
23
10
23
30
42
17
28
45
15
30
60
12
26
53
28
36
Podra asegurarse que existe diferencia en las comisiones de los vendedores, o es que esta
diferencia solo se debe al azar?, asuma un nivel de significancia del 5%.
5.18. Se hace un estudio para saber si la estatura de las personas estaba ligado al lugar de donde
provenan; para ello, en la ciudad de Huacho se toman muestras aleatorias de un grupo de
pobladores, provenientes de Huaraz, Oyn, Hunuco, Celendn y Sihuas, a quienes se les agrupa
de acuerdo a sus edades y se les toma sus respectivas estaturas, encontrndose los siguientes
resultados:
Estatura promedio, en metros, de una muestra de personas segn
procedencia de origen y rango de edades
Parcela
1
2
3
4
5
Inferencia Estadstica
A
50
55
45
48
40
Tipo de fertilizante
B
C
45
44
56
44
45
56
43
58
41
47
Ciclo 2013-I I
D
51
52
41
40
44
Moiss E. Armas
Pgina 64 de 85
Proporcionan estos datos, suficiente evidencia como para concluir que el rendimiento de
tomate, est asociado al tipo de fertilizante y la parcela utilizada, considerando un nivel de
significancia del 1%?
5.20. Una consultora en marketing, est interesada en evaluar el grado de preferencia de parte de
los potenciales consumidores de un nuevo producto, que la empresa a la cual estn asesorando;
a fin de evaluar esta preferencia de parte del pblico consumidor, se decide presentar el producto
bajos cinco tipo de envases: de vidrio, en bolsa de papel aluminio, en cartn, en bolsa de papel, y
en envase de aluminio y en frasco de polietieleno. Dado que el pblico es muy heterogneo, a fin
de reducir los efectos por estas diferencias, se los decide probarlos en siete lugares del pas de ls
cuales se seleccionar muestra aleatorias; se presenta el producto en una de estas
presentaciones, solo a uno de los seleccionados y se les pide que muestren su grado de
apreciacin, en una escala valorativa de cero a 100; los resultados de esta investigacin fueron
los siguientes:
Tabla valorativa, de uno a 100, sobre el grado de apreciacin de un producto, presentado en
diferentes envases, de clientes potenciales, seleccionadas al azar, de diferentes lugares del pas.
Presentacin del producto
Frasco
Papel
Bolsa
Envase
polietilen
Lugares
Vidrio
aluminio
Cartn
papel
aluminio
o
Huarz
59
65
40
50
78
65
Trujillo
78
43
55
51
80
74
Lima
80
69
54
49
85
70
Arequipa
61
50
56
58
74
63
Cusco
67
62
67
69
76
66
Pucallpa
50
44
68
75
70
72
Tacna
68
50
72
42
83
67
Es posible considerar que el grado de valoracin del producto, presentado en los diferentes
envases, tienen el mismo calificativo, pese a que clientes potenciales fueron clasificados de
acuerdo a su lugar de procedencia? Asuma un riesgo de equivocarse del 5%
5.21. Las instalaciones para generar energa nuclear producen gran cantidad de calor que, en
general se descarga a cuerpos de agua. Ese calor eleva la temperatura del lquido, lo cual da
como resultado una mayor concentracin de clorofila que, a la vez, alarga la temporada de
crecimiento. Para estudiar este efecto, se tomaron muestras de agua en forma mensual en 3
estaciones durante un perodo de 12 meses. La estacin A es la que se ubica ms cerca de una
descarga potencial de agua caliente, la estacin C es la ms lejana, y la estacin B, se encuentra
dentro de estas dos estaciones; se registraron las dos concentraciones de clorofila :
Estacin del ao
Mes
Enero
Febrero
Marzo
Abril
Mayo
Inferencia Estadstica
A
9,867
14,035
10,700
13,853
7,067
B
3,723
8,416
20,723
9,168
4,778
Ciclo 2013-I I
C
4,410
11,100
4,470
8,010
34,080
Moiss E. Armas
Pgina 65 de 85
Junio
11,670
9,145
8,090
Julio
7,357
8,463
3,350
Agosto
3,358
4,086
4,500
Setiembre
4,210
4,233
6,830
Octubre
3,630
2,320
5,800
Noviembre
2,953
3,843
3,480
Diciembre
2,640
3,610
3,020
Realice un anlisis de varianza y pruebe la hiptesis de que con un nivel de significancia de 0,05,
si hay diferencia en las concentraciones medias de clorofila en las 3 estaciones.
5.22. En un estudio realizado sobre efectos de componentes alimenticios, se asignaron 3 dietas
durante un perodo de 3 das a cada uno de 6 sujetos, con el diseo mostrado abajo. Los sujetos
que desempean el papel de bloques, recibieron las siguientes 3 dietas, en orden aleatorio:
Dieta 1: grasas mixtas y carbohidratos,
Dieta 2: muchas grasas,
Dieta 3. Muchos carbohidratos.
Al terminar el perodo de 3 das, se puso a cada sujeto en una banda caminadora y se midi el
tiempo en segundos, en que quedaban exhaustos. Se registraron los siguientes datos:
Sujeto
Dieta
A
B
C
D
E
F
1
84
35
91
57
56
45
2
91
48
71
45
61
61
3
122
53
110
71
91
122
Efecte un anlisis de varianza para determinar si existe diferencia significativa entre las dietas.
5.23. Unos emprendedores estn interesados en invertir en la ciudad de Barranca, colocando una
sucursal de servicios informticos, de tal manera que proporcione resultados en tiempo real y al
costo mnimo; previo a ello desean saber si los potenciales clientes podran asociar su presencia
al tipo de publicidad desarrollada; los clientes potenciales con las cuales se trata de determinar su
grado de satisfaccin, sern los estudiantes universitarios, los profesionales, los comerciantes,
los agricultores y los docentes del magisterio; para ello se emprende un programa de difusin
masiva en los diferentes medios publicitarios, resaltando las bondades del futuro negocio; los
resultados de este programa se muestra en la siguiente tabla:
Resultados de grados de satisfaccin porcentual en una muestra de clientes potenciales, de
acuerdo al tipo de campaa publicitaria, a favor de la empresa de Servicios Informticos.
Perifone
Volante Banderola
o
Estudiantes
15
5
4
9
9
10
Profesionales
7
12
16
4
5
7
Comerciantes
13
5
4
12
15
13
Agricultores
8
7
3
9
12
11
Docentes del magisterio
9
10
8
13
7
12
Otros
6
11
2
7
9
8
De acuerdo a los resultados de esta tabla, qu podra sugerirle a estos emprendedores,
asumiendo un riesgo de equivocarse el 5%?
Inferencia Estadstica
Radio
TV
Diario
Ciclo 2013-I I
Moiss E. Armas
Pgina 66 de 85
5.24. Una compaa de seguros tiene que optar por escoger dentro de cuatro planes de seguros de
vida que actualmente ofrece a sus clientes; para ello desea conocer si el ndice de preferencia por
algn plan de seguros de sus clientes est asociada a su nivel ocupacional. Se toma una muestra
de un grupo de clientes usuarios de este plan, obtenindose los resultados mostrados en la
siguiente pgina:
Indice de preferencia porcentual, segn plan de seguros optados por los clientes
Nivel
A
B
C
D
ocupacional
Obreros
30
45
35
70
Comerciantes
48
39
47
65
Profesionales
59
46
52
60
Independientes
20
15
10
22
a. Podra asegurarse que el plan de seguros optado por los clientes nada tiene que ver con los
tipos de clientes?, considere un riesgo de equivocarse del 1%.
b. Qu debera pasar para decir que el plan de seguros optados por los clientes, est asociado
a su nivel ocupacional, considerando un riesgo de equivocarse del 5%?
5.25. En un experimento para comparar la calidad de cuatro marcas diferentes de cintas de grabar
de carrete a carrete, se seleccionan cinco carretes de 800 metros de cada marca, determinndose
el nmero de imperfecciones en cada uno.
Marca de Carrete
A
B
C
D
10
14
13
17
7
13
20
14
12
13
9
10
15
10
8
21
9
10
21
13
Se cree que el nmero de imperfecciones sigue una distribucin Poisson, para cada marca.
Analice los datos al nivel de significancia del 1%, con el objeto de averiguar si el nmero esperado
de imperfecciones por carrete es el mismo para cada marca; de otra manera, explique cules de
las marcas es la que presenta mayor desconfianza.
5.26. Un distribuidor de equipos de cmputo est interesado en saber, si diferentes marcas de
discos duros, HD, tienen diferentes tiempos de duracin, de acuerdo a las condiciones
ambientales donde son utilizadas; para ello toma seis marcas diferentes de HD y se les somete a
una prueba de simulacin de tiempo de duracin, a fin de determinar qu marca es la ms
adecuada para comercializarlo; dado que considera que las condiciones ambientales no son las
mismas en diferentes lugares del pas, los que podran influir en los clculos de la variabilidad
total, los agrupa de acuerdo al lugar donde se hacen los ensayos; luego de un tiempo de
observacin, logr configurar la siguiente tabla de ANVA, de manera incompleta:
Tabla ANVA
Fuente
S.C.
g.l.
CM
Fr
Marcas de HD
Lugar de prueba
30,75
7,86
Error
415
Total
29
a) Complete las celdas vacas de esta tabla.
b) Formule un contraste de hiptesis para este experimento, y extraiga sus conclusiones,
asumiendo un margen de equivocarse del 1%.
Solucin:
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 67 de 85
a)
b)
5.27. Una empresa textil trabaja a tres turnos, en razn de que debe satisfacer las grandes
cantidades de pedidos de sus clientes provenientes del exterior; sin embargo el departamento de
control de calidad alega que este sistema de implementar turnos de trabajo no es conveniente
dado que frecuentemente se encuentran fallas de calidad en las prendas confeccionadas por sus
trabajadores, lo cual puede perjudicar la imagen de la empresa ante sus clientes. A fin de
determinar si realmente existe este tipo de problemas como lo alega este departamento, se toman
muestras de un grupo de trabajadores de los diferentes turnos y se les evala sus respectivos
trabajos, a fin de determinar el nmero de fallas encontradas en las prendas producidas; los
resultados de estos se encuentran en la siguiente tabla:
Resultados valorativos del muestreo hecho a un grupo de trabajadores, para
determinar el nmero de fallas encontrados en las prendas confeccionadas
Maana
Tarde
Noche
5
4
16
17
7
3
12
9
14
5
11
6
7
13
3
CUADRADO LATINO
En los diseos de bloque al azar, a fin de reducir los efectos de la variacin por efectos de su
heterogenidad, se les agrupa en grupos homogneos, llamados bloques; en el cuadrado latino se
tiene en cuenta dos factores de variacin y de igual modo, a los elementos muestrales se le agrupa
teniendo en cuenta estos dos factores, y se asigna el respectivo tratamiento.
Este diseo permitir configurar una serie de opciones, dependiendo del nmero de elementos con
los que cuentan los factores; as los factores son de tres elementos, entonces el cuadrado latino
estar formado por 3 x 3 = 9 celdas, donde en cada celda, solo se le asignar un tratamiento, sin que
este se repita en su respectiva fila y columna.
Ejemplo 5.3 Un empresario est interesado en introducir un nuevo producto al mercado, para ello
utilizar diferentes medios publicitarios a fin de evaluar, en cules de ellos, los clientes recuerdan ms
la publicidad del producto; dichos medios publicitarios sern: la Radio, la TV, los Diarios, los
Perifoneos, las Revistas especializadas, y la emisin de Volantes, en esta publicidad se explicar las
bondades del nuevo producto; sin embargo sus analistas de marketing consideran que los
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 68 de 85
potenciales clientes, tambin podran estar influenciados por el lugar donde habitan, adems de los
meses del ao en que se hace la publicidad; en este sentido, a fin de reducir la influencia en la suma
de los cuadrados de las varianzas totales, a estos potenciales clientes se los agrupa de acuerdo a
estos rasgos homogneos y aleatoriamente se seleccionan a un grupo de clientes y tambin
aleatoriamente se les asigna a uno de los medios publicitarios; luego se les pregunta si recordaba o
haber visto la publicidad del producto a travs del medio publicitado; las respuestas mostradas en el
diseo experimental, de manera incompleta se muestra en la siguiente tabla:
Nmero de veces que recordaba el cliente sobre la publicidad del producto,
Utilizando diferentes medios publicitarios, y agrupados segn lugar de
residencia y mes del ao
Chimbot
e
C, 5
15
14
7
12
14
Huarme
y
9
7
E, 5
11
6
16
Huaura
Lima
Ica
Hunuco
Enero
12
14
5
15
Febrero
5
8
9
D, 4
Marzo
3
0
11
13
Abril
A, 6
10
13
8
Mayo
5
14
B, 9
2
Junio
9
F, 5
4
11
Donde:
A = representa el medio publicitario como la Radio, B = la TV, C = los Diarios, D = Perifoneos,
E = Revistas especializadas, y F = los Volantes.
a) Complete con los tratamientos en cada una de las celdas de esta matriz.
b) Evale los resultados de este experimento, asumiendo un riesgo de equivocarse del 5%.
c) En los casos de que el experimento resultase positivo, indique, con cul de los medios
publicitarios deber contar la empresa, a fin de llegar a un mayor nmero de clientes.
Solucin:
Una posible forma de diseo de cuadrado latino tiene la siguiente configuracin:
Lugar de residencia del elemento en experimentacin
Mes del ao
Chimbot
e
Huarme
y
Huaura
Enero
C,
F,
B,
Febrero
A,
15
B,
C,
Marzo
B,
14 E,
D,
Abril
F,
C,
11
A,
Mayo
E,
12
D,
F,
Junio
D,
14
A,
Inferencia Estadstica
16 E,
Lima
D,
14
E,
5
8
C,
3
0
B,
6
10
A,
5
14
F,
9
5
12
Ciclo 2013-I I
Ica
E,
5
F,
9
A,
11
D,
13
B,
9
C,
4
Hunuc
o
A,
15
D,
F,
13
E,
C,
B,
11
Moiss E. Armas
Pgina 69 de 85
Siendo el problema un tema correspondiente a un cuadrado latino; los desarrollos de los elementos
de informacin son:
Mes del
ao
Enero
Huaur
a
12
Febrero
15
Marzo
14
Abril
11
Mayo
12
Junio
14
16
Chimbote Huarmey
T.j..
67
54
T.j..^2
4489
2916
La suma de sus tratamientos:
T..A
T..D
T..E
T..F
77 T..a^2= 5929
63 T..b^2= 3969
T..c^2=
27
729
54 T..d^2= 2916
47 T..e^2=2209
48 T..f^2= 2304
T.. =
316.000
T..B
T..C
Y..a
=
y..b =
y..c =
y..d =
y..e =
y..f =
Lima
Ica
14
Hunuc
o
15
Ti..
Ti..^2
60
3600
48
2304
11
13
46
2116
10
13
55
3025
14
48
2304
11
59
3481
53
2809
40
51
51
1600 2601 2601
12.8
10.5
4.5
9.0
7.8
8.0
Inferencia Estadstica
2773.778
622.222
Ciclo 2013-I I
Moiss E. Armas
Pgina 70 de 85
EJERCICIOS
5.28. El departamento de matemticas de una universidad, quiere evaluar las habilidades didcticas
de cuatro profesores; para eliminar cualesquiera de los efectos debidos a los horarios y cursos
distintos de matemticas a lo largo del da, se decidi realizar un experimento utilizando el diseo
del cuadrado latino, en el que las letras A, B, C, y D representaban a los cuatro profesores. Cada
uno de ellos ense una parte de cada uno de los cuatro cursos programados en cuatro horarios
distintos del da. Los datos siguientes muestran las calificaciones, entre cero y cien puntos,
asignadas a los maestros por los 16 estudiantes de capacidad aproximadamente igual. Utilice un
nivel de significancia de 0,05 para probar la hiptesis de que los distintos profesores no tienen
ningn efecto en las calificaciones.
Curso
Horario
1
2
3
4
Algebra
A: 84
B: 91
C: 59
D: 75
Geometra Estadstica
B: 79
C: 53
C: 84
D: 84
D: 48
A: 79
A: 55
B: 65
Clculo
D: 93
A: 81
B: 82
C: 61
5.29. Una empresa de manufactura desea investigar los efectos de 5 aditivos para el color en el
tiempo de preparacin de una nueva mezcla de concreto. Se esperan variaciones en los tiempos
de preparacin debido a los cambios diarios de temperatura y humedad, as como a los distintos
trabajadores que preparan los moldes de prueba. para eliminar estas fuentes extraas de
variacin, se dise un cuadrado latino de 5 x 5, en el cual, las letras A, B, C, D y E representan
los 5 aditivos. En la tabla que sigue se presentan los tiempos de preparacin en horas, para los 25
moldes:
Da
Trabajador
1
2
3
4
5
1
D:10,7
11,3
11,8
14,1
14,5
2
10,3
10,5
10,9
11,6
11,5
3
11,2
12,0
C: 10,5
11,0
11,5
4
10,9
11,5
11,3
11,7
12,7
5
10,5
10,3
7,5
11,5
B: 10,9
Complete las celdas de esta matriz, y con un nivel de significancia de 0,05, es posible decir que
los aditivos para el color no tienen efecto alguno en el tiempo de preparacin de la mezcla de
concreto?, Si lo fuese as, cules seran los aditivos que influyen en el tiempo de preparacin de
la mezcla de concreto?
5.30. Se hace un modelo de experimento para conocer la produccin de 6 variedades de trigo,
utilizando 6 fertilizantes en 6 aos diferentes, cuyos resultados se muestran en la tabla siguiente:
Producciones de trigo en kilogramos por parcela, utilizando seis fertilizantes en
seis aos diferentes
Aos
Fertilizantes
Inferencia Estadstica
3
Ciclo 2013-I I
6
Moiss E. Armas
Pgina 71 de 85
F1
F2
F3
F4
F5
F6
C; 70
81
70
63
62
75
75
60
62
63
67
80
80
71
A;63
66
61
50
65
80
87
52
F; 48
75
43
56
72
79
85
80
56
85
72
73
76
59
Haga un diseo experimental, completando las celdas de la matriz, y evale sus resultados,
planteando correctamente sus contrastes de hiptesis, y asumiendo un riesgo de equivocarse del
5%. Considere que A, B,F, son las variedades de trigo, cuyas cosechas son las que figuran en
la tabla.
VI.
MODELOS DE REGRESIONES
A menudo existe la necesidad de estudiar la relacin entre dos variables, una dependiente y la otra
independiente; cuando se trata de encontrar esta relacin, se est en el caso de encontrar un modelo
de regresin que permita encontrar una funcin que permita relacionar estas dos variables; si la
variable dependiente solo depende de una sola variable independiente, se estar en el caso de un
modelo de regresin simple; si la variable dependiente est en funcin de ms de una variable
independiente, entonces se trata de encontrar un modelo de regresin mltiple; para el primer caso
se dice que yi = f(xi), y para el segundo caso, y i = f(x1, x2, x3, .., xn), donde los xi son las variables
independientes y los yi representan los valores reales para cada valor de la variable independiente.
De este modo, si se estuviera interesado en saber qu relacin existe entre el peso de las madres
gestantes y sus respectivos bebs; o qu relacin existe entre las notas obtenidas por los alumnos,
cuando dedican un determinado nmero de horas de estudio a la semana, se estara tratando de
encontrar un modelo de regresin simple, ya que el peso de las madres gestantes, depender del
peso de sus bebs al momento de nacer, por lo cual se dice que el peso de las madres gestantes, es
una funcin de los bebs al momento de nacer, o Peso i = yi = f(xi); de igual manera podra afirmarse
que las notas obtenidas por los alumnos, estarn en funcin a las horas dedicadas al estudio; esto es
Notasi = yi = f(hi).
En estas y cualesquiera de otras situaciones similares, se trata de encontrar una relacin entre la
variable dependiente y la variable independiente. Cuando la variable dependiente est relacionado
con cualquier elemento que perturbe a la variable independiente, se dice que la relacin es causal;
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 72 de 85
esto es que una variable independiente genera un efecto en la variable dependiente; si la variable
independiente est asociado al tiempo, la relacin se dice que es una serie de tiempo o y i = f(ti),
donde ti es la variable independiente tiempo.
Una idea aproximada de obtener una relacin causal o serie de tiempos entre las dos variables, es
construir un diagrama de puntos en el sistema de coordenadas cartesianas. En el eje X se anotarn
las ocurrencias de la variable independiente xi y en el eje Y, el valor de la variable dependiente y i para
a cada ocurrencia de xi; este sistema de representar los puntos de pares ordenados (x i , yi)para cada
observacin, se denota ploteo o construccin de su nube de puntos; la siguiente figura muestra estas
dos correspondencias.
Variable dependiente y
13
12
11
10
9
8
7
6
5
1
3
4
Variable independiente x
Fig.
Observando este grfico se estar interesado en encontrar una curva de tendencia permita explicar
tericamente el comportamiento de la variable dependiente; a simple vista, observando el
comportamiento de la distribucin de los puntos de la grfica, puede deducirse que una curva de
tendencia que podra explicar el comportamiento de ambas variables es una recta lineal de la forma
i = a + b*xi; esta recta podra obtenerse, tratando de que la mayor cantidad de puntos, estn lo ms
cerca posible a esta recta, de all podra obtenerse por extrapolacin el valor de a que le corresponde
a la intercepcin con el eje Y; b denota la pendiente de la recta estimada; haciendo estos ajustes se
puede obtener recta la ideal, que est lo ms prximo a todos estos puntos; por lo tanto para cada
valor observado yi habr un valor terico esperado i, ambos diferentes, tal como podra suceder en
la vida real; y por lo tanto yi = i + = a + b*xi + ; donde es el error de estimacin igual a la
diferencia de yi - i; cuanto ms pequeo sea esta diferencia, mejor explicar el comportamiento de
estas observaciones; lo ideal sera que todas estas diferencias sean iguales a cero; sin embargo en la
vida real es difcil concebir que esto suceda, porque es imposible concebir que un conjunto de
observaciones sigan exactamente un modelo terico.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 73 de 85
La diferencia entre las dos relaciones yi - i se denomina desviacin alrededor de la media, y se sabe
) = 0. El inters de
i=1
hacer esta sumatoria es obtener los coeficientes a y b, ya que determinndole se tendr la ecuacin
estimada i; sin embargo como se puede observar, desarrollando esta sumatoria no ser posible;
como el inters de que estas desviaciones sean lo ms pequeo posible, a fin de evitar esta
contradiccin de las sumatorias, se puede elevar la sumatoria al cuadrado y la relacin de igualdad
)2 = 0; reemplazando por el
i=1
(Y i i )
equivalente de i, se obtiene:
(Y iabx i)2
i=1
i=1
estimada i solo depender de a y b, y como debe ser el que proporciona los errores mnimos, se
deriva parcialmente respecto a y b, igualando ambas ecuaciones a cero; se resuelve ambas
ecuaciones y se obtiene los coeficientes deseados:
n
n x i y i x i y i
b=
i=1
i=1
i=1
ya=
n x i ( x i )
2
i=1
i=1
i=1
y ib x i
n
i =1
De esta manera, un coeficiente positivo de b indicar que a medida que xi aumenta yi tambin
aumentar, y un coeficiente negativo de b indicar que a medida que xi aumenta, yi disminuir; el
valor de a indicar el punto donde se intercepta con el eje Y.
Ejemplo 6.1 Considere el caso de que se asuma que el rendimiento acadmico de los alumnos,
estar asociado al nmero de horas dedicadas al estudio semanalmente; en este sentido se han
hecho las averiguaciones con una muestra de alumnos seleccionados al azar, cuyos resultados se
muestran en la siguiente tabla:
Horas/estudi
o
Promedio
acadmico
25
20
22
30
31
36
40
18
22
15
10
21
12
11
12
15
16
14
18
10
10
10
Construyendo su nube de puntos de estas dos relaciones se obtiene la figura que muestra su
comportamiento; tambin se ajusta una recta lineal de la forma i = a + b*xi que permita explicar el
comportamiento terico de estas observaciones:
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
.1
1
7
5
0
.1
5
0
.1
2
5
0
0
.7
S
q
r
l
i
n
e
a
l
=
0
.
8
6
9
.5
01
0
.1
5
.02
0
.H
5
.0
3
0
.3
5
.04
0
.
o
ra
s
e
t2u
d
io
/s
e
m
a
n
NotaFinl
Pgina 74 de 85
__
Fig.
Calculando los coeficientes a y b segn las frmulas deducidas, la ecuacin de la recta de regresin
estar expresada por i = 3,398 + 0,353*xi.
De acuerdo a lo planteado, se est aceptando que esta recta obtenida est estimando correctamente
las observaciones registradas, lo cual podra no ser siempre correcta; entonces surge el problema de
determinar en qu medida podra ser aceptada como vlida para poder implementarlo? Un criterio
que permite determinarlo su aceptacin es estudiar el grado de correlacin que existe entre las dos
variables, y esto se consigue con su coeficiente de correlacin; este coeficiente permite apreciar en
qu proporcin las dos variables van correlacionadas, es decir si xi aumenta, tambin yi debe
aumentar, o tambin si xi aumenta yi debe disminuir. El coeficiente de correlacin R se determina del
siguiente modo:
n
n x i yi x i y i
i=1
R=
i=1
i=1
n x i2( xi ) n y i2( y i)
i=1
i=1
i=1
i=1
Ciclo 2013-I I
Moiss E. Armas
Pgina 75 de 85
de correlacin de R = 0, significa que no existe ninguna correlacin entre x i y yi; es decir que nada
tiene que ver en que xi aumente e yi aumente o disminuya; en este sentido, cuanto ms se aproxime
el coeficiente de correlacin R a 1 -1, mejor ser la ecuacin de regresin; y al revs, cuando ms
se aproxime este coeficiente a cero, tendr menor valor la ecuacin de regresin. El coeficiente de
determinacin R2 mide el grado cohesin entre las dos variables x e y.
Retomando el ejemplo del caso tratado, se obtiene que R = 0,9391, lo cual significa que el 93,91% de
los valores de xi estn correlacionados con yi; es decir que efectivamente en el 93,91% de las horas
dedicadas al estudio, el rendimiento acadmico de los alumnos estarn influenciados por el estudio;
en cambio el coeficiente de determinacin R 2 = 0,869, explica que el 86,90 % del rendimiento
acadmico de los alumnos significa que se debe a las horas semanales dedicadas al estudio.
En los casos que la nube de puntos no es posible explicarlo mediante una ecuacin de regresin
lineal, habr que buscar otros modelos simples que permitan explicar el comportamiento de las
observaciones; la Figura muestra tres casos posibles que podran suceder al construir su nube de
puntos.
En el primer caso, una posible ecuacin que podra aproximarse puede ser de la forma potencial de
ecuacin i = a*xb, lo cual puede ser fcilmente puede ser llevado a la forma lineal, tomando
logaritmos: Ln i = Ln a + b*Ln(xi) y resolver como una ecuacin lineal; en la segunda figura la curva de
tendencia podra aproximarse a una forma exponencial de la forma i = a*bx; de igual manera esta
ecuacin puede ser linealizado tomando logaritmos: i = Ln(a) + x*Ln(b); el tercer caso, la curva de
tendencia puede aproximarse a una exponencial negativa o una hiperblica; si el caso fuese la
1
i
1600
16000
1400
14000
1200
12000
1000
10000
800
8000
600
6000
400
4000
200
2000
y3
15000
y2
y1
= a + b* x.
5000
0
0
10
20
30
x1
40
50
60
10000
0
0
10
20
30
x1
40
50
60
10
20
30
x1
40
50
60
Ciclo 2013-I I
Moiss E. Armas
Pgina 76 de 85
ANOVA
Suma de
gl
Media
cuadrados
Regresin
Residual
Total
Sig.
cuadrtica
103.343
103.343
15.574
10
1.557
118.917
11
66.356
.000
Ejemplo 6.2 Considere que una empresa est interesado en conocer la relacin existente entre los
gastos en publicidad y los ingresos obtenidos, por ventas de laptop; para ello la tabla siguiente
muestra el comportamiento de estas dos variables.
Tabla 6.2
Ingresos en Nuevos Soles por ventas de Laptop,
segn gastos desarrollados en publicidad
Gastos en Publicidad
X
2560
3201
4500
4800
5238
5493
6394
6521
7368
8891
Ciclo 2013-I I
Moiss E. Armas
l40.0o
M
o
d
e
d
e
rg
e
s
i
n
lie
a
lp
ra
lIn
e
c
a
s
o
d
e
I
n
g
r
e
s
o
m
o
n
e
t
a
r
i
o
s
v
e
r
s
u
g
a
s
t
o
d
s
o
d
p
u
b
l
i
c
d
a
g
rS
/
Pgina 77 de 85
3
0.0
2
0.0
S
q
r
l
i
n
e
a
l
=
0
.
8
2
1
0.02
0
.04
0
.0
0
.0
G
a
s
to
e
n
p
u
b
li6c
d
a
e
n
S
/80.0
La siguiente tabla proporciona sus coeficientes de correlacin y determinacin:
Resumen del modelo
R cuadrado
R cuadrado
corregida
.939
.882
.868
La variable independiente es Publicidad.
R
Error tpico de
la estimacin
3494.969
Coeficientes no
estandarizados
Publicidad
(Constante)
B
4.761
-437.653
Error tpico
.615
3555.376
Beta
.939
t
7.745
-.123
Sig.
.000
.905
Como solo se escogi la opcin modelo de regresin lineal el modelo estimado tiene como ecuacin
i = a + b*xi, entonces a = -437,653 y el coeficiente b = 4,761, por lo tanto la ecuacin requerida ser
i = -437,653 + 4,761*xi.
La siguiente tabla muestra su anlisis de varianza:
ANOVA
Regresin
Residual
Suma de
cuadrados
732671495.788
97718479.113
Total
830389974.901
La variable independiente es Publicidad.
Inferencia Estadstica
gl
1
8
Media cuadrtica
732671495.788
12214809.889
F
59.982
Sig.
.000
Ciclo 2013-I I
Moiss E. Armas
Pgina 78 de 85
En este caso, su Fr = 59,982, el cual contrastado con el Fc(0,005, 1,8) = 5,12, puede apreciarse que el
modelo es vlido.
De igual modo, de la ventana Estimacin curvilnea, se pueden escoger otras opciones de regresin
como: Cuadrtico, Cbico, Logartmico, Crecimiento, Inverso, Exponencial, etc. A manera de prueba
seleccione la opcin Cbico y podr obtener los principales resultados:
La tabla muestra sus coeficientes de correlacin y coeficientes de determinacin:
Coeficientes de regresin y determinacin:
Resumen del modelo
R cuadrado
R cuadrado
corregida
.967
.935
.903
La variable independiente es Publicidad.
R
Error tpico de
la estimacin
2997.256
Tabla de anlisis de varianza, donde se indica que debe aceptarse el modelo de regresin, ya que Fr
es mayor que Fc.
ANOVA
Suma de
cuadrados
gl
Regresin
776488721.
3
786
Residual
53901253.1
6
14
Total
830389974.
9
901
La variable independiente es Publicidad.
Media
cuadrtica
258829573.
929
8983542.18
6
F
28.812
Sig.
.001
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
In
g
re
s
oO
b
s
e
ro
v
a
d
C
ic
4
0.0
3
0.0
2
0.0
1
0.0
2
0
.04
0
.0P
6
0
.08
0
.0
u
b
lic
d
a
Pgina 79 de 85
__
Coeficientes
estandarizado
s
Coeficientes no
estandarizados
Publicidad
Publicidad ** 2
B
-4.492
.002
Publicidad ** 3
(Constante)
Error tpico
14.691
.003
Beta
-.886
5.225
-1.63E-007
.000
-3.511
9057.332
24138.905
t
-.306
.842
Sig.
.770
.432
-1.025
.345
.375
.720
Ejemplo 6.3 Una empresa observa que los costos totales de llevar inventarios de un determinado
producto estn relacionados de acuerdo a la cantidad que ordena comprar, cada vez que los
requerimientos as los exigen; los costos de acuerdo a estos pedidos se muestran en la siguiente
tabla:
Cantidad de
producto solicitado
en unid.
Costo total de
llevar inventarios
en S/
200
350
460
570
602
13850.0
9387.5
8353.3
7983.6
7948.5
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 80 de 85
625
640
800
900
1200
1400
1800
2130
7938.3
7937.5
8150.0
8425.0
9600.0
10550.0
12650.0
14495.6
Esta curva sigue una forma cuadrtica de la forma: i = a + b*x + c*x2, por lo tanto se puede probar
este modelo para determinar los coeficientes a, b y c, con el SPSS.
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 81 de 85
Escogiendo la opcin Analizar Regresin Estimacin curvilnea, se define como variable
dependiente Costo y como variable independiente Cantidad; se escoge como modelo: Cuadrtico, y
para que muestre las constantes de la ecuacin, represente los modelo y ver la tabla ANVA, chequear
en sus respectivos casilleros; los resultados sern los siguientes:
Descripcin del modelo
Nombre del modelo
MOD_3
Variable dependiente
Costo
Ecuacin
Cuadrtico
Variable independiente
Cantidad
Constante
Incluidos
Sin especificar
grficos
Tolerancia para la entrada de trminos en ecuaciones
.0001
Coeficientes
Sig.
estandarizados
B
Cantidad
Error tpico
-9.902
2.848
-2.407
-3.477
.006
.005
.001
3.030
4.378
.001
12829.842
1337.613
9.592
.000
Cantidad ** 2
(Constante)
Beta
La ecuacin se obtiene activando la Ventana Propiedades o pulsando Crtl T, una vez estando en el
editor de grficos de la ecuacin; en este caso la ecuacin que se obtiene siguiendo esta instruccin
es:
i =12829.8421089082 + -9.902268589937924 * x + 0.005253131143189109 * x*x
La tabla ANVA muestra que el p sig. = 0,001 menor que = 0,05, por lo tanto es dable aceptar que el
modelo buscado se ajusta a las necesidades.
ANOVA
Suma de
gl
Media
cuadrados
Sig.
cuadrtica
Regresin
51436192.847
25718096.424
Residual
16277068.965
10
1627706.896
Total
67713261.812
12
15.800
.001
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas
Pgina 82 de 85
EJERCICIOS
6.1 Qu diferencias existen entre una relacin causal y una serie de tiempos? Mediante ejemplos,
regresin?
6.5 Se realiz un estudio sobre la cantidad de azcar convertida, en cierto proceso, a distintas
1,0 1,1
8,1 7,8
1,2
8,5
1,3
9,8
1,4
9,5
1,5
8,9
1,6
8,6
1,7
10,2
1,8
9,3
1,9
9,2
2,0
10,5
a)
b)
c)
d)
e)
40
20
25
20
30
50
40
20
385 400 395 365 475 440 490 420
50
40
25
50
560 525 480 510
x
1760
1652
1485
1390
1420
y
4010
3810
4500
3008
Ciclo 2013-I I
x
1665
1550
1700
1270
Moiss E. Armas
Pgina 83 de 85
a) Ajuste a una recta de regresin simple y valdelo, asumiendo un riesgo de equivocarse del
5%; luego estime un intervalo de confianza del 95%, para predecir el comportamiento del
empuje del motor en la medida que la temperatura vaya incrementndose.
b) Con el intervalo de confianza obtenido, estime el empuje del motor, cuando la temperatura sea
de 1300F.
6.8 La cantidad de poblacin de una determinada regin tuvo el siguiente comportamiento a travs de
los aos:
Ao
N habitantes
1950
23 723
1960
12 465
1970
7 654
1980
6 907
1990
4 632
2000
3 681
2010
2 637
1940
7 320
1950
8 654
1960
10 116
1970
13 189
1980
15 472
1990
21 682
2000
25 485
2010
28 626
125,3
98,2
201,4
147,3
145,9
% humedad
77,9
76,8
81,5
79,8
78,2
124,
7
78,3
112,2
120,4
161,2
178,9
159,5
77,5
77,0
80,1
80,2
79,9
145,
8
79,0
75,1
76,7
Ciclo 2013-I I
Moiss E. Armas
Pgina 84 de 85
b) Qu explica su coeficiente de determinacin? r2 = 89,13% (El 89,13% de los valores observados de y,
c)
quedan explicados dentro de la ecuacin de regresin) ; r = 94,41% (El 94,41% de las observaciones estn
correlacionados)
Valide esta curva de tendencia, considerando un riesgo de equivocarse del 1 %. R: el modelo se
acepta dado que Fr= 90,174.
d) Utilizando el SPSS, encuentre un modelo polinomial de grado 3 y confronte sus resultados con
el modelo lineal.
e) Establezca los intervalos de confianza al 95%, de modo que pueda establecerse un margen
de pronstico.
f) Estime el porcentaje de humedad que se alcanzara cuando la velocidad sea de 160.
g) Si el porcentaje de humedad encontrado fue de 90%, a qu velocidad de oxidacin se
espera estar trabajando?
Por problemas de extrema pobreza, la poblacin de un centro poblado ubicado en la sierra
norte de Lima, tiende a migrar hacia otras ciudades, donde supuestamente pueden mejorar sus
condiciones de vida; de este modo se ha podido comprobar que la poblacin local, solamente se
va quedando con personas mayores y con nios, segn se muestra en la siguiente tabla:
6.11
Ao de
censo
1950
1960
1970
1980
1990
2000
Poblacin
censada
21 602
18 574
16 105
11 638
9 244
9 058
6.12
Ciclo 2013-I I
Moiss E. Armas
Pgina 85 de 85
a) Formule un modelo de comportamiento polinmico de estas observaciones, validndole al
5%, y estime la cantidad de software que se espera ofrecer si la ganancia esperada fuera de
$ 350.
b) Explique el comportamiento de su coeficiente de determinacin y el su coeficiente de
correlacin.
c) Encuentre un intervalo de confianza del 95% de confianza para estimar los mrgenes de
ganancia, cuando la cantidad de software vendido, se incremente.
d) Podra aceptarse este modelo, dentro del marco de la racionalidad, como vlido, para
estimar futuras mrgenes de ganancia?
6.13
En determinado lugar del pas, a travs del tiempo, se ha observado que a medida que los
precios de las computadoras han ido disminuyendo, el volumen de ventas ha ido aumentando,
conforme se puede apreciar en la siguiente tabla.
Precio
de
las Cantidades de
computadoras en computadoras
miles de US $
vendidas
8,0
12
7,0
13
5,0
18
4,0
22
2,5
34
1,5
51
1,0
69
0,5
108
Formule y valide, a un nivel de significancia del 1%, un modelo matemtico del comportamiento
de ventas de las computadoras, y estime las cantidades que podran venderse si los precios
fueran de $ 0,40 y $ 10. Sug. Pruebe con el modelo hiperblico
6.14
Una empresa dedicada a la venta de refrescos de jugo de cocona, reporta que sus ventas
anuales durante los ltimos cuatro aos, variaron de acuerdo a la estacin climatolgica, segn
reporta en la siguiente tabla:
Venta en miles de botellas de refrescos de cocona de 500 ml., entre
los aos 2008 y 2011 en la provincia de Lima
AOS
VERANO
2008
2009
2010
2011
200
210
217
231
OTOO
182
193
208
219
INVIERNO
170
181
193
207
PRIMAVER
A
196
205
211
225
Pronostique las ventas de estas bebidas para los prximos cuatro aos.
6.15
Inferencia Estadstica
Ciclo 2013-I I
Moiss E. Armas