Académique Documents
Professionnel Documents
Culture Documents
TABLAS UNILATERALES
1. Una vía rápida en una ciudad, con cuatro carriles en cada dirección, fue estudiada para
ver si los conductores prefieren viajar en los carriles interiores. Se observaron un total de
1000 automóviles durante el intenso tránsito de la hora pico por la mañana y se registraron
sus carriles respectivos. Los resultados se muestran en la siguiente tabla. ¿Los datos
presentan suficiente evidencia para indicar que algunos carriles se prefieren a otros?
(Pruebe la hipótesis de que 𝑝1 = 𝑝2 = 𝑝3 = 𝑝4 = 1/4, usando 𝛼 = .05. )
Carril 1 2 3 4
Cantidad 294 276 238 192
2. ¿Odia usted los lunes? Investigadores en Alemania han dado otra razón para hacerlo:
concluyeron que el riesgo de ataque al corazón en un lunes, para una persona que trabaja,
puede ser hasta 50% mayor que en cualquier otro día. Los investigadores registraron
ataques al corazón y paros cardiacos en un periodo de 5 años entre 330 000 personas que
vivían cerca de Augsberg, Alemania. En un intento por verificar lo dicho por el
investigador, se encuestaron 200 trabajadores que habían tenido ataques al corazón
recientemente. El día en el que ocurrieron sus ataques al corazón aparecen en la tabla
siguiente:
¿Estos datos presentan suficiente evidencia para indicar que hay una diferencia en los
porcentajes de ataques al corazón que ocurren en diferentes días de la semana? Pruebe
usando 𝛼 = .05.
A B AB O
89 18 12 81
¿Hay suficiente evidencia, en el nivel de significancia .05 para afirmar que las
proporciones difieren de los valores históricos?
4. Un sistema de apoyo para decisiones (DSS, decision support system) es un sistema
computarizado diseñado para facilitar el análisis y gestión de conjuntos de datos grandes.
Idealmente, un DSS deberá incluir 4 componente: (1) un sistema de extracción de datos,
(2) una organización de base de datos relacional, (3) modelos de análisis y (4) un dialogo
interactivo, amable con el usuario, entre éste y el sistema. Una dependencia estatal de
autopistas instaló hace poco un DSS para coadyuvar al manejo de datos sobre licitaciones
por contratos de construcción de carreteras. Como parte de un autoexamen, la
dependencia seleccionó 151 de los problemas más recientes que podría achacarse
directamente al DSS y los calificó según el componente en el que se originaron. ¿Se puede
concluir de los datos de la tabla que las proporciones de problemas son diferentes para al
menos dos de los 4 componente del DSS? Pruebe con 𝛼 = .05
Componente 1 2 3 4
Número de 31 28 45 47
problemas
5. Imagine que las suposiciones asociadas con un experimento multinomial están todas
satisfechas. Entonces cada una de las ni, i = 1, 2, . . . , k, tienen una distribución binomial
con parámetros n y pi. Además, Cov (ni, nj) = −npi pj si i ≠ j.
a. ¿Cuál es E (ni − nj)?
b. Consulte el inciso a. Proporcione un estimador insesgado para pi − pj .
c. Demuestre que V(ni − nj) = n[pi (1 − pi ) + pj (1 − pj ) +2pi pj ].
d. Consulte el inciso c. ¿Cuál es la varianza del estimador insesgado que se dio en el
inciso b?
TABLAS DE CONTINGENCIA
¿Hay suficiente evidencia para indicar que si el paciente de un ataque al corazón sufre o
no complicaciones depende del resultado del ECG inicial? Pruebe usando 𝛼 = .05.
7. Joseph Jacobson y Diane Wille realizaron un estudio para determinar el efecto del
cuidado temprano de niños con patrones de apego entre hijo y madre.5 En el estudio, 93
infantes fueron clasificados como “seguro” o “ansioso” usando el paradigma Ainsworth
de situación extraña. Además, los infantes fueron clasificados de acuerdo con el número
promedio de horas por semana que recibían cuidado. Los datos aparecen en la siguiente
tabla:
Horas en cuidados de Infantes
Patrón de Bajo (0 - 3 horas) Moderado (4 - 19 Alto (20 - 54
afecto horas) horas)
Seguro 24 35 5
Ansioso 11 10 8
¿Los datos indican dependencia entre patrones de apego y el número de horas de atención
al niño? Pruebe usando 𝛼 = .05.
8. El empleo de lenguajes de alto nivel para programar computadoras (por ejemplo, Fortran,
Cobol, Algol y Pascal) con microprocesadores y minicomputadoras se ha incrementado
drásticamente en los últimos años. Esto ha hecho crecer la necesidad de contar con nuevos
y mejores métodos para evaluar el rendimiento. En un estudio, un investigador desarrolló
un sistema de medición para evaluar dos lenguajes de programación de alto nivel, Algol
y Pascal. Los resultados informados incluyen una distribución de la frecuencia de
ocurrencia relativa de los diferentes tipos de enunciados que se utilizan en programas
típicos escritos en Algol y Pascal del mismo tamaño aproximadamente. Los porcentajes
informados se usaron para tabular la información como sigue:
Algol Pascal
IF 125 2045
FOR 968 350
Tipos de E/S 135 1847
enunciado Asignación 8923 4763
Otro 261 465
TOTALES 10412 9470
a. Suponiendo conteos marginales fijos para los dos lenguajes de programación, realice
una prueba para determinar si los porcentajes de los diferentes tipos de enunciados
de programación difieren para los lenguajes. Prueba con 𝛼 = .05
b. Establezca un intervalo de confianza de 95% para la diferencia en los porcentajes de
enunciados de asignación empleados en los dos lenguajes
10. Los ingenieros de video han inventado un método nuevo para acortar el tiempo requerido
para transmitir un mensaje comercial por televisión. Esta técnica, llamada compresión en
tiempo, ha permitido a quienes utilizan la publicidad por televisión reducir el alto costo
de dicha publicidad. Sin embargo, ¿son efectivos los mensajes más cortos? A fin de
responder esta pregunta, 200 estudiantes universitarios se dividieron aleatoriamente en 3
grupos. El primer grupo (57 estudiantes) vio una grabación de un programa televisivo
que incluía un mensaje comercial de 30 segundos; el segundo grupo (74 estudiantes) vio
la misma grabación pero con la versión del mensaje comercial comprimida a 24 segundos;
el tercer gripo (69 estudiantes) vio una versión del mensaje comercial comprimida a 20
segundos. Dos días después de ver el programa, se pidió a los estudiantes de los 3 grupos
citar el nombre de la marca publicitada. En la tabla se indican los números de estudiantes
que recordaron el nombre de la marca para cada uno de los 3 grupos.
TOTALES 57 74 69 200
a. ¿Los datos proporcionan pruebas suficientes (con 𝛼 = .05) de que las dos
direcciones de clasificación, tipo de mensaje comercial y retención del nombre de
marca, son dependientes? Interprete sus resultados
b. Establezca un intervalo de confianza de 95% para la diferencia entre las proporciones
de espectadores de mensajes comerciales normal y comprimido de 24 segundos que
recuerden la marca.
11. La industria de los viajes aéreos se ha preocupado desde hace mucho por el miedo a volar;
se estima que una de cada seis estadounidenses adultos tiene miedo a volar, A fin de
determinar si el miedo a volar es un problema importante para la industria de las líneas
aéreas, se realizó una serie de encuestas nacionales y de propósito especial. Una de las
preguntas buscaba determinar si la ansiedad generada por la idea de volar depende de la
experiencia de vuelo en aviones comerciales. Los respondedores se clasificaron en primer
término como no voladores (los que han volado por lo menos una vez), no voladores que
probablemente volarán (quienes nunca han volado pero consideran que seguramente
volarán en el futuro) y no voladores que probablemente no volarán (quienes nunca han
volado ni piensan volar en el futuro). En la tabla se muestran los números dentro de cada
grupo que caen en cada uno de 3 niveles de ansiedad ante la idea de volar.
Experiencia de vuelo
Voladores No voladores que No voladores que
piensan volar no piensan volar
Nivel de Sin ansiedad 1043 128 113
ansiedad Con ansiedad 189 46 6
Con miedo 140 47 141
a. ¿El nivel de ansiedad ante la idea de volar depende de la experiencia de vuelo?
Utilice 𝛼 = .05
b. Establezca un intervalo de confianza de 95% para la diferencia entre las proporciones
de voladores y no voladores que piensan volar que no sienten ansiedad ante la idea
de volar. Interprete el intervalo.
12. Suponga que las entradas en una tabla de contingencia que aparecen en el renglón i y la
columna j están denotadas por nij, para i = 1, 2, . . . , r y j = 1, 2, . . . , c; que los totales de
renglón y columna están denotados por ri, para i = 1, 2, . . . , r, y cj, para j = 1, 2, . . . , c;
y que el tamaño muestral total es n.
Demuestre que:
𝑐 𝑟 ̂ )]2
[𝑛𝑖𝑗 − 𝐸(𝑛
𝑐 𝑟
2
𝑖𝑗 𝑛𝑖𝑗 2
𝑋 = ∑∑ = 𝑛 (∑ ∑ − 1)
̂)
𝐸(𝑛 𝑟𝑖 𝑐𝑗
𝑗=1 𝑖=1 𝑖𝑗 𝑗=1 𝑖=1
Observe que esta fórmula proporciona una forma más eficiente desde el punto de vista
computacional para calcular el valor de 𝑋 2
BONDAD DE AJUSTE
13. Durante un periodo fijo se observó el número de accidentes sufridos por mecánicos, con
los resultados que se ven en la siguiente. Pruebe, con un nivel de significancia de 5%, la
hipótesis de que los datos provienen de una distribución de Poisson.
14. Los datos de la tabla siguiente son los conteos de frecuencia para 400 observaciones del
número de colonias bacterianas dentro del campo de un microscopio, usando muestras de
película de leche. ¿Hay suficiente evidencia para decir que los datos no se ajustan a la
distribución de Poisson? (Use 𝛼 = .05)
Número de Frecuencia de
colonias por Observación
campo
0 56
1 104
2 80
3 62
4 42
5 27
6 9
7 9
8 5
9 3
10 2
11 0
19 1
Total 400
15. Se lanzó mil veces 5 monedas y luego se registró las veces que salieron cara. ¿Hay
suficiente evidencia para decir que los datos se ajustan a la distribución Binomial? (Use
𝛼 = .05)
# de Caras Frecuencia de
Observación
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000