Vous êtes sur la page 1sur 4

2EP 1C 2017 Estadística General 2 página No 1

UNIVERSIDAD DE COSTA RICA - ESTADISTICA GRAL 2 (XS-277)


SEGUNDO EXAMEN PARCIAL (8 de Julio del 2017) (SOLUCION)
NOMBRE DEL ESTUDIANTE: __________________________________________________________________
CARNET: _______ GRUPO: ___ PROF: __________________________ Examen a lápiz o correcto blanco 
NOTA del 2EP:_________ NOTA FINAL: _________ Derecho examen ampliación  20/7/2017 5pm

INSTRUCCIONES:
No se admiten consultas al profesor, a menos que sea para aclarar el sentido de alguna pregunta. Todas las respuestas,
procedimientos y los cálculos que las respaldan deben quedar incluidos en este formulario. Este examen es a "libro cerrado", pero se
permite consultar las "Tablas Estadísticas". Se cuenta con un tiempo máximo de 2 horas para responder a todas las preguntas. No se
admiten reclamos, si utiliza en las respuestas del examen lápiz, corrector (líquido blanco) o tachaduras. No se permite el uso de
teléfonos celulares, beepers, tabletas, ni computadoras durante el examen. No es posible salir del aula durante la evaluación. Este
examen consta de cuatro ejercicios en cuatro páginas.

La accidentabilidad laboral ha disminuido en Costa Rica


Según un estudio del Consejo de Salud Ocupacional la cantidad de accidentes laborales por personas ocupadas se han reducido del
2012 al 2015 en Costa Rica.

1. En el estudio citado se analizó la cantidad de trabajadores asegurados que sufrieron accidentes en el año 2015. Los resultados
se presentan en el siguiente cuadro:
COSTA RICA: TRABAJADORES ASEGURADOS SEGUN SU ACTIVIDAD ECONOMICA
Y POR TENENCIA DE ACCIDENTES LABORALES EN EL 2015
(cifras en miles)
TRABAJADORES ASEGURADOS
ACTIVIDAD ECONOMICA TOTAL
Accidentados No accidentados
TOTAL 57 530 587
Comercio 21 335 356
Industria 15 113 128
Agricultura 21 82 103
Con base en la información presentada en el cuadro:
Verifique la hipótesis de que la cantidad de accidentes dependen de la actividad económica donde laboran los trabajadores asegurados.
Utilice un nivel de significancia del 5%, establezca las hipótesis, realice los cálculos respectivos y concluya en términos del problema
(25 puntos)

Ho: La cantidad de accidentes es independiente de la actividad económica donde laboran los trabajadores asegurados (2 punto)
H1: La cantidad de accidentes depende de la actividad económica donde laboran los trabajadores asegurados (2 punto)

= (21-34,57)2 /34,57 + (335-321,43)2 /321,43 + (15-12,43)2 /12,43 + (113-115,57)2 /115,57 + (21-10)2 /10 + (82-93)2 /93 = 19,88
(10 puntos)

(2 gl) 5% = 5,991 (4 puntos)

R/ Dado que 19,88 > 5,991 (1 punto) se rechaza Ho con  = 5% (3 puntos) y con ello existe evidencia para afirmar que la cantidad de
accidentes depende de la actividad económica donde laboran los trabajadores asegurados (3 puntos)
2EP 1C 2017 Estadística General 2 página No 2
2. Se desea verificar que existen diferencias entre los promedios de las incidencias laborales de cuatro actividades económicas
(agricultura, construcción, industria y trasporte). A continuación se presenta los resultados de MegaStat:
TABLA DE ANDEVA
Suma grados Cuadrado
Fuente Cuadrados libertad Medio Fc Valor P
Tratamientos 594,508 3 198,1693 16,85 0,000033
Error 188,140 16 11,7588
Total 782,648 19

Actividad
Económica muestra Promedio
Agricultura 5 23,72
Construcción 5 20,56
Industria 5 12,42
Transporte 5 10,66
Total 20 16,84

DIFERENCIAS DE PROMEDIOS
Transporte Industria Construcción Agricultura
Transporte
Industria 1,76
Construcción 9,90 8,14
Agricultura 13,06 11,30 3,16

DMS ---> 6,33


Para los resultados presentados:
a) Complete la tabla del ANDEVA (4 puntos)
b) Plantee las hipótesis respectivas y verifíquelas (utilizando el valor p o p value). Use un nivel de significancia del 1% y
concluya en términos del problema. (20 puntos)

Ho: μ1= μ2= μ3= μ4 (1 puntos)


H1: Al menos un par de promedios es diferente (1 puntos)

 = 0,01 (2 puntos)
|
 = 0,00003 (5 puntos) (en caso de utilizar Fc bajar 5 puntos)

Dado que | = 0,000033 <  = 0,01 se rechaza Ho (3 puntos)


Por tanto, con un nivel de significancia del 1% (2 puntos) existe evidencia (3 puntos) para afirmar que al menos un par de promedios de
las incidencias laborales de las cuatro actividades económicas es diferente (3 puntos)

En caso de no rechazar Ho toda la conclusión esta incorrecta


2EP 1C 2017 Estadística General 2 página No 3
c) Utilice las comparaciones de DMS de la salida de cómputo anterior e indique cuáles pares de promedios de las actividades
laborales son diferentes con α=1%? Justifique (6 puntos)

Las diferencias de pares de promedios que son diferentes son los siguientes:
Transporte vs construcción  9,9 > 6,33 (1,5 puntos)
Transporte vs agricultura  13,06 > 6,33 (1,5 puntos)
Industria vs construcción  8,14 > 6,33 (1,5 puntos)
Industria vs agricultura  11,3 > 6,33 (1,5 puntos)
Otra posibilidad seria que indiquen que las diferencias de los pares de promedios …. Son mayores a 6,2, o sea el DMS
Los que son menores a DMS no son diferentes y viceversa

3. Si en un análisis de variancia de dos vías (bloques) no se rechazan las hipótesis, cuál sería el paso a seguir? Justifique
(5 puntos)

En caso de no rechazar las hipótesis se debe regresar al ANDEVA de una vía (3 puntos), ya que los bloques no están aportando al diseño
(2 puntos)

4. Utilizando una muestra de 15 tipos de empresas se realizó un análisis para determinar si la cantidad de accidentes se
encuentra relacionadas con la cantidad de trabajadores por tipo de empresa. A continuación se presentan los resultados
obtenidos mediante el paquete de cómputo Excel (módulo de regresión):

Estadísticas de la regresión
Coeficiente de correlación 0,62136009
Error típico 2,53168449
Observaciones 15

Coeficientes Probabilidad
Intercepción 2,56455703 0,01462514
trabajadores 0,05073904 0,01341521

Con base en la información anterior y a la materia del curso responda lo siguiente:


2EP 1C 2017 Estadística General 2 página No 4
4.1 Verifique la hipótesis (utilizando el valor p) de que el coeficiente de regresión poblacional es mayor que cero. Utilice un nivel
de significancia del 5%, establezca las hipótesis y concluya en términos del problema (10 puntos)

Ho: β=0 (1 punto)


H1: β>0 (1 punto)
 = 0,05 (1 punto)
| = 0,0134 (2 puntos)  Si utiliza Tc (bajar 2 puntos)

Dado que | = 0,0134 <  = 0,05 se rechaza Ho (2 puntos)


Por tanto, con un nivel de significancia del 5% (1 punto) existe evidencia para afirmar que el coeficiente poblacional de regresión
(trabajadores vs accidentes en CR) es mayor que cero (2 puntos)
(en caso de omitir poblacional rebajar 1 punto)

4.2 Existe dentro de los pares de datos del modelo anterior, una empresa que contaba con 58,1 mil trabajadores y tuvieron 13,7 mil
accidentes (lo cual se puede observar en el gráfico anterior). ¿Mejorará el modelo de regresión planteado si se elimina ese par
ordenado? (4 puntos)
/_/ Si /_/No
Justifique:
Sí (1punto), porque el resto de pares ordenados estarían cerca de la línea de regresión y ello genera un mejor ajuste (3 puntos)

4.3 Interprete la bondad de ajuste en términos del problema (6 puntos)

El 39% (2 puntos) de la variabilidad de la cantidad de accidentes (2 puntos) se explican por su relación lineal con la cantidad de
trabajadores (2 puntos)

4.4 Indique e interprete el coeficiente de correlación en términos del problema (6 puntos)

r=0,6214 (1 punto)  Existe una asociación lineal, directa y moderada (3 puntos) entre la cantidad de trabajadores y los accidentes
laborales (2 puntos)

4.5 Calcule ¿Cuántos accidentes laborales se esperan para una empresa con 50 mil trabajadores? (6 puntos)

Y = 2,56 + 0,05 (50) = 5,06  R/ 5,06 miles de accidentes o 5006 accidentes


(3 puntos) (2 puntos) (1 punto)

4.6 Asuma que luego se generó otro modelo de regresión ingresando otra variable independiente (edad promedio de los
trabajadores). Es decir se tiene la variable dependiente: Cantidad de accidentes y las variables independientes: cantidad de
trabajadores y edad promedio de los mimos. Los resultados se procesaron en Excel y se presentan a continuación:

Estadísticas de la regresión
Coeficiente de determinación R^2 0,94770474
Error típico 0,46023024
Observaciones 13

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -2,21331271 0,79105969 -2,79790861 0,0188621
trabajadores 0,01636175 0,00532618 3,07194581 0,0118016
edad promedio 0,18122228 0,03074239 5,89486744 0,00015211
Con base en lo anterior, indique cuál modelo predice mejor la variable dependiente (cantidad de accidentes), el modelo del ejercicio
4.6 o el modelo del enunciado del ejercicio 4? Justifique (8 puntos)

El modelo que predice mejor la variable dependiente (cantidad de accidentes) es el del ejercicio 4.6 (2 puntos), ya que tiene una
bondad de ajuste (coeficiente de determinación) mayor (6 puntos)

Vous aimerez peut-être aussi