Vous êtes sur la page 1sur 3

Taller Modelo de Regresin Lineal

Estadstica II
Problema 1. El siguiente conjunto de datos era tomado sobre grupos de

trabajadoras de Inglaterra y Gals en el perodo de 1970-72. Cada grupo


est formado por trabajadores de la misma profesin (mdicos,
trabajadores textiles, decoradores,...etc,) y en cada uno de los
veinticinco grupos muestreados se han observado dos variables: el
ndice de estandarizado de consumo de cigarrillos (variable regresora x)
y el ndice de muertes por cncer de pulmn (variable dependiente y).
(Occupational mortality: the registar generals decennial supplement for
England and Wales, 1970-72, series Ds, n.1, London:HMSO,149).

1. Estudiar el modelo de regresin lineal del ndice de mortalidad


frente al ndice de fumadores interpretndolos parmetros
estimados.
2. Calcular la tabla ANOVA. Conclusiones.
3. Realice las pruebas de significancia de los parmetros estimados.
4. Determine el coeficiente de determinacin e interprete su valor.
5. Comprobar si se verifican las hiptesis del modelo.
x
77
137
117
94
116
102
111
93
88

y
84
116
123
128
155
101
118
113
104

x
102
91
104
107
112
113
110
125

y
88
104
129
86
96
144
139
113

x
133
115
105
87
91
100
76
66

y
146
128
115
79
85
120
60
51

Problema 2. En el archivo Problema-5-10 se encuentran datos relativos a

partidos de la liga ACB de baloncesto. Se desea estudiar si existe alguna


relacin lineal entre la variable, puntos por partido (PUNTPART) que es
capaz de anotar un jugador de baloncesto respecto a las siguientes
variables explicatorias:

La altura del jugador (ALTURA).


Los minutos que juega por partido (MINPART).
Los balones que pierde por partido (BPPART).
Las faltas personales cometidas por partido (FPPART).
El porcentaje en tiros de campo por partido (porcentaje obtenido de
los tiros de dos y tres puntos conseguidos e intentados) (POR_TC).

(Recogida de datos: Los datos para realizar la regresin se han obtenido


a partir de la Gua Oficial Liga 1989-1990, de la ACB (Asociacin de
Clubs de Baloncesto), para lo cual se han seleccionado 62 jugadores al
azar de entre el total.) En base a estos datos, se pide:
1. Ajustar un modelo de regresin a estos datos, sin excluir ninguna
variable e interpretar el resultado. Es el ajuste bueno?
2. Cree que pueda existir multicolinealidad en el modelo anterior?
3. Con el modelo anterior Cules son las observaciones atpicas y/o
influyentes?
4. Puede existir un modelo de regresin lineal ms adecuado segn
estos datos? Justificar la respuesta.
5. Analice los supuestos del modelo.
Problema 3. En el archivo Problema-5-14

se presentan datos de
contaminacin atmosfrica en 41 ciudades de EEUU relativos a los aos
1969-71. La variable de inters es Y =contenido deSO en el aire en
microgramos por metro cbico y se desea estudiar su relacin con seis
variables regresoras, dos relativas a ecologa humana y cuatro al clima.
Son las siguientes:
2

X =temperatura media anual en grados Farenheit.


1

X =nmero de fbricas con ms de 20 empleados


2

X =nmero de habitantes, en miles


3

X =Velocidad media del viento al ao en millas por hora


4

X =precipitacin media anual en litros por pulgada


5

X =nmero medio de das con lluvia al ao


6

El objetivo del estudio es encontrar un modelo de regresin mltiple que


explique adecuadamente el comportamiento de la variable Y, mediante
el proceso de seleccin de variables:
a) hacia adelante, mostrando todos los pasos del algoritmo.
b) hacia atrs, mostrando todos los pasos del algoritmo.
Del modelo resultante, realice prueba de significancia del modelo,
inferencia sobre los parmetros estimados, validacin de los supuestos
del modelo y determine la calidad de ajuste.