Académique Documents
Professionnel Documents
Culture Documents
1
Relaciones entre variables y regresión
El término regresión fue introducido por Galton en su libro
“Natural inheritance” (1889) refiriéndose a la “ley de la
regresión universal”:
“Cada peculiaridad en un hombre es compartida por sus
descendientes, pero en media, en un grado menor.”
Regresión a la media
Su trabajo se centraba en la descripción de los rasgos físicos de
los descendientes (una variable) a partir de los de sus padres (otra
variable).
Pearson (un amigo suyo) realizó un estudio con más de 1000 Sir Francis Galton
registros de grupos familiares observando una relación del tipo: •Primo de Darwin
Altura del hijo = 85cm + 0,5 altura del padre (aprox.) •Estadístico y aventurero
•Fundador (con otros) de
Conclusión: los padres muy altos tienen tendencia a tener hijos que la estadística moderna
heredan parte de esta altura, aunque tienen tendencia a acercarse para explicar las teorías
(regresar) a la media. Lo mismo puede decirse de los padres muy
bajos. de Darwin.
RELACIÓN FUNCIONAL
Y=f (X1, X2, … , Xn)
Ejemplo: La relación que existe entre el tiempo (Y) que tarda un
móvil en recorrer una distancia (X) a velocidad constante (v)
Y=X/v
NO EXISTE NINGUNA RELACIÓN
Ejemplo: La relación que existe entre el dinero (Y) que gana una
persona adulta mensualmente y su altura (X)
RELACIÓN ESTOCÁSTICA
Y = f(X) + error
f es una función de un tipo determinado (desconocida)
3
REGRESIÓN
yˆ b 0
y
y ˆ
modelo derara vez coincidirán por muy bueno que sea
regresión.
e
A la cantidad
el e b
y x
1
se le denomina residuo o error
yˆ 6
Método de Mínimos Cuadrados
yi ^i
2
Los errores a minimizar son las ei2
cantidades
y
Método de Mínimos Cuadrados
2 2 2
ei yi ˆyi yi b0 b1 xi
n n n
i1
i1
i1
Para minimizar se deriva con respecto a ambas (b y b ) e
0 1
igualando a cero.
y b0n b1 xi
i
i1
0 b0 y
i1
b1x
Mediante la segunda ecuación normal,
n n n
yi xi b0 xi b1 x 0 2
i
i i i
1 1 1
Método de Mínimos
Cuadrados
y sustituyendo, se obtiene que
n n n
n xi y i - xi S
b1 = i=1 i=1 i=1 r SY
-
n n 2
yi n 2
X
1 x i i=1 x i
i=
La constante b0 de regresión indica el valor pronosticado de Y
cuando X es cero.
El coeficiente de regresión b1 representa la cantidad de cambio
(aumento o disminución) que pronosticaríamos en Y para un
aumento de una unidad en X.
Un signo negativo en el coeficiente b1 nos indica que a medida que
aumenta X, disminuye Y. Gráficamente, b1 es la pendiente de la
línea de regresión.
yˆ b0 b1x
Se obtiene además unas ventajas “de
regalo”
El error residual medio es nulo
La varianza del error residual es
Errores de
mínima para dicha estimación. predicción
Traducido: En término medio no nos Y
equivocamos. Cualquier otra estimación (residuos)
que no cometa error en término medio, si
es de tipo lineal, será peor por presentar
mayor variabilidad con respecto al error
medio (que es cero).
Cuanto menos
dispersos sean los
residuos, mejor será
la bondad del
ajuste.
10
SUPUESTOS
1. X no es una variable aleatoria.
2. Para cada valor de X hay una
distribución de probabilidad de Y.
Se supone que cada una de estas
distribuciones es normal.
SUPUESTOS
e1e2 yy12y
2
E Y Y 1
y
en yn
yn
BONDAD DE AJUSTE
E pequeña
E debe ser una variable cuya media debe ser 0, y la varianza S 2
en comparación con S.
Y 2
H0 : b0 0 H 0 : b1 0
H 1 : b0 1 1
H :b
0 0
PRUEBA DE HIPÓTESIS PARA
Asociación no es sinónimo de
causalidad.
Prueba de hipótesis para “medir la
intensidad de la asociación
observada entre dos variables
cualesquiera”.
H0 : XY 0
H 1 : XY
0
Otros modelos de regresión
¿recta o
Se pueden considerar otros parábola?
tipos de modelos, en función del
aspecto que presente el
diagrama de dispersión
(regresión no lineal)
Incluso se puede considerar el 140 150 160 170 180 190 200
que una variable dependa de
varias (regresión múltiple). ¿recta o cúbica?
17
Vehículos
18
Se realizó una encuesta en
diferentes ciudades importantes de
un país para relacionar el grado de
contaminación ambiental (x) en
imecas con el porcentaje de
población afectado de las vías
respiratorias (y), la cual se muestra
en la siguiente tabla: