Académique Documents
Professionnel Documents
Culture Documents
Analisis de Regresion
Y = f(x1,...,xn; θ1,...,θm)
donde:
Para elegir una relación funcional particular como la representativa de la población bajo
investigación, usualmente se procede:
Una vez decidido el tipo de función matemática que mejor se ajusta (o representa nuestro
concepto de la relación exacta que existe entre las variables) se presenta el problema de
elegir una expresión particular de esta familia de funciones; es decir, se ha postulado una
cierta función como término del verdadero estado en la población y ahora es necesario
estimar los parámetros de esta función (ajuste de curvas).
Como los valores de los parámetros no se pueden determinar sin errores por que los valores
observados de la variable dependiente no concuerdan con los valores esperados, entonces
la ecuación general replanteada, estadísticamente, sería:
Y = f(x1,...xn;θ1,...,θm) + ε
F. de Mendiburu
2
Cuando la relación funcional entre las variables dependiente (Y) e independiente (X) es una
línea recta, se tiene una regresión lineal simple, dada por la ecuación
Y = ßo + ß1X + ε
donde:
Terminologia:
Promedios
xi
= ∑y i ; x =∑ y
n n
(
SCY =∑ yi−y 2; ) (
SCX =∑ xi−x ) ; SPXY =∑(x − x)(y − y)
2
i i
F. de Mendiburu
3
Estimación de parámetros
Y = ßo + ß1X + ε
bo = y −b1x
b1= spxy scx
F. de Mendiburu
4
Si b1=0, se dice que no existe relación lineal entre las dos variables.
F. de Mendiburu
5
Los cálculos de regresión pueden ser vistos como un proceso de partición de la suma total
de cuadrados; así, gráficamente se tiene:
(y − y)= (y − y)+(y −y )
i i i i
Luego:
(
∑ yi−y ) = ∑(yi−y) +∑(yi−yi)
2 2 2
F. de Mendiburu
6
Suma de Cuadrados del Total (SCT), mide la dispersión (variación total) en los valores
observados de Y. Este término se utiliza para el cálculo de la variancia de la muestra.
Cuando cada partición se asocia a una porción correspondiente del total de grados de
libertad, la técnica es conocida cono analisis de variancia (ANVA), que generalmente se
presenta en un cuadro de la siguiente forma:
Total n-1 SC Y
Años (X) 0 1 2 3 4 5 6 7 8 9
Madera Aserrada 475.24 495.72 585.2 565.78 630.22 624.92 482.27 590.27 834.67
(Y) 489.25
Gl SC CM F F0.05 Pr>F
F. de Mendiburu
7
X = El periodo.
Intercepto = 467,42
Tasa = 24,42
Intervalos de Confianza
b1 - t0 Sb1 ≤ ß1 ≤ b1 + to Sb1
Con estos resultados se puede afirmar al 95% de confianza que la tasa de crecimiento en
madera aserrada es positiva y por lo menos se tendra un crecimiento de 3 mil metros cubicos
por año.
F. de Mendiburu
8
En función del modelo se puede hacer estimaciones para los siguientes años:
2000 711.7
2001 736.12
2002 760.55
Estas proyecciones son puntuales, en base al modelo; para año 2000, X=10, resulta una
producción de 711 mil m3 de madera aserrada.
Para obtener limites de confianza para estos valores predecidos, se debe determinar sus
desviaciones estandar correspondiente; utilice la siguiente formula:
1
( −x) 2
Prueba de Hipotesis
F. de Mendiburu
9
b) Cuando ß1 tiene un valor específico distinto de cero ß10; es decir, Hp: ß1=ß10. En
este caso, para la prueba de esta hipótesis se usa el estadístico t de Student. El valor
t calculado es hallado mediante la expresión: tc = (b1-ß10)/Sb1
Para el ejemplo planteado, se rechaza la hipotesis planteada, esto significa que existe una
relación lineal significativa del tiempo y la producción de madera aserrada total.
Analisis de Correlacion
El análisis de correlación emplea métodos para medir la significación del grado o intensidad
de asociación entre dos o más variables. El concepto de correlación está estrechamente
vinculado al concepto de regresión, pues, para que una ecuación de regresión sea razonable
los puntos muestrales deben estar ceñidos a la ecuación de regresión; además el coeficiente
de correlación debe ser:
-1 ≤ r ≤ 1.
Si r = -1, la asociación es perfecta pero inversa; es decir, a valores altos de una variable le
corresponde valores bajos a la otra variable, y viceversa.
r= SPXY
F. de Mendiburu
10
SCX.SCY
Para los datos de la producción de madera aserrada total entre los años 1990 a 1999, existe
una asociación de 0.68.
r= 2015,17 = 0.68
(105525,86)(82,5)
1 = SCR/SCT + SCE/SCT
R² = 1 - SCE/SCT = SCR/SCT
R² = SC regresion / SC total
Interpretación de R²:
Se interpreta como una medida de ajuste de los datos observados y proporciona el porcentaje
de la variación total explicada por la regresión.
Tambien, se puede obtener el R² ajustado que es la relacion entre cuadrados medios, asi:
F. de Mendiburu
11
Lo que se espera que ambos R², resulten similares, para dar una confianza al coeficiente de
determinación.
F. de Mendiburu