Vous êtes sur la page 1sur 3

FACULTAD DE CIENCIAS ECONÓMICAS

ESTADÍSTICA- SEGUNDO CUATRIMESTRE DE 2012


COMISIÓN 6/7 - TARDE

ACTIVIDAD TEÓRICA 3: REGRESIÓN Y CORRELACIÓN

ANÁLISIS DESCRIPTIVO

Para este análisis se tomaron las notas de los alumnos de la comisión 1 de Estadística del año 2009 que rindieron
un primer parcial, pero al no complacerles su resultado se presentaron a la instancia de recuperatorio, se arma el
cuadro de trabajo para un ajuste lineal y se obtienen algunas conclusiones.

CUADRO DE TRABAJO

Y x y
X
Notas Desvíos Desvíos 2 2
Notas x y x(.)y
Recup. notas Parcial notas Rec.
Parcial 1
Parcial 1 1 Parcial 1
2 2 -0,4118 -1,4706 0,1696 2,1626 0,6055
4 4 1,5882 0,5294 2,5225 0,2803 0,8408
2 5 -0,4118 1,5294 0,1696 2,3391 -0,6298
4 5 1,5882 1,5294 2,5225 2,3391 2,4291
2 1 -0,4118 -2,4706 0,1696 6,1038 1,0173
4 6 1,5882 2,5294 2,5225 6,3979 4,0173
4 4 1,5882 0,5294 2,5225 0,2803 0,8408
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
5 4 2,5882 0,5294 6,6990 0,2803 1,3702
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
1 2 -1,4118 -1,4706 1,9931 2,1626 2,0761
0 4 -2,4118 0,5294 5,8166 0,2803 -1,2768
1 2 -1,4118 -1,4706 1,9931 2,1626 2,0761
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
2 1 -0,4118 -2,4706 0,1696 6,1038 1,0173
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
2 1 -0,4118 -2,4706 0,1696 6,1038 1,0173
1 2 -1,4118 -1,4706 1,9931 2,1626 2,0761
4 5 1,5882 1,5294 2,5225 2,3391 2,4291
4 4 1,5882 0,5294 2,5225 0,2803 0,8408
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
2 5 -0,4118 1,5294 0,1696 2,3391 -0,6298
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
1 2 -1,4118 -1,4706 1,9931 2,1626 2,0761
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
5 6 2,5882 2,5294 6,6990 6,3979 6,5467
2 4 -0,4118 0,5294 0,1696 0,2803 -0,2180
2 1 -0,4118 -2,4706 0,1696 6,1038 1,0173
4 4 1,5882 0,5294 2,5225 0,2803 0,8408
2 2 -0,4118 -1,4706 0,1696 2,1626 0,6055
2 2 -0,4118 -1,4706 0,1696 2,1626 0,6055
SUMA 82 118 0 0 48,2353 66,4706 29,4118
Promedio 2,4118 3,4706

El primer paso de todo análisis de regresión y correlación es el gráfico de dispersión, mediante el cual se puede
visualizar la distribución de los datos, en este caso parecen estar levemente alineados mediante una recta con
pendiente positiva:

1
Diagrama de dispersión

Rec. Parcial 1
6
4
2
0
0 1 2 3 4 5 6
Parcial 1

Diagrama de dispersión

Determinación de los coeficientes de regresión:


n

∑x y i i
29.4118
b= i =1
n
= = 0.6098
48.2353
∑x
i =1
2
i

Interpretación: en promedio la nota del recuperatorio aumenta en 0.61 puntos por cada punto adicional del parcial
n

∑x y i i
29.4118
b= i =1
n
= = 0.4425
66.4706
∑y
i =1
2
i

Interpretación: en promedio la nota del parcial aumenta en 0.44 puntos por cada punto adicional del recuperatorio
del parcial 1.

Determinación de las rectas de regresión:


Primer recta:
ɵy = bx → Y − m = b ( X − m ) donde: a = bm + m
Y X X Y

ɵy = 0.6098 x → Y − 3.4706 = 0.6098 ( X − 2.4118 ) → Y = 0.6098 X − 0.6098 ⋅ 2.4118 + 3.4706

Y = 0.6098 X + 2
Segunda recta:
xɵ = b1 y → X − mX = b1 (Y − mY ) donde: a1 = b1mY + mX
xɵ = 0.4425 y → X − 2.4118 = 0.4425 (Y − 3.4706 ) → X = 0.4425Y − 0.4425 ⋅ 3.4706 + 2.4118

X = 0.4425Y + 0.8761
1
Determinación del coeficiente de correlación
r = b ⋅ b1 = 0.6098 ( ⋅) 0.4425 = 0.5194
Interpretación: significa que las notas del parcial y su recuperatorio tienen una correlación funcional directa
moderada, es decir a medida que crece el puntaje de las notas del parcial aumenta el puntaje de las notas del
recuperatorio pero no es moderadamente significativo.

Determinación del coeficiente de determinación


R 2 ó r 2 = b ⋅ b1 = 0.6098 ( ⋅) 0.4425 = 0.2698

1
Rango del coeficiente, de –1 correlación total negativa a 1 correlación total positiva, el 0 estaría indicando la falta
total de correlación. El signo que la raíz cuadrada lo aporta la covarianza, que se ve reflejada en los signos de los
coeficientes de regresión.

2
Interpretación: significa que el modelo predice resultados con un 26.98% de determinación, es decir el modelo
explica el 26.98% de las variaciones de las posibles determinaciones.
2
Determinación del coeficiente de indeterminación
(1 − r ) = 1 − 0.2698 = 0.7302
2

Interpretación: significa que el modelo tiene un 73.02% de indeterminación, es decir el modelo no explica o tiene
una aleatoriedad del 73.02% de las variaciones de las posibles determinaciones.

Una forma de corroborar estos valores es incorporando al diagrama de dispersión la línea de tendencia y el R
cuadrado, son dos opciones que aporte la graficación de series que permite la planilla de cálculo Excel.

En el siguiente gráfico se puede observar su determinación que coincide con la primer recta de regresión:

Análisis de RyC

8
Rec. Parcial 1

6
4
2 y = 0,6098x + 2
R2 = 0,2698
0
0 1 2 3 4 5 6
Parcial 1

Diagrama de dispersión Lineal (Diagrama de dispersión)

Si se intercambian las variables obtendremos los valores de la segunda recta de regresión:

Análisis de RyC

6
5 y = 0,4425x + 0,8761
Parcial 1

4
3 R 2 = 0,2698
2
1
0
0 1 2 3 4 5 6 7
Rec. Parcial 1

Diagrama de dispersión Lineal (Diagrama de dispersión)

2
2
También se puede calcular a partir de la varianza de Y y la de la recta: (1 − r ) = Sϕ
2 rectaY
2
Y

Vous aimerez peut-être aussi