Vous êtes sur la page 1sur 8

UNIVERSIDAD DIEGO PORTALES Anlisis de Informacin Empresarial Profesora: Sara Arancibia Carvajal Ayudante: Ricardo Hernndez Alderete Segundo

Semestre 2010 Ayudanta N 7 Fuente: Los100mejorescolegios.sav La Universidad est completamente convencida de que uno de los factores que ms interesa a los apoderados al momento de decidir en qu colegio postula a sus hijos es el puntaje promedio de la PSU obtenido el ao anterior. Adems, en base a una encuesta realizada a profesores de diferentes tipos de instituciones, se ha llegado a una creencia comn de que el nmero promedio de alumnos por profesor incide directamente en los resultados de los alumnos. 1.- Verificar la existencia de una correlacin significativa entre el puntaje promedio obtenido en la PSU y el nmero promedio de alumnos por profesor. En caso de que exista la correlacin, realizar el correspondiente diagrama de dispersin con la lnea de tendencia y mostrando la bondad de ajuste. Comentar lo ms relevante. COMPUTE alumprof=alu_tot / prof_tot. VARIABLE LABELS alumprof 'alumnos por profesor'. EXECUTE.
Luego, y debido a que ambas variables corresponden a variables cuantitativas, se debe realizar un test de correlaciones de Pearson para verificar si es que existe alguna relacin entre esas variables: CORRELATIONS /VARIABLES=psu2003 alumprof /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE. H0: Las variables NO estn correlacionadas. H1: Las variables estn correlacionadas.

Dado que la significancia es 0,000 existe evidencia para rechazar la hiptesis nula, es decir, las variables se encuentran correlaciondas. Por otra parte se aprecia que la relacin entre el nmero promedio de alumnos por profesor y el puntaje promedio de la PSU 2003 tienen una relacin inversa y de una magnitud media-alta. El diagrama de dispersin que se genera de estas dos variables es el siguiente: GRAPH /SCATTERPLOT(BIVAR)=alumprof WITH psu2003 /MISSING=LISTWISE.

Por medio del diagrama anterior se observa una asociacin lineal negativa, mientras que la bondad de ajuste del modelo llega a un 56,5% 2.- Determinar el modelo de regresin lineal correspondiente, interpretando el coeficiente de correlacin R, coeficiente de determinacin R2 (bondad de ajuste) y la pendiente. Adems, verifique que todos los coeficientes son significativos para el modelo de regresin lineal. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT psu2003 /METHOD=ENTER alumprof /SCATTERPLOT=(*ZRESID ,*ZPRED) /RESIDUALS NORM(ZRESID) /SAVE ZRESID.

El coeficiente de correlacin R (0,752) indica la existencia de una relacin media-alta. Por otra parte la bondad de ajuste (coeficiente de determinacin) se encuentra en un 56,5% indicando que la variable de alumnos por profesor explican en un 56,5% la variabilidad de la variable puntaje promedio obtenido en la PSU.

H0: No existe relacin entre la variable dependiente y la independiente. H1: Existe relacin entre la variable dependiente y la independiente. Como la significancia es 0,000, existe evidencia para rechazar la hiptesis nula y s existe relacin entre la variable dependiente y la independiente.

i)

H0: 0 = 0 H1: 0 0

ii)

H0: 1 = 0 H1: 1 0

o
ii) H0: i = 0

H1: i 0

i = 1, 2

Al observar la significancia de los coeficientes, se encuentran valores inferiores a 0,05, por lo tanto los coeficientes son distintos a cero y se plantea la siguiente ecuacin:
Y = 707,592 5,065 X

Donde: Y: Puntaje promedio de la PSU

X: Nmero promedio de alumnos por profesor. La pendiente indica que por el aumento en promedio de un alumno por cada profesor el puntaje promedio que se obtiene en promedio de la PSU desciende en 5,065 puntos.

3.- Verifique que se cumplan los supuestos de homocedasticidad y normalidad de los residuos. La homocedasticidad de los residuos se puede dilucidar por medio del siguiente grfico de dispersin:

Se puede apreciar que la nube de puntos no presenta ninguna tendencia en particular, y todos sus valores se encuentran entre -3 y 3, con los que se asume un comportamiento homocedstico. Luego la normalidad de los residuos se dilucida por medio del siguiente test o el siguiente grfico:

Del grfico se observa que en promedio la mayora de los puntos se encuentran sobre lnea lo que da un primer indico que los residuos distribuyen normal, pero para que esto quede demostrado se realiza la prueba de normalidad de los residuos. EXAMINE VARIABLES=ZRE_1 /PLOT BOXPLOT NPPLOT /COMPARE GROUP /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. H0: Los residuos distribuyen normal. H1: Los residuos no distribuyen normal.

Debido a que la cantidad de datos en estudio son 100, el estadstico de Kolmogorov- Smirnov es el adecuado para probar la normalidad de los residuos. Ya que el p-value (0,058) es mayor que el nivel de significancia por defecto, no existe evidencia para rechazar la hiptesis nula de cumplimiento de normalidad, validando el modelo de regresin lineal planteado con anterioridad. 4.- Construya la variable dummy Posee al menos cinco horas de preparacin semanal de PSU (Valores 1: Si; 0: No) e ingrsela al

modelo. Comente como varia la bondad de ajuste del modelo y determine las nuevas ecuaciones de regresin lineal. IF (hr_psu >= 5) dummypsu=1. IF (hr_psu < 5) dummypsu=0. VARIABLE LABELS dummypsu 'posee al menos 5 horas de preparacin para la psu'. EXECUTE. Luego de ejecutada la sentencia anterior se deben colocar los valores 1 SI y 0 NO. Realizado lo anterior se debe ingresar esta nueva variable al modelo de regresin lineal, obteniendo los siguientes resultados: REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT psu2003 /METHOD=ENTER alumprof dummypsu /SCATTERPLOT=(*ZRESID ,*ZPRED) /RESIDUALS NORM(ZRESID) /SAVE ZRESID.

Tanto la magnitud de la correlacin como la bondad de ajuste no presentan cambios considerables frente al caso anterior. La tabla ANOVA reafirma la existencia de una correlacin entre la variable dependiente con las variables independientes. Sin embargo, en la tabla de coeficientes se aprecia que la ultima variable ingresada al modelo no es significativa al mismo, por lo que no genera un cambio sustancial al modelo planteado con anterioridad. Ecuacin:
Y = 707,592 5,065 X + 11,157*Dummy

Donde: Y: Puntaje promedio de la PSU X: Nmero promedio de alumnos por profesor. Dummy: toma valor 1 si estudia al menso 5 horas y valor 0 en caso contrario. Ecuacin si estudia al menos 5 horas (interpretar nueva pendiente):
Y = 718,749 5,065 X

Y: Puntaje promedio de la PSU X: Nmero promedio de alumnos por profesor. Ecuacin si estudia menos de 5 horas:
Y = 707,592 5,065 X

Y: Puntaje promedio de la PSU X: Nmero promedio de alumnos por profesor. Si piden grfico de dispersin se entrega lo siguiente: GRAPH /SCATTERPLOT(BIVAR)=alumprof WITH psu2003 BY dummypsu /MISSING=LISTWISE.

Vous aimerez peut-être aussi