Vous êtes sur la page 1sur 13

SECCIN I

CENTRO DE INVESTIGACIONES DE INGENIERA FACULTAD DE INGENIERA ESCUELA DE CIENCIAS CURSO: TCNICAS DE INVESTIGACIN CAT: Inga. Pamela Vega

EJERCICIOS DE REGRESIN LINEAL Y CONCEPTOS FRMULAS: En el orden que aparecen las ecuaciones, as debe aplicarlas, esto es para facilitar el procedimiento que debe seguir en el clculo del coeficiente de Pearson y la recta de regresin MEDIA VARIANZA de X VARIANZA de Y DESVIACIN ESTNDAR de X y de Y COVARIANZA COEFICIENTE DE PEARSON o de correlacin Recta de regresin de X sobre Y Recta de regresin de Y sobre X

2 x


2 i

x
N

2 y

(y
N

2 i

= , =

xy

(x y ) x * y
i i

xy x y

xx

xy y y 2 y
xy x x 2 x

yy

ES FUNDAMENTAL LA INTERPRETACIN DE SUS RESULTADOS La relacin entre variables es Si el valor es positivo DIRECTA. En la grfica pendiente positiva. La relacin entre variables es INDIRECTA O Si el valor es negativo INVERSA. En la grfica pendiente negativa. Existe una relacin DIRECTA ENTRE LAS r>0 VARIABLES. Si es fuerte o dbil ver diagrama. NO EXISTE RELACIN ENTRE LAS VARIABLES, pero r=0 puede haber relaciones de algn otro tipo, donde se requieren otros anlisis estadsticos Existe una relacin INDIRECTA O r<0 INVERSA ENTRE LAS VARIABLES. Si es fuerte o dbil ver diagrama.

COVARIANZA

COVARIANZA

Coeficiente de Pearson o de correlacin

Coeficiente de Pearson o de correlacin

Coeficiente de Pearson o de correlacin

Ejemplo de INTERPRETACIN 01: Considere la siguiente grfica:

X
Para evaluar el GRADO DE DEPENDENCIA DE DOS VARIABLES se hace uso del COEFICIENTE DE PEARSON. En la grfica se trata de relacionar el PESO con la INTELIGENCIA. Se quiere saber si el peso influye en la inteligencia. CUL ES LA VAR. INDEPENDIENTE Y CUAL LA DEPENDIENTE? VAR INDEPENDIENTE = PESO VAR DEPENDIENTE = INTELIGENCIA Si un sujeto pesa ms se esperara que fuera ms inteligente, que sera una relacin directa, o bien, que si pesa menos, se esperara que fuera ms inteligente, lo que sera una relacin indirecta. PERO, OBSERVE LA GRFICA, LA DISPERSIN DE LOS PUNTOS NO FORMAN UNA LNEA RECTA, POR LO MENOS LOS PUNTOS NO SE ACERCAN A FORMAR UNA LINEA RECTA CON PENDIENTE POSITIVA O NEGATIVA, por lo tanto se concluye que NO HAY RELACIN ENTRE LAS DOS VARIBLES, NO HAY RELACIN ENTRE EL PESO Y LA INTELIGENCIA.

QUE UNA PERSONA SEA MS O MENOS GORDA, MS O MENOS FLACA, NO SIGNIFICA QUE SEA MS O MENOS INTELIGENTE Ejemplo de INTERPRETACIN 02: En una investigacin se trata de establecer si existe relacin entre el consumo de lea y el grado de deforestacin en dos regiones de Guatemala. La primera regin a evaluar es el departamento de Petn, donde los primeros anlisis de los datos arrojaron un coeficiente de Pearson r = 0.23, qu puede decir de este resultado? En primer lugar identificar las variables: VAR INDEP = CONSUMO DE LEA VAR DEPEN = GRADO DE DEFORESTACIN Un coeficiente de correlacin de 0.23 indica que existe una RELACIN DIRECTA PERO DBIL ENTRE EL CONSUMO DE LEA Y EL GRADO DE DEFORESTACIN que se da en el Depto. de Petn. Es decir, la gente del lugar hace uso de la lea para suplir sus necesidades energticas, pero su uso no incide, en la deforestacin que se sufre en Petn. Con ese valor NO SE PUEDE AFIRMAR QUE SEA LA GENTE QUE CONSUME LEA LA QUE HA DEFORESTADO PETN. Entonces se deben considerar otros factores, quiz la tala ilegal por ejemplo. La segunda regin es Cobn, donde el coeficiente de Pearson resulto ser r = 0.87 qu se puede decir de este otro valor, si se siguen evaluando las misma variables? En Cobn la situacin se muestra diferente, existe una RELACIN DIRECTA Y FUERTE ENTRE EL CONSUMO DE LEA Y LA DEFORESTACIN, por lo tanto, s es muy probable que la gente de Cobn que utiliza la lea para suplir sus necesidades energticas sea en parte responsable de la deforestacin de Cobn. Si bien se pueden considerar otros factores, en este caso el CONSUMO DE LEA si afecta directamente en la DEFORESTACIN DE COBN.

Note que el estudio de las mismas variables en diferentes lugares arrojaron valores distintos, en otros lugares es posible que no exista relacin alguna. Ejemplo de CLCULO E INTERPRETACIN 03: Se obtuvieron datos sobre RENDIEMIENTO ACADMICO e INTELIGENCIA de 10 estudiantes de nivel de diversificado de un instituto de la zona 18 de la Ciudad Capital, que se muestran en la siguiente tabla:
INTELIGENCIA 105 116 103 124 137 126 112 129 118 105 RENDIMIENTO 4 8 2 7 9 9 3 10 7 6

a) Identifique quin es la variable dependiente y cul la independiente b) cul es el tipo de relacin entre estas variables? c) cul podra ser el rendimiento de un estudiante si su nivel de

inteligencia es de 140? puede calcularse? SI / NO y por qu

SOLUCIN: a) Identificar variables El rendimiento depende de la inteligencia VAR INDEPENDIENTE: INTELIGENCIA VAR DEPENDIENTE: RENDIMIENTO Recuerde la ecuacin: y = mx + b Rendimiento = m ( inteligencia ) + b segn los niveles de inteligencia de los estudiantes as ser su rendimiento. Se quiere saber si en realidad se da alguna relacin entre estas dos variables.

b) Cul es el tipo de relacin entre las variables? Se pide que se encuentre si el rendimiento realmente depende de la inteligencia, para saber esto qu se necesita?, se necesita calcular el coeficiente de Pearson, y cmo se calcula? PASO 1: hacer una tabla con los valores de las variables y TRES COLUMNAS MS.
INTELIGENCIA RENDIMIENTO Y X
105 116 103 124 137 126 112 129 118 105 X2 11025 13456 10609 15376 18769 15876 12544 16641 13924 11025 Y2 16 64 4 49 81 81 9 100 49 36 XY 420 928 206 868 1233 1134 336 1290 826 630

No. 1 2 3 4 5 6 7 8 9 10 sumatoria

4 8 2 7 9 9 3 10 7 6

1175

65

139245

489

7871

Usted debe calcular: X al cuadrado Y al cuadrado X por Y LUEGO SUME CADA COLUMNA Tambin sume la columna X y la columna Y PASO 2: CALCULAR MEDIAS ARITMTICAS PARA LAS DOS VARIABLES Media de X: se usa la frmula
=

Sustituyendo valores:
= 1175 = = 117.5 10

Media de Y: se usa la misma frmula pero con lo valores de la columna de la variable Y


= 65 = = 6.5 10

PASO 3: calcular las VARIANZAS DE LAS DOS VARIABLES Varianza de X Usando la frmula

2 x

x
N

2 i

Sustituyendo valores:
2

2 2

2 =

139245 117.52 10

2 = 13924.5 13806.25 2 = 118.25

Note que la varianza debe salir positiva, PORQUE SI SALE NEGATIVA NO PODRA CALCULAR LA DESVIACIN ESTNDAR. (raz de un nmero negativo) NO OLVIDE ELEVAR AL CUADRADO LA MEDIA, DE LO CONTRARIO NO OBTENDRA DATOS CORRECTOS.

Varianza de Y, con la misma frmula pero para la columna de Y

2 2 489 6.52 10

2 =

2 = 48.9 42.25 2 = 6.65

PASO 4: ya tiene la varianza ahora sacando la raz a las mismas obtiene la DESVIACIN ESTANDAR PARA CADA VARIABLE DESVIACIN ESTNDAR para X: =
2 = 118.25

= 10.8743 DESVIACIN ESTNDAR para Y: =


2 = 6.65

= 2.5788 Recuerde que se quiere encontrar la relacin entre el rendimiento y la inteligencia, por lo que falta realizar algunos clculos ms

PASO 5: Calcular COVARIANZA Se usa la frmula:


xy
i i

(x y ) x * y
N

Sustituyendo valores = =

7871 117.5 6.5 10

= 787.1 763.75 = 23.35 TABLA RESUMEN DE DATOS OBTENIDOS MEDIA DE X 117.5 MEDIA DE Y 6.5 VARIANZA DE X 118.25 VARIANZA DE Y 6.65 DESVIACIN ESTNDAR DE X 10.8743 DESVIACIN ESTNDAR DE Y 2.5788 COVARIANZA 23.35 LA COVARIANZA ES POSITIVA por lo tanto la CORRELACIN ES DIRECTA o POSITIVA pero no se sabe si es fuerte, dbil o nula. Para eso se tiene que calcular ahora el COEFICIENTE DE PEARSON PASO 6: calculo de coeficiente de PEARSON O DE CORRELACIN Con la frmula
r

xy x y

Sustituyendo los valores de la covarianza y las desviaciones estndar de x y de y =

23.35 10.8743 2.5788 = 0.8323

SI LA COVARIANZA ES POSITIVA EL COEFICIENTE SER POSITIVO Del diagrama

r = 0.83 la relacin entre el RENDIMIENTO y la INTELIGENCIA es una relacin DIRECTA POSITIVA y FUERTE YA QUE EL COEFICIENTE TIENE UN VALOR DE 0.83, Esta es la respuesta al inciso b) donde se le pide que encuentre la relacin entre las mismas.

Calcule ahora cul sera el rendimiento de un estudiante si tiene un valor de inteligencia (CI) de 140? Recuerde la ecuacin: y = mx + b Rendimiento = m (inteligencia) + b Ahora, se tiene que encontrar una ecuacin para sustituir el valor de inteligencia de 140 Y = rendimiento, es lo que se quiere calcular, NO SE CONOCE X = inteligencia, este valor SE CONOCE es 140 Empleando la frmula:
yy

xy x x 2 x

Sustituyendo valores qu valores necesita para sustituir en la frmula? COVARIANZA VARIANZA DE X MEDIA DE Y MEDIA DE X = . =

. . .

MULTIPLICANDO

. = . . . = . .

SIMPLIFICANDO

= . .

ESTA YA ES LA ECUACIN, Cuando se le pide encontrar la ecuacin de la recta de Y sobre X as es como debe dejar la respuesta AHORA Cuando le piden hacer un clculo sustituye el valor que le piden como: x = 140 el rendimiento entonces ser = . . = . . = . ADVERTENCIA!! SI LA RESPUESTA LA DEJA SLO CON 10.95 NO SIGNIFICA NADA, DEBE SABER QU SIGNIFICA Para un estudiante con 140 de CI se espera que tenga un rendimiento de 10.95, aprox 11 puntos.