Vous êtes sur la page 1sur 13

Introduccin a la Regresin Mltiple

Ahora agregaremos unas nuevas herramientas a nuestra caja de estadstica.


Tomemos un momento para revisar lo que tenemos.
1. Coeficiente de Correlacin: es un numero nico que nos dice como es la
relacin que existe entre dos variables, si es fuerte, positiva o negativa.
2. El coeficiente de determinacin: es un nmero nico que nos dice como
es la variacin en una variable, si es directamente a la proporcin en otra
variable.
3. Regresin lineal: es un proceso que permite hacer predicciones acerca de
una variable y basada en una variable conocida x.
4. Error estndar de estimacin: es un nmero nico que nos permite hacer
predicciones de regresin lineal.
Quiero dedicar un poco ms de tiempo a tratar con la correlacin y la regresin. En
este captulo se har una introduccin a lo que llamamos Regresin Mltiple. La
regresin mltiple es una herramienta muy avanzada y extremadamente poderosa
cuando se intenta construir un modelo para predecir la variedad entre ellos. No
vamos a ir demasiado lejos en la regresin mltiple, ser solamente una
introduccin slida. Si vas a la escuela de posgrado probablemente tendrs la
oportunidad de ser mucho ms familiarizado con esta poderosa tcnica.
Revisin rpida
Usa el anlisis de correlacin para encontrar una relacin estadsticamente
significativa entre dos variables.
Usa la el anlisis de regresin lineal para hacer predicciones basadas en las
relaciones que existen entre dos variables.
La principal limitacin que tiene con la correlacin y la regresin lineal como acaba
de aprender a hacerlo es que slo funciona cuando se tienen dos variables. El
problema es que pensamos que el problema es complicado cuando el modelo solo
tiene dos variables. Por ejemplo. Supongamos que yo pregunto las siguientes
cuestiones: Por qu una persona recibe una compensacin por lo que hace? Qu
diras? Podra decir algo como lo siguiente:
Podra tener algo que ver con cunto tiempo una persona ha trabajado para
la empresa.
Podra tener algo que ver con la cantidad de experiencia que una persona
tiene que hacer su tipo especfico de trabajo.
Podra tener algo que ver con su edad. (La edad es un "poder" para
experiencia).
Podra tener algo que ver con el tipo de trabajo que hacen.
Podra tener algo que ver con sus calificaciones de rendimiento.
Podra tener algo que ver con qu parte del pas viven.
Probablemente tienes una idea de como muchas personas obtienen su paga,
realmente se basa en mas que una sola pieza de informacin. En realidad, todos
los factores como los anteriores juegan un rol de como una persona obtiene su paga
y como lo hace.
Si usted fuera a utilizar la correlacin estndar para estudiar por qu las personas
reciben la compensacin que hacen, se limitara a slo mirar una de estas cosas a
la vez. Por ejemplo, podra utilizar la correlacin para estudiar la relacin entre la
compensacin actual de una persona y su tiempo con la empresa (como lo hicimos
en el captulo sobre la regresin lineal). Adems tambin puedes usar la correlacin
para estudiar la relacin entre la compensacin actual de una persona y el nmero
de aos de escuela que completaron. Sin embargo, usted no podra hacer ambos
para descubrir cmo la compensacin actual de una persona se relaciona con su
educacin y cunto tiempo han trabajado para la compaa. Recuerda, la
correlacin de Pearson es herramienta bi-variable, significa que esta diseada para
encontrar relaciones entre nicamente dos variables. Y sin embargo, sabemos que
la vida es tan complicada que toma ms de dos variables para empezar a explicar /
predecir por qu las cosas son como son. Que necesitas una herramienta nueva-
La Regresin Mltiple.
Regresin Mltiple (R)
Una herramienta estadstica que te permite examinar como las mltiples variables
independientes estn relacionadas con las variables dependientes. Una vez que
hayas identificado cmo estas variables mltiples se relacionan con su variable
dependiente, puedes tomar informacin sobre todas las variables independientes y
usarla para hacer mucho ms poderosa y precisa la informacin acerca de por qu
las cosas son como son. Este ultimo proceso es llamado Regresin Multiple.
Veamos un par de ejemplos que esperamos hagan que este concepto sea un poco
ms fcil de entender. Yo voy a usar Diagramas de Venn similares a lo que usamos
para conseguir control de lo que el coeficiente de determinacin significa.
La figura 4-1 presenta una imagen de como dos variables estn relacionadas
una con otra.
La figura 4-2 presenta una imagen de como dos variables independientes
estn relacionadas con una variable dependiente-mientras las dos variables
independientes no estn relacionadas una con la otra.
La figura 4-3 presenta una imagen de como dos variables independientes
estn relacionadas con una variable dependiente-mientras las dos variables
independientes estn relacionadas una con otra.
Debes entender estas tres figuras en orden para comprender los conceptos de
correlacin multiple y regresin mltiple.
Figura 4-1
Ejemplo de la relacin entre la edad y la compensacin actual.

Compensa
cin
Edad
actual

Variacin de la
compensacin que
Variacin en la no tiene nada que
edad que no tiene La varianza explicada ver con la edad de
nada que ver con por la relacin entre una persona.
la compensacin la edad y la
compensacin (27%)-

En este ejemplo, el 27% de lo que hay que saber sobre la


compensacin actual de una persona se explica por la edad de esa
persona. En otras palabras, si t conoces la edad de una persona
sabes el 27% de lo que necesitas hacer una prediccin precisa
sobre cul es su compensacin.

No hay nada nuevo en la figura 4-1. Hay una simple declaracin de lo que ya le en
el captulo sobre correlacin. Si no est claro sobre lo que significa la Figura 4-1,
por favor regresa al captulo y revisa el Coeficiente de Determinacin. El punto
principal es que la correlacin entre edad y compensacin nos dice que la
compensacin parece cambiar a medida de que una persona envejece. Esto hace
el sistema intuitivo, porque uno esperara que como una persona envejece, l o ella
sube en su trabajo y se paga ms.

Figura 4-2
Ejemplo de la relacin entre Edad (para mayores de 18 aos), Tiempo con la
empresa y Compensacin.
El 10% del porque
una persona gana
lo que hace est
relacionado con su
tiempo con la
empresa.

Comp.
Edad

Tiempo con
la empresa
El 27% del porque
una persona gana lo
que hace est
relacionado con la
edad de la persona.

Punto importante!

Notar que el tiempo de una persona con la empresa cuenta alrededor del
10% de por qu ganan lo que hacen. Al agregar esta variable a nuestro
estudio, hemos mejorado nuestra comprensin de por qu las personas
ganan los ingresos que hacen desde del 27% al 37%. En otras palabras,
usando dos variables en lugar de una variable, mejor nuestra capacidad
para hacer predicciones precisas sobre el salario de una persona.

La figura 4-2 es una buena ilustracin sobre que correlacin mltiple y regresin
est diseada para hacer. Por tener ms que una variable predictora (edad y
tiempo con la empresa), somos capaces de explicar ms de la variacin en la
compensacin. Como un resultado, nosotros hacemos muchas mas predicciones
precisas. Esto es porque la segunda variable agrega informacin adicional
importante sobre su variable dependiente (compensacin).
Figura 4-3
Ejemplo de la relacin entre Edad (para mayores de 18 aos), Ttulo
Universitario y Compensacin.
El 11% de la variacin
compartida por el grado El 45% del por qu una
universitario y la edad no persona gana lo que
hace est relacionada
est relacionada con el
con el grado
ingreso. Grado
universitario pero no
Universitario
est relacionado con la
edad.

Edad

El 12% del porque una El 20% de El ingreso


persona gana lo que hace est relacionado con
est relacionada con la edad una "interaccin" de
pero no est relacionada con edad y grado
el grado universitario. universitario

Punto importante!

Notar que esto es mucho ms complicado! El 12% de la


compensacin de una persona es relacionada con la edad, el
45% esta relacionada con el grado universitario de una
persona y el 20% esta relacionada con una interaccin entre la
edad y el grado universitario. En este caso, hemos aumentado
nuestra capacidad para predecir/explicar la compensacin a
casi el 77%.

Esperemos que, despus de mirar las figuras 4-1, 4-2 y 4-3, entienda los siguientes
hechos:
Cuando tienes ms que una variable independiente, puedes muy bien ser
capaz de hacer predicciones ms precisas sobre su variable dependiente.

Piensa en ello como tratar de comprar un coche. Si t solo le preguntas a


uno de tus amigos que tipo de carro piensan que es el mejor, tendrs algo de
informacin pero estars limitado. Pero... si tu preguntas a diez de tus amigos
la misma pregunta, obtendrs ms informacin y probablemente estars ms
identificado como para identificar un buen carro. Lo mismo es cierto con la
investigacin de regresin. Si ests tratando de desarrollar una manera de
predecir si es probable que una persona gravemente deprimida cometa
suicidio, tu prediccin ser mucho ms acertada si tomas mltiples fuentes
de informacin (variables independientes) tomando en cuenta la edad,
historial mdico, historial de intentos previos de suicidio, puntuacin en una
encuesta de depresin clnica, nmero de amigos/familiares en la red de
apoyo de la persona.

Las cosas son bastante sencillas cuando tienen mltiples variables


independientes y no estn relacionadas unas con otra.
Las cosas se complicaran mucho ms cuando sus mltiples variables
independientes estn relacionadas una con otra. En otras palabras, cuando
las variables independientes interacten con otra as como con la variable
dependiente. En este caso, para ser capaz de hacer predicciones necesitas
romper todas las correlaciones hacia abajo para que pueda averiguar el valor
mltiple de R.
As que, tratando de mantener este tipo simple ("Si, claro!", dices) aqu es lo que
queremos hacer.
1. Queremos calcular un nico nmero de resumen que nos indique cun fuerte
es la relacin entre TODAS las variables independientes y la variable
dependiente. Lo que queremos es similar al coeficiente de correlacin r.
Recuerda, sin embargo, que r es usada solamente con 2 variables. A
estadstica, vas a aprender que se llama "R" (que es un capitolio "r"). Siempre
que vea un capitulo "R" se interpreta como cualquier coeficiente de correlacin
regular excepto que le indica la fuerza de las relaciones combinadas entre
todas las variables independientes y la variable dependiente.
2. Queremos un nico nmero de resumen que diga cuanta variabilidad en la
variable dependiente est relacionada con TODAS las variables
independientes. Cando hablamos acerca de correlacin antigua, aprendimos
sobre el Coeficiente de Determinacin que es simbolizada como 2 .
Podemos hacer lo mismo con R para entender cuanta variacin en la
variable dependiente est contada por las variables independientes. Para
obtener esta estadstica, todo lo que necesita hacer es cuadrado su valor "R"
que le da 2 .
3. Finalmente, quieres ser capaz de hacer predicciones sobre variable
dependiente incluyendo toda la informacin proporcionada por todas las
variables independientes.
Cmo calcular R. (Que tambin se llama el coeficiente de correlacin mltiple)
La mejor manera de mostrarte cmo hacerlo es usarlo y usarlo como ejemplo.
Supongamos que eres un psiclogo de personal que trabaja para Motores
Generales. La empresa quiere desarrollar un nuevo proceso de contratacin que les
ayude a identificar a los solicitantes de empleo que sern los vendedores de coches
ms productivos.
Aqu est cmo utilizado la regresin mltiple para desarrollar una manera de
predecir quin ser el mejor vendedor.
1. Saliste y tomaste una muestra aleatoria de 5 vendedores actualmente
empleados de Motores Generales. En realidad, necesitas tener una muestra
ms grande, pero para hacer esto un poco ms fcil de seguir estoy usando
un conjunto de datos realmente pequeo.
2. Recopilaste la siguiente informacin sobre cada uno de los 5 vendedores:
Ao ms alto de educacin
Motivacin medida por la Escala de Motivacin de Higgins.
Cuantos ventas en dlares hizo la persona el ao pasado.
3. Calculaste la correlacin entre cada par de variables posibles:
Correlacin: Ao ms alto de educacin con Motivacin
Correlacin: Ao ms alto de educacin con Ventas en Dlares
Correlacin: Motivacin con Ventas en Dlares
4. Conecta las correlaciones en la frmula mltiple R.
5. Haz los clculos.
Paso 1 Selecciona tu muestra aleatoria
Recuerda, tomar una muestra aleatoria es crtico si quieres poder tomar tus
hallazgos y utilizarlos para tomar decisiones en el mundo real.
Paso 2 Recopila los datos
Supongamos que tomamos a nuestros 5 vendedores seleccionados aleatoriamente
y recopilamos la informacin que puedes ver en la Tabla 14-1.
Tabla 4-1
Datos recopilados de una muestra aleatoria de 5 vendedores de Motores
Generales
Variable Independiente Variable Independiente Variable Dependiente
(X1) (X2) (Y)
Ao ms alto de Motivacin medida por la Cuantos ventas en
educacin Escala de Motivacin de dlares hizo la persona
Higgins el ao pasado

12 32 $350,000
14 35 $399,765
15 45 $429,000
16 50 $435,000
18 65 $433,000

No voy a tomar el tiempo para trabajar a travs de calcular los coeficientes de


correlacin entre estas tres variables. Solo recuerda como lo hiciste en el capitulo
12. Supongamos que hiciste todas las matemticas y obtuviste la siguiente
informacin:
Media Desviacin Estndar
Ao ms alto de educacin 15 2.236
Motivacin 45.4 13.164
Ventas Anuales $409,353 $36,116.693

Correlacin entre Ao ms alto de educacin y Motivacin (1.2 ) = 0.968

Correlacin entre Ao ms alto de educacin y Ventas Anuales (1. ) = 0.880

Correlacin entre Motivacin y Ventas Anuales (1. ) = 0.772

Usando esta informacin estamos listos para usar los coeficientes de correlacin
para calcular R
La frmula para R

[(.1 )2 + (.2 )2 ] (2.1 .2 1,2 )


=
1 (1,2 )2

Ahora todo lo que necesitamos hacer es conectar los nmeros y hacer los clculos.
Creo que hemos terminado, estars de acuerdo en que esta fue la parte fcil.
PASO 1 Sustituya con los nmeros

((.880)2 + (. 772)2 ) (2(. 880)(. 772)(. 968))


=
1 (.968)2

PASO 2 Trabajando con las matemticas

(. 7744 + .5960) (1.3152)


=
1 .9370

Entonces

1.3704 1.3152
=
0.063

Entonces

0.0552
=
0.063

Finalmente

= . 8762
Por lo tanto
=.
Entonces, qu significa R=.9360? Esto es realmente bastante simple. Te dice,
La correlacin combinada entre los Aos de Educacin y la Motivacin con ventas
anuales de un vendedor es .9360. "
Recuerda, todas las correlaciones-Incluso las correlaciones mltiples deben estar
entre + o - 1.00. Una correlacin mltiple, al igual que cualquier otra correlacin, de
1,00 significan que las dos variables independientes, cuando se toman en conjunto
tienen una relacin perfecta con ventas anuales de vendedor. Si R=0.00
significara que no haba relacin alguna entre educacin, motivacin y ventas
anuales. Ya que nuestra Correlacin Mltiple es de .9360, las dos variables parecen
tener una fuerte relacin con las ventas anuales. En otras palabras, podra hacer
predicciones muy precisas sobre cunto dinero en traer un vendedor si no
sabemos nada ms sobre la persona ms que su educacin y su puntuacin en una
escala de evaluacin de la motivacin. Si todo esto fueran datos verdaderos (en
lugar de los datos inventados que he creado para ayudarte a entender el proceso)
tendramos una forma muy poderosa para seleccionar un nuevo vendedor y nos
volveramos muy ricos muy rpido!
No s si usted ha capturado completamente la visin en esto, djeme decirle otra
vez... ESTO ES MUY GENIAL, MUY PODEROSO, Y MUY IMPORTANTE. Usted
podra utilizar esta tcnica para hacer todo tipo de cosas como:
Predecir/Explicar la compensacin actual de una persona basada en un
nmero de caractersticas del empleado.
Predecir/Explicar la supervivencia del paciente despus de la ciruga basada
en un numero de caractersticas personales.
Predecir la probabilidad de una reciente reincidencia condenada por
delincuencia criminal basada en una serie de caractersticas personales.
Predecir la probabilidad de un estudiante graduado de desempearse bien
en la escuela de posgrado sobre la base de una serie de caractersticas
personales.
Podra seguir y seguir y seguir
Haciendo Predicciones: Regresin Mltiple
Bien, ahora tenemos una medida que nos permite establecer si nuestras variables
independientes son predictoras efectivas de nuestra variable dependiente. Ahora
podemos dar el siguiente paso y utilizar nuestro conocimiento para hacer
predicciones. Esto ser muy similar a lo que se hizo en el captulo 13, pero con un
paso extra.
Recuerda que con la regresin lineal estndar la formula algebraica para hacer
predicciones es:
= +
En la formula anterior:
Y= Un valor predicho de Y (que es su variable dependiente).
a= El valor de Y cuando X es igual a cero. Esto tambin es llamado Y interceptora.
b= El cambio en Y por cada 1 incremento de cambio en X.
1 = Una puntuacin de X en su primera variable independiente para lo que est
tratando de predecir el valor de Y.
2 = Una puntuacin de X en su segunda variable independiente para lo que est
tratando de predecir el valor de Y.
La frmula para Regresin Mltiple
= + 1 1 + 2. 2
Y= Un valor predicho de Y (que es su variable dependiente)
a= LA Y interceptora
1 = El cambio en Y por cada 1 incremento en 1 (En nuestro caso, este es el ao
ms alto de educacin).
2 = El cambio en Y por cada 1 incremento en 2 (En nuestro caso, este es el nivel
de motivacin Medido por la Escala de Motivacin de Higgins).
X= Una puntuacin de X (X es su variable independiente) para el que est
intentando predecir un valor de Y.
Como calcular y

, = Correlacin entre ao ms alto de educacin y ventas Anuales

, = Correlacin entre Motivacin y Ventas Anuales

, = Correlacin entre ao ms alto de educacin y Motivacin

(, ) = El coeficiente de determinacin (r cuadrada por el ao ms alto de


educacin y motivacin)
= Desviacin estndar por su variable Y (dependiente)
= Desviacin estndar por la primera variable X (educacin)
= Desviacin estndar por la segunda variable X (Motivacin)
Calculando los Coeficientes de Regresin
Ao ms alto de educacin

Puntaje de motivacin

Como calcular a
= 1
1 2
2

= La media de Y (Tu variable dependiente)


1
1 = El valor de 1 multiplicado por la Media de tu primera variable independiente
(En este caso, el ao ms alto de educacin).
2
2 = El valor de 2 multiplicado por la Media de tu segunda variable independiente
(en este caso, el puntaje de motivacin)
Calculando a

As que... Hagamos una prediccin!


Bueno, digamos que usted entrevist a un vendedor potencial y encontr que tena
13 aos de educacin (tom 1 ao de la universidad despus de la secundaria) y
obtuvo 49 en la escala de motivacin de Higgins. Cul sera su prediccin de
cunto dinero en ventas traera esta persona sobre una base anual?
Aos de escuela= 13
Puntaje de motivacin= 49
La frmula:

Tenga en cuenta que no he puesto los nmeros para 1 y 2 . Estos son los lugares
donde se sustituyen los valores que va a utilizar para hacer una prediccin. En este
caso, 1 se refiere al nmero de los aos de escuela (13) y 2 es el puntaje de
motivacin (49). As que. Si sustituyes los nmeros, podremos hacer nuestra
prediccin. Vea abajo:

Por lo tanto, dado un solicitante de empleo con 13 aos de educacin completos y


que recibi una puntuacin de motivacin de 49 en la Escala de Motivacin de
Higgins, nuestra mejor prediccin de cunto ganar esta persona para nuestra
concesin es $685,881.74. Muy bien eh? Piensa unos minutos acerca de cmo
una herramienta como esta podra ser utilizada en cualquier campo de la carrera
que ests pensando ir.
Trminos para aprender
Debe ser capaz de definir los siguientes trminos basndose en lo que haprendido
en este captulo.
Correlacin mltiple
Regresin mltiple

Vous aimerez peut-être aussi