Vous êtes sur la page 1sur 10

ADMINISTRACION DE OPERACIONES I REGRESION MULTPLE La proposicin bsica de la regresin simple es que una variable independiente se puede utilizar para

pronosticar el valor de alguna variable dependiente (la cantidad que se va pronosticar) con base en una relacin lineal entre las dos variables. En el ejemplo, la variable que se iba a pronosticar era el nmero de pedidos recibidos diariamente por una empresa de ventas por correo. La variable independiente en la cual tal pronostico se basaba en el peso de toda la correspondencia de ese da. En muchas situaciones de toma de decisiones se puede emplear ms de una variable para explicar o predecir cierta variable dependiente. Por ejemplo, en la situacin de las ventas por correo el da de la semana as como el peso de la correspondencia recibida podra usarse para pronosticar el nmero de pedidos. En situaciones donde ms de una variable independiente nica es necesaria para pronosticar con precisin; la regresin simple no es adecuada. Sin embargo, la idea de la regresin simple se puede generalizar mediante la tcnica de la regresin mltiple para que permita incluir ms de una variable independiente. El caso especifico que se usara para ejemplificar los principios y conceptos de la regresin mltiple y la correlacin se refiere a la prediccin de las ventas anuales de una empresa en el negocio del cristal. La tabla siguiente muestra alguna de la informacin histrica que dicha compaa, California Plate Glass (CPG) ha reunido. Esta tabla contiene los datos no solo sobre las ventas variables de la compaa (ventas netas) sino tambin sobre las otras dos variables la produccin anual de automviles y el nmero de contratos de construccin conseguidos anualmente. La administracin de CPG considera que sus ventas netas estn estrechamente relacionadas con esas otras dos industrias, ya que sus clientes importantes son los productores de automviles y los contratistas de la construccin. Se supone que como parte del proceso de planificacin, los altos directivos han solicitado pronsticos de las ventas corporativas con base anual para los prximos cinco aos. Aunque los resultados del anlisis de regresin simple pueden ser satisfactorios para la prediccin de las ventas, probablemente la administracin preferira utilizar la informacin que tiene sobre la produccin de automviles y los contratos de construccin al mismo tiempo; es decir, puesto que la administracin sabe que ambos factores son importantes y que se mueven en cierto sentido en forma independiente uno del otro, le gustara pronosticar las ventas netas de CPG como

funcin tanto de la produccin de automviles como de los contratos de construccin concedidos. Matemticamente tal relacin podra escribirse como: Ventas netas de CPG = f (produccin de automviles, contratos de construccin concedidos) Esta ecuacin establece que las ventas netas de la empresa dependen de dos variables independientes -la produccin de automviles y los contratos de construccin concedidos-. Aunque se podran escribir varias formas diferentes de la ecuacin para mostrar la relacin entre estas variables, una directa sera. = a + b1X1 + b2X2 En donde: = valor estimado de las ventas anuales de CPG X1 = produccin anual de automviles X2 = contratos anuales de construccin concedidos A partir de esta ecuacin se puede ver que si X1 o X2 se eliminaran, se tendra la misma situacin que se manejo con la regresin lineal simple. Ya que se tiene ms de una variable independiente (X1 y X2), la regresin se conoce como mltiple. APLICACIN DEL ANLISIS DE REGRESIN MLTIPLE Para lograr una mejor compresin del concepto de regresin mltiple, usamos los datos de la tabla CPG y aplicar el mtodo minimocuadrtico para obtener los valores de a, b1 y b2 de la ecuacin (9-1). En el primer paso se establece precisamente cul es el problema y cmo se quiere resolverlo. Se supone que el objetivo es pronosticar las ventas de la empresa para los prximos cinco aos y que tales predicciones se basarn en parte en los valores estimados de la produccin de automviles y los contratos de construccin concedidos en esos aos. Con dicha informacin histrica y un programa para computadora con regresin mltiple, se obtiene los siguientes resultados: a = 19.1, b1 = 35.7 y b2 = 10.9
9-1

Por la cual, la ecuacin para pronosticar las ventas de la empresa se puede escribir como: = 19.1 + 35.7X1 + 10.9X2 9-2

La interpretacin correcta de los valores de la ecuacin (9-2) es que cuando tanto X1 como X2 son 0, las ventas de la empresa Y tendrn un valor de 19.1 millones, y que cuando la produccin de automviles aumenta en un milln de unidades, las ventas de la empresa aumentarn en $ 37.5 millones (manteniendo constantes otras cosas, o sea los contratos de construccin concedidos). As pues, los coeficientes de la ecuacin generalmente proporcionan una idea burda de cmo los cambios de cada una de las variables independientes influyen el valor de la variable dependiente . Con el fin de pronosticar las ventas para los cinco aos venideros, se necesita sustituir valores estimados para X1 X2 en la ecuacin (9-2) para el ao 1989, estos valores son, por ejemplo, 6.4 y 48.52, respectivamente. Por lo que la estimacin de las ventas para 1989 sera. = 19.1 + 35.7 (6.4) + 10-9 (48.51) = 776.3 (millones de dlares) Un ltimo punto acerca de este ejemplo es que las predicciones para los aos 1989 hasta 1993 se hicieron sin verificar primero la significacin de los parmetros o lo apropiado de la ecuacin en la que dichas predicciones se iban a basar. LA CORRELACION MULTIPLE Y EL COEFICIENTE DE DETERMINACION Se reconocer que en la regresin simple se calculaba un estadstico llamado coeficiente de determinacin, el cual era simplemente la razn de la variacin explicada a la variacin total. La misma razn se puede tambin calcular en la regresin mltiple, en donde una vez ms equivale a la variacin explicada sobre la variacin total. Este coeficiente de determinacin, denotado R 2 puede tomar valores de 0 a 1; el ultimo representa una situacin en la que toda la variacin de es explicada. La formula real para calcular el coeficiente de determinacin en este caso es exactamente la misma que la usada para la regresin simple: (i Y)2 R2 = ---------------- (Yi Y)2 Se vuelve a tomar el ejemplo de las ventas anuales de CPG, el clculo del coeficiente de determinacin da, al emplear la ecuacin (9-3), 0-976. Esto quiere decir que el 97.6 % de la variacin de las ventas anuales puede explicarse por la variacin combinada de la produccin de automviles y los contratos de construccin concedidos. En la regresin mltiple es posible calcular el coeficiente de correlacin individual para cada par de variables. As, se calculara un coeficiente de correlacin simple para las ventas de la empres y la produccin anual de automviles. Otro coeficiente de correlacin simple se podra calcular para las ventas anuales y los contratos de construccin concedidos. Finalmente,
9-3

se podra calcular un coeficiente de correlacin para la produccin anual de automviles y los contratos de construccin concedidos. A estos tres coeficientes de correlacin diferentes se les conoce como coeficientes de correlacin simple,ya que implican solo dos variables. Con mucha frecuencia se les presenta una matriz de correlaciones como las que se muestra en la siguiente tabla. MATRIZ DE CORRELACIONES SIMPLES Ventas de CPG Ventas de CPG Produccin de automviles Contratos de construccin 1.000 0.688 0.948 Produccin automviles 0.688 1.000 0.530 de Contratos construccin 0.948 0.530 1.000 de

PUEBAS DE SIGNIFICACION Una cuestin importante antes de que los resultados de la regresin mltiple se pueden utilizar para pronosticar valores futuros es el relativo a la significacin estadstica. El clculo de los coeficientes de la ecuacin de regresin se basa en el uso de una muestra de observaciones histricas. En consecuencia, la confiabilidad de las predicciones basadas en dicha ecuacin de regresin depender en gran parte de la muestra especfica de observaciones que se emplearon en su desarrollo. As pues, la cuestin de la significacin realmente es qu tan confiables son los pronsticos que se basan en el anlisis de regresin mltiple de una muestra dada de datos? La primera prueba es el estadstico F (significacin de la regresin simple). El valor del estadstico F es la razn de la varianza explicada a la varianza no explicada. Matemticamente se puede escribir en dos formas equivalentes, una forma es (i Y)2 / (k 1) F = -------------------------9-4

(Yi i )2 / (n-k) en donde n = Nmero de observaciones (puntos de datos) en donde k= Nmero de coeficientes

De manera alternativa se puede escribir como R2 / (k-1) F = -------------------(1 R2 )/ (n-k) En donde R2 es el coeficiente de determinacin. Aunque ambas formas dan el mismo valor numrico para el estadstico F, la ecuacin (9-5) generalmente es ms fcil de usar porque el coeficiente de determinacin R2 usualmente tendr que ser calculado. En el ejemplo CPG ya se calculo como R2 = 0.976; debido a que utilizan 17 observaciones para determinar los valores de los parmetros a, b 1 b2 y porque se tienen tres coeficientes en la ecuacin de regresin, la ecuacin (9-5) da 0.976/(3 1) F = ------------------------ = 284.9 (1 0.976)/(17 3) Para el estadstico F la regla de decisin apropiada relativa a la significacin a un nivel de confianza de 95% es que 284.9 sea mayor que el valor correspondiente de la tabla de valore para F. Puesto que dicho valor es 3.74, el cual es mucho menor que 284.9, se concluye que la ecuacin de regresin es significativa. La segunda prueba implica verificar la significacin de los coeficientes individuales de la ecuacin de regresin. En esencia, la cuestin es si el valor de cada coeficiente es significativamente diferente de 0 `o si se dio por casualidad esta prueba consiste en calcular el error tpico para cada uno de los coeficientes y en seguida emplear tal error para determinar si el valor de los coeficientes es significativamente diferente de 0. El clculo real del valor del error tpico de cada coeficiente generalmente se incluye en los programas para computadora que realizan regresin mltiple. En la mayora de los casos estos resultados se proporcionan en la forma de la prueba t para cada uno de los tales coeficientes. Dicha prueba t se usa directamente para determinar la significacin de cada coeficiente. Los resultados de los clculos de la prueba t para el ejemplo de las ventas de CPG se presentan en la siguiente tabla. Como se puede observar, la prueba t
9-5

simplemente es el valor del coeficiente dividido entre la desviacin tpica del mismo coeficiente. As indica el numero de desviaciones tpicas que el valor calculado es diferente del 0. En la misma tabla siguiente muestra que para a, el trmino consiste de la ecuacin de regresin, el valor calculado de 19.1 solo es de 0.37 desviaciones tpicas desde 0. Para b1 b2 el numero de desviaciones tpicas desde 0 es mucho mayor, 3.55 y 11.17 respectivamente. Coeficiente Valor del Error coeficiente tpico Prueba t Valor de Valor del tablas coeficiente/error ( = 0-05) tpico 0.37 2.145 3.55 2.145 11.17 2.145 Es significativo el valor del coeficiente? No Si Si

a b1 b2

19.1 35.7 10.9

51.9 10.1 0.97

La regla para determinar si un coeficiente es diferente significativamente de 0 a un nivel de confianza de 95% es que el valor absoluto de la prueba t calculada debe ser mayor que el valor correspondiente de las tablas. La tercera prueba de significacin implica el clculo de error tpico de un pronstico. Esto permite intervalos de confianza que hay que desarrollar alrededor de pronsticos basados en la recta de regresin. En general, se usa un intervalo de confianza de 95%. Debido a la complejidad de calcular el error tpico de las predicciones, tal medida generalmente se incluye en los programas computacionales para el anlisis de la regresin mltiple. Una vez que se ha obtenido el error tpico de los pronsticos, el gerente puede usarlo para desarrollar un intervalo de confianza alrededor de cualquier prediccin. Por ejemplo, el gerente pudiera tener un nivel de confianza del 95% (suponiendo que el patrn pasado permanecer igual durante la fase de prediccin) de que el valor real se encontrar dentro de 2 errores tpicos del valor pronosticado. Para el ejemplo de CPG, el error tpico de la prediccin asociado con el valor medio de las variables independientes es de 40.8, entonces, si se quisiera preparar un pronstico utilizando los valores medios de la produccin automviles y de los contratos concedidos de construccin, se podra confiar en un 95% de que el valor real podra encontrarse en un intervalo de aproximadamente 81.6 unidades alrededor del valor pronosticado. (Obsrvese que 81.6 es igual a dos veces el error tpico de la prediccin.) El valor exacto de este intervalo podra encontrarse al emplear la formula apropiada. Por ltimo, se debe hacer notar que

el valor que el valor de 81.6 est en trminos de millones de dlares, ya que esas son las unidades de Y. Con cada una de estas pruebas bsicas de significacin realizadas, el usuario obtendr una mejor comprensin de la ecuacin de regresin mltiple y del nivel de confianza que se puede depositar en las predicciones desarrolladas a partir de la misma. Sin embargo, los gerentes deben estar tambin conscientes de que, como todos los mtodos estadsticos, la regresin est constituida sobre ciertos supuestos. Cuando se violan dichos supuestos, la tcnica puede generar desconfianza y hasta ser engaosa cuando se aplica en la prctica.

SUPUESTOS INHERENTES AL ANALISIS DE REGRESION MULTIPLE Siempre que la regresin mltiple se emplea en la prctica, se hacen cuatro supuestos bsicos. Tales supuestos se comprenden como las condiciones necesarias para que se cumplan si el anlisis de regresin se usa juiciosamente. El primer supuesto se refiere a la existencia de la relacin lineal. Este supuesto establece que la variable dependiente est relacionada linealmente con cada una de las variables independientes. (Tcnicamente el supuesto de la linealidad se refiere a la linealidad de los coeficientes.) El segundo supuesto es el de la varianza constante de los errores de regresin. A esto se le llama con el nombre tcnico de homoscedasticidad. (Varianza constante.) Este supuesto establece que los errores de prediccin deben ser constantes a lo largo del recorrido completo de observaciones.

Primer tipo de patrn cuando est presente la varianza constante:

Segundo tipo de patrn en situacin en la cual los residuos aumentan a medida que el valor de la variable independiente aumenta, y entonces el supuesto de la varianza constante no se cumple:

Tercer tipo de patrn aqu se describe un tipo diferente de inconstancia de la varianza. Por lo tanto para cumplir con el supuesto de la varianza constante tampoco se cumple. El tercer supuesto bsico se refiere a que los residuos son (aleatoriamente) independientes el uno del otro. Esto quiere decir, que cada valor residual es independiente de los valores que se encuentran antes y despus de l. En trminos tcnicos, cuando este supuesto no satisface, se dice que existe correlacin serial (o autocorrelacion) entre los valores residuales sucesivos. Cuando los residuos no son independientes, puede haberse omitido una variable independiente importante o puede existir no linealidad entre las variables empleadas en la ecuacin de regresin. Para eliminar la autocorrelacin se usan comnmente dos soluciones. Primera, se puede requerir una variable independiente adicional para capturar algo de la variacin de la variable dependiente que pudiera no ser explicada por las variables independientes existentes y resultara as en errores sistemticos y no aleatorios. Segunda, puede haberse utilizado la forma funcional equivocada (como lineal en vez de exponencial) en la ecuacin de regresin. El cuarto supuesto bsico es que los valores residuales, si se trazan en una grfica, deben estar aproximadamente distribuidos normalmente. En general este supuesto no es restrictivo, ya que los residuos representan las consecuencias de un gran nmero de factores sin importancia que influyen a la variable dependiente, cada uno con grado relativamente insignificante. Para comprobar este supuesto de normalidad se deben trazar los residuos y asegurarse de que formen una curva en forma de campana (normal). Si no se cumple este supuesto, las pruebas de significacin y los intervalos de confianza, desarrollados a partir de los mismos, pueden estar incorrectos.

USO DEL ANALISIS DE REGRESION MULTIPLE EN LA PRACTICA El hecho de que el anlisis de regresin sea una tcnica basada en la comprensin y medicin del alcance de la relacin, significa que se deben identificar aquellos factores que parecen influir la variable que se va a pronosticar. As, el procedimiento que se ha esbozado realmente ira ms all de la formulacin de una ecuacin de regresin y describir como, en una situacin especfica, un administrador podr hacer hiptesis sobre ciertas relaciones y usar luego el anlisis de regresin para determinar cul es la ms apropiada. A continuacin se enumeran y describen nueve pasos bsicos.

1. Formulacin del problema. 2. Seleccin de indicadores pertinentes econmicos y de otra naturaleza. 3. Corrida de prueba inicial de la regresin mltiple. 4. Estudio de la matriz de correlaciones simples. 5. Decisin entre regresiones individuales. 6. Observacin del valor de R2. 7. Verificacin de la validez de los supuestos de regresin. 8. Preparacin del pronstico. 9. Empleo de la ecuacin de regresin para aumentar la comprensin.

1.- Don J.J. Alberto ha estado preocupado desde hace unos meses por los costos de su taller de tipografa. El piensa que algunos autores u obras incompletas o desordenadas le incrementan los costos, ya que los estmulos por l tomando en cuenta solo la mano de obra, le han faltado y por lo tanto sus pronsticos de costos ltimamente no han salido bien. Se pregunta si agregando otra variable independiente (costos de papel de galera, de cajas tipogrficas impresas y de otras materias primas) mejorara su pronstico. Durante los ltimos seis meses J.J. Alberto ha llevado un registro de los costos totales de su taller, no solo de las horas de mano de obra directa, sino tambin en la cantidad de costos de material usado. Esta es la informacin se presenta en la siguiente tabla: Tabla 1 Costos del taller de J.J. Alberto (en miles de pesos mensuales)
Costos administrativos del taller (miles de pesos) 235 229 231 227 225 233 Mano de obra (miles de pesos) 41 39 37 39 38 40 Costos de material usado (miles de pesos) 28 25 24 19 18 23

Para usar el criterio de los cuadrados mnimos, las ecuaciones para determinar a, b1 y b 2 Determinar el pronstico, si don J.J. Alberto en diciembre usa 42 mil pesos para gastos de mano de obra y 25 mil pesos para gastos de materiales, cuales seran los costos administrativos del taller?

Vous aimerez peut-être aussi