Vous êtes sur la page 1sur 55

Keat, P., Young, P. ( 2004) . Estimacin de la demanda.

En
Economa de empresa (pp.166-220)(766p.)(4a ed). (C26262)

Estimacin de la demanda

La siluaci11
A Jennifer Harrah se le asign la tarea de desarrollar y probar
un modelo estadstico que ayudara a explicar la demanda del
consumidor de bebidas gaseosas. Jennifer trabajaba para una
importante compaa de investigacin de mercados que tena
F o o D s
una reputacin mundial por su trabajo en el sector de la economa, particularmente en el mercado de bienes de consumo de
alta rotacin. Su empresa justamente ha sido contratada por Global Foods
In c . para llevar a cabo un estudio preliminar dentro del mercado de bebidas
gaseosas.
Como consumidora regular de bebidas gaseosas, Jennifer a menudo se
preguntaba qu afectaba la demanda de las personas por estas bebidas. Adems, haba hecho un estudio de caso acerca de Global Foods en la licenciatura y estuvo buscando trabajo en la misma compaa de la que recordaba un
estudio muy interesante en ese momento. En este estudio, Global Foods era
retratada como el ejemplo clsico de una gran compaa multinacional que
enfrent mrgenes de utilidad y de demanda en declive para sus productos
debido a la madurez de los mercados en los que aqullos se vendan. Su clase lleg a la conclusin de que la mejor forma en que esta compaa podra
energizarse consista en entrar a los mercados en que el crecimiento tanto en
ventas unitarias como en mrgenes de utilidad fuera muy alto, al tiempo que
tambin en relacin con los alimentos, se tratara de su negocio principal.
Sin embargo, Jennifer se sorprendi de que la compaa eligiera bebidas
gaseosas como su nueva lnea de producto. Su clase haba decidido que las
comidas congeladas gourmet para microondas eran las candidatas lgicas
para los esfuerzos de expansin de la empresa.
G L 0 8 A L

(Contina)

La tarea de Jennifer se coment con gran detalle en una reunin entre el


socio principal de su empresa y un representante de Global Foods, lnc. El socio comenz la reunin diciendo, "Jennifer, voy a ponerte a cargo de todo el
proyecto. T decides acerca de la mejor forma de obtener la informacin, la
tcnica estadstica para utilizar en el anlisis de datos y la forma ms efectiva
de presentar los resultados a nuestro cliente. Global te dar tanta ayuda como sea posible. Ellos tienen su propio grupo interno de investigacin de mercados, pero el director general siente que el uso de consultora externa dara
al estudio ms objetividad y credibilidad. Tu nica restriccin es el tiempo. Se
trata de un proyecto de alta prioridad para nuestro cliente. De hecho, el director general quiere que generes los resultados en tres semanas, algunos das
ms o menos. Lo puedes hacer?"
"Es una tarea divina", pens Jennifer. "Un temq interesante, un cliente
grande y bien conocido, una oportunidad de interaccin con la alta direccin
y un importante contrato para nuestra empresa." Ella esper un poco como
para no parecer muy ansiosa y despus replic: "No hay problema. El reporte
estar listo en 20 das".

INTRODU

CIN

En los captulos anteriores analizamos la funcin de la demanda desde un punto de vista


terico. Mostramos cmo cada una de las determinantes de la demanda (factores de precio y algunos otros, tales como gustos, preferencias e ingreso) afecta la cantidad que la
gente est dispuesta a adquirir de un bien o servicio en particular. Se expusieron ejemplos
numricos hipotticos para ilustrar el concepto de elasticidad, una forma clave en la que
los economistas miden la sensibilidad de la cantidad demandada ante cambios en el precio y las determinantes no basadas en el precio de la demanda. El uso de datos hipotticos es una forma conveniente de ilustrar la teora. Pero al poner la teora en prctica, los
directores de una empresa necesitan conocer la verdadera relacin cuantitativa entre la
demanda y los factores que la afectan.
Qu es lo que hace que los consumidores estn dispuestos a pagar por un producto
y servicio en particular? Cmo podemos producir un bien o servicio que nos permita
vender lo suficiente a un cierto precio para recibir un rendimiento aceptable sobre nuestra inversin? Qu impacto tiene la publicidad sobre las ventas? Podemos esperar que
diferentes segmentos del mercado (es decir, por regin, nivel de ingresos, categora ocupacional) reaccionen de formas diferentes a nuestros esfuerzos de marketing? En resumen,
"qu es lo que los consumidores realmente quieren?"
Para quienes toman las decisiones, la respuesta a esta pregunta es crucial. Podemos
anticipar que ellos estaran dispuestos a pagar sumas considerables de dinero para obtener
esta informacin, y de hecho, lo hacen. Muchas empresas tienen sus propios departamentos de investigacin de mercados, as como departamentos de investigacin econmica.
Otras contratan firmas consultoras independientes, y otras an descansan en los brazos
de investigacin de sus agencias de publicidad. Los proveedores lderes en servicios de
investigacin de mercado en Estados Unidos son ACNielsen e IRI. ACNielsen tiene una
fuerte presencia global, mientras que IRI est empezando a expandirse fuera de EUA.

Captulo 5 Estimacin de

demanda

167

Existen muchas formas en las que los investigadores de mercado buscan la "verdad" del
comportamiento del consumidor. Ellos podran usar el enfoque directo de una encuesta
al consumidor, ya sea cara a cara (por ejemplo, deteniendo a la gente en los centros comerciales) o por telfono. Quiz alguno de ustedes ha sido alguna vez participante en este tipo
de recoleccin de datos.
Otro mtodo directo utilizado por los investigadores de mercado es el grupo de enfoque. Se les pide a los consumidores que asistan a una reunin grupal conducida por un
investigador, y se hacen varias preguntas relacionadas con los bienes y servicios de una
compaa. Los representantes de una compaa pueden estar presentes o pueden elegir
observar los procedimientos detrs de un espejo de doble vista. El problema principal con
tales mtodos es que los consumidores muchas veces pueden no ser realistas acerca de la
forma en cmo actuaran en verdaderas situaciones de mercado.
Para obtener una visin ms precisa del comportamiento "verdadero" de los consumidores, las empresas de investigacin de mercado, como ACNielsen, tambin recaban
datos mediante la participacin de la gente en paneles de estudios de consumo. A los voluntarios en esta actividad se les proporciona un escner, que les permite registrar todas
sus compras mediante la lectura de cdigos de barras de cada artculo que compran en
tiendas de venta al detalle. Los participantes en la encuesta transmiten entonces los datos
escaneados a la empresa de investigacin de mercado regularmente, va un mdem especial instalado en los telfonos de sus hogares.
La tecnologa est haciendo posible que las compaas acumulen, almacenen y procesen grandes cantidades de datos acerca del comportamiento del consumidor. Primero se
recaban los datos con la ayuda de la tecnologa del escner (lectores de cdigo de barras y
terminales de punto de venta [Point of sale terminals, POS]) que se utiliza en los mostradores de las cajas de salida en tiendas y supermercados tanto en Estados Unidos como en
Europa Occidental. En muchas otras partes del mundo, hay personal de investigacin de
mercado que realiza "auditoras" in situ para recolectar los datos de las compras del consumidor. Sin embargo, eventualmente se espera que muchos pases, particularmente los
llamados "grandes mercados emergentes", utilicen la tecnologa del escner.
Recientemente ACNielsen fue adquirida por VNU, la compaa holandesa que se
mencion en el captulo 1 en la seccin" Aplicacin internacional". Una visita al sitio Web
de la compaa (www.acnielsen.com) 1 proporcionar a los lectores una buena idea de las
clases de productos y servicios que las compaas de investigacin de mercado brindan a
sus clientes, la mayora de los cuales son grandes compaas de alimentos, bebidas y
otros tipos de bienes de consumo empacados de alta rotacin. Este sitio tambin contiene
artculos tiles acerca de temas actuales en el marketing de consumo, tales como intercambios B2B, administracin de categoras y marketing global.
Las compaas tales como NCR se especializan en proveer capacidad de almacenamiento que se mide en "terabits" o billones de bits de informacin. IBM desarroll recientemente una tecnologa de almacenamiento que permite que todos los contenidos de la
Librera del Congreso de EUA sean almacenados en un dispositivo aproximadamente del
tamao de la cabeza de un alfiler. Wal-Mart ha construido un almacn de informacin a
partir de cada una de las compras de sus clientes en cada una de sus tiendas cada da del
ao. La cantidad de datos incluidos en este almacn de informacin ocupa, se asegura, el
segundo lugar despus de los almacenados por el gobierno de EUA. Todos estos desarrollos permiten a los analistas estadsticos extraer un conjunto de datos mucho ms rico
para estimar la demanda de consumo.
1En

el momento que revisamos su sitio Web (8 de febrero, 2002), haba una interesante historia en su pgina principal acerca de la donacin por parte de la compaa de un panel de herramientas de escner al
Sam W. Walton College of Business en la University of Arkansas para "permitir a los estudiantes aprender a partir de las mismas herramientas e informacin utilizadas por los vendedores al detalle y fabricantes en la industria de bienes de consumo empacados".

168

Economa de empresa

El procedimiento comnmente empleado por los economistas para estimar la demanda de consumo es.el anlisis de regresin. Adems de su aplicacin en la estimacin
de la demanda, se usa para estimar las funciones de produccin y de costo (vea captulos
7 y 8). Tambin se utiliza en estudios de macroeconoma del consumo, inversin, comercio
internacional y tasas de inters. La seccin que sigue es una versin concisa de los contenidos del captulo completo, en la que se explica brevemente qu es el anlisis de regresin,
cmo interpretar sus resultados y cmo aplicar stos a las decisiones directivas. Una presentacin ms detallada del anlisis de regresin en la toma de decisiones empresariales
sigue al resumen. Sin embargo, para un anlisis ms detallado de este tema, se recomienda
consultar libros de estadstica o econometra.

RE
de

En la estimacin de la demanda de un bien o servicio en particular, primero determine todos


los factores que podran influir en esta demanda. Suponga que queremos estimar la demanda de pizzas por parte de estudiantes universitarios en Estados Unidos. Qu variables
afectaran ms probablemente su demanda de pizza? Podemos comenzar a responder esta
pregunta a partir del precio y de todas las determinantes no basadas en el precio listadas
en el captulo 3 (por ejemplo, gustos y preferencias, ingreso, precios de bienes relacionados, expectativas futuras, nmero de compradores). Pero no es siempre posible o apropiado incluir todas estas variables en un anlisis particular de demanda. Como ejemplo
de esto, en la demanda de pizza, uno no pensara que las "expectativas futuras" jugaran
un papel importante. Adems, pueden existir otras variables no especficamente consideradas en la teora econmica de la demanda que podran tener un impacto en la compra
de pizza. Por ejemplo, en la "solucin" de este captulo incluimos la temperatura promedio anual como determinante en la demanda de bebidas gaseosas.2
De manera ideal, todas las variables que se cree que tienen un impacto en la demanda deben incluirse en el anlisis de regresin. En realidad, las variables utilizadas
en el anlisis de regresin estn basadas en la disponibilidad de los datos y el costo de
generar nuevos datos. Los dos tipos de datos utilizados en el anlisis de regresin son el
de corte transversal y las series de tiempo. Los datos de corte transversal proporcionan
informacin de las variables para un periodo determinado. Las series de tiempo dan informacin acerca de las variables sobre una cantidad de periodos. Para propsitos de
ilustracin, supongamos que hemos obtenido datos de corte transversal de los estudiantes de licenciatura mediante una encuesta en 30 universidades seleccionadas de manera
aleatoria en Estados Unidos durante un mes en particular.
Suponga que hemos reunido la siguiente informacin de cada plantel a partir de esta
encuesta: 1) nmero promedio de rebanadas consumidas mensualmente por los estudiantes, 2) el precio promedio de una rebanada de pizza en los lugares que venden pizza alrededor del campus, 3) costo anual de la colegiatura, 4) precio promedio de las bebidas gaseosas
vendidas en los locales de pizza y 5) la ubicacin del plantel (zona urbana versus rural o suburbana). Los datos obtenidos de nuestra encuesta hipottica se presentan en la tabla 5.1.
Las razones de la seleccin de estas variables estn basadas en la teora econmica de
la demanda. Por lo tanto, debe resultar claro por qu el precio de la pizza y el precio de su
2Sin

embargo, podra argumentarse que el clima afecta la demanda va su impacto sobre "el gusto y las
preferencias" de los consumidores.

Captulo 5 Estimacin de la demanda

169

Tabla

.1

Datos muestra: la demanda de pizza

UNIVERSIDAD

1
2
3
4
S
6
7
8
9
10
11
12
13
14
1S
16
17
18
19
20
21
22
23
24
2S
26
27
28
29
30

10
12
13
14
9
8
4
3
1S
12
13
14
12
10
10
12
11

12
10
8
9
10

11
12
13
10
9
8
8
5

Y =Cantidad
X1 = Precio de la pizza
X2 = Costo de la colegiatura
X3 = Precio de las bebidas gaseosas
x4 = Ubicacin

170

Economa de empresa

100
100
90
9S
110
12S
12S
1SO
80
80
90
100
100
110
12S
110
1SO
100
150
1SO
1SO
12S
125
100
7S
100
110
12S
1SO
1SO

14
16
8
7
11
S
12
10
18
12
6
S
12
10
14
1S
16
12
12
10
13
15
16
17
10
12
6
10

8
10

100
9S
110
90
100
100
125
1SO
100
90
80
7S
100
12S
130
80
90
9S
100
90
95
100
9S
100
100
110
12S
90
80
95

1
1
1
1

o
o
1

o
1
1
1
1
1

o
o
1

o
1

o
o
o
1
1

o
1
1

o
o
o
o

producto complementario, una bebida gaseosa, se seleccionaron para este estudio. Pero
algunas veces el investigador quiz tenga que usar algo de creatividad para encontrar las
variables que representan factores tales como el ingreso y gustos y preferencias. Debido a
la dificultad de encontrar el ingreso promedio de los estudiantes (o de sus familiares) que
asisten a una universidad en particular, el costo de la colegiatura se us como una variable sustituta. La variable nula o simulada de ubicacin se incluy para averiguar si la demanda de pizza se ve afectada por el nmero de sustitutos disponibles para la pizza. La
suposicin detrs de esto es que las universidades en reas urbanas pueden tener alrededor
ms establecimientos de comida entre los cuales escoger y esto puede afectar de manera
adversa la demanda de pizza por parte de los estudiantes.
Al utilizar estos datos, entonces expresamos la ecuacin de regresin que ser estimada de la siguiente forma lineal aditiva:
Y'"' a+ b1 X1 + b2 X2 + b3 X3 + b4 X4

donde Y

a=

xl

X2 =
X; =
X4 =

bl' b2, b31 h4 =

cantidad demandada de pizza (nmero promedio de rebanadas per c<lpita mensuc'tles)


el valor constante o interseccin de Y
precio ptomedio de la rebanada de pizza (en centavos)
colegiatura anual (en miles de dlares)
precjo prom.edio de una lata de 12 onzas de bebida gaseosa (en centavos)
ubicacin del caro pus (1 si est< ubicado en un rea concentrada urbana, O
si es de otra forma)
los coeficientes de las variables de X que rn.iden el in1pacto de las variables
en la demanda. de pizza

Y, o la cantidad demandada, se llama la variable dependiente. Las variables X se


denominan variables independientes o explicativas. Es importante observar la unidad de
medida utilizada para cada una de las variables. El investigador puede elegir cmo archivar los datos para su empleo en el anlisis de regresin. Aqu estamos midiendo los precios de la pizza y de las bebidas gaseosas en centavos y el costo de la colegiatura en miles
de dlares. Observe tambin que la unidad de medicin para la variable de ubicacin es
muy diferente de las otras; toma un valor de "1" si el campus est ubicado en un rea urbana y de "O" si es de otro modo. Mediante la medicin de la ubicacin en esta forma, la
variable de ubicacin se considera como una variable binaria o nula. Dado este sistema
particular de la ecuacin de regresin y del esquema de medicin para las variables, podemos ahora estimar los valores de los coeficientes b de las variables independientes, as
como el trmino de interseccin a mediante el empleo de uno de los muchos paquetes de
software disponibles que contenga anlisis de regresin.

Estimacin e interpretacin de los coeficientes de regresin


Entre los paquetes de software utilizados por los economistas para llevar a cabo un anlisis
de regresin para la demanda de un bien o servicio estn el SPSS, SAS y Micro TSP. Para
estimar la demanda de pizza empleamos la funcin de regresin contenida en Excel.
Aunque sta slo contiene los elementos bsicos de regresin (por ejemplo, no proporciona una prueba de Durbin-Watson), creemos que es perfectamente adecuada para muchos
tipos de anlisis de regresin que seran llevados a cabo en la investigacin de negocios.
Adems, Excel (y Lotus 1-2-3) est ms disponible tanto en negocios, colegios y universidades que los paquetes de software de estadstica.

Captulo 5 Estimacin de la demanda

171

Mediante la funcin de regresin en Excel, obtuvimos las siguientes estimaciones para nuestra ecuacin de regresin de demanda de pizza.

y ::o.

= 0.717

+ 138X2
estndar

--

la

y= 1.64

(Los errores estndar de los coeficientes estn listados entre parntesis.)


Antes de interpretar estos resultados, debemos pensar acerca de qu direccin de
impacto de los cambios en las variables explicativas se esperan en la demanda de pizza,
como se evidencia por los signos de los coeficientes estimados de regresin. Para decirlo
ms formalmente, podemos expresar las hiptesis siguientes acerca de la relacin anticipada entre cada una de las variables explicativas y la demanda de pizza:
Hiptesis 1: El precio de la pizza (X1) es una determinante inversa de la cantidad demandada de pizza (es decir, se espera que el signo del coeficiente sea
negativo).
Hiptesis 2: Si se supone que el costo de la colegiatura es una variable sustituta para el ingreso, la pizza podr ser "normal" o "inferior". Por lo tanto,
suponemos que el costo de la colegiatura (X2) es una determinante de la
demanda de pizza, pero no podemos decir de antemano si es una determinante inversa o directa (es decir, el signo del coeficiente puede ser positivo
o negativo).
Hiptesis 3: El precio de la bebidas gaseosas (X3) es una determinante inversa
de la demanda de pizza (se espera que el signo del coeficiente sea negativo).
Hiptesis 4: Se espera que la ubicacin en un escenario urbano (X4) sea una
determinante inversa de la demanda de pizza.
Volviendo ahora a los resultados de regresin, observamos que el coeficiente de X1
tiene un signo negativo, y esto es exactamente lo que esperaramos debido a la ley de la
demanda. Al cambiar el precio de la pizza (X1), la cantidad demandada de pizza cambiar en direccin opuesta. Esto es lo que nos dice un coeficiente negativo. El signo positivo del coeficiente del costo de la colegiatura indica que los costos de colegiatura y la
cantidad de pizza estn directamente relacionados. Un costo ms alto de colegiatura est asociado con una demanda mayor de pizza y viceversa. Por lo tanto, la pizza parece
ser un producto "normal". El signo negativo del precio de la bebida gaseosa confirma la
complementariedad entre pizza y bebidas gaseosas. Al elevarse el precio de las bebidas
gaseosas, los estudiantes de licenciatura tienden a comprar menos pizza. Lo contrario
seguira siendo cierto para una reduccin en el precio de una bebida gaseosa. Finalmente, el signo negativo de la variable nula de ubicacin nos dice que aquellos estudiantes que asisten a universidades en reas urbanas comprarn cerca de la mitad de
una rebanada de pizza por mes (0.544) menos que sus contrapartes en los suburbios o
reas rurales.
Un poco ms complicada es la interpretacin de las magnitudes de los coeficientes
estimados de regresin. Cada coeficiente estimado nos dice cunto cambiar la demanda
de pizza en relacin con un cambio unitario en cada una de las variables explicativas. Por
ejemplo, una b1 de -0.088 indica que un cambio unitario en el precio dar como resultado
un cambio en la demanda de pizza de 0.088 en la direccin opuesta. El precio, como usted

172

Economa de empresa

recordar, estaba medido en centavos. Por lo tanto, de acuerdo con nuestras estimaciones
de regresin, un incremento de 100 centavos (o $1.00) dar como resultado una disminucin en la cantidad demandada de pizza de 8.8 (100 X 0.088)~1Un incremento en el costo
de colegiatura de una unidad (en este caso$ 1,000) da como resultado un incremento en
la cantidad demandada de pizza de 0.138. Estos cambios y los asociados con las modificaciones en el precio de las bebidas gaseosas y en la ubicacin del campus universitario
son sustanciales o intrascendentes?
Los investigadores que constantemente estiman la demanda para un bien o servicio
en particular tendrn una idea exacta de si las magnitudes de los coeficientes estimados en
un estudio especfico son altas o bajas en relacin con sus otros trabajos. Pero si no existen
otros estudios disponibles para comparar, entonces los investigadores pueden al menos
usar las elasticidades de la demanda con el fin de calibrar el impacto relativo que las variables explicativas tienen en la cantidad demandada.
A partir de nuestra explicacin de elasticidad en el captulo 4, usted puede ver que
los resultados del anlisis de regresin son ideales para la estimacin de la elasticida9pu~. Recuerde que la frmula para calcular la elasticidad punto es
:::.:

dO
dX

"--~

X
~

-~--

donde Q = cantidad demandada y X = cualquier variable que afecte Q (por ejemplo, precio o ingreso). En el caso de nuestra demanda estimada de pizza, supongamos que las variables explicativas tienen los siguientes valores:
Precio de pizza (X1) = 100 ($1.00)
Costo anual de la colegiatura universitaria (X2) = 14 ($14,000)
Precio de una bebida gaseosa (X3) = 110 ($1.10)
Ubicacin del campus (X4) =rea urbana (X4 = 1)
Entonces, al insertar estos valores dentro de la ecuacin estimada resulta
Y= 26.67 0.088 {100) + 0.138 (14) 0.076 (110) 0.544 (1)
10.898 o 11 (redondeado a la fraccin ms cercana)

Para calcular las elasticidades punto para cada una de las variables considerando los
valores precedentes, simplemente insertamos los nmeros apropiados dentro de la frmula de elasticidad. La derivada parcial de Y respecto de los cambios en cada una de las
variables (oY/oX) es simplemente el coeficiente estimado de cada una de las variables.
Elasticidad

100

. ---o.o88 x To.ae~i

Elasticidad del costo de la colegiatura: O. 138 x

Elasticidad precio cruzada:

0.076 x

'=

---o.so7

14

16:898 " 0.177


11 o
10:898 =

0.767

Con estas estimaciones, podemos decir que la demanda para pizza es algo inelstica
en el precio y que hay algn grado de elasticidad precio cruzada entre las bebidas gaseosas y la pizza. A juzgar por el coeficiente ms bien bajo de 0.177, el costo de la colegiatura
no parece tener un gran impacto en la demanda de pizza.

Captulo 5 Estimacin de )a demanda

173

de

acin

Nuestros resultados de regresin estn basados en una muestra de universidades estadounidenses. Cmo confiar que estos resultados reflejan en verdad a la poblacin de los
estudiantes de licenciatura? La prueba bsica de la significancia estadstica de cada uno
de los coeficientes estimados de regresin se llama prueba-t. Esencialmente, esta prueba
se lleva a cabo mediante el cmputo del valor-t o estadstica-t para cada uno de los coeficientes estimados. Esto se hace mediante la divisin del coeficiente estimado entre su
error estndar.3 Esto es:
t ........

Como es prctica comn en las presentaciones de resultados de regresin, los errores


estndar en nuestra regresin de pizza se presentan entre parntesis bajo los coeficientes estimados. Mediante la regla de 2, podemos decir que el coeficiente estimado es estadsticamente significativo si el valor absoluto del coeficiente dividido entre _su error estndar es
mayor que o igual a 2.4
Es evidente a partir de la ecuacin de regresin precedente que X1 (precio de la pizza) y X3 (precio de las bebidas gaseosas) son estadsticamente significativas debido a que
los valores absolutos de sus estadsticas-t son 4.89 y 3.80, respectivamente. Las otras dos
variables,
(colegiatura) y
(ubicacin), no son estadsticamente significativas debido
a que los valores absolutos de sus estadsticas-t son menores que dos.
Si el coeficiente estimado de una variable pasa la prueba-t, podemos estar confiados
de que la variable verdaderamente tiene un impacto en la demanda. Si no pasa la pruebat, entonces, con toda probabilidad, la variable no tiene verdaderamente un impacto para
toda la poblacin de estudiantes universitarios. En otras palabras, los coeficientes de regresin son nmeros diferentes a cero simplemente debido a un evento fortuito en la
muestra de estudiantes que tomamos a partir de la poblacin.
En el anlisis estadstico, lo mejor que podemos esperar es estar muy seguros de que
nuestros resultados muestrales verdaderamente reflejen la poblacin que representan.
Sin embargo, nunca podemos estar absolutamente seguros. Por ello, los analistas estadsticos fijan grados de incertidumbre. Como se explicar con mayor detalle ms adelante en
este captulo, el usar la regla de 2 generalmente implica un nivel de 5% de significancia.
En otras palabras, al declarar un coeficiente que aprueba la versin de la regla de 2 de la
prueba-t como estadsticamente significativo, nos encontraremos abiertos a una posibilidad de un 5% de probabilidad de que estemos equivocados.
Otro indicador estadstico importante utilizado para evaluar los resultados de regresin
es el coeficiente de determinacin o R2 Esta medida muestra el porcentaje de variacin en
una variable dependiente que se explica por la variacin en todas las variables explicativas
en la ecuacin de regresin. Esta medida puede ser tan baja como O(que indica que las variaciones en la variable dependiente no son explicadas en absoluto por la variacin en las
variables explicativas) y tan alta como 1.0 (que indica que toda la variacin en la variable dependiente puede explicarse por las variables explicativas). Para los analistas estadsticos,
cuanto ms cercano est R2 a 1.0, mayor ser el poder explicativo de la ecuacin de regresin.

x2

x4

la siguiente ecuacin, el pequeo "sombrero" (acento circunflejo) sobre bes una notacin comnmente
utilizada en el anlisis estadstico para denotar un valor estimado a partir de una muestra de datos.
4Se recuerda al lector que sta es slo una descripcin breve de la prueba-t. Para mayores detalles, vea la
explicacin completa ms adelante en este captulo.
3En

174

Economa de empresa

En nuestra regresin de pizza, R2 = 0.717, esto significa que cerca del72% de la variacin en la demanda de pizza por los estudiantes de licenciatura puede explicarse por la
variacin en el precio de la pizza, el costo de la colegiatura, el precio de una bebida gaseosa y la ubicacin del campus. Como se ver ms adelante en este captulo, R2 se incrementa al agregar ms variables independientes a la ecuacin de regresin. Por ello, muchos
analistas prefieren utilizar la medicin que se ajuste al nmero de variables independientes utilizadas de tal forma que las ecuaciones con nmeros diferentes de variables independientes puedan compararse de una manera ms precisa. Esta medicin alternativa se
denomina R2 ajustada. As, resulta que la R2 ajustada para esta ecuacin es 0.67. Otra
prueba, llamada prueba-F, se utiliza muchas veces en conjuncin con la R2 Los lectores
interesados podrn remitirse a "La prueba-F", ms adelante en este captulo para una
explicacin de esta prueba.

Repaso

lisis

de resu
Ahora revisaremos todos los pasos clave explicados hasta ahora en el anlisis de regresin de una ecuacin de demanda mediante la siguiente ecuacin:
Q "' 70 ., 10P l- 4Px

+ 501

( ':'
v)

errores
n

m ados
entre

El signo negativo para la variable P


indica una relacin inversa entre el precio y la cantidad demandada de un producto. Un
incremento unitario en el precio (1 centavo) causar que la cantidad disminuya en 10 unidades. Una disminucin en el precio causar un incremento en la cantidad de 10 unidades. As
por ejemplo, si el precio disminuyera en $1.00, la cantidad se incrementara en 1,000 unidades.
El signo positivo para la variable Px indica una relacin directa entre el precio de un
producto relacionado y la cantidad demandada. Esto indica que el producto relacionado
es un sustituto del producto en cuestin. Por ejemplo, si el precio del producto relacionado cambia en una unidad (por ejemplo, 1 centavo), entonces la cantidad demandada del
producto en cuestin cambiar en 4 unidades en la misma direccin.
El signo positivo para la variable I indica que el producto es normal o quiz superior,
dependiendo de la magnitud del coeficiente de elasticidad ingreso. Un cambio unitario
en el ingreso per cpita ($1,000) causar que la cantidad cambie en 50 unidades en la misma
direccin.
5

de

demanda

175

Clculo de coeficientes de elasticidad Para calcular los coeficientes


Paso
de elasticidad, necesitamos asumir ciertos niveles de variables independientes P, Px e I.
Digamos que son:
P 100 (recuerde, esto es 100 centavos o $1.00)
PX = 1

(tambin en centavos)

25

representa $25,000)

Al insertar estos valores dentro de la ecuacin previa resulta


Q = 70

10(100)

+ 4(120) . 50(25)
!.

Q .:. 800

Ahora usamos la frmula para la elasticidad punto a fin de obtener los coeficientes
de elasticidad. Recuerde que
E

8Q

::::::

" ox a

Al utilizar esta frmula, obtenemos


.. --1 o . ~g_g
800
-- 1

... 6
E

25
::-.::50
800

.: : . 1.56

Determinacin

significancia estadstica Mediante la "regla

de 2" como una aproximacin al nivel .05 de significancia, podemos decir que P y Px son
estadsticamente significativas debido a que sus valores t son mayores que 2 (por ejemplo, 3.3 y 2, respectivamente). I no es estadsticamente significativa al nivel .05 debido a
que su valor t es slo 1.67.
Como una consideracin adicional, observamos que R2 de .47 indica que el47% de la
variacin en la cantidad puede explicarse por las variaciones en las tres variables independientes P, Px e I. Aunque sta no es en realidad una indicacin de significancia estadstica, muestra el poder explicativo de la ecuacin de regresin. Para datos de corte
transversal, este nivel R2 se interpreta como moderadamente alto.

Implicaciones del anlisis de regresin


para decisiones administrativas
En nuestra experiencia, la "prueba del budn" en el mundo de los negocios de cualquier
anlisis estadstico, incluso el anlisis de regresin, es el grado con el que estos resultados
176

Economa de empresa

pueden ayudar a los directivos a tomar buenas decisiones. En nuestro ejemplo de pizza,
los resultados indican que el precio de la pizza y el precio de su producto complementario,la bebida gaseosa, son factores clave que influyen en la demanda de pizza. Sus coeficientes de elasticidad son menores que 1 y ambos coeficientes de las variables aprobaron
la prueba-t. Qu significa esto para quienes estn en el negocio de la pizza? Primero, esto significa que ellos pueden esperar que las disminuciones en el precio conduzcan hacia
disminuciones en el ingreso, al permanecer otros factores constantes. Por lo tanto, probablemente no desearn tratar de bajar el precio en un esfuerzo por incrementar las ventas.
Pero tratarn de bajar el precio de las bebidas gaseosas, con la anticipacin de que el precio
ms bajo en las bebidas gaseosas atraer a la gente a comprar pizzas.
En el anlisis estadstico muchas veces resulta tan importante encontrar qu es lo que
no pasa la prueba-t como encontrar lo que s la pasa. En nuestro ejemplo, aprendimos que el
costo de la colegiatura y la ubicacin no tenan impactos estadsticamente significativos
en la demanda de pizza. Ms an, las magnitudes de sus coeficientes eran relativamente
pequeas. Para los directores de las cadenas nacionales tales como Pizza Hut o Domino's,
esto indicara que ellos no tendran que estar muy preocupados acerca del tipo de universidad (privada o pblica) o de su ubicacin (urbana o rural) al decidir dnde abrir
franquicias de pizza.
Esperamos que este resumen sea suficiente para aquellos profesores y lectores que
simplemente quieren una idea general de cmo se emplea el anlisis de regresin en el
anlisis de negocios y en la toma de decisiones. Para una explicacin ms detallada, habr que continuar con el resto del captulo.

A.NLISIS DE REGRESIN
El propsito bsico del anlisis de regresin es el de estimar la relacin cuantitativa entre
variables. El primer paso en este procedimiento estadstico es el de especificar el modelo
de regresin (tambin llamado ecuacin de regresin). El segundo consiste en obtener
datos acerca de las variables especificadas en el modelo. El tercero es el de estimar el
impacto cuantitativo que cada una de las variables independientes tiene en la variable
dependiente. El cuarto paso es el de probar la significancia estadstica de los resultados de
regresin. Finalmente, los resultados del anlisis de regresin resultan tiles como material de apoyo en la elaboracin de polticas y en la toma de decisiones de negocios.
El anlisis de regresin implica dos tipos bsicos de variables: la variable dependiente y las variables independientes. Estas ltimas se conocen tambin como variables explicativas. Como indica su nombre, la variable dependiente es aquella cuyo valor depende
del valor de alguna otra variable o variables. La variable dependiente es el foco central de
cualquier estudio de regresin y es la variable que los investigadores tratan de explicar y
predecir. En anlisis de regresin de la demanda, la variable dependiente es la cantidad
demandada de un bien o servicio en particular. Si slo una variable independiente se emplea en el anlisis, usamos el trmino regresin simple. Si est implicada ms de una variable
independiente, usamos el trmino regresin mltiple. Como usted esperara, las variables independientes ms comnmente empleadas en el anlisis de regresin de la demanda son el
precio, precios de productos relacionados, gustos y preferencias, ingreso y nmero de compradores. Para propsitos de explicacin e ilustracin, es mucho ms fcil enfocamos en la
regresin simple. Despus de que el modelo de regresin simple haya sido desarrollado y
explicado, presentaremos el modelo de regresin mltiple.
Captulo 5 Estimacin de la demanda

177

El modelo de regresin simple


Nuestra explicacin de la regresin simple comienza con la expresin formal de la relacin que suponemos que existe entre la variable dependiente y la independiente. Esta relacin se expresa como la siguiente ecuacin matemtica:
Y" a+ bX +u

donde Y=
X . .oc:

(5.1)

v<:~rinble

depenclienle
independiente
a = interseccin
=: pendiente
u :e
aleatorio

Advierta que el anlisis de regresin busca la mejor relacin lineal entre la variable dependiente y la variable independiente.s As, a denota la interseccin de la lnea y b la pendiente de la lnea. Observe que otro trmino, u, se incluye en la expresin formal del modelo
de regresin. Generalmente se le conoce como trmino "aleatorio" o de "error". Aunque su
valor no es realmente una parte del impacto estimado de X en Y, su inclusin en la ecuacin
formal de regresin es esencial. Para entender por qu, haremos una breve digresin acerca
de la diferencia entre modelos deterministas y modelos probabilsticos en el anlisis estadstico.
Suponga que usted desea desarrollar un modelo simple del consumo de gasolina de
su carro, con la cantidad de gasolina utilizada como la variable dependiente y el nmero
de millas viajadas como la variable independiente. Si usted supiera el nmero de millas
por galn que su carro es capaz de obtener, cuantificar esta relacin sera cuestin de simple
aritmtica. Por ejemplo, si el millaje de gasolina de su auto es de 20 millas por galn y usted
recorri 100 millas, su consumo sera de 5 galones de gasolina. Esta relacin puede generalizarse como Y = 0.05X. La figura 5.1a muestra la relacin determinstica entre X y Y.
Ahora suponga que usted decide medir la relacin entre millas recorridas y gasolina
consumida mediante el registro de esta informacin para 5 viajes separados, cada uno 100
millas ms largo que el anterior, empezando con un viaje de 100 millas. Como usted puede
imaginar, la cantidad real de gasolina consumida relativa a las millas viajadas no conformara exactamente lo que se predice en el modelo determinstico. Suponga que los datos
almacenados reales son los mostrados en la figura 5.1b. Como usted puede observar, la
esquematizacin de cada millaje de viaje junto con el consumo de gasolina en realidad
da como resultado puntos dispersos en lugar de un camino de puntos a lo largo de una
lnea recta. Esto implica que otros factores adems de las millas recorridas (condiciones
climticas, patrones de trnsito y hbitos de manejo) afectan el consumo de gasolina.
Nuestro modelo de millaje de gasolina debe, por tanto, reformularse como Y = 0.05X + u,
donde el valor de u es responsable de la desviacin de los puntos de una lnea recta que
representa Y = 0.05X. La variable u representa los factores diferentes a la variable independiente que pueden afectar el valor de la variable dependiente.
Asumimos en teora estadstica que este factor u tiene un impacto aleatorio ms
que un impacto sistemtico en la variable dependiente. En teora estadstica, los eventos aleatoriamente ocurridos se describen en trminos de la probabilidad de su ocurrencia.
5La

aplicacin de la regresin a los problemas econmicos generalmente supone una relacin lineal entre
la variable dependiente y la(s) variable(s) independiente(s). De hecho, el trmino anlisis de regresin lineal se utiliza muchas veces en los estudios econmicos. Existen tcnicas ms avanzadas de regresin no
lineal. Sin embargo, como se muestra ms adelante, los economistas frecuentemente transforman relaciones no lineales en ecuaciones adecuadas para el anlisis de regresin lineal.

178

Economa de empresa

Y (galones)

Y (galones)
y= 0.05X

y= 0.05X +u

25

25

20

20

15

15

10

10

100 200 300 400 500X (millas)

100 200 300 400 500X {millas)

(a)

(b)

Figura 5.1
Modelo de consumo de gasolina
De aqu que el trmino probabilstico se utilice para describir una ecuacin que contiene el
elemento aleatorio u. Usted ver por qu es importante entender la naturaleza de un modelo probabilstico cuando lleguemos a la seccin donde se estudia la significancia estadstica de los resultados de regresin.

Datos utilizados en el anlisis de regresin


Los datos utilizados en el anlisis de regresin estn divididos en dos tipos: de corte transversal y de series de tiempo. Los datos de corte transversal proporcionan informacin de
una variable en un punto determinado en el tiempo. Los diferentes valores de la variable representan un corte cruzado de las observaciones de entidades tales como individuos, grupos de individuos y ubicaciones (ciudad, municipio, rea metropolitana, estado o pas). Los
datos de series de tiempo proporcionan informacin de una entidad a lo largo del tiempo
(por ejemplo: ingreso anual per cpita de un estado durante un periodo de 20 aos). Los
ejemplos de pizza citados anteriormente implicaban datos de corte transversal, dado que la
informacin estaba reunida en una porcin de individuos en las universidades en un punto determinado en el tiempo (en realidad, un periodo de una semana). La informacin basada en series de tiempo puede implicar el seguimiento de las compras per cpita de pizza
en una regin determinada del pas relativa a su precio durante un periodo. Por ejemplo,
podramos buscar el consumo per cpita anual de pizza en Estados Unidos.

Estimacin de la ecuacin de regresin


La estimacin de la ecuacin de regresin implica una bsqueda de la mejor relacin lineal entre la variable dependiente y la independiente. As, la ecuacin de regresin que
buscamos para estimar se expresa como

(5.2)
Captulo 5 Estimacin de la demanda

179

X
~)

X
(b)

Figura 5.2
Representaciones lineales de grficas de dispersin

donde Y:;:;: variable dependiente

X = variable independiente
a = intercepcin de lnea con eje Y
lJ = pendiente de la lrH:'a
La intercepcin y la pendiente generalmente se denominan como parmetros o coeficientes de la ecuacin de regresin.
La figura 5.2 muestra una grfica de dispersin de datos hipotticos para Y y X. Como se indica en la parte a de esta figura, en la grfica de dispersin podra dibujarse cualquier nmero de lneas para representar la relacin entre Y y X. En el anlisis de regresin
la forma ms comn de estimar la relacin se llama mtodo de los mnimos cuadrados
ordinarios (MCO).* En esencia, este mtodo requiere dibujar una lnea a travs de la dispersin de puntos, de tal forma que la suma de las desviaciones cuadradas de cada uno de los
puntos respecto a la lnea sea minimizada. Los mnimos cuadrados se muestran en la figura
5.2b. Una ilustracin del mtodo de los mnimos cuadrados se presenta en la figura 5.3.
La estimacin real de la lnea de regresin es una cuestin relativamente simple, dada la disponibilidad de computadoras y paquetes de software. Muchas calculadoras de
mano contienen programas o teclas de funciones especiales para estimar las ecuaciones
de regresin simple. Sin embargo, cuando se utiliza ms de una variable independiente
(anlisis de regresin mltiple), se requiere del poder de procesamiento de una computadora. En cualquier caso, quienes deseen revisar las frmulas para la estimacin de
ecuaciones, as como las derivaciones matemticas de estas frmulas, pueden consultar
un texto de estadstica o econometra. Mediante el mtodo de los mnimos cuadrados,
llegamos a la lnea de regresin que se indica en la figura 5.2b.
Aunque el mtodo de mnimos cuadrados proporciona una buena representacin lineal de la dispersin de puntos, existe claramente una diferencia en el ajuste de las lneas de
N.T. En ingls, Method of Ordinary Least Squares (OLS).

180

Economa de empresa

Figura 5.3
Minimizacin de la suma de
las desviaciones cuadradas

mnimos cuadrados mostradas en las figuras 5.4a y b. Una simple observacin indica que la
figura 5.4b representa un mejor ajuste de la lnea de regresin a travs de la dispersin de
puntos. Esto se debe obviamente a la naturaleza de la dispersin de los puntos y no a la forma en que se construyeron estas lneas. Ambas lneas de regresin fueron dibujadas de forma
que se cumpla el criterio de los mnimos cuadrados. Por tanto, sera til contar con alguna
medicin de qu tan bien una lnea de regresin se ajusta a la dispersin de puntos.

Figura 5.4
Lneas de regresin con diferentes ajustes a travs de los puntos de dispersin
y

(a)

Captulo 5 Estimacin de la demanda

(b)

181

Co

FICI N
D DETE MINACIN:
UNA MEDIDA D L PODER EXPLICATIVO
DE LA CUACIN D
REGRESIN
STIMADA 6
Para explicar el significado del coeficiente de determinacin, necesitamos introducir algunos conceptos y notaciones utilizados en los textos de estadstica y econometra. Siempre que se presentan los resultados de regresin basados en datos muestrales, se coloca
un "sombrero" (acento circunflejo) sobre los valores estimados:
(5.3)

El sombrero sobre Y, a y b significa que sus valores son estimados mediante el empleo de un conjunto de datos muestrales. Un mtodo razonable para medir qu tan bien
esta ecuacin de regresin estimada determina el valor de Y dado el valor de X, es comparar los valores de Y con los valores reales de Y tomados en la muestra.
La grfica de dispersin que aparece en la figura 5.5 ayudar a explicar este enfoque.
La ecuacin (5.3) representa la lnea de regresin estimada a travs de la dispersin de puntos. Tomemos uno de estos puntos, el punto A, para propsitos de ilustracin. Usted puede
ver que la desviacin de este punto respecto a la lnea de regresin se indica por la distancia
entre A y B en la figura 5.5. Si acumulramos las desviaciones cuadradas de cada uno de los
puntos de la lnea de regresin, obtendramos la suma ms pequea posible, debido a que
se utiliz el mtodo de mnimos cuadrados para estimar la lnea de regresin. As, en la
evaluacin del ajuste de esta lnea de regresin para la grfica de dispersin de los datos
reales, necesitamos algn estndar de comparacin.

Figura 5.5
Desviaciones
explicadas y no
explicadas

6Esta

seccin se deriva en gran parte de la explicacin presentada en H. Kelejian y W. Oates, Introduction

to Econometrics, New York: Harper & Row, 1989.

182

Economa de empresa

Suponga que se le pide predecir la cantidad de pizza demandada por los consumidores sin la ayuda de una ecuacin de regresin. No sera razonable utilizar el valor medio
(esto es, el promedio aritmtico) de la cantidad demandada como el valor pronosticado? Los
tericos estadsticos, de hecho, utilizan el valor medio de la variable dependiente (Y) como
la base para la comparacin de la "bondad del ajuste" de la lnea de regresin respecto
a la dispersin de los puntos reales de informacin. En efecto, esta medicin particular
responde a la pregunta: qu tanto resulta mejor utilizar la lnea de regresin para predecir el valor de Y en comparacin con el simple uso de la media de Y?
En la figura 5.5,la media de Y (Y) se indica mediante la lnea punteada. La desviacin
de lnea de regresin del valor medio de Y se indica por la distancia entre los puntos B y
C. Observe que la lnea de regresin siempre pasa a travs del punto que representa la
media de X y la media de Y.7 Esto se indica por el punto Den la figura 5.5. Por lo tanto,
observamos en la figura 5.5 que la desviacin de un valor muestra! de Y a partir de su media
puede dividirse en dos componentes separados: AB y BC. Ms formalmente, podemos
afirmar lo siguiente:
'""' Desviacin
de la muestra

de! i-simo valor muestra! de Y respecto a la media

'"" (Y; -- Y) ~" Desviacin explicada de Y1 respecto a Y

AB '''

(Y,. - Y) ''

Desviacin no explicada de

Y,. respecto a \/

BC es la desviacin "explicada" del valor muestra! de Y respecto a su media debido a

que ste puede explicarse por la lnea de regresin. ABes la porcin "inexplicada" de la
desviacin total, debido a que su valor difiere del valor estimado mediante la lnea de
regresin. Si la ruptura entre los componentes explicados e inexplicados se midiera para
cada observacin, y los valores resultantes se elevaran al cuadrado (para compensar por
desviaciones negativas y positivas) y despus se sumaran, llegaramos a las siguientes
relaciones:
STC = l( Y;

YV

::::=

SCR =, 2.:{ Y

Y) 2

= Suma de cuadrados de

SCE '"~(Y
1

YV
1

Suma total
cuadrados
(suma
las desviaciones cuadradas de los valores muestrales
de Y respecto a la media)
regresin
(suma de las desviaciones cuadradas de los valores estimados
respecto a !a media)

Suma de los cuadrados de los errores


(suma de las desviaciones cuadradas de los valores muestrales
respecto a los valores estimados)

Las abreviaciones STC, SCR y SCE se utilizan comnmente en los libros de econometra para estas relaciones, as que aqu los utilizaremos en referencia a los componentes totales, explicados y no explicados, respectivamente, de la variacin de los valores de la
muestra respecto a su media. Para resumir podemos decir simplemente que STC = SCR +
SCE. A partir de estas relaciones, podemos construir una medicin del poder explicativo
de la ecuacin de regresin.
7para la prueba de por qu siempre es ste el caso cuando el mtodo de los mnimos cuadrados se utiliza,
consulte un texto de estadstica o de econometra.

Captulo 5 Estimacin de la demanda

183

R2 =O

(Y= y)

R2 = 1

(a)

(b)

Figura 5.6
El coeficiente de determinacin

La medicin del poder explicativo de la ecuacin de regresin que se utiliza ms comnmente se llama coeficiente de determinacin. El smbolo utilizado para esta medicin
es R2 Definimos esta medicin de la forma siguiente:
SCR
STC

----- --- ::e::

SCE
1 - --------STC

{5.4)

Si SCR es igual a STC, esto significa que la desviacin total de Y respecto a su media
muestra! puede ser explicada por la ecuacin. Esto tambin implica que R2 es igual a 1.
Otra forma de ver esta situacin es buscar la expresin alternativa de R2, 1-SCE/STC. Si
la lnea de regresin explica la desviacin total de Y respecto a su media, no habra suma
de cuadrados de error (SCE = 0). Esto significa que SCE/STC =O, y por tanto R2 = l.
La figura 5.6a ilustra una situacin en la que R2 = l. Usted puede ver en esta figura que
R2 = 1 significa que cada punto en la grfica de dispersin descansa sobre la lnea de
regresin.
En el otro extremo, si la lnea de regresin no explica ninguna variacin de Y a partir
de su media, R2 asume el valor de O. Como se ve a partir de la frmula, R2 =O significa
que SCR/STC = O. Mediante la frmula alternativa para R2, vemos que esto significa que
SCE=STC (es decir, SCE/STC = 1). Tal caso podra indicar que el valor medio de Y es justamente tan til como la lnea de regresin de mnimos cuadrados en la prediccin del valor de Y (esto es, Y= Y). La figura 5.6b ilustra este caso.
En realidad, R2 asumir algn valor entre los dos valores extremos de Oy l. Claramente, cuanto ms cercano est R2 a la unidad, mayor ser el poder explicativo de la ecuacin
de regresin. Por ejemplo, un R2 de 0.93 indica un muy buen ajuste de la lnea de regresin a la dispersin de puntos (vea la figura 5.7a). Esta estadstica indica que un 93% de la
variacin en Y respecto a su media puede explicarse por la ecuacin de regresin. Un R2
cercano a Oindica una ecuacin de regresin con muy poco poder explicativo. Por ejemplo,

184

Economa de empresa

Figura 5.7
Indicador del ajuste de la lnea de regresin

R2 = .15 (slo el15% de variacin en Y respecto a su media es explicado) se muestra en la


figura 5.7b.
El que un valor dado para R2 se considere "alto" o "bajo", o "aceptable" o "inaceptable"
en el anlisis estadstico depende del tipo de datos que se estn utilizando (de corte transversal versus series de tiempo), los estndares particulares del investigador y la R2 tpica
calculada en estudios de naturaleza similar. Los estudios que emplean datos de corte transversal generalmente tienen un R2 ms bajo que aquellos que utilizan datos de series
de tiempo. Esto se debe a que los datos de series de tiempo, como cabe esperar, tienen un
elemento de tendencia incorporado que por lo general provoca que las variables Y y X se
muevan cercanamente durante el tiempo. No es poco comn que cuando se estima la demanda utilizando datos de series de tiempo se obtenga un R2 de 0.90 o superior. Los estudios macroeconmicos de la funcin de consumo generalmente tienen un R2 de 0.95 o
ms. Ordinariamente, si un investigador estima una ecuacin de regresin con R2 = 0.75,
significa que el modelo de regresin tiene un poder explicativo ms bien fuerte. Sin embargo, dado que la mayor parte de los estudios de funcin de consumo producen valores
de R2 de 0.95 o ms, un valor R2 de 0.75 en una ecuacin de consumo tendra que considerarse como un valor relativamente bajo.
Hay que mencionar un aspecto adicional acerca de R2 Al aadirse variables adicionales a la ecuacin de regresin (esto es, al movernos de la regresin simple a la regresin
mltiple),la ecuacin de regresin, naturalmente, "explicar" una mayor proporcin de la
variacin en la variable dependiente. De hecho, es posible mostrar que la adicin de algn
nmero aleatorio o variable sin relacin alguna con el modelo de regresin, mejorar la bondad del ajuste de la ecuacin de regresin (incrementar la magnitud de R2). Para compensar
por el hecho de que las ecuaciones de regresin con ms variables independientes tienden a
tener valores de R2 ms altos, podemos utilizar una medicin llamada coeficiente de determinacin "corregido" o "ajustado", R.2. Esta medicin se define como
Captulo 5 Estimacin de la demanda

185

donde k

= nmero de variables independientes

n :::.e::. tarr1ai'o de la muestra

Mediante observacin, usted puede deducir que en la regresin mltiple, R2 exceder


siempre a R.z. La diferencia entre las dos mediciones depender, por supuesto, del tamao
de la muestra (n) y del nmero de variables independientes (k). Para un tamao de muestra dado, R.z mostrar un ajuste incrementado hacia abajo respecto a R2 conforme aumente
el nmero de variables independientes. Sin importar el nmero de variables independientes en la ecuacin, la cantidad del ajuste hacia abajo respecto a R2 disminuir al incrementarse el tamao de la muestra. En cualquier proporcin, casi todos los paquetes de
software para regresin calculan automticamente R2 adems de R2

EVAlUACIN DE LOS COEFICIENTES


DE REGRESIN
----------------------------------'''"''~;,

Hasta aqut hemos estudiado el anlisis de regresin en relacin con lo que se denomina
estadstica descriptiva. Los datos se renen con base en dos variables, una dependiente y la
otra independiente; una lnea se ajusta a travs de la dispersin de puntos que representan los valores de las dos variables; y se desarrolla una medicin de qu tan bien se ajusta la
lnea a la dispersin. Pero para evaluar la utilidad de los resultados del anlisis de regresin en la toma de decisiones de negocios, necesitamos entrar al mbito de la estadstica

inferencia[.
Un investigador que busca cierta informacin acerca de alguna poblacin intentar
obtener datos de la poblacin entera o de alguna muestra de la poblacin. En todos los
casos se emplea una muestra de la poblacin debido al costo prohibitivo de obtener informacin de la poblacin entera. Ms an, en muchos casos es simplemente imposible
obtener los datos de la poblacin entera. Pero si se utiliza una muestra en vez de la poblacin total, el investigador debe evaluar el grado en que los resultados de esta muestra
reflejan a la poblacin. En otras palabras, se vuelve necesario hacer inferencias acerca de la
poblacin con base en lo que se conoce acerca de la muestra, y hacer un juicio acerca de
qu tan buenas son estas inferencias.
Suponga que estamos llevando a cabo un estudio de la demanda de la pizza en un
plantel universitario con una poblacin de 4,500 estudiantes. Las variables en estudio son
el ingreso y la cantidad promedio de rebanadas de pizza demandadas al mes. Suponga
adems que somos capaces de obtener informacin de la poblacin completa de estudiantes. Esto se ilustra en la tabla 5.2, donde los consumidores se han dividido en 10 grupos
de acuerdo con el ingreso semanal despus de descontar impuestos, comenzando con
$100 a la semana e incrementndose en intervalos de $20 hasta $280. El nmero promedio
de rebanadas de pizza compradas al mes se indica en la matriz numrica. Para hacer esta
ilustracin tan simple como sea posible, suponemos que hay 450 estudiantes consumidores
en cada una de las 10 categoras de ingreso. Por ejemplo, si leemos hacia abajo en la columna de $100, vemos que 10 estudiantes (un dcimo de 100) compran un promedio de 10 rebanadas de pizza al mes, 30 estudiantes (un dcimo de 300) compran un promedio de 10.5
rebanadas de pizza al mes, y as sucesivamente. (Note la flecha vertical en la tabla 5.2.)
Al leer a travs de cada flecha observamos el nmero de rebanadas de pizza demandadas

186

Economa de empresa

Tabla 5.2
Nmero de rebanadas de pizza consumidas al mes, por ingreso semanal

(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)

$100

$120

$140

$160

$180

$200

$220

$240

$260

$280

100

10.0
10.5
10.8
11.2
11.5
11.8
12.2
12.5
13.0

11.5
12.0
12.3
12.7
13.0
13.3
13.7
14.0
14.3

13.0
13.5
13.8
14.2
14.5
14.8

14.5
15.0
15.3
15.7
16.0
16.3
16.7
17.0
17.5

16.0
16.5
16.8
17.2
17.5
17.8
18.2
18.5
19.0

17.5
18.0
18.3
18.7
19.0
19.3

19.0
19.5
19.8
20.2
20.5
20.8
21.2
21.5
22.0

20.5
21.0
21.3
21.7
22.0
22.3

22.0
22.5
22.8
23.2
23.5
23.8
24.2
24.5
25.0

23.5
24.0
24.3
24.7

300
600
800
900
800
600
300
100
4,500

15.2
15.5
16.0

19.7
20.0
20.5

22.7
23.0
23.5

25.0
25.3
25.7
26.0
26.5

para las nueve categoras de frecuencia. (Note la flecha horizontal en la tabla 5.2.) Observamos que el nmero de rebanadas de pizza demandadas se incrementa al aumentar el
ingreso semanalmente. Por ejemplo, en la segunda fila, frecuencia 300, vemos que los 30
individuos (un dcimo de 300), que tienen un ingreso promedio semanal de $100 compran
10.5 rebanadas de pizza al mes; los 30 que ganan un promedio de $120 al mes compran 12
rebanadas de pizza al mes, y as sucesivamente. El nmero promedio de rebanadas que
se presenta ms frecuentemente para cada categora de ingreso se observa al leer a travs
de la fila indicada por la frecuencia de 900. Como se observa, esta lnea tambin representa el nmero promedio de rebanadas de pizza para cada categora de ingreso.
La figura 5.8 muestra la distribucin de aquellos consumidores que ganan $200 semanalmente. El conjunto completo de datos en la tabla 5.2 se ilustra en la figura 5.9. Observe

f
100
80
60
40
20

Rebanadas/
mes

Captulo 5 Estimacin de la demanda

Figura 5.8
Demanda de
pizza:distribucin de los
consumidores que ganan
$200 por semana

187

Y(Rebanadas de pizza/mes)

Y= 4+0.075X

200

X (Ingreso promedio semanal)

Figura .9
Distribuciones de frecuencia combinada para la demanda de pizza

que suponemos que hay una distribucin normal y continua para cada nivel de ingreso.
Cada distribucin tiene un valor esperado o media diferente, pero todas tienen la misma
varianza.
Para los datos de tal poblacin la lnea de regresin sera
Y= 4 + 0.075X

(5.5)

Ahora suponga que seleccionamos una muestra de compradores de pizza a partir de


esta poblacin. Como usted se imaginar, esta muestra puede indicar una relacin diferente entre el ingreso y la cantidad demandada de pizza. Para demostrar este hecho, hemos dibujado una "visin amplificada" de una parte de la figura 5.9 en la figura 5.10a. Observe
que el grupo denso de los puntos poblacionales simtricamente colocados alrededor de la
media de cada distribucin refleja la distribucin normal, con forma de campana, que hemos asumido que existe para cada nivel de ingreso.
La lnea slida dibujada a travs de la dispersin de puntos en la figura 5.10 indica la
verdadera lnea de regresin para la poblacin. Sin embargo, la muestra de puntos seleccionados para un estudio de regresin es diferente de la dispersin de puntos de la poblacin.
Esto ocasionara que la ecuacin de regresin estimada para la muestra sea diferente de la
de la poblacin. Ejemplos de posibles diferencias entre la muestra y las ecuaciones de
regresin de la poblacin se presentan en las figuras 5.10b, e y d. Las ecuaciones de regresin de la muestra se representan por las lneas entrecortadas.
Como podr ver, una lnea de regresin de mnimos cuadrados ajustada a travs
de los puntos de la muestra en la figura 5.10b mostrara una relacin positiva entre el
ingreso y la demanda de pizza. Sin embargo, debido a que la pendiente no est tan incli-

188

Economa de empresa

f(Y)

f(Y)

Y=a + bX

(Y= 4 + 0.075X)

+ bX
Y=a
(b < b)

. .

___ .. ---------

f(Y)

f(Y)


--------------

160

200

240

Y= a+ fx
--- ... ---~-

280

(b <O)

(e)

=igura 5.1 O
.nea de regresin de la poblacin y tres lneas de regresin de la muestra

nada como la pendiente de la lnea de regresin para la poblacin, la magnitud de esta


relacin es ms pequea. La muestra indicada en la figura S.lOe indica que no existe ninguna relacin entre ingreso y demanda de pizza. La muestra de la figura 5.10d indica en
realidad una relacin negativa entre ingreso y demanda de pizza, lo que implica que la
pizza es un producto "inferior".
En realidad, los datos de la poblacin tales como los incluidos en la tabla 5.2 son desconocidos para los investigadores. Todo lo que tienen para trabajar son datos de la muestra
del tipo ilustrado en las figuras 5.10b, e y d. Qu tan seguro puede estar un investigador
acerca del grado en el que una ecuacin de regresin para la muestra representa verdaderamente la ecuacin de regresin desconocida para la poblacin? La respuesta a esta
pregunta aparece en la siguiente seccin.

Captulo 5 Estimacin de la demanda

189

La prueba utilizada para establecer, con un cierto grado de certidumbre, que los coeficientes de regresin estimados a partir de los datos muestrales verdaderamente reflejan a la
poblacin, se denomina prueba de significancia estadstica. Debido a que esta prueba implica
lo que se conoce como valores-t, se le denomina comnmente prueba-t.
Nuestra explicacin de esta prueba comienza con un repaso del trmino de error, u, presentado al principio de este captulo. En teora estadstica, se supone que este trmino se
distribuye aleatoriamente alrededor de la lnea de regresin de poblacin en una forma normal, con su media como el valor de Y dado el valor de X y con alguna cantidad de varianza. 8
Como se ilustra en la figura 5.10, un ejemplo aleatorio tomado de la poblacin puede
producir resultados de regresin que son muy diferentes de una lnea de regresin ajustada
a travs de la poblacin. Si repetidamente seleccionramos una muestra aleatoria de un
tamao determinado a partir de esta poblacin y estimramos una lnea de regresin para
cada una de estas muestras, generaramos un gran nmero de lneas de regresin muestra! (vea la figura 5.11). Cada una de estas lneas de regresin muestra! tiene sus propios
coeficientes de intercepcin y de pendiente, ay b. En teora estadstica, se puede mostrar
que si el trmino de error de la poblacin est distribuido normalmente alrededor de su
lnea de regresin con alguna varianza constante (aD, entonces el repetir el muestreo producir una distribucin de coeficientes de regresin estimados, ay b, que estn normalmente

distribuidos con una media o un valor esperado igual a los coeficientes de regresin de la poblacin,
y con una varianza igual a un nmero relacionado con la varianza del trmino de error en alguna
forma sistemtica. Las ecuaciones siguientes expresan este enunciado de una forma notacional. Debido a que estamos interesados primordialmente en los coeficientes de la pendiente,
debemos enfocar nuestra atencin en b. Sin embargo, las mismas afirmaciones se pueden
hacer acerca del trmino de interseccin, a.
b)

(5.6)

(5.7)
La ecuacin (5.6) es muy sencilla. Expresa que la media o el valor esperado del coeficiente estimado bes igual a b, el coeficiente de regresin verdadero (pero desconocido) para la
poblacin completa. La ecuacin (5.7) afirma que la varianza de la distribucin de los coeficientes de regresin estimados de un muestreo repetido de la poblacin es igual a la varianza del trmino de error de la poblacin, u, dividido entre la suma de las desviaciones cuadradas de cada valor observado de X respecto a la media de X. La verbalizacin de la ecuacin
(5.7) es ms bien molesta pero se hace para estar seguros. Pero lo importante es tener en
mente que necesitamos conocer la varianza de la distribucin de los estimadores muestrales
bpara determinar la probabilidad de ocurrencia de cualquier valor de ben particular.
Debido a que la informacin acerca de la varianza de los trminos de error de la poblacin es generalmente desconocida, recurrimos al uso de un estimador de la varianza de
la poblacin. En teora estadstica, es posible mostrar que un estimador sin sesgo de la vaque la distribucin normal es la curva simtrica y con forma de campana usada con frecuencia
en estadstica. Como tal, se puede definir mediante dos valores, su media y su varianza (o desviacin
estndar, la raz cuadrada de la varianza). Cuanto ms grande sea la varianza, ms "dispersa" ser la
distribucin normal.

8Recuerde

190

em

Yz= az + bzX----r--~.,-.:;;._-,r----- Y
1 = 1 + bX

Figura 5.11
Lneas de regresin
producidas por muestreo
repetido

rianza de la distribucin de trminos de error ( fr~) es igual a la suma de los residuos cuadra-

dos de cada uno de los puntos de la muestra respecto a la lnea de regresin estimada, dividida entre el tamao de la muestra menos 2 (esto es, n - 2). Los residuales son las diferencias entre los
':alares reales de Y y los estimados a partir de la ecuacin de regresin (esto es, Y menos
Y). Expresado en forma notacional,

A su vez, el estimador sin sesgo de la varianza del estimador muestra! b (a~) es igual
al estimador de la varianza de los trminos de error divididos entre la suma de las
desviaciones cuadradas de cada valor observado de X respecto a la media de X. En
forma notacional,

Obtenemos la desviacin estndar de la distribucin de los coeficientes muestrales b


tomando simplemente la raz cuadrada de la varianza estimada de esta distribucin. Esto es,
SEr,u ' \/r} 2
D

Como es costumbre, nos debemos referir a la desviacin estndar del coeficiente de


regresin de la muestra como el error estndar del coeficiente (EE 1;). Y, como vamos a
mostrar, EE; juega un papel central en la prueba-t.
Al manejar la prueba-t, comenzamos mediante la hiptesis de que el coeficiente de
regresin verdadero (pero desconocido) para la poblacin es un cierto valor. En el anlisis
estadstico esto se denomina hiptesis nula. Tpicamente en la investigacin econmica, se
hace la hiptesis de que el coeficiente de regresin de la poblacin es O; es decir, no hay
relacin entre X y Y en la poblacin. La hiptesis alternativa es que existe de hecho una relacin entre X y Y. Al utilizar la notacin convencional estadstica, podemos expresar la
hiptesis nula y la alternativa como:
Captulo 5 Estimacin de la demanda

191

Yde la
muestra

Figura 5.1
X

Relacin falsa indicada por


la regresin de la muestra

H0 :b:::::Q
H1."bc;ic:Q
'

Si la b o el coeficiente de la pendiente es verdaderamente O, como expresa la hiptesis


nula, entonces para la poblacin completa, los cambios en X no tendran impacto en Y.
Suponga que el valor verdadero de b fuera de hecho O. Sera an posible seleccionar
una muestra que denotara la relacin entre Y y X? Ciertamente s sera posible, y la figura 5.12 muestra exactamente cmo podra pasar esto. Observe que en esta figura la grfica de dispersin de la poblacin es tal que una lnea de regresin ajustada a travs de los
puntos es horizontal (tiene una pendiente cero). Pero suponga que la muestra que seleccionamos (indicada por los puntos circulados en la figura 5.12) denotara una relacin positiva al fijar una lnea de cuadrados mnimos a travs de la dispersin de la muestra. Con
base en los resultados del anlisis de regresin de los datos muestrales, concluiramos
que existe una relacin directa entre X y Y para la poblacin entera, cuando realmente no
hay ninguna. Esta clase de error sera de obvia preocupacin para los encargados de tomar decisiones. Por ejemplo, suponga que un anlisis de regresin de ventas relacionado
con los gastos de publicidad mostr errneamente una relacin positiva entre las dos variables y sugiri a la empresa incrementar sustancialmente la cantidad de su presupuesto
para publicidad. Dado que en realidad no existe un impacto de la publicidad en las ventas, esta decisin conducira a gastar intilmente los recursos financieros de la empresa.
Afirmamos antes que si el trmino de error de la ecuacin de regresin de la poblacin
est normalmente distribuido, es posible mostrar que los coeficientes estimados de la muestra tambin estn distribuidos normalmente. Tambin es factible demostrar matemticamente que la desviacin estandarizada de cada estimacin muestra! a partir del valor de poblacin real tiene una distribucin-U La figura 5.13 ilustra este punto. En la figura 5.13a, vemos
9La distribucin-t es una distribucin simtrica en forma de campana que se asemeja mucho a la distribucin normal. Esta forma precisa depende de la medicin llamada grados de libertad. En la regresin simple
existen n- 2 grados de libertad. Al incrementarse el tamao de la muestra (n), la distribucin-t tiende hacia
la distribucin estndar normal. En el lmite, las dos se vuelven idnticas.

192

Economa de empresa

P(b)

P(t)

E(b) = b

t=O

(a)

t=2

(b)

Figura 5.1
La distribucin-t

una distribucin normal de los coeficientes b estimados con su punto medio que designa la
media o el valor esperado. El eje vertical de la grfica mide la probabilidad de ocurrencia de
los diferentes valores de b estimados. Obviamente, la media o valor esperado de b tiene la
mayor probabilidad de ocurrir. Suponga que el coeficiente estimado de la muestra bes el que
se indica en el punto A en la figura 5.13a. Cul es la probabilidad de que tal punto ocurra?
Para encontrar la respuesta a esta pregunta, estandarizamos las diferencias entre cualquier
punto en la distribucin y su valor esperado. Esto se hace mediante la siguiente ecuacin:
+
t .....
. .

(5.8)

Este valor muestra a cuntas unidades-t alejadas del valor esperado se encuentra el
coeficiente estimado b. Para interpretar este valor-t, necesitamos saber el nmero de grados
de libertad (d.f., del ingls degrees offreedom) implicados en este caso. Para cualquier muestra determinada, d.f. se define como n - k -1 , donde n, k y 1 representan el tamao de la
muestra, el nmero de variables independientes y el trmino de interseccin, respectivamente. Por ejemplo, en una ecuacin de regresin con una muestra de 62 observaciones, habra 60 grados de libertad. La probabilidad de ocurrencia del valor A (convertida en 2 unidades) se puede encontrar ahora con la ayuda de una tabla-t, como se muestra en la tabla
CA en el apndice C al final del texto. En esta tabla vemos que para 60 d.f., la probabilidad
de que t tenga un valor de 1.671 o ms es aproximadamente del 5%. (Vea columna para
"una-cola, a = 0.05".) Por lo tanto, la probabilidad de que t tenga un valor de 2 o ms ser claramente menor que 5%.
Despus de encontrar el valor-t del coeficiente estimado de regresin b, el investigador debe decidir entonces si rechazar la hiptesis nula de que no existe relacin entre X y
Y en la poblacin. El procedimiento estndar es establecer lo que se llama el valor-t crtico
basado en un punto predeterminado de la distribucin-t. Generalmente este punto se establece en un nivel de significancia de 0.05. Podemos entonces ir a la tabla-t para encontrar
el valor crtico de t correspondiente a este nivel de significancia. Por ejemplo, la tabla mues-

193

-2

+2

Figura 5.14
Valores-t crticos para la
prueba de dos colas, nivel
de 5% de significancia, 60
grados de libertad

traque para 60 grados de libertad, el rango entre 2.0 y -2.0 incluye aproximadamente el
95% de los valores de t. Otra forma de decir esto es que la oportunidad de obtener un valor-t mayor que 2.0 o menor que -2.0 es de aproximadamente 5% o menos. La figura 5.14
ilustra el nivel 0.05 de significancia en una distribucin t con 60 grados de libertad. Observe que los valores de t son mayores o menores que el valor-t crtico que est situado en las
dos terminales o "colas" de distribucin.
La conclusin anterior nos ayuda a entender la racionalidad de la "regla de 2" empleada muchas veces por los economistas en su evaluacin de la prueba-t. Esta regla afirma
que la hiptesis nula de que b =O puede rechazarse si el valor-tes menor o igual a -2 o
mayor o igual a 2. Al utilizar el valor absoluto de t, podemos afirmar que la hiptesis nula
se rechaza si

La implicacin de esta regla emprica es que el nivel de significancia 0.05 se est utilizando para seleccionar el valor-t crtico. Como se observa en la tabla-t al nivel de 0.05 de
significancia, 2 sirve como una aproximacin til del valor-t crtico para 20 grados de libertad y superior.

Ejercicio sugerido para ilustrar el uso de la prueba-t en el saln de clases


En este punto, quiz usted est un poco confundido acerca de la nocin del valor-t y su uso
en la comprobacin de la relacin entre la estimacin muestra! by el valor poblacional desconocido b, particularmente si no est familiarizado con la teora estadstica. Presentaremos, entonces, un ejercicio simple que probablemente desear poner en prctica usted mismo o conjuntamente con sus compaeros de clase y su profesor. Este ejercicio utiliza el
ejemplo de la demanda de pizzas con el que hemos trabajado anteriormente.
Corte 45 cuadrados de cartn de igual tamao. De acuerdo con la tabla 5.2, existen
nueve niveles posibles de demanda de pizza para cada categora de ingreso. Por tanto,
a cada uno de los cuadrados se le asignar un rango de valor de 1 a 9. Como se muestra
en la primera columna de la tabla 5.2, deber etiquetarse un cuadrado con 1, tres cuadrados con 2, seis cuadrados con 3 y as sucesivamente. (Observe que hemos dividido
las frecuencias en cada categora de ingreso entre 100. Existen 4,500 observaciones en la
poblacin, pero hemos reducido el nmero de cuadrados empleados a 45 simplemente

194

Economa de empresa

por conveniencia. Si las frecuencias relativas son las mismas, no debe importar si se utilizan 45 o 4,500 cuadrados en este ejercicio.)
Coloque los 45 cuadrados en un sobre. Despus seleccione un cuadrado para cada
categora de ingreso. Asegrese de regresar el cuadrado al sobre despus de cada seleccin. Al hacer esto, usted est generando una muestra aleatoria de 10 observaciones,
una para cada categora de ingreso. Debido a que el nmero 5 ocurre ms frecuentemente
(9 veces en este ejercicio y 900 veces en una poblacin hipottica de estudiantes consumidores) es claro que la probabilidad de sacar este nmero del sobre es la mayor. De hecho,
cada vez que se selecciona un cuadrado, hay una probabilidad del 20% (9 145) de que el
nmero 5 sea seleccionado. Entonces combine el nmero sacado con su categora de ingreso para determinar el consumo correspondiente de pizza.
Suponga que uno de estos ejercicios produce la siguiente tabla de nmeros. Como referencia al ejercicio, el nmero que fue sacado del sobre se incluye entre parntesis junto
con las cantidades demandas de pizza.
CANTIDAD PROMEDIO DE REBANADAS
DE PIZZA DEMANDADA

INGRESO SEMANAL

10.0 (1)

$100

13.0 (5)

120

15.2 (7)

140

16.0 (5)

160

16.0 (1)

180

18.7 (4)

200

21.2 (7)

220

22.3 (6)

240

22.0 (1)

260

26.0 (8)

280

En la figura 5.15 se presenta una grfica de dispersin de estos datos.


La ecuacin de regresin estimada para esta muestra es
Y~=

3.27 l- 0.078X
(0.86) (0.004)

(5.9)

Ahora llevaremos a cabo una prueba-t para la significancia del coeficiente de muestra
estimado, b. Recuerde que las hiptesis nula y alternativa se pueden expresar de la siguiente forma:
Ho . b -O

Claramente, nuestro coeficiente muestral bde 0.078 es mayor que cero. Por tanto, debemos determinar la probabilidad de encontrar tal valor muestra! a partir de una poblacin
cuyo valor verdadero es en realidad cero. Empezamos mediante la sustraccin del cero (el
valor de poblacin hipottico de b) de 0.078 (el valor estimado a partir de lamuestra, b), y
despus dividimos esta diferencia entre el error estndar de b. Por convencin, el error estndar de un coeficiente de regresin estimado se presenta entre parntesis debajo del
coeficiente. Como se observa en la ecuacin (5.9), el valor estndar debes 0.004, y el error
estndar de la interseccin es 0.86. Este procedimiento se resume aqu.

Capitulo 5 Estimacin de la demanda

195

y
(Rebanadas 1
Mes)

25 r-

20 r-

15 r-

5 rAl

_1

120 140 160 180 200 220 240 260 280


X
(Ingreso semanal)

Figura .1
Grfica de dispersin de
los datos de muestra para
el experimento de la pizza

t . ..:

(5.10)
t= 1

La ecuacin (5.10) se denomina razn-t o el valor-t.


A partir de los resultados de la ecuacin usted puede ver que si el coeficiente de poblacin, b, fuera verdaderamente cero, entonces 0.078 estara situado a 19.5 unidades-t de
distancia de la media. Al regresar a la tabla C.4 en el apndice C de este texto vemos que la
probabilidad de encontrar tal valor es tan remota que ni siquiera se incluye en la tabla. Sin
embargo, esta tabla indica que la probabilidad de obtener un valor-t (con 8 grados de libertad) mayor que 3.355 o menor que -3.355 a partir de una distribucin cuya media es
cero, es una entre 100 (es decir, 0.01). Esto implica que la probabilidad de obtener un valor de 19.5 es virtualmente nula. Y por ello llegamos a la conclusin bastante obvia de que
el verdadero valor del coeficiente de poblacin es, muy probablemente, diferente de cero.
En trminos de teora estadstica, rechazamos la hiptesis nula.
Al utilizar el anlisis de regresin, los economistas casi siempre hacen la hiptesis
de que el coeficiente de poblacin es igual a cero (H0 : b = 0). Sin embargo, se puede formular la hiptesis de que el valor del coeficiente desconocido de poblacin sea de cualquier valor que el investigador desee. Por ejemplo, suponga que diferentes estudios previos en la demanda de pizza estimaron que el valor del coeficiente de la variable del
ingreso es aproximadamente de 0.073. Entonces podramos utilizar estos estudios previos
como la justificacin de la hiptesis de que el coeficiente desconocido es igual a este valor:
H0 : b "''' 0.73
Hfi : b

:f'

0.73

Encontramos la razn-t correspondiente como

196

Economa de empresa

0.078 ""

t :::.: . .
0.004

Suponga que probamos esta hiptesis mediante una prueba de dos colas con un nivel
de 0.05 de significancia. Si regresamos nuevamente a la tabla-t en el apndice, encontramos un valor-t crtico de 2.306 para una regresin con 8 grados de libertad. Dado que el
valor-t de 1.25 no es mayor que 2.306, no podemos rechazar la hiptesis nula. Nuev;:unente, esto no significa que podamos decir ahora que el coeficiente de poblacin es en realidad 0.073. Sin embargo, esta falla en pasar la prueba-t significa que no podemos decir con
un alto grado de certidumbre que el valor de la poblacin no es de 0.073. Hasta que estudios futuros indiquen otra cosa, los investigadores quiz quieran asumir la hiptesis en
funcionamiento de que el coeficiente desconocido de poblacin est alrededor de 0.073.

La distribucin-t y

una

Al utilizar el
anlisis de regresin para la investigacin econmica y de negocios, el patrn para todas
las hiptesis nulas es afirmar que no existe relacin entre una variable particular independiente y la variable dependiente (por ejemplo, b = O). Sin embargo, los investigadores por
lo general hacen una eleccin en cuanto a si la hiptesis alternativa afirma que la variable
independiente simplemente tiene algn impacto en la variable dependiente (una prueba
de dos colas) o si indica un impacto positivo o negativo (una prueba de una cola). En la
evaluacin de la relacin entre ingreso y cantidad demandada de pizza, nuestra hiptesis alternativa fue que los cambios en el ingreso tenan un efecto en la cantidad demandada de pizza; no se estableci si este efecto era positivo o negativo. Si tuviramos una razn a priori para creer que el efecto del ingreso en la cantidad demandada era positivo o
negativo, se reflejara en la hiptesis alternativa. Por ejemplo, si establecemos la hiptesis
de que la pizza es un bien "normal",la hiptesis alternativa sera que los cambios en el ingreso tienen una relacin directa con los cambios en la cantidad demandada. Si establecemos la hiptesis de que la pizza es un bien "inferior", la hiptesis alternativa afirmara una
relacin inversa entre las dos variables. Mediante la notacin que hemos desarrollado:
Si se formula la hiptesis de que la pizza es un "bien normal" (el coeficiente
de la variable de ingreso es positivo), entonces
H0 : lJ :sO

H:
b.> O
Ei
Si se establece la hiptesis de que pizza es un "bien inferior" (el coeficiente de
la variable de ingreso es negativo), entonces

H0 : b::;:: O
H:b<~O
a

Si se tiene la hiptesis de que el ingreso simplemente tiene un impacto (positivo


o negativo) en la demanda de pizza, entonces

H0 : b =O

H:b?O
d

Captulo 5 Estimacin de la demanda

197

muy extenso de la prueba-t, as que resultar til resumir cada uno de los pasos implicados en la ejecucin de esta prueba.
Paso 1: Formule la hiptesis.
Por ejemplo, "la p~zza es un bien normal". (En otras palabras, se hace la hiptesis de
que el ingreso tiene una relacin directa con la demanda de pizza.)
Paso 2: Reformule la hiptesis en trminos adecuados para la prueba estadstica.
Con respecto a la hiptesis antecedente acerca del ingreso y la pizza,

o
: b.> o
:b

::~:

Paso 3: Establezca un nivel crtico de rechazo y encuentre el valor-t que corresponda a este nivel.
Por ejemplo, para una prueba de una cola, el nivel de significancia de 0.05 y 8 grados
de libertad (el nmero que asumimos para el anlisis de pizza), t* = 1.86. Por tanto, si
la estadstica-t es mayor que 1.86, podemos rechazar la hiptesis nula al nivel 0.05 de
significancia.
Paso 4: Encuentre la estadstica-t mediante la transformacin de la diferencia
entre el estimado b y su valor hipottico, O.
Por ejemplo, suponga que un coeficiente estimado es 2.5 y que el error estndar del
coeficiente es 1.3. Entonces
t

2.5-

oo:

1.92

Paso 5. Compare el valor-t resultante con el valor crtico. Entonces decida si


hay que rechazar la hiptesis nula.
En nuestro ejemplo, 1.92 es mayor que el valor crtico-t de 1.86 para una prueba de una
cola con 8 grados de libertad. Por tanto, podemos rechazar la hiptesis nula y afirmar que el
ingreso tiene un impacto directo estadsticamente significativo en la demanda de pizza.

ANLISIS D

REGR SIN MLTI

Empecemos nuestra explicacin de la regresin mltiple mediante la especificacin del


siguiente modelo de regresin aditivo lineal para la demanda de pizza:
Y

a+ b1

donde Y== ca.ntidad demandada de


por mes)
X, = precio

198

Economa de empresa

una

(5.11)
(nnH.:ro promedio

rebanadas per cpita

U onzas de bebida
(en centavos)
plantel est ubicndo en una concentrada
urbana, Ode otra forma)
Suponga, como lo hicimos en la seccin de apertura de este captulo, que el anlisis
de regresin de datos de corte transversal de 30 universidades produce la siguiente relacin
estimada entre la cantidad demandada de pizza y nuestra seleccin de variables independientes:

+ 0.1
(0.018)

R2 . 0.7'17
R2 0.67

(0.087)

- 0.544)(1
(0.020)

(0.884)

(5.12)

F 15.8 n

Error

de Y. 1

Los asteriscos indican la significancia estadstica al nivel de 0.05.


Al evaluar esta ecuacin, observamos primero los signos de los coeficientes estimados de las variables independientes. (Generalmente ignoramos el trmino de interseccin, debido a que por s mismo este trmino carece de significado econmico.) Observe
que, como se esperaba, el signo de la variable del precio es negativo. El signo de la variable X2 es positivo, lo que indica que cuanto ms alto sea el costo de la colegiatura de la
universidad, ms pizzas comprarn los estudiantes. El signo X 3, la variable del precio de
bebidas gaseosas, es negativo, lo que indica que la pizza y las bebidas gaseosas son productos complementarios.
Existe una variable en la ecuacin, X4, que podra parecer un poco extraa. Se llama
variable binaria o nula y asume el valor de 1 si el campus se ubica en un rea urbana concentrada, y un valor de cero si es de otra forma. Este tipo de variable se explicar con mayor detalle en una seccin posterior. Sin embargo, por el momento podemos sealar que
el coeficiente de esta variable mide la diferencia de la demanda de pizza por estudiantes
que asisten a universidades en reas urbanas versus los estudiantes en instituciones localizadas fuera de las reas urbanas. Como usted podr observar por la magnitud y signo
del coeficiente X4, se estima que el primer grupo coma 0.544 menos rebanadas de pizza
por mes que el ltimo grupo.
Las magnitudes de los coeficientes indican el cambio en la cantidad demandada de
pizza relativo a un cambio unitario en una variable particular independiente, asumiendo
que los valores de las otras variables permanecen sin cambio. Esta caracterstica del anlisis de
regresin mltiple es extremadamente til en la investigacin econmica y de negocios,
debido a que sigue el enfoque de la esttica comparativa para el anlisis de problemas tan
comnmente utilizado en teora econmica. Por tanto, la ecuacin nos dice que, al permanecer constantes todos los dems factores, una disminucin de una unidad (un centavo)
en el precio de la pizza causar que la cantidad demandada de pizza se eleve en 0.088
unidades. A menos que alguien tenga experiencia real o conocimiento previo acerca del
negocio de venta de pizza al detalle, es difcil juzgar si las magnitudes de los coeficientes
de regresin representan patrones tpicos de demanda de pizza relativos a cambios en las
variables independientes o no. Sin embargo, como se observ antes, una forma de evaluar estas magnitudes es la de calcular las elasticidades de la demanda con respecto a estas variables independientes. Para calcular dichas elasticidades, tenemos que suponer un
cierto punto de arranque para los valores de las variables independientes. Asumamos los
siguientes valores:

Captulo 5 Estimacin de

demanda

199

Precio de pizza (X1) = 100 ($1.00)


Costo anual de la colegiatura de licenciatura (X2) = 14 ($14,000)
Precio de una bebida gaseosa (X3) = 110 ($1.10)
Ubicacin del campus (X4) =rea urbana (X4 = 1)
Dados estos valores, calcularemos entonces que la demanda mensual per cpita para
pizza ser
y~~:.

26.67 -- 0.088 (100)

+ 0.1

(1

---0.076 (110) --0.544 (1)

(5.13)

10.898 o 1 'l (redondeo a la

cornpleta ms cercana)

Recuerde la frmula general para la elasticidad punto:


bY

-----X

ax

X
Y

Ahora usaremos esta frmula para calcular las diferentes elasticidades de demanda:
1
Elasticidad precio: -0.088 x -10.898

99

-0.807

14

Elasticidad del costo de la colegiatura: 0.138 x - - - =O 177


10.898
'
Elasticidad precio cruzada: - 0.076 x

110
10.898

0.767

La ecuacin tiene una R2 ajustada de 0.67. Esto significa que el67% de la variacin en
la variable dependiente se puede explicar por las variaciones en la variable independiente. Una vez ms, slo quienes estn familiarizados con este tipo de negocios podrn evaluar realmente el poder explicativo de esa ecuacin estimada. Sin embargo, 0.67 es una R2
mayor que la que se encuentra en la mayor parte de los estudios empricos de demanda
del consumidor que utilizan datos de corte transversal.
Para llevar a cabo la prueba-t, primero dividimos los errores estndar (citados entre
parntesis) entre sus respectivos coeficientes y comparamos estas razones-t con los valores apropiados en la tabla C.4 del apndice C. Al nivel de 0.05 de significancia, la prueba
de dos colas, podemos ver que el valor-t crtico de 25 grados de libertad es 2.06. Mediante este nivel crtico vemos que las variables x1, que indica el precio de la pizza, y x3, que
indica el precio de las bebidas gaseosas, son estadsticamente significativas.
En cuanto a las implicaciones para las polticas de estos hallazgos de regresin, suponga que usted es un empresario que est considerando abrir una cadena de pizzeras
en universidades a lo largo del pas. La inelasticidad precio de la pizza implica que usted
debe tratar de utilizar la publicidad y promocin en lugar de las reducciones en el precio
como medio de impulsar las ventas. Adems, la significancia estadstica del coeficiente
de la variable del precio le dara una gran seguridad en cuanto a que no debe tratar de
reducir el precio. Aunque el coeficiente de costo de la colegiatura no prob ser estadsticamente significativo, la relativamente baja elasticidad de la demanda del costo de la colegiatura lo llevar a la conclusin de que sus pizzeras no deben estar confinadas en algn
tipo particular de instituciones de educacin superior. Con base justamente en la elasticidad precio cruzada entre los precios de las bebidas gaseosas y la demanda de pizza, una
vez que las pizzeras se establezcan, usted quiz considere reducir el precio de las bebidas
como forma de impulsar la demanda de pizza.

200

Economa de empresa

Existe otra prueba de significancia estadstica, llamada la prueba-F, que se emplea comnmente en el anlisis de regresin. Esta prueba mide la significancia estadstica de
la ecuacin de regresin completa en lugar de la de cada coeficiente individual (como la
prueba-t). Anteriormente, afirmamos que R2 es la medida del poder explicativo del modelo de regresin. En efecto, la estadstica- F es una prueba de la significancia estadstica
de R2 La hiptesis nula de la prueba-F se expresa como sigue:

o
donde k es igual al nmero de variables independientes en la ecuacin de regresin.
Si la hiptesis nula es verdadera, virtualmente no existe ninguna relacin entre la variable dependiente y las k variables independientes para la poblacin, y cualquiera que
sea el valor de R2 (esto es, la proporcin de la variacin en Y explicada por X), es ms probablemente un resultado casual del proceso de muestreo.
El valor-F se define como

1)

donde la variacin explicada es ICY- Y)2, la variacin no explicada es I(Y - Y)2, n es el


tamao de la muestra, y k es el nmero de variables independientes. Esto tambin puede
expresarse en trminos del valor de R2:
(5.14)

El procedimiento para usar el valor-F en la prueba-Fes similar al uso del valor-ten


la prueba-t. Se establece un valor crtico para F dependiendo del grado de significancia
estadstica que el investigador desee fijar. Tpicamente, el nivel de significancia se fija
en 0.05 o 0.01. Los valores-F crticos correspondientes a estos niveles de aceptacin se
muestran en la tabla C.3 del apndice C. Como se puede ver hay dos valores de "grados
de libertad" que deben incorporase en la seleccin del valor-F crtico. Un valor se relaciona con el numerador de la ecuacin de F, y el otro se relaciona con el denominador.
Dada esta informacin de los antecedentes, podemos ahora interpretar el valor-F para
nuestra ecuacin de regresin mltiple para la demanda de pizza. Con un tamao de
muestra de 30 y cuatro variables independientes (n = 30 y k = 4), la tabla-F indica que
en el nivel de 0.05, el valor-F crtico para 4 y 25 grados de libertad es 2.76. En el nivel
0.01, el valor-F crtico es 4.18.
Debido a que el valor-F de 15.80 de la ecuacin estimada (reportado en la ecuacin
5.12) excede ambos valores crticos, podemos concluir que nuestro modelo completo de
regresin explica una porcin estadsticamente significativa de la variacin en la demanda de pizzas. En general, es muy fcil para un modelo de regresin aprobar la prueba-F. La
hiptesis nula, que establece que no existe relacin entre la variable dependiente y todas
las variables independientes, es ms bien un enunciado rgido. Mientras algunas de las variables independientes en la ecuacin de regresin verdaderamente ayuden a explicar la
varianza en la variable dependiente, la prueba-F indicar muy probablemente un modelo
de regresin estadsticamente significativo. De hecho, se puede ver en la ecuacin (5.14) que
para algn tamao de muestra dado y un conjunto de variables independientes, cuanto
mayor sea R2, mayor ser el valor-F.

Captulo 5 Estimacin de la demanda

201

Otra forma de ver la tendencia general de una ecuacin de regresin a pasar la prueba-Fes reconocer que los modelos de regresin que no pasen el examen deben de hecho
ser inferiores. En cualquier caso, aun si la estadstica-F indica la significancia estadstica
general del modelo de regresin, ah existe an la necesidad de someter cada variable independiente a un examen individual. Para ese propsito, confiamos en la prueba-t.

EMPL O D L AN Ll
REGRESiN PARA
LA DEMANDA

iS DE
ONOS ICAR

Adems de ayudar a los investigadores a entender ms acerca de las determinantes de la


demanda, el anlisis de regresin se puede usar simplemente como herramienta para el
pronstico. En el siguiente captulo explicaremos este tema con mucho mayor detalle. Por
ahora, solamente afirmaremos que una vez que se han estimado los coeficientes de regresin, llegar a un valor pronosticado de la demanda de un bien o servicio en particular es
simplemente cuestin de asignar valores a las variables independientes. Por ejemplo, suponga que el anlisis de regresin de datos de series de tiempo da como resultado la
siguiente estimacin de demanda de pizza:
Q ""- 100 -- 20P + 100/ + 15GP + 10P;,(1.

donde Q

:::e:

P=
l :;;;

CP ::::
Phd

dernanda de pizza (en rniUones de rebanadas por ao)


precio de la pizza (en centavos)
lngreso per cpita (en miles de dolares)
gastos de pubLicidad (en millones de dolares)
Precio de los hot dogs (en centavos)

Si asumimos que P = 100, I = 5, GP = 30 y Phd =125, nuestro pronstico para la cantidad de pizza demandada para el ao prximo ser de 300 (millones de rebanadas). Sin
embargo, cuando el anlisis de regresin se utiliza para el pronstico, debe tenerse el mismo cuidado que se tuvo al evaluar la significancia estadstica de los coeficientes de regresin individual. Esto se debe a que el pronstico est basado en una muestra de datos. Para tomar en cuenta que el valor de pronstico de 300 est basado en una muestra y es
por tanto sujeto a un error de muestreo, utilizamos una medida llamada error estndar
del estimado (EEE). Este trmino se incluye como una parte regular del ejemplar impreso de computadora de cualquier programa de software de regresin. De hecho, se puede mostrar que el error estndar del coeficiente (EE 6) se deriva en realidad del EEE de la
ecuacin de regresin.
De acuerdo con la teora estadstica, podemos esperar que el valor verdadero (pero
desconocido) de Y est dentro de un rango determinado por el valor estimado, ms o
menos el producto del error estndar del estimado y el valor-t apropiado. En forma
notacional,
Y:::::tn-k

EEE

Por ejemplo, suponga que la ecuacin de regresin estimada para la demanda de la


pizza se gener a partir de un tamao de muestra de 27 y que tiene un EEE de 25. Dados los valores previos podemos decir con 95% de seguridad que la actual demanda de
202

Economa de empresa

pizza es 300 + 2.074 (25) o un rango de 248.15 a 351.85.10 Hay que tener precaucin cuando
se desarrolla un rango d~ pronstico para la variable dependiente de la ecuacin de regresin
estimada. La teora estadstica muestra que conforme los valores dados de las variables independientes (precio, ingreso, precio de productos relacionados) se alejan de sus valores
promedio, el rango de pronstico se ampla para cualquier nivel determinado de confianza.

TEMAS ADICIONAL
N
LA ESPECIFICACI N
EL
MODELO DE R GRESIN

Variables nulas y sustitutas


Uno de los aspectos que ms retos representan en el anlisis de regresin (o en cualquier
tipo de anlisis estadstico) es la obtencin de datos muestrales adecuados para su empleo
en el anlisis. Por ejemplo, la teora econmica indica que "los gustos y las preferencias"
es una determinante importante de la demanda del consumidor. Pero, cmo se mide este factor? Un investigador que no puede obtener informacin directa acerca de los gustos
y preferencias, quiz tenga que usar una variable sustituta para representar este factor en
la ecuacin de regresin. El nivel de educacin y el gnero de los consumidores son posibles variables sustitutas para gustos y preferencias. Las personas con niveles ms altos de
escolaridad formal pueden tener gustos o preferencias diferentes por un bien o servicio
en particular. Las mujeres pueden tener gustos o preferencias diferentes a los hombres.
Aun las diferencias en la ubicacin residencial podran reflejar diferencias en gustos y
preferencias. Por ejemplo, los autores han observado que los supermercados en la regin
noreste de Estados Unidos manejan un surtido proporcionalmente ms grande de alimentos italianos que los que se localizan en otras partes del pas. Por otro lado, la variedad
y cantidad de comida mexicana en los estantes de los supermercados en el medio oeste, el
suroeste y la costa pacfica son sustancialmente ms amplias que en el noreste.
En ciertos casos, las variables tales como la ubicacin y el gnero que se utilizan en el
anlisis de regresin, se deben cuantificar. Esto se hace mediante la creacin de una variable binaria o nula, que toma el valor de 1 si la unidad de observacin cae en una categora
en particular, y Osi no lo hace. Por ejemplo, podemos asignar el valor de uno a un consumidor femenino y cero a uno masculino. De esta manera, es posible crear variables nulas
para cualquier factor no cuantitativo.
Una manera til de considerar una variable nula en una ecuacin de regresin es como
un factor de "desplazamiento". Por ejemplo, en nuestro anlisis de regresin de la demanda de pizza por estudiantes universitarios, el coeficiente de la variable nula de ubicacin
se estim en -0.54. Suponga que graficamos la ecuacin de la demanda implicada mediante los valoresproporcionados en la ecuacin (5.13). Esto se ilustra en la figura 5.16. La
curva original de la demanda indica la demanda de aquellos estudiantes que asisten a escuelas fuera de las reas urbanas (X4 = 0). Para determinar la demanda de los estudiantes que
asisten a escuelas en reas urbanas, asignamos simplemente el valor de 1 a la variable X4
10De acuerdo con la tabla-t, el valor-t crtico con 22 grados de libertad (n - k- 1, o 27- S) es 2.074. Si
se deseara un grado mayor de confianza, el rango del valor esperado para la demanda de pizza obviamente se ampliara. Por ejemplo, al 99% de nivel de confianza, el valor-t crtico con 22 grados de libertad es 2.819.

Captulo 5 Estimacin de demanda

203

Ingreso

ra 5.1
Efecto de la variable nula

Esto nos da la segunda curva de la demanda mostrada en la figura 5.16. En efecto, el cambio en X4 ha originado que la curva original se desplace hacia abajo.

El mtodo de mnimos cuadrados encuentra la mejor relacin lineal entre las variables
dependientes e independientes. Sin embargo, en ciertos casos, la teora econmica, la experiencia, o la simple observacin de la grfica de dispersin puede llevar a los investigadores a sospechar que la relacin entre las variables dependientes e independientes es no
lineal. Por ejemplo, suponga que los datos de ingreso (X) y de demanda para comidas en
restaurantes (Q 0 ) para una muestra de hogares produce el diagrama de dispersin que se
presenta en la figura 5.17a. Como podr ver, la dispersin implica una relacin no lineal
entre el ingreso y la demanda para comidas en restaurantes. Tales representaciones no
lineales son an adecuadas para la estimacin mediante el uso del anlisis de regresin lineal. Por ejemplo, podramos especificar un modelo de regresin polinomial en el que el
trmino independiente, X, se eleve tanto al segundo como al primer grado. La figura
5.17b ilustra esta opcin. Tambin podramos especificar nuestra ecuacin de regresin en
trminos de una funcin de potencia. La figura 5.17c ilustra esta posibilidad. En cualquier
caso, la idea es la de usar el mtodo de mnimos cuadrados para estimar los coeficientes
de las ecuaciones. Las pruebas y estadsticas comunes (prueba-t, prueba-F, R2) se emplean an.en la evaluacin de los resultados de regresin.
Cuando utilizamos la funcin de potencia, primero aplicamos una transformacin logartmica a la especificacin original. Por ejemplo, dejemos que la ecuacin original sea
como sigue:

una
en un restauranlc:

204

come

Qo

X(Ingreso)
(a)

X (Ingreso)

X (Ingreso)

(b)

,.gura

(e)

. 1""'"~
.,

elaciones no lineales

Si aplicamos el logaritmo a ambos lados de la ecuacin, resulta la siguiente transformacin logartmica:


log

o.:.:..

loga

+.

b logX

Para desarrollar un anlisis de regresin de este tipo de datos no lineales, primero encontramos los logaritmos de cada uno de los valores de Y y X en la muestra de datos.
Entonces hacemos la regresin de logY con logX mediante el mtodo de los mnimos
cuadrados. Una forma en que se puede evaluar la ecuacin de regresin transformada es la
de comparar su R2 con el de la ecuacin lineal simple (esto es, Q 0 =a + bX). Si el R2 de
la ecuacin exponencial transformada es mayor que el de la expresin lineal simple, parecer que el modelo no lineal ofrece una mejor explicacin para la varianza de Q0 .
El uso de la ecuacin logartmica lineal en el anlisis de regresin es particularmente
adecuado para los economistas, debido a que para cambios relativamente pequeos en X,

Captulo 5 Estimacin de la demanda

205

el coeficiente estimado del logaritmo de X puede indicar el cambio porcentual en Y relativo


al cambio porcentual en x.u En otras palabras, los coeficientes de las variables transformadas son, de hecho, medidas de la elasticidad punto de la demanda con respecto a cada variable. Por ejemplo, si el valor estimado deben la ecuacin anterior fuera 1.2, entonces
podramos interpretar inmediatamente a la comida en restaurantes como un producto
"superior" debido a que su elasticidad ingreso es mayor que la unidad.

PRO LEMA
EN
DEL ANLISIS D

IN

Una exposicin plena de los problemas que pueden surgir en la regresin est ms all de
las pretensiones de este captulo y este texto. Como se mencion al comienzo del presente captulo, existen textos y cursos completos, desde introductorios hasta avanzados, dedicados al estudio del anlisis de regresin. No obstante, debemos citar y explicar brevemente algunos de estos problemas para que los lectores que no estn familiarizados con
este tema adquieran una apreciacin de los retos reales que aguardan a quienes desean
aplicar el anlisis de regresin a la investigacin econmica y de negocios.

problema de identificacin
El problema de identificacin representa tal vez el mayor reto para quienes utilizan el
anlisis de regresin para estimar la demanda de un bien o servicio en particular. A fin de
explicar este problema, retornemos a nuestro ejemplo de las pizzas. Suponga que tenemos datos de series de tiempo relacionados con el consumo per cpita de pizza y con el
precio de pizza durante un periodo de 20 aos. La grfica de dispersin de esta informacin se presenta en la figura 5.18a. Observe que la dispersin tiende a tener una pendiente hacia arriba y que la estimacin de regresin de los mnimos cuadrados reflejara este
patrn de relacin. Esto significa que los consumidores de pizza se comportan irracionalmente y demandan ms pizza a precios ms altos? El sentido comn evitara esta conclusin, pero entonces por qu el coeficiente positivo de la variable de precio en la ecuacin
de la demanda? El lector alerta afirmara que lo que hemos identificado como una ecuacin de la demanda es probablemente alguna clase de ecuacin de la oferta o quiz, el resultado del movimiento tanto en la oferta como en la demanda durante los pasados 20
aos. Como se advierte en la figura 5.18b, si la oferta permaneci constante durante los
pasados 20 aos mientras la demanda se desplaz hacia arriba (debido a cambios en factores tales como el ingreso, nmero de compradores, gustos y preferencias durante este
periodo),la ecuacin de regresin sera realmente un reflejo de la curva de la oferta Or Si
la oferta se increment pero la dem~nda se increment ms que la oferta, entonces la estimacin de regresin sera realmente un reflejo de la interseccin de varias curvas O y D
en la figura 5.18c. La figura 5.18d muestra otra posibilidad. En este caso, la oferta se desplaza ms que la demanda, de manera que la lnea de regresin estimada tiene pendiente
hacia abajo y es ms parecida a lo que esperaramos de una curva de la demanda. No obstante, esta curva de la demanda estimada es ms plana que las curvas de demanda verdaderas, que se desplazan en forma gradual hacia la derecha con el paso de los aos. Por
tanto, el estimador de la regresin de la relacin entre el precio y la cantidad demandada
U Para una explicacin del significado de los coeficientes en una ecuacin de regresin lineal logartmica,
vea el anlisis de matemticas bsicas de la funcin de Cobb-Douglas en el captulo 7.

206

Economa de empresa

Precio

Precio

(a)

(b)

Qo

Qo

o3

X
.

D2

,
D2

Dl

Precio

Precio
(e)

(d)

Figura 5.18
El problema de identificacin

estara sesgado en el sentido de que podra indicar una elasticidad precio mucho mayor
de la que en realidad existe en la poblacin de consumidores de pizza.
Existen tcnicas de estimacin avanzadas, tales como los mtodos de mnimos cuadrados
de dos etapas y mnimos cuadrados indirectos, que ayudan al investigador a tratar con muestras
en las que los desplazamientos simultneos de la oferta y la demanda tienen lugar. Esencialmente, estas tcnicas implican la consideracin simultnea de las ecuaciones de la
oferta y la demanda con el uso de una sola ecuacin de regresin. La descripcin de estas
tcnicas est fuera del alcance de este texto. Pero el punto principal a recordar es que si la
identificacin del problema no se reconoce y se trata por el investigador, el mtodo de los
mnimos cuadrados ordinarios dar como resultado estimaciones sesgadas de los coeficientes de regresin.
Captulo 5 Estimacin de la demanda

207

Uno de los principales supuestos hechos en la construccin de la ecuacin de regresin


mltiple es que las variables independientes no estn relacionadas entre s en ninguna
forma sistemtica. Si esta suposicin es incorrecta, entonces cada uno de los coeficientes
estimados podra dar una visin distorsionada del impacto del cambio en cada una de las
variables independientes. Por ejemplo, suponga que un modelo de regresin expresa que
la demanda de automviles de lujo y fabricados en el extranjero depende del precio, ingreso y educacin. La ltima variable se incluye debido a que la educacin es un sustituto para gustos y preferencias, y se establece la hiptesis de que las personas con altos niveles
educativos tienen una preferencia mayor por los carros extranjeros de lujo. Pero, como usted esperara, la educacin y el ingreso estn asociados estrechamente. Si sus valores tienden a moverse hacia arriba y abajo juntos, el mtodo de los mnimos cuadrados podra
asignar arbitrariamente un valor alto al coeficiente de una variable y un valor de coeficiente bajo a la otra. En efecto, si las dos variables estn asociadas estrechamente, se vuelve difcil separar el efecto que cada una tiene sobre la variable dependiente. La existencia
de tal condicin en el anlisis de regresin se denomina multicolinealidad.
Si los resultados de la regresin pasan la prueba-F (la medicin de la significancia estadstica global de la ecuacin de regresin) pero no pasan la prueba-t para cada uno de los
coeficientes de regresin individual, generalmente es un signo de que se presenta multicolinealidad en los datos muestrales. La multicolinealidad se puede detectar tambin al examinar el coeficiente de correlacin entre dos variables que se sospecha estn relacionadas
estrechamente.12 Como regla emprica, los coeficientes de correlacin de 0.7 o mayores proporcionan una base a los investigadores para sospechar la existencia de multicolinealidad.
Si la multicolinealidad es un problema serio en el anlisis de regresin, tender a introducir un sesgo hacia arriba a los errores estndar de los coeficientes. Esto tender a reducir
los valores-t (los que, como usted recuerda, se calculan usando los errores estndar de los
coeficientes). Esto hace ms difcil rechazar la hiptesis nula y, por supuesto, identificar
las variables independientes estadsticamente significativas en el modelo de regresin.
Se debe sealar, sin embargo, que si el investigador simplemente desea usar los coeficientes estimados de regresin como base para pronosticar valores futuros en la variable
dependiente, la multicolinealidad no representa un problema serio. Es slo cuando el investigador desea entender ms acerca de la estructura subyacente de la funcin de la demanda (esto es, cules son las determinantes clave de la demanda) que este problema estadstico en particular debe resolverse. La mayor parte de los paquetes de software
producen automticamente una matriz de coeficiente de correlacin para el conjunto entero de variables independientes utilizadas en la ecuacin de regresin. Un remedio estndar para la multicolinealidad es el de eliminar una de las variables que est asociada
estrechamente con otra variable en la ecuacin de regresin.

Autocorrelacin
La autocorrelacin es un problema que se encuentra generalmente cuando se utilizan datos
de series de tiempo. Por esta razn con frecuencia se denomina correlacin serial. Utilicemos
el caso de la regresin simple, que implica slo la variable dependiente Y y una variable
independiente, X. Esencialmente, la autocorrelacin ocurre cuando la variable Y se relaciona
12El coeficiente de correlacin es un medicin del grado de asociacin entre dos variables. Esta medicin,
denotada como r, vara de un valor de -1 (correlacin negativa perfecta) a 1 (correlacin positiva perfecta).

208

Economa de empresa

(a)

Tiempo
(b)

Figura 5.19
Autocorrelacin
con la variable X de acuerdo con cierto patrn. Por ejemplo, en la figura 5.19a, la grfica
de dispersin revela que al incrementarse X (presumiblemente durante el tiempo), el valor Y se desva de la lnea de regresin de una forma muy sistemtica. En otras palabras,
el trmino residual, o la diferencia entre el valor observado de Y y el valor estimado de Y
dado X(Y) se alterna entre un valor positivo y negativo de aproximadamente la misma
magnitud a travs del rango de los valores X. De hecho, si graficramos estos residuos
por separado, tendran el patrn mostrado en la figura 5.19b.
Una posible causa de autocorrelacin es que existen efectos en Y que no explican las
variables incluidas en la ecuacin de regresin. Tambin puede deberse a que la relacin
verdadera entre Y y la(s) variable(s) independiente(s) es no lineal. Pero sin importar la razn, si se presenta la autocorrelacin en el anlisis de regresin, se crea un problema para
la validez de la prueba-t. Dicho de forma simple, la autocorrelacin tiende a incrementar la
probabilidad de que la hiptesis nula sea rechazada. Esto se debe a que la autocorrelacin
da un sesgo hacia abajo al error estndar del coeficiente estimado de regresin (EE;). Al
recordar que el valor-t se define como (b - b) /EE;, podemos ver que un EE; ms pequeo
tender a incrementar la magnitud del valor-t, al permanecer constantes otros factores. Por
tanto, en la presencia de autocorrelacin, los investigadores pueden declarar que ciertas
variables independientes tienen un impacto estadsticamente significativo en la variable
dependiente cuando de hecho no lo tienen. Desde el punto de vista de las polticas, suponga que el coeficiente estimado de la variable de publicidad en un modelo de regresin
de demanda pas la prueba-t cuando no tena que hacerlo realmente. Una empresa entonces quiz incrementara los gastos en publicidad cuando de hecho debera buscar
otras formas de expandir la demanda (a travs de promociones, canales de distribucin
alternativos o acciones sobre precios).
Puede resultar difcil identificar la autocorrelacin mediante la simple observacin
del patrn de los residuos de una ecuacin de regresin. Una prueba estndar para identificar la presencia de este problema es la prueba de Durbin-Watson. La estadstica de DurbinCaptulo 5 Estimacin de la demanda

209

Watson (DW) se calcula rutinariamente en los paquetes de software de regresin y se presenta automticamente en el ejemplar impreso de la computadora. Como en el caso de la
prueba-t y de la prueba-F, existe un tabla de Durbin-Watson que lista los valores crticos
de esta estadstica para un nivel dado de significancia (generalmente el nivel 0.05). Hemos incluido dicha tabla en el apndice en la parte final de este texto (vea tabla C.5). Como
regla emprica, si la estadstica DW est alrededor de 2, hay mucha probabilidad de que no
se presente autocorrelacin en los datos. Pero si la estadstica DW indica la presencia de
autocorrelacin, existen ciertas cosas que un investigador puede hacer para corregir el
problema. Esto incluye la transformacin de los datos en un orden diferente de magnitud
o la introduccin de datos adelantados o rezagados en las series de tiempo.

APLICACIN INTERNACIONAL: ALIMENTOS


EN ESPAA, CIGARROS EN TAIWN
------------------------------------~'-"'''"~

L~,

\~

Es algo difcil obtener los resultados reales de regresin en la demanda del consumidor
por parte de compaas tales como ACNielsen e IRI, o de grupos de investigacin de mercado de los principales fabricantes de bienes de consumo. Sabemos que la regresin es
una herramienta til para estos investigadores, pero desafortunadamente, todos sus estudios estn patentados. Los lectores deben estar seguros de que muchos de estos estudios
reales utilizan especificaciones de ecuaciones de regresin similares a las presentadas en
este captulo. Sin embargo, muchos estudios llevados a cabo por investigadores acadmicos estn disponibles para el pblico en general. Hemos seleccionado dos de tales estudios, principalmente debido a que dan a los lectores un ejemplo del comportamiento del
consumidor fuera de Estados Unidos.13

Ejemplo 1: Anlisis de regresin para alimentos bsicos en Espaa Un


estudio de series de tiempo de la demanda de seis clases de comida para el periodo comprendido entre 1964 y 1991 se desarroll en Espaa. Las seis diferentes clasificaciones fueron:
l.
2.
3.
4.
5.
6.

Pan y cereales
Carne
Pescado
Leche, productos lcteos y huevos
Frutas, vegetales y papas
Grasas y aceites

Los resultados revelaron que los cambios en la demanda de la comida (en trminos
de caloras consumidas) no depende:n slo del ingreso y de los precios actuales, sino tambin de los valores rezagados de estas variables. Los consumidores de alimentos en Espaa no ajustan inmediatamente sus gastos cuando los ingresos o precios cambian. Ms
bien parecen mostrar un cierto nivel de inercia.
De las seis categoras, slo la carne se considera un bien "superior", con una elasticidad ingreso de 1.54. Entre los otros cinco grupos, slo las frutas y vegetales tienen una
elasticidad ingreso cercana a la unidad (.9), mientras que la elasticidad de grasas y aceites
es la ms baja, con .35. En trminos de elasticidades precio propias, la carne muestra el
13Tambin

proporcionamos ejemplos de estudios acadmicos de costos que emplean el anlisis de regresin


en el captulo 8.

210

Economa de empresa

coeficiente ms alto de -.8. Todas las dems son tambin negativas; todas tienen resultados en la prueba-t que son siginificativamente diferentes a cero. La mayora de las elasticidades cruzadas son muy bajas y no son estadsticamente significativas, lo que indica
que no hay una gran posibilidad de sustitucin entre estos productos. Existen pocas excepciones, la ms importante es el pescado y la carne, cuyos resultados en la prueba-t son
significativos. La R2 para la ecuacin es relativamente alta, .63.14

Ejemplo 2: Anlisis de regresin de la demanda de cigarros en Taiwn


Un estudio reciente de series de tiempo investig la demanda de cigarros en Taiwn, no
slo como funcin del ingreso y precio, sino tambin en el marco de la influencia de las
campaas contra el tabaquismo y el impacto de la apertura del mercado de Taiwn a
los cigarros importados. Se utilizaron datos generados en 30 aos (1966-1995). La ecuacin
bsica de estimacin es la siguiente:
Ct

= ao + a, pt + a2 yt

+ a3Ht

+ a4Xt + er

donde C1 =
P1 =
Y1 =
H1 =

consumo anual de cigarros per cpita


precio promedio al detaJle de los cigarros por paquete
ingreso disponible per cpita, en dlares nuevos taiwaneses de 1991
medicin de la informacin de salud relacionada con el tabaquismo
= otras determinantes
e, = trmino aleatorio de error
'
lq = coeficientes de regresin

xi

Adems, se estimaron las funciones separadas de demanda para cigarros nacionales e importados. Las ecuaciones utilizadas en estos clculos fueron similares a las de arriba, a excepcin de un trmino que se aadi a cada ecuacin. En la ecuacin de demanda
interna de cigarros, se incluy el precio de cigarros importados para medir la elasticidad
precio cruzada. En la ecuacin para cigarros importados, se incluy el precio de los cigarros nacionales. Se utilizaron dos mediciones de informacin de salud:
l. Participacin de mercado para cigarros de bajo alquitrn
2. Etiquetas con advertencias claramente expresadas adoptadas en 1992. Una variable
nula de Ohasta 1991 y de ah en adelante se emple 1

Entre otras variables explicativas se incluyeron el consumo rezagado, la participacin de


mercado de los cigarros importados y la participacin de la mujer en la fuerza de trabajo.
Los resultados para el modelo global fueron los siguientes:
Elasticidad precio - .5 a - .6
Elasticidad ingreso .14 a .22
Impacto del bajo alquitrn - .04
Estos tres factores tienen coeficientes de significancia estadstica tanto al nivel del 1%
como al de 5%. El efecto de las etiquetas de advertencia fue tambin negativo pero no
estadsticamente significativo, y el impacto de los cigarros importados fue positivo pero
slo significativo a un nivel del10% en algunos de los modelos.
14A. Gracia, J. M. Gil y A. M. Angulo, "Spanish Food Demand: A Dynamic Approach", Appled Economics,
octubre 1998, 30(10), pp. 1399-1405.

Captulo 5 Estimacin de la demanda

211

Cuando los cigarros nacionales e importados se consideraron por separado, los resultados fueron similares. Las elasticidades precio cruzadas en ambas ecuaciones fueron positivas, indicando que los cigarros nacionales e importados eran sustitutos. Los coeficientes de determinacin para los distintos modelos fueron muy satisfactorios; fueron
aproximadamente de .91 para el total de las ecuaciones, y .71 y .88 para las ecuaciones en
las que los cigarros nacionales e importados se estudiaron por separado. 15

La solucin
a

La tarea de generar un modelo estadstico no fue tan simple como


Jennifer Harrah haba previsto. El problema principal fue la falta de
datos. El producto era nuevo para Global Foods, as que no haba
informacin histrica que la compaa pudiera proporcionar como
F o o o s
datos de series de tiempo en el anlisis de regresin. Ella pudo
haber generado datos de corte transversal mediante una encuesta
telefnica, pero simplemente no haba suficiente tiempo. Pudo haber encontrado informacin pblica en datos de series de tiempo del gobierno para artculos
tales como jugos de fruta, bebidas gaseosas y cerveza, pero stos estaban
agregados por tipo de producto, y ninguna otra informacin adems del precio
promedio estaba disponible. El nico conjunto de datos que pudo encontrar
dentro del tiempo permitido fue una parte de un estudio de mercado llevado a
cabo en los aos cincuenta por la National Bottler's Gazette. Este estudio
contemplaba el consumo per cpita de bebidas gaseosas por estado, junto con
la temperatura anual promedio del estado y su ingreso per cpita. Estas cifras
se muestran en la tabla 5.3. * Llev a cabo un anlisis de regresin de estos
datos de corte transversal mediante el siguiente modelo:
6 L 0

A L

d<') bebidas
donde O '''' consumo anual per
ING = ingreso anual per cpita
TEMP ::::o
re promedo anual
Los resultados del anlisis de computadora se presentan en la tabla 5.4.
La temperatura tuvo un impacto considerable as como estadsticamente significativo en el consumo de bebidas gaseosas. Cada grado adicional de temperatura anual promedio dio como resultado un incremento en el consumo per cpita

*Los autores debatieron acerca de si usar datos artificialmente creados para demostrar todos los
temas presentados en este captulo o usar datos reales, lo cual limitara la aplicacin del anlisis de regresin. Se eligi la ltima opcin debido a que en las situaciones reales de negocios, la
falta de buenos datos es mucho ms limitante que el conocimiento del anlisis estadstico o que
el poder de la computacin disponible para manejar los nmeros. Las cifras del consumo de
bebidas gaseosas del estudio de la National Bottler's Gazette aparecieron originalmente en un libro de texto de investigacin de mercado que est agotado. Desafortunadamente, este texto no
cit la fecha en que se obtuvieron las cifras.
(Contina)

15Chee-Ruey

Hsieh, Teh-Wei Hu y Chien-Fu Jeff Lin, "The Demand for Cigarettes in Taiwan: Domestic
vs. Imported Cigarettes", Contemporary Economic Policy, abrill999, pp. 223-234.

212

Economa de empresa

Tabla 5
Consumo de bebidas gaseosas, temperatura e ingreso por estado
CONSUMO DE BEBIDAS
ESTADO

INGRESO PER CPITA

GASEOSAS PER CPITA

Alabama
Arizona
Arkansas
California
Colorado
Connecticut
Delaware
Florida
Georgia
Idaho
Illinois
Indiana
Iowa
Kansas
Kentucky
Louisiana
Maine
Maryland
Massachusetts
Michigan
Minnesota
Mississippi
Missouri
Montana
Nebraska
Nevada
New Hampshire
NewJersey
NewMexico
NewYork
North Carolina
North Dakota
Ohio
Oklahoma
Oregon
Pennsylvania
Rhode Island
South Carolina
South Dakota
Tennessee
Texas
Utah
Vermont
Virginia
Washington
West Virginia
Wisconsin
Wyoming

Capitulo 5 Estimacin

200
150
237
135
121
118
217
242
295
85
114
184
104
143
230
269
111
217
114
108
108
248
203
77
97
166
177
143
157
111
330
63
165
184
68
121
138
237
95
236
222
100
64
270
77
144
97
102

la demanda

TEMPERATURA

op

MEDIA

$13
17
11

25
19
27
28
18
14
16
24
20
16
17
13
15
16
21
22
21
18
10
19
19
16
24
18
24
15
25
13
14
22
16
19
20
20
12
13
13
17
16
16
16
20
15
19
19

66
62
63
56
52
50
52
72

64
46
52
52
50
56
56
69
41
54
47
47
41
65
57
44
49
48
35
54
56
48
59
39
51
82
51
50
50
65
45
60
69
50
44
58
49
55
46
46

213

de bebidas gaseosas de 4.7 botellas. Mediante la "regla de 2", podemos ver que el valor-tde
5. 70 es claramente significativo. El coeficiente estimado de la variable de ingreso es interesante. Primero, su valor negativo indica que una bebida gaseosa es un producto "inferior".
Los niveles ms altos de ingreso redundan en un consumo ms bajo per cpita, y un ingreso
ms bajo implica un consumo ms alto. Sin embargo, el valor-t de -1.2 est por debajo del
valor-t crtico. Por lo tanto, el ingreso no puede considerarse como un determinante estadsticamente significativo del consumo de bebidas gaseosas. La R2 ajustada de 0.46 indica
que aproximadamente la mitad de la variacin en el consumo de bebidas gaseosas puede
explicarse por la variacin en el ingreso per cpita y la temperatura anual promedio. Esto es
lo que se esperaba, considerando el hecho de que se utilizan datos de corte transversal y
de que slo dos variables independientes se incorporaron en la ecuacin. No obstante, el
valor-F de 21.37 indica que la R 2 es estadsticamente significativa, porque el valor crtico de
F al nivel de 0.05 con 2 y 45 grados de libertad es de 3.20.
Jennifer quiso incluir el precio en su modelo de regresin. Desafortunadamente, no
hubo datos de series de tiempo disponibles para el precio. Haba algunos datos de corte
transversal sobre los precios promedio en diferentes regiones del pas, pero estos datos no
fueron adecuados para el anlisis de regresin, debido a que los precios fueron bsicamente los mismos para todas las regiones. El anlisis de regresin requiere una variacin en los
valores de las variables independientes. De otra forma, no hay grfica de dispersin a la
cual ajustar la lnea de regresin.

Tabla 5.4
Resultado del anlisis de regresin de Excel
ESTADSTICAS DE REGRESIN

Rmltiple
Rcuadrada
R cuadrada ajustada
Error estndar
Observaciones

0.697953501
0.487139089
0.464345271
49.71283142
48

.ANOVA

--------Regresin
Residual
Total

DF

SS

MS

2
45
47

105633.7976
111211.4524
216845.25

52816.9
2471.366

SIGNIFICANCIA F

21.371544

2.98532E-07

-------------------------------------

95%

95%

COEFICIENTES

ESTNDAR

ESTADSTICA T

VALORP

MS BAJO

MS ALTO

-54.841134
-2.20457538
4.719982058

63.45499732
1.825233618
0.828234444

-0.864252
-1.207832
5.698848

0.3920329
0.2334217
8.722E-07

-182.6460536
-5.880784437
3.05183233

72.96379
1.471634
6.388132

ERROR

------------------- -----------------------------------Interseccin
X Variable 1
X Variable 2

Variable 1 =ingreso per cpita


Variable 2 = temperatura promedio

214

Economa de empresa

RESUMEN

----------------------------------------------------------------------------~~~
Este captulo ha presentado una introduccin al anlisis de regresin, el mtodo ms
comnmente utilizado por los economistas para la estimacin de demanda de bienes y
servicios. En realidad, el material de este captulo es slo una pequea parte de la econometra, que es la aplicacin del anlisis estadstico multivariable a la teora econmica. La
importancia primordial de este captulo es que ayuda a comprender cmo se aplican las
tcnicas del anlisis de regresin a los negocios interesados en saber ms acerca de los aspectos cuantitativos de la demanda de sus productos. Los lectores deben apreciar el reto de
aplicar el anlisis de regresin y otras tcnicas estadsticas a los problemas de negocios
debido a la dificultad de obtener datos confiables y precisos.
El proceso de aplicacin del anlisis de regresin para la estimacin de la demanda
se resume en los siguientes pasos:
1. Especificacin del modelo de regresin de la demanda.
2. Recoleccin de datos relevantes.
3. Estimacin de la ecuacin de regresin.
4. Anlisis y evaluacin de los resultados de regresin (prueba-t, prueba-F, R2) y ajuste
o correccin de cualquier problema estadstico (multicolinealidad, autocorrelacin,
forma funcional incorrecta).
5. Evaluacin de los hallazgos de regresin para su uso en la toma de decisiones de
polticas.
En un curso formal de econometra, el mayor nfasis se pone en los pasos 1, 3 y 4 (los
mayores aspectos tcnicos de este tipo en el anlisis estadstico). En negocios, los pasos ms importantes son el2 y 5. Las computadoras poderosas y los paquetes sofisticados
de software estn actualmente disponibles para cualquiera a un costo tan razonable que se
ha vuelto elemental aplicar el anlisis de regresin en la estimacin de la demanda o en
cualquier otro aspecto de la investigacin de negocios. El verdadero reto es obtener buenos
datos y aplicar juiciosamente los resultados del anlisis de regresin al proceso de toma
de decisiones. En estas dos reas del anlisis de regresin, ningn libro de texto o curso
pueden tomar el lugar de la experiencia.
CONCEPTOS IMPORTANTES
\.nlisis de regresin: Una tcnica estadstica para
encontrar la mejor relacin entre la variable dependiente y las variables independientes seleccionadas.
Si slo se utiliza una variable independiente, esta
tcnica se denomina regresin simple. Si se emplea
ms de una variable independiente, se llama regresin

mltiple. (p. 169)


:oeficiente de determinacin (R2): Una medida que
indica el porcentaje de variacin en la variable dependiente explicado por las variaciones en alguna
variable independiente designada. Su valor va del O
al l. El cero indica que las variaciones en la variable
independiente no son responsables de ninguna de
las variaciones en la variable dependiente. El uno
indica que el100% de la variacin en la variable

dependiente puede explicarse por las variaciones en


la variable independiente. En el anlisis de regresin mltiple, esta medida se denomina coeficiente
mltiple de determinacin. (p. 174)
Coeficientes de la ecuacin de regresin: Tambin
llamados parmetros, son los valores que indican el
impacto cuantitativo en la variable dependiente del
cambio en una unidad en la variable independiente.
El principal objetivo del anlisis de regresin es
el de estimar los valores de estos coeficientes a
partir de una muestra de datos. Para ello se emplea
generalmente el mtodo de los mnimos cuadrados
comunes. (p. 180)
Datos de corte transversal: Datos sobre un conjunto
particular de variables en un punto dado en el tiempo

Captulo 5 Estimacin de la demanda

215

para un corte cruzado de entidades individuales


(como personas, hogares, ciudades, estados, pases).
(p. 169)
Datos de series de tiempo: Datos de un conjunto
particular de variables que establecen sus valores a
lo largo de un periodo especfico a intervalos regulares (mensual, trimestral, anualmente). (p. 169)
Encuesta al consumidor: El intento de obtener datos
acerca de la demanda haciendo preguntas directamente a los consumidores sobre sus hbitos de compra a travs de medios tales como entrevistas cara a
cara, grupos de enfoque, encuestas telefnicas y
cuestionarios por correo. (p. 168)
Error estndar del coeficiente (EEb): Una medida de
la desviacin del valor estimado del coeficiente de
regresin estimado a partir del valor hipottico del
coeficiente verdadero (pero desconocido) de la poblacin. En la prueba-t, el coeficiente estimado se
divide entre el error estndar, para indicar el valor-t.
(p. 174)
Error estndar del estimado (EEE): Una medida de
la desviacin del valor estimado de la variable
dependiente, dados los valores de las variables independientes. En el pronstico, el error estndar del
estimado se utiliza para desarrollar un intervalo que
contiene el verdadero valor de la variable dependiente, sujeto a un grado designado de confianza.
(p. 202)
Grados de libertad (degrees offreedom, d. f.): Un factor de ajuste que se requiere para llevar a cabo la
prueba-t. Este nmero se encuentra sustrayendo el
nmero de las variables independientes ms 1 del nmero de observaciones en la muestra; esto es, d. f. =
n - (k + 1) = n - k- l. (p. 193)
Hiptesis alternativa: En el anlisis de regresin, la
hiptesis que se establece en contraste con la hiptesis nula. Generalmente afirma que el coeficiente verdadero (pero desconocido) de poblacin es algn
valor diferente de cero (p. 191).
Hiptesis nula: En el anlisis de regresin, la hiptesis usada en la prueba de significancia estadstica
del coeficiente de regresin estimada. Expresa que

los coeficientes verdaderos (pero desconocidos) de


regresin para la poblacin son cero. (p. 191)
Mtodo de los mnimos cuadrados (MCO): En el
anlisis de regresin simple, un mtodo diseado
para ajustar una lnea a travs de una dispersin de
puntos, que indica los valores de una variable
dependiente y una variable independiente de tal
forma que la suma de las desviaciones cuadradas
de los puntos respecto a la lnea es minimizada.
(p. 180)
Prueba de dos colas: Una prueba-t en la que la hiptesis alternativa afirma que el coeficiente de poblacin podra ser positivo o negativo (no es cero); esto
es, se puede utilizar la cola ms alta o la ms baja de
la distribucin-t. (p. 197)
Prueba de una cola: Se refiere a la naturaleza de la
hiptesis alternativa en la prueba-t. Si la hiptesis
alternativa afirma que el coeficiente de poblacin es
positivo, entonces se utiliza la cola superior de la
distribucin-t. Si la hiptesis alternativa afirma que
el coeficiente de la poblacin es negativo, entonces
se utiliza la cola ms baja. En cualquier caso, slo se
utiliza una cola. (p. 197)
Prueba-F: Una prueba para la significancia estadstica
del valor R2 Si esta prueba se pasa, un investigador
puede estar muy seguro de que todos los coeficientes estimados de un modelo de regresin juntos no
son cero para la poblacin en estudio. (p. 201)
Prueba-t: Una prueba para la significancia estadstica
de los coeficientes estimados de regresin. Si el coeficiente pasa esta prueba, entonces el investigador
puede estar seguro de que el valor del coeficiente
verdadero de la poblacin no es cero. (p. 190)
Regla de 2: Una regla general emprica empleada por
los economistas al llevar a cabo una prueba-t. Esencialmente, afirma que cualquier razn-t de 2 o ms
indica que el coeficiente estimado es estadsticamente significativo al nivel 0.05. (p. 174)
Tabla-t: Una tabla numrica que indica los diferentes
valores de la razn-t y la frecuencia de su ocurrencia
en una distribucin-t cuyo valor de la media es cero.
(p. 193)

PREGUNTAS

--------------------------------------------------------------------------------~~~
1. Explique la diferencia entre los datos de series
la demanda para bienes de consumo durables
de tiempo y los datos de corte transversal.
Proporcione ejemplos de cada tipo de datos.
2. Habr alguna diferencia en el conjunto de variables utilizadas en el modelo de regresin de

216

Economa de empresa

(automviles, enseres, muebles) y un modelo


de regresin de la demanda para "bienes de
consumo de alta rotacin" (comidas, bebidas,
productos de cuidado personal)? Explique.

3. Explique la diferencia entre un modelo deter-

minista y un modelo probabilstico de la relacin entre una variable dependiente y una o


ms variables independientes.
4. Explique brevemente el significado de R2 Un
anlisis de series de tiempo de la demanda
tende a dar como resultado un R2 ms alto
que uno que usa los datos de corte transversal. Por qu piensa que esto es as?
5. Lo siguiente se escuch en la cafetera: "Mi
modelo de regresin de la demanda es mejor que el que nos prepar el consultor, debido a que tiene un R2 ms alto. Adems, mi
ecuacin tiene tres variables independientes
ms y es ms completa que la del consultor".
Comente esta afirmacin. Estara de acuerdo con esta persona? Explique.

6. Resuma los pasos implicados en la conduccin de la prueba-t. Cul es la base para el


uso de la "regla de 2" como mtodo conveniente de evaluacin de las razones-t?
7. Explique brevemente el significado de la
prueba-F. Por qu piensa que esta prueba se
considera ms importante en el anlisis de
regresin mltiple que en el anlisis de regre
sin simple?
8. Qu es la multicolinealidad? Cmo detectan
los investigadores este problema. Cul es el
impacto de este problema en los estimadores
de la regresin? Qu pasos conviene dar para tratar este problema?
9. En qu consiste el problema de identificacin? Qu efecto tendr este problema en las
estimaciones de la regresin de una funcin
de demanda? Explique.

PROBLEMAS

-------------------------------------------------------------~A~~~~
l. En los primeros aos de la dcada de los noventa, la industria de la electrnica de
consumo tena altas esperanzas para el xito de un tipo de reproductor de discos
compactos que despliega programas sofisticados de audio y video en un equipo
de televisin. El precio inicial de este producto, que permitira a los usuarios recorrer programas que van de las obras completas de William Shakespeare a un libro
de cocina con ms de 450 recetas con fotografas a color y sonorizacin, se fij en
aproximadamente $1,000.
a. Suponga que se le pidi que llevara a cabo una investigacin de mercado para
este producto. Es posible usar el anlisis de regresin para un producto como ste,
que nunca antes ha estado en el mercado? Si lo cree as, qu tendra que hacer
para llevar a cabo esta investigacin?
b. Al acumularse datos acerca de las ventas de este producto, sugiera los tipos de
variables que podran incluirse en el anlisis de regresin de la demanda para
este nuevo tipo de reproductor de CD.
c. Qu le dice la actual popularidad de las computadoras multimedia personales,
los juegos de video y los asistentes personales digitales, acerca de las dificultades de usar la regresin (o en este caso, cualquier otra tcnica cuantitativa) para
pronosticar la demanda de un producto?
2. Una de las tareas ms difciles en el anlisis de regresin es la de obtener datos
adecuados para los estudios cuanttativos de esta clase. Suponga que est tratando
de estimar la demanda para los muebles del hogar. Sugiera las clases de variables que
conviene usar para representar los siguientes factores, que se cree afectan la demanda de cualquier producto. Sea tan especfico como sea posible acerca de cmo van a
medirse dichas variables. Anticipa usted cualquier dificultad para obtener tales
datos? Explique.

Capitulo 5 Estimacin de la

217

DETERMINANTES DE

VARIABLES SUGERIDAS PARA USAR

LA DEMANDA PARA MUEBLES

EN EL ANUSIS DE REGRESIN

---------------------------------Precio
Gustos y preferencias
Precio de productos relacionados
Ingreso
Costo o disponibilidad de crdito
Nmero de compradores
Expectativas futuras
Otros factores posibles

3. Usted es el director de una gran concesionaria de automviles que quiere aprender


ms acerca de la efectividad de varios descuentos ofrecidos a los consumidores durante los pasados 14 meses. A continuacin se indica el promedio de los precios negociados para cada mes y las cantidades vendidas de un modelo bsico (ajustado para
varias opciones) durante este periodo.
a. Concentre esta informacin en una grfica de dispersin. Estime la ecuacin de
la demanda. Qu indican los resultados de regresin acerca de la conveniencia
del precio de descuento? Explique.
MEs

PRECIO

CANTIDAD

Ene.
Feb.
Mar.
Abril
Mayo

12,500

15

12,200

17

11,900

16

12,000

18

11,800

20

Junio

12,500

18

Julio
Agosto
Sept.
Oct.
Nov.

11,700

22

12,100

15

11,400

22

11,400

25

11,200

24

Dic.

11,000

30

Ene.
Feb.

10,800

25

10,000

28

b. Qu otros factores adems del precio deben incluirse en esta ecuacin? Usted
prev alguna dificultad en la obtencin de datos adicionales o en su incorporacin dentro del anlisis de regresin?
4. El fabricante de una marca lder de comida de bajas caloras para microondas estim
la siguiente ecuacin de demanda para su producto mediante el uso de datos de 26
supermercados alrededor del pas para el mes de abril:
O

218

.c.::

Economa de empresa

-5,200 - 42P + 20Px + 5.2/ + 0.20A + 0.25M


(2,002) (17.5)

(6.2)

R2

"'

0.55

.c.::.

(2.5)
26

(0.09)

(0.21)

F = 4.88

Considere los siguientes valores para las variables independientes:

Q = cmUidad vendida mensual


P (en centavos)= precio del producto= 500
Px (en centavos) = precio del competidor lder del producto= 600
I (en dlares) = ingreso per G:ipita del rea estadstica metropolitana estndar
(SMSA, standard metropolitan statistical area) en la que se localiza
el supermercado = 5,500
A (en dlares) = gastos mensuales en publicidad = 10,000
J\!1 -: :.:. : nmero de hornos de microondas vendidos en el SMSA en el que se
ubica el supermercado= 5,000.
Con esta informacin, conteste las siguientes preguntas:
a. Calcule las elasticidades para cada una de las variables.
b. Qu tan preocupada piensa que debera estar la compaa acerca del impacto de
una recesin en sus ventas? Explique.
c. Piensa que esta empresa debe recortar su precio para incrementar su participacin de mercado? Explique.
d. Qu porcin de la variacin en las ventas es explicada por las variables independientes de las ecuaciones? Qu tan confiado est usted de esta respuesta?
Explique.
5. Un fabricante de estaciones de trabajo de cmputo que reuni cifras de ventas mensuales promedio de sus 56 sucursales y sus distribuidores a lo largo del pas estim la
siguiente demanda para su producto:
Q=

+15,000

-- 2.80P -+- 150A + 0.3Ppc +- 0.35Pm

(5,234)

R2

"'"'

(1.29)

0.68

(175)

(0.12)

EEE = 786

(0.17)

+ 0.2Pc
(0.13)

F = 21.25

Las variables y sus valores son:


cantidad
precio del modelo bsico :.:e 7,000
A = gastos t'n publicidad (en miles) =52
P,,,. == precio prom.edio de UIIa computadora personal -: : : 4000
!;i '"= precio promedio de una mnicomputadora = 15 000
Pe = precio promedio de la estacin de trabajo lder de la competencia
Q
p

=--=

o:-:::

=8,000

a. Calcule las elasticidades para cada una de las variables. Sobre esta base, discuta
el impacto relativo de cada variable en la demanda. Qu implicaciones tienen
estos resultados para el marketing de la empresa y las polticas de fijacin de
precios?
b. Lleve a cabo una prueba-t para la significancia estadstica de cada variable. En
cada caso, exprese si se requiere la prueba de una o de dos colas. Qu diferencia
hay en los resultados, si es que hay alguna, en el uso de la prueba de una cola o
de dos colas?
c. Suponga que un administrador que evala estos resultados sugiere que las tasas
de inters y el desempeo de la computadora (tpicamente medidos en millones
de instrucciones por segundo, MIPS) son determinantes importantes de la demanda de estaciones de trabajo y por lo tanto deben incluirse en el estudio. Cmo respondera a esta sugerencia? Explique.
Captulo 5 Estimacin de la demanda

219

6. Deck & Blacker es un fabricante de aparatos pequeos de cociria. Su economista estima la siguiente demanda para hornos tostadores mediante los datos reunidos en 16
trimestres de los diez distribuidores ms importantes de venta al detalle de su producto. Este tipo de muestra, que implica el uso de datos de corte transversal y de series de tiempo, se denomina muestra mancomunada o agrupada. Sobre la base de esta
muestra mancomunada de 160 observaciones, el economista estim la siguiente
ecuacin:
Q

1. 1P + 1
(0.9)

!-

(0.6)

17)

(0.1

f.:c.c

Las variables y los valores, incorporados a la ecuacin con propsitos de pronstico


son los siguientes:

Q . caridad demandada, en
P = precio, en dlares:::
gastos en publicidad, en miles = 20
1 e::: ingreso promedo de hogares; en miles = 31
H =: nmero total de ventas residenciales, c~n miles:;::; 10
P, ::. precio
competidor lder, en
=50
A

a. Debe esta compaa tratar de comercializar sus hornos tostadores en tiendas


gourmet para un segmento de altos ingresos? Explique.
b. Qu tan preocupada debe estar esta compaa acerca de los descuentos en el
precio de su competidor lder? Explique.
c. Qu tan efectiva piensa usted que sea la publicidad para esta compaa?
d. Debe considerar esta compaa hacer descuentos en el precio con el fin de ganar
participacin de mercado a expensas de sus competidores? Explique.
e. Suponiendo que los valores de lis variables estn dados, indique el intervalo de
confianza de 95% del pronstico de la demanda para hornos tostadores.
7. A usted le dan la siguiente funcin de demanda para automviles europeos de lujo:
1

()9:')

/(i

p1.'
!

donde P P,1 --- precio


P; =: precio
.:.: : inC'JPTCSO

Asuma que cada coeficiente es estadsticamente significativo (es decir, que pas la
prueba-t). Con base en la informacin dada, conteste las siguientes preguntas:
a. Comente la posibilidad de sustitucin entre los carros de lujo estadounidenses y
europeos, y entre los carros de lujo europeos y japoneses. Explique algunas de
las posibles razones para los resultados en la ecuacin.
b. Comente acerca del coeficiente para la variable de ingreso. Era ste el resultado
que usted esperaba? Explique.
c. Comente acerca del coeficiente de la variable del precio del auto europeo. Es lo
que usted esperara? Explique.

220

Economa de empresa

Vous aimerez peut-être aussi