Académique Documents
Professionnel Documents
Culture Documents
la muestra. (Por ejemplo, n 8 para la tabla 10-1). Con frecuencia los programas de
cmputo proporcionan la desviacin estndar sb1 Por ejemplo, los resultados de Mini-
tab incluidos en esta seccin (vase la pgina 567) indican que sb1 5 0.04486 se loca-
liza en la columna con el encabezado de SE Coeff y en el rengln correspondiente a la
primera variable de prediccin de la duracin. Utilice los datos muestrales de la tabla
10-1 y los resultados de Minitab incluidos en esta seccin para poner a prueba la ase-
veracin de que b1 0. Tambin pruebe la aseveracin de que b2 0. Qu implican
los resultados sobre la ecuacin de regresin?
18. Intervalo de confianza para un coeficiente de regresin. Un intervalo de confianza
para el coeficiente de regresin b1 se expresa como
b1 2 E , b1 , b1 1 E
donde
E 5 t a>2sb1
Ao 1800 1820 1840 1860 1880 1900 1920 1940 1960 1980 2000
Ao codificado 1 2 3 4 5 6 7 8 9 10 11
Poblacin 5 10 17 31 50 76 106 132 179 227 281
10-6 Elaboracin de modelos 579
cuadrtico, pero su funcin de regresin ml- Line Plot. Usted puede elegir un modelo li-
Uso de la tecnologa tiple puede emplearse con los datos de la tabla neal, un modelo cuadrtico o un modelo c-
10-4 para generar el modelo cuadrtico de la bico. Los resultados incluyen la ecuacin, el
Cualquier sistema capaz de realizar regre-
siguiente manera: primero introduzca los va- valor de R2 y la suma de cuadrados de los
sin mltiple puede emplearse para generar
lores poblacionales en la columna 1 de la residuales.
algunos de los modelos descritos en esta sec-
ventana de datos de STATDISK. Introduzca
cin. Por ejemplo, STATDISK no est dise- TI-83/84 PLUS Primero inicie la fun-
1, 2, 3, . . . , 11 en la columna 2 e introduz-
ado para trabajar directamente con el modelo cin diagnstica de la siguiente manera: pre-
ca 4, 9, . . . , 121 en la columna 3. Haga clic
en Analysis y luego seleccione Multiple Re- sione 2nd CATALOG, despus baje hasta
gression. Utilice las columnas 1, 2, 3, con la DiagnosticON y presione la tecla ENTER
columna 1 como variable dependiente. Des- dos veces. Introduzca los datos apareados en
pus de hacer clic en Evaluate, STATDISK las listas L1 y L2. Presione STAT, seleccione
genera la ecuacin y 10.012 6.0028x CALC y luego elija el modelo deseado de las
2.7669x2, junto con R2 0.99917, que son opciones disponibles. Presione ENTER, lue-
los mismos resultados obtenidos con la calcu- go ingrese L1, L2 (con la coma) y presione
ladora TI-83>84 Plus. ENTER nuevamente. Los resultados inclu-
yen el formato de la ecuacin junto con los
MINITAB Primero ingrese los datos coeficientes utilizados en la ecuacin; tam-
apareados en las columnas C1 y C2, des- bin se incluye el valor de R2 en muchos de
pus seleccione Stat, Regression y Fitted los modelos.
4. El mejor modelo. Suponga que utilizamos una muestra con los mtodos de esta sec-
cin para calcular que, de los cinco modelos posibles, el mejor modelo es y 4x1.2 con
R2 0.200. Este mejor modelo parece ser un buen modelo? Por qu?
Obtencin del mejor modelo. En los ejercicios 5 a 12, construya un diagrama de disper-
sin e identifique el modelo matemtico que se ajusta mejor a los datos indicados. Suponga
que el modelo se va a emplear nicamente para el alcance que tienen los datos y considere
slo los modelos lineal, cuadrtico, logartmico, exponencial y potencial.
x 1 2 3 4 5 6
5.
y 5 7 9 11 13 15
x 1 2 3 4 5 6
6.
y 2 4 8 16 32 64
x 1 2 3 4 5 6
7.
y 1 7 17 31 49 71
x 1 2 3 4 5 6
8.
y 3 8.485 15.588 24 33.541 44.091
Ao 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993
Muertes 15 34 33 33 39 43 50 47 53 38 35
Ao 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Muertes 49 42 60 54 67 82 78 81 95 73 69
10. Muertes de manates por causas naturales. La siguiente tabla lista el nmero de
muertes de manates en Florida por causas naturales (segn datos de Florida Fish and
Wildlife Conservation). El mejor modelo parece ser un modelo razonablemente bueno?
Ao 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993
Muertes 6 24 19 1 10 15 18 21 13 20 22
Ao 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Muertes 33 35 101 42 12 37 37 34 59 102 25
11. Experimento de fsica. Un experimento para una clase de fsica implica dejar caer
una pelota de golf y registrar la distancia (en metros) que cae en diferentes tiempos
(en segundos) despus de ser soltada. Los datos se incluyen en la siguiente tabla. Pro-
yecte la distancia para un tiempo de 12 segundos, dado que la pelota de golf se dej
caer de un edificio con una altura de 50 m.
12. Mercado burstil. A continuacin se listan, por rengln, los valores mximos anuales
del Promedio Industrial Dow Jones para cada ao a partir de 1980. Cul es el mejor
valor predicho para el ao 2004? Dado que el valor real mximo en 2004 fue 10,855,
qu tan bueno fue el valor predicho? Qu sugiere el patrn acerca del mercado
Repaso 581
Ao 1971 1974 1978 1982 1985 1989 1993 1997 1999 2000 2002 2003
Transistores 2.3 5 29 120 275 1180 3100 7500 24,000 42,000 220,000 410,000
Repaso
Este captulo present mtodos bsicos para investigar relaciones o correlaciones entre
dos o ms variables.
La seccin 10-2 emple diagramas de dispersin y el coeficiente de correlacin lineal
sin que (por medio del criterio de los mnimos cuadrados) se ajusta mejor a los datos
apareados. Cuando existe una correlacin lineal significativa, la ecuacin de regre-
sin puede utilizarse para predecir el valor de una variable, dado algn valor de la otra
variable.
582 Captulo 10 Correlacin y regresin
Ejercicios de repaso
1. Muerte de manates. La tabla que se incluye a continuacin lista el nmero de muertes
de manates en Florida, relacionadas con encuentros con embarcaciones y provoca-
das por causas naturales durante varios aos (segn datos de Florida Fish and Wildlife
Conservation).
a. Calcule el valor del coeficiente de correlacin lineal y determine si existe una co-
rrelacin lineal significativa entre las dos variables.
b. Calcule la ecuacin de la recta de regresin. Permita que el nmero de muertes na-
turales represente la variable de respuesta (y). Cul es el mejor nmero predicho
de muertes naturales en un ao con 50 muertes por encuentros con embarcaciones?
Embarcacin 49 42 60 54 67 82 78 81 95 73 69
Natural 33 35 101 42 12 37 37 34 59 102 25
2. Old Faithful. Utilice los datos que se presentan a continuacin (de la tabla 10-1).
Las duraciones estn en segundos y las alturas en pies.
a. Existe una correlacin lineal significativa entre la duracin de una erupcin del
giser Old Faithful y la altura de la erupcin?
Ejercicios de repaso acumulativo 583
3. a. Utilice un nivel de significancia de 0.05 para probar una correlacin lineal entre el
costo de la electricidad y los kWh de electricidad consumidos.
b. Qu porcentaje de la variacin en el costo se puede explicar por medio de la rela-
cin lineal entre el consumo de electricidad (en kWh) y el costo?
c. Calcule la ecuacin de la recta de regresin que exprese el costo (y) en trminos de
la cantidad de electricidad consumida (en kWh).
d. Cul es el mejor costo predicho para un tiempo en el que se utilizan 3000 kWh de
electricidad?
4. a. Utilice un nivel de significancia de 0.05 para probar una correlacin lineal entre la
temperatura diaria promedio y el costo.
b. Qu porcentaje de la variacin en el costo se puede explicar por medio de la rela-
cin lineal entre el costo y la temperatura diaria promedio?
c. Calcule la ecuacin de la recta de regresin que exprese el costo (y) en trminos de
la temperatura diaria promedio.
d. Cul es el mejor costo predicho para un tiempo en el que la temperatura diaria
promedio es de 40?
5. Utilice un programa de cmputo como STATDISK, Minitab o Excel para calcular la ecua-
cin de regresin mltiple con la forma y 5 b0 1 b1x1 1 b2x2 , donde la variable de res-
puesta y representa el costo, x1 representa el consumo de electricidad en kWh y x2
representa la temperatura diaria promedio. Adems, identifique el valor del coeficiente
mltiple de determinacin R2, la R2 ajustada y el valor P que representa la significancia ge-
neral de la ecuacin de regresin mltiple. Se puede usar la ecuacin de regresin para
predecir el costo? Son mejores las ecuaciones de regresin del ejercicio 3 y del ejercicio 4?
Puntos en el Sper
Bowl 56 55 53 39 41 37 69 61
DJIA 6561 8259 9374 11,568 11,401 11,350 10,635 10,454
584 Captulo 10 Correlacin y regresin
1. Pruebe si existe una correlacin entre los puntos del Sper Bowl y el DJIA. El resul-
tado es el que usted esperaba?
2. Calcule la ecuacin de regresin en la que el valor mximo del DJIA sea la variable
de respuesta (y). Cul es el mejor valor del DJIA predicho para un ao en el que se
anotaron 50 puntos en el Sper Bowl?
3. Es posible probar la aseveracin de que el nmero medio de puntos anotados en el
Sper Bowl es igual al valor medio del DJIA? Tendra sentido una prueba como sta?
4. Construya un estimado de un intervalo de confianza del 95% para el nmero medio de
puntos anotados en juegos del Sper Bowl.
5. Por qu sera una mala idea trata de estimar el siguiente valor mximo consecutivo del
DJIA construyendo un estimado de un intervalo de confianza para los valores del DJIA?
6. Al parecer, los puntos del Sper Bowl provienen de una poblacin con una distribu-
cin normal? Por qu?
7. Calcule la media y la desviacin estndar de la muestra de puntos del Sper Bowl.
8. La media y la desviacin estndar del ejercicio 7 son estadsticos muestrales, pero tr-
telos como parmetros poblacionales para una poblacin distribuida normalmente, y
calcule la probabilidad de que en un juego del Sper Bowl seleccionado al azar se
anoten menos de 40 puntos totales.
explicacin razonable para la presencia o ausencia de un procedimiento para predecir valores de una de las
una correlacin. variables, cuando se tienen valores de la otra variable.
Temas sugeridos:
7. Actividad en clase Dividan la clase en grupos de tres o
Existe una relacin entre el sabor y el costo de dis-
cuatro personas. El apndice B incluye muchos conjun-
tintas marcas de galletas de chocolate (o bebidas de
tos de datos que an no se han utilizado en los ejemplos
cola)? El sabor puede medirse con base en una escala
o ejercicios de este captulo. Busque en el apndice B un
numrica, como del 1 al 10.
par de variables de inters, y luego investigue la correla-
Existe una relacin entre los salarios de los juga-
cin y la regresin. Establezca sus conclusiones y trate
dores profesionales de bisbol (bsquetbol o ftbol)
de identificar aplicaciones prcticas.
y sus logros por temporada?
8. Actividad fuera de clase Dividan la clase en grupos Existe una relacin entre el largo de los pies de
de tres o cuatro personas. Investiguen la relacin entre hombres (o mujeres) y su estatura?
dos variables reuniendo sus propios datos muestrales Existe una relacin entre el promedio de calificacio-
apareados y utilizando los mtodos de este captulo pa- nes de los estudiantes y la cantidad de tiempo que ven
ra determinar si existe una correlacin lineal significativa. televisin? Si es as, cul es?
Tambin identifiquen la ecuacin de regresin y describan
Proyecto tecnolgico
Se dedica un gran esfuerzo a estudiar gemelos idnticos que de manera que la primera puntuacin de cada lista represente
fueron separados al nacer y que se criaron aparte uno de el primer conjunto de gemelos, la segunda puntuacin de
otro. Los gemelos idnticos se producen cuando un solo vulo cada lista al segundo conjunto de gemelos y as sucesiva-
fertilizado se separa en dos, de manera que ambos compar- mente. Antes de realizar cualquier clculo, primero estime
ten la misma configuracin gentica. Al obtener las puntua- un valor del coeficiente de correlacin lineal que usted es-
ciones de CI de gemelos idnticos separados al nacer, los perara. Ahora aplique los mtodos de la seccin 10-2 con
investigadores esperan identificar los efectos de la herencia un nivel de significancia de 0.05 para probar una correla-
y del ambiente sobre la inteligencia. En este proyecto si- cin lineal significativa y establezca sus resultados.
mularemos 100 conjuntos de nacimientos de gemelos, pero Considere que el procedimiento anterior es un ensayo. Da-
generaremos sus puntuaciones de CI de manera que no exis- da la forma en que los datos muestrales fueron generados, qu
tan influencias genticas o ambientales comunes. Con un proporcin de esos ensayos debe conducir a la conclusin
generador de nmeros aleatorios de un paquete de cmputo incorrecta de que existe una correlacin lineal significativa?
o de una calculadora, genere una lista de 100 puntuaciones Si repetimos los ensayos, podemos verificar que la proporcin
de CI simuladas, seleccionadas al azar de una poblacin dis- es aproximadamente correcta. Repita el ensayo o combine
tribuida normalmente, con una media de 100 y una desvia- sus resultados con otros para verificar que la proporcin
cin estndar de 15. Ahora use el mismo procedimiento para es aproximadamente correcta. Recuerde que el error tipo I es
generar una segunda lista de 100 puntuaciones de CI simu- aquel que se comete al rechazar una hiptesis nula verdade-
ladas, que tambin se seleccionen al azar de una poblacin ra, lo que, en este caso, implicara concluir que existe una
distribuida normalmente, con una media de 100 y una desvia- correlacin lineal significativa, cuando en realidad no existe
cin estndar de 15. Aun cuando las dos listas se generan de tal correlacin.
manera independiente, considrelas como datos apareados,
586 Captulo 10 Correlacin y regresin
De los datos a la decisin Anlisis de los resultados racin especfica de que el tratamiento es
eficaz y luego aplique los mtodos de la
Pensamiento crtico: Duragesic 1. Utilice los datos indicados para construir seccin 9-4 para probar esa aseveracin.
un diagrama de dispersin y luego apli-
es eficaz para reducir el dolor? 5. Cul de los resultados anteriores es mejor
que los mtodos de la seccin 10-2 para
A continuacin se listan las medidas de la in- hacer una prueba de correlacin lineal para determinar si el tratamiento con el fr-
tensidad del dolor antes y despus de utilizar entre la intensidad del dolor antes del tra- maco es eficaz para reducir el dolor? Cul
el medicamento patentado Duragesic (segn tamiento y despus del tratamiento. Si de los resultados anteriores es el menos
datos de Janssen Pharmaceutical Products, existe una correlacin lineal significati- efectivo para determinar si el tratamiento
L.P.). Los datos aparecen en orden por ren- va, se infiere que el tratamiento con el con el frmaco es eficaz para reducir el do-
gln, y las medidas correspondientes son del frmaco es eficaz? lor? Con base en los resultados anteriores,
mismo sujeto antes y despus del tratamien- parece que el frmaco es eficaz?
to. Por ejemplo, el primer sujeto tuvo una me- 2. Utilice los datos para calcular la ecuacin
dida de 1.2 antes del tratamiento, y una medida de la recta de regresin. Permita que la va-
de 0.4 despus del tratamiento. Cada par de riable de respuesta (y) sea la intensidad del
mediciones corresponde a un sujeto, y la in- dolor despus del tratamiento. Cul sera
tensidad del dolor se midi utilizando la la ecuacin de la recta de regresin para un
puntuacin anloga visual estndar. tratamiento que no tiene ningn efecto?
Intensidad del dolor antes del tratamiento con 3. Los mtodos de la seccin 9-3 se pueden
Duragesic emplear para probar la aseveracin de que
dos poblaciones tienen la misma media.
1.2 1.3 1.5 1.6 8.0 3.4 3.5 2.8 2.6 2.2 Identifique la aseveracin especfica de
3.0 7.1 2.3 2.1 3.4 6.4 5.0 4.2 2.8 3.9 que el tratamiento es eficaz y luego utilice
5.2 6.9 6.9 5.0 5.5 6.0 5.5 8.6 9.4 10.0 los mtodos de la seccin 9-3 para probar
7.6 esa aseveracin. Los mtodos de la sec-
Intensidad del dolor despus del tratamiento cin 9-3 se basan en el requisito de que las
con Duragesic muestras son independientes. Son inde-
pendientes en este caso?
0.4 1.4 1.8 2.9 6.0 1.4 0.7 3.9 0.9 1.8
0.9 9.3 8.0 6.8 2.3 0.4 0.7 1.2 4.5 2.0 4. Los mtodos de la seccin 9-4 permiten
1.6 2.0 2.0 6.8 6.6 4.1 4.6 2.9 5.4 4.8 poner a prueba una aseveracin acerca
4.1 de datos apareados. Identifique la aseve-
La estadstica en el trabajo
En un mundo de negocios En qu consiste su trabajo? Qu conocimientos de estadstica
Dirijo un equipo de personas responsables
se requieren para obtener un empleo
que se muestra fascinado como el suyo?
de planear y pronosticar medidas tales co-
con los nmeros y con los mo la asistencia al parque, la ocupacin Yo tengo una maestra en economa, con
en cada uno de nuestros hoteles y las utili- especialidad en mtodos de anlisis cuan-
datos, la estadstica es dades que Walt Disney World obtendr titativo. Por lo general se requiere de algn
fundamental para poder por estos negocios bsicos. ttulo de posgrado con nfasis en anlisis
estadstico para tener xito en un puesto
Cmo usa usted la estadstica y como el mo.
analizar y resumir apro-
qu conceptos especficos de esta
piadamente grandes materia emplea? Considera que las personas que soli-
citan empleo en su compaa son vis-
cantidades de datos. La estadstica es fundamental para el pro- tas de forma ms favorable si tienen
ceso de pronstico. Muchas de nuestras
algunos estudios de estadstica?
herramientas de pronstico se basan en
tcnicas de regresin mltiple, y algunos Se requiere de cierto nivel de experiencia
de esos modelos son ms complejos que con la estadstica para tener un puesto en
otros. Tambin empleamos cotidianamen- el equipo de pronstico y anlisis. Hay mu-
te muchos conceptos estadsticos bsicos, chos otros puestos en Walt Disney World
como el reporte del error medio del que veran de manera ms favorable a
porcentaje absoluto de nuestros prons- los solicitantes que tienen estudios de es-
ticos, la comprensin de las medidas de tadstica.
tendencia central, las distribuciones y las
tcnicas de muestreo cuando realizamos Recomendara a los estudiantes
la investigacin de mercado; o la aplica- universitarios de hoy que estudien
cin de correlaciones para entender la estadstica? Por qu?
Mark D. Haskell manera en que diferentes variables se aso- Definitivamente s. En un mundo de ne-
cian con nuestros principales negocios. Se gocios que se muestra fascinado con los
Director de pronsticos y anlisis
dispone de muchos enfoques para crear nmeros y con los datos, la estadstica es
Walt Disney World Resort
pronsticos de alta calidad, pero la estads- fundamental para poder analizar y resumir
Como director de pronsticos y tica es un bloque de construccin bsico apropiadamente grandes cantidades de
anlisis de Walt Disney World Re- para casi cualquiera de esos enfoques. datos. Incluso si uno no es el respon-
sort, Mark dirige un equipo de sable de realizar el anlisis, necesita una
Describa un ejemplo especfico de
personas responsables de planear comprensin bsica para utilizar adecua-
cmo el uso de la estadstica sirvi
y pronosticar valores como la asis- damente la informacin en la toma de
tencia, la ocupacin de hoteles y
para mejorar un producto o servicio. decisiones. Es necesario aprender a utili-
las ganancias proyectadas. Al ana- Recientemente, mi equipo utiliz el anli- zar la estadstica de manera apropiada, o
lizar diversos factores, Mark y su sis de correlacin para entender qu fuen- se corre el riesgo de que los individuos
equipo ayudan a que Disney con- tes de datos seran ms tiles para pre- que saben ms de estadstica la utilicen
tine trabajando para asegurarse decir la asistencia y los gastos en uno de en contra de uno.
de que cada husped tenga una nuestros centros de venta al detalle. Con Qu otras habilidades son
experiencia divertida e inolvidable base en ese trabajo, desarrollamos un
importantes para los estudiantes
en Walt Disney World Resort. modelo de regresin que sirve para que
los lderes de la empresa conozcan las ga-
universitarios de hoy?
nancias potenciales, determinen las nece- Las habilidades de comunicacin, tanto
sidades de personal, establezcan las horas verbales como escritas. Se considera muy
de operacin, identifiquen nuevas opor- valiosas a las personas que saben analizar
tunidades de productos y nuevas necesi- informacin compleja, que luego la sim-
dades de inversin de capital, slo por plifican y la comunican con claridad para
nombrar algunas aplicaciones. su uso sencillo.