Vous êtes sur la page 1sur 27

26/08/2013

DEPARTAMENTO DE INGENIERIAS

Curso: Diseo de Experimentos Ambientales


Ing. Omar Murrieta Pozos

UNIDAD I: Regresin lineal.

1.1.0 1.1.1 1.1.2 1.1.3

Regresin lineal simple. Estimacin de parmetros. Prueba de significancia. Medidas de adecuacin del modelo(anlisis residual, coeficiente de determinacin, coeficiente de correlacin). 1.1.4. Estimacin de intervalo de prediccin.

26/08/2013

UNIDAD I: Regresin lineal.

1.2.0 1.2.1 1.2.2 1.2.3 1.2.4 1.2.5 1.3.0

Regresin lineal mltiple. Estimacin de parmetros. Prueba de significancia. Prueba de coeficientes individuales. Medidas de adecuacin del modelo de regresin (anlisis residual, coeficiente de determinacin, coeficiente de correlacin) Estimacin del intervalo de prediccin Paquete computacional para la solucin de problemas.

UNIDAD I: Regresin lineal.


Horario: Lunes Martes (07:00-09:00) (07:00-09:00) E2 LA1

Sesiones: 4 horas/semana
*Nota: El estudiante se apoyara del uso de la calculadora cientfica y cuaderno individual para apuntes.

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Objetivo General
Analizar, identificar y aplicar mtodos estadsticos tiles en la investigacin, que permitan abordar fenmenos tecnolgicos y ambientales as como facilitar la estimacin e interpretacin lo cual permitir dar solucin eficaz a problemas relacionados con la Ingeniera Ambiental.

Competencias especificas (Unidad I: Regresin lineal)


1. 2. 3. 4. Conocer los mtodos para el anlisis de regresin. Identificar la variable de respuesta. Identificar la(s) variable(s) de control. Realizar un anlisis estadstico de un caso empleando el anlisis de regresin.

Instrumentos de evaluacin
1. Apuntes 2. Investigacin 3. Ejercicios 4. Practicas Computacionales 4. Evaluacin 10% 10% 20% 20% 40%

(Martes 03 Sep 2013)

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Bibliografa
I. Hines, W.W. y Montgomery, D.C. (1993). Probabilidad y Estadstica para Ingeniera y Administracin. (3 Ed). Mxico: CECSA. II. 2Kuehl, R.O. (2001). Diseo de experimentos. Principios estadsticos para el diseo y anlisis de investigaciones. (2 Ed.) Mxico: Thomson III. Levin, R.I. y Rubin, D.S. (1996). Estadstica para Administradores. (6a Ed.). Mxico: Prentice Hall Hispanoamericana. IV. Mason, R.D.; Lind, D.A. y Marchal, W.G. (2001). Estadstica para Administracin y Economa. (3a Ed.) Mxico: Mc Graw Hill. V. Mason, R.D.; Lind, D.A. y Marchal, W.G. (2002). Estadstica para Administracin y Economa. (10a Ed.) Mxico: Alfaomega. VI. Miller, I.R., Freund, J.E. y Johnson, R. (1992). Probabilidad y Estadstica para Ingenieros. (4 Ed.). Cuarta Edicin. Mxico: Prentice Hall. VII. Montgomery, D.C. y Runger, G.C. (1996). Probabilidad y Estadstica aplicadas a la Ingeniera. Mxico: Mc Graw Hill

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

La estadstica aplicada a la investigacin La estadstica y. en particular, el diseo de experimentos. son considerados en la literatura cientfica como tcnicas que deben incorporarse al desarrollo fie I proceso investigativo. Ubicar la estadstica en el contexto de la investigacin es asunto de In teora del conocimiento. Sin pretender entrar en el campo filosfico. se enunciaran algunas ideas relacionadas con la adquisicin del conocimiento cientfico.

Por otra parte, segn el tipo de inters que se tenga en la bsqueda del conocimiento, la ciencia tiene dos propsitos: incrementar el conocimiento y contribuir al bienestar y al poder de los pueblos. A la primer a se Ie llama ciencia pura y a la segunda ciencia aplicada. Es claro que esta subdivisin no esta delimitada rgidamente: la ciencia es pura solamente en el sentido de que no se preocupa de las aplicaciones. pero sus resultados pueden eventualmente contribuir a la solucin de un problema de naturaleza real.

EI mtodo de la ciencia o mtodo cientfico, es un proceso que da indicaciones para avanzar en la investigacin y suministrar medios para evitar algunos errores, pero no reemplaza la inventiva ni la originalidad.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Bunge (1983) describe ocho pasos en la aplicacin del mtodo cientfico, ellos son: 1. 2. 3. 4. 5. 6. 7. 8. Enunciar preguntas bien formuladas y verosmilmente fecundas Arbitrar conjeturas fundadas y contrastables con la experiencia para contestar a las preguntas formuladas. Derivar consecuencias lgicas de las conjeturas. Arbitrar tcnicas para someter las conjeturas a contrastacin Someter, a su vez, a contrastacin esas tcnicas para comprobar su relevancia Llevar a cabo las contrastacin e interpretar los resultados Estimar la pretensin de verdad de las conjeturas y la fidelidad de las tcnicas. Determinar los dominios en los cuales son validas las conjeturas y las tcnicas, y formular problemas nuevos originados por la investigacin.

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Bunge (1983) describe ocho pasos en la aplicacin del mtodo cientfico, ellos son: 1. 2. 3. 4. 5. 6. 7. 8. Enunciar preguntas bien formuladas y verosmilmente fecundas Arbitrar conjeturas fundadas y contrastables con la experiencia para contestar a las preguntas formuladas. Derivar consecuencias lgicas de las conjeturas. Arbitrar tcnicas para someter las conjeturas a contrastacin Someter, a su vez, a contrastacin esas tcnicas para comprobar su relevancia Llevar a cabo las contrastacin e interpretar los resultados Estimar la pretensin de verdad de las conjeturas y la fidelidad de las tcnicas. Determinar los dominios en los cuales son validas las conjeturas y las tcnicas, y formular problemas nuevos originados por la investigacin.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

La estadstica ayuda a responder preguntas, no a formularlas. Para dar los tres primeros pasos en la practica cientfica, el investigador o requiere la estadstica: esta le dice poco acerca de como descubrir hiptesis o derivar consecuencias de ellas. Sin embargo, el conocimiento de sus principios y mtodos en el momento de escoger aquellas conjeturas contrastables, que deben traducirse al lenguaje matemtico para su verificacin. Por otras parte, mediante la estadstica se corrobora o se refuta una hiptesis pero no se demuestra; es decir, esta no puede establecerse con certeza. Aqu se esta poniendo en relieve que los mtodos estadsticos no son de naturaleza deductiva sino inductiva. Aun permanece el concepto, no cientfico, sobre la posibilidad de falsear ciertas conclusiones utilizando estadstica. Disraeli, poltico y escritor ingles del siglo XIX, deca que haba tres clases de mentiras: mentirillas, mentiras execrables y estadsticas. Segn Di Trocchio (1998), entre las posibilidades de algunos cientficos para engaar a sus lectores esta el conocimiento profundo de los trucos estadsticos, que otorgan la posibilidad de sostener con rigor matemtico toda idea surgida de la fantasa. Como ocurre con otras ciencias, la estadstica puede utilizarse con fine no siempre plausibles, pero esto no le quita su carcter cientfico.

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras Microsoft Excel Minitab 16

SPSS 19

Statgraphics

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Minitab 16
Minitab es un programa de computadora diseado para ejecutar funciones estadsticas bsicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de ejecucin de anlisis estadsticos. En 1972, instructores del programa de anlisis estadsticos de la Universidad Estatal de Pennsylvania (Pennsylvania State University) desarrollaron MINITAB como una versin ligera de OMNITAB, un programa de anlisis estadstico del Instituto Nacional de Estndares y Tecnologa (NIST) de los Estados Unidos.

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Regresin lineal simple y correlacin simple


Pronosticar es emitir un enunciado sobre lo que es probable que ocurra en el futuro, basndose en anlisis y en consideraciones de juicio. Objetivo de un Pronstico: Obtener conocimiento sobre eventos inciertos que son importantes en la toma de decisiones presentes.

Pronstico: Este ser til si reduce la incertidumbre que rodea al evento en cuestin y tenindolo resulta en una decisin cuyo beneficio sea superior al costo incurrido en obtener el pronstico. Mtodos de Pronsticos

Cualitativos: Se usan cuando los datos son escasos (ejemplo introduccin de un producto
nuevo al mercado). En estas tcnicas se usa el criterio de las personas y ciertas relaciones para transformar informacin cualitativa en estimados cuantitativos.

Cuantitativos: En ellos se hace uso de informacin histrica que puede cuantificarse

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Mtodos de Pronsticos Cuantitativos


1. 2. 3.

Se utilizan cuando existen estas tres condiciones: Hay informacin sobre el pasado. Esta informacin puede cuantificarse en forma de datos. Puede suponerse que el patrn del pasado se repetir en el futuro (Suposicin de consistencia, es ms probable que sea correcta a corto plazo ms que a largo plazo).

Mtodos de Pronsticos Cuantitativos Se clasifican en:


Modelos Causales los cuales asumen que el factor que va a ser pronosticado exhibe una
relacin causa-efecto con una o mas variables independientes. Anlisis de Series de Tiempo su objetivo es descubrir el patrn subyacente en la serie de datos histricos y extrapolar ese patrn al futuro.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Modelos causales
En este tipo de modelos, el pronstico se expresar como funcin de cierto nmero de factores, los cuales determinan el resultado. Son mas apropiados para hacer pronsticos para horizontes de 3 meses a 1 ao.

Meta: Predecir la variable dependiente descubriendo cmo est relacionada con una o mas variables independientes. Importante: Considerar que las relaciones encontradas por la regresin son relaciones de asociacin , pero no necesariamente relaciones de causa y efecto.

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Regresin lineal simple y correlacin simple


El objetivo de estudiar regresin lineal simple es para obtener el modelo de regresin ms apropiado, es decir, una ecuacin de regresin lineal simple o mltiple para fines de prediccin y estimacin. Los componentes de esta ecuacin de regresin lineal, con solo una variable independiente, tambin llamado modelo lineal de primer orden, son la variable dependiente Y o funcin de respuesta y, la variable independiente X. El modelo de esta ecuacin, que describe la relacin de la variable X con la variable Y, se llama la ecuacin de regresin de Y sobre X y, la grfica de esta funcin, se llama la curva de regresin.

El modelo de regresin lineal poblacional que describe la relacin entre la respuesta o variable dependiente Y y, la variable independiente o regresora X es:

Donde: Y = variable dependiente poblacional (tambin se usa la anotacin y) o = intercepto en la ordenada 1 = pendiente de la lnea x1 = variable independiente

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

La ecuacin de la lnea de regresin muestral que estima a modelo de regresin poblacional anterior se da como:

Donde: Y = valor de la variable dependiente de la muestra a = intercepto en la ordenada b = pendiente de la lnea

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Tipos de correlacin lineal


1. Correlacin simple que consiste de dos variables, una dependiente (Y) y la otra independiente (X). Dentro de esta categora tenemos: (a) Correlacin directa. Esta correlacin consiste en el incremento en una variable la cual es acompaada por el incremento de otra variable (correlacin positiva). (b) Correlacin inversa. Esta correlacin consiste en el incremento de una variable la cual es acompaada por el incremento de otra (correlacin negativa). (c) Correlacin no lineal. En esta correlacin no hay ninguna asociacin entre las dos variables. 2. Correlacin mltiple. Aqu, hay ms de dos variables. Una variable es dependiente (Y), mientras que las otras son independientes X1, X2,, Xk, etc. Las figuras siguientes representan varios tipos de correlaciones.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Tipos de curvas ms comunes

Diagramas esparcidos con lneas de cuadrados mnimos. La Figura (a) representa una lnea recta con X fija; la Figura (b) representa lnea no recta con X fija; la Figura (c) representa una distribucin adjunta con lnea recta; la Figura (d) representa una distribucin adjunta con lnea no recta; la Figura (e) representa un diagrama donde no hay sociacin entre las dos variable y; la Figura (f) representa una relacin causal. Las otras dos grficas representan correlaciones perfectas.

10

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Figura 8.2. La figura (a) representa la funcin exponencial; la figura (b) representa la funcin de potencia, la figura (c) representa una funcin recproca y, la figura (d) representa una funcin hiperblica.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

EL ERROR ESTNDAR DEL ESTIMADOR: El error estndar de la estimacin es la desviacin estndar condicional de la variable dependiente dado un valor de la variable independiente . Para datos poblacionales, el error estndar del estimador se representa mediante el smbolo para datos mustrales, la frmula es: La frmula alternativa para clculos que no requiere determinar cada uno de los valores ajustados es:

EL COEFICIENTE DE DETERMINACIN (

):

(Indica la proporcin de la varianza de , que queda explicada por la accin de la variable ). Para datos mustrales, puede obtenerse el valor estimado del coeficiente de Determinacin mediante la frmula correspondiente: Una frmula alternativa es:

11

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

EL COEFICIENTE DE CORRELACIN ( ): Aunque el coeficiente de determinacin es relativamente fcil de interpretar, no se prueba muy bien en pruebas estadsticas. Sin embargo, la raz cuadrada del coeficiente de determinacin, que se denomina coeficiente de correlacin si se presta para las pruebas estadsticas.

El valor del coeficiente de correlacin puede variar de 1.00 a +1.00. El signo aritmtico asociado con el coeficiente de correlacin, que es siempre igual al signo de de la ecuacin de regresin, indica la direccin de la relacin entre y ( , ) para el coeficiente de correlacin muestral, la frmula es:

Como una alternativa a la frmula para la correlacin es la siguiente frmula que no requiere de clculo previo de los valores de regresin de y :

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

APARIENCIA GENERAL DE LOS DIAGRAMAS DE DISPERSIN ASOCIADOS CON DIVERSOS VALORES DE CORRELACIN:

12

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Interpretacin de : Si , la correlacin es perfecta, es decir entre las variables hay dependencia lineal exacta y adems, esta dependencia es positiva. Si , la correlacin es perfecta y negativa Si , no existe relacin lineal entre las variables La correlacin es tanto ms fuerte a medida que r se aproxima a 1 +1 y es tanto ms dbil a medida que se aproxima a 0.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Correlaciones positivas

330 280

130 110 90 70

230
180 130 80

r=0,1
140 150 160 170 180 190 200

50 30
140
100
90 80 70 60 50

r=0,4
150 160 170 180 190 200

30

110

90
70 50

r=0,8
140 150 160 170 180 190 200

40 30 140 150 160 170 180

r=0,99
190 200

30

13

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Correlaciones negativas

80
80

60 40
20

60
40

r=-0,5
140 150 160 170 180 190 200

20

r=-0,7
140 150 160 170 180 190 200

80

80
70

60
40 20

60 50 40 30
20 10

r=-0,95
140 150 160 170 180 190 200

r=-0,999
140 150 160 170 180 190 200

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Evolucin de r y diagrama de dispersin

14

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Prueba de hiptesis para regresin

Paso 1) Planteamiento de hiptesis

es la pendiente de la recta y si esta es igual a cero. Significa que es paralela al eje de la y eso quiere decir que no hay pendiente (no hay relacin entre las variables). Para probar la hiptesis nula: se utiliza la tabla de distribucin t de Student con grados de libertad ya que se desconoce la varianza poblacional: el estimador se define:

Paso 2) Establecimiento de los valores crticos de t Valor critico de t para regresin Nota: Se trabaja con 2 niveles de significancia

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Paso 3) Regla de decisin Rechazo si calculada es menor que Paso 4) Calcular

o mayor que

Paso 5) Conclusin

15

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Prueba de hiptesis para correlacin Paso 1) Planteamiento de hiptesis

Paso 2) Establecimiento de los valores crticos de t Valor critico de t para regresin

Nota: Se trabaja con 2 niveles de significancia

Paso 3) Regla de decisin Rechazo si calculada es menor que Paso 4) Calcular

o mayor que

Paso 5) Conclusin

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

1. El dueo de una casa multifamiliar en un suburbio del noreste de estados unidos desea desarrollar un modelo para predecir el consumo de energa elctrica en su casa elctrica( luz, ventiladores, calefaccin, aparatos, etc.) segn la temperatura exterior (en grados Fahrenheit). Dispone de datos de los recibos mensuales y la informacin de temperatura para un periodo de 24 meses. Establezca el diagrama de dispersin. Suponga una relacin lineal y utilice el mtodo de mnimos cuadrados para encontrar los coeficientes de regresin. Interprete el significado de la pendiente en este problema. Pronostique el consumo promedio en kilowatts cuando la temperatura media es de 50F. Calcule el coeficiente de determinacin r2 e interprete su significado. Calcule el error estndar de la estimacin.

16

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

B) Suponga una relacin lineal y utilice el mtodo de mnimos cuadrados para encontrar los coeficientes de regresin.
MES 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 SUMA MEDIA (Y) CONSUMO EN KILOWATS 126 132 114 87 67 50 39 45 39 43 61 92 123 121 138 99 64 52 49 41 44 53 59 118 1856 77.33333333 (X) TEMP PROMEDIO (F) 30 25 29 42 48 61 69 78 72 62 45 36 27 33 28 39 47 63 69 73 70 64 53 27 1190 49.58333333 X2 900 625 841 1764 2304 3721 4761 6084 5184 3844 2025 1296 729 1089 784 1521 2209 3969 4761 5329 4900 4096 2809 729 66274 X*Y 3780 3300 3306 3654 3216 3050 2691 3510 2808 2666 2745 3312 3321 3993 3864 3861 3008 3276 3381 2993 3080 3392 3127 3186 78520 Y2 Y (ESTIMADA) 15876 113.2 17424 122.5 12996 115.06 7569 90.88 4489 79.72 2500 55.54 1521 40.66 2025 23.92 1521 35.08 1849 53.68 3721 85.3 8464 102.04 15129 118.78 14641 107.62 19044 116.92 9801 96.46 4096 81.58 2704 51.82 2401 40.66 1681 33.22 1936 38.8 2809 49.96 3481 70.42 13924 118.78 171602

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

= -1.857898

= 77.33333-(-1.857898)(49.583333)= 169.45 Ecuacin de regresin lineal

(Estimado)

17

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

C) Interprete el significado de la pendiente en este problema. Ecuacin de regresin lineal

(Estimado)

Es la pendiente de la recta. Es el valor que disminuye la variable y por cada unidad que aumenta x. Es decir por cada grado Fahrenheit promedio que aumente la temperatura el consumo de kilowatts disminuye. Al ser negativo se tiene una relacin inversa entre la temperatura y el consumo en kilowatts.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

D) Pronostique el consumo promedio en kilowatts cuando la temperatura media es de 50F. Ecuacin de regresin

Estimando

cuando x = 50 F 76.5551

76.5551 Kilowatts (Estimado)

18

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

E) Calcule el coeficiente de determinacin r2 e interprete su significado.

= 0.8936701952

Esto indica que el 89.367019% de la varianza del consumo en kilowatts (variables y), queda explicada por la temperatura promedio (variable x). El 10.6329% se debe a causas no estadsticas o desconocidas.
F) Calcule el error estndar de la estimacin.

= 11.648158

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

19

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Coeficiente de determinacin Error Estndar de la estimacin

20

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Los siguientes datos representan el cargo promedio (en dlares por minuto) y la cantidad de minutos gastados (en miles de millones) en todas las llamadas telefnicas hechas desde estados unidos a 20 pases diferentes durante 1996.
PAIS CARGO POR MINUTO (DOLARES) MINUTOS (MIL MILLONES) PAIS CARGO POR MINUTO (DOLARES) MINUTOS (MIL MILLONES)

Canad Mxico Gran Bretaa Alemania Japn Repblica Dominicana Francia Corea del Sur Hong Kong Filipinas

0.34 0.85 0.73 0.88 1.00 0.84 0.81 1.09 0.90 1.29

3.049 2.012 1.025 0.622 0.576 0.410 0.364 0.319 0.317 0.297

India Brasil Italia Taiwn Colombia China Israel Australia Jamaica Pases bajos

1.38 0.96 1.00 0.97 1.00 1.47 1.16 1.01 1.03 0.78

0.287 0.284 0.279 0.273 0.257 0.232 0.214 0.201 0.188 0.167

Calcule el coeficiente de correlacin r. Para 0.05 de nivel de significancia, existe una relacin entre X y Y? Explique. Se puede esperar que cuanto mas alto sea el cargo por minuto, menor ser el nmero de minutos que se usen. refleja esta relacin esperada el coeficiente de correlacin? Explique.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

A) Calcule el coeficiente de correlacin r.


(X) PAIS Canad Mxico Gran Bretaa Alemania Japn Repblica Dominicana Francia Corea del Sur Hong Kong Filipinas India Brasil Italia Taiwn Colombia China Israel Australia Jamaica Pases bajos SUMA MEDIA
CARGOS POR MINUTO (DOLARES)

(Y)
MINUTOS (MIL MILLONES)

0.34 0.85 0.73 0.88 1 0.84 0.81 1.09 0.9 1.29 1.38 0.96 1 0.97 1 1.47 1.16 1.01 1.03 0.78 19.49 0.928095238

3.049 2.012 1.025 0.622 0.576 0.41 0.364 0.319 0.317 0.297 0.287 0.284 0.279 0.273 0.257 0.232 0.214 0.201 0.188 0.167 11.373 0.541571429

X2 0.1156 0.7225 0.5329 0.7744 1 0.7056 0.6561 1.1881 0.81 1.6641 1.9044 0.9216 1 0.9409 1 2.1609 1.3456 1.0201 1.0609 0.6084 20.1321

X*Y 1.03666 1.7102 0.74825 0.54736 0.576 0.3444 0.29484 0.34771 0.2853 0.38313 0.39606 0.27264 0.279 0.26481 0.257 0.34104 0.24824 0.20301 0.19364 0.13026 8.85955

Y2 9.296401 4.048144 1.050625 0.386884 0.331776 0.1681 0.132496 0.101761 0.100489 0.088209 0.082369 0.080656 0.077841 0.074529 0.066049 0.053824 0.045796 0.040401 0.035344 0.027889 16.289583

Y (ESTIMADA) -2.509362 -2.478405 -2.485689 -2.476584 -2.4693 -2.479012 -2.480833 -2.463837 -2.47537 -2.451697 -2.446234 -2.471728 -2.4693 -2.471121 -2.4693 -2.440771 -2.459588 -2.468693 -2.467479 -2.482654

n n x2

XY x
2

X * n

Y y2 y
2

21

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

= -0.664830

B) Para 0.05 de nivel de significancia, existe una relacin entre X y Y? Explique. Planteamiento De la hiptesis

Establecimiento de los valores crticos de t = 0.05 n= 20 )= t(18, 0.025)= 2.101 (de tablas)

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Calculo de t. =

= = = 144.6175

= 0.01348384257

Como t calculada (144.6175) cae en la zona de rechazo, rechazo y acepto como cierta, es decir si hay una relacin significativa entre variables (x y y) a un nivel de significancia del 0.05 y el valor p del anlisis de varianza en minitab 16 es menor que 0.05.

22

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

C) Se puede esperar que cuanto mas alto sea el cargo por minuto, menor ser el nmero de minutos que se usen. Refleja esta relacin esperada el coeficiente de correlacin? Explique.

= -0.664830

El -0.664830 es un valor prximo a -1 por lo que se considera un grado de asociacin entre variables. La correlacin es negativa, y el coeficiente de correlacin se presta para la prueba estadstica. Aunque el 44.2% de la varianza (coeficiente de determinacin) del numero de minutos usados queda explicada por el cargo por minuto. El 55.8% restante se debe a causas no estadsticas o desconocidas.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

23

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

3.5 3.0 2.5 2.0

MINUTOS

1.5 1.0 0.5 0.0 -0.5 0.50 0.75 1.00 CARGOS POR MINUTO 1.25 1.50

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

Este problema est relacionado con un estudio acerca de la cantidad de precipitacin pluvial y la cantidad de contaminacin atmosfrica.

Hacer las siguientes estimaciones: (a) Identificar la variable dependiente y la variable independiente. Hacer una grfica que vaya en funcin de la variable dependiente Y, y la variable independiente X. (b) Calcular los valores de la estadstica descriptiva de los datos. (c) Obtener la ecuacin de regresin lineal simple y trazarla en la grfica. (d) Hacer una grfica que muestre la prueba de normalidad. Complementar la evaluacin del modelo con inferencias estadsticas, como: (e) Clculo del coeficiente de determinacin R2 y el coeficiente de correlacin R. (f) Hacer una grafica que muestre los residuales estandarizados versus renglones (g) Hacer una tabla de anlisis de varianza (ANOVA).

24

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

En un estudio de microbiologa ambiental, en muestras de agua, se dieron los siguientes datos de la tabla de abajo. Estos datos se refieren al crecimiento de una colonia de bacterias en un medio de cultivo.

(a) Calcular la lnea de regresin. Que significa tiene aplicacin prctica. Que significa Calcule el error estndar del estimador . (b) Calcular e interpretar el coeficiente de determinacin R2 y el coeficiente de correlacin R. (c) Con la ecuacin de regresin, estimar el nmero de bacterias despus de 20 das Realice una prueba de hiptesis Ho: R=0, utilizando un nivel de significancia del 1%.

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

En un estudio de ingeniera del agua relacionado con las reducciones de los slidos suspendidos, en funcin de la demanda qumica de oxgeno (DQO), se sac una muestra aleatoria, cuyos datos se dan en la tabla de abajo. Para lo siguiente: (a) Identificar la variable dependiente y la independiente y hacer una grfica de DQO versus reduccin de slidos.

(b) Calcular la ecuacin de la lnea de regresin. (c) Hacer una tabla de anlisis de varianza que incluya el valor de p. (d) Validar el modelo candidato, a travs de estadsticas como R2,

25

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

26

26/08/2013

I n s t i t u t o Te c n o l g i c o d e C i u d a d V a l l e s Departamento de Ingenieras

27

Vous aimerez peut-être aussi