Académique Documents
Professionnel Documents
Culture Documents
INGENIERIA INDUSTRIAL
MATERIA: Estadstica Inferencial ll PROFESOR: Diana Valles Rivera ALUMNA: Mnica del Sagrario Hernndez Lpez HORARIO: 7:00 8:00
INDICE
Unidad 4: Conceptos bsicos en Diseos Factoriales 4.1. Diseos factoriales con dos factores 3 4.2. Diseos factoriales con tres factores.5 4.3. Diseo factorial general7 4.4. Modelos de efectos aleatorios8 4.5. Uso de un software estadstico.10
UNIDAD 4: Conceptos Bsicos en Diseos Factoriales. 4.1. Diseos factoriales con dos factores.
Los resultados del ANOVA para dos factores pueden ser extendidos a un caso general en donde: a son los niveles del factor A, b son los niveles del factor B, c son los factores del nivel C, y as sucesivamente, los cuales pueden ser arreglados en un experimento factorial, en el cual el nmero de rplicas es n. Est diseada para generar procesos de calidad. TAGUCHI desarroll una aproximacin al diseo de experimentos con el objetivo de reducir los costos emanados de la experimentacin, esta aproximacin es ms prctica que terica y se interesa ms por la productividad y los costos de produccin que en las reglas estadsticas. Los conceptos de estas tcnicas estn basados en las relaciones de costos y ahorros. Disear un sistema de manufactura para elaborar un producto requiere de conocimientos tcnicos adems de una gran experiencia en el rea a la cual pertenece el producto. Los diseos factoriales son ampliamente utilizados en experimentos en los que ntervienen varios factores para estudiar el efecto conjunto de estos sobre una respuesta. Existen varios casos especiales del diseo factorial general que resultan importantes porque se usan ampliamente en el trabajo de investigacin, y porque constituyen la base para otros diseos de gran valor prctico. En los ltimos aos se ha observado un creciente inters por algunas de las ideas del profesor Genechi Taguchi acerca del diseo experimental y su aplicacin al mejoramiento de la calidad. El diseo factorial fraccionario 2 k-p se usa en experimentos de escrutinio para identificar con rapidez y de manera eficiente el subconjunto de factores que son activos, y para obtener alguna informacin sobre la interaccin. La propiedad de proyeccin de estos diseos hace posible en muchos casos examinar los factores activos con ms detalle. La combinacin secuencial de estos diseos a travs del plegamiento es una forma muy eficaz de obtener informacin extra acerca de las interacciones, la cual puede identificarse en un experimento inicial como potencialmente importante. Ejemplo: En la tabla adjunta se presentan los tiempos, en minutos, de conexin con una direccin de internet desde cuatro puntos geogrficos de una regin y en tres horas determinadas. El experimento se repeta cuatro veces y era diseado para estudiar la influencia del factor hora de conexin y el factor lugar de la conexin en la variable de inters tiempo de conexin.
Analizar estos datos y estudiar la influencia de los dos factores. Lugar A Hora 1 Hora 2 Hora 3 0'31 0'45 0'46 0'43 0'36 0'29 0'40 0'23 0'22 0'21 0'18 0'23 Lugar B 0'82 1'10 0'88 0'72 0'92 0'61 0'49 1'24 0'30 0'37 0'38 0'29 Lugar C 0'43 0'45 0'63 0'76 0'44 0'35 0'31 0'40 0'23 0'25 0'24 0'22 Lugar D 0'45 0'71 0'66 0'62 0'56 1'02 0'71 0'38 0'30 0'36 0'31 0'33
Solucin. Estimacin de los parmetros. Se obtienen las siguientes tablas de medias y estimaciones L-A H-1 H-2 H-3
. . .j 1j 2j 3j . . .
L-D 0 610 0 667 0'325 0'534 0'055 L-D -0'063 0'068 -0'006
' ' ' '
..
'
'
= 0'479
ij
-0'083 0'045
-0'139
De donde se deduce la siguiente tabla de residuos: Residuos Hora 1 Lugar A 0'103 0'047 0'04 0 0'08 0 0'010 0'030 0'03 7 0'01 7 0'030 0'090 0'00 0 0'02 0 Lugar B 0'060 0'000 0'105 0'325 0'035 0'045 0'220 0'160 0'205 0'425 0'035 0'045 Lugar C 0'138 0'062 0'065 0'065 0'005 0'005 0'118 0'192 0'025 0'025 0'015 0'015
4
Hora 2
0'107 0'043
0'353 0'287
Hora 3
Tabla ANOVA Utilizando las estimaciones y residuos obtenidos se obtiene la siguiente tabla ANOVA Tabla ANOVA Fuentes de variacin Factor hora Factor lugar Interaccin Variab. Exp. Total Residual Global Suma de cuadrados 1'0330 0'9212 0'2501 2'2043 0'8007 3'0050 Grados de libertad 2 3 6 11 36 47 0.0222 0'0639
R
= 0'149 0'253
Y=
De esta tabla se deducen los siguientes contrastes: 1.- El contraste de la hiptesis: no existe interaccin entre los factores T y T . Se realiza por el estadstico Es razonable aceptar la hiptesis de no influencia de la interaccin entre lugar y hora. 2.- El contraste de la hiptesis: el factor hora no influye. Se realiza por el estadstico Se rechaza esta hiptesis de no influencia del factor hora. 3.- El contraste de la hiptesis: el factor lugar no influye. Se rechaza esta hiptesis de no influencia del factor lugar.
superior. Estos niveles se representan mediante los dgitos 0 (nivel inferior), 1 (intermedio) y 2 (superior). Cada combinacin de tratamientos de un diseo 3k se presenta mediante k dgitos, donde el primero incida el nivel de A, el segundo seale al nivel de B,..... Y el k-simo dgito, el nivel del factor k.
Ejemplo: Es un diseo 32 el 00 representa la combinacin de tratamientos, en la que tanto el factor A como el B estn en el nivel inferior, y el 01 representa la combinacin de tratamientos que corresponde al factor A en el nivel inferior y a B en el nivel intermedio. En ste, el sistema de notacin que se prefiere usar es el de + - en virtud de que facilita la interpretacin geomtrica del diseo y de que es directamente aplicable al modelado por regresin, la formacin de bloques y la construccin de factoriales fraccionarios. La adicin de un tercer nivel permite modelar con una relacin cuadrtica la relacin entre la respuesta y cada factor. DISEO 32 El diseo ms simple es el 32 que consta de dos factores con tres niveles cada uno. Como hay 32 = 9 combinaciones de tratamientos, existen 8 grados de libertad entre ellas, Los efectos principales A y B tienen dos grados de libertad cada uno, y la interaccin AB tiene cuatro grados de libertad. Si hay n rplicas habr un total de n32 - 1 grado de libertad, correspondiendo para el error 32 (n-1) grados de libertad. DISEO 33 Si se supone que se estn estudiando tres factores (A, B, C) y que cada factor tiene tres niveles acomodados en un experimento factorial. Este es un diseo 33. Las 27 combinaciones tienen 26 grados de libertad.
Alto 2 20 21 22
donde m es la media global, eij son variables (una para cada muestra) distribuidas normalmente, con media 0 y varianza s2 (como en el modelo I) y Ai es una variable distribuida normalmente, independiente de las eij, con media 0 y varianza La diferencia con respecto al modelo I es que en lugar de los efectos fijos ai ahora se consideran efectos aleatorios Ai. Igual que en el modelo I se encuentra que MSE no se modifica en la H1 y que al valor esperado de MSA se le aade el trmino de componente aadida (que aqu es una verdadera varianza ya que Ai es una variable aleatoria):
Para llegar a este resultado se utiliza la asuncin de independencia entreAi y eij y es, por tanto, muy importante en el modelo y conviene verificar si es correcta en cada caso. En el ejemplo de las cobayas significara que las variaciones de grasa en el hgado de cada cobaya son independientes de las variaciones entre cobayas. Esta asuncin se violara si, por ejemplo, en el animalario existieran 2 cepas genticas tales que en una de ellas la concentracin de grasa en las clulas hepticas fuera mayor y ms variable que en la otra. Por tanto, en H0 tanto MSA como MSE estiman s2, mientras que en H1,MSE sigue estimando s2 y MSA estima . La existencia de esta componente aadida se contrasta con F= MSA/MSE y en caso afirmativo, la varianza de Ai se estima como:
Ejemplo: Una marca de coches est interesada en controlar la variabilidad en el consumo de los coches que fabrica de un determinado modelo y para ello somete a un nmero de coches a una prueba que consiste en que los coches hagan un recorrido predeterminado y se calcule el consumo realizado. Las causas ms probables de esta variabilidad son dos: los coches utilizados (no todos tienen el mismo consumo) y los conductores que hacen la prueba.
8
Pueden considerarse dos situaciones: 1.- Los conductores que participan en el experimento son personal de la empresa acostumbrado a realizar este tipo de pruebas y se cree que su influencia es casi nula, de modo que casi con total seguridad el problema radica en las unidades de coche fabricadas que se estn provando. El factor tratamiento es los coches y los niveles son todos los coches fabricados y que se podran fabricar en el futuro. Tericamente esta poblacin de niveles es infinita y se puede suponer que los coches elegidos entre los ltimos fabricados son una muestra aleatoria de todas los fabricados. El efecto del coche sobre el consumo es un efecto aleatorio y se modela mediante una variable aleatoria. 2.- Se sabe que hay muy pocas diferencias entre los coches fabricados o estn son mnimas, y se supone que su influencia en el consumo es prcticamente nula. Por otra parte, la fbrica de coches ha querido hacer una prueba de consumo de carcter realista y ha elegido como conductores para hacer la prueba a personas de la ciudad donde est ubicada con la nica condicin de que tengan el carnet de conducir. Por tanto cabe esperar que el origen de la variabilidad debe encontrarse en los conductores. La ciudad es relativamente grande y el nmero de conductores es elevado, por este motivo los operarios seleccionados para hacer la prueba son una pequea muestra de todos los conductores de la ciudad. Asumido que el grupo seleccionado es representativo de la poblacin, ste puede considerarse una muestra aleatoria de la poblacin total de conductores. De nuevo el factor conductor es un factor de efectos aleatorios y se debe utilizar un diseo de una va completamente aleatorizado. En su planificacin, habr que seleccionar al azar una muestra de tamao I de la poblacin de niveles del factor tratamiento aleatorio y, a continuacin, asignar al azar las unidades experimentales a los I niveles seleccionados. Aqu, para conseguir una potencia especfica en las pruebas de hiptesis, hay que determinar con antelacin el valor apropiado de I, adems del tamao muestral de cada nivel.
Excel o Calc Javascript Applet de Java, Geogebra Proyecto Descartes Software Libre
Excel/Calc La hoja de clculo Excel o Calc (OpenOffice) es un software considerado como estndar en todos los entornos(educativo, profesional, familiar, etc), que posee la virtud de presentar una interfaz agradable, una facilidad de uso digna de elogio y permite realizar anlisis estadsticos simples o ms complejos y avanzados. Javascript JavaScript, es un lenguaje de programacin de pginas web de lado del cliente, nos permite aadir a las pginas web efectos y funciones adicionales a los contemplados en el estndar HTML. Gracias a que se ejecuta en el navegador (localmente), JavaScript, nos permite responder de manera rpida y eficaz a las acciones del usuario, creando de esta manera aplicaciones interactivas. Applet de Java El lenguaje Java se puede usar para crear los applets de Java. Un applet es un elemento ms de una pgina web, como una imagen o una porcin de texto. Cuando el navegador carga la pgina web, el applet insertado en dicha pgina se carga y se ejecuta.
10
Proyecto Descartes Descartes (M.E.C.) es un programa realizado en lenguaje applet de java que se caracterizan porque crean "escenas" que se pueden insertar en las pginas web. Descartes no slo convierte una web en una web interactiva sino que, adems, es configurable, es decir, que los usuarios (profesores) pueden "programarlo" para que aparezcan diferentes elementos y distintos tipos de interaccin. Software Libre "Software Libre" es un asunto de libertad, no de precio.`Software Libre'' se refiere a la libertad de los usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y mejorar el software.
11
UNIDAD 5: Series De Tiempo 5.1 Modelo clsico de series de tiempo Una serie de tiempo es un conjunto de valores observados, como datos de produccin o ventas, durante una serie de periodos temporales secuenciales ordenada. Ejemplo de estos datos son las ventas de un producto en particular durante una serie de meses y el nmero de trabajadores empleados en una industria en particular durante una serie de anos. Una serie de tiempo se representa grficamente por medio de una grafica de lneas, sobre cuyo eje horizontal se representan los periodos y en cuyo eje vertical de representan los valores de la serie de tiempo. El anlisis de series de tiempo es el procedimiento por el cual se identifican y aslan los factores relacionados con el tiempo que influyen en los valores observados en las series de tiempo. Una vez identificados, estos factores pueden contribuir a la interpretacin de valores histricos de series de tiempo y a pronosticar valores futuros de series de tiempo. El mtodo clsico para el anlisis de serie de tiempo identifica cuatro de estas influencias o componentes. Tendencia (T): el movimiento general a largo plazo de los de la serie de tiempo (Y) sobre un extenso periodo de anos. Fluctuaciones cclicas : movimientos ascendentes y descendentes recurrentes respecto de la tendencia con una duracin de varios anos. Variaciones estacinales (E): movimientos ascendentes y descendentes respecto de la tendencia que se consuman en el trmino de un ano y se repiten anualmente. Estas variaciones suelen identificarse con base en datos mensuales o trimestrales. Variaciones irregulares (I): las variaciones errticas respecto de la tendencia que no pueden atribuirse a las influencias cclicas o estacinales. Este modelo en que se apoya el anlisis clsico de serie de tiempo se basa en el supuesto de que, el valor de la variable esta determinado por los cuatro componentes tiene una relacin multiplicativa. As donde representa el valor de serie de tiempo observado.
Y= T X C X E X I + 12
Un modelo clsico para una serie de tiempo, supone que una serie x(1), ..., x(n) puede ser expresada como suma o producto de tres componentes: tendencia, estacionalidad y un trmino de error aleatorio. Existen tres modelos de series de tiempos, que generalmente se aceptan como buenas aproximaciones a las verdaderas relaciones, entre los componentes de los datos observados. Estos son: 1. Aditivo: X(t) = T(t) + E(t) + A(t) 2. Multiplicativo: X(t) = T(t) E(t) A(t) 3. Mixto: X(t) = T(t) E(t) + A(t) Donde: X(t) serie observada en instante t T(t) componente de tendencia E(t) componente estacional A(t) componente aleatoria (accidental)
Una suposicin usual es que A(t) sea una componente aleatoria o ruido blanco con media cero y varianza constante. Un modelo aditivo (1), es adecuado, por ejemplo, cuando E(t) no depende de otras componentes, como T(t), s por el contrario la estacionalidad vara con la tendencia, el modelo ms adecuado es un modelo multiplicativo (2). Es claro que el modelo 2 puede ser transformado en aditivo, tomando logaritmos. El problema que se presenta, es modelar adecuadamente las componentes de la serie. La figura 2.1 ilustra posibles patrones que podran seguir series representadas por los modelos (1), (2) y (3).
Figura 2.1 ESTIMACIN DE LA TENDENCIA Supondremos aqu que la componente estacional E(t) no est presente y que el modelo aditivo es adecuado, esto es: X(t) = T(t) + A(t), donde A(t) es ruido blanco.
13
Hay varios mtodos para estimar T(t). Los ms utilizados consisten en: 1) Ajustar una funcin del tiempo, como un polinomio, una exponencial u otra funcin suave de t. 2) Suavizar (o filtrar) los valores de la serie. 3) Utilizar diferencias.
Factores fsicos son la temperatura del suelo, la presin del agua y la humedad atmosfrica Factores qumicos son la concentracin de nitrgeno en el suelo, de oxgeno en el agua y de dixido de carbono en la atmsfera.
14
1. Es una fluctuacin peridica de la serie temporal, de periodo fijo no superior al ao, debida a la influencia de fenmenos sociolgicos y econmicos ntimamente correlacionados con las variaciones de las variables causales que evolucionan a lo largo del ao. 2. Generalmente, la variacin estacional se determina en forma de nmeros ndices que ponen de manifiesto el porcentaje (sobre la media anual o el total anual) de aumento o disminucin de las ventas, debido al hecho de estar en una determinada poca o sub-periodo interanual. 3. El periodo interanual puede coincidir con un trimestre, una estacin climtica, un mes, un bimestre, un trimestre, una semana, una quincena o cualquiera otra combinacin posible, siempre y cuando el marco de referencia divisorio sea uniforme en su tamao temporal e inferior al ao. 4. Los mtodos para el clculo de estos ndices dependen de la relacin existente entre las componentes temporales de la serie, aditiva o multiplicativa, que se considere para analizar la serie. Descomposicin de la serie
5. En el anlisis esttico de las series temporales o cronolgicas se considera que los valores de las ventas son consecuencia de la interaccin de cuatro componentes: Tendencia secular (TS), Variacin estacional (VE), Influencia cclica (IC) y Aleatoriedad (CA). 6. Mientras la Tendencia secular puede considerarse como la medicin del cambio promedio de la serie por ao, la Influencia cclica refleja el efecto de las expansiones y contracciones econmicas sobre las ventas a largo plazo, y la componente aleatoria constituye la expresin de las fluctuaciones causadas por factores indeterminados. Relacin multiplicativa 7. Considera que los valores de las ventas son consecuencia del producto de las componentes: V = f (t) = TS x VE x IC x CA 8. Si suponemos que estamos analizamos en el corto plazo (periodo interanual) el efecto de la Influencia cclica es nulo, ello quiere decir que IC = 1, por lo que podremos expresar que: V / TS = VE x CA 9. Y en consecuencia, calculando sus esperanzas matemticas, concluir que:
16
E [ VE ] = E [ V/TS ] 10. Para la elaboracin de un mtodo de clculo, deberemos suponer que partimos del conocimiento de una serie temporal de ventas en la que las observaciones ( Vij ) nos vienen dadas desagregadas, no solo por el numero de aos observados ( n ), si no por el numero de periodos que se obtiene de multiplicar los aos observados por el numero de subperiodos ( h ) que se han considerado (y observados) como referencia temporal inferior al ao ( donde 1<i<n+1 ; 1<j<h+1 ) . Variacin irregular El componente aleatorio mide la variabilidad de las series de tiempo despus de que se retiran los otros componentes. Contabiliza la variabilidad aleatoria en una serie de tiempo ocasionada por factores imprevistos y no ocurrentes. La mayora de los componentes irregulares se conforman de variabilidad aleatoria. Sin embargo ciertos sucesos a veces impredecibles como huelgas, cambios de clima (sequas, inundaciones o terremotos), elecciones, conflictos armados o la aprobacin de asuntos legislativos, pueden causar irregularidad en una variable.
Verano 10.8 1.141 Otoo 15.0 1.1519 2000 Invierno 7.1 0.765 9.28 Primavera 5.7 Verano 11.1 1.141 Otoo 14.5 1.1519 2001 Invierno 8.0 0.765 10.46 Primavera 6.2 Verano 11.4 1.141 Otoo 14.9 1.519
10.79
A fin de eliminar el efecto de la variacin estacional, la cantidad estacional, la cantidad de ventas para cada trimestre (que contiene efectos de tendencia, cclicos, irregulares y estacinales) se divide entre el ndice estacional de ese trimestre; esto es, TSCI/S. Ejemplo Las ventas reales para el primer trimestre de 1996 fueron 6.7 millones de dlares, el ndice estacional par el trimestre de invierno es 76.5 el ndice 76.5 indica que las ventas en el primer trimestre normalmente se encuentran 23.5% abajo del promedio de un trimestre normal. Dividiendo las ventas reales $6.7 millones entre 76.5 y multiplicando el resultado por 100 se encuentra el valor de las ventas desestacionalizadas del primer trimestre de 1996. El valor es $8758170 que se obtuvo de ($6700000/76.5)100. Este proceso se repite con los dems trimestres en la columna 3 de la tabla 19.10 y los resultados se dan en millones de dlares. Puesto que la componente estacionalizadas contiene solo las componentes de tendencia (T), ciclo e irregular (I). Al revisar las ventas desestacionalizadas. Es claro que la eliminacin del factor estacional permite considerar la tendencia general a largo plazo de las ventas. Tambin se podr determinar la ecuacin de regresin de los datos de tendencia y usarla para pronosticar ventas futuras.
18
Una consideracin particularmente importante en los pronsticos a largo plazo, es el componente cclico de las series de tiempo. METODOS PARA PRONOSTICOS A CORTO PLAZO:
1. Emplear el valor de tendencia proyectado como base del pronstico. 2. Ajustarlo respecto del componente estacional.
1. Desestacionalizar el valor observado ms reciente y 2. Multiplicarlo por el ndice estacional del periodo de pronstico. (la diferencia entre los dos periodos ser la atribuible a la influencia estacional).
19