Vous êtes sur la page 1sur 99

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

2. I NTRODUCCIN
En un mundo orientado a la globalizacin, se presentan - segundo a segundo millones de datos que desean ser interpretados. La estadstica es una ciencia que nos permite pensar en forma clara y disciplinada, y ofrece diversas tcnicas, cuya correcta aplicacin, reduce la complejidad presente en los datos, para que estos puedan ser interpretados. El presente apunte est orientado a un conjunto de tcnicas de anlisis

estadstico. En su primer mdulo est destinado a reconocer las races mismas del dato, caractersticas de ste, cmo y cuntos datos obtener para poder obtener conclusiones cientficamente vlidas. En el segundo y tercer mdulo, se enfatiza el anlisis exploratorio de datos como un primer paso en todo resumen de datos, utilizando para ello la disponibilidad de ordenadores, software estadstico con posibilidades de representacin grfica y tratamiento conjunto de datos multivariados. Las posibilidades didcticas del anlisis exploratorio de datos se deben principalmente: sencillez del aparato matemtico requerido, importancia dada hoy da en estadstica a los sistemas de representacin mltiple, las conexiones de carcter transversal en todas las reas del quehacer humano, el trabajo en equipo y la posibilidad de desarrollo de proyectos por parte de los profesionales que requieren de informacin para sus proyecciones futuras. A partir del tercer mdulo, con la experiencia y visin obtenida en los mdulos anteriores, se comienza a presentar medidas de probabilidad, para luego mostrar modelos que habitualmente se utilizan en ingeniera y los elementos esenciales de inferencia estadstica.

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

3. PRIMER MDULO
3.1 Proceso de Medicin En todo mbito de la vida del hombre, constantemente los medios de comunicacin invaden las percepciones de la gente con todo tipo de indicadores, tales como: cantidad de libros que en promedio leen alumnos de enseanza media, porcentaje de mujeres que sufren de maltrato psicolgico, variaciones de precios (IPC), ndices de delincuencia o seguridad ciudadana, niveles de aceptacin respecto a la gestin realizado por funcionarios pblicos, etc. En la empresa, estos indicadores han surgido como un eficaz medio para evaluar y controlar su desempeo, en fenmenos que a juicio de los ejecutivos son de inters para la viabilidad de sta, es as como, en empresas productivas el porcentaje de bienes defectuosos son un indicador importante, mientras que en empresas de servicio, el nmero promedio de reclamos, son un indicador del buen o mal servicio que se est prestando. Todos estos indicadores que irrumpen en la vida, son producto de mediciones realizadas con algn instrumento. Sin embargo, el concepto mismo medicin ha sido apartado de los indicadores, dando por hecho que stos son un reflejo puro de la realidad, en el instante donde se produce la medicin, lo cual puede considerarse como un ideal, pero no necesariamente real.. No se puede administrar lo que no se mide, las mediciones son la clave. Si no se puede medir, no se puede controlar. si no se puede controlar, no puede gestionar. Si no puede gestionar, no es posible mejorarlo. La falta sistemtica o ausencia estructural de estadsticas en cualquier organizacin impide una adecuada administracin de las mismas. Es lamentable que la coleccin de datos en las reas de mantenimiento sea dbil en muchas empresas, esto no permite contar con informacin adecuada para la toma de decisiones y genera en los profesionales del rea la sensacin que no se requiere y que para ser un buen mantenedor basta solo con ser asertivo. Dirigir slo en base a una revisin parcial de los datos, tomar decisiones basadas ms en la intuicin o en simples extrapolaciones, y tomar decisiones desconociendo las probabilidades de xito u ocurrencia, son slo algunos de los problemas o inconvenientes ms comunes hallados actualmente en cualquier empresa y ms aun en el mbito del mantenimiento. Es por esta razn, que en general, se debe tener claro la seleccin y diseo de la tcnica de medicin, para estar seguro de que estas mediciones sean eficientes para cumplir con el objetivo de aclarar el suceso, hecho u objeto bajo estudio , con limitaciones propias de la relacin propuesta entre el mundo emprico y el mundo abstracto.

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

La medicin es la asignacin de smbolos (nmeros) a sucesos, hechos u objetos del mundo emprico, sobre la base de reglas y procedimientos. Caractersticas de las Mediciones Nuestro sistema numrico est compuesto por los dgitos : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; que tienen bsicamente cuatro propiedades esenciales que permiten definir las siguientes escalas de medicin. Tipos de Escala Escala Nominal.- Es aquella en que los nmeros sirven solamente como etiqueta para catalogar o identificar los objetos o sucesos. Ejemplos: Regiones, Comunas, Marcas, Tipos de almacenes, sexo, etc. En clasificaciones nominales no se puede establecer prioridad alguna de las categoras asignadas. Una proporcin importante de variables de mercadeo requiere una medicin en escala nominal, en situaciones tales como medir: marcas, tipos de almacenes, tipos de clientes, etc. Escala Ordinal.- Adems de lo anterior, define una relacin ordenada entre los sucesos y/o objetos que comprenden la caracterstica de orden. En este tipo de escala, se mide si hay ms o menos de la caracterstica, en relacin con los otros objetos. Ejemplo: Aptitudes, preferencias, etc. Grupo Social; 1 Bajo, 2 Medio, 3 Alto. No se puede decir que 2 es el doble de 1, slo que 2 tiene ms que 1.

En este nivel tienen sentido los conceptos del conteo de elementos, de tal forma que, ordenados puedan ir acumulando, lo que da origen a medidas de posicin basadas en los llamados "cuantiles" o clase cuantil. A modo de ejemplo, un quintil divide la poblacin en cinco segmentos, de tal forma que bajo un quintil especifico se encuentra un porcentaje conocido de datos observados.. Escala Intervalar.- Adems de todo lo anterior, comprende la utilizacin de los nmeros para clasificar objetos o sucesos de manera que la distancia entre los nmeros corresponde a la distancia entre los objetos o sucesos en relacin con la caracterstica que se est midiendo. Ejemplo: - Escala de temperatura (C, F); 0 C punto de congelacin del agua - Nmeros ndices; IPC, IPM, PIB, etc.

32 F.

Las mediciones en esta escala, poseen todas las propiedades de la escala ordinal, adems de la caracterstica de igual diferencia propia del sistema numrico.

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Escala de Razn.- Tiene todas las propiedades de la escala de intervalos, adems del cero absoluto. En esta escala slo se puede asignar arbitrariamente la unidad de medicin o distancia, pues una vez determinado este nmero, se establecen completamente las asignaciones numricas restantes. Ejemplo: - Ventas pesos, dlares, etc. - Estatura unidad - Peso unidad Adems de la clasificacin de las mediciones segn escala, que es una caracterstica propia del dato, ste tambin puede ser clasificado como un dato cualitativo cuantitativo. Los datos cualitativos, se asocian siempre a datos cuya medicin sea en escala nominal u ordinal, mientras que los datos cuantitativos, se relacionan siempre a datos cuya medicin sea en escala intervalar o de razn, ya sean discretos o continuos.

Diagrama de escalas de medida

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

3.2

Estadstica y Ciencia

De la gran variedad de procedimientos cientficos, vinculados a distintas tcnicas de metodologa de investigacin se pueden destacar puntos esenciales en comn, que son: 1. Revisin de los hechos y teoras propuestas. 2. Formulacin de hiptesis sujetas a pruebas. 3. Evaluacin objetiva de las hiptesis y conclusiones. Las respuestas a interrogantes relacionadas con el problema a investigar, por lo general, se hacen mediante una descripcin de; las relaciones, los hechos, los procesos relacionados del problema. La Estadstica, se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

3.3

Introduccin al Muestreo

Los mtodos o tcnicas de muestreo son un pilar fundamental dentro de los mtodos estadsticos, ya que dependiendo del tipo problema, el escoger una adecuada tcnica de muestreo es resolver parte importante del problema. Las tcnicas de muestreo se preocupan de la seleccin de muestras de una poblacin bajo estudio y de las estimaciones de las caractersticas poblacionales de inters en la forma ms confiable y al ms bajo costo posible. La forma como se escogen las unidades muestrales permiten clasificar los mtodos de muestreo en: Muestras cientficas probabilstica y Muestras no probabilsticas. Muestreo no Probabilstico: Es el tpico muestreo que se realiza a la salida de un centro comercial, salida o ingreso del metro, en una esquina de una calle, etc., en donde los resultados obtenidos slo representan el pensamiento de los encuestados, pero no necesariamente el de la poblacin en estudio.

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Muestreo Probabilstico: La aleatorizacin es vital, pues, las inferencias que se realicen abarcarn al comportamiento de la poblacin total. Es por ello, que una mala aleatorizacin o el no cumplimiento de lo establecido por la aleatorizacin, puede llevar a obtener conclusiones errneas, al considerarse estas muestras como sesgadas. En este muestreo cada uno de los elementos de la poblacin de inters, o poblacin objeto, tiene una probabilidad conocida, y frecuentemente igual, de ser elegido en la muestra.

Encuesta Opinin Pblica

Est el comercio regional deprimido?

1. Salida Mall 2. Calle

Figura 2.4

Las encuesta de opinin pblica son por lo general aleatorias

En el muestreo probabilstico se utilizan bsicamente cinco tcnicas de muestreo: 1. Muestreo Aleatorio Simple (m.a.s.). 2. Muestreo Aleatorio Sistemtico (m.a.st.). 3. Muestreo Aleatorio Estratificado (m.a.e.). 4. Muestreo Aleatorio por Conglomerado (m.a.c.). 5. Muestreo Aleatorio Multietpico o con Sub-Muestreo (m.a.pe). La eleccin de una tcnica de muestreo, se basa en el grado de conocimiento que se tenga del comportamiento de la caracterstica de inters dentro de la poblacin objetivo, el grado de precisin que se desea obtener en los estimadores utilizados, costos asociados a su aplicacin, etc.,.

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

3.3.1 Tipos de Muestreos Muestreo aleatorio simple, tambin llamado muestreo al azar irrestricto, los elementos se escogen al azar de la totalidad de la poblacin, es decir, se escogen sin ningn privilegio y cada uno posee la misma probabilidad de formar parte de la muestra en cada una de las posibles muestras. A modo de ejemplo: Es recomendado cuando la caracterstica de inters se encuentra distribuida de forma homognea dentro de los elementos de la poblacin, como se muestra en la Figura 2.5.

Figura 2.5

Representacin esquemtica del muestreo aleatorio simple.

La seleccin al azar es similar a la que se realiza en la extraccin aleatoria de nmeros en una lotera. Sin embargo, en el muestreo estadstico, por lo general se utiliza un programa computarizado de nmeros aleatorios o un generador de nmeros aleatorios para identificar los elementos numerados de la poblacin que se eligen para la muestra. Muestreo aleatorio sistemtico, es un plan de muestreo al azar, en la cual se eligen los elementos de la poblacin a intervalos uniformes, a partir de un listado, tal como elegir cada k-simo elemento despus de un arranque aleatorio. Eesquemticamente se puede visualizar como; de una poblacin de N elementos, se desea obtener una muestra de n elementos, entonces la cantidad de intervalos o grupos k, en que se divide la poblacin, est dada por k = N / n. Luego del primer grupo de k elementos se escoge un elemento al azar, mientras que los n 1 elementos faltantes en la muestras, se escogen a intervalos regulares de k elementos, despus del primer escogido, como se muestra en la Figura 2.6.

1 . r . k 1 k 1

1 . r . k k+1 2k 2

1 . r . k 1 . r . k (g 1)k + 1 (n 1)k + 1 (g 1)k + k nk = N g n

Figura 2.6:

Esquematizacin Muestreo Aleatorio Sistemtico

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Las principales razones por la que utiliza el muestreo sistemtico, es: su sencilla aplicacin y supervisin., a prueba de errores y flexible Este plan de muestreo presenta falencias, que aunque son superables, presentan molestias en su aplicacin, como por ejemplo, que el tamao de poblacin N no sea mltiplo de k, que la lista de la poblacin puede tener muchos elementos blancos o extraos, tambin puede presentar errores sistemticos, producto que el azar slo se encuentra en la seleccin de la primera muestra y puede existir un factor peridico o cclico en la lista de la poblacin que pudiera conducir a un error sistemtico en los resultados mustrales,etc. Muestreo aleatorio estratificado, la caracterstica que se est midiendo en la poblacin objetivo, presenta mucha dispersin y se distinguen estratos o grupos en sta, por lo tanto, lo primero que se debe hacer es estratificar los elementos de la poblacin en grupos separados y excluyentes de acuerdo al comportamiento que presenta la caracterstica dentro de estos grupos. Posterior a la estratificacin, se obtiene por separado una muestra aleatoria simple o sistemtica de cada estrato. Por lo general el tamao de la muestra que se requiere para lograr un determinado nivel de precisin en el muestreo estratificado es menor que con muestreo aleatorio simple, con la consiguiente reduccin en los costos del muestreo. En trminos generales, se puede distinguir las siguientes etapas: 1. Dividir los elementos de la poblacin en las subpoblaciones distintas que llamamos estratos. 2. Dentro de cada estrato se selecciona una muestra separada a partir de todas las unidades distintas que componen ese estrato.

Figura 2.7

Representacin esquemtica del muestreo aleatorio estratificado.

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Muestreo aleatorio por conglomerados, es un muestreo aleatorio en el cual la unidad de muestreo, que es la unidad de seleccin, contiene ms de un elemento de la poblacin, por lo tanto la unidad de muestreo es un grupo de elementos tambin llamados conglomerados. En este caso cada elemento de la poblacin debe estar identificado unvocamente con una, y slo una, unidad de muestreo. En la aplicacin de este tipo de muestreo, lo habitual es que los elementos de la poblacin se agrupan en forma natural en subgrupos de tal manera que forman una masa que es difcil descomponer no se puede acceder directamente a ellos. As, se eligen al azar en primer lugar los conglomerados, y luego los elementos dentro de ste. Una manera de esquematizar este plan de muestreo, se muestra en la Figura 2.8, donde se pueden observar que existen conjuntos de elementos, difciles de separar.

Figura 2.8

Representacin esquemtica del muestreo aleatorio por conglomerados.

La seleccin de conglomerados en primer lugar y de elementos dentro de stos conglomerados, requiere de dos etapas de seleccin, aunque puede extenderse rpidamente a ms etapas, es conocido como muestrea aleatorio polietpico, que consiste en una jerarqua de diferentes tipo de unidades; cada unidad de primera etapa se divide, o es potencialmente divisible, en unidades de segunda etapa, etc. Las unidades de muestreo de la primera etapa se llaman unidades de muestreos primarias, mientras que en las etapas siguientes se llaman de segunda Etapa,, tercera Etapa, etc.

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

4. SEGUNDO MDULO
4.1 Resumen de Datos En estadstica descriptiva, a partir de un conjunto de datos, se busca encontrar resumes sencillos, que permitan visualizar las caractersticas esenciales de stos. En el resumen de datos se siguen dos enfoques: el primero, ms orientado al anlisis exploratorio de datos, con un conjunto de tcnicas encaminadas a la visualizacin de los datos mediante tablas o grficos que permitan realizar un diagnstico de ellos; el segundo desarrolla un conjunto de indicadores descriptivos de diversas caractersticas importantes de los datos, cuyo fin es complementar el diagnstico de stos. 4.2 Organizacin de Datos

La organizacin de datos trata de acomodar stos, para que puedan revelar sus caractersticas informativas fundamentales y de esta manera simplificar los anlisis para la obtencin de conclusiones. Una manera de acomodar los datos es construir un arreglo ordenado; esto es, organizando los datos con un orden natural- cuando la escala de medicin lo permite. Si el nmero de datos es grande, el arreglo puede ser difcil de manejar y poco til en cuanto a la informacin que pueda entregar; por eso a menudo se utilizan tablas de frecuencia como una primera aproximacin general a la organizacin de datos. 4.2.1 Tablas de Frecuencia Las respuestas observadas en la poblacin (muestra), se denominaran clases, las cuales se simbolizan por: C1, C2,..., Ck, donde k es la cantidad de categoras (respuestas) distintas. En la construccin de tablas se utilizan las clases junto con dos frecuencias asociadas a stas, estas son: Frecuencia Absoluta: Se llama frecuencia absoluta de la clase Ci, al nmero de elementos en la poblacin (muestra) que pertenecen a la clase Ci. Este nmero lo denotaremos por ni y cumplen la propiedad:

n = n
i i =1

10

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Frecuencia Relativa: Se llama frecuencia relativa de la clase Ci, a la cantidad de elementos en la poblacin (muestra) que pertenecen a la clase Ci, relativo al total de elementos en la poblacin (muestra).Este nmero lo denotaremos por fi y cumplen la propiedad:
n fi = i n

f
i =1

i =1

ni = 1.0 n

En la fabricacin de cremas para manos influyen una serie de APLICACIN 4.1 factores en su calidad, como: densidad de la crema, viscosidad de la crema, etc. Mediante un proceso de batch o lotes, se producen cuatro tipos de cremas, que varan segn su calidad. Los datos representan aquellos tipos de crema que han vuelto a ser procesada por no cumplir el estndar de su respectiva crema en muestreos de su lote. Humectante Humectante Aceite de Em Humectante Econmica Econmica Nocturna Aceite de Em Econmica Econmica Humectante Econmica Nocturna Humectante Humectante Humectante Nocturna Econmica Nocturna Nocturna Aceite de Em Econmica Econmica Humectante Humectante Nocturna Econmica Aceite de Em Econmica Humectante Humectante Humectante

Tabla 4.1 Frecuencias de lotes reprocesados segn el tipo de crema Tipo de Crema Econmica Aceite de Em Humectante Nocturna Frecuencias Absoluta 10 4 12 6 Frecuencias Relativa 31,25% 12,50% 37,50% 18,75%

Estas dos frecuencias asociadas a la organizacin (resumen) de datos son comunes e independientes de la escala de medicin , es lo mnimo que una tabla de frecuencia puede tener, sin embargo, cuando se trabaja con datos en escala al menos ordinal, se pueden agregar otras frecuencias adicionales, a saber: Frecuencia Absoluta Acumulada: Se llama frecuencia absoluta acumulada hasta la clase Ci, al nmero total de elementos en la poblacin (muestra) que pertenecen a las clases C1, C2,..., Ci. Este nmero lo denotaremos por Ni y cumplen la propiedad: Ni = n1 + n2 +... + ni =

n
j =1

j = 1, 2,..., i,

i = 1, 2,..., k

Nk = n1 + n2 +... + ni +... + nk = n

11

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Frecuencia Relativa Acumulada: Se llama frecuencia relativa acumulada hasta la clase Ci, a la cantidad de elementos en la poblacin (muestra) que pertenecen a las clases C1, C2, ... , Ci, con respecto al total de elementos en la poblacin (muestra). Este nmero lo denotaremos por Fi y cumplen la propiedad:

Fi = f1 + f2 +... + fi =

f
j =1

j = 1, 2,..., i,

i = 1, 2,..., k

Fk = f1 + f2 + ... + fi + ... + fk = 1.0


APLICACIN 4.2 En un conjunto de clientes, el inters es determinar la clasificacin de stos segn su cumplimiento en el pago. Estos son clasificados como: Malos (M), Regulares (R), Buenos (B) y excelentes (E). Los datos son:
B R B E M R M B M R B M E B M E R B B B E R B E B E M B B B M R E B B B B B B E E B E B M R B R B R

Tabla 4.2 Clasificacin de clientes por su cumplimiento en el pago.

Clasificacin Malo Regular Buenos Excelentes

Frecuencias Absoluta Relativa 8 16% 9 18% 23 46% 10 20%

Frecuencias Acumuladas Absoluta Relativa 8 16% 17 34% 40 80% 50 100%

Las aplicaciones anteriores estn orientadas a la organizacin de variables cualitativas, en una primera aplicacin en datos nominales, y en un segundo caso, a datos en escala ordinal. Sin embargo, estos mismos conceptos pueden ser aplicados a variables discretas, siempre que en nmero de datos tomando distintos valores no sea excesivamente grande.
APLICACIN 4.3 Suponga que en un conjunto de clientes, el inters es determinar el nmero de veces que stos se han atrasado en el pago de su cuenta. Los datos son los siguientes: 0 0 7 2 0 0 0 0 2 0 3 8 4 2 3 0 4 0 7 0 7 0 1 0 0 0 0 4 1 4 3 0 4 1 0 0 0 1 3 3 0 0 0 2 0 7 0 3 0 3 0 3 0 8 0 0 0 0 1 0

12

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Tabla 4.3 Nmero de veces que clientes se han atrasado en el pago de su cuenta. Nmero de Frecuencias Frecuencias Acumuladas Atrasos Absoluta Relativa Absoluta Relativa 0 32 53,4% 32 53,4% 1 5 8,3% 37 61,7% 2 4 6,7% 41 68,4% 3 8 13,3% 49 81,7% 4 5 8,3% 54 90,0% 5 0 0,0% 54 90,0% 6 0 0,0% 54 90,0% 7 4 6,7% 58 96,7% 8 2 3,3% 60 100,0%

En variables continuas, la organizacin de datos es un poco ms compleja, se dividen los datos en k grupos o segmentos disjuntos, como se muestra Figura 4.1. Estos grupos representan las clases y se determina la frecuencia de datos asociado a cada grupo, conformando una tabla de frecuencia agrupada.

Figura 4.1

Segmentacin en grupos de datos continuos.

En este tipo de datos las clases estn compuestas por intervalos, luego es necesario buscar un representante de la frecuencia asociada a este intervalo, el cual se conoce como marca de clase. Es comn utilizar como marca de clase al valor medio del segmento (intervalo). En la construccin de una tabla de frecuencia, lo primero que se tiene que tener claro es la cantidad de segmentos (intervalos) a considerar. Habitualmente, la regla de Sturges, k = 1 + 3,3 log(n), es utilizada para establecer la cantidad de clases iniciales, las cuales pueden modificarse, si por la estructura de los datos resulta poco informativa, generando tablas de frecuencia de distinta amplitud. Los siguientes lmites se obtienen sumando la amplitud hasta completar las k clases a utilizar. La tabla de frecuencia genrica resultante queda:

13

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Tabla 4.4 Tabla de frecuencia genrica. Frecuencias Frecuencia Acumulada Clases Absoluta Relativa Absoluta Relativa n1 f1 N1 F1 [ LI1 LS1 [ n2 f2 N2 F2 [ LI2 LS2 [ n3 f3 N3 F3 [ LI3 LS3 [ [ LIk LSk ] . . . . .

nk

fk

Nk

Fk

APLICACIN 4.4 Suponga que los datos representan tiempos de espera (en segundos) para la atencin de clientes.

47 34 55 53 55 61 25 42 55 52

43 48 65 45 49 46 66 54 70 57

33 42 36 44 57 53 44 70 34 41

52 57 47 43 57 57 54 41 68 39

Tiempos (Segundos) 70 24 55 48 65 45 48 63 66 51 39 11 56 59 56 54 55 46 42 52 54 49 49 45 52 41 54 54 49 51 44 52 29 36 52 32 42 37 43 35

52 54 44 23 56 36 57 58 45 38

52 54 44 23 56 36 57 58 45 57

49 46 45 32 42 47 45 44 52 69

47 55 44 49 53 52 46

A travs de un procedimiento de conteo de los datos que se encuentre en cada uno de los intervalos se establecen las frecuencias. Este procedimiento es extremadamente rpido mediante la utilizacin de algn software.
Tabla 4.5 Tiempo de espera antes de ser atendido. Frecuencia Frecuencia Acumulada Marca Absoluta Relativa Absoluta Relativa Tiempos (seg.) de Clase 14,7 [ 10,4 19,0 [ 1 0,85% 1 0,85% 23,3 [ 19,0 27,6 [ 4 3,42% 5 4,27% 31,9 [ 27,6 36,2 [ 11 9,40% 16 13,67% 40,5 [ 36,2 44,8 [ 22 18,80% 38 32,47% 49,1 [ 44,8 53,4 [ 39 33,33% 77 65,80% 57,7 [ 53,4 62,0 [ 30 25,64% 107 91,44% 66,3 [ 62,0 70,6 ] 10 8,56% 117 100,00%

14

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

4.2.1 Grficos

Un grfico es otra forma de representar y resumir datos, en el grfico se pueden se hacer evidentes ciertas caractersticas que en una tabla de frecuencias pueden pasar inadvertidas. La representacin grfica de los datos ha logrado un uso creciente en los medios de comunicacin y eso se debe en gran parte, a la popularidad y uso de software con amplias representaciones grficas.
Grficos de barras y la grfica de pastel (circular), son los grficos ms comunes y sencillos, usualmente utilizados en datos categricos. Cuando los datos se presentan en escala nominal, la secuencia en que se presentan las clases es totalmente arbitraria, sin embargo, cuando los datos se presentan en escala ordinal, las clases deben mantener el orden de la escala. A continuacin se presentan dos aplicaciones que exponen una serie de grficos y variaciones de estos. APLICACIN 4.6 La tabla muestra la proporcin de clientes asociados sector de ubicacin. Tabla 4.6 Sector de ubicacin del cliente.

Sector Proporcin (%)

1 10%

2 15%

3 40%

4 20%

5 10%

6 5%

Sector de Cliente
40% Porcentaje

6 5

5% 10% 10%

Sector de Cliente

20% 15% 10% 10% 5%


1 2 3 4 5 6

Sector

1 2 4 3

15% 20% 40%

Sector

Porcentaje

Figura 4.3: Grficas de barra asociada de ubicacin del cliente.

Las grficas de barras anteriores son dos variantes, la primera (de izquierda a derecha), es un grfico de barra habitual donde se sigue la secuencia del sector, en la segunda forma, ahora escrito en el eje de las abscisas, se escriben los sectores de acuerdo a su importancia relativa. Los grficos circulares, son otra opcin para los datos anteriores, En estos grficos, el ms comn es el primero (de izquierda a derecha), por su sencillez y fcil interpretacin, sin embargo, particularmente en peridicos de economa y negocios se ha popularizado el segundo, por su atractivo visual.

15

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Sector de Cliente
5% 28% 14% 10%
1 2 3 4 5 6

Sector de Cliente
14% 10% 24% 28%
1 2 3 4 5 6

19%

5%

24%

19%

Figura 4.4: Grficas circulares asociadas al sector del cliente

APLICACIN 4.7 Suponga que estamos interesados en el grado de satisfaccin de los clientes con respecto a los servicios adicionales que presta la empresa. En este caso a una muestra de 77 clientes se les pide que califiquen el grado de satisfaccin como: Insatisfecho (I), Indiferente (II), Normal (N), Satisfecho con reparos (SR) y Totalmente Satisfecho (TS). Los datos son: Tabla 4.7 Grado de satisfaccin por servicios adicionales de la empresa. Grado Insatisfecho (I) Indiferente (II) Normal (N) Satisfecho con Reparos (SR) Totalmente Satisfecho (STS)

Frecuencia Absoluta Absoluta Acumulada 19 19 21 40 33 73 2 75 4 77

En la Figura 4.5, se muestran dos grficas asociadas, para cuando la variable bajo estudio est en escala ordinal, razn por la cul, existe un orden en la distribucin del grado de satisfaccin.
Grado de Satisfaccin
TS SR N II I 0 10
21 19 2 33 4

Grado de Satisfaccin
3% 5% 24%
I II N

41%
40

SR TS

20 30 Frecuencia

27%

Figura 4.5:

Grficas circulares asociadas al sector del cliente.

16

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

En la representacin grfica de tablas de frecuencia de datos cuantitativos (continuos), existen dos grficos habituales. El primero, los constituye el histograma de frecuencia junto con el polgono de frecuencia; el segundo, lo constituye grfica de frecuencias acumuladas junto con la ojiva. Se muestra a continuacin estas graficas para los datos de tiempos de espera (Tabla 4.5)
H isto grama d e F recuencia
50 40 Frecuencia 30 20 10 0
10,4 -19,0 19,0 - 27,6 27,6 - 36,2 36,2 - 44,8 44,8 - 53,4 53,4 - 62,0 62,0 - 70,6

Tie m pos [s e g .]

Figura 4.6:

Histograma de frecuencia y polgono de frecuencia para tiempos de espera.

Polgono de Frecuencia
120 100 Frecuencia 80 60 40 20 0

Frecuencia Acumulada

Ojiva

10,4 -19,0 19,0 - 27,6 27,6 - 36,2 36,2 - 44,8 44,8 - 53,4 53,4 - 62,0 62,0 - 70,6 Tiempos [s eg.]

Figura 4.7:

Grfica de frecuencia acumulada y ojiva para los tiempos de espera

17

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

4.3

Medidas de Desempeo

Los indicadores de desempeo han adquirido gran importancia a partir del establecimiento de la filosofa de gestin, calidad total y la aplicacin de normas nacionales o internacionales. Son herramientas para la evaluacin de la gestin, que proveen valores de referencia con el cual se puedan comparar o proponer metas. Las medidas de desempeo son otro medio con el cual se resumen los datos, ya que a travs de ellos se establece una medida resumen de alguna particularidad en los datos. Estos indicadores se dividen en tres tipos: medidas de posicin, resumen de los datos que representa un lugar definido importante dentro de ellos; medidas de variabilidad o riesgo, que como se podr apreciar son muy importantes ;y medidas de forma, que tienen una importante relacin con un grupo de medidas de posicin.
4.3.1 Medidas de Posicin

Una medida de posicin es un valor simple que se calcula para un grupo de datos y que se utiliza como una manera de resumir los datos. Normalmente se desea que el valor sea representativo de todos los valores incluidos en el grupo, estos valores pueden estar relacionados con posiciones de particular inters como los extremos, los cuales se asocian a cuantiles, o valores del centro, llamados de tendencia central.
La Media Aritmtica: La media aritmtica, o promedio, se define como el cuociente de la suma de todos los valores entre el nmero total de valores. En estadstica, un "promedio es una medida de Tendencia central para un conjunto de datos.

En estadstica es normal representar una medida descriptiva de una poblacin, (o parmetro poblacional), mediante letras griegas, en tanto que se utilizan letras romanas para las medidas descriptivas de estadsticas muestrales. As, la media aritmtica para una poblacin de valores se presenta mediante el smbolo , en tanto que la media aritmtica de una muestra se representa mediante el smbolo X . Las expresiones para el clculo de la media de una poblacin y de una muestra son:

1 N

i = 1

Xi

X=

1 n

i =1

Xi

APLICACIN 4.8: Los pagos de consumo, en una muestra de 15 cuentas, fueron: $1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000,12500, 13500, 24500, 27500, 30900, y 41000.
X = i =1

Xi
15

15

El promedio muestral es:

= $ 12.080.

18

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Cuando se agrupan datos en una distribucin de frecuencias, se utiliza el punto medio de cada clase como aproximacin de todos los valores contenidos en ella. El punto medio o marca de clase se representa con el smbolo mi, en donde el subndice i indica la "clase i", y se utiliza la letra ni para representar la frecuencia absoluta observada en la clase respectiva. Las frmulas para la media de la poblacin y de la muestra para datos agrupados son:

i =1

ni mi N

X=

i =1

ni mi n

APLICACIN 4.9: Considerando los datos del tiempo de espera (en segundos)e:

Tiempos (seg.) [ 10,4 19,0 [ [ 19,0 27,6 [ [ 27,6 36,2 [ [ 36,2 44,8 [ [ 44,8 53,4 [ [ 53,4 62,0 [ [ 62,0 70,6 ]
X=

Marca de Clase 14,7 23,3 31,9 40,5 49,1 57,7 66,3

Frecuencia Absoluta Relativa 1 0,85% 4 3,42% 11 9,40% 22 18,80% 39 33,33% 30 25,64% 10 8,56%

i =1

ni mi n

14, 7 1 + 23,3 4 + . . . + 66,3 10 = 48,4 [ segundos] 117

La gran desventaja de este indicador es su gran sensibilidad a la presencia de datos extremos. Un dato extremo se manifiesta inmediatamente en el promedio, poniendo en duda el ser un valor representativo del centro de los datos.
La Mediana: La mediana de un conjunto de datos es el valor que ocupa el lugar central, cuando se ordenan en orden de magnitud. Para conjunto de datos, con un nmero par de elementos, la mediana se calcula como el promedio de los valores centrales.

En el caso de estar trabajando con datos dispersos, la expresin para determinar la posicin de la mediana en el conjunto de datos, donde los parntesis en el subndice, muestra el lugar que ocupa la mediana dentro del conjunto de datos ordenados, est dada por:

19

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

X n + 1 2 Me = 1 (X n + 2 2

si n es impar

( )

( ))
n +1 2

si n es par

APLICACIN 4.10: Considerando los pagos de consumo, en una muestra de 15 cuentas en un restaurante: $1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000,12500, 13500, 24500, 27500, 30900, y 41000.

Me =

n + 1 2

15 + 1 = 2

$ 5.300

La mediana es una medida de tendencia central, este indicador no es afectado por datos extremos (indicador robusto).
La Moda: Medida de tendencia central, que est dada por el valor o clase que se presenta con mayor frecuencia. Cuantiles: Los cuantiles son medidas de posicin que dividen los datos en grupos bajo los cuales se encuentra una determinada proporcin de stos, por lo se requiere que los datos se encuentren en al menos escala ordinal.

La mediana es un cuantil que divide la distribucin de los datos en dos partes de igual frecuencia acumulada, y luego bajo/sobre la mediana se encuentra acumulado el 50% de los datos. Los cuartiles, la dividen en cuatro cuartos; los quintiles, dividen la poblacin en cinco; los deciles, la dividen en diez dcimos; y los puntos percentiles, la dividen en cien partes. Estos, en el caso de datos dispersos, son expresados por:
Qi (cuartil i ) = X i ( n + 1)
4

i : 1, 2, ... , 4

Ki (quintil i ) = X i ( n + 1)
5

i : 1, 2, ... , 5

Di (dencil i ) = X i ( n + 1)
10

i : 1, 2, ... , 10

Pi ( percentil i ) = X i ( n +1)
100

i : 1, 2, ... , 100

20

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Estas expresiones son exactas en la medida que los factores de proporcin: i (n + 1) i (n + 1) i (n + 1) ; ; sean nmeros enteros, en caso contrario una 4 10 100 buena aproximacin (aunque no la nica) la entrega el promedio entre el entero superior e inferior de la respectiva fraccin, tal como se presenta en la aplicacin siguiente.
APLICACIN 4.13: Considerando los pagos de consumo: $1000, 1000, 2500, 2500,

2500, 3500, 4000, 5300, 9000,12500, 13500, 24500, 27500, 30900, y 41000. Q3 = X 3(15 + 1) = X(12) = $ 24.500
4

Luego, el 75% de los pagos por consumo son menores o iguales a $ 24.500. D4 = X 4(15 + 1) = X(6,4) =
10

X (6) + X (7) = $ 3.750 2 X (10) + X (11) 2 = $ 13.000

P68 = X 68(15 + 1) = X(10,88) =



100

4.3.2 Medidas de Variabilidad

Las medidas de tendencia central de posicin que se presentaron son tiles para identificar un valor tpico particular de un conjunto de datos, las medidas de variabilidad se ocupan de describir la dispersin (riesgo, precisin) de los datos con respecto a una medida del centro o un valor particular. A modo de ejemplo, suponga que dos mquinas empacadoras dan como resultado productos con un peso promedio de 10 gramos, pero que en un caso los productos se encuentran dentro de un rango de 0,1 gramos con respecto a este peso promedio, en tanto que en el otro los pesos pueden variar hasta en un gramo. Como se observa en la Figura 4.11, en el primer caso los datos son menos dispersos respecto al valor de 10 gramos que en el segundo caso, lo que implicara que suposiciones realizadas al primer caso seran de menor riesgo que las del segundo.

Figura 4.11: Visualizacin de la variabilidad en un conjunto de datos

21

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Existen varios indicadores para medir la magnitud de la variabilidad en conjuntos de datos. Las que se describen a continuacin son: rango, rango modificado, desviacin media, varianza, desviacin estndar y coeficiente de variacin.
El Rango: El rango (R), es la diferencia entre el mayor y menor valor del conjunto de datos. S Mx.{xi} representa el mayor, y Min.{xi} representa el menor, el rango de los datos est dado por:

Max{xi } Min{xi } R= LS LI 1 k

datos dispersos datos agrupados

APLICACIN 4.15: Considerando los pagos de consumo, en una muestra de 15 cuentas en un restaurante: $1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000,12500, 13500, 24500, 27500, 30900, y 41000, el rango est dado por:

R = Mx.{xi} Min.{xi} = 41000 - 1000 = $ 40.000


Rangos Modificados: Un rango modificado es un rango para el cual se elimina cierto porcentaje de los valores en cada uno de los extremos de la distribucin y es simbolizado por R mod. ( j % central). Algunos rangos modificados tpicos son: el 50% central, el 80% central y el 90% central.

Para determinar el rango modificado, primero se debe ubicar los dos puntos percentiles de inters para, despus, calcular el rango entre ellos.
APLICACIN 4.17: Considerando los pagos de consumo, en una muestra de 15 cuentas en un restaurante: $1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000,12500, 13500, 24500, 27500, 30900, y 41000, el rango modificado al 50% central est dado por:

P75 = X 75 ( n + 1) = X(12) = $ 24.500.



100 100

P25 = X 25 ( n + 1) = X(4) = $ 2.500.


R Mod (50% central) = P75 - P25 = 24500 2500 = $ 22.000.

22

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

El rango modificado al 50% central, tambin es conocido como rango intercuartilico, mientras que el rango modificado al 80% es conocido como rango interdecil. Los rangos modificados, en general, buscan anular el efecto de valores extremos de los datos, que produciran un fuerte efecto en el rango tradicional, como medida de variabilidad.
La Varianza y la Desviacin Estndar: La varianza es similar a la desviacin media porque se basa en la diferencia entre cada uno de los valores del conjunto de datos y la media del grupo, La diferencia consiste en que, antes de sumarlas, se eleva al cuadrado cada una de las diferencias, Para una poblacin de tamao N, se representa la varianza mediante V(X) o, tpicamente por la letra 2; la frmula de clculo es:

V(X) = =

i =1

( xi ) N

A diferencia de otras estadsticas muestrales que se han analizado, la varianza de una muestra no es, en trminos de clculo, completamente equivalente a la varianza de la poblacin, La varianza muestral se representa mediante S2, y est dada por: S =
2

i =1

( xi x )2 n 1

Se utiliza con mayor frecuencia la raz cuadrada de la varianza, representada mediante la letra griega para el caso poblacional y S para una muestra, y se le denominada desviacin estndar, Las frmulas son:

V(X)

S = Varianza muestral

La desviacin estndar, adems de ser una medida de dispersin que utiliza toda la informacin (en contraposicin con los rangos) y ser expresada en igual unidad de medida que los datos originales, es especialmente til cuando se le utiliza junto con la denominada distribucin normal.

23

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

EXACTITUD

PRECISIN ESTRATIFICACIN

I.- EXACTITUD Y PRECISIN

En muchas ocasiones no es posible tener mediciones fidedignas debido a problemas de diversa ndole propios de los datos que se estn analizando, por ejemplo, en el caso de utilizar instrumentos de medicin mecnicos: stos se pueden descalibrar (por uso y/o falta de mantenimiento); mal manejo de los aparatos; inadecuada instalacin de stos, etc. Mayor es el problema cuando el instrumento de medicin depende necesariamente de criterios o factores humanos, pues la subjetividad propia del ser siempre afecta las mediciones. En este sentido, en la toma de datos se deben tener presentes dos conceptos bsicos importantes, que son la exactitud y precisin de la medicin. Particularmente cuando la poblacin en estudio esta claramente estratificada, stos conceptos son de gran utilidad en la comparacin de los estratos. La exactitud, esta relacionada con el grado de cercana que tienen las mediciones con respecto a un valor objetivo que no necesariamente debe ser el promedio, aunque sea este ltimo una buena medida para medir la exactitud del estrato. La precisin de las mediciones esta relacionada con el grado de dispersin presente en los datos recopilados. Estos conceptos se pueden apreciar esquemticamente en la siguiente figura.

De estos conceptos se deben desprender dos aspectos importantes. El primero es que no se puede hablar de exactitud y precisin en datos que no sean cuantitativos. Si bien es cierto en el pasado se definieron medidas como la desviacin modal, no es sensato determinar sta en datos ordinales o nominales, pues las caractersticas que cumplen estos datos no son de distancia, por tanto difcilmente se podra hablar de dispersin. El segundo, es que cuando se habla de la precisin en las mediciones, es decir, la dispersin dispersin respecto a que? comnmente la varianza es una buena medida, sin embargo, dado que se est en una poblacin estratificada, no sera extrao en ningn caso que se obtengan promedios distintos en cada estrato, por lo

24

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

tanto si la dispersin es distinta en cada estrato, no habra de extraarse que la varianza tambin sea distinta en cada estrato. En este sentido una medida de variabilidad de gran uso y utilidad en la comparacin de poblaciones o subpoblaciones en el caso de estratos, est dada por el coeficiente de variacin (CV), que indica la magnitud relativa de la desviacin estndar con respecto a la media de la distribucin. La frmula de clculo se expresa por:

Poblacin

CV =

Muestra

CV =

s x

A P L I C A C I N 1 : Para 2 acciones de empresas, el precio promedio de cierre en el mercado de valores durante un mes fue, para la accin A, de $15.000, con desviacin estndar de $500. Para la accin B, el precio promedio fue de $5.000, con desviacin estndar de $300. Haciendo una comparacin absoluta result ser superior la variabilidad en el precio de la accin A, debido a que muestra una mayor desviacin estndar. Pero con respecto al nivel de precios, deben compararse los respectivos coeficientes de variacin:

CV (A) =

500 = 0,033 15000

CV(B) =

300 = 0,060 5000

Puede concluirse que el precio de la accin B ha sido casi 2 veces ms variable que la accin A (entonces ms riesgosa?).
Nota: El coeficiente de variacin permite comparar poblaciones aunque estn en distintas unidades. A P L I C A C I N 2 : Se toman dos muestras de materiales fabricados con tipos distintos de acero para analizar la resistencia a la ruptura. Los siguientes grficos resumen los tiempos mximos que soportan dichos materiales antes de fragmentarse, cuando son sometidos a la tensin:
Acero Tipo I
0,5 0,4 0,3 0,2 0,1 0,0 0 - 4 4 - 8 8 - 12 12 - 16 16 - 20 0,10 0,20 0,15 0,30 0,25 0,5 0,4 0,3 0,2 0,1 0,0 0 - 4 4 - 8 8 - 12 12 - 16 16 - 20 0,10 0,10 0,05 0,25

Acero Tipo II
0,50

Resitencia [ua]

Resistencia [ua]

25

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Claramente se puede apreciar que la distribucin de los datos dentro del rango de la tabla no es distinta para ambos tipos de acero, es ms se puede observar una clara simetra positiva en el acero tipo 2. Los clculos de las medidas utilizadas para el coeficiente de variacin son: x1 = 10, 60 x2 = 8, 00 s1 = 4,779 s2 = 3,899 CV1 = 45,08% CV2 = 48,74%

Ejercicio: A fin de controlar la calidad de un particular tipo de hilo producido en serie, en control de calidad toman una muestras al azar de tamao 7, correspondientes a cada uno de los cuatro turnos que los operarios realizan y se mide la resistencia a la tensin [en libras], cuyos datos se muestran a continuacin. Se tiene que la media por especificaciones debe ser de 48.00 [libras].

Observacin Turno 1 Turno 2 Turno 3 Turno 4

1 44 44 42 51

2 46 43 48 52

3 48 42 46 48

4 52 43 53 49

5 49 46 54 47

6 47 45 49 47

7 48 44 44 50

En la siguiente tabla se muestran algunas medidas de resumen de cada turno asociado al problema antes expuesto. Observacin Turno 1 Turno 2 Turno 3 Turno 4 i) ii) Media
47,71 43,86 48,00 49,14

Desviacin estndar 2,50 1,35 4,43 1,95

Coeficiente de variacin 5,23% 3,07% 9,24% 3,97%

St
2,33 4,34 4,11 2,13

Discuta la precisin y exactitud de la resistencia del hilo fabricado en cada turno. A qu turno asignara mayor atencin para mejorar su desempeo.

II.- MEDIA Y VARIANZA ESTRATIFICADA

Como se observ en los casos anteriores cuando la variable de estudio est claramente dividida en estratos, y en cada uno de stos se pueden obtener medidas de tendencia central y dispersin, o bien cuando se tiene informacin (medidas de resumen) slo de los estratos por separado y no se cuenta con los datos (ver figura), medidas de resumen de la poblacin total se obtienen de resmenes anteriores de la poblacin (medias y desviaciones estndar de cada estrato) estas son la media y varianza total, tambin llamadas media y varianza ponderada.

26

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

1.- La Media Ponderada: La media ponderada o promedio ponderado es una media aritmtica, en la cual se considera a cada uno de los valores de acuerdo con su importancia en el grupo. Las frmulas para la media ponderada poblacional y muestral son idnticas y estn dadas por:

p =

p
i =1 h

i i

p
i =1

xp =

px
i =1 h

i i

p
i =1

la importancia del grupo en la poblacin total est dada por los pesos expresados por pi, que generalmente se escogen de acuerdo al tamao del grupo.
A P L I C A C I N 4 : En una compaa que maneja 4 productos, los mrgenes de utilidad correspondientes a cada uno de ellos durante el ao fiscal anterior fueron: Producto A, 4,2%; Producto B, 5,5%; producto C, 7,4%; y producto D, 10,1%.

El margen de utilidad promedio, no ponderado, es: =

27,2 = 6,8% 4

Sin embargo, este promedio no ponderado es incorrecto porque se vendieron cantidades distintas de los 4 productos. Suponiendo los totales de ventas y margen de utilidad que aparecen en la Tabla siguiente, se encuentra que el promedio ponderado describe en forma correcta el promedio global.

27

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Producto A B C D

Margen de utilidades (%) 4,2 5,5 7,4 10,1

Ventas (p) $ 30.000.000 $ 20.000.000 $ 5.000.000 $ 3.000.000

pX $ 1.260.000 $ 1.100.000 $ 370.000 $ 303.000

p =

p
i =1 h

i i

p
i =1

=
i

3.033.000 = 5,2% 58.000.000

De manera anloga se puede obtener una ponderacin de acuerdo a las ventas por producto, obtenindose idntico resultado. Producto A B C D Margen de utilidades (%) 4,2 5,5 7,4 10,1 Ventas (p) $ 30.000.000 $ 20.000.000 $ 5.000.000 $ 3.000.000 pi
0,5173 0,3448 0,0862 0,0517

2.- La Varianza: La varianza es una varianza descompuesta y ponderada, en la cual se considera a cada una de las medidas de dispersin de los estratos de acuerdo con su importancia en el grupo, adems de una descomposicin de la variabilidad debido a la variabilidad propia del estrato, tambin llamada variabilidad dentro o Intra, y una variabilidad propia entre los estratos, tambin llamada variabilidad entre o Inter. Las frmulas para la varianza ponderada poblacional y muestral son idnticas y estn dadas por:
2 Sp

i =1

2 pi s i

p (x
i i =1

x p ) , donde

ps
i =1

2 i i

= Representa la variabilidad dentro.

p (x
i i =1

xp)

= Representa la variabilidad entre estratos.

28

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Por esta descomposicin de la variabilidad total, se pueden obtener los porcentajes de variabilidad debido a la variabilidad propia de los estratos y a la variabilidad propia de la estratificacin Ahora bien, si considerando las medidas de resumen del ejemplo 4 Margen de utilidad y volumen de ventas para 4 productos se obtiene que el mayor aporte (en porcentaje) a la variabilidad esta dada por la variabilidad propia del margen de utilidad. Producto A B C D Margen de utilidades (%) 4,2 5,5 7,4 10,1 Ventas (p) $ 30.000.000 $ 20.000.000 $ 5.000.000 $ 3.000.000
2 = Dentro + Entre ST 2 = 4,934 + 2,206 ST 2 = 7,140 [%]2 ST

Varianza (%)
4,02 5,20 6,85 9,08

Pi
0,5173 0,3448 0,0862 0,0517

Dentro 69,1%

Entre 30,9%

4.3.3 Asociacin de Variables

En estadstica descriptiva multivariada se trabaja con un vector de informacin para cada un de las n unidades, a las cuales se les miden p caractersticas o variables. Si se consideran pares de variables que al menos se encuentren en escala ordinal, una de las grficas ms tiles para observar el tipo de asociacin que existe entre un par de variables, son las llamadas grficas de dispersin, que consiste en tomar los pares ordenados de las variables, los cuales son grficos en el plano cartesiano x e y, es decir:. (x1, y1), (x2, y2), ... , (xn, yn) el diagrama de dispersin se muestra en la Figura 4.12.

29

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Figura 4.12

Grfica de dispersin de pares ordenados.

Una de las medidas de asociacin ms comunes y tiles, cuando se consideran pares de variables es el coeficiente de correlacin lineal de Pearson, que mide el grado de asociacin lineal entre un par de variables, que se encuentren en escala al menos intervalar. La deduccin y propiedades de este coeficiente, tiene sus fundamentos en matemticas. El clculo de este coeficiente se obtiene mediante:

r =
2

i =1 n

( yi
2

- y ) ( xi - x )
2

i =1

( yi - y )

i =1

( xi - x )

,
2

r =
2

i =1 n

yi xi

n 2

ny x

i =1

yi2 - n y 2

i =1

xi2 -

nx2

Este coeficiente tiene la propiedad que se encuentra intervalo de 1 a 1, considerndose que existe una buena asociacin lineal positiva negativa, si el valor de r est cercano a 1 1 respectivamente. Una manera muy prctica de ver la existencia de asociacin entre un par de variables, es mediante las grficas de dispersin.
Grfica de D ispersin
Y

Grfica de Dispersin
Y

r = -1

r1

30

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Grfica d e D ispersin
Y Y

Grfica de Dispersin

r -1

r=1

Grfica de Dispersin
Y
Y

Grfica de Dispersin

r=0
X

r=0
X

4.3.4 Elementos Bsicos de Regresin Considere un experimento, en el cual se considera una variable independiente, la cual trata de explicar una variable dependiente (a predecir), se tienen mediciones realizadas simultneamente, que conforman las variables x e y para un rango de diferentes condiciones experimentales. Si se hacen n mediciones, stas se pueden expresar por: ( xi, yi) con i = 1 , . . . , n , que son los correspondientes n pares ordenados de observaciones. Se construye un modelo estadstico paramtrico para esta situacin, proponiendo una relacin funcional f(x; ) para la media de Y. El primer paso en el anlisis, es realizar un grfico de dispersin de y versus x, si el grfico muestra una relacin entre las dos variables se puede considerar un modelo estadstico adecuado para esta relacin. En el caso presentado se estudia el modelo de regresin lineal simple.

31

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

En esta situacin el modelo estadstico a utilizar est dado por: Modelo : Yi = f(x) + &i = "0 + "1 xi + &i . i = 1, ... , n,

Adems, es posible realizar supuestos distribucionales verificables estadsticamente acerca de los errores &i, en particular, por ejemplo, que tienen una distribucin Normal, que es la base para poder llegar a realzar inferencias respecto al modelo, sus parmetros y sus predicciones. A partir de estos supuestos es posible visualizar a partir del siguiente diagrama de dispersin estos conceptos.

Estimacin de Parmetros El mtodo comnmente usado para la estimacin de parmetros en los modelos de Regresin Lineal es denominado Mnimos Cuadrados Ordinarios (MCO), aunque este mtodo coincide con la estimacin de los parmetros "0 y "1 del modelo lineal a travs del mtodo de Mxima Verosimilitud, que se basa en supuestos asociado a errores &i ( modelos aleatorios).

32

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Mnimos Cuadrados Ordinarios En este ejemplo a partir de un modelo de Regresin Lineal simple de la forma: Yi = " 0 + " 1 xi+ &i (4.1)

Se busca determinar los estimadores "0 y "1 que minimicen la suma de errores
&i al cuadrado. Esto se resuelve mediante herramientas matemticas, minimizando la

funcin g ( i2 ) con respecto a los cada parmetros "0 y "1, es decir, minimizando: g ( i2 ) =

i =1

i2

(y
i i =1

1 xi ) 2

las soluciones para los estimadores MCO de 0 y 1 son:

"

= i=1

( yi
n i=1

y )( x i x ) = x)2

( xi
+ x i = y 0 1 i

Sx y , Sx x

"0 = y - x "1

La regresin lineal ajustada, es posible escribirla en la siguiente forma. (4.2) (4.3)

(x x) i = y + y 1 i

La ecuacin (4.3), muestra la clara evidencia de la importancia del parmetro 1 en la ecuacin de regresin. Es decir, una estimacin 1 de muy cercana a cero, implicara la poca relacin lineal entres las variables. Recordando indicadores de asociacin lineal, se tiene que el coeficiente 1 posee una estrecha relacin con el coeficiente de asociacin lineal de Pearson, como se visualiza a continuacin

sx rp = 1 sy
i = y + rp y sx ( xi x ) sy

=r p 1

sy sx

(4.4)

33

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 4.18: La Gerencia de Airlines S.A., considera que existe una relacin directa entre los gastos publicitarios, en miles de US$ (P [MUS$]), y el nmero de pasajeros, en miles (Q [M]), que escogen viajar con Airlines S.A. Los datos son:
P [MUS$] Q [M/]

10 12 8

17 10 15 10 14 19 10 11 13 16 10 12

15 17 13 23 16 21 14 20 24 17 16 18 23 15 16

A travs del diagrama de dispersin, como se observa a continuacin:

Diagrama de Dispersin
26 Q [M] 22 18 14 10 7 9 11 13 15 P[MUS$] 17 19 21

Modelo Propuesto:

Yi = 0 + 1 xi + &i

Para el ajuste se requieren los clculos siguientes

( x x ) = 137,7333 Sxy = ( y y )( x x ) = 148,9333


Sxx =
i 2 i i

Syy =

( y y)
i

= 171,7333
x = 12,4667

y = 17,8667

Con los que se obtiene:

= 1

S xy S xx

= 1,0813

x = 4,3865 = y - 0 1

rp =

S xy S yy S xx

= 0,9684

Luego la regresin ajustada estara dada por: i = 4,3865 + 1,0813 xi y i = 17,8667 + 1,0813 (xi 12, 4667) y Se puede visualizar que para un gasto en publicidad de 9 [M], se tendra una estimacin del nmero de pasajeros que viajara de: i = 17,8667 + 1,0813 (9 12, 4667) = 14,1182. [M] y

34

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 4.19: Los datos representan una muestra de los tiempos de transporte y el porcentaje de capacidad no utilizada por camiones de una empresa de transporte.
% de Capacidad Transporte % de Capacidad Transporte

7,75 60,505

18,75 11,15 1,315 15,055 15,55 0,450

14,95 10,85 8,05 2,145 17,050 53,145 16,70 0,250 22,45 9,10 3,745 20,310

14,10 1,495 11,65 4,595

12,55 5,050

13,60 8,35 7,550 41,470

Del diagrama de dispersin, se puede visualizar el tipo de relacin que existe entre ambas variables, como se observa a continuacin:

80 Tiempos de Transporte 60 40 20 0 7

Diagrama de Dispersin

11 13 15 17 19 % de Capacidad no Utilizada

21

23

Modelo Propuesto:

Yi = exp{-(0 + 1 xi + &i)}

1 ln Y i = "0 + "1 Xi + &i 1 Yi* = ln Y i

ln (Yi) = ("0 + "1 xi + &i)

Yi* = "0 + "1 Xi + &i

Con los que se obtiene:

= i=1 1

y x
i=1
15

15

* * i i ny x

= xi2 n x 2

265,1626 15 1,7400 13,0367 2796,1975 15 (13,0367)


2

75,0986 = 0,304 246,8773

= y* x = 1,7400 0,304 13,0367 = 5,706 0 i 1 i* = 5,706 + 0,304 xi y

35

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Adems, a travs la estimacin del coeficiente de 1 se puede obtener el grado de asociacin lineal entre el porcentaje de capacidad no utilizada y el logaritmo del inverso del tiempo de transporte, el cul est dado por: s x = 0,304 17,6341 = 0,7581 rp = 1 sy 2,8356 Luego con la ecuacin de regresin ajustada se puede realizar una estimacin para el logaritmo del inverso del tiempo de transporte, cuando se tiene el porcentaje de capacidad no utilizada del camin del 19,5%, la cual est dada por:

* = 5,706 + 0,304 19,5 = 0,222 y luego,


1 Yi* = ln Y i = 0,222

= exp{ 0,222} = 0,80 [u.t.] y

APLICACIN 4.20: La rentabilidad promedio semanal, de una accin en el tiempo, para las ltimas 16 semanas expresados en la Tabla 1.
Tiempo Rentabilidad Tiempo Rentabilidad

1988 6,0 1996 17,8

1989 7,1 1997 13,2

1990 10,7 1998 21,4

1991 7,0 1999 17,0

1992 11,9 2000 25,1

1993 13,5 2001 21,4

1994 9,2 2002 27,8

1995 15,8 2003 16,6

Del diagrama de dispersin, se puede visualizar el tipo de relacin que existe entre ambas variables, sin embargo, como se observa en la grfica de dispersin los tiempos son transformados a la escala 1, , n, particularmente para las estimaciones de los parmetros:
Diagrama de Dispersin
Rentabilidad 30 20 10 0 0 2 4 6 8 10 12 Tiempo 14 16 18

36

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Modelo Propuesto:

Yi = 0 + 1 xi + &i

= i =1 1

15

15

y i* x i n y * x

=
x i2 n x 2

2451,7 16 8,5 15,094 1496 16 (8,5) 2

i =1

398,92 = 1,1733 340,00

=y x = 15,094 1,1733 x 8,5 = 7,767 0 1

con los datos se puede obtener la ecuacin de regresin ajustada a la rentabilidad de la accin en el tiempo, la cual est dada por: i = 7,767 + 1,1733 x i y Luego si se desea estima la rentabilidad de la accin para el ao 2004, se debe tener especial cuidad en el reemplazo del ao codificado (17) en la ecuacin anterior, 17 = 7,767 + 1,1733 17 = 27,71%. es decir: y

37

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

5. TERCER MDULO
5.1
Elementos de Probabilidad

En la investigacin cientfica, por lo general, se requiere de modelos que ayuden a comprender el fenmeno bajo estudio. En general, no es posible contar con modelos exactos, tambin conocidos como modelos determinsticos. En tales situaciones, las mediciones obtenidas presentan perturbaciones no controlables, lo que lleva a que la observacin presente variabilidad en los resultados. En experimentos en condiciones supuestamente idnticas, el azar o aleatoriedad en el resultado de la medicin, dificulta la posibilidad de predecir el resultado con certeza. Por ejemplo, en el problema de determinar la resistencia a la ruptura de una barra de acero (con alguna especificacin de la misma), es muy creble, que en la medicin de diez barras, ninguna resulte igual, luego, si se quiere ofrecer una especificacin de la resistencia de las barras que se producen: cul es el valor de la resistencia de las barras que se ofrecera?, la resistencia de la barra 1, 2, 3, ... , 10?, la mnima resistencia?, la mxima resistencia?. Posiblemente una respuesta comn sera, la resistencia media, aunque tal vez, ste no sea el mejor indicador. En el campo de investigaciones, donde no es posible utilizar modelos determinsticos, es natural esperar que en la prediccin no sea exacta, sin embargo, por ms que no sea posible prever el resultado con certeza en cada medicin, cuando se est en presencia de fenmenos aleatorios o estocsticos, no significa que dichas mediciones no posean ninguna regularidad, el objetivo de determinar el patrn de dicha regularidad, es lo que en el futuro conoceremos como ley de probabilidad.

Enfoque Clsico
El enfoque clsico, tiene la caracterstica esencial, que basa en la asignacin de medida de ocurrencia para un resultado, sobre los antecedentes que aporta un experimento que se realiza de la manera ms metdica posible, en donde los posibles resultados del mismo son igualmente probables, situacin que tambin se conoce como un experimento equiprobable. Este es el caso tpico de los juegos de azar en que asumimos que todos los resultados elementales son igualmente probables. ; Notemos que en el enfoque clsico (cuando es aplicable) se determinan los valores de probabilidad antes de observar los resultados experimentales, por esta razn se le denomina enfoque a priori.

APLICACIN 5.1 En un mazo de cartas bien barajadas que contiene 4 ases y 48 cartas de otro tipo, la probabilidad de obtener un as en una extraccin es:
[Obtener un as] =

1 #A 4 = . = # S 52 13

38

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Enfoque Frecuentista
En el enfoque de frecuencia relativa, se determina la probabilidad con base en la proporcin de veces que ocurre un resultado en un determinado nmero de observaciones o experimentos. No hay implcita ninguna suposicin previa de igualdad de probabilidades. Debido que para determinar los valores de probabilidad se requiere de la observacin y de la recopilacin de datos, a este enfoque se le denomina tambin enfoque emprico. Este enfoque no asigna probabilidades a priori a los posibles resultados del experimento. La probabilidad en el enfoque frecuentista se asocia directamente al concepto de frecuencia relativa ya trabajado en estadstica descriptiva, de acuerdo con este enfoque la probabilidad de que ocurra un resultado determinado, como por ejemplo llegar atrasado al trabajo es:
n Nmero de atrasos = i . Nmero total llegadas n APLICACIN 5.2 Antes de incluir la cobertura de ciertos tipos de problemas dentales en plizas de seguros mdicos para adultos, una compaa de seguros desea determinar la probabilidad de ocurrencia de esa clase de problemas, para que pueda fijarse la prima de seguros. Por ello, un especialista en estadstica recopila datos para 10000 adultos y encuentra que 100 de ellos han experimentado el problema dental especfico durante el ao anterior. Por ello, la probabilidad de ocurrencia es:

[Llegar atrasado al trabajo] =

[Problema dental] =

ni 100 = 0,01 1% = 10000 n

Enfoque Bayesiano
Tanto el enfoque clsico como el de frecuencia relativa producen valores de probabilidad objetivos, en el sentido de que sealan la tasa relativa de ocurrencia del evento a largo plazo. De acuerdo con el enfoque bayesiano, la probabilidad de un resultado es el grado de confianza que se tiene de que ste ocurra. Debido a que el valor de la probabilidad es un juicio personal, este enfoque, es llamado enfoque subjetivo. El desarrollo de la probabilidad mediante este enfoque, ha recibido mucha atencin en los ltimos tiempos, y tiene relacin con el anlisis bayesiano de decisin. La probabilidad asignada es conocida como probabilidad a priori, est probabilidad se actualiza mediante hechos que van acaeciendo en el tiempo, constituyendo despus de cada actualizacin una probabilidad a posteriori.

39

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Desarrollo Axiomtico de Probabilidad


La medida de probabilidad (P), se apoya en argumentos de Teora de Medida, que para su definicin axiomtica requiere de algunas definiciones previas, las cuales pasamos a recordar.

Definicin 5.1: Espacio Muestral. Se define el espacio muestral como el conjunto de todos los posibles resultados del experimento, y se anota por . Definicin 5.2: Suceso o Evento. Un suceso o evento, es cualquier subconjunto de , y se anota generalmente con letras maysculas. A, B, C etc.
El conjunto, 2, ser llamado conjunto de sucesos y el par (, ) espacio medible, una funcin : (0,1), es una medida de probabilidad si satisface: 1. 0 [A] 1, A . 2. [] = 1. 3. A1, A2 disjuntos [ An] =
i =1

i =1

[Ai]

i.

Dependiendo del nmero de posibles resultados de un experimento aleatorio, el espacio muestral puede ser clasificado como:
Finito

Discreto

Numerable Infinito Acotado

Continuo

No Numerable

No Acotado

5.2

Clculo de Probabilidades

Propiedades de una Medida de probabilidad


Un evento puede ocurrir o no, luego la suma de la probabilidad de ocurrencia de un evento ms la probabilidad de no-ocurrencia es siempre igual a 1.

[A] + [Ac] = 1

40

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 5.3: Suponga que se define como xito, la extraccin de cualquier carta de un naipe bien barajado de 52 cartas con figura o un as. Como 16 cartas de las 52 son jotas, reinas, reyes o ases, la probabilidad de xito es 16/52 = 4/13 y la probabilidad de no xito es entonces 9/13.

Eventos Mutuamente Excluyentes


Dos o ms eventos son mutuamente excluyentes, o disjuntos, si no pueden ocurrir simultneamente. Por ejemplo, supngase que se consideran los eventos as" y "rey" en la extraccin de una carta de un mazo. Estos dos eventos son mutuamente, excluyentes porque ninguna carta puede ser al mismo tiempo as y rey.

APLICACIN 5.4: En un estudio de la conducta de los consumidores, un analista clasifica a las personas que entran en una tienda de aparatos de sonido de acuerdo con su sexo ("masculino" o "femenino") y su edad ("menor de 30" o "30 o mayor). Los eventos, masculino y femenino son mutuamente excluyentes puesto que ninguna persona podra clasificarse en ambas categoras. De manera similar, los eventos "menor de 30" y "30 o mayor" son tambin mutuamente excluyentes. Sin embargo, los eventos "masculinos" y menor de 30" no son mutuamente excluyentes porque una persona elegida al azar podra estar en ambas categoras.
Regla de Aditividad

La regla de la adicin para eventos mutuamente excluyentes es:

[A o B] = [A B] = [A] + [B]
APLICACIN 5.5: Cuando se extrae una carta de un mazo de barajas, los eventos "as" (A) y "rey" (R) son mutuamente excluyentes. La probabilidad de extraer ya sea un as o un rey en una extraccin es:

[A R] = [A] + [R] =

4 4 2 + = 52 52 13

Nota: La regla de adicin se puede generalizarse a tres o ms eventos.

La regla de la adicin general que no son mutuamente excluyentes es:

[A o B] = [A B] = [A] + [B] [A B]
APLICACIN 5.6: Cuando se extrae una carta de un mazo, los eventos "as" y "trbol" no son mutuamente excluyentes. La probabilidad de obtener un as (A) o un trbol (T) (o ambos) en una sola extraccin es:

[A T] = [A] + [T] [A y T] =

4 13 1 4 + = 52 52 52 13

41

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

En el lenguaje de conjuntos, la probabilidad [A y T] se escribe [A T], y se interpreta como la probabilidad de que ocurran simultneamente.
Nota: La regla de adicin en eventos no excluyentes puede generalizarse con algunas variantes a tres o ms eventos.

5.3

Probabilidad Condicional y Eventos Independientes

Dos eventos son independientes cuando la ocurrencia de uno no tiene ningn efecto sobre la probabilidad de ocurrencia del otro y luego son dependientes cuando la ocurrencia de uno si afecta la probabilidad de ocurrencia del otro evento.

APLICACIN 5.7: Los resultados asociados con el lanzamiento de una moneda, dos veces seguidas, son claramente eventos independientes, ya que el resultado del primer lanzamiento no tiene ningn efecto sobre probabilidades del segundo lanzamiento. Por otra parte la extraccin de dos cartas sin reemplazo de un mazo son claramente eventos dependientes, ya que las probabilidades asociadas con la segunda extraccin dependen del resultado de la primera extraccin.
El concepto de probabilidad condicional se emplea para redefinir el clculo de probabilidad de ocurrencia de un evento dada cierta condicin ( o informacin). Si se conoce la probabilidad simple (no condicional) de un primer evento A y la probabilidad conjunta de dos eventos A y B, entonces se puede determinar la probabilidad condicional [B / A] mediante:

[B / A]=

[B A] , [A]

[A] > 0

La expresin [B / A] mide la probabilidad de que el evento B ocurra dado que el evento A ocurri. Ntese que "B / A" no es una fraccin. Si los eventos A y B son independientes, la probabilidad condicional

[B / A] es igual a la probabilidad simple (no condicional) [B]. Por lo tanto, una


forma evaluar la independencia de dos eventos A y B consiste en comparar:

[B / A] = [B]
lo que conduce a la regla [B A] = [A] [B].
Regla Multiplicativa

La regla multiplicativa se refiere a la determinacin de la probabilidad de la ocurrencia conjunta de dos ms eventos .La regla para dos eventos A y B es:

[A B] = [A] [B / A]

42

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 5.8: Si se lanza dos veces una moneda, la probabilidad de que ambos resultados sean "cara" es:

[C1 C2] = [C1] [C2 / C1]= [C1] [C2]= * =


La regla multiplicativa para tres eventos A, B y C es:

1 1 2 2

1 4

[A BC] = [A][B / A] [C / A B]
Nota: La regla multiplicativa puede generalizarse fcilmente a ms de tres eventos.

Los diagramas de rbol son particularmente tiles para ilustrar los posibles eventos asociados con observaciones o ensayos secuenciales. La figura, es un ejemplo de estos diagramas para los eventos asociados con el lanzamiento de una moneda dos veces, donde se identifica los resultados posibles y la probabilidad en cada punto de la secuencia.
APLICACIN 5.9: En la figura, se observa que son posibles cuatro tipos de

secuencias de eventos conjuntos, la probabilidad de ocurrencia conjunta para cualquiera de esas secuencias es 1/4.

APLICACIN 5.10: El Gerente de una empresa de seguridad que presta servicios a grandes tiendas, para lograr un efectivo control contra robos, debe decidir entre comprar detectores producidos por Simons Elctrica Universal. La probabilidad de que el detector producido por Simons, cumpla satisfactoriamente con su propsito es de 0,90; mientras que la de un detector producido por Elctrica Universal, es de 0,74. Las empresas proveedoras (Simons Elctrica Universal) presupuestan que para tener un control efectivo se deben instalar, de forma que funcionen de manera independiente, 3 detectores segn Simons 5 segn Elctrica Universal. Cul detector es ms conveniente, de manera que maximice la probabilidad de control?.

43

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

ei: {Detector Simons i-simo cumple con su propsito}. ci: {Detector Elctrica Universal i-simo cumple con su propsito}. T : {Detectores instalados cumplen con su funcin}. [ei] = 0,90 [ci] = 0,74

i = 1 , ...

c c [T] = [e1 e2 e3] = 1 [ e1 ec 2 e 3 ].


c c = 1 [ e1 ] [ e c 2 ] [ e 3 ] = 0,9990

[T] = [c1 c2 c3 c4 c5]


c c c c = 1 [ c 1 cc 2 c3 c4 c5 ] c c c c = 1 [ c 1 ] [ c c 2 ] [ c 3 ] [ c 4 ] [ c 5 ] = 0,9988.

De los resultados es conveniente usar el detector Simons La empresa en cuestin se ha adjudicado una importante licitacin, sin embargo sta exige que la probabilidad de control efectivo sea al menos de 0,9999995. Cuntos detectores Simons deberan ser instalados?
[T] > 0,9999995

[e1 e2 ... en] > 0,9999995


c c 1 [ e1 ec 2 ... e n ] > 0,9999995

i =1

c [ e1 ] < 0,0000005

0,1 < 0,0000005


i =1

(0,1) n < 0,0000005 n> ln(0, 0000005) 7 ln(0,1)

44

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Regla de Bayes
La regla de Bayes permite actualizar ciertas probabilidades a priori para transformarse en probabilidades posteriori de un evento (experimento). La importancia de la regla de Bayes consiste en que se aplica en contexto de eventos secuenciales y adems, de que proporciona la base para determinar la probabilidad condicional de un evento a la luz de un evento especifico que ha ocurrido. La frmula de clculo para el teorema es:

[A / B]=

[A] [B / A] [A B] = [B] [A] [B / A] + [Ac] [B / Ac]

Nota: 1. - El denominador es la probabilidad total o global del evento.

2. - La regla de probabilidad total o global puede generalizarse a tres o ms eventos.

APLICACIN 5.11: Supngase que existen 2 urnas U1 y U2. La urna 1 tiene ocho bolas rojas y dos bolas verdes, en tanto que la urna 2 tiene cuatro bolas rojas y seis bolas verdes. Si se elige una urna al azar, y despus se selecciona al azar una bola de esa urna escogida, el proceso secuencial y las probabilidades pueden representarse mediante el diagrama de rbol de la figura. El diagrama de rbol indica que la probabilidad de elegir cualquiera de las urnas es 0,50 y despus, las probabilidades condicionales de extraer una bola roja (r) o una verde (V) son las que se sealan.

Ahora, supngase que se observ una bola verde Cul es la probabilidad de que se haya seleccionado la urna 1? En smbolos, [U1 / V2]?

[U1/V1] =

(0,5)(0, 2) [U1] [V1 I U1] = 0,25 = [U1] [V1 I U1] + [U2] [ V2 I U2] (0,5)(0, 2) + (0,5)(0, 6)

En el anlisis bayesiano de decisin esta regla ofrece la base conceptual para revisar las probabilidades asociadas con diversos eventos, o estados implicados en un problema de decisin.

45

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 5.12: Considerar la posible falla de un sistema de abastecimiento de agua para atender la demanda durante un da de verano. El sistema puede fallar de las siguientes formas:
M1: Suministro inadecuado. M2: Falla de la bomba. M3: Sobrecarga en la planta de purificacin. Supongamos que la empresa sanitaria ha efectuado un estudio segn el cual se ha estimado que las probabilidades de falla en el sistema son las que se muestran en la Tabla 5.1. Adems, la probabilidad de que falle la bomba es de 2% y es independiente del nivel de demanda.

Tabla 5.1:

Probabilidades de falla del sistema


P[M3| Di] = P[Sobrecarga en la planta | Nivel de demanda]

Identificacin Nivel de P[M1| Di] = P[Suministro P[Di] = del nivel de demanda P[Nivel de inadecuado | Nivel de demanda [m3/da] demanda] demanda]

D1 D2 D3

100.000 150.000 200.000

0,6 0,3 0,1

0,0 0,1 0,5

0,0 0,0 0,1

La probabilidad de suministro inadecuado es:


[M1] = [M1 / D1] [D1] + [M1 / D2] [D2] + [M1 / D3] [D3]

= 0,0 0,6 + 0,1 0,3 + 0,5 0,1 = 0,080 La probabilidad de falla, cualquiera sea el motivo, cuando el nivel de demanda es 150.000 [m3/da].
[M1 M2 M3/ D2] = [M1 / D2] + [M2 / D2] + [M3 / D2]

= 0,10 + 0,02 + 0,00 = 0,120 La probabilidad de falla del sistema es:


[M1 M2 M3] = [M1] + [M2] + [M3]

Probabilidad de falla

[M3] = [M3 / D1] [D1] + [M3 / D2] [D2] + [M3 / D3] [D3]

= 0,0 0,6 + 0,0 0,3 + 0,1 0,1 = 0,010

[M1 M2 M3] = 0,080 + 0,020 + 0,010 = 0,110

46

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

La probabilidad de falla del sistema si se pone una bomba adicional, para que opere en caso de que falle la primera bomba, y cuya falla es independiente de la falla de la primera bomba es:
[M1 (M21 M22) M3] = [M1] + [ M21 M22] + [M3]

= 0,080 + 0,020 0,020 + 0,010 = 0,0904

APLICACIN 5.13: Se planea una gran presa, la empresa a cargo se interesa en la cantera de grava fina para el concreto. Una posible cantera cercana al lugar es difcil de reconocer con exactitud. Un consultor especializado plantea tres posibles escenario para la magnitud de la cantera; 50% de lo requerido; lo requerido; 150% de lo requerido. Por indicaciones de superficie y un slo pozo de sondeo, el consultor asigna las siguientes probabilidades a estos escenarios:
Escenario Probabilidad 50% de lo requerido 0,50 Lo requerido 0,40 150% de lo requerido 0,10

De las diferentes posibilidades que indique una muestra (Z1, Z2, Z3) depende el verdadero escenario (desconocido), sin embargo, por la experiencia de la empresa, las probabilidades de acierto del consultor con el resultado de la muestra en los posibles escenarios se indican a continuacin: Resultado Muestrales Z1, que favorece Z2, que favorece Z3, que favorece al 50% 0.50 0.40 0.20 al 100% 0.40 0.50 0.40 al 150% 0.10 0.10 0.40

Escenario 50% de lo requerido Lo requerido 150% de lo requerido

Antes los resultados de un segundo pozo de sondeo, que muestra un valor cercano a lo requerido. Cules son las nuevas probabilidades de la magnitud de grava en la cantera? E1 : {50% de lo requerido}; E2 : {Lo requerido}; E3 : {50% de lo requerido}.
[Z2] = [Z2 / E1] [E1] + [Z2 / E2] [E2] + [Z2 / E3] [E3]

= 0,40 0,50 + 0,50 0,40 + 0,40 0,10 = 0,4400

47

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

[E1 / Z2] =

[Z2 / E1] [E1] [Z2] [Z2 / E2] [E1] [Z2]

0,40 0,50 0,4400 0,50 0,40 0,4400

= 0,4546

[E2 / Z2] =

= 0,4546

[E3 / Z2] = 1 0,4546 0,4546 = 0,0908

Antes los resultados de un tercer pozo de sondeo, que muestra un valor cercano a 50% de lo requerido. Cules son las nuevas probabilidades de la magnitud de grava en la cantera?
[Z1] = [Z1 / E1] [E1] + [Z1 / E2] [E2] + [Z1 / E3] [E3]

= 0,50 0,4546 + 0,40 0,4546 + 0,20 0,0908 = 0,4273


[E1 / Z1] = [Z1 / E1] [E1] [Z1] [Z1 / E2] [E1] [Z1]

0,50 0,4546 0,4273 0,40 0,4546 0,4273

= 0,5320

[E2 / Z1] =

= 0,4256

[E3 / Z1] = 1 0,5320 0,4256 = 0,0424

5.4

Variables Aleatorias

En el proceso de construccin de medidas de probabilidad, distinguimos los siguientes elementos:

48

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

El espacio muestral de inters , se puede caracterizar por:

Definicin 5.6: Sea X un experimento aleatorio y H un espacio muestral asociado al experimento. Se dice que X es una variable aleatoria (v.a.) si es una funcin (medible) de H en los nmeros reales, es decir:

Nota: En trminos ms sencillos e intuitivos, se puede definir una variable aleatoria, como una funcin que toma valores en probabilidad, es decir, no se puede predecir con certeza sus valores resultados. Si aceptamos esta segunda definicin:
En qu situaciones se puede predecir con certeza?
Las variables aleatorias (v.a.) son caracterizadas segn los posibles valores que stas

puedan tomar, es decir, segn su recorrido, que se simbolizar por ex.

Definicin 5.7: Se dice que X es una v.a. discreta, si su recorrido ex. es numerable (finito infinito). APLICACIN 5.14: Variable aleatoria discreta con. ex finito

49

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 5.15

Ejemplo de una variable aleatoria discreta con. ex infinito

Definicin 5.8: Se dice que X es una variable aleatoria continua, si su recorrido ex. es no numerable, es decir, que estos pueden tomar cualquier valor en intervalos de la recta real (IR). APLICACIN 5.16
Ejemplo de una variable aleatoria continua:

Funciones de distribucin (Probabilidad acumulada)


Supongamos que se tiene que X es una v. a. discreta, donde los valores que toma son: x1, x2, x3,..., xk, con x1 < x2 < x3 <... < xk, entonces se tiene que en e, se pueden representar por:

La funcin de probabilidad acumulada, la probabilidad de que la variable aleatoria X sea menor o igual a x e. Notar que es la misma nocin de frecuencia relativa acumulada de estadstica descriptiva.

50

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Definicin 5.9: Sea X es una v.a., entonces, se define la funcin de distribucin de probabilidad, como la probabilidad de que la variable aleatoria X sea menor o igual a x e, y se simboliza por Fx(x) = [X x], la cual cumple con las siguientes propiedades:
1.

Fx(x) es una funcin no decreciente y continua a la derecha.

EJEMPLO En un problema de control de calidad, se tiene una poblacin de 25 artculos, donde se asume que 10 presentan pequeos defectos, si se elige una muestra al azar de 3 artculos. Determine Fx(x), donde X:= Nmero de artculos defectuosos en la muestra.

Notemos en primer lugar que ex = {0, 1, 2, 3}, luego s:

x<0

Fx(x) = [X x] = 0

0x<1

10 15 0 3 Fx(x) = [X x] = 25 3 10 15 0 3 Fx(x) = [X x] = 25 3 10 15 0 3 Fx(x) = [X x] = 25 3

= 0,198

1x<2

10 15 1 2 25 3

= 0,655

2x<3

10 15 + 1 2 25 3

10 15 2 1 + 25 3 x3
Fx(x) = [X x] = = 1,000

= 0,949

51

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

La grfica de Fx(x) est dada por:

Definicin 5.10: Sea X una v.a discreta., entonces se define la funcin de cuanta
masa de probabilidad, como la probabilidad de que la variable aleatoria X tome un valor especfico x, que se simboliza por fx(x) = [X = x] y cumple con las siguientes propiedades: 1. fx(x) = [X = x] 0 ,

x e.

3. fx(x) = [X x] [X x 1] = Fx(x) Fx(x 1) De donde se tiene que la funcin de cuanta toma valores distintos de cero slo para x ex = {0, 1, 2, 3}, y estos son:

10 15 0 3 fx (0) = 25 3 10 15 2 1 fx (2) = 25 3

= 0,198 ; f (1) = x

10 15 1 2 25 3 10 15 3 0 25 3

= 0,457

= 0,293; f (3) = x

= 0,052

52

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Donde la grfica de fx(x) ([X = x]) es:

En el caso de una variable aleatoria continua X, su recorrido ex. es no numerable, y luego [X = x] = 0 x e. Para este caso tenemos la funcin de densidad de probabilidad, definida ms adelante. A modo de ejemplo, consideremos la variable aleatoria X:=Tiempo de espera en la fila de un banco, la cual es claramente una variable aleatoria continua, cuya funcin de densidad es fx(x) hipottica, se destaca en la figura.

Definicin 5.11: Sea X es una v.a. continua, entonces fx(x) es una funcin de densidad de probabilidad (f.d.p.) para X, s fx(x), satisface las propiedades:
1. fx(x) 0,

para casi todo x e.

53

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Un modelo adecuado para fX(x), la funcin de densidad asociada a los tiempos de espera en la fila del banco (en minutos), puede ser: f ( x) = 1 x exp , 45 45 x>0

En primer lugar verificamos que fX(x), es f.d.p. En primer trmino, se puede observar que fX(x) es decreciente con imagen positiva, y verifica que:

1 x exp dx = 1 45 45

Como fX(x) es f.d.p., podemos calcular probabilidades, como por ejemplo: La probabilidad que una persona se demore ms de 45 minutos, en ser atendida, simblicamente [X > 45].

[X > 45] =

45

45

x exp dx = 0,368. 45

5.5

Valor Esperado

Definicin 5.12: Sea X una v.a, entonces, se define el valor esperado de una funcin
real, g(X) de X, como:
g (x) P [ X = x ] x x [g(X)] = g (x) f (x) dx x x El valor esperado de g(X) es un nmero, adems existe un conjunto de funciones g(X) cuyo valor esperado, representa medidas especficas, ya sea de tendencia central, variabilidad forma, etc.

Definicin 5.13: Sea X es una v.a, se define el valor esperado esperanza matemtica de X, como:
x P [X = x] x x [X] = x f (x) dx x x

54

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Propiedades: Sean a y b constantes y X una variable aleatoria, entonces:


1. [a] = a 2. [X] = . = constante. 3. [aX] = a [X] 4. [aX + b] = [aX] + [b] = a [X] + b

Definicin 5.14: La varianza( V(X) ) de una variable aleatoria X, se define como el valor esperado del cuadrado de la diferencia entre la variable aleatoria y su valor esperado, la cual est dada por:
[x - E[X]]2 P [ X = x ] x x V(X)=[(X [X])2] = 2 [x - E[[X]] f (x) dx x x

Notemos que en este caso la funcin cuadrtica es g(X)= (X [X])2, y que mediante operaciones algebraicas se puede descomponer en la diferencia de dos valores esperados, ms fciles de calcular desde el punto de vista del clculo, como se demuestra a continuacin:
[(X [X])2] = [(X [X]) (X [X])] = [X2 2 X [X] + ([X])2]

= [X2] [2 X [X]] + [([X])2] = [X2] [2 X .] + [.2] = [X2] 2 . [X] + .2 = [X2] 2 . . + .2 = [X2] 2 .2 + .2 = [X2] .2 = [X2] ([X])2 donde;

x 2 P [X = x] x x [X2] = 2 x f (x) dx x x
Propiedades: Sean a y b constantes y X una variable aleatoria cualquiera, entonces:

55

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

1. [a] = 0 2. [X] = 52 = constante. 3. [aX] = a2 [X] 4. [aX + b] = [aX] + [b] = a2 [X] + 0 = a2 [X]

APLICACIN 5.16: La funcin de probabilidad de X, el nmero de defectos por cada 10 metros de una tela sinttica en rollos continuos de ancho uniforme, es:
x
X(x)

0 0,41

1 0,37

3 0,05

4 0,01

Cul debe ser el valor de ? En primer lugar 0 , y adems debe verificar que:

x =0

[X = x] = 1

0,41 + 0,37 + + 0,05 + 0,01 = 1,00 = 0,16

La grfica de la funcin de distribucin probabilidad, se presenta en forma escalonada, ocurriendo los saltos en cada uno de los puntos, donde la variable aleatoria tiene probabilidad positiva, como se muestra a continuacin 0, 00 0, 41 0, 78 FX ( x) 0,94 0,99 1, 00 x<0 x <1 x<2 x<3 x<4 x4
1.0 0.8

FX(x)

0.6 0.4 0.2 0.0 -1 0 1 2 3 4

x 5

Tambin es posible realizar el clculo de algunas probabilidades sencillas como las que se muestran a continuacin:
[X > 3] = 0.01 [X > 1 / X < 3] =

0,16 [1 < X < 3] [X = 2] = 0,1702 = = 0,94 [X < 3] [X < 3]

56

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Determinar el valor esperado, varianza y la desviacin estndar de X.


[X] = = 0 0, 41 + 1 0,37 + ... + 4 0, 01 = 0,88 (valor esperado) [X2] = 02 0, 41 + 12 0,37 + ... + 42 0, 01 = 1,62 [X] = 2 = [X2] ([X])2 = 1,62 0,882 = 0,8456

(Variabilidad)

= 0.8456 = 0,91956 (desviacin estndar)


Adems, el costo esperado, si suponemos que el costo por defecto es: 500 G ( X ) = 5000 1500
si x < 2 si x > 2 e.o.c.

[G(X)] = 500 [X < 2] + 5000 [X > 2]+ 500 [X = 2]

= 500 (0,41 + 0,37) + 5000 (0,05+0,01) + 1500 0,16 = 930.

APLICACIN 5.17: Si suponemos que la funcin de densidad del tiempo de vida (horas de operacin), hasta que fallen ciertas mquinas en un proceso productivo es:
80 f (t ) = t 2 0 t 80 e.o.c.

Cul es la probabilidad de que una mquina elegida al azar funcione ms de 120 horas? Sea T:= v.a tiempo de vida de una mquina [horas de operacin], se pide:

[T > 120] = 1 - [T 120] = 1

120 80

80 120 2 80 dt = 1 = t t2 80 3

Tambin es posible determinar probabilidades condicionales, como por ejemplo si se ha observado que cierta mquina lleva funcionando ms 150 horas (condicin), la probabilidad de que falle antes de las 200 horas, est dada por:

57

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

[T < 200 / T 150] =

[150 T < 200]

1 [T 150]
200 150 150

80 dt t2

80

80 dt t2

2 15 8 15

1 4

5.6

Algunos Modelos Comunes en Ingeniera

Los modelos que estudiaremos son frecuentemente utilizados en ingeniera, estn caracterizados por la funcin de masa de probabilidades en el caso discreto, y densidad en el caso continuo.

5.6.1 Modelo Hipergeomtrico


Es un modelo de caracterstica discreta (distribucin), til para poblaciones

finitas.
Supongamos que N es el nmero de elementos de la poblacin, por ejemplo; la produccin de artculos en un da determinado, la cantidad de habitantes de una determinada regin, etc. Adems, supongamos que k, es el numero de elementos de la poblacin que cumplen con cierta cualidad observable (k < N), por ejemplo, la cantidad de defectuosos de la produccin de artculos de ese da, etc. Es posible observar que la poblacin de N elementos ha sido dividida en dos grupos: Aquellos que pertenecen al grupo 1, E1, como los artculos no defectuosos, y aquellos que pertenecen al grupo 2, E2, como los artculos no defectuosos. Si de esta poblacin se toma una muestra aleatoria de n elementos, como se muestra la figura. Entonces la variable aleatoria, X:= Nmero de artculos en la muestra que cumplen con la cualidad (ser defectuoso por ejemplo), puede modelarse por la siguiente funcin de masa de probabilidad:

k N-k a n-a [X = a] = N n

a = 1, 2, ... , min{k, n}

58

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 5.18: Suponga una caja con 25 artculos de los cuales 10 presentan una cualidad especial (ser rojos, defectuosos, etc.), entonces si se toma una muestra de 3 artculos, y se define:
X:= nmero de artculos que presentan esa cualidad especial en la muestra. Claramente en la muestra no puede haber ms artculos con la cualidad especial, que el tamao de la misma. Sin embargo, si en el lote hubiese slo 2 artculos con esa cualidad especial, en la muestra no puede haber ms dos con la cualidad especial. Las distintas alternativas para este caso son:
10 15 0 3 [X = 0] = = 0,198; 25 3 10 15 1 2 [X = 1] = = 0,457 25 3

10 15 10 15 2 1 3 0 [X = 2] = = 0,293 [X = 3] = = 0,052 25 25 3 3 La grfica de Px(x) (P[X = x]) est dada por:

Tambin es posible demostrar que en el caso general trminos la media y varianza son respectivamente:
[X] = = n

k N k k N - n 1 . N N N - 1

[X] = 2 = [X2] ([X])2 = n

59

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 5.19: Considere un fabricante de lanchas que compra motores a una compaa donde se fabrican bajo estrictas normas de especificacin. El fabricante recibe un lote de 40 motores. Su plan de muestreo para aceptar el lote consiste en seleccionar ocho motores al azar y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta el lote, de otra forma lo rechaza. Si el lote contiene dos motores con serios defectos, Cul es la probabilidad de que el lote sea aceptado?
X: El nmero de motores que presentan defectos en la muestra.
2 0 [X = 0] = 40 8

38 8 = 0,6359

Cuntos motores se espera sean defectuosos en la muestra?


[X] = = n

2 k = 0,4 Motores =8 N 40

5.6.2 Modelo Binomial


Esta es una de las distribuciones ms tiles, pues sus reas de aplicacin incluyen: medicina, ventas, investigaciones de mercado, inspecciones de calidad, etc. Consideremos nuevamente una poblacin que cumple con caractersticas dicotmicas, es decir, un grupo de la poblacin cumple con tener la caracterstica y otro no, llmese xito aquel elemento que cumple con la caracterstica, y fracaso el elemento que no cumple. Supongamos adems, que la probabilidad de xito p se mantiene constate en el curso de los ensayos. . Si de esta poblacin se escogen n elementos en forma independiente (sustitucin), y se define la variable aleatoria, X:= Nmero de xitos en estos n ensayos, entonces X sigue un modelo Binomial. La funcin de masa de probabilidades se puede deducir de la siguiente forma: Consideremos el caso particular de que en n ensayos independientes se obtengan a xitos consecutivos en los primeros a ensayos y posteriormente n a fracasos. Como los ensayos son independientes y la probabilidad de xito es constante, la probabilidad en este caso es el siguiente producto:

60

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Extendamos ahora el problema para obtener a xitos en n ensayos sin restriccin. Como se puede apreciar en la figura anterior, esta muestra slo un orden donde se cumple con el requisito a xitos, pero no todos los posibles, ya que los xitos pueden presentarse en distintas combinaciones en los n ensayos. Luego probabilidad de obtener a xitos en n ensayos con el natural requisito de: 0 a n, est dada por: n [X = a] = pa (1 p)n a, a a = 0, 1, 2,.. n

APLICACIN 5.20: Considere nuevamente el fabricante de lanchas. El fabricante recibe un lote de 40 motores. Su plan de muestreo para aceptar el lote consiste en seleccionar ocho motores al azar y someterlos a prueba, si ninguno de los motores presenta serios defectos acepta el lote, de otra forma lo rechaza. Si el lote contiene dos motores con serios defectos, Cul es la probabilidad de 15 lotes muestreados 10 sean aceptados? Consideramos las siguientes situaciones:
X: nmero de lotes aceptados. p: probabilidad que un lote sea aceptado (0,6359 calculado anteriormente), entonces: 15 [X = 10] = 0,635910 (1 0,6359)15 10 = 0,2078 10 El nmero medio esperado de lotes que sern aceptados, que est dado por:
[X] = = n p = 15 0,6359 9,54 lotes aceptados (Interpretar)

Adems se puede determinar que la varianza es:


[X] = 2 = n p (1 p) = 15 0,6359 0,36413,47 (Interpretar)

APLICACIN 5.21: Suponga que el 65% de un particular tipo de ratas, cuando es inyectada con una dosis de estimulante, muestra un comportamiento agresivo. Un experimentador aplica el estimulante a quince ratas, una despus de otra y observa la presencia o ausencia de agresividad en cada uno de los casos. Determine las siguientes probabilidades (bajo el supuesto de independencia entre las probabilidades de agresividad de las ratas).
Exactamente dos ratas agresivas. Sea X:=Nmero de ratas (experimento) que muestra comportamiento agresivo

61

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

15 2 13 [X = 2] = 2 0,65 0,35 = 0,0001 Diez o ms ratas son agresivas.


[X 10] = 1 [X 9] = 1

(0,0000525)

x 0, 65x 0,3515 x
x =0

15

= 1 0,4357 = 0,5643 (Uso de Tablas o calculadoras) Suponga que el experimentador aplic el estimulante a 80 ratas, de las cuales muestre 12. La probabilidad de tener exactamente dos ratas agresivas es: 52 28 2 10 = 0,0003 [Y = 2] = 80 12 En este ltimo ejemplo, se trabaja con el supuesto que de la poblacin, el 65%, debera tener un comportamiento agresivo, de ah el hecho que se espera que existan 52 ratas agresivas de las 80 bajo estudio. Como se habr podido apreciar el modelo binomial es muy parecido al modelo Hipergeomtrico, pues en ambos se miden xitos sobre la base de poblaciones dicotmicas (xito v/s fracaso), sin embargo poseen importantes diferencias, como lo son: En el modelo Hipergeomtrico se tiene una poblacin finita y el muestreo es sin reemplazo. Si en el modelo binomial, el tamao de la poblacin es finito, para mantener la independencia y probabilidad de xito constante, se debe utilizar un muestreo con reemplazo. Si en el modelo binomial, el tamao de la poblacin es infinito (muy grande), slo debemos garantizar probabilidad de xito constante. Las diferencias entre ambos modelos, disminuyen notablemente cuando el tamao de la poblacin (N) es grande, y la relacin entre el tamao de la muestra (n), y el tamao de la poblacin (N) es pequeo. k ). N

En este caso se muestra que: X H(N; k; n) B(n,

62

Universidad Tcnica Federico Santa Mara Ingeniera de Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

En la Tabla 5.4 se observan las probabilidades para una muestra de 10 elementos, donde la poblacin es de 100 elementos, y hay 20 elementos con la caracterstica. Se aprecia la aproximacin de la distribucin Hipergeomtrica por la distribucin binomial.

Tabla 5.4: Probabilidades exactas y aproximadas x Hipergeomtrica Binomial 2 0,3182 0,30199 3 0,2092 0,20133 4 0,0841 0,08808 5 0,0215 0,02642 6 0,0035 0,00551 7 0,0004 0,00079 8 0,0000 0,00007 9 0,0000 0,00000 10 0,0000 0,00000

5.6.3 Modelo Poisson


Otro modelo de distribucin discreta, que se utiliza en una amplia variedad de situaciones, donde se cuenta el nmero de eventos que ocurren aleatoriamente en el tiempo (rea, volumen, etc.) a una tasa constante, es el modelo Poisson. Ejemplos tpicos son: Nmeros de Aviones, Buques, Camiones que llegan a un punto. Nmero de defectos en una lmina de algn metal. Nmero de bacterias en un cultivo. Nmero de rboles daados, etc.

Si se define X:= Nmero de eventos que ocurren por unidad de tiempo (espacio, volumen), entonces se prueba que bajo ciertos supuestos:

[X = a] =

a!

a = 0, 1, 2,....

En este modelo se puede probar que el nmero esperado es [X] = , y la variabilidad en torno al valor medio es [X]= .

APLICACIN 5.22: Suponga que el nmero de defectos en lminas de 1 metro por 2 metros se distribuyen aleatoriamente en las lminas, con una media de 6 defectos por lmina. Cul es la probabilidad de que en una lmina escogida al azar se encuentren ocho defectos?

63

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

X:= Nmero de defectos [Por lmina], luego X c(6)


[X = 8] =

e 6 6 8!

= 0,1033

Se puede verificar que cuando el tamao de una muestra es grande, y la probabilidad que de que cumpla con la caracterstica es pequea, existe una buena aproximacin entre los resultados de modelo binomial con los resultados de un modelo Poisson, tal como se muestra a continuacin: X B(n, p) c(n p). Bajo las idnticas suposiciones se puede apreciar adems la siguiente relacin: X H (N; k; n) B (n, p) c(n p). Considere una poblacin de 100 elementos, donde los elementos que cumplen con una caracterstica son 20 y se toma una muestra de 10 elementos. La aproximacin de la distribucin Hipergeomtrica con la distribucin binomial y con la distribucin Poisson se muestra en la tabla siguiente:

Tabla 5.5: Probabilidades exactas y aproximadas x Hipergeomtrica Binomial Poisson 2 0,3182 0,30199 0,27067 3 0,2092 0,20133 0,18045 4 0,0841 0,08808 0,09022 5 0,0215 0,02642 0,03609 6 0,0035 0,00551 0,01203 7 0,0004 0,00079 0,00344 8 0,0000 0,00007 0,00086 9 0,0000 0,00000 0,00019 10 0,0000 0,00000 0,00004

APLICACIN 5.23: Considere nuevamente el fabricante de lanchas que compra motores a una compaa donde se fabrican bajo estrictas normas de especificacin. El fabricante recibe un lote de 1000 motores. Su plan de muestreo para aceptar el lote consiste en seleccionar 15 motores al azar y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta el lote, de otra forma lo rechaza. Si el lote contiene 40 motores con serios defectos, cul es la probabilidad de el lote sea aceptado?
Si definimos X: Nmero de motores defectuosos en el lote. Se tiene la aproximacin:

64

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

40 960 0 15 exp {-0,60} = 0,5488 [X = 0] = 1000 15

A modo de ejercicio se compara con el resultado de la probabilidad exacta que para este caso particular es coincide con el esquema de la aproximacin binomial.
40 960 0 15 = 0,5397 [X = 0] = 1000 15

5.6.4 Modelo Normal


La distribucin Normal o Gausiana es, sin lugar a dudas, la ms importante y la de mayor uso en los modelos para variables aleatorias continuas. Es la piedra angular en el anlisis de datos, y en la aplicacin de la inferencia estadstica. Ejemplos comunes del uso de este modelo, se encuentran en todas las reas del conocimiento humano, por ejemplo: datos de temperatura, precipitacin pluvial; datos de voltajes, datos de resistencias, errores de medicin, etc. En general es un modelo muy popular, es inicialmente utilizado para representar errores o desviaciones en mediciones fsicas. El modelo Normal es representado por la siguiente funcin de densidad:

f ( x) =

2 1 1 x exp 2 2

; x , , +.

Como se puede observar, la curva presenta una cima o mximo, adems es simtrica con respecto a su valor medio .

Notacin: X N( ; 2) , donde es su valor medio, y es la desviacin.

65

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Si tomamos la transformacin: Z =

, entonces:

Si XN ( ; 2), bajo esta transformacin la variable aleatoria Z, contina siendo normal, con media cero y varianza, es decir Z N(0, 1). La variable aleatoria Z, se denomina normal estndar y se encuentra ampliamente tabulada para el clculo de probabilidades (tablas, calculadoras), la cul mantiene la forma de la normal original centrada en cero.

APLICACIN 5.24: El dimetro de un eje metlico empleado en la unidad de disco de una computadora se supone tiene distribucin normal. La media actual del proceso de fabricacin es de 0,1505 [plg.] y coeficiente de variacin de 0,004. Se han determinado los lmites de especificacin para el dimetro del eje en el intervalo 0,1500 0,0015 [plg.]. Calcule la fraccin de ejes producidos que cumplen con las especificaciones.
X: Dimetro de un eje metlico [en plg.] X N (0,1505, 2); CV = 0,004 = 0,004 = 0,00602

0,1485 0,1505 [X < 0,1485] = Z = [Z 3,32] = 0,0005 0,000602 0,1515 0,1505 [X < 0,1515] = Z = [Z 1,66] = 0,9515 0,000602 La fraccin de ejes producidos que cumplen con las especificaciones es 95,1%.

66

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 5.25: Las bandas de plstico que se utilizan en un dispositivo electrnico para deteccin, se fabrican de manera que satisfagan una especificacin de valor mximo de 305,28 mm. y una especificacin mnima de 304,55 mm. Si la dimensin de las bandas es menor que la especificacin mnima, se desechan, si son ms grandes, se reelaboran. Se ha probado que las dimensiones de estas piezas estn distribuidas normalmente con una desviacin estndar de 0,25 mm. y que slo el 5% de las bandas se desechan. Cul es el tamao medio de las bandas de plstico?
Sea X:= Dimensin de las bandas de plstico [en mm.]
[X < 304,55] = 0,05

X N ( x , (0,25)2)

304,55 x Z = 0,05 0,25

304,55 x = 1,645 0,25

x = 304,96 [mm]

Qu porcentaje de bandas se reelabora? 305,28 304,96 [X > 305,28] = Z 0,25 = 1 [Z 1,28] = 0,1003

Luego el porcentaje de bandas se reelabora es de 10,03%. Si se toma una muestra de 24 bandas. Cul es la probabilidad de que no menos de 22 cumplan con las especificaciones, sin necesidad de reelaboradas? Sea Y:= Nmero de bandas encontradas que cumplen con las especificaciones.

Y B (24, p)

p = 1 0,05 0,1003 = 0,8497 0,85

[ Y 22] = 1 [Y 21] = 0,2798

Luego la probabilidad de que no menos de 22 cumplan con las especificaciones es de 27,98%. Cul es la probabilidad de que no menos de 5 sean reelaboradas? Sea Y:= Nmero de bandas encontradas que son reelaboradas. Y B (24, p) p = 0,1003 0,10

[ Y 5] = 0,9723

Luego la probabilidad de que no menos de 5 cumplan con ser reelaboradas es de 97,23%.

67

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

.6.5

Modelo Gamma y Exponencial

La distribucin Gamma es un modelo muy popular en ingeniera, por ejemplo: Teora de colas lneas de espera, Confiabilidad, Hidrologa, Energa Elica, etc. Se presenta en mltiples formas, desde distribuciones totalmente asimtricas positivas hasta distribuciones completamente simtricas, sin contemplar asimetras negativas, dependiendo de dos parmetros: , denominado parmetro de escala; y , denominado parmetro de forma. Su funcin de densidad es:

x 1 f(x) = exp{x} ; x + , + , +. ( )

1/2 1/2 1/2 1/2 1/2

3/2 1/2 1 4 6

Como casos particulares; cuando el parmetro de forma: = 1, se le llama distribucin exponencial de parmetro ; cuando es un nmero natural arbitrio se le llama distribucin Erlang. En el caso de la distribucin exponencial, el clculo de probabilidades es sencillo al poder determinar su funcin de distribucin de forma explicita, es decir:

f(x) = exp{ x}
entonces, para x > 0

; x + , + FX(x) =

exp{ t}dt = 1 exp{ x}


0

68

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

La funcin de distribucin de la exponencial permite el clculo de todos los cuantiles de esta distribucin, mediante el despeje de la funcin de distribucin, es decir: Pj FX(j/100) 1 exp{ P j } = j/100 Pj

j ln 1 100
1

APLICACIN 5.26: Una empresa de comida que abastece a los vuelos del Aeropuerto de Santiago de Chile. El Ingeniero en Calidad de Servicio se encuentra altamente preocupado, por la cantidad de reclamos que ha recibido la empresa en los tiempos de entrega de los productos, que afectan directamente la calidad de ste. Los tiempos de conservacin de cada producto son bien modelados por una distribucin exponencial, con un tiempo medio de conservacin de das. Cul es la probabilidad que un producto tenga un tiempo de conservacin superior a su tiempo medio esperado?
T : Tiempo de conservacin del producto [en das] 1 T exp [T] = das 1 [T > ] = exp = exp { 1} = 0,3679

(SIEMPRE)

Si la probabilidad de que un producto tenga un tiempo de conservacin mayor que 20 das es de 0,445. Cul es el tiempo medio de conservacin de los alimentos?
[T > 20] = 0,445

1 exp 20 = 0,445

20 24,70 ln(0, 445)

5.6.6 Modelo Weibull y Exponencial


La distribucin Weibull popularizada por el fsico del mismo nombre, adquiere particular importancia en modelos relacionados con Tiempos de vida, Velocidad del viento, Confiabilidad, etc. La funcin de densidad f(x), depende de dos parmetros: , denominado parmetro de escala; y , denominado parmetro de forma, y est dada por:

f(x) = x 1 exp{(x) }

; x + , + , +.

69

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

La distribucin muestra caractersticas un modales cuando el parmetro de forma es mayor que 1, y a medida que ste crece para un parmetro de escala fijo, la distribucin es ms simtrica.

1/2 1/2 1/2 1/2 1/2

1/5 1/2 2 4 6

Observacin: Cuando el parmetro =1, se recupera el modelo exponencial.


En el caso de la distribucin Weibull, el clculo de probabilidades es sencillo al poder determinar su funcin de distribucin de forma explicita, es decir: para x > 0 FX(x) =

exp{ (t ) }dt = 1 exp{ ( x) }

La funcin de distribucin de la exponencial permite el clculo de todos los cuantiles de esta distribucin, mediante el despeje de la funcin de distribucin, es decir: Pj FX(j/100) 1 exp{ ( P j ) } = j/100 1 j Pj ln 1 100
1/

70

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

6. CUARTO MDULO
6.1 Inferencia Estadstica
En Inferencia clsica y Teora de decisiones, las observaciones son postuladas tomando valores en forma aleatoria, la ley distribucin de la(s) variable(s) aleatoria(s) observable(s), P, se asume pertenece a una familia paramtrica conocida en su forma general, pero no se conoce el(los) valor(es) de parmetro(s). Un objetivo fundamental de la inferencia estadstica, es determinar valor(es) factibles de parmetro(s) a partir de los datos. La utilidad de los datos, generados a partir de muestras probabilsticas, es inferir caractersticas esenciales, de la distribucin de la muestra a la poblacin Una de las reas asociadas a la inferencia estadstica, es la estimacin de parmetros, para introducirnos en el tema se requieren algunas definiciones.

Definicin 6.1Parmetro. Es una caracterstica numrica de la distribucin de la poblacin, que describe, parcial o completamente, la funcin de masa de probabilidad de la caracterstica de inters, habitualmente se simboliza por la letra griega . Definicin 6.2Espacio Paramtrico. Es el conjunto de posibles valores que puede(n) ser considerado(s) para el(los) parmetro(s). Se simboliza por la letra griega mayscula .
La Figura 6.1, se muestra esquemticamente el problema de estimacin.

Figura 6.1

El problema de estimacin.

Los posibles valores de la muestra aleatoria constituyen el espacio de informacin, y utilizando algn resumen apropiado (Estadstica), construimos un estimador de(l) parmetro(s) asociado(s) a la familia de distribucin supuesta.

71

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Distinguimos dos mtodos en la estimacin de parmetros: el primero conocido como estimacin puntual, trata de especificar un valor numrico para el (los) parmetro(s) que se desea estimar; el segundo, que entrega un conjunto de posibles valores asociados al parmetro como se muestra en la Figura 6.1. La estimacin puntual de parmetros es, habitualmente, un primer paso para la utilizacin de estos estimadores en la construccin de intervalos de posibles valores asociados al verdadero valor del parmetro.

6.2

Mtodo de Momentos

Es quizs el mtodo ms antiguo (al igual que mtodo de mnimos cuadrados) para la estimacin puntual de parmetros, consiste en igualar los momentos apropiados de la distribucin de la poblacin con los correspondientes momentos mustrales. Este mtodo conduce a que existan, tantas ecuaciones como parmetros se deseen estimar de la poblacin.

Definicin 6.3Momentos muestrales. Sean X1, X2, , Xn, una muestra aleatoria con una funcin de masa de probabilidad f(x; ). Entonces el r-psimo momento muestral en torno a cero se define por:
1 Mr = n

X
i =1

r i

donde se puede observar, que para el caso de r = 1, se obtiene la media muestral, mientras que para los casos de r = 2, 3, 4, se obstinen indicadores que ayudan al clculo de medidas de variabilidad y forma respectivamente.

Definicin 6.4 Momentos Poblacionales. Sean X1, X2, , Xn, una muestra aleatoria (variables independientes con idntica distribucin) con una funcin de probabilidad f(x; ). Entonces el r-simo momento poblacional en torno a cero se define por:

r = [Xr]
donde se puede observar, que para el caso de r = 1, se obtiene la media , mientras que para los casos de r = 2, 3, 4, se obstinen indicadores que ayudan al clculo de medidas de variabilidad y forma poblacionales.

APLICACIN 6.1 Sea X1, X2,..., Xn una muestra aleatoria de tamao n de una poblacin la cual se supone tiene funcin de cuanta de probabilidad dada por:
[X = x] = p x (1 p )1 x

x = 0,1.

72

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Entonces el estimador de momentos p , de p, consiste en igualar el primer momento muestral al primer momento poblacional, es decir:
[X] = 1 p +0 (1 p) = p = 1

1 = M1

p = X.

APLICACIN 6.2 Sea X1,..., Xn una muestra aleatoria de tamao 100 de una poblacin la cual se supone tiene funcin de densidad de probabilidades:
1 x exp f (x) = 0

x > 0 , > 0 e.o.c.

Entonces determinar el estimador de momentos , de , consiste en igualar el primer momento muestral al primer momento poblacional, es decir:

[X] =

x exp dx = = 1
x

1 = M1
~

= X

6.3

Mtodos de Mxima Verosimilitud

Es uno de los mtodos ms empleados para obtener estimadores puntuales, selecciona como estimador el valor(es) del parmetro(s) que tiene(n) la propiedad de maximizar la probabilidad de lo observado en la muestra aleatoria. El mtodo de mxima verosimilitud consiste en encontrar el valor(es) del parmetro(s) que maximiza la funcin de masa (densidad) de probabilidad conjunta de la muestra, llamada verosimilitud.

Definicin 6.5Funcin de verosimilitud. Sean X1,, Xn, una muestra aleatoria con una funcin de masa (densidad) de probabilidad f(x; ), y sea L( ; X1, X2, , Xn) la verosimilitud de la muestra como funcin de , la cul se representa por:

L( ; x) = L( ; X1, X2, , Xn) = f(x1; ) f(x2; ) f(xn; )


(x ,, x ), que maximiza L( ; x). El mtodo de mxima verosimilitud busca 1 n Para obtener estimadores mximo verosmiles se utilizan las herramientas de clculo
73

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

matemtico, que para simplificar lo clculos utilizan el logaritmo de verosimilitud, llamada funcin de log verosimilitud, representada por:

l( ; x) = ln (L( ; x)).
APLICACIN 6.3 Sea X1,..., Xn una muestra aleatoria de tamao n de una poblacin la cual se supone tiene funcin de densidad de probabilidades:
1 x exp f (x) = 4 4 0
x > 0 , > 4 e.o.c.

Utilizando herramientas de clculo diferencial a la funcin l( ; x), se obtiene , de . estimador mximo verosmil
n 1 1 n l(, x) = nln x ln I + ( xi ) + i 4 i =1 i =1 4

l(, x)

=0

1 n + ( 4 ) ( 4 ) 2

x
i =1

=0

= X +4

es: Para verificar que es un mximo local, la segunda derivada evaluada en


2 l(,x) 2
=X

4)

(
n

4)

x
i =1

n ( 4 ) 2 xi

4)

i =1

; ( 4 ) > 0 > 4
3

n ( 4 ) 2 xi = nX 2nX= nX < 0.
i =1

= X +4 MV , x ) es un mximo local, y tambin se prueba que es mximo global. Luego l( MV

74

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

6.4

Estimacin por Intervalo

La estimacin puntual de un parmetro poblacional adolece del siguiente defecto: La probabilidad de que el estimador coincida con el verdadero valor del parmetro es muy pequea y en el caso continuo nula. Los intervalos de confianza resuelven este inconveniente, ofrecindonos un rango para los posibles valores del parmetro poblacional.

Definicin 6.6 Sea X1, X2,..., Xn una muestra aleatoria desde f(x; ), donde f(x; ) es una funcin de masa (densidad) de probabilidades dependiendo de un parmetro desconocido . Sean T1 y T2 dos estadsticos tales que T1(x) < T2(x), para casi todo x y P(T1 T2) = , donde no depende de . Se dice que [T1 , T2 ] es un intervalo de confianza para con 100 % de confianza. Observaciones:

1.- T1 y T2 reciben el nombre de cota inferior y superior de confianza. 2.- recibe el nombre de coeficiente de confianza. 3.- [T1 , T2 ] es un intervalo aleatorio, ya que sus extremos son aletorios.

Definicin 6.7 En las mismas condiciones de la definicin 6.10. Sea T1 un estadstico que cumple con P (T1 ) = . Se dice que T1 es un limite inferior de confianza para con 100 % de confianza. Definicin 6.8 En las mismas condiciones de la definicin 6.10. Sea T2 un estadstico que cumple con y P (T2 ) = . Se dice que T2 es un limite superior de confianza para con 100 % de confianza.
Existen tcnicas para construir intervalos (regiones) de confianza, y una de ellas es la del pivote que pasamos a presentar.
Cantidad Pivotal

Sea X1, X2,..., Xn una m.a. (n) desde f(x; ) y Q = Q(X1,..., Xn). Si la distribucin de Q es independiente de , se dice que Q es una Cantidad Pivotal.

APLICACIN 6.4: Sea X1, X2,..., Xn una m.a.(n) desde familia Normal (N( ; 2)
con media y varianza conocida 2, luego
2

Q= X

Q N (0,

Q es cantidad pivotal.

75

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

6.4.1 Intervalo de Confianza para la Media Poblacional


Sea X1, X2,..., Xn una m.a.(n) desde una distribucin Normal (N( ; 2), como X es el mejor estimador de , entonces si se conoce 2, se tiene que:

Z=

(X - ) n

N (0, 1)

Z es pivote

Luego dado , se requiere determinar los valores ms apropiados de q1 y q2 que cumplan con:
[q1

(X - ) n

q2] =

Como se puede observar de las grficas existen muchos (infinitos) valores de q1 y q2 que satisfacen lo anterior, sin embargo, se puede probar que si se desea minimizar la longitud del intervalo de confianza, los valores de q1 y q2 deben ser aquellos que produzcan igualdad de probabilidades en las colas, es decir:

q2 = Z 1

+ 2

y q1 = - q2

Luego si tomamos = 1 , se tiene:


[Z / 2

(X - ) n

Z1 / 2 ] = 1-

76

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Pero como Z / 2 = Z1 / 2
[ X Z1 / 2

X + Z1 / 2

] = 1-

Con lo anterior se concluye que el intervalo del (1- )% de confianza para la media poblacional est dado por: IC ( ):= [ X Z1 / 2

Si se tiene una m.a.(n) X1, X2, ... , Xn tal que Xi N( , 2), con varianza poblacional 2 desconocida, como sabemos S2 es el mejor estimador de 2 , luego se tiene que: T=

(X - ) n t-Student (n 1) T es cantidad pivotal. s

Anlogo al caso anterior, dado (coeficiente de confianza), para determinar los valores de q1 y q2 que minimicen la longitud del intervalo de confianza, se escogen con igualdad de probabilidades en las colas, es decir:
[q1

(X - ) n q2] = s

q1 = t / (n 1) = t1 / (n 1) 2 2 q2 = t1 / (n 1) 2

Se tiene que:
[ X t1 / 2 (n 1)
s n

X + t1 / 2 (n 1)

s ] = 1- n

77

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Luego el intervalo de confianza del (1- )% para la media poblacional es: IC ( ):= [ X t1 / 2 (n 1)
s ] n

Si el tamao de la muestra es grande (mayor que 50), utilizando Teorema del Limite Central, el intervalo de confianza toma de la siguiente forma: IC ( ):= [ X Z1 / 2
s ] n

Notemos que es importante distinguir cuando la varianza poblacional es conocida o desconocida. Si a partir de la muestra aleatoria se determine una varianza, sta es la muestral, por lo tanto lo correcto es utilizar un intervalo de confianza considerando la distribucin t - Student, si el tamao de la muestra es superior a 40, entonces empleamos el T.L.C. para aproximar por distribucin Normal.

6.4.2 Intervalos de Confianza para una Proporcin Poblacional


una m.a. (n) desde distribucin Binomial (B(1, p)).El = X . La distribucin de P = X , estimador de p sobre la base de la muestra es P para muestras grandes (empleando el T.L.C), se puede aproximar por: N P; P(1 P) P n
Nota: Es una aproximacin til pero no completamente satisfactoria, debe utilizarse con algunas recomendaciones entregadas en clases.

Sea X1, X2,..., Xn

Un inconveniente de sta aproximacin para la construccin de intervalos de confianza, es que la varianza del estimador depende del parmetro a estimar, lo cual no permite un despeje sencillo, por lo que se decide estimar la varianza con los datos, con lo cul se tiene una doble aproximacin: P) P(1 N P P; n Con esta aproximacin se obtiene la siguiente cantidad pivotal:

Z=

- p) (P N (0,1) (1 - P ) P n

Z es cantidad pivotal

78

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Luego dado (1- ), los valores de q1 y q2 que minimizan la longitud del intervalo son, como se observ anteriormente: (1 - P ) P Z [ P 1 /2 n

+Z P 1 /2

(1 - P ) P ]= n

Luego el intervalo de confianza, del % para la proporcin poblacional es:


Z IC (p):= [ P 1 /2

(1 - P ) P ] n

Se puede apreciar que los intervalos de confianza anteriores estn compuestos por un estimador puntual, ms menos cantidad, esta cantidad recibe el nombre de, error de estimacin, que resultara til para la determinacin de tamaos de muestra.

6.4.3 Intervalos de Confianza para la Varianza Poblacional


Como se habr observado en intervalos de confianza para la media, existen dos situaciones, dependiendo si la varianza poblacional conocida desconocida, siendo obviamente este ltimo el caso ms comn. Sea X1, X2,..., Xn una m.a. (n) desde una distribucin Normal (N( , 2)), existen dos posibilidades para la estimacin de la varianza , la primera cuando la media poblacional es conocida (caso extrao) y el segundo cuando la media poblacional es desconocida. Ambas cantidades pivotales se expresan respectivamente por:
n Sn
2

2 2

(n)

2 (n) Chi-cuadrado con n grados de libertad (g.l.)

(n - 1) S n - 1

(n 1)
n

2 (n 1) Chi-cuadrado con n 1 g. l.
2

donde:

2 Sn

=1
i

(X i ) n

2 Sn -1

=1
i

( X i X) n -1

Como se puede apreciar de las grficas, la distribucin Chi-cuadrado no tiene la propiedad de simetra, por lo que tomar igualdad de probabilidades en las colas no conduce a intervalos de longitud mnima, sin embargo son una buena aproximacin cuando la muestra es grande.
79

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Considerando la cantidad pivotal para el caso ms realista, es decir, se desconoce la media poblacional, se obtiene:
[ / 2 (n 1)
2 (n 1) [ / 2 2 (n - 1) S n 1
2

(n - 1) S n - 1

1 - / 2 (n 1)] = 1

2 1 - / 2 ( n 1) 2 (n - 1) S n 1

]=1

2 (n - 1) S n 1 2 1 - / 2 ( n 1)

2 (n - 1) S n 1 2 / 2 ( n 1)

]=1

Luego el intervalo del (1- )% de confianza para la varianza poblacional est dado por: IC( ):= [
2 2 (n - 1) S n 1 2 1 - / 2 ( n 1)

2 (n - 1) S n 1 2 / 2 ( n 1)

80

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 6.5: Entradas y Salidas de efectivo de un negocio. Las entradas (x) y salidas (y) semanales de efectivo de un negocio [en UF] son variables aleatorias. Los siguientes datos proporcionan los valores de x e y durante 28 semanas. Suponga que x e y estn normalmente distribuidas.
x y x y x y x y

42 65 76 92 37 47 27

25 37 83 36 73 23 97

23 63 40 70 82 90 68

36 70 51 39 36 82 30

82 28 61 75 83 60 93

72 39 27 38 27 78 20

86 68 53 87 63 47 52

68 72 60 65 80 62 36

Definir las variables asociadas al problema, es siempre el primer paso en el desarrollo de todo problema. X:=Entradas semanales en efectivo del negocio [UF] Y:= Salidas semanales en efectivo del negocio [UF] Datos:
x = 62,86 y = 52,21
2 X N ( x , x )

Y N ( y , 2 y) nx = 28 ny = 28

sx = 20,75 sy = 22,45

Determinar intervalos del 95% de confianza para los parmetros. I95%C ( x )= [ X t1 / 2 (nx 1) Sx nx ] I95%C(.x) : [54,81 ; 70,90]

Interpretacin: Con un 95% de confianza las entradas medias reales del negocio se encuentra entre los lmites 54,81 [UF] y 70,90 [UF].

I95%C ( y ) = [ Y t1 / 2 (ny 1)

Sy ny

I95%C (.y) = [43,51; 60,92]

Interpretacin: Con un 95% de confianza las salidas medias reales del negocio se encuentra entre los lmites 43,51 [UF] y 60,92 [UF].
2 (n x - 1) S x 2 (n x - 1) S x 2 / 2 (n x

I95%C

2 (x )

=[

2 1 - / 2 (n x

1)

1)

2 ] I95%C ( x ) :[269,17 ; 797,90]

Interpretacin: Con un 95% de confianza las varianzas de las entradas medias reales del negocio se encuentra entre los limites 269,17[UF]2 y 797,90 [UF]2.
81

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica
2 (n y - 1) S y 2 (n y - 1) S y 2 / 2 (n y

Renato Allende Olivares Humberto Villalobos Torres

I95%C

(2 y)

=[

2 1 - / 2 (n y

1)

1)

] I95%C ( 2 y ) : [315,14 ; 934,16]

Interpretacin: Con un 95% de confianza las varianzas de las entradas medias reales del negocio se encuentra entre los limites 315,144 [UF]2 y 934,16 [UF]2.

Determine mediante un intervalo del 90% de confianza la verdadera proporcin de semanas donde se obtuvo prdida. X: = N de semanas donde se obtuvo prdida.

X B (28, p) N (p, p(1 p) ) p 28


x y 68 72 60 65 80 62 36 9 10 11 = 12 12 p 86 68 53 87 63 47 52

x 42 65 76 92 37 47 27

y 25 37 83 36 73 23 97

x 23 63 40 70 82 90 68

y 36 70 51 39 36 82 30 4 5 6

x 82 28 61 75 83 60 93

y 72 39 27 38 27 78 20 7

1 2 3

28

Z I90%C (p) = [ P 1 /2

(1 - P ) P ] n

I90%C(p) = [27,47% ; 58,24%]

Interpretacin: Con un 90% de confianza la verdadera proporcin de semanas donde el negocio tiene prdida se encuentra entre los lmites 27,47% y 58,24%.

Determine el nivel de confianza con el que se podra afirmar que la proporcin de semanas donde hubo prdidas se encuentra entre los lmites 27,86% y 57,86%.
+Z Notemos que LS LI = P 1 /2

(1 - P ) P Z (P 1 /2 n (1 - P ) P n 12 28 2 0.57 0.43 1

(1 - P ) P ) n

0.58 0.28 = 2 Z1 / 2

Z1 / 2 = (0.58 0.28) Z1 / 2 = 1.603

1 = (0.9452 + 0.9458) 2 2
! = 0,1090

# = 89,10%
82

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Interpretacin: Con un 89,10% de confianza la verdadera proporcin de semanas donde el negocio tiene prdidas se encuentra entre los lmites 27,86 % y 57,86%.

APLICACIN 6.6: El especialista de mercadeo. Un especialista en mercadeo de cierta universidad, asegura que la proporcin de hombres que utiliza una tarjeta de crdito para hacer compras superiores a US$10 es inferior a la proporcin de mujeres que realiza este mismo tipo de pago. Como parte de un proyecto, el especialista, encuesta en un centro comercial local a 50 hombres y 100 mujeres respecto a sus hbitos de compra. De los hombres, 39 dijeron que haban utilizado este tipo de pago en el ltimo mes, mientras que 84 mujeres admitieron hacer este mismo tipo de pago.
X1 = N de mujeres que utiliza la tarjeta de crdito en compras superiores a US$10. X2= N de hombres que utiliza la tarjeta de crdito en compras superiores a US$10. Supuestos: X1 B (100, p1) X2 B (50, p2)

(1 p 1) p 1 N (p1, 1 p ) 100 2 N (p2, p 2 (1 p 2) p ) 50

1 = 0,84 p 2 = 0,78 p

Intervalos del 90% de confianza para la proporcin de mujeres, como para la de hombres que utiliza el medio de pago en cuestin son:. Z I90%C (p) = [ P i 1 /2
2

I90%C (p1) : [76,81% ; 91,19%] (1 - P ) P i i ]= n I90%C (p2) : [66,52% ; 89,48%]

Interpretacin: Con un 90% de confianza se puede decir que la verdadera proporcin de mujeres que utiliza una tarjeta de crdito para hacer compras superiores a US$10 se encuentra entre los limites 76,81% y 91,19%, mientras que la verdadera proporcin de hombres que utiliza una tarjeta de crdito para hacer compras superiores a US$10 se encuentra entre los limites 66,52% y 89,48%.

Determine un intervalo del 95% de confianza para la verdadera proporcin de personas que no utiliza una tarjeta de crdito para hacer compras superiores a US$10. X3:=N de personas que no usa la tarjeta de crdito en compras superiores a US$10. X3 B (150, p3)
Z I95%C (p) = [ P 1 /2

3 N (p3, p
(1 - P ) P ] n

3 (1 p 3) p ) 150

3 = 0,18 p

I95%C(p3) : [12,84% ; 23,16%]

83

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Interpretacin: Con un 95% de confianza, se puede decir que la verdadera proporcin personas que no utiliza una tarjeta de crdito para hacer compras superiores a US$10 se encuentra contenida entre los lmites 12,84% y 23,16%.

Determine el tamao de muestra necesario para que el error de estimacin en la verdadera proporcin personas que no utiliza una tarjeta de crdito para hacer compras superiores a US$10 no sea superior a 5% con un 95% de confianza.
(1 - P ) P < 0,05 n 0,18 (1 0,18) Z0,975 2 < 0,05 n

Z1 / 2

Error de Estimacin n>


2 Z0,975 0,18 (1 0,18)

( 0, 05 )2

227

Interpretacin: El tamao de muestra necesario, para que con un 95% de confianza, el error de estimacin de la proporcin personas que no utiliza una tarjeta de crdito para hacer compras superiores a US$10 no sea mayor a 5%, es de al menos 227 personas.

Determine con un 96% de confianza, el tamao de muestra necesario para que la amplitud del intervalo para la proporcin personas que no utiliza una tarjeta de crdito en compras superiores a US$10 no sea mayor al 8%.
(1 - P ) P < 0,08 n

LS LI = 2 Z1 / 2

0,18 (1 0,18) < 0,08 2 Z0,98 2 n

n>

2 4 Z0,975 0,18 (1 0,18)

( 0, 08)2

390

Interpretacin: El tamao de muestra necesario, para que la amplitud del intervalo de la proporcin de personas que no utiliza una tarjeta de crdito en compras superiores a US$10 no sea mayor a 8%, es de un mnimo de 390 personas, con un 96% de confianza.

84

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 6.7: La decisin: AT&T Sprint. Un contador de una corporacin en los Estados Unidos, debe decidir si seleccionar a AT&T Sprint para manejar su servicio telefnico de llamadas a larga distancia de la empresa, El contador seleccion una muestra al azar de las llamadas realizadas en cada una de las compaas reportando la siguiente informacin:
AT&T 145 US$ 4.07 US$ 0.97 Sprint 102 US$ 3.89 US$ 0.85

Nmero de llamadas Costo promedio Desviacin estndar

X = Costo de llamadas a larga distancia en la compaa AT&T. Y =: Costo de llamadas a larga distancia en la compaa Sprint. Supuestos: Datos:
2 X N ( x , x )

Y N ( y , 2 y) s x = 0,97 [US$] s y = 0,85 [US$] nx = 145 n y = 102

x = 4,07 [US$]

y = 3,89 [US$]

GRANDES

Determine intervalos del 96% de confianza, para medias de las variables definidas. s I96%C ( x ) = x Z1 / 2 x nx I96%C( x ) = [3,90 ; 4,42]

Interpretacin: Con un 96% de confianza, el verdadero costo medio de llamadas a larga distancia en la compaa AT&T se encuentra entre los limites 3,90 [US$] y 4,42 [US$].
sy I96%C ( y ) : y Z1 / 2 ny

I96%C( y ) = [3,72 ; 4,31]

Interpretacin: Con un 96% de confianza, el verdadero costo medio de llamadas a larga distancia con la compaa Sprint se encuentra entre los limites 3,72 [US$] y 4,31 [US$].

85

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

7. QUINTO MDULO
7.1 Introduccin a Confiabilidad de Sistemas
En el mbito industrial, se considera que los productos son de alta calidad si cumplen con sus especificaciones de diseo y con la preferencia del consumidor. Sin embargo, pueden fallar en poco tiempo, por degradacin del producto o por alguna saturacin o colapso instantneo. Se dice que un sistema, proceso o componente es confiable si contina funcionando segn las especificaciones durante un amplio perodo de tiempo. En nuestro mbito, la confiabilidad de un equipo, producto o sistema es la probabilidad de que cumpla segn las especificaciones de uso determinadas, por lo menos un perodo de tiempo determinado, en otras palabras, permanencia de la calidad de los productos o sistemas a lo largo del tiempo. El trmino buena calidad de un producto significa que ste cumple con las especificaciones de diseo establecidas; la diferencia entre calidad y confiabilidad es que la calidad garantiza que el producto sale de fbrica en buenas condiciones. La confiabilidad garantiza que el producto permanezca en buenas condiciones durante un perodo razonable de tiempo. Pero evidentemente, la calidad de un producto contribuye a la confiabilidad del mismo. Por tanto, la calidad carece de la dependencia temporal y esta dependencia introduce una incertidumbre, para lo cual la definicin de confiabilidad incorpora esta aleatoriedad, es decir, saber si un producto funciona a lo largo de un perodo de tiempo es una cuestin de probabilidad. El anlisis de confiabilidad es el estudio de fallos de un sistema, equipo o componente a travs de herramientas estadsticas; el rol que cumple la teora estadstica de confiabilidad es desarrollar mtodos para estimar las caractersticas de las distribuciones de vida a partir de tiempos de falla. Al realizar un estudio de confiabilidad a un equipo o sistema, obtenemos informacin valiosa acerca de la condicin del mismo, por ejemplo, probabilidad de falla, tiempo promedio hasta su falla y etapa de vida en que se encuentra el equipo. Se hace una distincin entre la confiabilidad de los sistemas que no se pueden reparar y aquella de los que si es posible reparar. Un componente que se puede reparar despus de fallar, pasa por un periodo de reparacin y a continuacin vuelve a fallar normalmente. La disponibilidad de un componente se entender por la probabilidad de que est activo y funcionando en ese instante de tiempo requerido. Por esta razn, para aumentar la disponibilidad de los sistemas cuyos componentes son susceptibles de reparar se preparan procedimientos de mantenimiento, que deben evitar las fallas de un sistema, ya sea; reemplazando peridicamente sus partes criticas, afinndolas, limpindolas, etc. segn sea necesario.

86

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

La aplicacin del concepto confiabilidad en la actividad humana, es una realidad inmemorial, sin embargo desde un punto de vista de ingeniera se constituye como un nuevo factor de inters desde la revolucin industrial en la fabricacin de un producto, aunque su mayor auge lo logra a partir de la Segunda Guerra Mundial, por la necesidad urgente de la fabricacin de instrumentos blicos de alta durabilidad en optimo desempeo. Valores numricos en confiabilidad comenzaron a aparecer, por ejemplo en contratos donde se exiga cierto grado de confiabilidad al producto o servicio transado, castigando con multas el no cumplimiento. La industria energtica (suministro de energa elctrica) utiliza estimaciones de confiabilidad para determinar costos de suministro y disponibilidad de ellos para los consumidores. La disponibilidad para un consumidor en particular, por ejemplo en los aos ochenta, se puede expresar en un promedio de treinta minutos perdidos por ao de consumo, claro est que hoy en da las compaas elctricas de distribucin deben compensar por la ocurrencia de fallas no programadas debiendo pagar a los consumidores las consecuencias de sta, ya sea en descuentos en tarifas por el tiempo de falla, o reparacin de artefactos que se hayan inutilizados producto de sta falla. La necesidad de conocer la confiabilidad de un sistema exige que sta sea medible, para as poder desarrollar mtodos o tcnicas que puedan caracterizar las variables que influyen de mayor o menor forma en la confiabilidad del sistema. La aleatoriedad de las variables medibles involucradas en describir caractersticas de un sistema relacionado con su confiabilidad exige una base estadstica y probabilstica fundamental para la teora de anlisis de confiabilidad. ndices bsicos en categoras de tiempo, desempean un papel importante en la teora de confiabilidad, disponibilidad y facilidad de mantenimiento de los sistemas, por ejemplo, categoras de tiempo relacionadas con el uso son: Tiempo de Operacin, que es el intervalo durante el cual el sistema est realmente funcionando; Tiempo de Operacin Programado, que es el intervalo durante el cual se requiere que el sistema trabaje bien; Tiempo Libre, que es el intervalo durante el cual se programa el sistema para que est inactivo; Tiempo de Almacenamiento, que es el intervalo durante el cual el sistema se almacena como refaccin. Adems existen las categoras de tiempo relacionadas con la condicin del equipo, como: Tiempo dentro, que es el intervalo durante el cual el sistema est trabajando o listo para trabajar; Tiempo Fuera, que es el intervalo durante el tiempo programado de operacin, en el cual el sistema est en estado de falla. El tiempo fuera es la suma de: tiempo administrativo, tiempo de reparacin activa, y tiempo logstico (suspensin de la reparacin por falta de refacciones). Estas clasificaciones de tiempos, generan los ndices:

87

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

1. Tiempo Programado de Operacin = Tiempo de Operacin + Tiempo de Falla 2. Disponibilidad Intrnseca = 3. Disponibilidad = 4. Disponibilidad Operativa = Tiempo de Operacin Tiempo de Operacin + Tiempo de Repar. Activa Tiempo de Operacin Tiempo de Operacin + Tiempo Fuera Tiempo Dentro
Tiempo Total

Las fallas en un sistema se presentan habitualmente debido a la combinacin entre la causa de falla, intensidad y periocidad de sta y mediante distintas formas de presentarse, tal vez las ms comunes son las que se muestran a continuacin.

Causas de Falla.
a. Desgaste: b. Debilidad: El fallo se produce por cansancio despus de soportar adecuadamente las fuerzas aplicadas. El fallo se produce por debilidad del producto con relacin a las fuerzas aplicadas.

Modo de Presentarse.
a. Gradual: b. Repentino: El fallo puede ser previsto con anterioridad. El fallo no puede ser previsto con anterioridad.

Intensidad.
a. Parcial: b. Completo: El producto puede continuar el servicio, aunque en forma imperfecta. El producto cesa en sus funciones totalmente.

Modo de Presentarse la Intensidad.


a. Degradacin: b. Catastrfico: Fallo, a la vez gradual y parcial. Fallo, a la vez repentino y completo.

Perodo.
a. Infantil: b. Accidental: c. Senil: Debilidad prematura, en rodaje. Repentino y aleatorio, en cualquier perodo de tiempo. Agotamiento general, vejez

88

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

7.2

Clculo de la Confiabilidad
La confiabilidad de un sistema, sea simple o compuesto, en el tiempo t, Simbolizada por e(t), est definida como e(t) = [T > t], donde T es la duracin del sistema y e(t) se denomina funcin de confiabilidad.

Definicin 1:

Definicin 2:

La tasa de falla de un sistema, sea simple o compuesto, en el tiempo t, Simbolizada por r(t), est definida como la proporcin de unidades que fallan en el intervalo de tiempo (t, t + t) cuyo clculo c esta dado por:

f (t ) r( t ) = T e (t ) donde, fT(t), es la funcin de densidad de probabilidad asociada a la variable aleatoria T antes definida. Claramente la tasa de falla es una probabilidad asociada a un sistema como se muestra a continuacin: Recordemos [T < t + t / T > t] = r(t) = lim t 0

[t < T < t + t] [T > t]


1 [t < T < t + t] [T > t] t

1 FT(t + t) FT(t) r(t) = lim t 0 1 FT(t) t r( t ) = 1 lim FT(t + t) FT(t) 1 FT(t) t 0 t d FT(t) 1 = 1 FT(t) dt
f T (t ) e (t )

r( t ) =

89

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Tambin es posible determinar la funcin de densidad de una variable a travs de

e(t) = [T > t]

e(t) = 1 [T t] e(t) = 1 FT(t)


d e(t) = fT(t) dt

e(t) = fT(t)

f (t ) r( t ) = T e(t )

r( t ) =

e(t ) e(t )

Inf

r (x) dx = ln(e(t)) + ln(e(Inf))


t exp r (x) dx = 1 FT(t) Inf

Inf t

r (x) dx =

Inf

e ( x) dx e(x)

t FT(t) = 1 exp r (x) dx Inf

d FT(t) = fT(t) = r(t) exp dt

t r (x) dx Inf

Definicin 3:

El tiempo Medio hasta la falla ( MTTF, Mean time to failure) o vida esperada de un producto se define por la cantidad:

Inf

tf (t ) dt = e(t ) dt
Inf

APLICACIN 7.1: Suponga que el tiempo de vida X (en das) de un componente elctrico esta modelado en forma independiente por la siguiente funcin de densidad:
3exp{3 x} f(x) = 0 falla. x>0 e.o.c.

Determine la funcin de confiabilidad del componente y grafique su tasa de

e(x) = [X > x] = 1 [X x] = 1 FX(x) = exp{ 3x}

90

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

f ( x) 3 exp{3 x} r ( x) = X = =3 exp{3 x} e(x)

r(x) 5,0
3,0 1,0 -1,0
x

Observar que el caso que la distribucin de probabilidad de la variable sea exponencial, su tasa de falla es constante y corresponde al parmetro de la distribucin.

Funciones de densidad, distribucin acumulada, confiabilidad y riesgo bajo ley exponencial.

91

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

APLICACIN 7.2: Suponga que la tasa de falla de un componente en un aparato mdico esta modelado en forma:
t 1 r(t) = 0 t > 0, > 0, > 0 e.o.c.

Determine la funcin de densidad de la variable tiempo de vida del componente y grafique su tasa de falla considerando = 3, >1 y <1. t t 1 1 fT(t) = r(t) exp r (x) dx = t exp x dx Inf 0

= t 1 exp ( x)

} }

T W(; )

e(t) = [T > t] = 1 [T t] = 1 FT(t) = exp ( x)

r(t)

3,0 2,5 2,0 1,5 1,0 0,5 0,0 t

r(t) 25

= 0,5

20 15 10 5 0

= 2,5

En general se tiene que :

92

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica
1 Para f T (t ) = t exp t (t )

Renato Allende Olivares Humberto Villalobos Torres

[0 , [

Funciones de densidad, distribucin acumulada, confiabilidad y riesgo bajo ley Weibull

93

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Tipos de Sistemas
I.

Sistemas con Componentes en Paralelo

Suponga que un sistema est compuesto por n componentes, que funcionan de manera independiente, entonces una configuracin en paralelo es aquella que se representa por la siguiente figura 1: C1 C2
. . .

Cn
Figura 1: Sistema en Paralelo

En este tipo de sistemas, se pueden considerar dos situaciones: la primera, cuando el sistema funciona cuando al menos uno funciona; la segunda, cuando el sistema funciona cuando al menos k componentes funcionan. En la primera situacin, el sistema funciona si al menos un componente funciona, si se puede establecer condiciones de independencia en el funcionamiento de los componentes, y adems suponer que todos ellos se encuentran gobernados por la misma confiabilidad, entonces la confiabilidad del sistema est dada por:

es(t) = [T > t] = [C1 > t C2 > t ... Cn > t]


= 1 [(C1 > t C2 > t ... Cn > t)c] = 1 [C1 < t C2 < t ... Cn < t] = 1 ([C1 < t] [C2 < t] ... [Cn < t]) =1

i =1 n i =1

[Ci < t]

=1

(1 e (t))
i

= 1 (1 e(t))n En la segunda situacin, el sistema funciona si al menos k componentes funcionan, si se puede establecer condiciones de independencia en el funcionamiento

94

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

de los componentes, y adems suponer que todos ellos se encuentran gobernados por la misma confiabilidad, entonces la confiabilidad del sistema est dada por:

es(t) = [T > t] =

x=k

x (e(t ))
n

(1 e(t ))

nx

Es fcil observar que si todos los componentes se encuentran gobernados por la misma confiabilidad y siendo stos independientes, la confiabilidad de cada uno de estos esta dada por e(t). Por lo tanto, es natural observar que la confiabilidad del sistema se convierta en una distribucin binomial. En ambas situaciones se ha supuesto que los componentes funcionan de forma independiente. Un caso completamente distinto seria que los componentes trabajasen de forma excluyente, es decir, mientras el primer componente esta funcionando, los otros componentes estn inactivos y slo se activarn en reemplazo del primero, cuando este falle. En esta situacin es necesario, determinar la distribucin de la suma de los tiempos de vida de cada uno de los componentes que integran el sistema.
II.

Sistemas con Componentes en Serie

Suponga que un sistema est compuesto por n componentes, que funcionan de manera independiente, entonces una configuracin en serie es aquella que se representa por la siguiente figura 2: C1 C2 C3
. . . . . . . .

Cn

Figura 2: Sistema en Serie

Si se puede establecer condiciones de independencia en el funcionamiento de los componentes, y adems suponer que todos ellos se encuentran gobernados por la misma confiabilidad, entonces la confiabilidad del sistema est dada por:

es(t) = [T > t] = [C1 > t C2 > t ... Cn > t]


= [C1 > t] [C2 > t] ... [Cn > t] = e1(t) e2(t) ... en(t) =

e (t) = (e(t))n
i i =1

95

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

III.

Sistemas Mixtos

Suponga que un sistema est compuesto por n componentes, que funcionan de manera independiente, entonces una configuracin mixta es aquella donde un conjunto de componentes estn configurados en paralelos, mientras que otro conjunto se encuentra en serie. Este tipo de sistemas, deben ser reducidos a subsistemas que entre ellos trabajen con alguna de las dos configuraciones clsicas, es decir, en paralelo o en serie.

APLICACIN 7.3: Suponga que el tiempo de vida T (en das) de un componente electrnico esta modelado en forma independiente por la siguiente funcin de densidad:
f T (t ) = 20 t ( + 1) , t > 20 y > 0.

Suponga que un sistema esta compuesto por cuatro componentes del mismo tipo que funcionan independientemente, con la siguiente configuracin: C3 C1 C2 Determine e interprete la tasa de falla del segundo componente y realice un bosquejo aproximado de ella. f (t ) r( t ) = T e(t ) C4

e(t) = [T > t] = 1 FT(t)

FT(t) =

20 t

T (t )

dt ( +1) +1 t t dt = 20 ( + 1) + 1 20

20

20

( +1)

20 =1 t

( +1) f (t ) 20 t r( t ) = T = = e (t ) t 20 t

r( t ) t

96

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

Determine la funcin de confiabilidad del sistema y determine la probabilidad de que el sistema dure ms de 80 das si = 0.8.

es(t) = [C1 > t ((C3 > t C4 > t) C2 > t)]


= [C1 > t] [(C3 > t C4 > t) C2 > t] = [C1 > t] (1 [(C3 < t C4 < t) C2 < t]) = [C1 > t] (1 ([C3 < t C4 < t] [C2 < t])) = [C1 > t] (1 (1 [C3 > t C4 > t]) (1 [C2 > t]))) = [C1 > t] (1 (1 [C3 > t] [C4 > t]) (1 [C2 > t]))) = e(t) (1 (1 e2(t)) (1 e(t))) = 0,8 20 e(80) = 80
0.8 1.6 0.8 1 1 20 1 20 = 0,1329 80 80

APLICACIN 7.4: Suponga que el tiempo de vida T (en aos) de un componente electrnico esta modelado en forma independiente por la funcin de densidad y sistema que esta compuesto por cinco componentes del mismo tipo que funcionan en forma independientes, como se muestra a continuacin:
C3 f T (t ) = 1 6 1 exp t 3 t , t > 0. C1 C2 C4 C5 Determine la confiabilidad de sistema y evalela a los dos aos. T : Tiempo de vida de un componente. T ~ W(1/2, 1/9) 1 t e(t) = exp 3

97

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

es(t) = [C1 > t C2 > t (C3 > t C4 > t C5 > t)]


= [C1 > t] [C2 > t] [(C3 > t C4 > t C5 > t)] = [C1 > t] [ C2 > t] (1 [(C3 < t C4 < t C5 < t)]) =[C1 > t] [C2 > t]) (1 (1 [C3 > t]) (1 [C4 > t]) (1 [C5 > t])) = e1(t) e2(t) (1 (1 e3(t)) (1 e4(t)) (1 e5(t))) = e2(t) (1 (1 e(t))3) 1 1 3 = exp 3 t (1 (1 exp 3 t ) )
2

es(2) = 0,36885

Cul es la probabilidad que el tiempo de vida del sistema se encuentre entre los dieciocho meses y diez aos? Ts : Tiempo de vida del sistema.

[18/12 < Ts < 10] = [Ts < 10] [Ts < 18/10] = 1 es(10) (1 es(18/12))
= es(18/12) es(10) = 0,4253 0,0879 = 0,33746

APLICACIN 7.5: Suponga que el tiempo de vida T (en decenas de aos) de un componente electrnico esta modelado en forma independiente por la siguiente funcin de densidad:
f T (t ) = 8 t exp 4t 2

{ }

t > 0.

Suponga que un sistema esta compuesto por cuatro componentes del mismo tipo que funcionan en forma independientes, con la siguiente configuracin: C3 C1 C2 C4 Determine la confiabilidad de sistema y evalela a los tres aos.

98

Universidad Tcnica Federico Santa Mara Magister en Gestin de Activos y Mantenimiento Probabilidad y Estadstica

Renato Allende Olivares Humberto Villalobos Torres

T : Tiempo de vida de un componente.

T ~ W(2, 2)

e(t) = exp{4 t2}

es(t)

= [C1 > t C2 > t (C3 > t C4 > t)] = [C1 > t] [C2 > t] [(C3 > t C4 > t)] = [C1 > t] [ C2 > t] (1 [(C3 < t C4 < t)]) = [C1 > t] [C2 > t]) (1 (1 [C3 > t]) (1 [C4 > t])) = e1(t) e2(t) (1 (1 e3(t)) (1 e4(t))) = e2(t) (1 (1 e(t))2) = exp{8 t2} (1 (1 exp{4 t2})2) = 2 exp{12 t2} exp{16 t2}

es(3/10) = 0,4423
Cul es la probabilidad que el tiempo de vida del sistema se encuentre entre los dos y cuatro aos? Ts : Tiempo de vida del sistema.

[2/10 < Ts < 4/10] = [Ts < 4/10] [Ts < 2/10]
= 1 es(4/10) (1 es(2/10)) = es(2/10) es(4/10) = 0,7103 0,2159 = 0,4944 Realice un bosquejo aproximado de la tasa de falla del sistema. rs(t) = fTs(t) es(t) = e 's (t) = es(t) 32 t exp{16 t2} 48 t exp{12 t2} 2 exp{12 t2} exp{16 t2}

Tasa de Falla

t 0,050 0,200 0,800 1,000

rS 0,808 3,612 18,943 23,926

r s (t ) 20,0
15,0 10,0 5,0 0,0 0,050 0,200 0,800 1,000

25,0

99

Vous aimerez peut-être aussi