Vous êtes sur la page 1sur 67

Introduccin 9

TEORA DE FIABILIDAD

Introduccin

La teora de la fiabilidad industrial estudia mtodos que deben seguirse tanto en el diseo
como en la recepcin, el transporte y el uso de los productos para garantizar al mximo su
rendimiento. Uno de los objetivos de la teora de la fiabilidad industrial es el abandono de la
subjetividad en las previsiones sobre la duracin de los productos a travs de la
cuantificacin de dichas previsiones. As expresiones como: "Esta construccin es ms
segura que aqulla", "Nuestro producto es ms resistente que el de la competencia", tienen
que sustituirse por formulaciones ms precisas, que necesitan del lenguaje estadstico.

Hay que pensar en la fiabilidad desde la primera fase del desarrollo de un producto. Antes
de tomar la decisin de fabricarlo en serie hay que someterlo a ensayos que sean
suficientemente representativos de sus condiciones de fabricacin como para permitir no
slo juzgar lo ensayado, sino tambin la fabricacin en serie. En la etapa de desarrollo de un
producto deben elaborarse una serie de reglas que se tendrn que observar a la hora de
fabricar los productos, en su recepcin y en su explotacin, con la finalidad de preservar la
fiabilidad.

La fiabilidad en la ingeniera est orientada a los fallos. El problema reside en predecir si


puede ocurrir un fallo al utilizar un dispositivo y cundo ocurrir. Esta informacin es til para
determinar las polticas de mantenimiento e inspeccin de una empresa, as como para
determinar los plazos de garanta de los productos. Tambin puede utilizarse para predecir
costes debidos al mantenimiento y a los eventuales fallos que puedan ocurrir mientras el
dispositivo est operativo.

La definicin utilizada en la ingeniera para la fiabilidad es la de "probabilidad de que un


dispositivo haga su funcin bajo condiciones establecidas, durante un perodo de tiempo
establecido".

Para la Fsica, la probabilidad se define: "Por probabilidad de un acontecimiento de una


observacin nosotros entendemos nuestra estimacin ms creble de la fraccin del nmero
de observaciones que resultarn del acontecimiento particular" [Feynman]. Esta idea
corresponde a la definicin frecuentista de la probabilidad: consiste en imaginar la repeticin
de una experiencia y establecer la relacin entre la frecuencia de un suceso A NA y el
nmero N de repeticiones:

NA
P(A)= .
N

Hay por lo menos dos reflexiones ligadas a esta idea:

Un suceso no es siempre exactamente repetible. Como mnimo, los tiempos de


ocurrencia son distintos.

La probabilidad est ligada a la informacin disponible en cada momento.

Los autores, 2003; Edicions UPC, 2003.


10 Fiabilidad industrial

Otra definicin de probabilidad ms subjetiva es que "probabilidad es el grado de creencia


que tiene un analista u observador." La idea es que la probabilidad es una herramienta
analtica basada en la valoracin, til para poder tomar decisiones. Esta definicin es en la
que se apoya la Escuela Bayesiana.

Para revisar las propiedades de la probabilidad se puede consultar el captulo 2 de


Montgomery y Runger (1996).

Perspectiva histrica de la teora de la fiabilidad

El origen de la fiabilidad puede atribuirse a los estudios para poder evaluar la mortalidad
derivada de las epidemias y a los mtodos actuariales desarrollados por las compaas de
seguros, para determinar los riesgos de sus plizas. Como herramienta para el clculo del
riesgo se utilizaba las tablas de vida.

La primera tabla de vida data de 1693 y es debida a Edmund Halley1, astrnomo ingls
conocido por haber predicho la rbita del cometa que lleva su nombre.

A principios de 1900 se utilizaban los mtodos actuariales tanto para estimar la


supervivencia de pacientes sometidos a distintos tratamientos como para estudiar la
fiabilidad de equipamientos, en particular de los ferrocarriles.

La teora matemtica de la fiabilidad se desarrolla por las demandas de la tecnologa


moderna y en particular por las necesidades de los sistemas complejos militares. El rea de
mantenimiento de mquinas es una de las reas donde la fiabilidad se aplica con
sofisticadas matemticas. La renovacin y los avances de la tecnologa se utilizan muy
pronto para resolver problemas de reparacin e inspeccin de dispositivos.

En 1939 Walodie Weibull, cuando era profesor del Royal Institute of Technology en Suiza,
propuso una distribucin para describir la duracin de materiales, que ms tarde llevara su
nombre. La distribucin de Weibull es muy utilizada en las aplicaciones, ya que es muy
verstil, pues admite distintas formas de funciones de riesgo.

En 1951 Epstein y Sobel empezaron a trabajar con la distribucin exponencial como modelo
probabilstico para estudiar el tiempo de vida de dispositivos [ver Epstein y Sobel (1953)].
Este modelo de probabilidad, tan bueno como muchos otros, se basa en el concepto de
poblacin de tamao infinito o no acotado. La distribucin exponencial tiene la propiedad de
no tener memoria; es decir, en el clculo de la probabilidad de que falle un dispositivo no
influye el tiempo que hace que funciona.

Una razn fundamental de la popularidad de la distribucin exponencial es la amplia


explotacin que se ha hecho de ella en trabajos de fiabilidad, debido a su simplicidad en la
suma de las tasas de fallo ya que hace posible el clculo de diseos de datos de forma
simple.

La investigacin de sistemas de fiabilidad en general (y en particular las funciones de


sistemas coherentes) se inici en 1961 a partir del artculo de Birnbaum, Esary y Sauders.

1
Puede encontrarse una traduccin al espaol del artculo citado en James R. Newman (1968).

Los autores, 2003; Edicions UPC, 2003.


Introduccin 11

Se puede citar tambin un trabajo previo de Moore-Shanon donde plantean de forma ms


abstracta unos enlaces de superfiabilidad. Birmbaum, Esary y Marshall (1966) introdujeron
la conexin entre las estructuras de los sistemas coherentes y la clase de distribuciones de
tiempos de vida, incluyendo las distribuciones exponenciales.

El clculo de la fiabilidad de los sistemas haba llegado a un nivel de complejidad tal que era
necesaria la formalizacin abstracta de dichos sistemas.

Los sistemas coherentes forman una clase de modelos de fiabilidad; el concepto


fundamental de los sistemas coherentes (coherent system) es que los componentes se
encuentran individualmente en uno de los dos estados: funcionan o fallan, y el estado de los
sistemas se representa en trminos de los estados individuales de cada componente a
travs de las funciones de estructura (structure function). Dos propiedades clave son: (a) la
relevancia de cada componente, es decir, no hay ningn componente cuya fiabilidad no
afecte a la fiabilidad del sistema; y (b) la monotonicidad, que encierra el concepto de que la
fiabilidad de un sistema nunca puede ser mejorada cuando uno de sus componentes se
vuelve menos fiable.

Merece mencin especial indicar las publicaciones W. Nelson (1982,1990) sobre


aplicaciones de fiabilidad industrial y pruebas de vida acelerada que se han convertido en
referencias obligadas en el campo de la fiabilidad industrial.

El anlisis mediante rboles de fallo, FTA (failure tree analysis), es un mtodo de anlisis de
la seguridad de un sistema. Lo desarroll por primera vez H.A. Watson en los laboratorios
Bell. Pero es en los aos 70 cuando el anlisis de la fiabilidad de un sistema mediante
rboles de fallo toma ms fuerza por problemas relacionados con la seguridad en las
centrales nucleares.

En los aos 80 el objetivo principal de los trabajos de fiabilidad est en las redes de
comunicaciones. Esto fue motivado por el proyecto Advanced Research Project Agency
Network (ARPAnet) del Departamento de Defensa americano, que se plante el objetivo de
la alta fiabilidad de las comunicaciones entre centros estratgicos, aunque los nodos
intermedios no fueran altamente fiables. El resultado de estos trabajos ha encontrado
aplicacin en los sistemas de web e Internet actuales.

En los aos 90, la investigacin de la fiabilidad toma nuevas direcciones con M.B. Mendel.
Los orgenes de su investigacin se basan en la hiptesis de que muchas de las
representaciones en el espacio muestral que se han considerado en la estadstica no
correspondan en ingeniera a los espacios eucldeos. Por ello, utiliza la geometra diferencial
como base para la aproximacin de los problemas de ingeniera estadstica. Esto puntos de
vista se pueden encontrar en recientes publicaciones sobre problemas de fiabilidad de la
ingeniera, entre ellos los de Shortle y Mendel (1994) y (1996).

Objetivos de la materia

La materia de fiabilidad que se imparte en este texto es una introduccin a las tcnicas
estadsticas para resolver cuestiones de fiabilidad industrial.

La fiabilidad industrial se diferencia de otras tcnicas estadsticas por utilizar los modelos
probabilsticos propios de las variables aleatorias que son tiempos de vida hasta el fallo,

Los autores, 2003; Edicions UPC, 2003.


12 Fiabilidad industrial

como la distribucin exponencial y la Weibull. Otro rasgo diferencial es que en la prctica las
muestras aleatorias de que se dispone no son completas. Esto es debido a que en muchos
casos las pruebas de vida o ensayos de fiabilidad son destructivas, con lo cual son costosas
econmicamente y en tiempo. Por ello, en muchos casos, se finaliza el ensayo antes de
observar el fallo.

Se desarrollan los modelos exponencial y Weibull en el contexto de la fiabilidad. Tambin se


hace una introduccin a los datos censurados y la estimacin de parmetros con datos
censurados.

Se hace una introduccin a las pruebas de vida acelerada, que son una prctica comn en
la industria. Son aquellos ensayos que se realizan a un nivel de estrs superior al de las
condiciones ordinarias de funcionamiento, con el fin de provocar la aparicin de fallos en un
tiempo ms corto. Estas pruebas se realizan exponiendo los productos a condiciones ms
severas que las usuales. Generalmente implica aumentar la temperatura, el voltaje, la
presin, la vibracin, el tiempo operativo, etc.

Las pruebas de vida acelerada pueden usarse tanto para evaluar la capacidad de un
componente, a fin de satisfacer los requisitos de fiabilidad, como para tener un medio ms
rpido de detectar debilidades potenciales o modos de fallo.

En el ltimo captulo se desarrolla el anlisis de un sistema, formulando los sistemas


coherentes, la fiabilidad de un sistema en serie y en paralelo con tasa de fallo constante. Por
fin, se hace una introduccin al anlisis de la fiabilidad mediante rboles de fallo.

El objetivo principal de esta materia es dar una introduccin a la fiabilidad industrial de forma
que el estudiante sea capaz de:

Identificar cundo un problema es propio de la fiabilidad y determinar cul es la prueba


de vida ms adecuada para estudiarlo.

Reconocer la variable aleatoria que define la problemtica planteada, acotando bien la


definicin de fallo y definiendo las unidades con que se medir: ciclos, horas, resistencia
hasta el fallo, etc.

Establecer cul es el modelo probabilstico adecuado que ajusta mejor los datos de una
prueba de vida.

Estimar grficamente con una hoja de clculo los parmetros de los modelos
exponencial y Weibull para muestras con datos completos y datos censurados.

Estimar por el mtodo de mxima verosimilitud los parmetros de los modelos


exponencial y Weibull para muestras con datos completos y datos censurados.

Calcular las caractersticas de fiabilidad: la fiabilidad, la vida media hasta el fallo, la tasa
de fallo, la funcin de riesgo, los percentiles y la mediana.

Calcular los intervalos de confianza de la vida media y la tasa de fallo del modelo
exponencial.

Calcular las constantes de los modelos de pruebas de vida con estrs constante: el de
Arrhenius y el de la potencia inversa de Weibull.

Los autores, 2003; Edicions UPC, 2003.


Introduccin 13

Determinar la fiabilidad de un sistema compuesto por componentes en serie con tasa de


fallo constante, en paralelo, sistemas combinados y sistemas con componentes
redundantes.

Calcular la fiabilidad de un sistema a partir del anlisis de un modelo lgico grfico


como los rboles de fallo (FTA).

La materia de fiabilidad est estructurada en 5 captulos y dos apartados de ejercicios y


prcticas:

Captulo 1: Conceptos fundamentales

En este captulo se presentan los conceptos generales de la teora de la fiabilidad. El


objetivo de este captulo es familiarizarse con las nociones de fallo, tasa de fallo, vida
media y fiabilidad. Estos conceptos se introducen haciendo referencia al lenguaje y la
terminologa de una prueba de vida industrial. Se dan los preliminares de las
distribuciones de probabilidad en fiabilidad, haciendo hincapi en la funcin de riesgo
(hazard function), que es especfica de los estudios de fiabilidad. Tambin se hace una
introduccin de los distintos enfoques que puede tener la fiabilidad en la industria.

Captulo 2: Fiabilidad con tasa de fallo constante

Este captulo aborda el modelo exponencial, que es el ms utilizado en el anlisis de


pruebas de vida. Se plantea la estimacin de la vida media y la tasa de fallo para
distintas situaciones de pruebas de vida. Se introducen las muestras aleatorias que no
son completas y el concepto de datos censurados.

Captulo 3: Tasa de fallo no constante: El modelo de Weibull y otros

Este captulo trata el modelo de Weibull, que permite modelar tasas de fallo constante,
crecientes y decrecientes. Tambin se tratan otras distribuciones como la Gumbel, la
Normal y la lognormal. Se describen los grficos de probabilidad como herramienta para
validar el modelo de Weibull y estimar sus parmetros, tanto para muestras completas
como datos censurados. Se expone brevemente el mtodo de estimacin de la mxima
verosimilitud y se proponen estimadores para los parmetros basados en este mtodo.

Captulo 4: Pruebas de vida aceleradas

Es una introduccin a las pruebas de vida acelerada, que son una prctica comn en
situaciones donde es difcil la aparicin de fallos. Se explican dos tipos de pruebas de
donde, a partir de los datos de dispositivos sometidos a una aceleracin, se puede
inferir la fiabilidad del dispositivo en condiciones normales de uso. Se exponen el
modelo de Arrhenius y el de la potencia inversa de Weibull, dos modelos tpicos de
pruebas de vida con estrs constante,

Captulo 5: Anlisis de la fiabilidad de un sistema

En este captulo se desarrolla el anlisis de un sistema, formulando los sistemas


coherentes, la fiabilidad de un sistema en serie y en paralelo con tasa de fallo
constante. Se hace una introduccin al anlisis de la fiabilidad mediante rboles de fallo.

Los autores, 2003; Edicions UPC, 2003.


14 Fiabilidad industrial

Ejercicios y prcticas de fiabilidad

Se proponen ejercicios y prcticas resueltos de los cinco captulos. La herramienta


utilizada es la hoja de clculo Excel y el programario estadstico Minitab.

Autoevaluaciones de fiabilidad

Se proponen ejercicios tipo test resueltos.

La fuente de algunos de los ejemplos desarrollados en estos apuntes es de W. Nelson


(1982) y G. Gmez y M. Canela (1992).

Los autores, 2003; Edicions UPC, 2003.


Conceptos fundamentales 15

1 CONCEPTOS FUNDAMENTALES

En este captulo se presentan los conceptos generales de la teora de la fiabilidad. El


objetivo de este captulo es familiarizarse con las nociones de fallo, tasa de fallo, vida media
y fiabilidad. Estos conceptos se introducen haciendo referencia al lenguaje y la terminologa
de una prueba de vida industrial. Se dan los preliminares de las distribuciones de
probabilidad en fiabilidad, haciendo hincapi en la funcin de riesgo (hazard function) que es
especfica de los estudios de fiabilidad. Tambin se hace una introduccin de los distintos
enfoques que puede tener la fiabilidad en la industria.

Fiabilidad es un concepto con muchas connotaciones distintas. Cuando se aplica al ser


humano, normalmente se refiere a la habilidad de las personas para hacer ciertas tareas de
acuerdo con un estndar especificado. Por extensin, la palabra se aplica a una pieza de un
equipo, o a un componente de un sistema, y significa la habilidad de un equipo o
componente para cumplir con la funcionalidad que se requiere de l. El origen del uso del
trmino era cualitativo.

En su aplicacin actual, la fiabilidad es casi siempre un concepto cuantitativo, y esto implica


la necesidad de mtodos para medirla.

Hay muchas razones por las que la fiabilidad necesita ser cuantificada. Quiz el ms
importante es el econmico ya que la mejora de la fiabilidad cuesta dinero, y esto puede ser
justificado slo si se puede evaluar la no fiabilidad de un equipo. Para un componente
crtico, del cual su operacin funcional es esencial en un sistema, la fiabilidad puede ser
medida como la probabilidad de que el componente opere con xito, y la esperanza del
costo de un componente no fiable se mide como el producto de la probabilidad de fallo y el
costo del fallo. En una aplicacin rutinaria, donde los componentes que fallan pueden ser
reparados, la media del tiempo entre fallos (Mean Time Between Failures) es un parmetro
crtico. En ambos casos, la necesidad de una definicin probabilstica de fiabilidad es
evidente.

1.1 Fiabilidad y fallo

Segn la norma internacional ISO 8402, la calidad de un producto es el conjunto de


caractersticas que le confieren la aptitud para satisfacer las necesidades establecidas y las
implcitas. Estas necesidades pueden comportar aspectos relativos a su aptitud de uso, la
seguridad, el respeto al medio ambiente, y en muchos casos, la fiabilidad.

La fiabilidad (reliability) de un producto se define como la facultad de conservar la calidad,


durante un tiempo preestablecido, en unas condiciones determinadas de explotacin
(definicin cualitativa). Para poder cuantificarla se utiliza el lenguaje estadstico y se define
como la probabilidad de que un dispositivo desarrolle su funcin con ciertas condiciones
establecidas, durante un perodo de tiempo establecido. El valor de esta probabilidad se
denota por R.

Para no tener ambigedades en la cuantificacin de la fiabilidad es importante tener bien


definido el concepto de tiempo de vida de un producto y tener identificado cundo ste falla
y de que clase de fallo se trata.

Los autores, 2003; Edicions UPC, 2003.


16 Fiabilidad industrial

La vida de un producto es el perodo de tiempo durante el que puede ser utilizado, en las
condiciones establecidas.

Fallo (failure) es la prdida de alguna de las propiedades del dispositivo que reduce, total o
parcialmente, su funcionamiento.

Cuando el fallo se define como un cierto nivel de degradacin en el funcionamiento del


dispositivo, puede interesar estudiar la variacin de la propiedad en la que se concreta la
degradacin con el tiempo y a la curva que la describe se le llama curva de degradacin. No
es objeto de estos apuntes entrar en el estudio de sta, que requiere de un aparato
matemtico ms sofisticado. En la figura 1.1, a modo de ilustracin, se puede observar
grficamente la deriva de la media y la varianza de una medida de inters.

Ejemplo 1.1

Un tipo de resistencia elctrica de 3.000 nominales presenta una deriva del parmetro
fundamental segn el siguiente esquema: el valor medio decrece a razn del 1% de su valor
inicial cada 1.000 horas; la desviacin estndar, inicialmente del 2%, es decir 60, aumenta
a razn del 0,5% de su valor inicial cada 1.000 horas. Un esquema de la pauta de la deriva
puede ser el de la figura 1.1.

Cul es la probabilidad de que una resistencia se encuentre despus de 2.000 horas de


funcionamiento dentro del intervalo de tolerancia 3.000 240, suponiendo que la
distribucin del valor de la resistencia sigue una ley Normal?

En t = 0 horas la variable aleatoria, T = "resistencia elctrica", se distribuye segn una


distribucin Normal de media 3.000 y una desviacin estndar 60 . Es decir,
T~N(3.000, 60)

En t = 2.000 horas, T ~ N(3.000 - 60; 60 + 0,6) = N(2.940; 60,6)

Se calcula la probabilidad de que la resistencia cumpla la tolerancia al cabo de 2.000 horas


de funcionamiento a partir de la tablas estadsticas de la distribucin Normal Z(0;1) en la
tabla 2 del anexo.

2.760-2.940 T -2.940 3.240-2.940


Pr(2.760 T 3.240) = Pr =
60,6 60,6 60,6
Pr[-2,97 Z 4,95] = Pr(Z 4,95)- Pr[Z -2,97] = 1-(1-0,9985) = 0,9985, donde Z~N(0;1)

No cumplirn la tolerancia un 0,15% de las resistencias. Al cabo de 2.000 horas de


funcionamiento.

Los autores, 2003; Edicions UPC, 2003.


Conceptos fundamentales 17

Figura 1.1 Ejemplo de la deriva de los parmetros de la distribucin Normal con el tiempo

La manera en que se observa el fallo se denomina modo de fallo (failure mode) y el


mecanismo del fallo (failure mechanism) se refiere al proceso qumico, fsico que da lugar al
fallo.

En ciertos casos la nocin de fallo no es transparente: por ejemplo, nos puede interesar
saber cundo una pieza de un motor deja de funcionar de manera adecuada; en este caso
debe precisarse muy bien cul es el fallo. Por ejemplo, si el fallo se detecta por el ruido del
motor, se tendr que definir cmo medirlo (en decibelios por ejemplo) y definir un lmite
superior de tolerancia (por ejemplo 60 dB). Cuando se supera el lmite de 60 dB, tenemos el
fallo.

Los fallos se pueden clasificar segn la causa que lo provoca: fallo por uso indebido (misuse
failure) cuando la causa es extrnseca al dispositivo, y fallo por debilidad inherente (inherent
weakness failure) cuando la causa es intrnseca.

Un sistema es un dispositivo formado por partes, la fiabilidad de las cuales es conocida.


Estas partes se denominan componentes. En general, el fallo de un sistema se produce al
fallar uno o varios componentes. Segn sea el fallo, se denomina fallo primario (primary
failure) cuando no es causado ni directamente ni indirectamente por el fallo de otro
dispositivo, fallo secundario cuando es causado por el fallo de otro dispositivo, y fallo por
desgaste (wear-out failure) cuando es un fallo con una probabilidad de aparicin que
aumenta a medida que el tiempo pasa, resultado de una serie de procesos caractersticos
del dispositivo.

Los autores, 2003; Edicions UPC, 2003.


18 Fiabilidad industrial

1.2 Caractersticas de fiabilidad

Para poder describir el comportamiento del tiempo de vida T de un dispositivo utilizamos la


fiabilidad, que es la probabilidad de que un objeto realice su funcin con ciertas condiciones
establecidas, durante un perodo de tiempo prefijado. T es una variable aleatoria y para cada
valor del tiempo t se obtiene un valor de fiabilidad R(t), el que en estadstica se denomina
distribucin de probabilidad. Una distribucin de probabilidad se caracteriza mediante unos
parmetros estadsticos, que en el contexto de la fiabilidad se denominan caractersticas de
fiabilidad. La distribucin de probabilidad ser distinta si los dispositivos se reparan o no,
puesto que en un caso la variable aleatoria de inters es el tiempo entre fallos y, en el otro,
el tiempo hasta el fallo.

En los dispositivos que no se reparan, nicamente tiene sentido considerar tiempos de vida
hasta el primer fallo, y la variabilidad de una unidad a otra da una distribucin, que es el
objeto de estudio de la fiabilidad.

Una caracterstica de fiabilidad de la variable aleatoria T: tiempo hasta el fallo es la vida


media hasta el fallo, MTTF (mean time to failure).

Si los dispositivos son reparados tiene sentido considerar el tiempo entre fallos
consecutivos. La fiabilidad en este caso es ms complicada, a menos que la distribucin de
probabilidad de tiempo entre fallos sea independiente de la edad del dispositivo.

Una caracterstica de fiabilidad de la variable aleatoria T: tiempo entre fallos consecutivos es


el tiempo medio entre fallos, MTBF (mean time between failure).

En las aplicaciones, slo se dispone de un valor aproximado de estos parmetros, obtenido


por un procedimiento estadstico de estimacin ms o menos complejo. Estos valores estn
muchas veces incluidos en la especificacin de un producto, y pueden figurar en una
relacin contractual entre un cliente y un proveedor, o servir de criterio para una
homologacin. Es importante concretar de qu forma se obtiene una caracterstica de
fiabilidad. Un lenguaje preciso y preferiblemente normalizado ayuda a evitar malentendidos
cuando se utilizan valores de las caractersticas de fiabilidad. Aqu utilizaremos la
terminologa de la Internacional Electrotechnical Comision (IEC), recogida en la norma IEC
271.

Observacin: La variable aleatoria duracin de un dispositivo a veces no se mide en tiempo


sino en otra magnitud que tiene un significado anlogo, por ejemplo la fiabilidad de un cable
puede referirse a la resistencia en Newton hasta la rotura, la de un neumtico a los
kilmetros rodados, la de una tostadora al nmero de ciclos, la de un motor al nmero de
revoluciones, la de un equipo elctrico a los kilovatios consumidos. De todas formas
mantendremos la notacin temporal para simplificar.

Otras caractersticas de fiabilidad son la fiabilidad y la tasa de fallo.

La fiabilidad es la probabilidad de que una variable aleatoria T: tiempo hasta el fallo supere
un cierto perodo de tiempo en funcionamiento y se denota por R(t):

R(t) = Pr(T > t), donde T: tiempo hasta el fallo es la variable aleatoria.

Los autores, 2003; Edicions UPC, 2003.


Conceptos fundamentales 19

Hay distintas formas de aproximar una caracterstica de fiabilidad. En general se distinguen


cuatro formas distintas: observada, evaluada, extrapolada y predicha. Esta distincin es
vlida para cualquier caracterstica de fiabilidad. En el caso de la fiabilidad se definen de la
siguiente forma:

Fiabilidad observada (observed reliability): de un dispositivo que no se repara a un tiempo


dado t, es la proporcin de dispositivos de una muestra que hacen su funcin de manera
satisfactoria una vez transcurrido este tiempo t. Puede expresarse en porcentaje. El ejemplo
1.2 es una ilustracin de este concepto.

Ejemplo 1.2

Se realiza un ensayo del mecanismo de arrastre del papel de un nuevo modelo de


impresora de chorro de tinta. El ensayo se realiza con 12 unidades y la duracin prefijada es
de 60.000 ciclos. Los resultados son:

24.609; 25.237; 30.391; 41.434; 42.212; 51.615; 60.000+; 60.000+; 60.000+; 60.000+;
60.000+; 60.000+.

El smbolo + indica censura por la derecha, es decir al cabo de 60.000 ciclos an


funcionaba.

En este caso la variable aleatoria es:

T = "n ciclos de un mecanismo de arrastre hasta el fallo"

La muestra aleatoria simple T1, ... ,T12 es de tamao n=12.

La fiabilidad observada a 50.000 ciclos es:

R(50.000) = 7/12 = 0,58

donde se interpreta que este nuevo mecanismo tiene una fiabilidad observada del 0,58, es
decir un 58% de las impresoras superan los 50.000 ciclos.

Nota: las frmulas y la terminologa para los clculos se encuentran desarrolladas en el


captulo 2.

La fiabilidad evaluada (assessed reliability) hace referencia a valores obtenidos a partir de


datos experimentales por un tratamiento estadstico. El resultado de este tratamiento puede
dar distinto a la fiabilidad observada como puede apreciarse en el ejemplo 1.3. La ventaja
del tratamiento estadstico es que el resultado es ms preciso ya que en el clculo
intervienen los tiempos de vida, y adems nos permite la obtencin de un intervalo de
confianza. Se puede dar a la fiabilidad evaluada un lmite de confianza inferior o dos lmites.
Obsrvese en el ejemplo 1.3 un intervalo de confianza unilateral de la fiabilidad evaluada.

Los autores, 2003; Edicions UPC, 2003.


20 Fiabilidad industrial

1.2.1 Interpretacin de un intervalo de confianza (1-) para un parmetro

El intervalo de confianza asocia una verosimilitud o nivel de certeza que puede atribuirse a
la estimacin del parmetro .

Un intervalo de confianza (1-) en el sentido clsico (no bayesiano) es tal que, si repetimos
el experimento una infinidad de veces (y cada vez recalculamos el intervalo) entonces un
porcentaje (1-)100 % de las veces, el intervalo cubrira el verdadero valor del parmetro
desconocido .

Ejemplo 1.3

Se realiza un ensayo con 20 dispositivos y se finaliza cuando 12 de ellos han fallado. Se


obtienen los siguientes resultados:

55, 58, 86, 131, 335, 376, 517, 544, 920, 953, 1.072 y 1.260 horas hasta el fallo.

En este caso la variable aleatoria es:

T = "tiempo en horas hasta el fallo de un dispositivo"

La muestra aleatoria simple T1, ... ,T20 es de tamao n = 20.

Slo se dispone del tiempo hasta el fallo de 12 de los 20 dispositivos; de los 8 restantes
sabemos que han superado las 1.260 horas de funcionamiento.

Si suponemos que la distribucin exponencial se ajusta bien a los datos podemos estimar la
vida media hasta el fallo como:

T
= MTTFOBSERVADO = = 1.365,58
12

horas, donde T es el tiempo total en test

T = 55+58+86+131+335+376+517+544+920+953+1.072+1.260+860 = 16.387

La vida media evaluada hasta el fallo es de 1.365,58 horas.

La fiabilidad observada a 600 horas es 12/20 = 0,60, donde 12 son los dispositivos que han
superado las 600 horas.

La fiabilidad evaluada a 600 horas es:

R(600) = exp(-600/1.365,58) = 0,64

Los autores, 2003; Edicions UPC, 2003.


Conceptos fundamentales 21

Clculo de la fiabilidad mnima de 600 horas con una confianza del 0,95

Primero se calcula el intervalo de confianza unilateral del 0,95 para , que es:

2T
900,01=
0,95:24
2

donde el percentil 0,95 de la distribucin 0,95;24


2
= 36,415 . As, se deduce que la vida media
de los dispositivos es de 900,01 horas como mnimo, con una confianza del 0,95.

Utilizando el lmite inferior de la estimacin de la vida media se encuentra el intervalo de


confianza unilateral del 0,95 para R(600), que es

R(600) = exp(-600/900,01) = 0,51

De donde se interpreta que, como mnimo, la fiabilidad a 600 horas es de 0,51 con una
confianza del 0,95, lo que indica que 51% de los dispositivos superarn las 600 horas y esta
afirmacin se hace con una confianza del 0,95.

Nota: las frmulas para los clculos se encuentran descritas en el captulo 2.

La fiabilidad extrapolada (extrapolated reliability) se refiere a un valor obtenido al extrapolar


o interpolar una fiabilidad observada o evaluada para poder obtener un valor aplicable a
condiciones de estrs distintas, en que se van obteniendo resultados experimentales.
Habitualmente, los valores extrapolados se basan en pruebas de vida aceleradas, que
comentaremos en el captulo 4.

La fiabilidad predicha (predicted reliability) designa un valor aplicable a un sistema, que se


obtiene a partir de los valores observados, evaluados o extrapolados, de sus componentes.
Los mtodos para el clculo de las caractersticas de fiabilidad de un sistema se harn en el
captulo 5.

La tasa de fallo (failure rate) es una caracterstica de la fiabilidad que se puede interpretar
como la velocidad a la que se producen los fallos, la fraccin de unidades de un producto
que fallan por unidad de tiempo.

Si la tasa de fallo es constante se designa por y si es funcin del tiempo t se designa por
h(t) y se llama funcin de riesgo (Hazard function).

La tasa de fallo es la magnitud recproca de la vida media, ya que generalmente representa


un nmero medio de fallos por unidad de tiempo.

Igual que las otras caractersticas de fiabilidad, la tasa de fallo para un tiempo dado puede
ser observada, extrapolada, etc.

La tasa de fallo, para un intervalo (t1, t2) se define como:

R (t1)-R (t 2 )
h(t1, t2)=
(t 2 -t1)R (t1)

Los autores, 2003; Edicions UPC, 2003.


22 Fiabilidad industrial

y es llamada tambin tasa de fallo autntico (true failure rate). La fiabilidad R(t) representa la
proporcin de unidades que no han fallado en el instante t.

El cociente (R(t1) - R(t2)) / R(t1) representa la fraccin de unidades que, no habiendo fallado
en el instante t1, fallan en el intervalo (t1, t2).

Si hacemos el lmite de h(t1, t2) cuando t2 tiende a t1 se obtiene la funcin de riesgo o tasa
de fallo instantneo en un instante t, que es una derivada:

-R (t)
h(t)=
R (t)

Si se asume que la tasa de fallo no depende de t, es decir es constante, el tratamiento


estadstico es mucho ms sencillo tal como veremos en el siguiente captulo.

Ejemplo 1.4

La siguiente tabla de mortalidad debida a Halley (1693) es un ejemplo clsico, que fue
discutido por Todhunter en 1949, que puede servir de ilustracin para discutir las frmulas
de la fiabilidad y de la tasa de fallo definidas. La tabla muestra las edades de defuncin de
las personas de la poca, que vienen agrupadas en intervalos de 5 aos.

Edad t Proporcin F(t) Fiabilidad R(t) Tasa h(t)


05 0,290 0,290 0,710 0,058
510 0,057 0,347 0,653 0,016
1015 0,031 0,378 0,622 0,009
1520 0,030 0,408 0,592 0,010
2025 0,032 0,440 0,560 0,011
2530 0,037 0,477 0,523 0,013
3035 0,042 0,519 0,481 0,016
3540 0,045 0,564 0,436 0,019
4045 0,049 0,613 0,387 0,022
4550 0,052 0,665 0,335 0,027
5055 0,053 0,718 0,282 0,032
5560 0,050 0,768 0,232 0,035
6065 0,050 0,818 0,182 0,043
6570 0,051 0,869 0,131 0,056
7075 0,053 0,922 0,078 0,081
7580 0,044 0,966 0,034 0,113
8085 0,034 1 0 0,200

Los autores, 2003; Edicions UPC, 2003.


Conceptos fundamentales 23

1.3 Pruebas de vida

Las pruebas de vida son experimentos cuya finalidad es determinar el valor de una
caracterstica de fiabilidad (determination tests) o bien asegurar que una caracterstica de
fiabilidad es superior o inferior a un lmite especificado (compliance test).

Una cuestin importante es la eleccin de las condiciones exteriores y el rgimen de trabajo


que hace falta seguir durante las pruebas. En la eleccin de las condiciones se deben tener
en cuenta las particularidades del producto durante su explotacin, como temperatura,
humedad, tensin, vibraciones, etc. Las condiciones exteriores pueden tener una influencia
decisiva en la variacin de los parmetros medidos.

La aproximacin de las pruebas de vida es estadstica, puesto que a priori no puede saberse
cundo se va a producir el fallo. Es decir, la aparicin del fallo tiene un carcter aleatorio.

El conjunto de reglas que rigen el desarrollo de las pruebas se designa por plan de las
pruebas y ste ha de estar bien definido antes de empezar a experimentar. Debe fijarse el
nmero de unidades que se prueban, y la duracin, que vendr restringida por la
disponibilidad econmica y de tiempo. La duracin puede fijarse en tiempo o en nmero de
unidades que s esta dispuesto a observar que fallen. En ambos casos puede pasar que la
prueba termine y haya unidades donde no se ha observado el fallo.

Los ejemplos 1.2 y 1.3 ilustran situaciones tpicas de pruebas de vida: en el ejemplo 1.2 se
fija la duracin de la prueba en 60.000 ciclos y en el ejemplo 1.3 se fija la cantidad de
unidades que se est dispuesto a esperar que fallen, en particular 12.

El tratamiento estadstico en este caso requiere de las tcnicas de muestras estadsticas no


completas, puesto que la informacin de que se dispone sobre algunas unidades es que el
fallo no ha ocurrido durante el tiempo de la prueba, denominado tiempo total de test. Estos
datos se llaman censurados. El concepto de censuramiento se define en el captulo 2.

Tambin es importante fijar si el seguimiento de la prueba ser continuo o peridico. En


muchos casos no se dispone de equipos conectados a las unidades para poder determinar
exactamente cundo ha habido el fallo y en estos casos debe fijarse con qu periodicidad se
efectuar y cules sern las unidades de medida. En otros casos puede que el seguimiento
no sea en tiempo real sino operacional, es decir el seguimiento se hace a largo plazo y slo
cuando el dispositivo opera, por ejemplo en el tiempo de vuelo, y no el tiempo desde su
fabricacin.

Es importante establecer si las unidades que fallan sern reemplazadas o no, a medida que
vayan fallando (sistemas reparables o no reparables) y cundo se d por terminada la
prueba.

Debido a la duracin y al coste de las pruebas de vida se plantea el reducir el nmero de


unidades sometidas al test y el tiempo de la prueba. En algunos casos la magnitud de la
vida media del producto hace inviable una prueba de vida en las condiciones normales de
funcionamiento del producto. Es en estos casos que se hace necesaria la realizacin de
pruebas de vida aceleradas (accelerated life test), en las cuales las condiciones de la prueba
se hacen ms severas a fin de acelerar el proceso de envejecimiento y bajar la vida media.
Para poder sacar partido de este tipo de pruebas debe disponerse de un modelo terico o
emprico que permita la extrapolacin de los resultados en condiciones ordinarias de

Los autores, 2003; Edicions UPC, 2003.


24 Fiabilidad industrial

funcionamiento. Las principales dificultades de la elaboracin de planes de prueba de vida


acelerada estn ligadas al estudio de los aspectos fsico-qumicos del proceso de
envejecimiento, en funcin de las condiciones externas y el rgimen de trabajo. Este tema
se desarrolla en el captulo 4.

1.4 Distribuciones de probabilidad en fiabilidad

En muchas reas de la estadstica aplicada, la distribucin Normal es el punto de partida


natural para modelar la variable aleatoria de inters. Puede resultar de consideraciones
puramente pragmticas o del argumento terico basado en el Teorema del Lmite Central, el
cual nos dice que si una variable aleatoria es la suma de un gran nmero de efectos
pequeos, entonces la distribucin es aproximadamente Normal. En el contexto de
fiabilidad, el caso de la Normalidad tiene una importancia menor. Por un lado los tiempos de
vida y las resistencias a la rotura son cantidades inherentemente positivas y adems para
una variable aleatoria de estas caractersticas surge de forma natural la idea de que la
aparicin de fallos puede seguir el proceso de Poisson, con lo que en este caso la
distribucin exponencial es ms adecuada.

En la prctica, los modelos utilizados en fiabilidad son generalizaciones de la distribucin


exponencial, tales como las distribuciones Gamma y Weibull.

Otro aspecto distintivo del anlisis estadstico de los datos de fiabilidad es el papel central
que juegan la funcin de fiabilidad y la funcin de riesgo (Hazard Function) y la natural
aparicin de datos censurados.

1.4.1 El proceso de Poisson

El proceso de Poisson modeliza los tiempos entre sucesos aleatorios. Supongamos que se
observan una serie de sucesos aleatorios; concretando, supongamos que los sucesos son
fallos de unidades, de forma que las observaciones son tiempos entre fallos, por ejemplo en
sistemas reparables. Las hiptesis naturales, las cuales pueden o no satisfacerse en algn
ejemplo particular, son:

Los fallos que ocurren en intervalos de tiempo disjuntos son estadsticamente


independientes.

La tasa de fallo (media de fallos por unidad de tiempo) es constante, as que no


depende del intervalo examinado en particular.

Cuando ambas hiptesis se cumplen, entonces el proceso de aparicin de fallos se llama


proceso de Poisson con tasa de fallo .

El proceso de Poisson tiene dos propiedades importantes:

El nmero de fallos X en un intervalo de longitud t sigue una distribucin de Poisson con


media t, de tal forma que

Pr(X = k) = (t)k e-t/k! , k0

Los autores, 2003; Edicions UPC, 2003.


Conceptos fundamentales 25

Los tiempos entre fallos sucesivos son variables aleatorias independientes, cada una de
las cuales sigue una distribucin exponencial con parmetro , as que:

Pr(tiempo de fallo > t) = e-t, 0 < t <

El tiempo medio entre fallos (MTBF) es -1.

La primera propiedad est totalmente relacionada con la distribucin de Poisson de


parmetro :

X Poisson() Pr(X = k) = ke-/k!, k = 0,1,2, ...

Adems, el proceso de Poisson es un buen modelo para aquellos sistemas con muchos
componentes que pueden fallar, pero que la probabilidad de fallo de cada uno de los
componentes es pequea. Este fenmeno es conocido con el nombre de sucesos raros.

La segunda propiedad sugiere la distribucin exponencial como modelo para tiempos de


vida. La distribucin exponencial se estudiar en el captulo 2.

En las aplicaciones la hiptesis 2 puede ser crtica, ya que muchos sistemas pueden mejorar
o deteriorarse con el tiempo. En este caso se necesitan modelos ms generales como los
procesos de Poisson no homogneos (Nonhomogeneous Poisson Process) donde la tasa
de fallo no es constante. Este tipo de modelos es particularmente importante en el anlisis
de sistemas reparables. Para ampliar el tema consultar el captulo 8 del libro de Crowder y
otros (1995).

1.4.2 Preliminares de las distribuciones del tiempo de vida

Para fijar ideas, supondremos la variable aleatoria

T = "duracin de una unidad hasta el fallo"

Aqu utilizaremos tiempo en el sentido ms general. Puede ser tiempo real o tiempo
operacional o incluso cualquier variable no negativa, tal como resistencia a la rotura o
nmero de revoluciones hasta el fallo o nmero de ciclos hasta el fallo. Entonces

F(t) = Pr(T t)

es la funcin de distribucin de T y

R(t) = Pr(T > t) = 1-F(t)

es la funcin de fiabilidad o funcin de supervivencia de T. Fiabilidad (R) se utiliza en el


contexto de fiabilidad industrial y supervivencia (S) en el contexto de supervivencia en
epidemiologa.

Diremos que T tiene la funcin de densidad

dF (t ) dR(t )
f(t) = =-
dt d(t )

Los autores, 2003; Edicions UPC, 2003.


26 Fiabilidad industrial

as que la probabilidad de que una unidad falle en un intervalo de tiempo pequeo (t, t+t] es

Pr(t < T t+t) f(t)t

Consideremos el mismo suceso, t < T t+t, condicionado al hecho de que la unidad no ha


fallado antes del tiempo t. Es decir

f(t )t
Pr(t < T t+t| T>t)
R (t )

La funcin h(t) dada por

f (t ) -R (t )
h(t) = =
R (t ) R (t )

es la funcin de riesgo (hazard function) o funcin tasa de fallo, y es un indicador de la


disposicin al fallo de una unidad despus de un intervalo de funcionamiento t. La funcin de
riesgo acumulada es

t
H(t)= h(u )du
0

de donde se puede deducir

R(t) = exp{-H(t)}

Obsrvese que f, F, R, h y H son descripciones equivalentes de T en el sentido que, dada


cualquiera de ellas, se pueden deducir las otras cuatro.

A continuacin discutimos tipologas de la funcin de riesgo:

Si h(t) = es constante, entonces H(t) = t y R(t) = exp(-t), que es la funcin de


fiabilidad de una distribucin exponencial de parmetro de tasa de fallo . La
correspondiente funcin de densidad es

f(t) = e-t

As, la distribucin del tiempo de vida exponencial corresponde a dispositivos que no


envejecen, y es un punto de partida para modelar datos de fiabilidad. Esta es la etapa
de la vida de un dispositivo llamada perodo de fallo con tasa constante (constant failure
rate periode).

Si h(t) es una funcin creciente de t, entonces se dice que T tiene una tasa de fallo
creciente. Esto es apropiado cuando las unidades estn sujetas al envejecimiento
debido al desgaste, la fatiga o la acumulacin de daos. Esta es la etapa de la vida de
un dispositivo llamada perodo de fallo por desgaste (wear-out failure periode).

Los autores, 2003; Edicions UPC, 2003.


Conceptos fundamentales 27
Conceptos fundamentales p27

Si h(t) es una funcin decreciente de t, ent nces se dice que T tiene una tasa de fall
n decreciente.
Si h(t) es unaEstfuncin
puede currir, p de
decreciente r ejempl , cuand
t, entonces el prque
se dice ces de fabricacin
T tiene una tasa deprfalloduce
una pr p rcin
decreciente. apreciable
Esto de unidades
puede ocurrir, c n baja
por ejemplo, cuandocalidad que pueden
el proceso pr v car
de fabricacin un fall
produce
prec z. Pasad apreciable
una proporcin un ciert tiemp , quedan
de unidades conlas
bajaunidades
calidad de
quecalidad
puedensuperi r, l uncual
provocar falloda
una tasaPasado
precoz. de fallun cierto
inferi tiempo,
r. Esta quedan
es unalassituacin
unidadescdemn en superior,
calidad algun s lo disp
cualsitiv
da s
electrnic s. En tales cas s se s mete a veces al disp sitiv a una prueba de
una tasa de fallo inferior. Esta es una situacin comn en algunos dispositivos
resistencia
electrnicos.c Enn estrs ms se
tales casos grande
somete dela cveces
rrespalndiente a las
dispositivo a unac ndici
prueba nesdede
resistencia con estrs ms grande del correspondiente a las
funci namient para eliminar las unidades subestndares. Estas pruebas s n tpicas condiciones deen
lafuncionamiento para eliminar
industria electrnica, las unidades
y se llaman pruebassubestndares. Estases
de burn-in. Esta pruebas
la etapasondetpicas
la vidaende
la industria electrnica, y se llaman pruebas de burn-in. Esta
un disp sitiv llamada perodo de fallo precoz (early failure periode). es la etapa de la vida de
un dispositivo llamada perodo de fallo precoz (early failure periode).
Otra c sa que se debe resaltar es la funcin de riesg en f rma curva de baera (bath-
n Otra cosa que se debe resaltar es la funcin de riesgo en forma curva de baera (bath-
tub hazard), que tiene un riesg inicial decreciente per eventualmente pasa a un riesg
tub hazard), que tiene un riesgo inicial decreciente pero eventualmente pasa a un riesgo
creciente. Un escenari en el cual se puede bservar este c mp rtamient es c m
creciente. Un escenario en el cual se puede observar este comportamiento es como
sigue. L s disp sitiv s c n baja calidad tienden a tener una fallada prec z, dejand
sigue. Los dispositivos con baja calidad tienden a tener una fallada precoz, dejando
pas
paso aa l los
s dede alta
alta calidad.
calidad. Est
Estoss tienden
tienden aa hacer
hacer bajar
bajary yaacontinuacin
c ntinuacinaplanar
aplanarla la
funcin de riesg en la etapa de su vida para la cual ha sid diseada. Despus
funcin de riesgo en la etapa de su vida para la cual ha sido diseada. Despus de este de este
per d , debid
perodo, debido aa la
la fatiga,
fatiga, empieza
empieza aa crecer,
crecer,yycausa
causauna
unafuncin
funcindederiesgo
riesgcreciente.
creciente.

Tasa
Tasa de
de fallo
fallo

FFALLO
ALLO DD ESGASTE
ESGASTE
PRECOZ
PRECOZ

T
TASA
ASACONSTANTE
CONSTANTE Tiempo
Tiempo

Figura 1.2
Figura 1.2 Etapas
Etapas de
de lalavida
vidade
deun
undispositivo
disp sitiv

Observaciones: en
Observaciones: en muchas
muchas situaci
situaciones
nes de
de inters
inters aplicado
aplicad lalamayora
may radedelaslasunidades
unidades
defectu sas s n separadas (quiz c m resultad del c ntr l de calidad)antes
defectuosas son separadas (quiz como resultado del control de calidad) antesdede empezar
empezar
el perodo de observacin con lo cual es difcil encontrar funciones de riesgo decreciente. La
el per d de bservacin c n l cual es difcil enc ntrar funci nes de riesg decreciente. La
fiabilidad de algunos componentes electrnicos, puede ser tan alta que el equipo del que
fiabilidad de algun s c mp nentes electrnic s, puede ser tan alta que el equip del que
formaran parte quedar obsoleto antes de llegar a la fase de desgaste, por lo cual en este
f tipo
rmaran parte quedar bs let antes de llegar a la fase de desgaste, p r l cual en este
de productos no interesa la etapa del perodo de envejecimiento.
tip de pr duct s n interesa la etapa del per d de envejecimient .
En algunos productos el perodo de fallo precoz no forma parte de su vida comercial, ya que
Ensealgun
organizas prla duct s el per
produccin d deque
de forma fall elprec
fallo z n f rma
precoz se dparte dede
dentro sulavida c mercial,
fbrica. Por estoyase
que
sesomete
rganiza la pr duccin
a veces de f rma
al dispositivo que prueba
a una el fall prec z se d dentr
de resistencia de la fbrica.
con estrs P r estdelse
ms grande
s correspondiente
mete a veces a al las
dispcondiciones
sitiv a una prueba de resistencia c n estrs
de funcionamiento. Estas pruebas son tpicas ms grande
en ladel
c industria
rresp ndiente a las c ndici nes de funci namient . Estas pruebas
electrnica, y se llaman pruebas de burn-in. Y es por esto, que en muchos s n tpicas en la
industria electrnica, y se llaman pruebas de burn-in. Y es
productos solamente interesa la etapa perodo de fallo con tasa constante. p r est , que en much s
pr duct s s lamente interesa la etapa per d de fall c n tasa c nstante.
Es difcil encontrar modelos probabilsticos para modelar funciones de riesgo con curva de
Es difcil Pueden
baera. enc ntrar m del s pr
encontrarse babilstic
estudios donde s para m este
se trata delarproblema
funci nes ende riesg
Gaver c n(1979).
y Acar curva de
baera. Pueden enc ntrarse estudi s d nde se trata este pr blema en Gaver y Acar (1979).

Los autores, 2003; Edicions UPC, 2003.


28 Fiabilidad industrial

Ejemplo 1. 5

El siguiente grfico es la tasa de fallo de la tabla de mortalidad de Halley (ejemplo 1.4).


Obsrvese que tiene forma de curva de baera.

0,25
0,2
0,15
0,1
0,05
0
5
10

15 5
20 0
25 5
30 0
35 5
40 0
45 5
50 0
55 5
60 0
65 5
70 0
75 5
80 0
5
0-

-1
-2
-2
-3
-3
-4
-4
-5
-5
-6
-6
-7
-7
-8
-8
5-
10

AOS

1.5 Enfoques de la fiabilidad

Para finalizar este captulo, y a manera de sntesis podemos decir que la fiabilidad en la
industria se puede enfocar desde un punto de vista cuantitativo o cualitativo.

Desde el punto de vista cuantitativo, tenemos herramientas como la curva de fiabilidad, la


curva de degradacin o las caractersticas de fiabilidad para cuantificar el comportamiento
de la vida de los dispositivos. Estos conceptos ya han sido desarrollados a lo largo de este
captulo.

Desde el punto de vista cualitativo las herramientas que se utilizan en la industria son el
Anlisis de modo de fallo y sus efectos (AMFE) y los anlisis por rboles de fallos FTA
(failure tree analysis). Este ltimo se desarrollara en el captulo 5.

El anlisis modal de fallos y sus efectos es un sistema metdico de valoracin de


prioridades de riesgos de un proceso o producto con el propsito de reconocer y evaluar
fallos potenciales de un producto o proceso y sus efectos, identificar acciones que puedan
eliminar o reducir el riesgo de los potenciales fallos y documentar el proceso.

Fue desarrollado por la NASA en el proyecto Apolo a mediados de los aos 70. Despus de
las aplicaciones en los viajes areos y espaciales as como en las centrales nucleares se
utiliz de inmediato en la industria de la automocin; actualmente es una herramienta de uso
habitual en la industria.

Es una tcnica de carcter preventivo que debe llevarse a cabo en las fases de diseo y
desarrollo de productos y servicios a lo largo del proceso de fabricacin para que se puedan
detectar y prevenir los posible modos de fallo potenciales.

En el manual Potential Failure Mode and Effects Analysis de la QS 9000, normativa del
sector de la automocin Ford, Opel y General Motors, pueden encontrase las ideas
fundamentales de esta tcnica y la manera de aplicarlas.

Los autores, 2003; Edicions UPC, 2003.


Fiabilidad con tasa de fallo constante 29

2 FIABILIDAD CON TASA DE FALLO CONSTANTE

En este captulo se aborda el modelo exponencial que, como hemos mencionado en el


apartado 1.4, es un punto de partida natural como distribucin en fiabilidad. Se introducen
las muestras aleatorias no completas y el concepto de datos censurados. Se plantea la
estimacin de la vida media y la tasa de fallo para distintos tipos de pruebas de vida.

2.1 El modelo Exponencial

La funcin de fiabilidad de una variable aleatoria T = "Tiempo de vida hasta el fallo de un


dispositivo", cuya distribucin es expo-nencial, se expresa como

-t
R(t) = Pr(T > t) = exp(-t) = exp , t > 0

donde es un parmetro positivo, denominado tasa se fallo, y =1/ es otra parametrizacin


habitual de la distribucin exponencial que representa la media del tiempo de vida . La figura
2.1 muestra dos funciones de fiabilidad.

Utilizando las frmulas del apartado 1.4 se deduce que h(t), la funcin de riesgo (hazard
function) de la distribucin exponencial es constante:

-R (t )
h(t) = =
R (t )

En este caso se llama tasa de fallo.

La funcin de densidad exponencial tiene la expresin:

1 t
f(t) = exp(-t) = exp - , t >0

Para cualquier valor de la forma de la funcin de densidad es siempre la misma. As, por
ejemplo, si el tiempo en minutos, T, de cierto dispositivo es exponencial con tasa de fallo ,
el tiempo en horas es T*=T/60, y T* se distribuye exponencial con tasa de fallo 60. La
figura 2.2 muestra dos funciones de densidad exponencial.

La funcin de distribucin exponencial viene dada por:

F(t) = Pr(T t) = 1- exp(-t), t>0

La media o esperanza matemtica de la exponencial se deduce de


E(T) = tf (t )dt = = 1/
0

Los autores, 2003; Edicions UPC, 2003.


30 Fiabilidad industrial

y la varianza


Var(T) = (t - )2 f (t )dt = 2 = (1/)2
0

En el captulo 3 veremos que la funcin exponencial es un caso especial de la distribucin


de Weibull.

El ejemplo 2.1 ilustra la interpretacin de las caractersticas de fiabilidad de la distribucin


exponencial.

F ia b ilid a d

1
0 ,8 =5
0 ,6
R(t)

0 ,4 =10
0 ,2
0
0 0 ,2 0 ,4 0 ,6 0 ,8 1 1 ,2
T

Figura 2.1 Funcin de fiabilidad exponencial


con tasa de fallo = 5 (slido) y = 10 (punteado)

D e n s id a d

10
8 =10
6
f(t)

=5
4
2
0
0 0 ,1 0 ,2 0 ,3 0 ,4 0 ,5 0 ,6 0 ,7 0 ,8
T

Figura 2.2 Funcin de densidad exponencial


con tasa de fallo = 5 (slido) y = 10 (punteado)

Los autores, 2003; Edicions UPC, 2003.


Fiabilidad con tasa de fallo constante p31

Ejemplo 2.1 Cambio de un motor Diesel

La duracin en km del cambio de un motor Diesel de un automvil sigue una ley exponencial
de vida media = 300.000 km. La tasa de fallo es = 1/300.000 = 310-6 fallos/km o 3 fallos
por 1 milln de km de funcionamiento.

La direccin de una fabrica quiere decidir si es necesario redisear los equipos actuales
para poder mantener la garanta, que es actualmente de 20.000 km de funcionamiento.

Se calcula la probabilidad de que fallen antes de 60.000:

20.000
Pr(T 20.000) = F(20.000) = 1-R(20.000) = 1-exp - = 0,0645
300.000

Esto indica que un 6,45% de los cambios fallan durante la garanta.

La direccin de la empresa quiere saber en qu valor tiene que fijar la garanta para que
fallen nicamente un 5% de los cambios de los motores.

Para esto se plantea cul ha de ser el valor k de la variable aleatoria T para que
F(t) = 1-R(k) = 0,05, es decir R(k) = Pr(T > k) = 0,95, de donde se deduce:

k
R(k) = exp - = 0,95 k = -ln(0,95)x300.000 = 15.388 km
300.000

La magnitud k = 15.388 km representa el percentil del 5% de la distribucin de la variable


aleatoria T, km hasta el fallo de un cambio del motor.

Conclusin: Si la direccin desea que slo fallen un 5% de los cambios del motor durante el
perodo de garanta debera fijarla en 15.388 Km. de funcionamiento. En caso de querer
mantener los 20.000 Km. debera redisear los cambios. Es importante remarcar que esto
se ha hecho suponiendo que el modelo exponencial es adecuado para modelar los km de
funcionamiento hasta el fallo de los cambios de los motores.

2.2 Datos censurados

Frecuentemente los datos de tiempo de vida tienen observaciones incompletas. El


tratamiento estadstico y en particular la estimacin de las caractersticas de fiabilidad
cambia respecto a la estimacin clsica de muestras completas.

Este tipo de datos se denominan datos censurados. El mecanismo de censuramiento puede


ser por la derecha, por la izquierda y por intervalo. En principio el tiempo de vida de las
unidades no depende del mecanismo de censuramiento.

Ocurre comnmente que el valor exacto del tiempo de vida de una unidad no es observado
pero se sabe que excede de un cierto tiempo c. Tales tipos de observaciones reciben el
nombre de censuradas por la derecha. Una observacin de este tipo aparece cuando la
unidad an no ha fallado cuando termina el tiempo previsto de la prueba de vida.

Los autores, 2003; Edicions UPC, 2003.


32 Fiabilidad industrial

El censuramiento por la izquierda aparece cuando de la unidad se conoce que ha fallado


algn tiempo antes c. Por ejemplo cuando el test sobre la unidad se hace cada hora. Si una
unidad ha fallado antes de la primera hora entonces de la unidad slo se sabe que el tiempo
de vida es inferior a una hora. En este escenario puede darse que una unidad falle entre la
segunda y la tercera hora (es decir, que la unidad trabaje en el segundo test y en el tercero
ya no funcione). Entonces sabemos que la unidad ha durado ms de dos horas pero menos
de tres horas. Este es un ejemplo de censuramiento por intervalo.

Un posible mecanismo de censuramiento, conocido como tipo I, es cuando se ponen n


unidades en un ensayo y a priori se fija un periodo t0 de la prueba. Entonces, los i-simos
tiempos de vida Ti (i = 1, ... ,n) que se observan son los que Ti t0, mientras que hay otros
de los que slo se sabe que Ti > t0. Este tipo de censuramiento es fcil de tratar
estadsticamente.

Otro tipo de mecanismo de censuramiento puede darse cuando se hace un test a n


unidades y cada unidad es observada hasta que el observador est convencido de que la
unidad ha empezado a fallar. El punto de vista del observador se basa en su experiencia y
no en puras suposiciones. En este caso, el mecanismo de censuramiento contiene
informacin de inters sobre los tiempos de vida. Esta situacin se puede formalizar de la
siguiente forma: sea Ti censurada por la derecha por ci; entonces se sabe que Ti > ci y
adems Ti = ci + i, donde i es una variable aleatoria positiva de media cero y varianza
pequea (su pequeez depende de la experiencia del observador). As, segn este
esquema, una unidad censurada en ci puede no ser representativa de todas las unidades
que tienen un tiempo de vida ci o superior. Este tipo de mecanismo de censuramiento debe
tratarse con mtodos estadsticos ms complejos que no se desarrollarn en este texto.
(Puede consultarse Crowder y otros (1995).)

Una forma de censuramiento habitual en estudios de fiabilidad es el censuramiento por la


derecha llamado tipo II. En este caso se fija la duracin del ensayo hasta despus de haber
observado un nmero especificado de unidades que fallen. Obsrvese que el tiempo de
censuramiento por la derecha (o tiempos, si todas las unidades no se han puesto en
funcionamiento a la vez) no es (son) conocido (s) por avanzado. Pueden encontrarse otras
formas ms complicadas de censuramiento por la derecha, pero deben tratarse de manera
particular cada una de ellas, sabiendo que cualquier unidad censurada por la derecha en ci
es representativa de todas las unidades similares que tienen un tiempo de vida superior a ci.
Para el censuramiento por la izquierda y por intervalo pueden aplicarse criterios similares.

Dada una muestra aleatoria simple de la variable de inters T si la realizacin de la muestra


es completa, es decir, si disponemos de todos los tiempos de vida, se trata de pruebas de
vida con datos completos. Si la realizacin de la muestra es incompleta, por lo tanto no
hemos observado todos los fallos, se trata de pruebas de vida con datos censurados.

2.3 Estimacin de la vida media y la tasa de fallo de la distribucin exponencial

Sea T = "tiempo de vida de una unidad", una variable aleatoria que se distribuye exp().

Sea T1, T2, ... , Tn una muestra aleatoria de T. Se define el tiempo total de test T, como la
suma de los tiempos de funcionamiento de las unidades de la muestra (hayan fallado o no).

Los autores, 2003; Edicions UPC, 2003.


Fiabilidad con tasa de fallo constante 33

El valor estimado de la vida media viene dada por

T
MTTF = =
r

^ indica la estimacin del parmetro , la vida media hasta el fallo. T es el tiempo total en
test y r es el nmero de fallos observados. Cuando la muestra es completa r coincide con n,
tamao de la muestra.

El valor estimado de la tasa de fallo = 1/ viene dado por

r
=
T

donde T es el tiempo total de test y r es el nmero de fallos observados. Obviamente aqu


tambin, para una muestra completa r, coincide con n.

2.4 Pruebas con datos completos. Intervalos de confianza 1- para la vida media
y la tasa de fallo

El intervalo de confianza bilateral 1- para la vida media es

2T 2T
(2.1)
2
(1-/2);2n 2
(/2);2n

donde T es el tiempo total de test de una muestra de tamao n y 1-2 ; es el (1-)-percentil


2
de la distribucin con grados de libertad, en este caso = 2n, donde n es el tamao de
la muestra.

El intervalo de confianza unilateral 1- para la vida media es

2T
(2.2)
(1-2 );2n
donde T es el tiempo total en test de una muestra de tamao n y 2; es el (1-)-percentil de
la distribucin 2 con grados de libertad, en este caso = 2n.

El intervalo de confianza bilateral 1- para la tasa de fallo es

(2/2);2n (1-2 /2);2n


(2.3)
2T 2T

donde T es el tiempo total de test de una muestra de tamao n y 2; es el -percentil de la


2
distribucin con grados de libertad, en este caso = 2n.

Los autores, 2003; Edicions UPC, 2003.


34 Fiabilidad industrial

De forma similar, se puede definir el intervalo de confianza unilateral 1- para la tasa de


fallo

2;2n (2.4)
2T

Ejemplo 2.2

La siguiente tabla presenta los datos obtenidos en una prueba de vida en que se midieron
los tiempos de perforacin (time to breakdown) en minutos, de un fluido aislante entre
electrodos sometido a un voltaje de 34 kV. El experimento dur hasta que todos los
componentes (n = 19) fallaron.

(fuente W. Nelson 1982)

Sea la variable aleatoria T= "Tiempo, en minutos, de un fluido aislante sometido a 34 kV" y


supongamos que T es exponencial.
n
El tiempo total de test es T = t
i=1
i = 272,82 minutos, donde t1,...,tn es la realizacin de la

muestra de la variable aleatoria T.

T
La media del tiempo de vida en minutos es = = 272,8191/19 = 14,3589 minutos.
n

El intervalo de confianza 0,95, aplicando la frmula (2.1), de la media del tiempo de vida es

9,59 23,85

En los anexos se encuentran las tablas de 2 donde los percentiles de la distribucin 2,


son para este caso:

0,025;38
2
= 22,8785 0,975;38
2
= 56,8955

lo que indica que la vida media de un fluido sometido a un voltaje de 34kV se encuentra
entre 9,59 y 23,85 minutos con una confianza del 0,95.

La tasa de fallo se estima como = 1/ = 0,0696, de donde se deduce que la tasa de fallo
es de 0,0696 fallos por minuto.

Aplicando la frmula (2.3) se calcula el intervalo de confianza 0,95 para la tasa de fallo:

0,0419 0,1043

lo que indica que la tasa de fallo de un fluido sometido a un voltaje de 34kV se encuentra
entre 0,042 y 0,10 fallos por minuto.

Los autores, 2003; Edicions UPC, 2003.


Fiabilidad con tasa de fallo constante 35

La funcin de fiabilidad estimada o evaluada es

-t
R(t) = exp , t0
14,36

de donde podemos decir que la fiabilidad evaluada a 15 minutos sera 0,35, es decir, que el
35% de los componentes sometidos a un voltaje constante de 34kV superaran los 15
minutos.

El intervalo de confianza 0,975 unilateral para R(15) es

exp(-15/9,59) = 0,21 R(15)

Es decir, que con una confianza del 0,975 podemos asegurar que el 21% de los
componentes superaran los 15 minutos.

Nota: Obsrvese que para el clculo del intervalo de confianza unilateral 0,975 para R(15)
utilizamos el lmite inferior del intervalo de confianza 0,95 de la estimacin de la media del
tiempo de vida.

2.5 Pruebas de vida con duracin prefijada (Censuramiento tipo I)

2.5.1 Tiempos de fallo conocidos

Supongamos un experimento en el que tenemos n dispositivos y prefijamos un tiempo t0 de


duracin y se registran los tiempos de fallo. Este tipo de prueba admite dos variantes, segn
si se reemplazan o no los dispositivos. En el primer caso se dice que la prueba se realiza
con sustitucin. Los dos tipos de prueba tienen un tratamiento matemtico parecido, las
pruebas con sustitucin no tienen otra finalidad que aumentar el tamao de la muestra.

Al cabo de t0 horas observamos r < n fallos.

En este caso el tiempo total en test T viene dado por:

r
T= t +(n-r )t
i=1
i 0 , donde ti t0

Si las pruebas son con sustitucin, T = n x t0.

La estimacin de la vida media es

= MTTF = T/r (2.5)

El intervalo de confianza bilateral 1- es

2T 2T
(2.6)
2
1-(/2);2r +2 2
(/2);2r

Los autores, 2003; Edicions UPC, 2003.


36 Fiabilidad industrial

donde T es el tiempo total de test de una muestra de tamao n y 2; es el -percentil de la


distribucin con grados de libertad y donde r(<n) es el nmero de fallos observados de
2

la muestra.

El intervalo de confianza unilateral se obtiene sustituyendo en la frmula (2.6) /2 por en


un solo lmite. Hay una ilustracin en el ejemplo 2.3.

Si durante el perodo previsto para la prueba no se observa ningn fallo, es decir r = 0, no


podemos dar un valor para ni para R(t0), pero s lmites de confianza inferiores para la vida
media y la fiabilidad.

Ejemplo 2.3

Se realiza una prueba de vida con n = 12 componentes durante una semana, es decir
fijando el tiempo de duracin en t0 = 168 horas, con substitucin, observndose r = 3 fallos.
Se quiere evaluar la fiabilidad al cabo de 168 horas y la vida media en horas de
funcionamiento. El tiempo total en test T es de 168 x 12 = 2.016 horas.

La vida media en horas de funcionamiento aplicando la frmula (2.5) es

= MTTF = T/r = 2.016/3 = 672 horas.

Sustituyendo por /2 en el lmite inferior de la frmula (2,6) se obtiene un lmite inferior de


confianza 0,95 para la vida media de

2x2016
2 =259,96 horas
0,95;8
donde 0,95;
2
8 = 15,51 se encuentra en las tablas estadsticas del Anexo. Lo que indica que

estos dispositivos tienen una duracin media mnima de 259,96 horas, y esta afirmacin se
hace con una confianza del 0,95.

La fiabilidad estimada al cabo de 168 horas es

R (168) = exp(-168/672) = 0,78

lo que indica que 78% de los dispositivos superan una semana.

Obsrvese que sta es una estimacin puntual sin ningn grado de confianza. Se podra
precisar ms dando una aproximacin por intervalo de confianza. Utilizando el lmite de
confianza inferior de la estimacin de la vida media se obtiene con un 95% de confianza:

R (168) exp(-168/259,96) = 0,524

Es decir, la probabilidad de que una pieza funcione al cabo de 168 horas es superior al
52,4% con una confianza del 95%.

Los autores, 2003; Edicions UPC, 2003.


Fiabilidad con tasa de fallo constante 37

Si durante este perodo de 168 horas los n=12 componentes no hubiesen fallado, es decir,
no se hubiese observado ningn fallo, podramos asegurar, con una confianza del 95%, que
la vida media de estos dispositivos es superior a:

2x2.016 4.092
= =673,12
0,95;2
2
5,99

Sustituyendo por = 673,12 obtenemos R (168) = exp(-168/673,12) = 0,78, que nos da un


lmite inferior de confianza para la fiabilidad al cabo de una semana, que se puede
interpretar como que la probabilidad de que un componente no haya fallado al cabo de una
semana es superior al 78%, con una confianza del 95%.

2.5.2 Pruebas de vida donde no se registran los tiempos de fallo

En los estudios de fiabilidad en la industria pueden plantearse pruebas de vida donde, fijado
un tiempo de duracin t0, slo se pueda obtener el nmero de fallos y no se registre el
tiempo de fallo de cada unidad. En este caso puede calcularse la fiabilidad en el momento t0
como:

n- r
R(t0)= (fiabilidad observada)
n

donde n es el tamao de la muestra y r son los fallos observados.

El intervalo de confianza 1- para la fiabilidad al cabo de t0 horas viene dado por

1 F1
R (t0 ) (2.7)
1+ (r +1)/(n -r ) F2 F1+(r /n - r +1))

donde F1 = F (1- 2 ;2n -2r +2;2r ) y F2 = F (1- 2 ;2r +2;2n -2r ) son los (1-/2) percentiles de la distribucin F
con 2n-2r+2 y 2r grados de libertad y 2r+2 y 2n-2r respectivamente. Los percentiles del 0,90
y 0,95 de la distribucin F se encuentran en las tablas estadsticas del Anexo.

De la misma manera que en la frmula 2.6, puede obtenerse el intervalo unilateral inferior
sustituyendo /2 por en el lmite inferior de la frmula (2.7). El comentario se ilustra en el
ejemplo 2.4.

Las frmulas para obtener la fiabilidad observada y el intervalo de confianza anteriores,


obviamente no dependen de la distribucin de los datos. Si por estudios anteriores o por la
naturaleza de los datos puede suponerse que el modelo exponencial es vlido, se puede
estimar la vida media como:

-t 0 -t 0
= = (2.8)
lnR (t 0 ) n-r
ln
n

Los autores, 2003; Edicions UPC, 2003.


38 Fiabilidad industrial

Ejemplo 2.4

Se dispone de n = 20 unidades de un dispositivo durante una semana, 168 horas. Al finalizar


la semana slo se observa que han fallado 5 unidades.

La fiabilidad observada de este producto al cabo de una semana R(168) = 15/20 = 0,75
horas, lo que indica que un 0,75% de los dispositivos superan la semana. Esta aproximacin
es sin grado de confianza.

Sustituyendo /2 por en el lmite inferior de la frmula (2.7) el intervalo de confianza 0,95


unilateral al cabo de 1 semana es:
1 1
0,54 = = R (168)

1+ (5+1)/(20-5) F2 1+(r +1)/(n - r ) F2

donde F2 = F(0,95;12;30) = 2,09, n es el tamao de la muestra y r el numero de fallos
observados. Con lo que se puede afirmar que la fiabilidad del dispositivo al cabo de una
semana es superior al 54%, con una confianza del 95%.

Si podemos suponer que los tiempos de vida (no registrados) se distribuyen exponencial, a
partir de la frmula (2.8) una estimacin puntual de la vida media es:
-168
= = 583,9 horas
15
ln
20

El intervalo unilateral inferior con una confianza del 95%, utilizando el lmite de confianza
inferior obtenido para la fiabilidad en la frmula 2.8, es:
-168
= 272,6
ln(0,54)

Concluimos que la validez del modelo exponencial permite asegurar que la vida media es
superior a 272,6 horas, con una confianza del 95%.

2.6 Pruebas de vida con nmero de fallos prefijados (Censuramiento tipo II)

Supongamos una prueba donde especifiquemos previamente el nmero de componentes


que estamos dispuestos a esperar que fallen. Este tipo de prueba se utiliza cuando el coste
de los dispositivos es elevado, o en la fase de desarrollo del producto donde se dispone de
pocos prototipos.

Sea r el nmero de fallos prefijado; entonces la muestra ordenada de los tiempos ser
t(1), t(2), ... ,t(r), t(r+1), ... ,t(n) y el tiempo total de test

T = t(1) + t(2) + ... + t(r) + (n-r)t(r)

Nota: Una muestra ordenada es cuando t(1) t(2) ... t(r) < t(r+1) ... t(n), donde el subndice
entre parntesis sirve para distinguirla de una muestra aleatoria simple.

La estimacin de la vida media es:

Los autores, 2003; Edicions UPC, 2003.


Fiabilidad con tasa de fallo constante 39

= MTTF = T /r

El intervalo de confianza bilateral 1- de la vida media:

2T 2T

2
(1- /2);2 r 2
( /2);2 r

Igual como se ha desarrollado en el apartado 2.5 se obtiene una estimacin de la fiabilidad y


los intervalos de confianza (1-) bilaterales y unilaterales sustituyndose el valor estimado
de en la frmula de la fiabilidad de una exponencial. En el ejemplo 2.5 se desarrollan
algunos de estos clculos.

Ejemplo 2.5

Sea una prueba de vida donde se ponen en funcionamiento 12 dispositivos y se detiene la


prueba una vez han fallado r = 4 dispositivos. Los tiempos de los 4 primeros fallos han sido:
175,2 185,5 215,2 y 315,7 horas.

Se quiere evaluar la vida media de los dispositivos y la fiabilidad al cabo de 200 horas de
funcionamiento.

El tiempo total de test es

T = t(1) + t(2) + ... + t(r) + (n-r)t(r) = 175,2 + 185,5 + 215,2 + 315,7 + 8x315,7 = 3.417,2 horas.
La estimacin de la vida media es
= MTTF = T/r = 854,3 horas.
El intervalo de confianza bilateral 0,90 es

2x3.417,2 2x3.417,2
440,64= =2.503,44
2
0,95;8
2
0,05;8
donde 0,95;8
2
= 15,51 y 0,05;8
2
= 2,73.

Utilizando la estimacin puntual de la vida media y sustituyendo en la frmula de la fiabilidad


-t
de una distribucin exponencial R(t)=exp , se obtiene una estimacin puntual de la

fiabilidad a las 200 horas de funcionamiento:
R(200) = exp(-200/854,3) = 0,79

lo que indica que un 79% de los dispositivos superan las 200 horas.
Para calcular el intervalo unilateral de la fiabilidad a las 200 horas se sustituye el lmite
inferior de la estimacin por el intervalo de la vida media del dispositivo en la expresin de la
fiabilidad. Se obtiene
R(200) exp(-200/440,64) = 0,45

Por lo tanto, la fiabilidad estimada al cabo de 200 horas ser superior al 0,45, con una
confianza del 95%.

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 41

3 TASA DE FALLO NO CONSTANTE. EL MODELO DE WEIBULL Y OTROS

Este captulo trata el modelo de Weibull, que permite modelar tasas de fallo no constante,
crecientes y decrecientes. Tambin se tratan otras distribuciones como la Gumbel, la Normal
y la lognormal. Se describen los grficos de probabilidad como herramienta para validar el
modelo de Weibull y estimar sus parmetros. Se expone brevemente el mtodo de
estimacin de la mxima verosimilitud y se proponen estimadores para los parmetros
basados en este mtodo.

3.1 Modelo de Weibull

La funcin de fiabilidad de una variable aleatoria T = "tiempo de vida de un dispositivo" de


una distribucin de Weibull(,) es

t
R(t) = Pr(T > t) = exp , t 0 (3.1)

donde y son parmetros positivos, un parmetro de escala (scale) y un parmetro de


perfil o de forma (shape). Ntese que cuando =1, se obtiene una distribucin exponencial
de = 1/. En la figura 3.1 puede verse la forma de 4 funciones de fiabilidad con el mismo
parmetro =1 y distintos valores de .

La funcin de riesgo (hazard function) de Weibull es

h(t) = -t-1

Si < 1 la funcin de riesgo o tasa de fallo disminuye al aumentar el tiempo. Este


comportamiento es propio de los fallos prematuros. Productos con esta tasa de fallo suelen
ser verificados en fbrica para que los fallos no se produzcan en el mercado.

Si = 1 (modelo exponencial) la funcin de riesgo es constante. Una tasa de fallo constante


es una caracterstica de los fallos ocasionales. En esta situacin el nmero de fallos y el
momento en que ocurren no depende del tiempo que el dispositivo funciona.

Si > 1 la funcin de riesgo es creciente. Esto indica que los fallos son debidos al
envejecimiento, a la fatiga o al desgaste. En particular si 1 < < 2, la funcin de riesgo crece
rpidamente al principio y muy poco al final; para = 2 la funcin de riesgo crece
linealmente con el tiempo; para > 2 crece poco al principio y rpido posteriormente, es
decir, el intervalo de tiempo en el cual se produce un fallo es cada vez menor. Es
recomendable que los dispositivos con tasa de fallo creciente tengan un plan de
mantenimiento preventivo.

En la figura 3.2 se muestra una seleccin de funciones de riesgo Weibull, crecientes,


decrecientes y constantes.

Los autores, 2003; Edicions UPC, 2003.


42 Fiabilidad industrial

El p-percentil (tp) en la distribucin Weibull se calcula a partir de la expresin:

tp = [-ln(1-p)]1/

que se deduce de despejar tp en:

p = Pr(T tp) = 1-R(tp) = 1-exp[-(tp/)] (3.2)

El parmetro es aproximadamente el percentil del 63,2%, se interpreta como el valor de la


variable del tiempo de vida en el que fallan el 63,2% de las unidades, y se obtiene
sustituyendo en la frmula (3.2) y aproximando 1-e-1 0,632. Esta propiedad se utiliza en
la estimacin grfica de los parmetros de la Weibull, herramienta bastamente utilizada en la
industria.

En particular la mediana (0,5-percentil) de la distribucin Weibull es:

t0,5 = [-ln(1-0,5)]1/ = [(0,6931)]1/ (3.3)

=8

0,8

0,6

0,4

= 3,5
=2

0,2

=1

0
0 0,5 1 1,5 2 2,5 3 3,5

Figura 3.1 Funciones de fiabilidad de Weibull con = 1 y = 1; 2; 3,5 y 8

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 43

6
=2,5

=2
4
=0,5

2 =1

0
0 0,5 1 1,5 2

Figura 3.2 Funciones de riesgo de Weibull con = 1 y = 0,5; 1; 2 y 2,5.

La funcin de densidad de Weibull es:

-1 t
f(t) = t exp - , t > 0

La media viene dada por

E(T) = = (1+(1/)) (3.4)

y la varianza por

Var(T) = 2[ (1+(2/)) - (1+(1/))2] (3.5)

donde la funcin es

0 u
x -1 -u
(x) = e du

En el anexo de tablas estadsticas se encuentra la funcin tabulada.

Cuando es grande (mayor que 5), la media y la varianza se pueden aproximar por y
1,642/2 respectivamente.

La forma de la densidad depende del valor de . En la figura 3.3 se muestran una seleccin
de funciones de densidad.

La distribucin de Weibull es probablemente la ms utilizada en anlisis de la fiabilidad.


Proporciona modelos razonables para tiempos de vida de muchos tipos de unidades
distintas, tales como tubos de vaco, cojinetes de bola y envejecimiento de materiales
composites. Una posible razn de esta adecuacin es el hecho de que es una distribucin
de valores extremos. De todas maneras, la forma de la funcin de fiabilidad y la amplia
variedad de formas de la funcin de densidad la hacen una generalizacin
convenientemente particular de la distribucin exponencial.

Los autores, 2003; Edicions UPC, 2003.


44 Fiabilidad industrial

3,5
3
= 8
2,5
2
1,5
= 1 = 3,5
1
=2
0,5
0
-0,5 0 0,5 1 1,5 2 2,5 3

Figura 3.3 Funciones de densidad de Weibull con = 1 y = 1; 2; 3,5 y 8.

Ejemplo 3.1

Sea T el tiempo de vida del tambor de una lavadora, que se distribuye segn un modelo de
Weibull con parmetros =10 aos y =2.

El parmetro =10 aos indica que un 36,8% de las bobinas duran ms de 10 aos, puesto
que a es percentil del 0,632 de la distribucin del tiempo de vida.

El parmetro =2 indica que tiene una funcin de riesgo linealmente creciente con el tiempo
(figura 3.2). Esto indica que los fallos son debidos al envejecimiento.

La vida media de las bobinas, aplicando la frmula (3.4), es:

= (1+(1/)) = 10(1+(1/2)) = 10x0,886 = 8,86 aos

Nota: (1+(1/2)) = 0,886 se encuentra en las tablas de estadstica (5).

La mediana de la distribucin es (3.3):

t0.5 = -[-ln(1-0,5)]1/ = 10[0,6931]1/2 = 8,32 aos

lo que indica que la mitad de las bobinas durarn 8,32 aos.

La varianza de la distribucin (3.4) es

Var(T) = 2[ (1+(2/)) - [(1+(1/))]2] = 21,5 aos2

Y la desviacin estndar 4,64 aos.

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 45

Si la garanta de los tambores es de 2 aos, qu proporcin de tambores fallarn durante


la garanta?

Sea la variable aleatoria T = "tiempo de vida en aos de los tambores":

Pr(T 2) = 1-R(2) = 1-exp[-(2/10)2] = 0,039

donde R es la funcin de fiabilidad.

Es decir, un 3,9 % de las bobinas fallarn durante la garanta.

Cuntos aos de garanta se deberan establecer para que nicamente fallasen un 1%


durante la garanta?

R(t0,01) = exp[-(t0,01/10)2] = 0,99 ln(0,99) = -(t0,01/10)2


2
t 0,01 = -ln(0,99)x100 = 1,005 aos2 t0,01 = 1,0025 aos

Es decir, se aconsejara fijar la garanta en 1 ao.

3.2 Otras distribuciones de fiabilidad

La distribucin de Gumbel, o del valor extremo, o Gompertz, tiene funcin de fiabilidad:

R(x) = exp{exp[(x-)/], - < x < +

donde es el parmetro de localizacin y > 0 es el parmetro de escala. Esta distribucin


tambin surge como una posible distribucin lmite de valores mnimos y tiene una tasa de
fallo o funcin de riesgo (figura 3.4) exponencialmente creciente. Ms comnmente, sin
embargo, surge como distribucin del logT, donde T es una distribucin de Weibull. La
relacin en este caso es = log y = 1/.

La funcin de densidad de Gumbel es

f(x) = -1exp{(x-)/}R(x), - < x < +

Para todos los parmetros tiene la misma forma. La figura 3.4 muestra la funcin de
densidad y la funcin de riesgo de una distribucin de Gumbel con = 0 y = 1, donde
puede observarse que la funcin de riesgo es creciente.

Los autores, 2003; Edicions UPC, 2003.


46 Fiabilidad industrial

Funcin de densidad de una distribucin de Gumbel

0,4

0,3

0,2

0,1

0
-4 -3 -2 -1 0 1 2

Funcin de riesgo de una distribucin de Gumbel

1,5

0,5

0
-4 -3 -2 -1 0 1

Figura 3.4 Funciones de densidad y de riesgo de Gumbel para = 0 y 2 = 1

La distribucin ms frecuentemente utilizada en estadstica es la distribucin Normal cuya


densidad de probabilidad es

f(x) = (22)-1/2exp {-(x-)2/ (22)}

para - < x < +, con media y varianza 2. Cuando = 0 y = 1, se tiene la distribucin


Normal estndar. La forma de la funcin de densidad es la conocida campana de Gauss y
la funcin de riesgo o tasa de fallo es una funcin creciente.

Algunas veces se utiliza la distribucin Normal como distribucin del tiempo de vida, aunque
da valores negativos con probabilidad positiva. Ms frecuente es el uso como modelo para
logT, logaritmo del tiempo de vida, que es equivalente a considerar la distribucin lognormal
para los tiempos de vida.

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 47

Funciones de densidad de la distribucin Normal

1,5

0,5

0
-3,5 -2,5 -1,5 -0,5 0,5 1,5 2,5 3,5

Funciones de riesgo de la distribucin Normal

25
20
15
10
5
0
-1 -5 0 1 2 3 4

Figura 3.5 Funciones de densidad y de riesgo de la distribucin Normal para = 1; 0,5 y 0,25 y = 0.

La densidad lognormal viene dada por

f(t) = (22t2)-1/2exp {-(log t-)2/ (22)}, t > 0

La media y la varianza de la distribucin lognormal son exp(+1/22) y exp(2+2){exp(2)-1}


respectivamente.

Para valores pequeos de la distribucin lognormal se parece a la normal. La utilizacin


de estos modelos en las aplicaciones est justificada cuando las variables T o logT se puede
suponer que son el resultado de la suma de un gran nmero de efectos pequeos,
justificacin terica basada en el teorema del lmite central.

Las funciones de fiabilidad y de riesgo de la Normal y la lognormal slo pueden expresarse


en trminos de integrales. La grfica de la funcin de riesgo de la distribucin lognormal
crece al principio, eventualmente decrece, y tiende a 0 para t . Este comportamiento es
justo al revs de lo que uno espera del tiempo de vida de una unidad en la prctica. Tal
como se ha discutido en el apartado 1.4, la funcin de riesgo a lo largo de todas las etapas
de la vida de un dispositivo suele tener forma de curva de baera, y es de esperar que el
tiempo de vida de un componente a largo plazo tenga una funcin de riesgo creciente
debido al envejecimiento.

Los autores, 2003; Edicions UPC, 2003.


48 Fiabilidad industrial

En algunos casos solamente se producen fallos despus de un cierto tiempo g


predeterminado (por ejemplo, el nmero de ciclos hasta la rotura del muelle de cierre de un
cinturn de seguridad presenta un nmero de ciclos -que aqu sustituye al tiempo- sin fallos
muy marcado). En estas circunstancias interesa trabajar con las distribuciones definidas con
otro parmetro de traslacin o de localizacin. Por ejemplo la densidad exponencial
trasladada toma la forma

f(t) = exp{ - (t-)) }, t >

o la densidad de Weibull trasladada o con tres parmetros:

1
(t - )
f(t) = (t - ) exp - , t >

En general se reemplaza t por (t-), a la derecha de la expresin de la funcin de densidad.


Si se toma = 0 se tiene la versin no trasladada de la funcin de la densidad. En el
contexto de fiabilidad uno espera que no sea negativa. Si es conocida no hay ms
problema que sustituir T por T-. Sin embargo, si no es conocida la estimacin de los
parmetros es ms compleja.

Existen otras distribuciones de fiabilidad como la Gamma, distribuciones mixtas o


generalizaciones de las comentadas, normalmente con tres parmetros. Estas distribuciones
son ms flexibles y describen mejor el mecanismo de fallo, pero es a un costo ms elevado
de complejidad matemtica. Para ampliar el tema ver Crowder y otros (1991).

3.3 Grficos probabilsticos

En las aplicaciones es habitual utilizar grficos probabilsticos para determinar si es o no


adecuado el modelo de Weibull para los datos. Suelen utilizarse tambin para estimar
grficamente los parmetros del modelo. Existen en la literatura unos grficos probabilsticos
impresos, llamados comnmente papeles probabilsticos, tanto para muestras completas
como censuradas.

Un grfico probabilstico es un grfico basado en la distribucin emprica y relativo a familias


de distribuciones especficas como la de Weibull, la Normal, o la lognormal. Consiste en
dibujar la distribucin emprica de los datos en un papel donde uno de los ejes est
adecuadamente transformado (escala logartmica o doble logartmica, etc.), y evaluar si los
puntos dibujados se ajustan a una lnea recta. No es aconsejable quedarse slo con la
apreciacin visual, pues puede resultar un mtodo de ajuste un poco subjetivo. Actualmente
se puede calcular la ecuacin de una recta de regresin por el mtodo de mnimos
cuadrados con una hoja de clculo o una simple calculadora de bolsillo.

Existen papeles probabilsticos para muchas distribuciones, en particular para la distribucin


exponencial y la de Weibull. El modelo se escoge basndose en la experiencia previa de
datos similares y en la comprensin del fenmeno fsico, qumico o biolgico que origina el
fallo.

Actualmente los programarios estadsticos tienen incorporadas rutinas para dibujar grficos
probabilsticos. El Minitab en particular, en su apartado de fiabilidad, dibuja los grficos

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 49

probabilsticos de la Weibull, la lognormal, la normal y la exponencial, y estima sus


parmetros por el mtodo de mxima verosimilitud, tanto para datos completos como
censurados.

Tambin es posible evaluar mediante grficos la adecuacin del modelo de Weibull para
muestras completas, mediante simples clculos y grficos utilizando una hoja de clculo.
Los ejercicios prcticos de este apartado se plantean utilizando la hoja de clculo del Excel.

3.3.1 Muestras completas

Para ilustrar la base terica del grfico probabilstico de Weibull consideremos la funcin de
fiabilidad de Weibull:

R(t) = 1-F(t) = exp{-(t/)}

Se aplica el logaritmo natural en ambos lados dos veces

ln(1-F(t)) = -(t/)
ln(-ln(1-F(t)) = ln(t)-ln()

que es equivalente a

ln(ln(1/(1-F(t))) = ln(t)-ln()

Sustituyendo la funcin de distribucin F(t) por la funcin de distribucin emprica Fn(t) se


tiene

lnln[1/(1- Fn(t))] = ln(t)-ln() (3.6)

o lo que es equivalente:

lnln[1/ Rn(t)] = ln(t)-ln()

Concluimos que lnln[1/Rn(t)] es una funcin lineal de ln(t), donde la pendiente es el


parmetro de forma . El grfico probabilstico de Weibull se basa en esta relacin lineal y
una manera fcil de comprobar si unos datos se ajustan al modelo de Weibull es hacer el
grfico lnln[1/Rn(t)] versus ln(t), donde t son los datos ordenados y Rn(t) es la funcin de
fiabilidad emprica, y evaluar hasta qu punto la relacin lineal es factible.

Utilizacin del grfico probabilstico

Se dibuja en el eje de abscisas ln(t(i)), es decir, el logaritmo de los datos, donde t(i) es la
muestra ordenada; y en el eje de ordenadas lnln[1/(1-Fn(i)], donde Fn(i) es la funcin de
distribucin emprica, y se ajusta una recta.

En funcin de lo bien que se ajusten los datos a la recta se decide si la relacin es lineal, y
en caso afirmativo se concluye que el modelo de Weibull es adecuado.

Los autores, 2003; Edicions UPC, 2003.


50 Fiabilidad industrial

Puede utilizarse la recta mnimo cuadrtica para estimar grficamente los parmetros de la
Weibull. La pendiente es el parmetro de forma , y puede estimarse teniendo en cuenta
que es el percentil del 63% (ejemplo 3.2).

Los estimadores grficos de los parmetros de una distribucin no son los ptimos, en el
sentido que los de mxima verosimilitud tienen propiedades mejores (se explicarn en el
siguiente apartado), pero tienen algunas ventajas como el ser rpidos y fciles de calcular.
Ayudan a presentar los datos de forma comprensible visualmente, cosa que es muy til a la
hora de sacar conclusiones, y facilitan su comprensin. Las hojas de clculo, como por
ejemplo el Excel, son una buena herramienta de clculo, de fcil manejo, para hacer un
grfico probabilstico.

Construccin de un grfico probabilstico de Weibull

1. Ordenar los n tiempos de fallo de menor a mayor (muestra ordenada)

t(1) ... t(i) ... t(n)

2. Asignar los rangos (rank)

3. Calcular Fn(i), la funcin de distribucin emprica que representa el porcentaje de fallos


ocurridos antes del tiempo de fallo correspondiente al rango i:

i -0,5 (*)
Fn(i) = , i=1,,n
n

4. Dibujar los puntos: para el fallo de rango i se sita en ln (t(i)) en las abcisas, y en el eje
de ordenadas lnln(1/(1-Fn(i))).

5. Determinar visualmente una recta de manera que las desviaciones entre los datos y la
recta sean lo menores posible y decidir si el ajuste es suficiente. Puede utilizarse la recta
mnima cuadrtica.

6. En caso de que el modelo de Weibull parezca plausible, estimar grficamente los


valores de y .

En el apartado de prcticas del captulo 3 se desarrolla un ejemplo con las pautas que se
deben seguir para construir el grfico probabilstico con una hoja de clculo Excel.

(*)
La frmula dada para el clculo de la funcin de distribucin emprica no es nica. Interesados en profundizar
el tema consultar pg. 118 de Nelson (1982). El programa Minitab da distintas opciones como: la normal escore
(i-3/8)/n-1/4, la de Kaplan-Meier modificado (i-0,5)/n, la de Herd-Honson i/(n+1) y i/n, que se llama de Kaplan-
Meir.

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 51

Ejemplo 3. 2

En una prueba de vida interesa el tiempo de perforacin, en minutos, de un fluido aislante


interpuesto entre dos electrodos a un voltaje de 38kV. Los datos son 0,74; 1,13; 0,09; 0,47;
0,73; 2,38; 1,4 y 0,39, donde los n=8 son datos completos, ya que el experimento termina
cuando fallan todas las unidades.

Con una hoja de clculo puede calcularse:

t(i) rango i Fn(i) ln(t(i)) lnln[1/(1- Fn(i))]


0,09 1 0,06 -2,41 -2,74
0,39 2 0,19 -0,94 -1,57
0,47 3 0,31 -0,76 -0,98
0,73 4 0,44 -0,31 -0,55
0,74 5 0,56 -0,30 -0,19
1,13 6 0,69 0,12 0,15
1,40 7 0,81 0,34 0,52
2,38 8 0,94 0,87 1,02

Obsrvese que la muestra est ordenada de menor a mayor.

Se dibuja lnln[1/ (1-Fn(t)] versus ln(t). En este caso se ha realizado con una hoja de clculo
del Excel, agregndose a los datos la lnea de tendencia, lo que indica que:

lnln[1/ (1-Fn(t)] = 1,203 ln(t) 0,0334

y con un coeficiente de determinacin R2=0,9721, que indica un ajuste razonable.

y = 1,203x - 0,0334 1,5


R 2 = 0,9721 1,0
0,5
ln(ti)
0,0
-3,0 -2,5 -2,0 -1,5 -1,0 -0,5 -0,5 0,0 0,5 1,0 1,5
-1,0
-1,5
-2,0
-2,5
-3,0 ln(ln(1/(1-Fn(t))))
-3,5

Conclusin: los datos se ajustan razonablemente a una distribucin de Weibull y la


estimacin grfica de los parmetros es

= 1,203 = exp(0,0334/1,203)=1,32

La estimacin de es la pendiente de la recta y la estimacin de se obtiene sustituyendo


en la expresin 3.6 y despejando.

Los autores, 2003; Edicions UPC, 2003.


52 Fiabilidad industrial

3.3.2 Muestras con datos censurados

Los grficos de riesgo son la alternativa a los grficos de probabilidad cuando los datos
estn censurados.

A continuacin damos la justificacin terica y las pautas para realizar el grfico de riesgo
con una hoja de clculo.

Para la construccin de grficos probabilsticos con datos censurados se utilizar tambin el


programario Minitab. Su utilizacin se explica en el apartado de prcticas mediante un
ejemplo.

Justificacin de los grficos de riesgo para la distribucin de Weibull

La funcin de riesgo acumulada de una distribucin, H(t), se define como la integral de la


funcin de riesgo, es decir:

t
H(t) = h(u )du
0

La funcin de riesgo acumulada de un modelo de Weibull es


t
H(t) =

Aplicando el logaritmo neperiano en la ecuacin 3.1 obtenemos H(t) = -lnR(t), y aplicando el


mismo razonamiento que en los grficos para datos completos obtenemos una relacin
lineal entre el logaritmo neperiano de H(t) y el logaritmo neperiano de t:

ln(H(t)) = ln(t) - ln()

Construccin del grfico de riesgo (hazard plots)

1. Ordenar los n datos de menor a mayor, teniendo en cuenta tanto los tiempos de fallo
observados como los datos censurados, marcando stos con el signo +.

2. Asignar el rango decreciente a los datos: al valor menor le corresponder rango n, al


segundo rango n-1, y as sucesivamente.

3. Calcular el valor de riesgo emprico, nicamente para los tiempos de fallo observados:

hn = 1/rango decreciente

i
4. Calcular el riesgo acumulado Hn(i )= hn (k ) para cada fallo.
k =1

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 53

5. Para cada tiempo de fallo observado dibujar ln(ti) en el eje de abcisas y ln(Hn(i)) en el eje
de ordenadas. Los datos censurados no aparecen en el grfico.

6. Calcular la recta mnimo cuadrtica.

7. Estimar los parmetros grficamente a partir de la expresin

ln(H(t)) = ln(t) - ln()

Ejemplo 3.3

Se realiza un ensayo del mecanismo de arrastre de papel en un nuevo modelo de impresora


de chorro de tinta. El ensayo se realiza con 12 unidades, y la duracin (prefijada) es de
60.000 ciclos. Los resultados se presentan en la tabla del ejemplo 1.2.

Con una hoja de clculo Excel puede calcularse:

Se dibuja lnHn(i) versus ln(t). En este caso se ha realizado con una hoja de clculo del Excel,
y se ha agregado a los datos la lnea de tendencia, lo que indica que

lnH(t) = 2,3278ln(t)25,59

y con un coeficiente de determinacin R2 = 0,8759, que indica un ajuste razonable.

0,000
-0,50010,00 10,20 10,40 10,60 10,80 11,00

-1,000
-1,500
-2,000
-2,500 y = 2,3278x - 25,59
2
-3,000 R = 0,8759

Los autores, 2003; Edicions UPC, 2003.


54 Fiabilidad industrial

Conclusin: Los datos se ajustan razonablemente a una distribucin de Weibull y la


estimacin grfica de los parmetros es, teniendo en cuenta que ln(H(t))=ln(t) - ln():

= 2,3278 = 59.451,18

3.4 Mtodo de estimacin de mxima verosimilitud

En este apartado se expone el mtodo general de estimacin de mxima verosimilitud. Para


fijar ideas supongamos que tenemos una observacin de una muestra (t1, ... ,tn) de una
poblacin de inters. Supongamos primero que ninguna de las observaciones est
censuradas. En el contexto de fiabilidad es razonable pensar en ti como tiempos de vida.
Supongamos que pueden ser vistas como observaciones de una funcin de densidad
comn f(t;1,2, ... ,m), donde la forma de f es conocida pero los parmetros son
desconocidos, (por ejemplo, una distribucin de Weibull donde los parmetros y son
desconocidos). Para simplificar tomaremos la notacin = (1,2, ... ,m). Entonces la funcin
de verosimilitud de las observaciones ser
n
L()= f (t i ; )
i =1

Si algunas de las observaciones estn censuradas por la derecha, podemos partir los
nmeros de la observaciones 1,2,...,n en dos conjuntos disjuntos: uno llamado N,
correspondiente a las observaciones no censuradas, y otro llamado C, correspondiente a las
observaciones censuradas por la derecha. Entonces la funcin de verosimilitud se expresa
como
L() = f (t ; )R(t ; )
i N
i
i U
i

donde la densidad de las observaciones censuradas por la derecha se ha sustituido por la


funcin de fiabilidad. De manera similar, la densidad de las observaciones censuradas por la
izquierda puede se reemplaza por la funcin de distribucin. Y, en el caso de tener
observaciones censuradas por intervalo, la funcin de densidad se reemplaza por la funcin
de distribucin evaluada en el lmite superior menos la evaluada en el lmite inferior, de
forma que da la probabilidad de ocurrencia del tiempo de vida dentro del intervalo.

En cualquier de los casos comentados es ms conveniente trabajar con el logaritmo de la


funcin de verosimilitud:
l() = ln(L())

Los estimadores mximo verosmil 1, 2 ..., m de 1,2,...,m son aquellos valores que
maximizan la funcin de verosimilitud, o lo que es equivalente, el logaritmo de la funcin de
verosimilitud.

Normalmente, los estimadores mximo verosmil se encuentran resolviendo las ecuaciones:

l
=0 , j = 1,2, ... ,m
j

Los autores, 2003; Edicions UPC, 2003.


Tasa de fallo no constante. El modelo de Weibull y otros 55

El ejemplo 3.3 ilustra cmo se calculan los estimadores mximo verosmil en el caso de la
distribucin normal. Muchas veces la solucin de estas ecuaciones no es explcita y se
requiere de mtodos numricos tales como el algoritmo de Newton. La problemtica al
entorno de estas soluciones se escapa del objetivo de estos apuntes. Si se quiere ampliar el
tema se puede consultar el captulo 3 de Crowder y otros.

Las ecuaciones normales de la distribucin de Weibull no dan una solucin explcita y es


necesaria la utilizacin de algoritmos como el de Newton para resolverlas. Para ms detalles
consultar la pgina 340 de Nelson (1982).

Se utilizar el programario estadstico Minitab para calcular los estimadores mximo


verosmil, y su funcionamiento se explicar en el desarrollo de las prcticas.

Basndose en la teora general del mtodo de mxima verosimilitud, una vez estimados los
parmetros y de la Weibull y las varianzas de y , pueden estimarse las
caractersticas de fiabilidad y los intervalos de confianza.

Los estimadores MV son asintticamente normales, es decir, para muestras de tamao


grande:

~N(;Var( )) ~N(;Var( ))

Entonces los intervalos de confianza (1-) aproximados de y pueden calcularse:

- z /2 Var( ) + z /2 Var( )
(3.7)
- z /2 Var( ) + z /2 Var( )

donde z/2 es el valor de la distribucin N(0;1) que deja en la cola una probabilidad /2 y el
tamao de la muestra n tiene que ser grande.

El clculo de las varianzas de y es computacionalmente complejo, ya que involucra el


clculo de la inversa de la matriz de derivadas segundas del logaritmo de la funcin de
verosimilitud. La mayora de programas estadsticos que cubren la fiabilidad disponen de
rutinas que calculan estas varianzas. Puede utilizarse tambin las siguientes expresiones
que dan una buena aproximacin:

2
1,1087 0,6079
Var( ) Var( ) 2
n n

La estimacin de la fiabilidad en un momento t0, o un percentil de la distribucin de Weibull


se obtiene mediante un simple clculo. Si se disponen de los estimadores MV y , la
fiabilidad estimada en t0 es

R (t 0 )=exp -(t 0 / )


y la estimacin del percentil p:

tp = [-ln(1-p)]
1/

Los autores, 2003; Edicions UPC, 2003.


56 Fiabilidad industrial

Los estimadores obtenidos de la fiabilidad y del percentil son tambin mximo verosmiles
gracias a la propiedad de invariancia funcional de los estimadores MV.

Conceptos avanzados

La estimacin mximo verosmil (MV) no es el nico mtodo de estimacin, pero s es el


ms ventajoso puesto que, por un lado, muchos de los problemas estadsticos que surgen
en el contexto de fiabilidad pueden resolverse utilizando MV. Adems, la generalizacin de
MV tiene ventajas desde el punto de vista computacional ya que con el mismo programa
pueden obtenerse estimadores mximo verosmil en cualquier contexto. En segundo lugar,
la propiedad de la invariancia funcional de los estimadores MV nos asegura que una vez
calculado , se puede obtener el estimador MV de una funcin de l, g(), directamente, sin
tener que empezar de nuevo el proceso de estimacin. Y tercero, los errores estndares de
las estimaciones MV pueden calcularse a partir de una rutina en que invierte la matriz de
informacin muestral.

Desde el punto de vista terico, los estimadores MV tambin tienen propiedades


recomendables. Bajo condiciones de regularidad los estimadores mximo verosmiles son
consistentes, asintticamente Normales y asimpoticamente eficientes. Para detalles tcnicos
consultar Cox and Hinkley (1974).

Ejemplo 3.4 Estimacin por mxima verosimilitud de los parmetros de la


distribucin Normal.

Sea X~N(; 2 ), cuya funcin de densidad es


1
1 ( x- )2
2
f(x) = e 2 , - < x < +
22

Dada X = (x1, ... ,xn), una muestra de tamao n de X, el logaritmo de la funcin de


verosimilitud como funcin del parmetro = (,2) es
n
n 1 n
lnL X (, 2 ) = lnf( xi ) = - ln2 2 - 2 ( x i - )2
i =1 2 2 i =1

Buscamos el mximo del logaritmo de la funcin de verosimilitud:

n
lnL (x i -) (x i -)=0
= =0

i =1
2
n

ln L = - n + 1
(x -) =0 2 (x i -)2
2 22 2 4
i 2 = i=1
n

De aqu se deducen los estimadores mximo verosmil de la media y la variancia de la


distribucin Normal, que son:
n -1 2
= X 2 = S
n

Los autores, 2003; Edicions UPC, 2003.


Pruebas de vida acelerada 57

4 PRUEBAS DE VIDA ACELERADA

En este captulo se hace una introduccin de las pruebas de vida acelerada y se explican
dos modelos tpicos de pruebas de vida con estrs constante, el de Arrhenius y el de la
potencia inversa de Weibull.

Las pruebas de vida acelerada son aquellas que se realizan a un nivel de estrs superior al
de las condiciones ordinarias de funcionamiento, con el fin de provocar la aparicin de fallos
en un tiempo ms corto. Estas pruebas se realizan exponiendo los productos a condiciones
ms severas que las usuales. Generalmente implica aumentar la temperatura, el voltaje, la
presin, la vibracin, el tiempo operativo, etc.

Las pruebas de vida acelerada pueden usarse tanto para evaluar la capacidad de un
componente para satisfacer los requisitos de fiabilidad como para tener un medio ms
rpido de detectar debilidades potenciales o modos de fallo.

Por ejemplo es habitual en la industria hacer estudios del nmero de ciclos hasta el fallo de
aparatos como lavadoras, tostadoras, etc., de forma seguida, que condensan el
envejecimiento correspondiente de 6 meses a 10 aos. En estos casos no es necesario un
aparato matemtico especial para determinar la relacin de tiempo de vida, puesto que se
extrapola en funcin del tiempo operativo de los mismos.

La relacin entre los fallos y la tasa de fallo en condiciones aceleradas, y las


correspondientes en condiciones normales de funcionamiento, debe conocerse a travs de
datos histricos o a partir de modelos estadsticos, que relacionen el tiempo de vida de los
componentes con el estrs a que estn sometido.

Son bien conocidas, por ejemplo, las tasas de fallo en funcin de las tensiones aplicadas y
las temperaturas de funcionamiento de condensadores y resistencias, y las relaciones
pueden usarse para evaluar unidades de un nuevo lote, tipo o fabricante. Una relacin
frecuentemente usada es que la tasa de fallo se duplica aproximadamente por cada subida
de 10C. Puesto que estos componentes suelen ser muy fiables, se usan temperaturas
elevadas en combinacin con sobretensiones, a fin de determinar tasas de fallo en un
tiempo razonable.

Los ensayos acelerados de nuevos productos es una prctica comn y se usa para detectar
modos de fallo potenciales.

Las pruebas de vida acelerada con fines de valoracin se restringen a las piezas y los
componentes, de los cuales se conocen las relaciones entre las tasas de fallo en
condiciones normales y de estrs. Un requisito importante es que las condiciones de estrs
no puedan introducir nuevos modos de fallo.

Cuando las relaciones estn bien definidas, las pruebas de vida aceleradas pueden dar
estimaciones de las caractersticas de fiabilidad a una fraccin del coste de las pruebas
ordinarias, y son ventajosas.

La relacin entre pruebas aceleradas y normales puede ser relativa a una tasa de fallo, a
una tasa de degradacin o cambio de una caracterstica, o al tiempo del desgaste. Siempre
que se conozca la relacin, los datos en condiciones aceleradas pueden reducirse a datos
en condiciones normales, generalmente multiplicados por algunas constantes apropiadas.

Los autores, 2003; Edicions UPC, 2003.


58 Fiabilidad industrial

De todas formas, para ciertos componentes se conocen las constantes a partir de estudios
documentados. El manual MIL-HBK-217 es la fuente ms consultada en la industria
electrnica.

Hay otra aplicacin en que se usan las pruebas de vida aceleradas, las pruebas conocidas
como burn-in, de purga, que causan el efecto de eliminar las unidades potencialmente
infiables sin afectar a las unidades buenas. Un ejemplo de esta prueba es el ensayo de
aceleracin a 20.000 g , donde g es la aceleracin de la gravedad 9,81m/s2, que se aplica a
los semiconductores (hay algn fabricante que ha aumentado incluso este nivel de g en un
50%, hasta 30.000 g en algunas unidades, sin observar efectos medibles sobre la actuacin
o longevidad de las unidades que pasan la prueba). Tal ensayo sirve para eliminar las
unidades que tienen una debilidad mecnica en potencia y una fiabilidad inferior. El ensayo
puede tambin hacer que fallen ciertas unidades cuya fiabilidad hubiera sido satisfactoria,
pero, imponindolo a todas las unidades, la fiabilidad general resultante del lote despus del
ensayo es considerablemente superior a la que hubiera sido de no haberse realizado el
ensayo. Es importante verificar que las unidades que superan la prueba no se hayan
degradado.

4.1 Modelos de pruebas de vida con estrs constante

En este apartado se desarrollan dos tipos de pruebas de donde, a partir de los datos de
dispositivos sometidos a una aceleracin, se puede inferir la fiabilidad del dispositivo en
condiciones normales de uso. Son modelos tpicos de pruebas de vida con estrs constante,
el de Arrhenius y el de la potencia inversa. La relacin entre el estrs y el tiempo de vida
hasta el fallo consiste en una funcin de potencia o exponencial. Esta relacin puede
transformarse en una relacin lineal entre el estrs (o una funcin de ste) y el logaritmo del
tiempo.

Un modelo estadstico para una prueba de vida acelerada consiste en:

Una distribucin de probabilidad (exponencial, Weibull, etc.) que describe la variabilidad


de la vida del dispositivo de una unidad a otra.

Una relacin entre el estrs y la vida. Esta relacin se tiene que materializar, con el fin
de que sea operativa, en una ecuacin matemtica que relacione el estrs con un
parmetro de posicin de la distribucin del tiempo de fallo.

4.1.1 Modelo Arrhenius-Exponencial

El modelo de Arrhenius-exponencial consta de dos elementos. Por un lado se supone que el


tiempo de fallo del dispositivo tiene una distribucin exponencial con vida media y el
parmetro vara con la temperatura de acuerdo con una ecuacin denominada ecuacin
de Arrhenius, porque est basada en la ley de Arrhenius de la cintica qumica.

La ecuacin de Arrhenius en este caso tiene la forma:

() = AeB / (4.1)

Los autores, 2003; Edicions UPC, 2003.


Pruebas de vida acelerada 59

donde es la temperatura absoluta y A y B son constantes. Tomando logaritmos en los dos


miembros de la ecuacin obtenemos

= ln() = 0 + 1/

donde es un parmetro en funcin del estrs (en este caso es funcin del parmetro de
posicin , la vida media, de la distribucin del tiempo de vida). Las constantes 0 y 1 se
determinan por regresin lineal a partir de los datos de pruebas de vida aceleradas. En el
caso de que el modelo sea vlido slo puede extrapolarse en el intervalo de temperatura en
el cual no quede modificado el mecanismo de fallo.

Este modelo es muy utilizado en el sector electrnico, donde se dispone de tasas de fallo de
diferentes componentes. En general se trabaja con la distribucin exponencial y el modelo
de Arrhenius, puesto que permiten obtener tasas de fallo mediante pruebas de vida
acelerada en un tiempo compatible con los ajustados ciclos del desarrollo de nuevos
productos.

Ejemplo 4.1 Tasa de fallo de un semiconductor [fuente: Nelson (1990)]

Para ciertos componentes se conocen las constantes 0 y 1 a partir de estudios


documentados, como el MIL-HBK-217. Por ejemplo, la tasa de fallo (en fallos por milln de
horas) a una temperatura para un componente electrnico MOS (metol oxide
semiconductor), en funcin de la temperatura (dentro de un cierto intervalo), es

= 1,08108exp(-6.373/), de donde =1/=0,9259x10-8exp(6.373/)

que equivale a tomar, en la frmula (4.1):

A = 0,9259108 B = 6.373

Si se quiere conocer la fiabilidad correspondiente a un perodo de garanta de un ao,


trabajando a 55C ( = 328,16K), la tasa de fallo sera

= 1,08x108x exp(-6.373/328,16) = 0,3974 fallos por milln de horas

Esto significa una vida media de

= 1/ = (1/0,39742)x106 = 2.516.232,88 horas

Contando 8.760 horas por ao, resulta una vida media de 287,24 aos.

La fiabilidad al ao es:

R(1 ao) = R(8.760) = exp(-x 8.760) = exp(-0,3974x10-6x8.760) = 0,9965

Los autores, 2003; Edicions UPC, 2003.


60 Fiabilidad industrial

4.1.2 El modelo potencia inversa de Weibull

El modelo de la potencia inversa describe la relacin entre el voltaje, que es la variable de


estrs, y el tiempo de fallo de un aislante elctrico de la siguiente forma:

T = K V -N

donde T representa la duracin del aislante, V es el voltaje y K y N son constantes. T es una


variable aleatoria con una cierta distribucin estadstica. La relacin tambin se considera
vlida cuando se sustituye T por un parmetro de posicin o de escala de la distribucin.
Tomando logaritmos en los dos miembros obtenemos

= 0+1ln(V)

donde las constantes 0 = ln(k) y 1 = -N, se determinan a partir de las pruebas de vida
aceleradas mediante la regresin lineal.

Un caso particular es el modelo de la potencia inversa de Weibull, donde se supone que el


tiempo de fallo del producto tiene una distribucin Weibull con parmetros y . La
ecuacin se expresa como

(V) = K V -N

donde (V) es el parmetro de escala de una distribucin de Weibull y vara con el voltaje V,
mientras que es independiente del voltaje:

= ln((V)) = 0+1ln(V) (4.2)

De aqu se deduce que el logaritmo del parmetro escala de las distribuciones Weibull a
distintos voltajes es lineal respecto del logaritmo de los voltajes. Para ilustrar este hecho se
utiliza el ejemplo 4.2, debido a Nelson.

Los autores, 2003; Edicions UPC, 2003.


Pruebas de vida acelerada 61

Ejemplo 4.2 [fuente: Nelson (1982)]

En una prueba de vida interesa el tiempo de perforacin, en minutos, de un fluido aislante


interpuesto entre dos electrodos. El tiempo de perforacin se mide a siete voltajes
diferentes. El experimento se alarga hasta que fallen todas las unidades. Los resultados se
encuentran en la tabla:

En la siguiente tabla se presentan los parmetros y de Weibull, obtenidos por mxima


verosimilitud. Se han estimado por separado utilizando el programa Minitab:

El siguiente grfico probabilstico justifica la distribucin de Weibull para los datos de cada
voltaje.

Los autores, 2003; Edicions UPC, 2003.


62 Fiabilidad industrial

La relacin lineal entre ln() y ln(V) se calcula con una hoja de clculo Excel:

y = -17,579x + 64,263
8
R2 = 0,9916
Log(alpha)

4
2
0
3,2000 3,3000 3,4000 3,5000 3,6000 3,7000
Log(V)

Los autores, 2003; Edicions UPC, 2003.


Pruebas de vida acelerada 63

De donde la relacin lineal viene dada por la recta de regresin:

ln() = 64,263 - 17,579ln(V)

con un coeficiente de determinacin de R2 = 0,9916, lo que indica una relacin lineal alta.

La estimacin de las constantes K y N de la ley de la potencia inversa se deducen de la


frmula (4.2):

K = exp{64,263} = 8,111027 N =17,579

Los autores, 2003; Edicions UPC, 2003.


Anlisis de la fiabilidad de un sistema 65

5 ANLISIS DE LA FIABILIDAD DE UN SISTEMA

En este captulo se desarrolla el anlisis de un sistema, formulando los sistemas coherentes,


la fiabilidad de un sistema en serie y en paralelo con tasa de fallo constante. Y se hace una
introduccin al anlisis de la fiabilidad mediante rboles de fallo.

En los captulos precedentes hemos discutido la fiabilidad de unidades individuales sin


referirnos a cul era su lugar en el conjunto de la estructura del sistema en estudio. Esto es
lo ms simple si son sistemas muy complejos.

Un sistema es, en este contexto, un dispositivo formado por partes cuya fiabilidad es
conocida. Estas partes se llaman componentes.

La actuacin de un sistema puede analizarse como funcin de componentes individuales. Si


los datos son recogidos en componentes individuales, entonces es posible hacer inferencia
estadstica sobre la fiabilidad de estos componentes, pero an queda el problema del
clculo de la fiabilidad del sistema a partir de la fiabilidad de sus componentes que es lo que
se desarrolla en este apartado.

En general el fallo de un sistema se produce al fallar uno o varios componentes. El problema


bsico de la fiabilidad de sistemas consiste en el clculo de la fiabilidad R(t) de un sistema a
partir de la fiabilidad R1(t), R2 (t), ... , Rn (t) de sus componentes.

5.1 Sistemas coherentes

La clase ms conocida de sistemas son los sistemas coherentes. El concepto fundamental


de los sistemas coherentes (coherent system) es que las componentes se encuentran,
individualmente, en uno de los dos estados, funcionan o fallan, y el estado de los sistemas
se representa en trminos de los estados individuales de cada componente a travs de las
funciones de estructura (structure function). Ejemplos de sistemas coherentes son los
sistemas en serie, en paralelo o mixtos, que desarrollaremos en este captulo.

A continuacin se formula las funciones de estructura.

Sea un sistema con n componentes. Se define Xi, el estado del componente i:

1 si el componente funciona
Xi =
0 si el componente no funciona

Se define , el estado del sistema, como

1 si el sistema funciona
=
0 si el sistema no funciona

La funcin de estructura es = ( X) , donde X = (x1, ... ,xn) es el vector de los estados de los
componentes.

Los autores, 2003; Edicions UPC, 2003.


66 Fiabilidad industrial

Ejemplos

5.1 Sistema en serie

Es aquel para el que el fallo del sistema equivale al de un solo componente.

n
(X) = x
i
i=1

A B C

Figura 5.1 Ejemplo de un sistema en serie formado por tres componentes

5.2 Sistema en paralelo

Es aquel para el cual se produce un fallo cuando todos los componentes fallan.

n
(X) = 1- (1- xi )
i=1

Figura 5.2 Ejemplo de un sistema en paralelo con tres componentes

5.3 Sistema K entre n

Es un sistema ms general que enlaza los sistemas serie y los sistemas paralelos. En este
caso el sistema est operativo si por lo menos K componentes de entre n componentes
estn operativos. K = n corresponde a un sistema en serie y K = 1 corresponde a un
sistema en paralelo.

1 si xi K
( X ) = (5.1)
0 si xi < K

El sistema 2 entre 3 de la figura 5.2 est operativo si por lo menos dos componentes de una
de las tres cadenas estn operativos. En este caso la expresin (5.1) debera contener la
restriccin que los componentes fueran de la misma cadena.

Los autores, 2003; Edicions UPC, 2003.


Anlisis de la fiabilidad de un sistema 67

Figura 5.3 Ejemplo de un sistema 2 entre 3

5.4 Fiabilidad de una red

Este es un ejemplo simplificado de un problema de la fiabilidad de una red (network


reliability), en la que el sistema puede ser representado por una red de componentes y el
estado del sistema depende de la existencia de un camino a travs del cual los
componentes funcionan.

Un sistema computador consiste en un computador central que tiene conectados tres


terminales. El computador tiene conectada una impresora y tambin es posible imprimir en
otra unidad central. El sistema se considera que funciona si es posible utilizar el computador
y tener una impresora de salida conectada. Para esto se requiere que: (a) funcione el
computador central, (b) al menos una terminal de las tres funcione, y (c) que funcione la
impresora local o que la conexin con la otra unidad que tiene conectada la impresora
funcione.

Este sistema se puede representarse grficamente (figura 5.4), donde 1, 2 y 3 son las tres
terminales, 4 el computador, 5 la impresora local y 6 la otra unidad. Y en este caso

( X )={1-(1-x 1)(1-x 2 )(1-x 3 )}x 4 {1-(1-x 5 )(1-x 6 )}

A partir de este ejemplo sencillo puede apreciar el potencial que uno puede tener para
sistemas ms complicados. Por ejemplo, un sistema computacional de una compaa o una
universidad puede representarse mediante diagramas de este tipo donde los sistemas,
mucho ms grandes y complejos, pueden requerir millares de componentes y una estructura
de redes complicadas. Tambin las centrales nucleares han sido modeladas por redes de
este tipo.
1

2 4

Figura 5.4 Ejemplo de un sistema computacional

Los autores, 2003; Edicions UPC, 2003.


68 Fiabilidad industrial

La formulacin matemtica de los sistemas coherentes es como sigue:

Un sistema representado por una funcin de estructura es coherente si cumple les dos
propiedades siguientes:

Relevancia de cada componente, es decir, no hay ninguna componente cuya fiabilidad


no afecte a la fiabilidad del sistema;

Monotonicidad, que encierra el concepto de que la fiabilidad de un sistema nunca puede


ser mejorada cuando uno de sus componentes se vuelva menos fiable.

Estas dos propiedades se pueden formular como sigue:

El i-simo componente es irrelevante si, para todos los estados de los otros componentes
x1,...,xi-1,xi+1,...,xn el estado del sistema es el mismo, independientemente de que xi sea 0 1:

( x1, ... ,xi-1,1,xi+1, ... ,xn) = ( x1, ... ,xi-1,0,xi+1, ... ,xn)

Nota: Si un componente no es irrelevante es relevante.

f:fuente
t:terminal f:fuente

t:terminal

Todos los componentes son relevantes Un componente irrelevante

Figura 5.5 Ejemplos de componentes relevantes e irrelevantes

La monotonicidad de la funcin de estructura se refiere a la monotona de cada xi:

( x1,...,xi-1,0,xi+1,...,xn) ( x1,...,xi-1,1,xi+1,...,xn)

Definicin: Una funcin de estructura se define como un sistema coherente si es


montona y cada componente es relevante.

La funcin de fiabilidad de un sistema puede formalizarse como

n

R(t) = ( x ){R (t ) i
xi
}
(1- Ri (t ))1- xi
x i =1

donde los componentes son independientes y Ri(t) es la fiabilidad del componente i, es


decir, es la probabilidad de que el componente i-simo funcione en el instante t, y donde
(X ) es la funcin de estructura que define a xi = 1 si el componente funciona y xi=0 si no
funciona.

Los autores, 2003; Edicions UPC, 2003.


Anlisis de la fiabilidad de un sistema 69

5.2 Fiabilidad de un sistema en serie con tasa de fallo constante

Si los componentes son independientes, la fiabilidad de un sistema en serie se calcula por la


regla del producto.

Regla del producto: un sistema en serie, con los componentes independientes, funciona s y
slo s todos los componentes funcionan:

R(t) = R1(t)R2(t) Rn(t)

Hablamos de sistema en serie con tasa de fallo constante cuando todos los componentes
tienen tasa de fallo constante, es decir, cuando el tiempo de vida de los componentes se
distribuye exponencial de parmetro i, Ri(t) = e-t y por la regla del producto:

R(t)= e- 1t e- 2t ...e- nt

O, equivalentemente, R(t)=e-t, donde =1+2++n.

Un sistema en serie con los componentes con tasa de fallo constante tiene la tasa de fallo
constante e igual a la suma de las tasas de fallo.

Nota: Puede servir para calcular la tasa de fallo de un producto que tiene diferentes tipos de
fallo independientes y con tasa de fallo constante.

La vida media de un sistema en serie con los componentes con tasa de fallo constante se
calcula a partir de las vidas medias i = 1/i de sus componentes:

1
=
1 1 1
+ +...+
1 2 n

En un sistema en serie complejo, formado por grupos de componentes idnticos, si el primer


grupo tiene n1 componentes con tasa de fallo 1, el segundo n2 componentes con tasa de
fallo 2, etc., las frmulas anteriores se pueden escribir:

R (t ) = R1(t )n1 R2 (t )n2 ...Rk (t )nk

donde la tasa de fallo del sistema es

= n11+ n22+ + nkk

y la vida media del sistema es

1
=
n1 n2 n
+ +... + k
1 2 n

donde i = 1/i las vidas medias de los subgrupos de sus componentes.

Los autores, 2003; Edicions UPC, 2003.


70 Fiabilidad industrial

La tasa de fallo de un sistema en serie, formado por n componentes idnticas con tasa de
fallo c, es:

= nc

Si los componentes no son idnticos, a veces es til considerar la tasa de fallo equivalente,
que sera la que tendran los componentes de un sistema con la misma fiabilidad si fuesen
idnticos. Es igual a la media aritmtica de las tasas de fallo reales de los componentes:

1 + 2 ... + n
c =
n

5.3 Fiabilidad de un sistema en paralelo

La fiabilidad de un sistema en paralelo con n componentes de fiabilidad Ri(t), i = 1,...,n es

R(t) = 1 - {(1-R1(t)) (1-R2(t)) (1-Rn(t))}

donde la probabilidad de que el sistema falle antes de un instante t es

Pr(T t) = 1-R(t) = (1-R1(t)) (1-R2(t)) (1-Rn(t)).

Si todos los componentes son idnticos, con fiabilidad Rc(t), entonces la fiabilidad es

R(t) = 1-(1-Rc(t))n

La fiabilidad de un sistema en paralelo, donde todos los componentes tienen tasa de fallo
constante, es

R(t) = 1- (1- e- 1t )(1- e- 2t )...(1- e- nt ) .

Concluimos que un sistema en paralelo, donde todos los componentes tengan tasa de fallo
constante, no tiene tasa de fallo constante.

En un sistema en paralelo si los componentes son idnticos, con tasa de fallo c, la


fiabilidad es:

R(t) = 1- (1- e- ct )n

1 1 1 1
y la vida media puede obtenerse como = 1+ 2 + 3 +...+ n .
c

1
Para n grande se puede utilizar la aproximacin (logn + ) , donde es la constante de
c
Euler : = 0,577.

Los autores, 2003; Edicions UPC, 2003.


Anlisis de la fiabilidad de un sistema 71

5.4 Redundancia

La redundancia es el principal mtodo para aumentar la fiabilidad de un sistema y se define


como la existencia de ms de un medio para realizar una determinada funcin. Estos
medios no tienen por qu ser idnticos (MIL-STD-721B).

La redundancia puede implicar el uso de dos o ms componentes o conjuntos idnticos, de


forma que cuando uno falla hay otros que realizan la funcin; o bien puede incluir medios
diferentes para realizar la funcin. Una rueda de repuesto de un automvil es un ejemplo de
pieza redundante; el sextante manual usado para la navegacin de un vehculo espacial en
caso de fallo de los controles automticos es un ejemplo del segundo mtodo.

En ambos ejemplos, el componente redundante (la rueda o el sextante) se usa slo cuando
falla el sistema primario. Este uso se llama redundancia secuencial.

Otros sistemas redundantes se hacen funcionar simultneamente, de modo que todos los
sistemas utilizables (no fallados) realicen la funcin durante todo el tiempo. Este tipo se
llama redundancia en paralelo activo. El uso de cuatro motores en un avin es un ejemplo
de redundancia en paralelo activo.

El tipo de redundancia viene impuesto ante todo por consideraciones de actuacin del
sistema. La redundancia secuencial proporciona tericamente ms fiabilidad que la
redundancia en paralelo activo si las funciones de deteccin de fallos y conmutacin son
extremadamente fiables. En caso contrario se prefiere la redundancia en paralelo activo
desde el punto de vista de la fiabilidad. Ambos tipos dan una fiabilidad del sistema mucho
mejor que el sistema no redundante. Los clculos de la fiabilidad de sistemas redundantes
pueden resultar muy complicados. En esta apartado se presentan, a ttulo de ejemplo,
algunos clculos de fiabilidad de sistemas con componentes redundantes.

La norma MIL-STD-721B define la redundancia activa (redundancia en paralelo activo)


como la redundancia de los sistemas en los que los objetos redundantes operan
simultneamente, en lugar de ser activados cuando son necesarios.

Y la redundancia secuencial (standby) se define como la redundancia de los sistemas en los


que el medio alternativo de realizar una funcin no se activa hasta que es necesario, y es
activado por el fallo del medio primario de realizar la funcin.
Un ejemplo de redundancia activa es un avin trimotor, que funciona siempre que funcionen
dos motores.

Consideraciones a tener en cuenta son que, en un sistema secuencial (standby), el


componente redundante se activa mediante un interruptor que tiene su propia fiabilidad. Si
la fiabilidad del interruptor no es del 100%, se puede perder la fiabilidad ganada con la
redundancia. Y adems, el hecho de que el componente redundante no est activado
mientras el otro funciona correctamente, reduce las oportunidades de fallo. Por lo tanto, si la
fiabilidad del interruptor es 100% fiable, un sistema secuencial (standby) tiene una fiabilidad
ms alta que un sistema en paralelo simple.

El ejemplo 5.5 muestra la mejora de la fiabilidad de un sistema redundante activo.

Los autores, 2003; Edicions UPC, 2003.


72 Fiabilidad industrial

Ejemplo 5.5

Supongamos que cierto componente tiene, para una cierta misin, una fiabilidad del 0,75. Si
sustituimos este componente por dos componentes idnticos en paralelo, obtenemos una
fiabilidad del 93,75%:

R = 1-(1-0,75)2 = 0,9395

Si lo substituimos por 4 componentes en paralelo, la fiabilidad del sistema aumenta hasta el


99,61%:

R = 1-(1-0,75)4 = 0,9961

Si continuamos aumentando la redundancia, la fiabilidad contina aumentando, pero el


aumento es cada vez menor.

Para un sistema en paralelo con n componentes standby, con interruptor 100% fiable, con
todos los componentes con la misma tasa de fallo , constante, la fiabilidad puede
calcularse a travs de la frmula:

R = e-t[1+ t + (t)2/2! + +(t)n-1/(n-1)!]

que es la expresin para un sistema con n unidades iguales y con n-1 unidades de reserva.

Ejemplo 5.6

En el ejemplo 5.5 se considera un sistema en paralelo donde los componentes tienen una
fiabilidad Rc = 0,75 = exp(-t). Esto equivale a t =0,2876.

Supongamos ahora que se trata de un sistema standby con interruptor 100%, con dos
componentes, uno funcionado y el otro en standby:

R = 0,75(1+0,2867) = 0,965

Si aadimos otro componente standby:

R = 0,75(1+0,2867+0,041) = 0,996

Nota: Si lo comparamos con el ejemplo 5.6, observamos que con 3 componentes es


suficiente para superar una fiabilidad del 99%.

En el ejemplo 5.6 puede apreciarse, comparado con el ejemplo 5.5, que la redundancia
secuencial con interruptor 100% fiable requiere de menos componentes para alcanzar la
misma fiabilidad que la redundancia en paralelo activa.

Supongamos que el dispositivo de deteccin de fallo no es perfectamente fiable, por lo que


es preciso tener en cuenta sus probabilidades de fallo. Si suponemos que el diseo del
sistema es tal que la funcin de deteccin slo est ligada a las unidades de reserva y no
afectan a la primera unidad que funciona, entonces se incluye en la frmula la probabilidad
de deteccin de fallo Psw .

Los autores, 2003; Edicions UPC, 2003.


Anlisis de la fiabilidad de un sistema 73

En este caso, dado un sistema formado por dos componentes con tasa de fallo constante en
redundancia standby, si la activacin del componente es manual, mediante un interruptor
100% fiable, y Psw es la probabilidad de deteccin, entonces la fiabilidad es

R(t) = e-t(1+ Psw t)

Observaciones:

Si la activacin se hace mediante un interruptor automtico con probabilidad de


funcionar p, la frmula tambin es vlida.

Si la activacin se hace mediante un interruptor automtico y la probabilidad de


funcionar es variable, se debe considerar la fiabilidad del interruptor. Cuando tiene tasa
de fallo constante s, la frmula es


R(t) = e- t 1+ (1-e- st )
s

Ejemplo 5.7

Supongamos un sistema formado por dos componentes en standby, con tasa de fallo
constante 0,75. La activacin es manual, con un interruptor 100% fiable y una probabilidad
de deteccin del 90%.

Como la fiabilidad de los componentes es Rc = e-t = 0,75 t = 0,2877

La fiabilidad del sistema es

R = 0,75(1+0,9x0,2876) = 0,944

Ejemplo 5.8 Sistemas combinados

Los sistemas combinados de la figura 5.5 estn formados por subsistemas en serie del
mismo componente. El primero es un sistema en serie formado por tres unidades de este
componente, y los otros tres son sistemas combinados formados a partir de 6 unidades del
componente.

a) Serie

Los autores, 2003; Edicions UPC, 2003.


74 Fiabilidad industrial

b) Paralelo-serie

c) Mixto-paralelo

d) Serie-paralelo

Figura 5.5 Sistemas combinados

Clculos: Si el componente bsico es el mismo, con fiabilidad 0,95, la fiabilidad de los


cuatro sistemas es:

a) Ra = 0,950,950,95 = 0,857375

b) Rb = 1-(1-0,950,950,95)2 = 0,9796

c) Rc = (1-(1-0,950,95)2)(1-(1-0,95)2) = 0,9880

d) Rc = (1-0,052) (1-0,052) (1-0,052) = 0,9925

5.5 Anlisis mediante rboles de fallo

La fiabilidad de redes (Network reliability) se basa en una representacin grfica abstracta


de un sistema. Bsicamente est orientada al suceso xito, pero en la prctica es mejor
orientarla al fallo.

Muchas veces un rbol de fallos (o rbol lgico) es el mejor dispositivo para deducir cul es
el mayor evento que puede producir un fallo en el sistema.

Los autores, 2003; Edicions UPC, 2003.


Anlisis de la fiabilidad de un sistema 75

El anlisis mediante rboles de fallo, abreviadamente FTA (failure tree analysis), es una
tcnica que utiliza grficos, denominados rboles de fallo, que representan con operadores
booleanos ("Y" y "O") las combinaciones de estados lgicos susceptibles de conducir un
sistema a una situacin no deseada.

5.5.1 Construccin de un rbol de fallos

La construccin de rboles de fallos es uno de los principales mtodos de sistemas de


anlisis de seguridad. Fue desarrollado en los aos 60 en la industria aeroespacial. Puede
ser una herramienta de diseo muy til. Se pueden identificar los accidentes potenciales en
el diseo de un sistema y puede ser de ayuda para eliminar cambios de diseo costosos y
retornos. Tambin se utiliza como herramienta de diagnstico para predecir las causas de
fallo ms probables de un sistema en el caso que deje de funcionar.

Un rbol de fallos es un modelo lgico grfico donde se representan varias combinaciones


de posibles sucesos, de fallo y normales, que ocurren en un sistema, donde el suceso no
deseado se sita arriba de todo del rbol. Entre los elementos de un sistema se incluyen:
hardware, software, y tambin factores humanos y ambientales.

Para construir un rbol de fallos de un sistema siempre se empieza definiendo el suceso


principal. Antes de empezar a construirlo debe entenderse el sistema, profundizando en las
limitaciones del entorno y del problema. Una vez construido, se analiza el rbol y, para que
tenga aplicabilidad, deben estudiarse las medidas correctivas y adoptarse las que se
consideren oportunas para evitar o disminuir la probabilidad de fallo del sistema.

5.5.2 Smbolos de los sucesos

Los smbolos se muestran en la figura 5.6, donde se representan tipos especficos de


sucesos de fallo y normales de los anlisis de rboles de fallo. El rectngulo define un
suceso que es la salida de una puerta lgica, y depende del tipo de puerta lgica y de las
entradas de la puerta lgica. Un suceso de fallo es un estado del sistema no normal. No
necesariamente ha de ser debido al fallo de un componente. Por ejemplo, el suceso fallo
puede ocurrir debido a un error de comando o de comunicacin.

El crculo define un fallo inherente bsico de un elemento del sistema cuando opera sin las
especificaciones diseadas. Nos referimos a este suceso como suceso bsico primario. El
rombo representa aquel fallo, distinto del fallo primario, que no interesa desarrollar ms (lo
denominamos suceso bsico secundario). Los sucesos bsicos, pus, son primarios
(crculo) o secundarios (rombo). El suceso interruptor representa un suceso que, por diseo,
se espera que ocurra siempre (on) o que no ocurra nunca (off).

Suceso de fallo Suceso bsico primario Suceso bsico secundario Suceso interruptor

Figura 5.6 Smbolos de los sucesos de un rbol lgico de fallos

Los autores, 2003; Edicions UPC, 2003.


76 Fiabilidad industrial

5.5.3 Puertas lgicas

Los rboles de fallo utilizan puertas O (OR gates) y puertas Y (AND gates). La puerta O es
una conexin lgica entre un suceso combinado y diversos sucesos elementales, lo que
significa que el suceso combinado tiene lugar cuando se da al menos alguno de los sucesos
elementales. La puerta Y es una conexin lgica entre un suceso combinado y diversos
sucesos elementales, lo que significa que el suceso combinado tiene lugar cuando se dan
simultneamente todos los sucesos elementales.

+ .

Puerta O Puerta Y

Figura 5.7 Smbolos de las puertas lgicas

Ejemplo 5.9

La fiabilidad del sistema de la figura 5.8 se calcula a partir de los fallos primarios cuyos
sucesos 1, 2, 3, 4, 5, 6 y 7 son independientes. Supongamos que las probabilidades de
estos fallos son, respectivamente

P1=0,2; P2=0,3; P3=0,32; P4=0,24; P5=0,22; P6=0,15 y P7=0,12

El clculo de la probabilidad de fallo del sistema (suceso F) es como sigue:

PF = PAP1PB

PA se calcula por la regla del producto, ya que es una puerta Y:

PA = P2P3P4 = 0,30,320,24 = 0,02304

PB se calcula por la regla del producto a partir de la probabilidad del complementario, ya que
se trata de una puerta O:

(1-PB) = (1-P5)(1-P6)(1-P7) = (1-0,22)(1-0,15)(1-0,12) = 0,58344

De donde se deduce que PB = 0,41656.

Los autores, 2003; Edicions UPC, 2003.


Anlisis de la fiabilidad de un sistema 77

Y se concluye que la probabilidad de fallo del sistema es

PF = 0,023040,20,41656 = 0,0019195

A 1
B

. +

2 3 4 5 6 7

Figura 5.8 rbol de fallo del ejemplo 5.9

Los autores, 2003; Edicions UPC, 2003.

Vous aimerez peut-être aussi