Vous êtes sur la page 1sur 13

TOLERANCIA A FALLOS

Grupo: Los Borbotones 8vo. Semestre SISTEMAS

TOLERANCIA A FALLOS
Una caracterstica de los sistemas distribuidos, que los difiere de sistemas singulares, es la nocin para errores parciales. Un error parcial puede ocurrir cuando algn componente del sistema distribuido falla, el fallo puede afectar el correcto funcionamiento de algunos componentes, pero a la vez dejar otros componentes sin afectarlos. A contrario de un sistema monousuario, el cual puede afectar a todo el sistema, apagndolo. Un punto importante en los sistemas distribuidos, es construirlos de tal forma que puede recuperarse automticamente de fallos sin afectar el rendimiento cuando un error ocurre el sistema debera seguir operando de forma aceptable mientras se hacer las reparaciones.

CONCEPTOS BSICOS
Para que un sistema distribuido pueda ser tolerante a fallos, se ocupan las siguientes caractersticas: Disponibilidad Confiabilidad Seguridad Mantenimiento

DISPONIBILIDAD
Es definida por la propiedad de que el sistema esta listo para ser usado, en otras palabras se entiende que el sistema esta operando correctamente. Un sistema con alta disponibilidad es aquel que puede trabajar en cualquier tiempo Por ejemplo: Corte de energa.

CONFIABILIDAD
Se refiere a la propiedad de que el sistema puede trabajar continuamente sin fallos, en contraste a la disponibilidad, la confiabilidad se refiere en lapsos de tiempo, en vez de momentos instantneos. Un sistema con alta confiabilidad, es aquel que funciona por largos periodos de tiempo sin fallo alguno. Por ejemplo: Sistema de seguridad (monitoreo de camaras).

SEGURIDAD
Se refiere a la situacin en la que un sistema falla temporalmente, no pasa nada grave, por ejemplo algunos sistemas que controlan plantas nucleares, si algunos de esos sistemas fallan, pueden traer consecuencias catastrficas.

MANTENIMIENTO
Se refiere a que tan rpido puede ser reparado un sistema. Un sistema con alto grado de mantenimiento es aquel que puede evitar o reparar fallas automticamente.

Por ejemplo: Sistema de telefona mvil.

TIPOS DE FALLOS
Transtales Son aquellos fallos que aparecen una vez y despus desaparecen aun cuando la misma operacin se repite.(Ataque exitoso de un hacker) Intermitentes Son aquellos fallos que aparecen una vez y despus desaparecen y despus vuelven a aparecer y continua el ciclo.(Corte de energia) Permanentes Son aquellos fallos que aparecen y no desaparecen hasta que el componente errneo es reemplazado o es arreglado el problema. (Caida de un servidor, dao fsico en algn dispositivo)

ENMASCARADO DE ERRORES POR REDUNDANCIA


Si un sistema debe ser tolerante a fallos, lo mejor que puede hacer es esconder esos errores de otros procesos. La tcnica clave es usando la redundancia. Los tipos de redundancia son: Redundancia de tiempo Redundancia de informacin Redundancia fsica

REDUNDANCIA DE TIEMPO
Con esta redundancia, una accin es hecha y despus si es necesaria, se repite la misma accin, este tipo de redundancia se presenta cuando hay errores intermitentes. Por ejemplo: Cuando se sube algo a la nube, al enviar un sms o un mail.

REDUNDANCIA DE INFORMACIN
Con este tipo de redundancia se agregan bits al paquete de informacin para permitir recuperacin de datos en caso de que el paquete recibido contenga errores. Por ejemplo: La sumarisacion en el manejo de paquetes.

REDUNDANCIA FSICA
Se llama as a la tcnica en la cual se hacen 2 o 3 copias del mismo mensaje para evitar fallos en el recibimiento del mismo. Es una de las tcnicas mas usadas para la tolerancia de fallos. Por ejemplo: Bases de datos espejo.