Académique Documents
Professionnel Documents
Culture Documents
3.5 Coplanificacion.
Ousterhout
(1982)
propuso
varios
algoritmos con base en un concepto
llamado coplanificacin, el cual toma en
cuenta los patrones de comunicacin
entre
los
procesos
durante
la
planificacin para garantizar que todos
los miembros de un grupo se ejecutan al
mismo tiempo.
TOLERANCIA A FALLOS
Tolerancia a Fallos
Se dice que un sistema falla cuando no se
cumple la especificacin que este tiene
Las fallas en diversos sistemas distribuidos pueden traer consigo
lo que en el mundo comercial se le conoce como perdidas,
ejemplificando esto se tiene un sistema de ventas distribuido. La falla en
dicho sistema vendra a afectar en gran manera a la empresa en cuanto
que se pierden ventas y dinero, mientras se presenta tal falla; por lo
consiguiente es una prioridad evitar tales fallas.
Fallos?
Fichero corrupto almacenado en el disco.
Consecuencia: avera en el sistema que utiliza el fichero.
Qu provoc el fallo?
El error en el sistema podra ser corregido (cambiando el fichero) pero los fallos
podran permanecer.
Importante distinguir entre fallos y errores.
Mas Fallos?
Explosin del Ariane 5 en 1996
Enviado por la ESA en junio de 1996 (fue su primer viaje)
Clasificacin de fallas
FALLA DE COMPONENTES:
Qu es una Falla?
Es un desperfecto, causado ya sea por un error de diseo, de
fabricacin, de fabricacin, programacin, dao fsico, deterioro por el paso de
tiempo, condiciones ambientales adversas, entradas inesperadas, entre otras
muchas.
Fallas
Transistorias
Intermitentes
Permanentes
Falla de Componentes
FALLAS TRANSITORIAS:
Estas ocurren cuando ocurren una vez y despus desaparecen. Si la
operacin se repite, la falla ya no se presenta.
FALLAS INTERMITENTE:
Este consta de una falla que desaparece y reaparece.
FALLA PERMANENTE:
Falla de Sistema
Analizando un poco lo anterior se aterriza en algo muy fundamental,
tiene mayor importancia el tener un sistema que pueda sobrevivir a fallas en los
componentes VS. Hacer que las fallas sean poco probables; Para un sistema
distribuido crtico.
Se considera a las confiabilidad de un sistema distribuido, una
particularidad importante; debido a que se cuentan con una cantidad robusta de
componentes. De esta ltima depende en gran parte la posibilidad de falla en uno
de estos.
Tipos de falla al
procesador
Fallas silentes:
Silentes
Bizantinas
Silentes
Fallas del
sistema
Bizantinas
Redundancia
El mtodo general para la tolerancia a fallos consiste en usa la redundancia.
Tipos de implementacion
de redundancia
Redundancia de la informacin
Se agregan algunos bits para poder recuperar los bits
revueltos.
Redundancia de
la informacion
Redundancia de tiempo
Redundancia del
tiempo
Redundancia
fisica
Redundancia Fsica
Se agrega un equipo adicional para permitir que el
sistema como un todo tolere la prdida o el mal
funcionamiento de algunos componentes.
Respaldo
primario