Académique Documents
Professionnel Documents
Culture Documents
Sesiones 8 al 9
Objetivos de la Unidad
Desarrollar la terminologa y los conceptos necesarios
para realizar una adecuada Gestin de los Sistemas de
Tolerancia a Fallos.
Conocer como disear los sistemas de tolerancia a
fallos.
Comprender los principales mtodos y controles
para implementar sistemas de tolerancia a fallos.
reas de Conocimiento
Terminologa preliminar
Estrategias de tolerancia a fallos
Situacin Actual
Servicio comprometido
Uptime de VISA
Visa Internacional tuvo 92 minutos sin servicio en los
ltimos 12 aos (99.998%).
Es probablemente la instalacin comercial ms segura
del mundo
5 minutos sin servicio significan dejar de procesar 55
millones de dlares en pagos.
10.000 transacciones por segundo
Fuente: Universidad Autnoma de Barcelona
Qu es la Fiabilidad?
Segn el diccionario de la RAE se define como:
La probabilidad de buen funcionamiento de algo.
MTTF: Tiempo durante el cual el Sistema
pueda operar sin pararse
10
11
12
13
Software
Temporal
Informacin
Administracin Servicios Red 2
14
Deteccin de Fallos
Se utilizan componentes adicionales para
detectar los fallos y recuperar el normal
funcionamiento del Servicio.
Se incrementa:
La complejidad del Sistema
Puede introducir fallos adicionales
El costo del Sistema
15
(1/3)
16
(2/3)
17
(3/3)
Ejemplo:
Falla del ventilador del CPU
18
Qu Grado de Tolerancia a
Fallos debemos utilizar?
Depender del Sistema o Servicio afectado
Sistema
Misin Crtica
Vital
Importante
19
20
21
22
23
24
Funciones y Procesos
(1/2)
Funcin o Macroproceso
Fuente: ITIL V3
25
Funciones y Procesos
(2/2)
Procesos
Fuente: ITIL V3
26
EJERCICIO 1 :
IDENTIFICANDO PROCESOS Y SERVICIOS
CRTICOS DE TI
27
Tipo de
Procesos
Objetivos
Empresa
Priorizacin
Procesos
Crticos
28
ii.
29
EJERCICIO 2:
DEFINICIN DE POSIBLES FALLOS
30
Ejercicio 2: Amenazas y
Vulnerabilidades posibles de Fallos
Propietario
Servicio
Vulnerabilidades
Potenciales
Amenazas
Controles
Servicios de
TI
Recursos
31
32
Identificar el RPO
ii.
Determinar el RTO
33
TIEMPOS DE RECUPERACIN
RPO
RTO
34
RPO y RTO
(1/3)
35
RPO y RTO
(2/3)
$$
perdida
operacional
Nivel de perdida
aceptable
RPO
t1
RTO
Administracin Servicios Red 2
Tiempo de
Recuperacin de
Operacin
36
RPO y RTO
(3/3)
37
sistemas requeridos)
Administracin Servicios Red 2
38
39
EJERCICIO 3:
DEFINICIN DE LOS NIVELES DE SERVICIO
40
RPO
Criticidad
Niveles de
Servicio
SISTEMAS
Priorizar
41
42
Mtodos de Recuperacin
I. Backup de Datos
II. Sitios Alternos
III. RAID, Mirrored Systems
IV. SLAS
V. UPS, Generadores, Grupo Electrgeno
VI. Redundancia de Telecomunicaciones
VII.Equipos de reemplazo
Administracin Servicios Red 2
43
44
Costos
45
46
Cold Sites
Warm Sites
- Tiempo
Hot Sites
- Costo
Mobile Sites
Mirrored Sites
47
48
49
reemplazo:
o Stock de Equipos
o Equipo compatible existente
Administracin Servicios Red 2
50
51
52
53
Cold Site
Warm Site
Hot Site
Mobile Site
Mirrored Site
Tiempo de
Hardware
Telecom
Ubicacin
Ninguno
Ninguno
Fija
Largo
Bajo
Parcial
Parcial
Fija
Mediano
Medio
Full
Full
Fija
Corto
Alto
Dependiente
Dependiente
Variable
Dependiente
Alto
Full
Full
Fija
Ninguna
Alto
Recuperacin
Costo
54
55
Conclusiones de la Unidad
i.
ii.
56
57
Muchas
Gracias
58