Vous êtes sur la page 1sur 123

PLAN DE CONTINUIDAD

DEL NEGOCIO EN EL
REA DE TI

MSc Franz Heredia Gmez


Septiembre de 2011

Planificacin
Procesamiento
Ejecucin

PLAN DE CONTINUIDAD DEL NEGOCIO

BC es mucho mas que infraestructura de hard y soft, debe considerarse adems:


Personal, procesos, notificaciones, arboles de decisin, disponibilidad de
infraestructura, telecomunicaciones y otros.

Recordemos que BC es tambin mas que DR. Un buen plan de continuidad debe
proveer valor incremental al negocio a diario aun en caso de desastres fortuitos.

PLAN DE CONTINUIDAD DEL NEGOCIO

CONSIDERACIONES GENERALES
o Los negocios tienden a depender cada vez mas de TI en su interaccin con los
clientes, adems de su operacin interna
o BC es una de las prioridades pues interrupciones tecnolgicas tienen
consecuencias altamente negativas en el negocio
o Las regulaciones sobre mantenimiento de la operatividad son crecientes
o Los negocios demandan soporte 24x7x365 por lo que el respaldo y recuperacin
de datos y procesos son un desafo en la planificacin de TI
o Las reas de TI deben encarar un crecimiento sin precedentes en complejidad y
magnitud de la cantidad de los datos por administrar.

EVOLUCIN DE UN BCP
Un BCP es nico en el hecho de que involucra todas las reas del negocio, procesos,
infraestructura y recurso humano. Por tanto implementar un adecuado BCP implica
un PROCESO CONTINUO que debe alcanzarse y perfeccionarse con el tiempo

EVOLUCIN DE UN BCP
o La curva promueve un proyecto factible no solo en lo tcnico, tambin en el
mbito financiero, integrado con otros objetivos de la organizacin con TTM,
calidad y funcionalidad de los servicios.
o La Infraestructura de TI debe estar alineada a estos objetivos integrales
o Para gestionar adecuadamente los tiempos de la curva, debe considerarse:
Planificar un proceso paso a paso agregando valor al
negocio en cada etapa (fijar con propiedad las
expectativas)
No tratar de solucionar todo al mismo tiempo,
acordar con la alta gerencia un programa paulatino y
multi-fase
Planificar, documentar y proporcionar valor en cada
etapa del programa haciendo evidente la provisin
de un continuo retorno de la inversin

PROCESO IDEAL PARA LA


PLANIFICACIN DEL BCP
La planificacin del BCP es un proceso continuo cuya optimizacin es permanente

PRIORIZACIN DEL NEGOCIO


Priorizacin del negocio implica definir el alcance del BCP mediante identificacin de
riesgos, amenazas y vulnerabilidades, estableciendo prioridades
El siguiente paso ser comparar estas prioridades con las expectativas del negocio
para desarrollar una lnea de base en la construccin del BCP

Evaluacin de Riesgos
Anlisis de Impacto en
el Negocio (BCI)
Auto evaluacin del
BCP

EVALUACIN DE RIESGOS
Estudio de anlisis y gestin del riesgo incluyendo una tipologa de desastres
(naturales, tecnolgicas y humanas) para posterior evaluacin del impacto
Este estudio determina el alcance y los escenarios que deben mitigarse, implica:
o Identificar riesgos y estimar su probabilidad de ocurrencia
o Evaluar y priorizar los riesgos
o Sistematizar los riesgos y vulnerabilidades identificadas
Interrupciones en sistemas TI pueden ser desde ligeros (cadas cortas de energa,
fallas en los discos, etc.) hasta severos (destruccin de equipos, incendios, etc.)
Muchas vulnerabilidades pueden eliminarse mediante soluciones tecnolgicas
(estrategia), operacionales (controles de seguridad) o por gestin del riesgo.
Por lo general no es posible eliminar completamente los riesgos
En esta fase se identifican riesgos y vulnerabilidades pero no se define el alcance de
la evaluacin de riesgos, esto se realiza en su evaluacin de impacto

EVALUACIN DE RIESGOS

EVALUACIN DE RIESGOS
Debe analizarse cada rea funcional para determinar e identificar riesgos potenciales,
su probabilidad de ocurrencia y sus impactos.
El anlisis debe hacerse a nivel de procesos del negocio, no nicamente a nivel de TI
Son varios los factores de riesgo pero se clasifican en:
o Naturales (Huracanes, Incendios, Inundaciones y otros)
o Humanos (Errores del operador, sabotaje, cdigo malicioso, etc.)
o Tecnologa (Fallas de equipo, de software, interrupciones en telecom, etc.)
No todos los riesgos son potenciales en todos los sitios, esto debe documentarse
Tambin deben identificarse su incidencia en situaciones normales y en caso de
verdaderos desastres (virus, corrupcin accidental de datos, destruccin de edificios)
Es recomendable efectuar un filtro inicial de los riesgos potenciales hasta una lista de
riesgos identificados que incluya aquellos con alta probabilidad de ocurrencia. En
pasos siguientes se efecta un refinamiento final

EVALUACIN DE RIESGOS
Los elementos para identificar la probabilidad de ocurrencia de una vulnerabilidad
especifica y riesgo, sin ser limitantes, pueden ser:
o Ubicacin geogrfica y su topografa
o Proximidad a plantas de energa, ros, mares,
aeropuertos, etc.
o Grado de accesibilidad (acceso) para la
organizacin
o Histrico de ocurrencia de interrupcin de servicios
(propias o ajenas)
o Histrico de eventos naturales del rea
o Proximidad de carreteras por donde se trasladan
productos riesgosos
o Otros incluyendo inestabilidad poltica o social

EVALUACIN DE RIESGOS
Los riesgos cambian a travs del tiempo, nuevos reemplazan antiguos a medida que
los sistemas evolucionan, su gestin es un proceso continuo y dinmico
EVALUACION DEL RIESGO EN EL MARCO DEL BCP

EVALUACIN DE RIESGOS
Idealmente todo riesgo identificado debiera ser anulado, esto es poco probable o bien
no es eficiente en costos, mas bien se intenta identificarlos hasta un nivel aceptable y
mantenerse conscientes y documentar los riesgos residuales
Los riesgos reconocidos sern el conjunto de situaciones de mayor importancia que
puedan afectar la operativa, disponibilidad, integridad y seguridad.
As se puede ajustar el alcance del BPC, preservando recursos y enfocando los
esfuerzos sobre los riesgos mas importantes y adecuada capacidad de recuperacin
PLANILLA DE DEFINICION DE VULNERABILIDADES (Data Center)

EVALUACIN DE RIESGOS
(RESUMEN DE PROCESOS)

ANLISIS DE IMPACTO EN EL NEGOCIO


BIA
Efectuado el anlisis de riesgos, con base en la lista de riesgos identificados se
efecta una detallada evaluacin sobre los impactos relativos y su prioridad

IMPACTO DE LA INTERRUPCIN
El BIA hace posible precisar los procesos crticos del negocio y su interdependencia
para refinar la clasificacin y alcance del BCP
Organizaciones con altos ingresos y con mayor dependencia de sistemas en lnea son
mas vulnerables ante interrupciones en TI
Dependiendo del tipo de negocio las perdidas por interrupciones son diferentes entre
las que destacan: energa, telecomunicaciones, manufactura y servicios financieros
La magnitud de las perdidas estn en funcin de la criticidad de procesos de negocio y
los sistemas que son interrumpidos (grado de interaccin con clientes, paliativos y
periodos pico) as como el numero de usuarios afectados.
Tambin perdidas significativas e inmediatas pueden residir en mala publicidad y
perdida de confianza de los usuarios, lo que afecta ingresos futuros

PROCESO DETALLADO DEL BIA

Paso 1
Recursos Crticos
 Evaluar el proceso del
negocio,
 Identificar funciones criticas
realizadas por el sistema y
 Especificar los recursos TI
involucrados

Paso 2

Paso 3

Impactos y tiempos aceptables


Establecer prioridades de
de interrupcin
recuperacin
 Analizar recursos crticos y
 Clasificar impacto y tiempos
su impacto en el negocio
 Proceso paulatino de consenso
 A travs del tiempo
 Define prioridades, tiempos y
 En la interaccin de
estrategias de recuperacin
recursos y sistemas
dependientes

PROCESO DETALLADO DEL BIA


El BIA define el alcance del BCP
Identifica y confirma el conjunto de condiciones definidos, tipologa de interrupciones y
eventos que el BCP debe gestionar
El alcance inicialmente considera una lnea de base y se expande a travs del tiempo,
esto permite abordar vulnerabilidades importantes de inmediato

ANLISIS DEL IMPACTO EN EL NEGOCIO

EVALUACION DEL PROGRAMA VIGENTE


Esta etapa de evaluacin implica la recopilacin de importantes cantidades de datos
para establecer y documentar la lnea de base del BCP

EVALUACION DEL PROGRAMA VIGENTE


Documentar las funciones ejecutadas por cada departamento del negocio. La
profundidad del anlisis varia en funcin del alcance del proyecto BCP
Se calcula un tiempo de entre dos semanas a un mes para documentar
completamente todas las funciones principales ejecutadas al interior y exterior de
cada departamento
Una plantilla simple si no es necesario todo el anlisis puede resumirse como:
Recoleccin de datos de anlisis
o

Seleccionar inicialmente algunos procesos clave




Cada proceso de negocio es un bloque de recuperacin, no la infraestructura


de TI, ni los servidores, ni aplicaciones parciales

Recolectar indicadores de rendimiento (KPIs)




En lo procedimental: Duracin de la ventana de respaldo, tiempo de


recuperacin, frecuencia de pruebas, tiempo de respuesta promedio, tiempo
promedio de solucin de problemas

En lo financiero: Costos y magnitud de ancho de banda, cantidad de datos


replicados, crecimiento porcentual del almacenamiento

EVALUACION DEL PROGRAMA VIGENTE


I N D I CAD O R E S D E R E N D I M IENTO
Los KPIs un concepto de administracin perfectamente aplicables al proyecto BCP,
reflejan los requerimientos de los clientes del BCP de TI que determinan su xito
Su interpretacin debe representar con precisin los objetivos del BCP, medir con
precisin las claves de xito. Deben ser medibles y cuantificables
Para definir KPIs del BCP se recomienda considerar:
o
o
o
o

Su funcionalidad alcanza el largo plazo


Que y como miden un hecho, no debe cambiar con frecuencia
Deben ser precisamente definidos y dimensionados
Deben tener objetivos cuantificables y definiciones de tiempos

Veamos un ejemplo:





NOMBRE:
ALCANCE:
MEDICION:
OBJETIVO:

Optimizar la ventana de Back up y Recovery


Reducir el tiempo de recuperacin mes a mes
Tiempo de la recuperacin
Mejorar cada mes
Es un indicador correcto??? Parece que NO!!!

EVALUACION DEL PROGRAMA VIGENTE


I N D I CAD O R E S D E R E N D I M IENTO
Para analizar el ejemplo consideremos:
1. La MEDICION establece mejorar los tiempos en horas, minutos o segundos?
2. Si son minutos, que medimos? Interrupciones planeadas o fortuitas?
3. Hablamos del tiempo entre el momento de inaccin hasta la recuperacin de
la aplicacin? Es RTO, RPO, ambos o ninguno?
4. Como probamos y medimos el tiempo de recuperacin?
5. Cuanto queremos mejorar el tiempo de Back up y Recovery cada mes?
SE REQUIERE MAYOR PRECISION!!

EVALUACION DEL PROGRAMA VIGENTE


I N D I CAD O R E S D E R E N D I M IENTO
Un buen ejemplo de indicador de continuidad es:
NOMBRE:

Reduccin del tiempo de proceso de la ventana de Back up

ALCANCE:

Interrupcin diaria planificada por el tiempo que los procesos 1, 3 y 7


requieren para efectuar el back up del da.
La ventana inicia cuando el sistema detiene transacciones en lnea de
usuarios genricos y concluye al rehabilitar completamente el sistema

MEDICION: Cada noche el back up es medido y documentado


Informacin de los datos involucrados (cantidad de datos, procesos
paralelos, etc.) tambin son medidos y documentados
El anlisis de tendencias (del proceso) son efectuados automticamente
y los resultados publicados semanalmente entre los empleados
Las mejoras son probadas en ambiente de desarrollo, los objetivos
establecidos y validados cuando son habilitados en produccin
OBJETIVO:

Reducir la ventana de back up a: 30 minutos el primer cuatrimestre, a 10


minutos el segundo y a 1 minuto al tercero

EVALUACION DEL PROGRAMA VIGENTE


I N D I CAD O R E S D E R E N D I M IENTO
Conjunto inicial de
indicadores KPI para
BCP de TI
 Instrumento de
administracin
 Dan una visin a
toda la organizacin
de lo importante
 Definen que es lo
que se busca
alcanzar
 Publicitar su objetivo
y el progreso
paulatino
 Generan
compromiso en su
cumplimiento

EVALUACION DEL PROGRAMA VIGENTE


Despus de definir los KPIs es preciso registrar informacin sobre el entorno de TI,
los componentes que soportan los procesos de negocio seleccionados

Inventario de componentes de TI
Datos a ser recopilados (por proceso de negocio)
1. Aplicaciones (de procesos de negocio seleccionados)
2. Datos y su administracin (de las aplicaciones)
3. Bases de datos (caractersticas, configuracin, etc.)
4. Infraestructura de Hardware (servidores, almacenamiento, etc.)
5. Redes de datos (LAN, MAN, Wireless que conectan procesos)
6. Procedimientos y herramientas
7. Personal (gente, posicin y habilidades requeridas)
8. Instalaciones (ubicaciones e infraestructura fsica)
9. Costo estimado por hora de interrupcin
10. Vulnerabilidades conocidas

EVALUACION DEL PROGRAMA VIGENTE


R E C U R S O S Y S U I M PACTO E N E L N E G O C I O

Matriz
simplificada
de recursos
y su impacto
en el
negocio
Corresponde
a un BIA
sencillo

EVALUACION DEL PROGRAMA VIGENTE


R E C U R S O S Y S U I M PACTO E N E L N E G O C I O
Consideraciones adicionales para definir el impacto en el negocio
 En caso de una interrupcin, cuanto tiempo podra funcionar el proceso?
 Cuales las tareas de mayor prioridad incluyendo procesos crticos manuales?
Con que periodicidad se realizan?
 Cual la dotacin de personal, equipos, formularios y suministros son necesarios
para realizar las tareas de mayor prioridad?
 Como el equipo critico, formularios y suministros pueden ser reemplazados en
caso de interrupciones?
 Son tiempos largos necesarios para reemplazar estos insumos?
 Que manuales (de referencia, operacin, procesos, etc.) son utilizados en el
departamento? Como se reemplazan en caso de desastres?
 Pueden formularios, suministros, equipamiento, manuales y otros almacenados
en un diferente sitio?

EVALUACION DEL PROGRAMA VIGENTE


R E C U R S O S Y S U I M PACTO E N E L N E G O C I O
Consideraciones adicionales para definir el impacto en el negocio
 Identificar el almacenamiento y seguridad de documentos originales. Como esta
informacin puede ser reemplazada? Alguna requiere de mayor proteccin?
 Cuales los actuales procedimientos de Back up? Han sido estos restaurados? Se
requiere algn almacenamiento de respaldo fuera del sitio?
 Cuales los procedimientos de operacin temporales en caso de desastres?
 Como serian afectados otros departamentos por una interrupcin en este?
 Cual seria el impacto de desastre en el computador principal?
 Que servicios externos son utilizados en operaciones normales?
 Pone un desastre peligro el cumplimiento de exigencias legales de informacin?
 Esta el personal debidamente entrenado para estos casos?
 Quien es responsable por mantener el BCP?

EVALUACION DEL PROGRAMA VIGENTE


R E C U R S O S Y S U I M PACTO E N E L N E G O C I O
Adicionalmente es recomendable recopilar informacin sobre:

Ubicacin de reportes
de back up

Inventario de partes de
servidores

Plan de Back ups de


soft y datos

Nmeros telefnicos
crticos

Lista maestra de
llamadas

Inventario mecanismos
de comunicacin

Inventario de
comunicaciones

Lista maestra de
proveedores

Registros de
distribucin

Inventario de Hard y
Soft de pcs

Especificaciones de
sitios alternos o
temporales

Otros materiales

Inventario de
documentacin

Checklist de
notificaciones

Otra documentacin

Inventario de equipos

Inventario de
formularios

Inventario de
suministros de oficina

Inventario de
almacenamiento de
datos fuera de sitio

Inventario de plizas de
seguros

EVALUACION DEL PROGRAMA VIGENTE


I D E N T IFI CAC I N D E C O N T RO L ES V I G E N TES
Luego debe analizarse el grado de preparacin, medidas preventivas y controles
habilitados en un determinada instancia a fin de incorporar nuevas en la fase de
implementacin
La evaluacin de tcnicas de prevencin incluyen dos categoras:
o Prevencin procedimental
 Sobre actividades peridicas (diarias, mensuales o anuales) de seguridad
 Asignacin de responsabilidad de toda la seguridad de la organizacin a un funcionario
con adecuada capacitacin, autoridad y competencias
 El objetivo es definir las actividades necesarias para la prevencin de desastres y asegurar
que estas se desarrollen con regularidad

o Prevencin fsica
 La seguridad fsica comienza cuando un sitio es construido, existen condiciones
particulares para la infraestructura fsica
 Proteccin contra incendios para un conjunto de equipos y componentes
 Todo aspecto referido a la seguridad perimetral, energa, procedimientos de emergencia y
sistemas de archivo/respaldo/recuperacin

EVALUACION DEL PROGRAMA VIGENTE


A N L I SI S D E L A CA PACI DAD AC T UAL D E R E C U P E R ACI N
En un ambiente TI dependiente, todo usuario percibe las interrupciones de sistemas,
estas medidas en dos componentes independientes
o Restauracin del sistema (Recovery Time Objective RTO)
Es el tiempo transcurrido desde el inicio de la interrupcin hasta cuando los
servicios del sistema estn completamente restaurado
o Perdida de datos (Recovery Point Objective RPO)
Perdida de datos experimentada o cuanto debe restaurarse antes de restaurar el
sistema para alcanzar el nivel de informacin en sistema antes de la interrupcin
Aplicaciones y procesos del negocio no son equivalentes. RTO y RPO deben ser
identificados y segmentados dentro del tiempo de recuperacin total
Otros componentes a identificar son:
o Objetivo de distancia de recuperacin (DRO) que mide la distancia a la que
bloques de datos deben ser transferidos.
o Objetivo de recuperacin de la red (NRO) que es el tiempo de rehabilitacin de la
red en el mismo sitio o en el alterno (dependiendo cual la poltica)

EVALUACION DEL PROGRAMA VIGENTE


D E T E R MI NACI N D E R TO Y R P O

EVALUACION DEL PROGRAMA VIGENTE


D E T E R MI NACI N D E R TO Y R P O
Ejecucin del proceso de recuperacin de servicios IT
1. Dada una interrupcin el primer paso es evaluar la necesidad de administrarla.
Declarar un desastre y administrarlo implica costos, asumirlos es una decisin.
Tomada esta opcin, comienza la ejecucin del BCP
2. La primera etapa del BCP es recuperar la operativa del Hard, los SO y los datos.
Operaciones, redes, telecomunicaciones, infraestructura fsica y el personal
involucrado estn incluidos en esta fase
3. En este punto, SO y los datos se han recuperado, tericamente los datos son los
correctos y consistentes en la instancia anterior a la interrupcin. El tiempo
transcurrido hasta este momento representa el RTO de hardware e integridad de
datos (data integrity)

EVALUACION DEL PROGRAMA VIGENTE


D E T E R MI NACI N D E R TO Y R P O
4. A pesar de esto la recuperacin no es a nivel de usuario, sino a nivel de servidor.
La integridad del Hardware no es equivalente a integridad de Transacciones.
5. El equipo de aplicaciones o DB efectan el proceso de recuperacin a nivel de
transacciones (commit/rollback via DB restart) restaurando la integridad lgica
6. En este punto las aplicaciones y DB estn listas para el acceso de usuarios. Este
tiempo es el RTO de la integridad de transacciones
7. El RTO de hard e integridad de datos es diferente al RTO de la integridad de
transacciones.
8. El RPO que son datos que deben ser regenerados se completa en un tiempo
adicional a la ocurrencia de la interrupcin, al procesar la integridad transaccional.
El servidor y componentes de almacenamiento no controlan las relaciones lgicas
entre mltiples aplicaciones y los bloques de datos

EVALUACION DEL PROGRAMA VIGENTE


Evaluacin integral del BCP vigente. Debe ser efectuado para el proceso completo
(end-to-end) no es til por componentes

EVALUACION DEL PROGRAMA VIGENTE


E VA LUAR E L G R A D O D E M A D U R E Z D E L B C P
NO ENFOCADO
Programa incompleto,
No se cumple
CONSCIENTE
Conocimiento de DR
Alta disponibilidad
BCP documentado
Estrategias parciales
CAPAZ
Programa BCP/DR
implementado
Estrategias y planes
establecidos
MADURO
Pruebas regulares
Ejecutivos involucrados
Buen manejo de crisis
Gobernabilidad

EVALUACION DEL PROGRAMA VIGENTE


E VA LUAR E L F I N ANCIAMI ENTO Y R E TO R NO D E L A I N V E R SI N
Por ultimo evaluamos los orgenes y niveles de financiamiento para el BCP vigente
El objetivo es establecer el modelo, procedimientos y criterios para disponer de
recursos existentes o adicionales
Tambin determinamos si el programa de BC es percibido como un costo, una
ventaja competitiva o como que.
Proyectos de BCP no comparten el modelo de financiamiento de un proyecto TI, los
primeros deben alcanzar resultados tangibles, los de BCP son medidas preventivas
cuyo valor se evidencia a travs de un exitoso proceso de recuperacin o en la
prevencin de interrupciones del negocio

PRIORIZACIN DEL NEGOCIO


R E S U M E N D E AC T IV IDAD ES

INTEGRACIN CON TI
Tomando como informacin de entrada el conocimiento del negocio y el estado del
modelo de continuidad vigente, estamos en condiciones de efectuar el diseo
completo (end-to-end) del BCP

INTEGRACIN CON TI
El diseo u optimizacin del
BCP difiere de la definicin de
la estrategia de TI en que esta
incluye todos los aspectos del
negocio, particularmente los
externos como son:
 Procesos y procedimientos
(no TI) del negocio
 Gestin del equipo de operacin
en caso de crisis (TI y no TI)
 Especificacin de cmo los
procesos no TI son reanudados
 Aspectos no IT de los procesos
de negocio referidos a Alta
Disponibilidad y Recuperacin
de Desastres

INTEGRACIN CON TI
El diseo u optimizacin del
BCP difiere de la definicin de
la estrategia de TI en que esta
incluye adicionalmente todos
los aspectos del negocio,
particularmente los externos
como son:
 Procesos y procedimientos
(no TI) del negocio
 Gestin del equipo de operacin
en caso de crisis (TI y no TI)
 Especificacin de cmo los
procesos no TI son reanudados
 Aspectos no IT de los procesos
de negocio referidos a Alta
Disponibilidad y Recuperacin
de Desastres

INTEGRACIN CON TI
P RO C E S O S Y P RO C E D I MI ENTO S
Los aspectos externos a ser cubiertos por el BCP son los de Personal, Procesos y
Procedimientos

INTEGRACIN CON TI
P RO C E S O S Y P RO C E D I MI ENTO S

INTEGRACIN CON TI
P RO C E S O S Y P RO C E D I MI ENTO S
 Disear procesos y procedimientos para acciones tendientes a proteger los
procesos de la organizacin de manera confiable y permanente
 Son procedimientos y acciones adicionales a esquemas cotidianos de alta
disponibilidad y operacin continua
 Es fundamental el gestionar los incidentes satisfactoriamente a travs de
procedimientos de alta calidad, probados, repetibles y confiables
 Se disean primero para luego recin seleccionar la tecnologa que mejor se ajuste
 El BCP implica mas que almacenamiento fuera de lnea y procedimientos de backup, incluye las funciones no TI necesarias para restablecer las operaciones
 Esta fase de planificacin implica disear procedimientos que dirijan el proceso de
recuperacin de las capacidades operativas del negocio
 El plan incluye documentos y procedimientos probados cuyo seguimiento asegura
la progresiva disponibilidad de recursos crticos y la continuidad de las operaciones
 Establece la forma como el personal de TI habr de reaccionar ante algn
desastre, el objetivo es alcanzar predictibilidad probada de las acciones humanas

INTEGRACIN CON TI
P RO C E S O S Y P RO C E D I MI ENTO S

INTEGRACIN CON TI
P RO C E S O S Y P RO C E D I MI ENTO S

INTEGRACIN CON TI
A LCA NCE Y C O B E R T U R A D E L B C P

 EL BCP se aplica a eventos planeados y no planeados, esto implica negacin de


normal acceso a infraestructura de TI por periodos extensos.
 Interrupciones planificadas deben ser incluidas tal como el caso de procesos de
rotacin de cargas de trabajo entre sitios
 Su orientacin promueve la disposicin de una declaracin consistente de acciones
a realizar antes, durante y despus de la ocurrencia de un desastre
 El alcance determinado mediante el BIA es ahora usado para definir el nivel de
planificacin de los procesos y procedimientos que aseguren recursos crticos
 Generalmente los procesos de negocio se crean y establecen a travs de los aos,
el BCP busca que en caso de desastres sean restablecidos en horas o das
 Este es un problema serio que requiere de planes claros, suficientemente
detallados, muy bien elaborados, capacidad de ejecucin y pruebas permanentes
de consistencia

INTEGRACIN CON TI
RO L D E L A G E S T I N D E R I E S G O S
La gestin de riesgos comprende acciones para identificar, controlar y mitigar riesgos
sobre la infraestructuras de TI y deben cumplir dos funciones primarias
 Prevencin
Reducir el impacto al
reducir o eliminar
riesgos. Controles de
alta disponibilidad,
seguridad y
disponibilidad

 Recuperacin
Reducir o limitar las
consecuencias ante
interrupciones.
Planificadas antes y
ejecutadas al
producirse el hecho

INTEGRACIN CON TI
P ROT E C CI N D E DATO S

 Proteccin de datos implican medidas de la organizacin para resguardar sus


activos, asegurar la precisin y fiabilidad de registros y promover la eficiencia
operativa
 Los controles internos incluyen medidas de salvaguarda de sistemas TI y la
determinacin de conjuntos de datos que requieren mayores niveles de proteccin
 La naturaleza de los controles implica que algunos determinan la operacin propia
de otros, esta interdependencia determina la necesidad de su apropiado diseo
 La seguridad es un concepto progresivo y comprende el anlisis de las crecientes
vas de acceso (proliferacin de pcs, redes wireless, VPNs, etc.). Mayor riesgo
 reas de importancia para controles internos son: controles organizativos, de
desarrollo y mantenimiento de sistemas, de acceso, seguridad fsica y del entorno
de comunicaciones

INTEGRACIN CON TI
C O B E R T U R A D E S E G U RO S E X T E R NO S
 Los seguros son una herramienta de mitigacin de riesgos, proveen un nivel de
confianza y previenen de impactos financieros u organizacionales
 Por si solos, no son suficientes pues no son capaces de compensar
apropiadamente todas las incalculables perdidas en caso de interrupciones
 Dimensionar su cobertura es clave en el entorno del BCP, su precisin, prueba y
mejoramiento no determina menores coberturas, debe siempre haber balance
 Las aseguradoras son una fuente de informacin sobre el impacto de un desastre
pues deben soportar al negocio en caso de inhabilitacin de servicios
 Cubren la perdida de ingresos y gastos extraordinarios a ser efectuados hasta la
recuperacin de la operatividad de los servicios
 Los efectos de un suceso de desastre deben ser documentados y cuantificados a
detalle para formalizar el reclamo
 Deben considerarse: reemplazo de hadr y soft, costos adicionales, cobertura de
perdidas en el negocio, cobertura a documentos y registros, errores y omisiones,
fidelidad de empleados y transporte de personal y medios de recuperacin

INTEGRACIN CON TI
C L A S I FI CAC I N D E DATO S Y R E G I S T RO S

 Identificar datos y registros crticos para procesos del negocio, no todos tienen el
mismo grado de requerimientos, algunos son irremplazables, otros tienen un alto
costo de recuperacin (financiero o en tiempo) y otros pueden recuperarse con
poco impacto o con mayor facilidad
 El anlisis define cuales deben ser duplicados, como y donde almacenarlos en
funcin de los riesgos contingentes y su importancia emergente del BIA
 Para soluciones de replicacin en tiempo real, la integridad del sitio alterno es una
consideracin importante particularmente en eventos de efecto progresivo,
aspectos que la tecnologa moderna soporta en las perspectivas de prevencin y
mitigacin
 Deben incluirse datos no electrnicos tendiendo a su manipulacin segura y
ordenada identificando su naturaleza
 Existe normativa legal que debe ser cumplida con respecto a su mantenimiento en
tiempo y forma para efectos de control, seguimiento y auditoria

INTEGRACIN CON TI
T I P O S D E P L A N E S D E C O N T I NG ENC IA B C P

 El BCP representa un amplio espectro de actividades para soportar y recuperar


procesos crticos del negocio y servicios de TI posterior a una emergencia
 En definitiva una organizacin usa un conjunto de planes para preparar apropiadas
respuestas de recuperacin y continuidad en el mbito de las TI, procesos del
sistema y sus instalaciones
 Existiendo una conexa relacin entre sistemas TI y los procesos del negocio que
soportan, debe haber coordinacin entre ambos en su desarrollo y optimizacin a
fin de que las estrategias de recuperacin y recursos de soporte no se afecten
entre si ni se dupliquen esfuerzos
 Definiciones conceptuales sobre planes de contingencia y otros relacionados no
existen, esto genera algunas confusiones sobre sus alcances y objetivos
 Un BCP enfrenta los efectos de interrupciones en los procesos del negocio y como
debe reiniciar la operatividad de los mismos, cualquiera haya sido el origen. El
punto es recuperar el control de gestin y capacidad de operacin

INTEGRACIN CON TI
T I P O S D E P L A N E S D E C O N T I NG ENC IA B C P
Hay una variedad de planes de contingencia necesarios e interrelacionados que se
convierten en componentes del BCP

INTEGRACIN CON TI
T I P O S D E P L A N E S D E C O N T I NG ENC IA B C P
Es recomendable que un BCP contemple la mayora si no todos estos elementos
 Plan de reanudacin del negocio Business Resumption Plan (BRP)
Un BRP orienta el restitucin de los procesos del negocio, se diferencia con el BCP en que
carece de procedimientos de continuidad durante una emergencia

 Plan de continuidad de operaciones Continuity of Operations (COOP)


Se enfoca en restaurar funciones esenciales (generalmente de la oficina central) en un sitio
alterno y su mantenimiento hasta el retorno de las condiciones normales en unos 30 dias

 Plan de respuesta a incidentes Incident Response Plan (IRP)


Establece procedimientos para identificar ataques cibernticos contra la infraestructura TI.
Identifica, mitiga y recupera operatividad ante incidentes maliciosos

 Plan de emergencia para empleados Occupant Emergency Plan (OEP)


Estrategia de seguridad fsica para ocupantes de las instalaciones del negocio. Tienen un
alcance geogrfico particular

 Plan de recuperacin de desastres Disaster Recovery Plan (DRP)


Aplica a las acciones para enfrentar imposibilidad de acceso a instalaciones del negocio.
Frecuentemente refieren a planes basados en TI para restaurar operatividad de datos,
sistemas o infraestructura en un sitio alterno. No efectivo en incidentes menores

INTEGRACIN CON TI
EQUIPO DE GESTIN DE LA CRISIS
La mayor parte de procesos y procedimientos se orientan a garantizar la gestin de la
organizacin y sus recursos durante el proceso de recuperacin.
 Compromiso de la alta gerencia
La alta gerencia debe respaldar y estar involucrado en el
desarrollo, coordinacin y aseguramiento de la efectividad del
plan. Recursos y tiempos adecuados deben ser provistos

 Un comit estable de planificacin


Incluir representantes de toda rea funcional, los
componentes clave incluirn a los gerentes de operaciones y
TI, este define el alcance e informa a la alta gerencia
regularmente debido a la naturaleza sensible del tema y por
las inversiones involucradas

 Un alcance definido
Si bien por lo general se consideran actividades relacionadas
con TI, un plan coherente incluir reas operativas fuera de la
cobertura de TI. El BCP debe tener una visin amplia para
contemplar los muchos escenarios que puedan afectar a la
organizacin

INTEGRACIN CON TI
C O N S I D E R ACI O NES D E L E Q U I P O D E G E S T I N D E C R I S I S

Al planificar, debe considerarse el escenario mas critico, as situaciones menos


complejas pueden manejarse con partes del plan con escasas modificaciones
El plan se basa en suposiciones, estas son funcin del alcance definido y limitan la
magnitud de desastres que la organizacin podr enfrentar, se identifican con base en
cuestionamientos como los siguientes:





Que equipos o infraestructura puede ser daada?


Cual el tiempo esperado de la interrupcin?
Que registros, archivos y materiales tienen proteccin?
Que recursos se tendrn disponibles despus de la
ocurrencia del desastre?
o
o
o
o
o

Dotacin de personal
Equipamiento
Comunicaciones
Transporte
Sitio alternativo

INTEGRACIN CON TI
C O N S I D E R ACI O NES D E L E Q U I P O D E G E S T I N D E C R I S I S
Supuestos a considerar (no limitativos) en la planificacin son:
o La infraestructura principal de la organizacin es destruida
o Existe personal para efectuar las tareas funciones definidas en el plan
o El personal puede ser notificado y puede reportar al sitio de respaldo para
acciones criticas de procesamiento, recuperacin y rehabilitacin de servicios
o El plan esta siempre probado y vigente
o Un subconjunto del plan puede soportar interrupciones menores
o Un sitio e infraestructura alternos estn disponibles
o Un stock suficiente de formularios y suministros estn disponibles off-site
o Un sitio de trabajo alterno puede ser habilitado para gestionar la crisis
o Las comunicaciones locales y de larga distancia (respaldo) estn habilitadas
o Transporte por tierra es factible en el rea
o Los proveedores se comportaran de acuerdo a los convenios para dar soporte a
la organizacin

INTEGRACIN CON TI
C O M I T S I N T ER NO S Y S U S R E S P O N SAB I L IDAD ES

 El BCP se construye con un enfoque de trabajo en equipo, son necesarios comits


para funciones administrativas, instalaciones. Logstica, soporte al usuario,
procesos de back-up, transmisin y recuperacin, etc. Funciones que deben ser
asignadas
 La estructura del equipo de crisis no podr ser equivalente a la de la organizacin,
usualmente se configuran para responder a las funciones de mayor impacto
 Los comits no necesitan atomizar funciones, algunos podrn ser responsables por
mas de una actividad pero no se deben recargar funciones ni asignarlas sin
propiedad
 El personal de los equipos debe seleccionarse con base en sus habilidades y
liderazgo, preferentemente a responsables ordinarios de las mismas funciones
 Los equipos deben entender no solo el propsito del plan sino los procedimientos
necesarios para completar la estrategia de recuperacin
 Tambin deben conocer los objetivos y procedimientos de otros grupos para
garantizar colaboracin y coordinacin

INTEGRACIN CON TI
C O M I T S I N T ER NO S Y S U S R E S P O N SAB I L IDAD ES

 Un lder dirige las operaciones de cada equipo, lo representa ante superiores y


coordina con los otros lideres. Distribuye informacin y aprueba las decisiones al
interior del equipo. Debe designarse un lder alterno en caso de ausencia
 El equipo de mayor importancia es el de administracin de la crisis, provee gua al
resto de equipos. Es un gerente de amplia experiencia (CIO) con autoridad para
decidir en funcin de costos, riesgo aceptable y niveles de coordinacin
 Sus funciones de mayor importancia son:
Responsable por activas el BCP y supervisar
su ejecucin
Supervisa las pruebas y entrenamiento
Facilita la comunicacin entre equipos
Dirige acciones en los equipos especializados
Coordina el proceso de recuperacin
Evala los desastres, define su activacin y convoca a otros equipos
Toma las decisiones sobre prioridades, polticas y procedimientos

INTEGRACIN CON TI
C O M I T S I N T ER NO S Y S U S R E S P O N SAB I L IDAD ES

INTEGRACIN CON TI
P RO C E D I MI ENTO S D E N OT I FI CAC I N Y AC T I VAC I N

 Son necesarios buenos procedimientos de notificacin y activacin como acciones


iniciales en caso de emergencia
 Implica actividades de notificacin al personal, evaluacin de los daos e
implementacin del plan
 El resultado de esta fase, los equipos de recuperacin estn preparados para
tomar medidas de contingencia para restaurar las funciones de forma temporal
 Las emergencias pueden ser anticipadas o imprevistas, los procedimientos deben
considerar los mecanismos de notificacin en ambos casos y en cualquier horario
 Una respuesta temprana reduce efectos en la infraestructura de TI y puede dar
opcin a tomar medidas preventivas
 El equipo de evaluacin de daos debe ser informado con prontitud para
determinar la gravedad de la situacin y as tomar las medidas mas adecuadas
 Concluida la evaluacin, los equipos apropiados de soporte y recuperacin tambin
deben ser notificados

INTEGRACIN CON TI
P RO C E D I MI ENTO S D E N OT I FI CAC I N Y AC T I VAC I N

 El proceso de notificacin deber considerar medios alternativos. Su estrategia


definir cual utilizar segn la coyuntura y debern estar claramente documentados
 Un mecanismo generalizado es el llamado rbol
de notificacin y plantea un proceso paulatino y
por niveles, cada uno con medios alternos
identificados en una lista de comunicacin
incluyendo niveles jerrquicos, nombres,
informacin y medios formales e informales de
contacto
 Para la cabeza del rbol debe definirse uno
alterno para que este asuma el liderazgo por la
ejecucin del plan
 Tambin debe notificarse a puntos de contacto
externos o socios empresariales que puedan ser
afectados, depender del tipo de interrupcin para
que tengan responsabilidades en el proceso

INTEGRACIN CON TI
P RO C E D I MI ENTO S D E N OT I FI CAC I N Y AC T I VAC I N
Un ejemplo de rbol de comunicaciones que define el flujo de la cadena de
informacin en situaciones de crisis puede ser:

INTEGRACIN CON TI
P RO C E D I MI ENTO S D E N OT I FI CAC I N Y AC T I VAC I N
Ejemplo de procedimiento de recuperacin en caso de indisponibilidad de
suministro elctrico

INTEGRACIN CON TI
P RO C E D I MI ENTO S D E N OT I FI CAC I N Y AC T I VAC I N
Debe documentarse el tipo de informacin a ser transmitida, su cantidad y nivel de
detalle. Esto depender del equipo especifico a ser convocado, esta podr incluir:
 Naturaleza del incidente
 Perdida de vidas humanas o heridos
 Estimacin de la magnitud de los daos
 Detalles de acciones emergentes y
detalles de recuperacin
 Lugares de reunin para coordinacin
y toma de decisiones
 Instrucciones de reubicacin y
tiempos estimados
 Instrucciones para continuar el rbol
de comunicacin

PROCESOS Y PROCEDIMIENTOS
AC T I VAC IO N D E L P L A N

El BCP debe ser iniciado cuando la evaluacin de la crisis indica que algn criterio de
activacin ha sido alcanzado, estos son particulares para cada organizacin y deben
ser descritos el la poltica de recuperacin, pueden estar basados en criterios como:
 Seguridad del personal o dao masivo de las instalaciones
 Dao masivo de la infraestructura de TI (fsico, operacional o de costos)
 Situacin critica del sistema que afecte la misin de la organizacin
 Interrupcin prevista de larga duracin
Despus de particularizado el dao, el coordinador de recuperacin debe seleccionar
la estrategia y equipos de recuperacin apropiados

PROCESOS Y PROCEDIMIENTOS
R E A N UDAC IO N D E L N E G O C I O
El plan de reanudacin del negocio refiere estrategias para reiniciar operaciones de TI
rpida y efectivamente
Se gestiona en dos fases, recuperacin que habilita la operatividad de procesos
crticos de forma temporal y restauracin que retorna la operacin del negocio a
condiciones originales
La estrategia debe cubrir los riesgos residuales del BIA considerando alternativas a
seguir considerando costos, tiempos aceptables, seguridad e integracin con planes
integrales de recuperacin de la organizacin
Este proceso requiere un buen nivel de automatizacin debido a su criticidad y
volumen de trabajo especializado y considera los siguientes tpicos:





El sistema (hosting de aplicaciones criticas a nivel central y descentralizado)


Servicios de red (LAN, WAN y telecomunicaciones criticas)
Activacin de los equipos de restauracin (coordinacin)
End-user (mecanismos para conectarse con sistemas y redes restauradas)

PROCESOS Y PROCEDIMIENTOS
P RO C E D I MI ENTO S D E R E C U P E R AC IO N
Inician cuando el BCP ha sido activado (evaluacin de la crisis completa) y se enfoca
en procedimientos de emergencia para recuperar temporalmente la operatividad de
los procesos de negocio definidos en el BCP
Pueden implicar procesos manuales temporales, operacin en sitios alternos (failover)
En sistemas complejos el procedimiento refleja las prioridades del BIA y la secuencia
de acciones responde a los tiempos permisibles de interrupcin de sistemas y
procesos correspondientes tambin definidos en el BIA
El procedimiento definir el equipo humano y la disposicin o traslado de equipos,
datos y todo material requerido para el proceso, entre otros:








Notificaciones internas y externas


Disposicin e instalacin de los componentes de hard necesarios
Disposicin y habilitacin de los datos necesarios
Activacin de los procesos crticos del negocio (sistemas y aplicaciones)
Pruebas de funcionalidad incluyendo condiciones de seguridad
Conexin de equipos, redes y conexiones a sistemas externos
Operacin satisfactoria de las instalaciones alternas

PROCESOS Y PROCEDIMIENTOS
FA S E D E R E S TAUR AC IO N

Es la fase final que completa la reanudacin del negocio cuando los efectos de la
crisis se han superado y se deben alcanzar las condiciones iniciales
Cuando las condiciones fsicas y de infraestructura de las instalaciones del negocio
estn rehabilitadas, la operatividad del negocio puede retornar al sitio original (o uno
nuevo), este proceso es conocido como Failback
Las actividades de este proceso desarrollaran las siguientes actividades









Verificar el cumplimiento de todas las condiciones exigidas (sitio original)


Instalar hard, soft, redes y comunicaciones
Habilitar conectividad e interfaces internas y externas
Pruebas de funcionalidad para todas sus operaciones
Recuperar e instalar datos y aplicaciones desde el sitio alterno
Bajar y finalizar operaciones en el sitio de contingencia
Reubicar material y documentos crticos del sitio alterno
Reubica al personal en el sitio original

PROCESOS Y PROCEDIMIENTOS
S I T I O S A LT E R NO S O D E C O N T I NG ENCIA
Parte del BCP implica disear caractersticas del sitio alterno, este puede ser:

Un sitio dedicado y gestionado por la organizacin


Un sitio compartido con alguna otra entidad
Un sitio comercial

Independientemente de su tipo, debe ser capaz de soportar las operaciones definidas


en el BCP
En funcin de su disponibilidad operacional podr ser:

Cold sites (fro) Solo instalaciones, sin facilidades ni equipamiento (traslado)


Warm sites (templado) Facilidades y equipamiento parcial, requiere preparacin para
para recibir transferencia de sistemas, datos y personal
Hot sites (caliente) Equipamiento y personal dedicados y preparados para operar en
caso de contingencias, gestionados 24x7. En funcin del tiempo de RTO pueden
espejarse o iniciar operaciones desde medios de back-up
Mobile sites (movil) Data center transportable (trailers), pueden ubicarse a decisin de la
organizacin, requieren instalacin previa por su compleja configuracin
Mirrored sites (espejados) Completa redundancia y mirroring en tiempo real, el mas alto
grado de continuidad. Usualmente usados en modelos de distribucin (rotacin) de
cargas de trabajo

PROCESOS Y PROCEDIMIENTOS
S I T I O S A LT E R NO S O D E C O N T I NG ENCIA

PROCESOS Y PROCEDIMIENTOS
S I T I O S A LT E R NO S O D E C O N T I NG ENCIA
 Ameritan un balance entre costos y funcionalidad por lo que ameritan un estudio
apropiado
 Tambin debe considerarse la compatibilidad del hard, soft, e instrumentos de
conectividad y control

 Las consideraciones de costo determina la consideracin de los mtodos de


disponibilidad: En propiedad, Compartido o Alquilado
 La solucin podr considerar la combinacin y complementariedad de mtodos a
objeto de proporcionar la mayor capacidad de recuperacin a una mayor cantidad
de riesgos y con el mejor ndice de retorno de la inversin

PROCESOS Y PROCEDIMIENTOS
S I T I O S A LT E R NO S O D E C O N T I NG ENCIA
 La discusin de costos involucran aspectos de amplio espectro pues deben cubrir
las necesidades del BCP
 Estos incluyen: soft, hard, viajes, envo de materiales, pruebas, entrenamiento,
concientizacin, horas de trabajo, servicios contratados y todo el equipamiento de
oficina
 La organizacin debe efectuar un anlisis de costo-beneficio para completar la
identificacin del plan de recuperacin mas adecuado

PROCESOS Y PROCEDIMIENTOS
S I T I O S A LT E R NO S O D E C O N T I NG ENCIA
La distancia entre sitios es una consideracin adicional a definir

Una solucin combinada se estructura a nivel del software de aplicacin por lo


general usando duplex standby DB y message queuing en middleware

PROCESOS Y PROCEDIMIENTOS

Los aspectos revisados cubren aspectos tales como:


 La importancia de procesos y procedimientos para conocer con precisin
como el personal y la infraestructura de TI van a reaccionar en casos de
crisis
 Diferentes tipos de planes de contingencia incorporados en el BCP
 Los equipos de gestin de la crisis y procedimientos de notificacin y
activacin del BCP
 Consideraciones de costos en la seleccin de alternativas de Alta
Disponibilidad, Recuperacin de Desastres y seleccin de Sitios Alternos

DISEO DE LA ESTRATEGIA DE TI
Estamos ahora en condiciones para disear las estrategias, arquitecturas y
tecnologas de TI apropiadas para soportar un BCP end-to-end
Consideremos las mejores
practicas referidas a:
 Simplificacin de
infraestructura de TI
 Diseo en alta
disponibilidad
 Servidores de alta
disponibilidad
 Replicacin de datos
 Diseo de Bases de
Datos y software

DISEO DE LA ESTRATEGIA DE TI
S I M P L I FI CAC IO N D E L A I N F R AE STRU CTU RA D E T I
El primer paso de la estrategia debe evaluar las disponibilidades desde un punto de
vista de consistencia de: operaciones, herramientas y en gestin de los datos
Alta heterogeneidad en la infraestructura requiere una variedad de herramientas,
polticas y habilidades, que requieren procesos complejos de recuperacin
Una buena practica consiste en iniciar en paralelo un proceso de consolidacin y
estandarizacin de la infraestructura
Los beneficios a lograr son:
 Mayor facilidad al administrar menos componentes
 Disponibilidad para reinvertir los recursos que se ahorren en el BCP
 Posibilidad de sincronizar proyectos de consolidacin con el del BCP,
logrando incorporar mejoras como en:

gestin de cargas,
gestin de los datos,
administracin del sistema,
cambios de control y otros

DISEO DE LA ESTRATEGIA DE TI
S I M P L I FI CAC I N D E L A I N F R AE STRU CTU RA D E T I

DISEO DE LA ESTRATEGIA DE TI
O B J E T IVO S D E L A A R Q U I T ECTU RA D E T I

DISEO DE LA ESTRATEGIA DE TI
A LTA D I S P O N I B IL I DAD

 Soluciones de servidores en cluster a travs del


SO e infraestructura de hardware
 Estructura dctil y dinmica que respalda
(esconde) fallas en sus componentes

Sin puntos nicos de fallo

 Provee acceso continuo a las aplicaciones

DISEO DE LA ESTRATEGIA DE TI
O P E R AC I N C O N T I NUA

 Permanente acceso a la infraestructura de TI en


condiciones normales
 No es necesario bajar las aplicaciones para
efectuar procesos de soporte o mantenimiento

Back-ups programados

Mantenimientos planificados

DISEO DE LA ESTRATEGIA DE TI
R E C U P E R AC I N D E D E SA S TR ES

 Capacidad de recuperacin ante interrupciones


generalmente en un sitio alternativo

Usualmente en hardware diferente

 Efectuado despus de que algo ha afectado la


operatividad a lo largo del sitio original

DISEO DE LA ESTRATEGIA DE TI
M O D E LO D E CA PA S D E C O N T I NUI DAD
 Un modelo de buenas practicas en la gestin de continuidad es el modelo de
capas para organizar los mltiples productos tecnolgicos
 El concepto es organizar la infraestructura en conjuntos para facilitar su evaluacin y
gestin. Dados valores de RTO del usuario, los productos y tecnologas del BCP
pueden ser ordenados generando grupos que responden los valores particulares de
RTO
 Luego, categorizando las opciones de tecnologa de continuidad segn valores de
RTO en una serie de capas, es posible cotejar los RTO deseados con el conjunto
optimo de tecnologas
 A medida que el tiempo de RTO decrece, la tecnologa que debe ser aplicada es
mas agresiva, consiguientemente de mayor costo.
 El concepto es dinmico, mientras el RTO por capa es mas bien fijo, la tecnologa
asociada es cambiante. Es posible actualizar las tecnologas asociadas a cada capa
de continuidad en funcin de su RTO
 Asimismo, si la criticidad de un proceso de negocio se incrementa, reduce su tiempo
de RTO, por tanto estar en condiciones para cambiar de capa segn corresponda al
nuevo tiempo de RTO

DISEO DE LA ESTRATEGIA DE TI
M O D E LO D E CA PA S D E C O N T I NUI DAD

 Como parte de la estrategia de TI se deber ajustar las escalas al entorno particular


y hacer de estas un instrumento de planificacin, comunicacin y toma de
decisiones, pues facilita la asignacin de la o las capas corresponden al RTO
deseado, as como la tecnologa requerida

DISEO DE LA ESTRATEGIA DE TI
S E G M E NTAC IO N D E P RO C E S O S
 Como siguiente paso se deben segmentar los procesos del negocio y las
aplicaciones de TI asociadas, al modelo de capas de continuidad.
 Una tecnologa de continuidad no es aplicable a todos los procesos de negocio
 Esta segmentacin se hace en (idealmente) tres segmentos segn el RTO
 Luego debe mapearse la segmentacin de procesos con las capas de continuidad

DISEO DE LA ESTRATEGIA DE TI
S E G M E NTAC IO N D E P RO C E S O S
 Con este modelo se mapean segmentos de procesos de negocio con capas de
tecnologas de recuperacin, identificando las tecnologas apropiadas a los niveles
de recuperacin (procesos) necesarios
 La consideracin de particularidades de cada segmento son variables, se definen de
acuerdo al contexto, en lneas generales se consideran:
 Disponibilidad Continua

Disponibilidad de datos 24x7 (servidores, almacenamiento, network)


Failover automtico de aplicaciones o sitios
Recuperacin gil y transparente (servidores, almacenamiento, network)
RTO entre minutos a 2 horas

 Recuperacin gil de Datos

Alta disponibilidad de datos y sistemas de almacenamiento (storage resilency)


Failover automtico o manual de sistemas de almacenamiento
Recuperacin gil de sistemas de almacenamiento
RTO de entre 2 a 8 horas

 Back-up/Restore

Back-up y recuperacin desde cinta o disco


RTO de 8 horas a varios das dependiendo del volumen de datos

DISEO DE LA ESTRATEGIA DE TI
S E G M E NTAC IO N D E P RO C E S O S
 La segmentacin muestra su valor estratgico en su perspectiva de aplicacin
progresiva en el tiempo

DISEO DE LA ESTRATEGIA DE TI
S E G M E NTAC IO N D E P RO C E S O S
 Construccin de Disponibilidad Continua

Identificar datos y aplicaciones de mayor criticidad que requieren disponibilidad continua


e inmediata recuperacin en caso de fallas
Definidas estas aplicaciones y procesos de negocio, asignarle recursos especficos de alta
disponibilidad (servidores, almacenamiento, bases de datos, software y recursos de red)
Estos recursos constituyen la infraestructura de alta disponibilidad del el negocio

 Bajo el mismo modelo se construyen ambientes de gil Recuperacin de Datos y el


de Back-up/Recovery, definiendo los estndares e infraestructura de cada segmento
 Construccin de un ambiente estandarizado de BC

Este modelo construye una estrategia de Consolidacin y Simplificacin que estandariza


la infraestructura de TI de manera horizontal (mltiples procesos y lneas de negocios)
Con esto construimos un conjunto estndar de recursos en infraestructura del negocio
Asimismo obtiene una metodologa con economas de escala estratgicas que reforzada
con buenas polticas y gobernabilidad de TI constituyen una arquitectura dinmica de BC

 Valor estratgico

En el tiempo, la implementacin de nuevas aplicaciones y procesos de negocios, la


definicin de capacidades de recuperacin esta ya estandarizada en un modelo de BC
flexible, escalable y consistente

DISEO DE LA ESTRATEGIA DE TI
R E S U M E N D E L D I S E O E N A LTA D I S P O N I B IL I DAD

 Se han revisado conceptos de Capas para BC y segmentacin de procesos para


establecer una arquitectura homognea y optimizada de BC
 Los pasos a seguir son:

Categorizar el conjunto de procesos del negocio en segmentos en funcin de la tolerancia


esperada ante interrupciones (baja, media y alta). Procesos que independientes no son
crticos pero que inciden en la operativa de otros que lo son, deben clasificarse en la
categora correspondiente

Para cada segmento se tienen varias capas de continuidad que corresponden a sus
mejores opciones de tecnologa de continuidad. No es necesario utilizar todas la capas y
por ende todas las tecnologas

Segmentados los procesos del negocio y las aplicaciones en tres bandas, seleccionamos
la mejor tecnologa de continuidad para la banda.

 El resultado de este proceso logra optimizar y mapear las variables necesidades de


tiempos de recuperacin con la tecnologa apropiada y a costos racionalizados, es
decir la mejor cobertura de las aplicaciones a los menores costos

DISEO DE LA ESTRATEGIA DE TI
S E RV I D O R E S D E A LTA D I S P O N I BI L IDAD

 Debe establecerse cuidadosamente las condiciones de alta disponibilidad


requeridos por el negocio. Esta configuracin es la lnea de base de consolidacin y
residencia requerida en servidores y SO
 Con un apropiado nivel de tolerancia a fallos, redundancia, residencia y capacidades
de clustering, los servidores pueden ser parte de un proceso de diseo de BC para
capacidad de recuperacin end-to-end
 Por lo general, alta disponibilidad en servidores enmascaran interrupciones de
manera interna y automtica, este diseo aplicado sobre sus componentes (CPU,
memoria y discos) permite su operacin ininterrumpida
 Varios servidores habilitados con alta disponibilidad son configurados para trabajar
juntos y asegurar recuperacin automtica en casa de fallos en un mnimo tiempo
de interrupcin.
 En este tipo de sistemas el SO detecta las fallas del hard y administra la
supervivencia de las aplicaciones reinicindolas el el mismo u otro disponible (que
asume la identidad del primero)

DISEO DE LA ESTRATEGIA DE TI
S E RV I D O R E S D E A LTA D I S P O N I BI L IDAD
 Tambin es necesario eliminar todo punto de falla con relacin a equipos o servicios
externos, si los equipos tienen una sola interface y conexin de red, una segunda de
respaldo debe ser habilitada
 Una alternativa para alta disponibilidad es una arquitectura de servidores en cluster
lo que permite compartir recursos entre ellos. Generalmente el almacenamiento
reside en arreglos compartidos de discos accesibles desde cualquier servidor
 Los conceptos de consolidacin y simplificacin son aplicables a los servidores para
establecer una arquitectura de alta disponibilidad a un costo racionalizado
 Soluciones de virtualizacin son altamente recomendados y deben ser utilizados
para mejorar el control, la eficiencia y gestin.

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N D E DATO S
 Como parte de la estrategia de TI para BC con sitios alternos, la pregunta a
responder es: Cual la mejor manera de replicar datos al sitio de respaldo?
 Existen dos categoras de proteccin de datos en el entorno de la replicacin:
 Corrupcin de datos: Producido por lo general debido a errores humanos o de las
aplicaciones para el cual, copias locales point-in-time en disco o cinta son una opcin
 Perdida de datos: Generada normalmente por perdida de capacidad de acceso, fallas
fsicas o destruccin de las estructuras de almacenamiento. Para este caso, la replicacin
remota es la tecnologa de recuperacin usualmente utilizada

 La replicacin de datos puede efectuarse de manera


valida en diferentes niveles:
 Bases de Datos y/o Aplicaciones (software)
 Servidores y SO
 Estructuras de almacenamiento (storage)

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N D E DATO S

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N D E DATO S

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N A N I V E L D E A P L I CACI O NES O B A S E D E DATO S
 El software y los RDBMSs actuales tienen facilidades para replicar datos (remoto)
 En este modelo el desde el soft o la DB direccionan datos (unidades logicas de
datos o transacciones) a una diferente instancia (sitio remoto) en forma de log-files
 En el sitio remoto, estos log-files pueden ser aplicados a una copia sombra
(shadow) de la DB

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N A N I V E L D E A P L I CACI O NES O B A S E D E DATO S
 Este modelo es til cuando se requiere minimizar anchos de banda.
 La aplicacin o DB tiene pleno conocimiento de datos y transacciones, el software
tiene inteligencia para eliminar informacin innecesaria antes de enviarla
 La cobertura de consistencia y recuperacin estn en el entorno de la aplicacin
 En el sitio remoto se regeneran problemas de consistencia (roll-back/commit)
 Se utilizan ciclos de tiempo ajustables para transmisin automtica
 Organizaciones con entornos de TI altamente homogneos en aplicaciones y DB,
con fuerte tendencia estratgica de estandarizacin bajo el mismo entorno, son las
que pueden aprovechar sustancialmente el modelo

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N A N I V E L D E L S E RV I D O R
 Es realizado por el SO o algn software en este (file system) y efecta la replicacin
a nivel de I/O (write-I/O-level)
 No tiene conocimiento de las frontera de transaccin o unida lgica de trabajo

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N A N I V E L D E L S E RV I D O R
 Como el servidor tiene control de todas las aplicaciones y bases de datos que
administra, la replicacion (de alguna unidad espejada o en cluster) es enviada con
cada cambio (write/update) al sitio remoto
 Es independiente de las aplicaciones y datos por lo que toma ventaja cuando hay
muchas y diferentes aplicaciones corriendo en el servidor o cuando hay muchos y
diferentes tipos y cantidades de datos, los interpreta como bloques indistintamente
 La cobertura de consistencia y recuperacion sera con una plataforma equivalente
 Como quiera que en este modelo no se tiene conocimiento completo del
significado logico de los datos que se transmiten, usa un mayor ancho de banda
 Cuando se requiere iniciar la instancia remota, se tiene una imagen no consistente
de los datos (crashed-image). DB y aplicaciones precisan un apropiado proceso de
consistenciacion (Roll-back)
 Utilizan ciclos programables para su ejecucin automatica
 Es en resumen menos compleja de implementar y es independiente de las
aplicaciones, pero esta limitada a plataformas equivalentes

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N A N I V E L D E I N F R AE STRU CTU RA D E DATO S
 Modelo muy util cuando el entorno a nivel del servidor es heterogneo, algunos
sistemas novedosos de cinta (virtual-tape) tambin lo aplican

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N A N I V E L D E I N F R AE STRU CTU RA D E DATO S
 Aplica en ambientes en los que la cobertura de recuperacin debe abarcar
plataformas de SO multiples, cuando la magnitud de la replicacin es grande y
requeriran ciclos grandes de descarga desde el servidor
 Como implica replicar desde una infraestructura comn de almacenamiento que
soportan a todos los servidores, es un medio comn de replicacin a todos ellos, es
independiente de los servidores, de sus plataformas y de las aplicaciones
 La cobertura de consistencia y recuperacin implica la misma plataforma de
estructura de almacenamiento (marca y familia). Esto debido a que el proceso
transfiere una imagen del controlador cache del storage (estructura del cahce)
 Del mismo modo que a nivel de servidor, la instancia remota tiene una imagen no
consistente de los datos (crashed-image) y requiere consistenciacion
 Tampoco tiene control sobre el significado lgico de los datos, incluso menos que
el servidor por lo que su volumen es alto y requiere un mayor ancho de banda
LA REPLICACION DE DATOS ES SOLAMENTE UNA PARTE DE LA SOLUCION

DISEO DE LA ESTRATEGIA DE TI
S E L E C C I N D E L M O D E LO D E R E P L I CACI N

DISEO DE LA ESTRATEGIA DE TI
S E L E C C I N D E L M O D E LO D E R E P L I CACI N

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N S I N C RO NI CA Y A S I N CRO NICA

Anlisis del
Impacto en el negocio
Y los costos
Impacto del tiempo mximo aceptable de respuesta

Mximo aceptable de perdida de transacciones (por proceso)


Un equilibrio entre costos relativos y beneficios

REPLICACION SINCRONICA
El impacto del tiempo de respuesta
es aceptable
La distancia es metropolitana
Ninguna perdida de datos es un
requisito
Para una recuperacin rpida
Prximo a Disponibilidad Continua

REPLICACION ASINCRONICA
Un pequeo impacto a la operatividad del
sitio primario es requerido
La distancia es amplia
Es aceptable la regeneracin de datos
Necesita mayor esfuerzo para su
implementacin
Provee rpida bajada y subida de sistema
No cataloga como Disponibilidad Continua

DISEO DE LA ESTRATEGIA DE TI
R E P L I CAC IO N S I N C RO NI CA Y A S I N CRO NICA

 Un modelo de replicacin asincrnica requiere de mayor tiempo y esfuerzo para su


implementacin
 El estado de los datos en el sitio remoto tiene un rezago
 Una cierta cantidad de datos deben recrearse en el sitio remoto
 Dependiendo del rezago puede tener un efecto domino con otras aplicaciones

 El estado de los datos puede variar en el sitio remoto


 Esta variacin implica que se debe considerar diferentes formas de interaccin entre los
diferentes procesos del negocio que son recuperados
 La variacin, frecuencia y sus efectos deben ser analizados y verificados para
dimensionarlos y administrarlos adecuadamente
 Existen varias tcnicas para manejar con suficiencia estas consideraciones per
requerirn de mayor proceso de planificacin e integracin de infraestructura

GESTION DEL BCP


 Con el plan diseado y la estrategia de TI definida, estamos preparados para iniciar
la gestin del BCP
 El primer elemento de gestin del plan es la implementacin que se desarrolla en
el marco de la implementacin de cualquier proyecto tecnolgico

IMPLEMENTACION DEL BCP


La implementacin del BCP implica integrar de manera operativa todos los elementos
que han sido diseados y establecidos
Se deben tomar en cuenta los siguientes
principios
Incluir como base del BCP la
consolidacin y simplificacin de la
infraestructura de TI
No tratar de hacer todo al mismo
tiempo
Planificar para construir el BCP de TI paso
a paso
Comenzar donde se esta hoy y
planificar un proceso multifase
progresivo hacia el objetivo final
Cada paso establece las bases para el
siguiente

IMPLEMENTACION DEL BCP

IMPLEMENTACION DEL BCP


E S TA MACI O N D E L T I E MP O D E R E C U P E R AC IO N
En la elaboracin del BCP se definen KPIs para tiempos y otras mtricas

VALIDACION DEL PROGRAMA


La validacin implica el diseo de un conjunto de pruebas y planes de entrenamiento

VALIDACION DEL PROGRAMA


U N E N TO R NO A S E Q U IB L E D E P RU E B A

 Los requerimientos son: CONFIABILIDAD, REPETITIBILIDAD, ESCALABILIDAD


 Estos tres aspectos no pueden probarse o mejorarse sin la capacidad de efectuar
pruebas frecuentes a costos accesibles
 Un entorno asequible no debe requerir mano de obra intensa o distraer el tiempo
de otras tareas
 Por tanto debe explotar en alto grado la AUTOMATIZACION
 La automatizacin hace factible hacer pruebas repetitivas con una frecuencia
programada
 Eliminando requerimientos de personal adicional lo convierten en un proceso
altamente repetible
 El componente de escalabilidad es tambin mas alcanzable

VALIDACION DEL PROGRAMA


L A S P RU E B A S
 La estrategia integral de continuidad requiere probar integralmente el BCP
empresarial conjuntamente con el de TI
 Las pruebas identifican deficiencias y ayuda a evaluar la capacidad del equipo de
recuperacin para implementar el plan rpida y efectivamente
 Cada elemento del BCP debe ser probado para confirmar la precisin de los
procesos individuales y su efectividad integral
 Deben ser cubiertas las siguientes reas:

Recuperacin en plataformas alternas desde cintas de Back-up

Coordinacin entre equipos de recuperacin

Conectividad interna y externa

Rendimiento del sistema en equipamiento alterno

Restauracin de operaciones normales

 Para cada tem deben establecerse objetivos y criterios de xito explicitos. Los
resultados deben ser documentados y revisados
 Los resultados y datos recopilados del test son un insumo para la optimizacion

VALIDACION DEL PROGRAMA


VA L I DAR R TO S C O N P E R S O NAL O P E R ATI VO

 La validacin debe expresar las condiciones normales, deben disearse y


conducirse en un ambiente de situaciones no ideales
 Una buena practica es ejecutarlo asumiendo la ausencia de sus diseadores y
otros expertos en el tema, estos deben participar como simples observadores
 El ejercicio del BCP ser entonces ejecutado completamente por el personal del
sitio alterno (asumiendo ausencia del equipo primario) siguiendo con precisin los
procesos y procedimientos vigentes
 El plan de pruebas debe mantener neutralidad sobre las capacidades del cliente
 La automatizacin es un componente importante de este proceso, reduce
dependencia de habilidades del personal por lo que reduce el impacto del BCP
ante ausencia de algn grupo de recuperacin

VALIDACION DEL PROGRAMA


E N T R ENAMIE NTO

 Entrenar al personal sobre sus responsabilidades complementa la prueba


 Debe ser efectuado al menos una ves al ao y personal de reciente incorporacin
deben ser inducidos apropiadamente
 A la larga, el personal involucrado con el Plan de Contingencia debe capacitarse al
extremo de poder ejecutar los procedimientos sin apoyo de la documentacin
 Los mbitos de capacitacin son:

Propsito del plan

Coordinacin y comunicacin cruzada entre equipos

Procedimientos de reporte

Requerimientos de seguridad

Procesos especficos por equipo (activacin, notificacin, recuperacin y


reconstruccin)

Responsabilidades individuales (activacin, notificacin, recuperacin y reconstruccin)

VALIDACION DEL PROGRAMA


G E S T I N D E R E S I L I E NCIA ( A DA PTAB IL I DAD ) D E L P RO G R A MA
 Por ultimo el BCP debe considerar procesos que le otorguen capacidades de
dinamicidad y adaptabilidad a las cambiantes condiciones del negocio
 Se deben definir los siguientes aspectos:

Concientizacin progresiva
Validacin peridica
Gestin del cambio y del sistema
Sesiones peridicas de administracion

VALIDACION DEL PROGRAMA


C O N C I E NTIZAC I N Y VA L I DAC I N P E R I D I CA
 El manejo de KPIs son esenciales tanto para la difusin del rendimiento como de
la efectividad del BCP
 Se recomienda publicarlos en lugares clave de las instalaciones de la organizacin
mostrando los objetivos de cada indicador y el progreso en su alcance
 Con una buena gestin del programa, el personal tomara conciencia del estado
del proceso y sus progresos
 As el personal ser motivado para y sentir el orgullo de alcanzar los objetivos

VALIDACION DEL PROGRAMA


G E S T I N D E L CA M B IO Y D E LO S S I S T EMAS

 El BCP debe ser mantenido y estar siempre preparado y actualizado reflejando los
requerimientos del sistema, sus polticas y procedimientos
 El ambiente de TI soporta cambios frecuentes debido a los ajustes a las
necesidades del negocio, actualizaciones tecnolgicas o nueva normativa
 Es esencial revisar y actualizar regularmente el plan para asegurar que las nuevas
condiciones han sido documentadas y las medidas de contingencia ajustadas
 Este anlisis deber hacerse al menos cada cuatro meses aunque ciertos
elementos requerirn revisiones mas frecuentes (inventario de equipos, versiones
de las aplicaciones, etc.)
 Las actualizaciones deben cubrir tambin al personal, equipos de recuperacin,
listas y mtodo de comunicaciones, listas de contactos, proveedores y otros
 La automatizacin apoya este proceso facilitando la evaluacin de componentes y
usuarios y procedimientos con mayor frecuencia

VALIDACION DEL PROGRAMA


G E S T I N D E L CA M B IO Y D E LO S S I S T EMAS

 Como mnimo las revisiones deben enfocar los siguientes elementos:

Requerimientos operacionales
Requerimientos de seguridad
Procedimientos tecnolgicos
Hardware, software y otro equipamiento
Nombres e informacin de contacto de los integrantes de equipos
Nombres e informacin de contacto de proveedores (fijos y alternos)
Requerimientos de recursos de sitios alternos u off-site
Registros vitales del negocio (electrnicos u otros)

 El BCP contiene informacin altamente sensible sobre las operaciones y personal


del negocio, su distribucin debe efectuarse con precisin y de manera controlada
 Copias del plan se distribuyen al personal clave para su resguardo en oficina y
fuera de ella as como en el sitio alterno. Una lista de las copias entregadas y
acuerdos de confidencialidad de receptores son parte de la documentacin
 Asimismo, informacin sobre contratos, SLA suscritos, licencias de software,
manuales y procedimientos deben ser incluidos

VALIDACION DEL PROGRAMA


G E S T I N D E L CA M B IO Y D E LO S S I S T EMAS

 Cambios en el plan, estrategias y polticas deben coordinarse con el coordinador


del BCP. Estos difundidos segn corresponda
 Los cambios sern apropiadamente documentados manteniendo informacin
histrica de su ocurrencia

 El coordinador interactuara frecuentemente con asociaos internos y externos para


garantizar que los cambios en cualquiera de estos se reflejen en el BCP. Deber
hacer un estricto control de versiones del plan

VALIDACION DEL PROGRAMA


G E S T I N D E L CA M B IO Y D E LO S S I S T EMAS

 El coordinador tambin evaluara la informacin de soporte asegurando que este


vigente y mantenga el cumplimiento de los requerimientos del sistema. Deber
validar por lo menos la siguiente informacin:

Contratos del sitio alterno incluyendo histrico de pruebas


Licencias de software
Acuerdos SLA con vendedores
Requerimientos de hardware y software
Requerimientos de seguridad
Estrategia de recuperacin
Polticas de contingencia
Material de concientizacin y capacitacin
Cobertura de las pruebas

 Algunos cambios no son tan evidentes por lo que el BIA tambin debe ser revisado
y actualizado peridicamente

VALIDACION DEL PROGRAMA


S E S I O N ES C UATR I MESTR AL ES D E A D M I NIS TR ACI N

 Las KPIs son un instrumento para informar a la alta gerencia sobre el progreso
del BCP, es recomendable que con frecuencia cuatrimestral el estado de cambios
sea presentado para revisin
 En sesiones de administracin deben ser abordados los siguientes puntos clave:
TI presenta el estado de su BCP a responsables de las lneas del negocio para
asegurar que ambos estn alineados con el BCP de la organizacin
Se usan los KPIs para fundamentar la reunin, reafirmar el valor del negocio
y la justificacin del BCP
En definitiva, son las lneas del negocio que tienen los riesgos teniendo el
soporte operacional de TI
TI asume su responsabilidad por lo que busca que los responsables de lneas
de negocios sean socios en garantizar la continuidad

RESUMEN DEL PROYECTO

1.
2.
3.
4.

5.
6.
7.

Revisin de la Infraestructura (hardware, software, networking,


comunicaciones, servicios contratados, proveedores, etc.)
Evaluacin de estrategias (del negocio, de TI, medio ambiente,
tendencias)
Revision de metodologas y tecnologa de BC
Priorizacin del Negocio
 Evaluacin de Riesgos
 Anlisis del impacto en el negocio (BIA)
 Evaluacin del BCP vigente

Integracin con TI

 Diseo del BCP


 Diseo de la estrategia de TI

Gestin del BCP

 Implementacin del programa


 Validacin del BCP

Programa de resiliencia (adaptabilidad)

BISINESS CONTINUIT Y PLAN PARA TI

GRACIAS . . .

Vous aimerez peut-être aussi