Académique Documents
Professionnel Documents
Culture Documents
QSE 2014 - Solucom - 2. Plans de Continuité Dactivité 1.0 PDF
QSE 2014 - Solucom - 2. Plans de Continuité Dactivité 1.0 PDF
Séisme
Panne
Grèves logicielle Coupure
informatique
Inondation Panne
Panne Défaillance de
matérielle
électrique Incendie prestataires
...
Les entreprises
31 morts, des milliers de blessés. Impossible de passer et recevoir des Séisme puis tsunami et catastrophe
2750 morts, 800 000 m² de bureaux Destruction du site et des alentours (150 appels pendant 1 journée suite à une nucléaire. 20 000 morts, conséquences
rasés. 350 entreprises et 40 000 bus de transport public, plusieurs panne informatique. Coût estimé de 20 majeures sur les infrastructures, forte
personnes étaient présentes sur le site. entreprises touchées, un lycée, une salle millions d’euros et dégâts d’image perturbation de l’activité économique du
de concert, …) considérables. pays.
…et 2014 ?
L’indisponibilité d’activités clés peut causer des impacts majeurs et multiples pour les organisations
Financier
Ex : la perturbation de certaines
activités critiques (ex : salles de
marchés) peut entraîner
Client rapidement des impacts de Juridique
plusieurs millions d’euros.
Ex : un incident informatique Ex : la continuité des activités
pourrait entraîner la perception vitales des banques est rendue
avec retard des prestations obligatoire par la règlementation
sociales. (CRBF 97-02).
Interne
Image
Ex : des incidents à répétition sur
Ex : une perturbation importante les systèmes informatiques
des activités entraînerait une pourraient entraîner des
dégradation de l’image de marque mécontentements clients en
de la banque vis-à-vis du public et agences et une dégradation des
des autres acteurs de la place. conditions de travail des agents.
Crue « lente » : 10 à 15 jours entre l’atteinte de la Au moment de l’alerte, le pic de crue ne peut pas
cote d’alerte et la cote maximale encore être déterminé
Décrue tout aussi lente, de l’ordre de 15 jours… Pour les crues majeures, les fortes évolutions de
l’urbanisme en Ile de France depuis 1910 rendent
… mais qui peut aller jusqu’à 40 jours (1910) difficile toute prévision
870 000 foyers et 2 640 sites de haute Arrêt de fonctionnement des RER A, B
tension sont concernés par le risque de et C, des gares de Lyon et d’Austerlitz
coupure électrique et des lignes de métro (par tronçons)
Transport routier :
• 100% des ponts à Paris et en
Télécommunications : Petite Couronne seront
inaccessibles
Sous-répartiteurs situés dans les sous-
sols inondables • Les autoroutes A86, A4 et A6
coupées à certains endroits
Réseau dépendant de l’alimentation
électrique • Engorgement des voies de
circulation
Eau potable :
Énergie :
5 000 000 de personnes seraient
Usagers ne seraient plus alimentés par le Assainissement :
privées d’eau potable
chauffage urbain Les égouts débordent et
De nombreux centres de distribution l’élimination des déchets
d’hydrocarbures sont inondés ménagers est rendue très
difficile
Accepter Éviter
Scénario
de
risque Réduire
Transférer probabilité
Transférer Limiter
impacts Réduire la probabilité
Déporter le risque sur un tiers (prise
Traiter le risque en amont, en réduisant
d’une assurance, transfert d’une activité
sa probabilité d’occurrence
à un prestataire, …)
Plan de Continuité d’Activité (PCA) : ensemble de dispositifs permettant de limiter les impacts lorsqu’un ou plusieurs scénarios de
risques sont avérés
Couverture
Coût
Un dispositif relevant d’un équilibre coût / couverture de risques de risques
PCA
Deux critères essentiels sont utilisés pour l’expression des besoins de continuité. Ils permettent de
déterminer la criticité des applications et des infrastructures informatiques sous-jacentes
Dernière Incident
Sauvegarde Reprise
majeur à T T+y
T-x Période non présente sur Application disponible
les sauvegardes Période de reprise à nouveau
PDMA DIMA
Procédures Positions de
travail Stockage ou
Référentiel documentaire approvisionnement des
Mesures d’anticipation, ressources matérielles
de contournement, formulaires Métiers nécessaires, …
Do
Définir et mettre en Check Gérer les incidents et
œuvre les plans d’action crises de continuité
Sensibiliser et former
à la continuité d’activité
Tester
Analyser les risques
régulièrement
Définir les besoins
Mettre à jour la
stratégie de
secours 1 Cadrage
Mettre à jour Maintenance et
les solutions amélioration 5 Recenser les
techniques 2 Stratégie solutions
Mettre à jour Évaluer les scénarios
les procédures
Test & recette 4 Conception
3 et mise en œuvre
PCO PCI
Valider le Valider le PCO PCI
fonctionnement des fonctionnement des Organisation Organisation
moyens de secours solutions Moyens de secours Infrastructure technique
Valider le caractère techniques Procédures Procédures de reprise
applicable des Valider le caractère dégradées du SI
procédures et de applicable des Site(s) de repli Site(s) de secours
l’organisation procédures et de utilisateurs informatique
l’organisation
Mme DURAND
- Administration des Ventes (facturation/recouvrement, stratégie, etc.)
- MOA du Système d'Information DMC
107
Localisation
Crossing
Sèvres
Aphelion
autre site : à préciser
Effectifs sur site
0
0
210
sans objet
réaliser ces activités critiques? - Mise en marché de nouveaux produits (déclinaison, définition et mise à disposition d’outils)
- Animation fonctionnelle des forces de ventes et relation commerciale pour les
Impact 2 3 4 5 5
DMC.0. Pilotage de la Filiale 7
Effectif 1 1 3 3 7
30
Impact
Effectif
Impact
2
5
3
10
4
15
3
5
18
4
5
18
Effectif 7 15 20
Impact 1 1
DMC.3. Relation Client : Développement 2
Effectif 1 2
Impact 2 3 3 4 4
DMC.5. Mise en Marché / Communication 2
Effectif 1 1 1 2 2
Effectif
Quels sont les prestataires indispensables ? La DMC dispose de sa propre Cellule de Crise Métier composée de 4 personnes.
Pour chaque couche technique SI, étude des solutions disponibles pour le
secours.
Actif
Applications Matériel dédié (Clustering, partage Activable Dormant
de charge,…)
Mutualisé interne
Matériel Mutualisé externe
(Pré-production, Intégration,
mutualisé (chez un prestataire)
Tests,…)
Services d’infrastructure Matériel
(annuaires, DNS, hyperviseur…) Commande lors du sinistre Pré-contractualisation
approvisionné
Réseau Réseau
Réseau dupliqué distincts
Réseau étendu Réseau mixte
Bi-site proche Bi-site éloigné Bi-site éloigné avec 2 Bi-site éloigné. 2ème site Tri-site
salles sur le 1er site externalisé INT
Hébergement et Eventuellement 2 salles sur le ou EXT
Rép. synch. Rép. asynch. 1er site
réplication
Rép. asynch. Rép. asynch.
S1 <20 km S2 S1 >200 km S2 Rép. synch.
S1 >200 km S2 S1 >200 km EXT <20 km S2
S1
Mutualisation
Haute-disponibilité Haute-disponibilité
Secours des Dédié activable ou externe
Haute-disponibilité locale distante
applications mutualisé avec Eventuellement
vitales distante Mutualisation Mutualisation
Boot-On-SAN haute-disponibilité
interne (interne ou externe)
locale
Couverture de risques Couverture de risques Couverture de risques Couverture de risques Couverture de risques
5 5 5 5 5
4 4 4
Faisabilité Faisabilité 4 4
Faisabilité Faisabilité
3 3 3 3
organisationnelle organisationnelle organisationnelle 3
2 2
organisationnelle
Faisabilité 2 2 2
organisationnelle 1 Aspect 1 Aspect 1 Aspect 1 Aspect 1 Aspect
0 financier 0 financier 0 financier 0 financier 0 financier
1 Définition de la « Boîte à outils » des solutions des secours 2 Choix des stratégies
Un panel de solutions à disposition des PCO pour apporter une réponse adaptée au sinistre Définition des solutions à appliquer pour chaque activité
à secourir et cas de sinistre à traiter
Approvisionnement de
Repli sur site interne ou Nomadisme et travail à
ressources de
externe distance Activité à secourir
remplacement
….
…
Mesures de prévention
Choix des prestataires (repli /
… approvisionnement)
…
C Tests techniques …
1 Mise à jour des besoins 2 Adaptation de la stratégie 3 Mise à jour des solutions et procédures
Revue périodique du Bilan d’Impact Adaptation de la stratégie aux nouveaux Adaptation des solutions et procédures en fonction des
sur l’Activité (BIA) besoins recensés / aux tests réalisés adaptations de la stratégie / des résultats des tests
Impact 2 3 4 5 5
DMC.0. Pilotage de la Filiale 7
Effectif 1 1 3 3 7
Impact 2 3 4 5 5
DMC.1. Administration des Ventes : Opérations 20
Effectif 5 10 15 18 18
Impact 3 4 5
DMC.2. Définition de l’Offre Commerciale 30
Effectif 7 15 20
Impact 1 1
DMC.3. Relation Client : Développement 2
Effectif 1 2
Impact 1 2 3 4 5
DMC.4. Relation Client : Service Client 7
Effectif 1 3 4 5 5
Impact 2 3 3 4 4
DMC.5. Mise en Marché / Communication 2
Effectif 1 1 1 2 2
Impact
DMC.6. Autres activités non critiques 39
Effectif
Applications
Principes de conception
Définir une stratégie de secours consiste à :
combiner en un ensemble cohérent, exploitable
Architecture
applicative
et maintenable…
… des solutions variées définies pour chaque
couche technique
Serveurs, middlewares
et composants
d’infrastructure
Stratégie PCI
Question ? Choix
Mode d’activation du
C. Stratégie d’activation
secours
Légende :
Pas de contrainte technique majeure
Haute-dispo et réplication synchrone non possible
12 mai 2014 - Propriété de Solucom, reproduction interdite 30
Plan de Continuité Informatique
B. Secours des serveurs
Adapter le secours des serveurs aux délais de reprise souhaités (DIMA / RTO)
DIMA / RTO
1h 4h 12h 24h 2/3j 1 semaine et plus
Haute disponibilité
Serveurs
Activable /
dédiés Hot Stand-by
Dormant
Mutualisation interne
Serveurs
mutualisés Mutualisation
fournisseur
Pré-contractualisation de
Serveurs l’approvisionnement
Réplication
Réplication
BDD
Confirmation BDD BDD BDD BDD
BDD
Locale Distante Locale Distante Locale Distante
Des moyens à mettre au regard des besoins exprimés par les Métiers en
termes de DIMA et PDMA
DIMA
< 1h 1 à 4h 4 à 12h 12 à 48h > 48h > 1 semaine
RTO
Haute-disponibilité
< Quelques
distante
Asynchrone
heures
Réplication
Le PCI, un dispositif coûteux, vécu comme une contrainte et non comme une
assurance
Constats Des solutions unitaires sans vision globale du secours
Un coût perçu comme prohibitif, identifié comme levier d’économie lors des réductions budgétaires
Des tests complexes à organiser sans résultats probants…
…Ne permettant pas d’avoir confiance dans l’utilisation du PCI
Rétablir la confiance
Définir la stratégie de tests dès la conception Impliquer les directions Métiers dans la définition
du périmètre à secourir pour assurer la
Intégrer le PCI dans les processus existants
cohérence
S’assurer que la cellule de crise est en mesure
de déclencher le PCI
…à identifier au Opérationnels
plus près du
terrain pour s’assurer
de leur caractère
opérationnel et
maintenable
… à combiner au
mieux pour couvrir les
besoins, en veillant à la
réutilisation de l’existant Équipe projet PCA
et à la mutualisation pour
réduire les coûts efficient
… à valider par le
management pour
assurer une mise en Équipe projet Management
œuvre efficace
Management
Objectif
Le Plan de Continuité des Opérations vise à poursuivre les activités critiques de l’entreprise
(éventuellement en mode dégradé) en cas d’indisponibilité de ressources dont elles ont besoin.
Afin de limiter les coûts en mutualisant les solutions, les entreprises raisonnent
souvent sur la nature de l’impact plutôt que sur la menace.
croisé
Site externe (IBM / Sungard) Réquisition de bureaux
Prestation spécialisée Utilisation des positions de
travail d’autres collaborateurs
Site interne Souscription dédiée ou mutualisée
dédié au Arrêt potentiel d’autres activités Utilisation de
avec d’autres clients salles de réunion /
repli Politiquement délicat
Savoir faire du formation
Meilleure couverture secouriste Difficile à Nécessité de pré-câbler
des sinistres étendus tester (courants faible et fort) les
Environnement technique parfaitement salles de réunion
maitrisé Site Capacités de réunion réduites
Mutualisation possible entre plusieurs Configuration des salles à examiner
entités d’un même groupe (salles aveugles)
Dual-office Nomadisme
Mode de fonctionnement par
Reprise ou maintien de l’activité
alternatives
sans déplacement de
collaborateurs soit en mais sans poste de
interne soit en externe travail
(prestataires)
Préparation des solutions de travail à distance (augmentation des stocks de roulement de PC, préparation et test
des kits de connexion à distance, …)
Mise en place de mesures sanitaires renforcées (nettoyage des locaux plus fréquents, distribution de masques,
consignes sanitaires aux collaborateurs, fermeture des RIE, …)
Restriction des accès aux sites (selon l’ampleur de la crise, restriction des accès uniquement aux collaborateurs
internes à l’entreprise, puis uniquement aux contributeurs d’activités critiques devant exercer sur site)
Au moment de la crise
Recours à l’intérim (pour le remplacement de collaborateurs malades ou s’occupant de proches, plutôt sur des
postes peu qualifiés)
1 2 Priorisation des activités (focalisation des collaborateurs sur les activités critiques, pour pallier à l’absence de
3 4 personnel ou aux mesures de restriction des accès aux sites)
Gel des prestations de services non critiques (arrêt des prestations externes non indispensables pour le bon
fonctionnement de l’entreprise)
Recours au télétravail (pour éviter la propagation du virus sur les sites de l’entreprise et/ou pallier à une fermeture
sanitaire ou des perturbations dans les transports)
Adaptation des horaires de travail (pour pallier aux perturbations dans les transports publics et permettre aux
collaborateurs de prendre soin de proches malades)
Limitation des déplacements (limitation des déplacements entre plaques régionales pour éviter la propagation du
virus entre sites)
12 mai 2014 - Propriété de Solucom, reproduction interdite 44
Agenda
1
Le PCA est nécessaire pour savoir réagir à tout moment à des incidents
graves qui pourraient arriver
2
Le PCA est un compromis entre les coûts et la couverture de risque
souhaitée
3
Le PCA doit être un processus continu et non un projet ponctuel, car pour
rester efficient, le PCA doit rester « aligné » sur les besoins d’une
entreprise, son organisation, ses processus, ses architectures, et ses
infrastructures
Contact
Raphaël BRUN
Consultant senior