Vous êtes sur la page 1sur 9

PCA RTO RPO

Le principe de haute disponibilité (High Availability en anglais):


La haute disponibilité signifie qu'un système informatique, un composant ou
une application peut fonctionner à un niveau élevé, en continu, sans
intervention, pendant une période donnée. L'infrastructure haute disponibilité
est configurée pour offrir des performances de qualité et gérer différentes
charges et pannes avec un temps d'arrêt minimal ou nul.

Quelle est l’importance de la haute disponibilité ?


La haute disponibilité est vitale pour les organisations afin de garantir que leurs
systèmes critiques continuent de fonctionner correctement, même en cas de
panne ou de sinistre. Les temps d'arrêt imprévus se manifesteront de multiples
manières, notamment en termes de perte de productivité, de perte de
données, d'image de marque ternie et de désabonnement des clients, ce qui
aura un impact considérable sur l'avenir d'une entreprise.

Quels sont les composants de la haute disponibilité ?

Elle consiste à avoir des éléments de


Redondance secours ou de sauvegarde pour prendre le
relais en cas de défaillance d'un composant
principal. Cela peut inclure des serveurs de
secours, des systèmes de stockage
redondants,
L'équilibrage de charge L'équilibrage de charge est une technique
utilisée dans les systèmes informatiques
pour répartir la charge de travail de
manière équitable et efficace entre
plusieurs ressources, telles que des
serveurs, des routeurs ou des applications.
L'objectif principal de l'équilibrage de
charge est d'optimiser les performances du
système en évitant la surcharge de
certaines ressources tout en maximisant
leur utilisation
Les systèmes HA intègrent des
Détecter les pannes mécanismes de détection des pannes pour
identifier rapidement les défaillances
rapidement matérielles ou logicielles. Cela permet
d'initier rapidement les mesures de
récupération sans perturber les utilisateurs
Les systèmes HA sont souvent soumis à
Tests réguliers des tests réguliers pour vérifier leur
capacité à gérer efficacement les pannes et
à maintenir la disponibilité du service.
Cela peut inclure des tests de basculement,
des simulations de défaillance et d'autres
exercices de validation.
La surveillance continue est essentielle
Surveillance continue pour les systèmes HA. Des outils de
surveillance sont utilisés pour surveiller en
permanence les performances et l'état de
santé du système, afin de détecter
rapidement les problèmes potentiels et
d'agir en conséquence.

RPO (Recovery Point Objective) :


Le RPO fait référence à la quantité maximale de données que votre entreprise peut se
permettre de perdre en cas d'incident majeur avant que cela n'affecte négativement ses
opérations. En d'autres termes, c'est la durée maximale pendant laquelle des données
peuvent être perdues suite à un incident, exprimée en termes de temps. Par exemple, si
votre RPO est de 1 heure, cela signifie que vous ne pouvez pas perdre plus d'une heure de
données en cas de sinistre

RTO (Recovery Time Objective) :


Le RTO fait référence à la durée maximale acceptable pendant laquelle un service, une
application ou un système peut être hors ligne après un incident avant que son absence
n'affecte négativement l'entreprise. En d'autres termes, c'est le délai dans lequel vous
devez restaurer le service ou les systèmes après un sinistre pour minimiser l'impact sur
les opérations commerciales. Par exemple, si votre RTO est de 4 heures, cela signifie que
vous devez être en mesure de restaurer le service ou le système en moins de 4 heures
après un incident pour respecter vos engagements envers les clients ou les parties
prenantes.
Le RTO et RPO dans le cas d’une banque
Les banques jouent un rôle critique dans la gestion et la sécurité des actifs financiers de
leurs clients, et en conséquence, la continuité des opérations est une priorité absolue.
Pour cette raison, les banques doivent viser un RPO (Recovery Point Objective) aussi
proche de zéro que possible. Cela signifie qu'elles ne peuvent se permettre de perdre
aucune donnée client en cas de sinistre. Toutefois, un RTO (Recovery Time Objective)
de 1 à 3 heures est considéré comme acceptable pour les banques, ce qui signifie qu'elles
doivent être en mesure de restaurer leurs services et leurs systèmes critiques dans un
délai aussi court que possible après un incident. Bien que le temps de récupération soit
crucial, les banques ont souvent des mesures de sécurité et des mécanismes de
redondance en place pour minimiser les temps d'arrêt. Cependant, le RPO de zéro est
essentiel car toute perte de données pourrait avoir des conséquences financières graves et
nuire à la confiance des clients. En résumé, les banques doivent viser un RPO de zéro
pour garantir la sécurité et l'intégrité des données client, tout en pouvant tolérer un RTO
de quelques heures pour restaurer les services opérationnels essentiels.

Le RTO et le RPO dans le cas d’un centre


d’appel
Les centres d'appels, étant au cœur de l'interaction client, doivent être agiles dans leur
capacité à reprendre rapidement leurs opérations en cas de perturbation. Ils peuvent
généralement accepter un RPO (Recovery Point Objective) de 1, 2 ou 3 heures, ce qui
leur permet de perdre une quantité limitée de données en cas d'incident. Cependant, un
RTO (Recovery Time Objective) de 0 est crucial, car toute interruption de service peut
avoir un impact immédiat sur la satisfaction client. Ainsi, en priorisant un RTO de 0, les
centres d'appels peuvent maintenir la continuité de leurs opérations et assurer une
expérience client sans faille, même en cas de perturbation.

Relation entre le temps de sauvegarde et le


temps de restauration des données
Dans la pratique, il est courant d'observer que le temps nécessaire pour restaurer les
données après un incident est souvent le double du temps nécessaire pour les
sauvegarder. Cette observation découle de plusieurs facteurs, notamment la complexité
des systèmes de sauvegarde et de restauration, les limitations de bande passante lors du
transfert des données vers les supports de sauvegarde, ainsi que la nécessité de vérifier
l'intégrité des données pendant le processus de restauration. En conséquence, il est
essentiel pour les entreprises de prendre en compte cette relation lors de la planification
de leurs stratégies de sauvegarde et de reprise après sinistre, en allouant des ressources et
en établissant des attentes réalistes en matière de temps de restauration des données. Une
compréhension claire de cette dynamique peut contribuer à améliorer l'efficacité et la
fiabilité des processus de sauvegarde et de restauration, garantissant ainsi une meilleure
préparation aux incidents et une reprise plus rapide des opérations en cas de besoin.

La notion de backup
Un "backup" (ou sauvegarde en français) est une copie de données informatiques
stockées dans un système de stockage sécurisé en dehors de leur emplacement d'origine.
L'objectif principal d'une sauvegarde est de permettre la récupération des données en cas
de perte, de corruption, de suppression accidentelle ou de tout autre incident susceptible
de compromettre leur intégrité ou leur disponibilité

Types de solutions de sauvegarde ( backup) :

Type de solution Description Exemples


d'entreprises
proposant des
solutions
logicielles de
sauvegarde :
Solutions logicielles de Les solutions logicielles de  Veeam
sauvegarde sont des programmes  Acronis
sauvegarde : informatiques conçus pour gérer  Veritas
et automatiser le processus de Technologies
sauvegarde des données. (Backup Exec)
 Commvault
 Rubrik

Solutions matérielles de Les solutions matérielles de  Dell EMC


sauvegarde sont des dispositifs  Hewlett Packard
sauvegarde : physiques conçus pour stocker et Enterprise
protéger les données. Elles (HPE)
peuvent inclure des équipements  IBM
tels que des lecteurs de bande,  Synology
des dispositifs de stockage réseau  Quantum
(NAS), des systèmes de stockage
sur disque dédiés
Solutions logicielles et Ces solutions combinent à la fois  Barracuda
des logiciels de sauvegarde et du Networks
matérielles combinées matériel dédié pour offrir une  NetApp
(logiciel+matériel) : solution complète de sauvegarde  Dell EMC Data
et de reprise après sinistre. Elles Domain
offrent généralement des  Rubrik
fonctionnalités avancées telles
que la déduplication des données,
la compression, la réplication

Les backup Media


Bandes Stockage sur Cloud Storage
magnétiques disque (Disk) : (Stockage
(Tape) : dans le
cloud) :

Les bandes magnétiques Le stockage sur disque Le stockage dans le


sont l'un des médias de est devenu de plus en cloud offre une solution
sauvegarde les plus anciens plus populaire en raison de sauvegarde et de
et les plus fiables. Elles de sa rapidité et de sa stockage de données
offrent une capacité de facilité d'utilisation. Il basée sur des services
stockage élevée et sont offre des temps de hébergés sur des
souvent utilisées pour les sauvegarde et de infrastructures cloud.
sauvegardes à long terme et récupération plus Cela permet aux
les archives rapides que les bandes utilisateurs de stocker
magnétiques. leurs données sur des
serveurs distants
accessibles via Internet.

Un plan de sauvegarde (backup plan) :


Un plan de sauvegarde (backup plan) est un ensemble de stratégies, de procédures et de
politiques définissant comment les données critiques seront sauvegardées, stockées et
récupérées en cas de besoin. Voici ce qu'implique généralement un plan de sauvegarde :

1. Identification des données critiques : Déterminez quelles données sont


essentielles pour votre entreprise et doivent être sauvegardées régulièrement. Cela
peut inclure des bases de données, des fichiers clients, des documents financiers,
etc.
2. Fréquence de sauvegarde : Définissez à quelle fréquence les données doivent
être sauvegardées en fonction de leur importance et de leur volatilité. Les données
critiques peuvent nécessiter des sauvegardes quotidiennes ou même plus
fréquentes, tandis que d'autres données moins critiques peuvent être sauvegardées
moins fréquemment.
3. Méthode de sauvegarde : Choisissez les méthodes et les technologies de
sauvegarde appropriées en fonction de vos besoins. Cela peut inclure des
sauvegardes sur bande, des sauvegardes sur disque, des sauvegardes dans le cloud
ou une combinaison de plusieurs méthodes.
4. Sécurité des données : Assurez-vous que les données sauvegardées sont
sécurisées contre les accès non autorisés, la perte ou la corruption. Utilisez des
méthodes de chiffrement pour protéger les données sensibles et mettez en œuvre
des contrôles d'accès appropriés.
5. Tests de restauration : Effectuez régulièrement des tests de restauration pour
vous assurer que les sauvegardes sont fonctionnelles et que les données peuvent
être récupérées en cas de besoin. Cela garantit que votre plan de sauvegarde est
efficace et fiable

Best practice backup :(National Institute of


Standards and Technology (NIST)
1. Trois copies des données : Vous devez disposer de trois copies distinctes des
données importantes : l'original et au moins deux copies de sauvegarde.
2. Deux types de médias : Les données doivent être stockées sur au moins deux types
de médias différents pour réduire le risque de perte totale en cas de défaillance
d'un média. Cela peut inclure des sauvegardes sur disque dur, des sauvegardes sur
bande, des sauvegardes sur le cloud, etc.
3. Une copie hors site : Au moins une copie de sauvegarde doit être stockée hors
site, de préférence dans un emplacement distant et sécurisé. Cela garantit la
protection des données en cas de catastrophe majeure, telle qu'un incendie, un vol
ou une inondation, qui pourrait endommager les locaux de l'entreprise.

En suivant la pratique 3-2-1 et en mettant en œuvre un plan de sauvegarde complet, les


entreprises peuvent garantir la protection et la disponibilité de leurs données critiques,
même en cas d'incidents imprévus ou de sinistres majeurs

La relation entre RPO et le backup :


Le backup (sauvegarde) est un mécanisme utilisé pour protéger les données en créant des
copies de celles-ci sur un support de stockage sécurisé. Ces copies sont généralement
utilisées pour restaurer les données en cas de perte, de corruption ou de suppression
accidentelle. Les sauvegardes sont un outil essentiel pour atteindre le RPO défini, car
elles permettent de restaurer les données à partir de la dernière sauvegarde valide,
limitant ainsi la perte de données en cas d'incident.

Un SLA (Service Level Agreement),

Un SLA (Service Level Agreement), ou accord de niveau de service en français, est un


contrat formel entre un fournisseur de services et un client. Ce contrat établit les attentes
mutuelles en termes de qualité et de performance du service fourni. Voici une définition
détaillée des éléments clés d'un SLA :

1. Parties impliquées : Le SLA spécifie clairement les parties impliquées, à savoir


le fournisseur de services et le client. Il peut également inclure des tiers le cas
échéant.
2. Description du service : Le SLA doit définir de manière précise et exhaustive les
services fournis par le prestataire. Cela peut inclure la description des
fonctionnalités du service, les limites de ce qui est inclus ou non, ainsi que les
dépendances éventuelles.
3. Objectifs de niveau de service (SLA Objectives) : Ce sont les indicateurs de
performance clés convenus entre le fournisseur et le client. Ils peuvent inclure des
éléments tels que la disponibilité du service, le temps de réponse, le temps de
résolution des incidents, etc.
4. Métriques de performance : Les métriques associées à chaque objectif de niveau
de service sont spécifiées dans le SLA. Par exemple, pour la disponibilité du
service, la métrique pourrait être exprimée en pourcentage de temps de
fonctionnement par mois ou par année.
5. Responsabilités des parties : Le SLA définit clairement les responsabilités de
chaque partie en ce qui concerne la fourniture et la réception du service. Cela
inclut les actions à entreprendre en cas de non-respect des objectifs de niveau de
service.
6. Pénalités et réparations : Le SLA peut inclure des dispositions concernant les
pénalités financières ou d'autres réparations en cas de non-respect des objectifs de
niveau de service.
7. Période de validité : Le SLA précise la durée pendant laquelle il est en vigueur,
ainsi que les conditions de révision ou de renouvellement.
8. Procédure de révision : Le processus de révision et de modification du SLA est
également décrit, y compris la manière dont les changements sont communiqués et
approuvés par les deux parties.

Un Operational Level Agreement (OLA)


, ou accord de niveau opérationnel en français, est un type d'accord qui définit les
responsabilités et les attentes spécifiques entre différentes équipes ou départements au
sein d'une même organisation. Contrairement au SLA (Service Level Agreement) qui est
un accord entre un fournisseur de services et un client externe, l'OLA concerne les
relations entre les fournisseurs de services internes au sein de l'organisation. Voici les
éléments clés d'un OLA :

1. Parties impliquées : L'OLA spécifie les parties internes impliquées, telles que les
équipes, les départements ou les unités organisationnelles.
2. Description des services : Il décrit les services fournis par chaque équipe ou
département aux autres parties prenantes internes.
3. Objectifs de niveau opérationnel (OLA Objectives) : Ce sont les objectifs
spécifiques convenus entre les différentes équipes ou départements. Ces objectifs
peuvent inclure des délais de réponse, des temps de résolution, des normes de
qualité, etc.
4. Métriques de performance : Les métriques associées à chaque objectif de niveau
opérationnel sont spécifiées dans l'OLA. Elles permettent de mesurer et de suivre
la performance des équipes ou des départements.
5. Responsabilités des parties : L'OLA définit clairement les responsabilités de
chaque équipe ou département en ce qui concerne la fourniture et la réception des
services.
6. Interdépendances : Il identifie les dépendances et les interactions entre les
différents services internes et spécifie les processus de coordination nécessaires.
7. Période de validité : L'OLA précise la durée pendant laquelle il est en vigueur,
ainsi que les conditions de révision ou de renouvellement.
8. Procédure de révision : Le processus de révision et de modification de l'OLA est
également décrit, y compris la manière dont les changements sont communiqués et
approuvés par les parties concernées.

Le prix de SLA
Les entreprises offrant des services avec des SLA plus contraignants, impliquant des
RTO et RPO plus courts, peuvent facturer des tarifs plus élevés en raison de
l'infrastructure, des technologies et des ressources supplémentaires nécessaires pour
répondre à ces exigences

Le rôle de l'auditeur IT dans la mise en place


d'un plan de reprise d'activité (PRA) :
Le rôle de l'auditeur IT dans la mise en place d'un plan de reprise d'activité (PRA)
informatique est crucial pour assurer que le plan est adéquat, conforme aux normes et aux
meilleures pratiques, et qu'il répond aux besoins et aux objectifs de l'organisation. Voici
quelques-unes des responsabilités et des contributions que l'auditeur IT pourrait apporter
à ce processus :

1. Évaluation des risques : L'auditeur IT peut contribuer à l'identification et à


l'évaluation des risques informatiques et des menaces potentielles qui pourraient
affecter la continuité des activités de l'organisation. Cela inclut l'analyse des
vulnérabilités des systèmes, des processus et des infrastructures informatiques.
2. Conformité réglementaire : L'auditeur IT peut vérifier que le plan de reprise
d'activité est conforme aux réglementations et aux normes sectorielles applicables,
telles que la norme ISO 22301 pour la gestion de la continuité des activités.
3. Examen du plan de reprise d'activité : L'auditeur IT peut examiner le plan de
reprise d'activité existant ou proposé pour s'assurer qu'il couvre tous les aspects
critiques de la reprise après sinistre, y compris la sauvegarde des données, la
continuité des opérations, la restauration des systèmes, la communication en cas
d'urgence, etc.
4. Test et validation : L'auditeur IT peut participer à la planification et à l'exécution
des tests de reprise d'activité pour évaluer l'efficacité du plan, identifier les
lacunes et recommander des améliorations. Il peut également valider les résultats
des tests et fournir des recommandations pour renforcer le plan.
5. Formation et sensibilisation : L'auditeur IT peut contribuer à la sensibilisation et à
la formation du personnel sur les procédures de reprise d'activité, les rôles et
responsabilités en cas d'incident, et les meilleures pratiques pour assurer la
résilience des opérations informatiques.

Vous aimerez peut-être aussi