Académique Documents
Professionnel Documents
Culture Documents
8 - Maintenance 2023
TD2 - Maintenance
Exercice 1
Contexte
Une entreprise héberge un SaaS d’analyse de données pour professionnels. L’application est
répartie sur 3 serveurs grâce à un système de répartition de charge, type Kubernetes, pour
permettre d’assurer la disponibilité du service lorsque certains serveurs sont en maintenance (donc
indisponibles).
En plus des opérations de maintenance courantes du système, il arrive parfois que le service soit
indisponible pour des raisons non identifiées. Afin de comprendre un peu mieux le problème, un
administrateur système décide de mettre en place un outil de suivi des connexions sur les serveurs.
Après analyse, il semble que le nombre de connexions simultanées au SaaS suit une distribution
normale de moyenne 113 et d’écart-type 22. Or chaque serveur est capable de supporter environ 60
connexions simultanées en temps normal.
Ressources
Un fichier excel avec :
- Un historique des pannes sur les serveur
- Un plan de maintenance des serveurs et du service
En série
À
redondance
K/N
Travail à faire
1. Expliquer l’impact que peut avoir une mauvaise maintenance du service pour
l’entreprise qui héberge l’application.
- Problèmes logiciels (mise à jour logicielle) : Les bogues, les vulnérabilités de sécurité ou
les problèmes de compatibilité logicielle peuvent également causer des problèmes d'indisponibilité
du service.
- Problèmes matériels : Les pannes matérielles telles que les défaillances du disque dur, les
D’après l’énoncé, on sait que le nombre de connexions simultanées au SaaS suit une distribution
normale de moyenne 113 et d’écart-type 22. Or chaque serveur est capable de supporter environ 60
connexions simultanées en temps normal. Donc pour 1 serveur disponible sur 3 on a X qui va de 0
à 60. Pour 2 serveurs disponibles X va de 0 à 120 et pour 3 X va de 0 à 180.
● Arbre de défaillances
4. Sur la base de l’historique des pannes, du plan de maintenance et des données énoncées,
déterminez le taux de disponibilité du service du point de vue client.
Pour déterminer le taux de disponibilité du service du point de vue client, nous devons prendre en
compte les temps d'immobilisation indiqués pour chaque défaillance et les comparer à la période
totale.
Le taux de disponibilité du service (Période totale - Temps d'immobilisation total) / Période totale
(30 jours * 24 heures - 22,14 heures) / (30 jours * 24 heures) = 96,92%
Conclusion :
Ainsi, le taux de disponibilité du service du point de vue client est d'environ 96.92%. Cela signifie
que le service était disponible pour les clients environ 96.92% du temps sur la période donnée, en
tenant compte des pannes et du plan de maintenance.
- on a une probabilité d’indisponibilité pour les 3 serveurs = 0,9988 et d’après notre calcul
précédent nous trouvons un taux de disponibilité de 96,92%
car les probabilités d'indisponibilité sont utilisées pour évaluer les risques et les performances
attendues dans des scénarios spécifiques, tels que le nombre de serveurs disponibles. Elles
permettent de comprendre les probabilités d'événements spécifiques, comme l'indisponibilité
lorsque 1 serveur sur 3 est disponible, 2 serveurs sur 3 sont disponibles
D'un autre côté, le taux de disponibilité est une mesure globale de la performance du service sur
une période donnée, tenant compte de tous les incidents d'indisponibilité et de disponibilité, y
compris ceux causés par des pannes imprévues et le plan de maintenance préventive.
Ainsi, bien que les probabilités d'indisponibilité et le taux de disponibilité soient liés à la
disponibilité du service, ils sont basés sur des approches et des objectifs différents, et donc ils ne
correspondent pas directement les uns aux autres.
➔ Optimiser les mises à jour : L'entreprise devrait effectuer des tests rigoureux avant de
déployer des mises à jour logicielles ou de sécurité pour éviter les problèmes et les indisponibilités
associées.
➔ Mettre en place des mesures de prévention des attaques DDoS : L'entreprise peut
➔ Améliorer la gestion des sauvegardes : La perte de données peut être évitée en mettant
en place des procédures de sauvegarde efficaces et en s'assurant de la disponibilité des
sauvegardes en cas de besoin.
➔ Mettre en place un suivi et une analyse des pannes : L'entreprise devrait mettre en place
un système de suivi et d'analyse des pannes pour identifier les problèmes récurrents, les tendances
et prendre des mesures correctives appropriées.
➔ Conditions d'utilisation : Le MTBF indiqué par le constructeur est basé sur des conditions
d'utilisation optimales. Si les disques durs sont soumis à des conditions d'utilisation plus
intenses, telles que des températures élevées, des vibrations, une utilisation en continu ou
des charges de travail plus lourdes que prévu, cela peut réduire considérablement leur durée
de vie et entraîner des pannes plus fréquentes.
➔ Défaillance du matériel : Même si les disques durs sont conçus pour fonctionner pendant
une certaine durée avant de tomber en panne, il y a toujours une probabilité intrinsèque de
défaillance du matériel. Certains disques durs peuvent avoir des défauts de fabrication ou
des composants défectueux qui peuvent entraîner des pannes prématurées, même avant la
durée moyenne prévue.
➔ Vieillissement naturel : Même en respectant toutes les conditions idéales, les disques durs
ont une durée de vie limitée. Avec le temps, les composants internes des disques durs
peuvent s'user, ce qui augmente le risque de défaillance.
Il est donc important de prendre en compte ces facteurs lors de la maintenance du matériel. Il est
recommandé de mettre en place des bonnes pratiques de gestion de l'équipement, de surveiller les
conditions d'utilisation, de suivre les recommandations du fabricant, d'effectuer des tests réguliers et
d'assurer une alimentation électrique stable pour minimiser les risques de pannes prématurées des
disques durs.