TD2 - Maintenance

A4.
8 - Maintenance 2023
TD2 - Maintenance
Exercice 1
Contexte
Une entreprise héberge un SaaS d’analyse de données pour professionnels. L’application est
répartie sur 3 serveurs grâce à un système de répartition de charge, type Kubernetes, pour
permettre d’assurer la disponibilité du service lorsque certains serveurs sont en maintenance (donc
indisponibles).
En plus des opérations de maintenance courantes du système, il arrive parfois que le service soit
indisponible pour des raisons non identifiées. Afin de comprendre un peu mieux le problème, un
administrateur système décide de mettre en place un outil de suivi des connexions sur les serveurs.
Après analyse, il semble que le nombre de connexions simultanées au SaaS suit une distribution
normale de moyenne 113 et d’écart-type 22. Or chaque serveur est capable de supporter environ 60
connexions simultanées en temps normal.
Ressources
Un fichier excel avec :
- Un historique des pannes sur les serveur
- Un plan de maintenance des serveurs et du service
Calculateur loi normale : https://www.codabrainy.com/loi-normale/
Construction des diagrammes de fiabilité

Système Arbre de défaillance Diagramme de fiabilité Disponibilité (A)
En série
FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

A4.8 - Maintenance 2023
En
parallèle
À
redondance
K/N
Travail à faire
1. Expliquer l’impact que peut avoir une mauvaise maintenance du service pour
l’entreprise qui héberge l’application.

Une mauvaise maintenance du service peut avoir plusieurs impacts négatifs sur l'entreprise qui
héberge l'application :
- Indisponibilité du service : Si les opérations de maintenance courantes ne sont pas

effectuées correctement, cela peut entraîner des périodes d'indisponibilité répétées. Cela signifie
que les utilisateurs ne pourront pas accéder à l'application et utiliser ses fonctionnalités, ce qui peut
entraîner une perte de confiance et de satisfaction des clients.
- Perte de revenus : Si le service est indisponible pendant une période prolongée, cela peut
entraîner une perte de revenus pour l'entreprise. Les clients qui ne peuvent pas accéder au service
peuvent se tourner vers des alternatives concurrentes, ce qui peut entraîner une perte de parts de
marché et une diminution des revenus.
- Impact sur la réputation : Une mauvaise maintenance du service peut nuire à la réputation
de l'entreprise. Les clients insatisfaits peuvent partager leurs expériences négatives sur les réseaux
sociaux, les forums ou d'autres plateformes en ligne, ce qui peut ternir la réputation de l'entreprise
et dissuader de nouveaux clients potentiels de faire appel à ses services.
- Perte de productivité : Si les utilisateurs professionnels ne peuvent pas accéder au SaaS
d'analyse de données, cela peut entraîner une perte de productivité pour leur entreprise. Les tâches
qui dépendent de l'application peuvent être retardées ou interrompues, ce qui peut avoir un impact
sur les délais et les performances globales de l'entreprise.
2. Quelles sont les causes possibles d’indisponibilité du service ? En particulier, en se

basant sur les nombres de connexions mesurés, quelles sont les probabilités que le service
soit indisponible quand 1 serveur sur 3 est disponible ? 2 serveurs sur 3 ? 3 sur 3 ?
- Surcharge des serveurs : Si le nombre de connexions simultanées dépasse la capacité

maximale des serveurs, cela peut entraîner une surcharge du système et rendre le service
indisponible.
- Problèmes logiciels (mise à jour logicielle) : Les bogues, les vulnérabilités de sécurité ou
les problèmes de compatibilité logicielle peuvent également causer des problèmes d'indisponibilité
du service.
- Problèmes matériels : Les pannes matérielles telles que les défaillances du disque dur, les

pannes de l'alimentation électrique ou les problèmes de connectivité réseau peuvent entraîner une
indisponibilité du service.
- Erreurs de configuration : Des erreurs de configuration au niveau des serveurs, du

système de répartition de charge ou des paramètres de l'application peuvent provoquer des
dysfonctionnements et rendre le service indisponible.
- DDos attack et Pertes de données
Probabilités pour 1 serveur sur 3 de disponible
D’après l’énoncé, on sait que le nombre de connexions simultanées au SaaS suit une distribution
normale de moyenne 113 et d’écart-type 22. Or chaque serveur est capable de supporter environ 60
connexions simultanées en temps normal. Donc pour 1 serveur disponible sur 3 on a X qui va de 0
à 60. Pour 2 serveurs disponibles X va de 0 à 120 et pour 3 X va de 0 à 180.
Probabilités pour 2 serveurs sur 3 de disponible

Probabilités pour 3 serveurs sur 3 de disponible
3. Construisez l’arbre de défaillances décrivant les causes d’indisponibilité du service.

Déduisez-en le diagramme de fiabilité du service et la disponibilité globale du service.
● Arbre de défaillances

● Diagramme de fiabilité

● La disponibilité globale du service
La disponibilité globale du service peut être calculée en utilisant le diagramme de fiabilité du
service. Étant donné que les trois serveurs sont en parallèle, nous pouvons utiliser la formule de
disponibilité en parallèle :
A = 1 - ((1 - A1) * (1 - A2) * (1 - A3))
où A1 est la disponibilité d’un serveur, A2 la disponibilité de deux serveurs et A3 la disponibilité de
trois serveurs. On a donc :
A = 1 - ((1 - 0,00799) * (1 - 0,6248) * (1 - 0,9988)) = 0,9995. Soit une disponibilité globale de
99,95%
4. Sur la base de l’historique des pannes, du plan de maintenance et des données énoncées,
déterminez le taux de disponibilité du service du point de vue client.
Pour déterminer le taux de disponibilité du service du point de vue client, nous devons prendre en
compte les temps d'immobilisation indiqués pour chaque défaillance et les comparer à la période
totale.
Période totale 30 jours
Temps d’immobilisation total due 1h + 1h30 + 2h + 30 min + 1h + 1h + 5h + 3h + 3h + 2h = 20h

à la panne
Temps d’immobilisation total due 2,14h

à la maintenance
Le taux de disponibilité du service (Période totale - Temps d'immobilisation total) / Période totale
(30 jours * 24 heures - 22,14 heures) / (30 jours * 24 heures) = 96,92%
Conclusion :
Ainsi, le taux de disponibilité du service du point de vue client est d'environ 96.92%. Cela signifie
que le service était disponible pour les clients environ 96.92% du temps sur la période donnée, en
tenant compte des pannes et du plan de maintenance.

5. Les taux de disponibilité correspondent-ils aux probabilités d’indisponibilité calculées à la
question 2. ? Sinon pourquoi ?
Non, les taux de disponibilité et les probabilités d'indisponibilité sont différents :
- on a une probabilité d’indisponibilité pour les 3 serveurs = 0,9988 et d’après notre calcul
précédent nous trouvons un taux de disponibilité de 96,92%
car les probabilités d'indisponibilité sont utilisées pour évaluer les risques et les performances
attendues dans des scénarios spécifiques, tels que le nombre de serveurs disponibles. Elles
permettent de comprendre les probabilités d'événements spécifiques, comme l'indisponibilité
lorsque 1 serveur sur 3 est disponible, 2 serveurs sur 3 sont disponibles
D'un autre côté, le taux de disponibilité est une mesure globale de la performance du service sur
une période donnée, tenant compte de tous les incidents d'indisponibilité et de disponibilité, y
compris ceux causés par des pannes imprévues et le plan de maintenance préventive.
Ainsi, bien que les probabilités d'indisponibilité et le taux de disponibilité soient liés à la
disponibilité du service, ils sont basés sur des approches et des objectifs différents, et donc ils ne
correspondent pas directement les uns aux autres.
6. Quelles mesures l’entreprise peut-elle prendre pour améliorer la maintenance du service ?

➔ Renforcer la capacité des serveurs : Si la surcharge des serveurs est une cause
fréquente d'indisponibilité, l'entreprise peut envisager d'augmenter la capacité de ses serveurs pour
mieux gérer le nombre de connexions simultanées.
➔ Optimiser les mises à jour : L'entreprise devrait effectuer des tests rigoureux avant de
déployer des mises à jour logicielles ou de sécurité pour éviter les problèmes et les indisponibilités
associées.
➔ Mettre en place des mesures de prévention des attaques DDoS : L'entreprise peut

mettre en place des solutions de protection contre les attaques DDoS pour minimiser l'impact de
ces attaques et maintenir la disponibilité du service.
➔ Améliorer la gestion des sauvegardes : La perte de données peut être évitée en mettant
en place des procédures de sauvegarde efficaces et en s'assurant de la disponibilité des
sauvegardes en cas de besoin.
➔ Effectuer une maintenance préventive régulière : Les opérations de maintenance

préventive sur le matériel, les mises à niveau du système d'exploitation et d'autres composants
doivent être effectuées régulièrement pour maintenir la fiabilité et la disponibilité du système.
➔ Mettre en place un suivi et une analyse des pannes : L'entreprise devrait mettre en place
un système de suivi et d'analyse des pannes pour identifier les problèmes récurrents, les tendances
et prendre des mesures correctives appropriées.
7. Le technicien chargé de la maintenance hardware s’étonne du fait que plus de la moitié

des disques durs tombent en panne plus vite que la durée moyenne entre chaque panne
(MTBF) indiquée par le constructeur. Expliquez pourquoi.
Ceci peut s'expliquer par plusieurs raisons :
➔ Conditions d'utilisation : Le MTBF indiqué par le constructeur est basé sur des conditions
d'utilisation optimales. Si les disques durs sont soumis à des conditions d'utilisation plus
intenses, telles que des températures élevées, des vibrations, une utilisation en continu ou
des charges de travail plus lourdes que prévu, cela peut réduire considérablement leur durée
de vie et entraîner des pannes plus fréquentes.
➔ Défaillance du matériel : Même si les disques durs sont conçus pour fonctionner pendant
une certaine durée avant de tomber en panne, il y a toujours une probabilité intrinsèque de
défaillance du matériel. Certains disques durs peuvent avoir des défauts de fabrication ou
des composants défectueux qui peuvent entraîner des pannes prématurées, même avant la
durée moyenne prévue.

➔ Erreurs de manipulation ou mauvaise utilisation : Les pannes de disques durs peuvent
également être causées par des erreurs humaines, telles que des manipulations incorrectes,
des chocs physiques, des erreurs lors de l'installation ou du remplacement des disques. Ces
facteurs peuvent accélérer l'usure et causer des défaillances prématurées.
➔ Facteurs environnementaux : Les facteurs environnementaux tels que les variations de

tension électrique, les surtensions, les pannes de courant, les problèmes d'alimentation
électrique ou les perturbations électromagnétiques peuvent également affecter la durée de
vie des disques durs et provoquer des pannes plus fréquentes.
➔ Vieillissement naturel : Même en respectant toutes les conditions idéales, les disques durs
ont une durée de vie limitée. Avec le temps, les composants internes des disques durs
peuvent s'user, ce qui augmente le risque de défaillance.
Il est donc important de prendre en compte ces facteurs lors de la maintenance du matériel. Il est
recommandé de mettre en place des bonnes pratiques de gestion de l'équipement, de surveiller les
conditions d'utilisation, de suivre les recommandations du fabricant, d'effectuer des tests réguliers et
d'assurer une alimentation électrique stable pour minimiser les risques de pannes prématurées des
disques durs.

TD2 - Maintenance

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

TD2 - Maintenance

Transféré par

Droits d'auteur :

Formats disponibles

A4.

Calculateur loi normale : https://www.codabrainy.com/loi-normale/

Construction des diagrammes de fiabilité

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

- Indisponibilité du service : Si les opérations de maintenance courantes ne sont pas

2. Quelles sont les causes possibles d’indisponibilité du service ? En particulier, en se

- Surcharge des serveurs : Si le nombre de connexions simultanées dépasse la capacité

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

- Erreurs de configuration : Des erreurs de configuration au niveau des serveurs, du

- DDos attack et Pertes de données

Probabilités pour 1 serveur sur 3 de disponible

Probabilités pour 2 serveurs sur 3 de disponible

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

3. Construisez l’arbre de défaillances décrivant les causes d’indisponibilité du service.

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

Période totale 30 jours

Temps d’immobilisation total due 1h + 1h30 + 2h + 30 min + 1h + 1h + 5h + 3h + 3h + 2h = 20h

Temps d’immobilisation total due 2,14h

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

Non, les taux de disponibilité et les probabilités d'indisponibilité sont différents :

6. Quelles mesures l’entreprise peut-elle prendre pour améliorer la maintenance du service ?

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

➔ Effectuer une maintenance préventive régulière : Les opérations de maintenance

7. Le technicien chargé de la maintenance hardware s’étonne du fait que plus de la moitié

Ceci peut s'expliquer par plusieurs raisons :

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

➔ Facteurs environnementaux : Les facteurs environnementaux tels que les variations de

FAIT PAR Junior MBADIEU WANTIE ET Laeticia Kevine LEUGOUE EMALEU

Vous aimerez peut-être aussi