Académique Documents
Professionnel Documents
Culture Documents
CLOUD COMPUTING
Attention !!! Ne vous laissez pas avoir par la taille du fournisseur Cloud. Dans la mesure du possible,
faites votre Due Diligence sans aucun préjugé. La taille d’une entreprise n’est pas un indicateur de sa
viabilité à long terme.
8
2.2 les composants Hadoop disponibles dans l’offre Cloud
Hadoop est un framework Java open source développé en 2006 par Doug Cutting et Michael J. Cafarella, et géré par Apache
Software Foundation sous licence Apache 2.0. Il s'agit d'un écosystème logiciel qui permet aux entreprises de traiter
d’énormes quantités de données en peu de temps. Ceci est accompli en facilitant l’utilisation du traitement informatique
parallèle sur une échelle massive.
Hadoop est très répandu parce qu'il est à la fois accessible et facile à maîtriser. Économique et pratique, il propose des
modules avec de nombreuses options. Il peut facilement évoluer et être déployé sur plusieurs machines pour s'adapter à
quasiment toutes les tailles d'ensembles de données. De plus, sa méthode de stockage et de traitement des données
présente une solution d'entreprise intéressante dans le cadre d'un stockage croissant.
Aujourd’hui, Hadoop a été mis en œuvre dans plusieurs secteurs pour répondre à leurs besoins spécifiques. Yahoo a été
parmi les premières entreprises à adopter Hadoop. Depuis, plusieurs grandes entreprises, y compris Facebook, Twitter et
Adobe, ont mis en œuvre cette architecture au profit de leur organisation.
HADOOP
9
Apache Hadoop is an open-source software framework that enables
distributed storage and processing of large amounts of data. It consists of
three main components: HDFS, MapReduce, and YARN.
HDFS (Hadoop Distributed File System) is a reliable storage layer that
divides files into blocks and stores them across a cluster of machines. It
achieves fault tolerance by replicating blocks.
MapReduce is a batch processing engine in Hadoop that divides a job into
independent tasks and runs them in parallel over the computer cluster. It
enables distributed processing of data.
YARN (Yet Another Resource Negotiator) is a resource management
layer in Hadoop that manages resources and schedules tasks across the
cluster. It ensures efficient utilization of resources.
Hadoop works by dividing data into blocks, storing them across a cluster, and
processing them in parallel using MapReduce. It provides fault tolerance,
scalability, and efficient resource management for big data processing.
10
Le responsable IT dans une entreprise afin de choisir un fournisseur cloud il doit évaluer la performance de l’offre du
fournisseur. En effet, rien n’est plus frustrant que de constater une fois l’abonnement souscrit que le service est plus lent
que ce qui avait été annoncé.
Vous devez vérifier que l’offre IaaS d’approvisionnement des machines virtuelles du fournisseur offre les caractéristiques
nécessaires pour le bon fonctionnement de vos composants Hadoop. Il s’agit entre autre du redimensionnement
automatique du cluster en ressources, nécessaires pour gérer les augmentations ou les baisses de charge de calcul, la
relance automatique des jobs en cas d’arrêts imprévus, la latence dans les calculs. En tout cas, l’idée est de vérifier toutes
les options de performance offertes par le fournisseur Cloud.
Attention !!! Ne perdez pas de vue que la performance que vous obtenez en Cloud est fonction des caractéristiques des
instances que vous incluez dans votre abonnement comme nous l’avons vu avec Amazon EMR et Azure HDInsight.
Evitez d’avoir des attentes de performance irréalistes par rapport au prix que vous payez et souscrivez à des instances de
tailles supérieures en cas d’augmentation de charge de calcul
12
2.4. la responsabilité juridique des données
Vous devez régler la question de la responsabilité juridique du fournisseur Cloud vis-à-vis de vos données.
Pendant longtemps, la question de propriété ne se posait pas puisque les données étaient stockées dans l’entreprise.
Aujourd’hui, avec le déplacement des données et leur hébergement dans le Cloud, la notion de propriété de données doit
être revue. Est-ce le fournisseur qui est propriétaire des données en vertu du fait qu’il héberge les données ? Ou bien est
ce l’entreprise parce que les données restent les siennes ? Toujours est-il qu’il est crucial qu’avec le fournisseur, vous
définissez clairement le propriétaire des données.
Etre propriétaire de données signifie en être pénalement responsable, par exemple en cas de fuite ou de
piratage, c’est le propriétaire qui répond de l’acte en justice. Or, la responsabilité pénale emmène la notion de
juridiction sur la scène. Etre responsable pénalement aux états unis par exemple, n’est pas identique qu’être responsable
pénalement en France.
13
2.4. la responsabilité juridique des données
La juridiction varie en fonction des pays. Pour définir le propriétaire des données vous devez prendre en compte 2 facteurs :
– La localisation géographique du fournisseur : la juridiction de l’Etat dans lequel le fournisseur Cloud a sa raison sociale peut
avoir un impact sur le niveau de contrôle que celui exerce sur les données. Vous devez donc connaître la juridiction à laquelle le
fournisseur est soumis dans son pays d’origine et voir les mécanismes juridiques mis en place par votre pays en cas de litige .
– La localisation géographique des données de l’entreprise : dans le Cloud, généralement vous n’avez pas connaissance de la
localisation des données. Même si aujourd’hui, les fournisseurs vous donnent la possibilité de choisir la zone géographique dans
laquelle vos données seront hébergées, les opérations de géo-réplication de données d’une zone géographique à une autre sont
souvent nécessaires pour effectuer des restaurations en cas de problème (tremblement de terre, séisme, etc.). La juridiction de la
zone géographique dans laquelle les données sont répliquées peut affecter la propriété et la responsabilité pénale. Vous pouvez
demander au fournisseur de certifier que les données sont uniquement sous la juridiction de la zone géographique où vous
choisissez de les héberger. Par exemple, si vous vous abonnez à un service en Irlande, alors le fournisseur doit garantir que seule la
juridiction de l’Irlande s’applique à vos données . De plus, le fournisseur doit garantir qu’il n’utilisera pas vos données à votre insu, ni
qu’il ne les diffusera sous aucun prétexte (en dehors d’un recours légal éventuel ou d’un mandat émanant directement de l’Etat de sa
résidence fiscale).
14
2.5. le niveau de sécurité des données
La sécurité est le second facteur critique du cloud après la souveraineté.
Il doit évaluer les stratégies mises en place par le fournisseur pour minimiser les risques de piratage des données hébergées.
En général, les mesures et systèmes de sécurité des entreprises sont moins solides et moins élaborées que celles offertes par les
fournisseurs Cloud, car là où la sécurité est un processus support pour une entreprise classique, elle est un processus métier clé
chez les fournisseurs Cloud.
Ceux-ci sont donc conscients des enjeux de sécurité, savent que leur réputation de fournisseur Cloud dépend de leur capacité à
garantir la protection des données de leurs clients et par conséquent investissent massivement dans le développement des systèmes
hautement sécurisés.
Évaluez les mesures de sécurité mises en place par le fournisseur Cloud (par exemple par la certification des revus de ses
processus de sécurité, la certification de ses processus d’identification des cartes de paiement, la certification de ses
processus métiers au standards ISO, PCI, SAS 70, etc.) et les techniques de protection de données qu’il a développés pour
garantir la sécurité de vos données (techniques de cryptage de données utilisées).
2.6. les SLA du fournisseur Cloud
15
En gros, les SLA représentent les garanties de performance que le fournisseur Cloud offre vis-à-vis de sa solution. Ces garanties
peuvent porter sur la restauration des données, la protection des données, la couverture juridique des données, la localisation
géographique des données, etc. L’ensemble de ces garanties sont mentionnées dans un document légal appelé le SLA (Service
Level Agreement), ou Accord de Niveau de Service. Le SLA spécifie l’ensemble des fonctionnalités attendues du service Cloud auss
bien de la part du client que du fournisseur. Comme tout document légal, le but est de protéger les deux parties en cas de conflits sur
la gestion des niveaux de services. Le SLA doit être revu par l’avocat des deux parties dans la mesure du possible. Les fournisseurs
Cloud ne garantissent pas les mêmes niveaux de service. Vous devez donc évaluer très attentivement leurs garanties et les
sélectionner sur cette base.
Un fournisseur qui annonce des fonctionnalités mais n’est pas prêt à s’engager juridiquement pour garantir la fourniture de
ces fonctionnalités est suspect .
2.7. La tarification 16
L’un des avantages les plus significatifs du Cloud réside bien sur les coûts. Nous l’avons déjà vu, le Cloud évite l’acquisition et la
maintenance d’infrastructures informatiques coûteuses.
Vous devez donc vous poser la question de savoir combien vous coûtera par période de consommation la solution du fournisseur.
nous avons vu les facteurs qui entrent dans la tarification des solutions Cloud et nous avons vu que l’un des plus importants d’entre
eux c’est la taille des instances du cluster. Ainsi, avant d’évaluer les fournisseurs sur ce critère, assurez-vous d’être clair sur vos
besoins, spécialement ceux concernant les ressources dont vous aurez besoin.
2.8. les conditions de sortie du Cloud
Vous pouvez être coincés « légalement » dans le Cloud d’un fournisseur. Certains fournisseurs rendent leur contrat tellement
complexe et les mécanismes de résiliation tellement difficiles qu’il peut être très difficile de sortir de l’offre Cloud. Encore une fois,
c’est comme dans toute chose, « clarity is power » . Demandez au fournisseur d’énoncer clairement les conditions de sortie de son
Cloud.
L’utilisation de cette grille de 8 critères vous aidera à évaluer le choix d’un fournisseur Cloud fiable pour vous (si vous êtes
responsable d’une entreprise) ou pour votre client (si vous êtes consultant). Bien-sûr, vous pouvez vous-même par une
séance de brainstorming, déterminer d’autres critères supplémentaires pertinents et adaptés à votre cas d’usage.
17
Les coûts ainsi que les économies que peut générer le Cloud
2.Instances réservées : Les fournisseurs de services Cloud proposent des instances réservées qui permettent aux
entreprises de réserver de la capacité informatique pour une période déterminée. En s'engageant sur une durée définie, les
entreprises peuvent réaliser des économies substantielles par rapport au modèle de tarification à la demande. Les instances
réservées conviennent particulièrement aux charges de travail prévisibles nécessitant une capacité informatique constante.
3.Instances SPOT : Les instances SPOT sont une autre option proposée par les fournisseurs de services Cloud. Elles
permettent aux entreprises de soumissionner sur la capacité informatique non utilisée, offrant ainsi des coûts bien plus bas
que les instances à la demande ou réservées. Cependant, la disponibilité n'est pas garantie, ce qui en fait une option
adaptée aux charges de travail flexibles.
4.Mise à l'échelle automatique : Les fournisseurs de services Cloud offrent la fonctionnalité de mise à l'échelle
automatique, qui ajuste automatiquement les ressources en fonction de la charge de travail. Cela garantit une infrastructure
toujours optimisée, ce qui peut générer des économies significatives. Par exemple, pendant les périodes de faible demande,
le nombre d'instances peut être réduit, tandis que pendant les pics de demande, il peut être augmenté.
5.Stockage Cloud : Le stockage Cloud représente un élément crucial, mais ses coûts peuvent s'accumuler rapidement. Les
entreprises doivent évaluer leurs besoins en stockage et envisager des options moins coûteuses, telles que le stockage à
accès peu fréquent ou le stockage Glacier pour les données moins sollicitées. La compression des données et la
déduplication peuvent également réduire les exigences de stockage.
Principaux avantages opérationnels et humains du Cloud. 19
L'évolutivité représente l'un des principaux atouts du cloud computing. Il permet aux entreprises
d'ajuster rapidement et facilement leurs ressources informatiques en fonction de leurs besoins, ne
payant ainsi que ce qu'elles consomment. Néanmoins, ce modèle de tarification basé sur
l'utilisation peut entraîner des coûts imprévus si les entreprises ne gèrent pas efficacement leurs
ressources. C'est là que les frais d'utilisation entrent en jeu. En facturant aux clients les
ressources qu'ils utilisent, les fournisseurs de cloud les encouragent à optimiser leur utilisation,
ce qui peut conduire à des économies et à une meilleure évolutivité.
20
L'optimisation des coûts représente un élément essentiel du cloud computing, avec un impact significatif sur les résultats des
entreprises. Alors que de plus en plus d'entreprises transfèrent leurs opérations vers le cloud, il devient impératif d'optimiser les
coûts pour assurer une efficacité maximale et un retour sur investissement optimal. En gérant efficacement les ressources
cloud, les entreprises peuvent réduire les dépenses superflues, améliorer la prévisibilité des coûts et allouer leurs budgets de
manière plus stratégique.
L'évolutivité constitue l'un des principaux avantages du cloud computing, permettant aux organisations d'ajuster leurs
ressources en fonction de leurs besoins. Toutefois, cette flexibilité peut engendrer des dépenses excessives si elle n'est pas
gérée avec soin. Par exemple, une entreprise qui ne surveille pas attentivement son utilisation du cloud risque de payer pour
des ressources inutilisées ou sous-utilisées, entraînant ainsi des coûts inutiles.
Pour illustrer l'importance de l'optimisation des coûts dans le cloud computing, prenons un exemple concret. Imaginons une
start-up ayant récemment migré son infrastructure vers le cloud. Au début, l'entreprise allouait ses ressources en fonction de
ses prévisions d'utilisation, mais avec l'expansion de ses activités, elle s'est retrouvée à payer pour plus de ressources que
nécessaire. En mettant en place des stratégies d'optimisation des coûts telles que le redimensionnement des instances et
l'utilisation de la mise à l'échelle automatique, l'entreprise a réussi à réduire ses coûts cloud de 30 %, lui permettant ainsi de
réaffecter ces économies à d'autres priorités commerciales.
Pour aider les organisations à naviguer dans les complexités de l'optimisation des coûts dans le cloud computing, voici
quelques conseils pratiques :
22
Surveillez et analysez attentivement l'utilisation du cloud : Utilisez des outils de gestion cloud pour surveiller régulièrement
l'utilisation des ressources et identifier les domaines où des économies peuvent être réalisées.
Redimensionnez les instances : Adaptez vos instances cloud aux besoins réels de votre charge de travail afin d'éviter le
gaspillage de ressources.
Utilisez des options de stockage rentables : Optez pour des solutions de stockage telles que Amazon S3 Glacier pour les
données moins fréquemment consultées, ce qui vous permet de réduire les coûts sans compromettre l'accessibilité.
Profitez des instances ponctuelles : Utilisez ces instances pour les charges de travail moins critiques, mais soyez conscient
du risque potentiel d'interruptions si le prix du marché dépasse votre offre.
Les études de cas, comme celle de Netflix qui a optimisé ses coûts cloud grâce à un système de surveillance et
d'automatisation, offrent également des perspectives précieuses sur les stratégies efficaces d’optimisation des coûts.
En conclusion, l'optimisation des coûts dans le cloud computing est cruciale pour maximiser le retour sur investissement et
allouer les ressources de manière stratégique. En comprenant l'importance de cette optimisation et en mettant en œuvre des
stratégies efficaces, les entreprises peuvent exploiter au mieux leurs investissements dans le cloud.