Vous êtes sur la page 1sur 21

Université de Jendouba

Faculté des sciences Juridiques Economiques et de Gestion de Jendouba


Module: Big data et Cloud Département: Informatique

Chargée de cours: Dr. Mouna Jouini Classes:3 LFBI/ EB


A.U: 2022-2023

Travaux Dirigés N°1

Exercice 1

Cochez la ou les bonnes réponses

1) Qu’est ce que le Cloud Computing ?

Un progiciel
Un tableur
Un moyen de stocker des données à distance
Une technique de gestion d’applications informatiques en entreprise

2) Lesquelles de ces traductions françaises désignent le Cloud Computing ?

Informatique dans le nuage


Informatique dématérialisée
Technologie de vitalisation

3) Lorsque l’on parle de Cloud Computing, les ressources se situent en principe:

sur le poste de l'utilisateur


sur des serveurs distants
sur un serveur dédié

4) Le Cloud Computing est plutôt adapté aux ?

Grandes entreprises
PME
TPE

5) Lequel des énoncés suivants est vrai pour le cloud computing

Il va toujours être moins cher et plus sûr que l'informatique locale


L'accès à vos données est possible depuis n’importe quel ordinateur dans le monde, aussi
longtemps que vous avez une connexion Internet
Seules quelques entreprises courageuses investissent dans le cloud, les autres hésitent à cause du
risque de fuite de données
6) Grâce au Cloud Computing les entreprises utilisent de plus en plus leurs serveurs

VRAI
FAUX

7) La zone géographique des infrastructures et supports de stockage utilisés par le cloud est
spécifiée dans le contrat de vente

VRAI
FAUX

8) Le cloud n’a pas besoin de réseaux très hauts débit pour fonctionner

VRAI
FAUX

9) Les infrastructures et applications utilisées pour le stockage des données sont :

communes à tous les utilisateurs


réservée à un client particulier
une architecture multi-tenant

Exercice 2

1. Qu’est ce qu’un cloud computing ?


2. Déduire alors l’utilité des systèmes Cloud ?
3. Définir la virtualisation ?
4. Citer les modèles de développement des systèmes Cloud ?
5. Expliquer le critère de la mutualisation des ressources pour les systèmes Cloud ?
6. Quels types d’entreprises sont les nouvelles cibles des géants du Cloud ?
7. Quel sont les majeurs problèmes d’un Datacenter ?

Exercice 3

1. Quel est l’apport de la virtualisation dans une entreprise ?


2. Quelle technologie a permis l’émergence du Cloud Computing ?
3. Comment une organisation peut utiliser un modèle hybride combinant les 3 modèles de
déploiement (public, privé, communautaire) ?
4. Comment les lois de pays différents peuvent-elles affecter le Cloud public ?
5. Pourquoi le respect des SLAs est-il important pour les fournisseurs de services ?
6. Citez un cas d’usage ou la virtualisation est plus recommandée que la conteneurisation.
Correction du TD 1

Correction de l’Exercice 1

1) Qu’est ce que le Cloud Computing ?

Un progiciel
Un tableur
Un moyen de stocker des données à distance
Une technique de gestion d’applications informatiques en entreprise

2) Lesquelles de ces traductions françaises désignent le Cloud Computing ?

Informatique dans le nuage


Informatique dématérialisée
Technologie de vitalisation

3) Lorsque l’on parle de Cloud Computing, les ressources se situent en principe:

sur le poste de l'utilisateur


sur des serveurs distants
sur un serveur dédié

4) Le Cloud Computing est plutôt adapté aux ?

Grandes entreprises
PME
TPE

5) Lequel des énoncés suivants est vrai pour le cloud computing

Il va toujours être moins cher et plus sûr que l'informatique locale


L'accès à vos données est possible depuis n’importe quel ordinateur dans le monde, aussi
longtemps que vous avez une connexion Internet
Seules quelques entreprises courageuses investissent dans le cloud, les autres hésitent à cause du
risque de fuite de données
6) Grâce au Cloud Computing les entreprises utilisent de plus en plus leurs serveurs

VRAI
FAUX

7) La zone géographique des infrastructures et supports de stockage utilisés par le cloud est
spécifiée dans le contrat de vente
VRAI
FAUX

8) Le cloud n’a pas besoin de réseaux très hauts débit pour fonctionner

VRAI
FAUX

9) Les infrastructures et applications utilisées pour le stockage des données sont :

communes à tous les utilisateurs


réservée à un client particulier
une architecture multi-tenant

Correction de l’Exercice 2
1. Qu’est ce qu’un cloud computing ?

Selon la définition du National Institute of Standards and Technology (NIST), le Cloud


computing est l'accès via un réseau de télécommunications, à la demande et en libre-service, à
des ressources informatiques partagées configurables. Il s'agit donc d'une délocalisation de
l'infrastructure informatique.

2. Déduire alors l’utilité des systèmes Cloud ?

Partage
Sauvegarde
Accessibilité
Mobilité
Pas d’installation

3. Définir la virtualisation ?

Ensemble de techniques permettant de faire tourner plusieurs systèmes d’exploitation sur une
même machine physique.

4. Citer les modèles de développement des systèmes Cloud ?

Les 4 typologies de développement :


 Privé
 Public
 Hybride
 Communautaire

5. Expliquer le critère de la mutualisation des ressources pour les systèmes Cloud ?


Les ressources Cloud sont mises en commun et mutualisées pour tous les utilisateurs afin de
servir de multiples utilisateurs. Grace à cette mise en commun des ressources, ces dernières
sont réallouées de façon dynamique en fonction de la demande.

Elle permet de combiner des ressources hétérogènes (matériel, logiciel, trafic réseau) pour
servir plusieurs consommateurs à qui les ressources sont automatiquement attribuées. La
mutualisation améliore l'évolutivité et l'élasticité ; elle facilite l'adaptation automatique des
ressources aux variations de la demande.

6. Quels types d’entreprises sont les nouvelles cibles des géants du Cloud ?

Les nouvelles cibles sont : les PME (Petites et moyennes entreprises)

7. Quel sont les problèmes d’un Datacenter ?

Les problèmes majeurs sont le cout d’achat puisque ce cout est très élevé

Et la sécurité surtout le risque lié à la perte de données puisque les données sont situées dans
des bases externes,. Aussi le risque liée à une intrusion physique qui est représenté par vol de
matériel contenant des données, incendies criminels, ou encore casse des serveurs.

Correction de l’exercice 3
1. Quel est l’apport de la virtualisation dans une entreprise ?

La virtualisation est une solution technologique qui peut permettre à aux


entreprisew d'améliorer ses ratios notamment qualité / performance / investissement, mais
aussi de simplifier et sécuriser son mode de fonctionnement.

2. La technologie qui a permis l’émergence du Cloud est la virtualisation

3. Un cas d’usage peut être un hôpital qui utilise un Cloud privé pour ses données
internes, un Cloud communautaire avec d’autres hôpitaux pour s’échanger des
informations sur leurs patients respectifs, et un Cloud public dans le cas où les
ressources du Cloud privé et communautaire sont épuisées et que les informations à
stocker ne sont pas confidentielles.

4. Ceci peut générer des problèmes si le client et le fournisseur sont dans des pays
différents.

Des opérations peuvent être tolérées dans un pays et interdites dans un autre. Ou la loi d’un
pays peut empêcher une entreprise de stocker ses données dans un pays étranger.
5. Le respect du SLA est important pour le fournisseur de service puisque son non-
respect engendre des pénalités au fournisseur. De plus, ceci peut également ternir
l’image du fournisseur.
6. La virtualisation est plus recommandée lorsqu’on veut déployer des applications qui
tournent dans des noyaux différents (Windows, Linux) puisque cela n’est pas possible
avec la conte-neurisation. Cette dernière ne peut faire fonctionner que des systèmes
d’exploitation qui ont un même noyau.
Université de Jendouba
Faculté des sciences Juridiques Economiques et de Gestion de Jendouba
Module: Big data et Cloud Département: Informatique

Chargée de cours: Dr. Mouna Jouini Classes:3 LFBI/ EB


A.U: 2022-2023

Travaux Dirigés N°2

Exercice 1 : Étude de cas : l’entreprise VSCO

Expliquer le raison principal pour lequel l’entreprise SVCO migre vers un système
Cloud ?

Secteur :Technologie
Site : Oakland, Californie
Taille de l'entreprise Moins de 500 employés
Produits : Jira Software Cloud, Confluence Cloud, Jira Service Desk Cloud Trello

L'évolutivité rapide et économique du cloud fait-elle réellement la différence ? Posez la


question à la communauté dédiée à la photographie de VSCO et vous obtiendrez un oui
catégorique.

L'entreprise est passée d'une application de photographie à une activité florissante basée sur
un modèle d'abonnement comptant plus de deux millions d'utilisateurs, apparemment du jour
au lendemain. Étant donné qu'elle envisageait une évolution rapide et sans interruption de
service, elle a opté pour Atlassian Cloud pour faire son grand saut en avant.
La facilité de maintenance est la principale raison pour laquelle nous avons migré. Notre
organisation étant Lean, nous voulons continuer à nous concentrer sur la valeur ajoutée que
nous procurons à nos deux millions de membres. Il est difficile de justifier le temps consacré
aux mises à niveau internes d'outils lorsque ceux-ci ne contribuent pas directement à notre
mission, à savoir aider les gens à tomber amoureux de leur créativité.
Comme l'explique Sky Frostenson, Director of Technical Product Management, l'utilisateur
intensif qui a appuyé l'adoption du cloud : En d'autres termes, pourquoi gaspiller le temps
précieux de votre équipe informatique pour la mise à niveau des serveurs, l'achat
d'équilibreurs de charge et les longs processus d'approbation qui pourraient être gérés (et
améliorés) sans l'intervention de l'équipe informatique ?
Selon Sky Frostenson, Atlassian Cloud optimise les performances et la disponibilité. Les
mises à niveau de service et les temps d'arrêt planifiés ont pratiquement disparu. Le service
informatique peut concentrer son énergie sur des tâches stratégiques, plutôt que sur la mise à
niveau des serveurs. L'équipe de Sky Frostenson affirme que l'IU Cloud est plus propre et plus
flexible.
Exercice 2 : Étude de cas : l’entreprise DOMINO’S
Expliquer le principal raison pour lequel l’entreprise SVCO migre vers un système
Cloud ?

Secteur : Services
Site: Ann Arbor, Michigan
Produits : Jira Software, Jira Service Desk, Confluence

S'il y a deux choses dans ce monde qui doivent être rapides, c'est la livraison de vos services
(comme : les repas) et votre processus DevOps. Domino's est en train de gagner sur ces deux
tableaux.

Avant d'adopter Atlassian Cloud Premium, cependant, cette société avait un problème : le
processus ralentissait considérablement ses workflows DevOps. En effet, ce processus
nécessitait auparavant plus de 20 heures de réunions et d'analyses mais il demande aujourd'hui
quelques minutes. Cette app résout un énorme problème de sécurité qui est très répandu dans
le développement.

Le responsable de ces ralentissements ? La sécurité. L'approbation des changements


technologiques nécessitait plus de 20 heures de réunions et de révisions, et Domino's savait
qu'elle devait réduire sensiblement ce chiffre si elle voulait rester compétitive.

Atlassian Cloud Premium est alors entré en jeu. Non seulement Domino's bénéficie désormais
de mises à niveau automatiques des performances et d'une disponibilité garantie, mais elle
dispose aussi des outils nécessaires pour synchroniser la sécurité avec DevOps et éliminer son
long processus de sécurité.

Comme l'explique Michael Sheppard, Senior Application Security Engineer chez Domino's :

Nous savions que nos développeurs aimaient utiliser Confluence pour collaborer et
documenter les exigences. La sécurité vient de rejoindre un workflow qui fonctionnait déjà
bien. Il faut désormais à peine quelques minutes pour remplir le formulaire, et environ quatre
minutes pour récupérer les tickets d'exigences de sécurité Jira correspondants. Ce qui
nécessitait auparavant plus de 20 heures de réunions et d'analyses demande aujourd'hui
quelques minutes. Cette app résout un énorme problème de sécurité qui est très répandu dans
le développement.
Correction du TD N°2

CORRECTION DE L’Exercice 1
Le principal raison pour lequel l’entreprise VSCO adopte un système Cloud
computing :

L’évolution (de façon plus rapide et économique) dans le cloud : en effet :

 Le cloud est plus adapté à l'évolutivité, car les installations sur site incluent peu de
ressources pour évoluer. Si vous devez assurer le bon fonctionnement des systèmes au
fur et à mesure que votre base d'utilisateurs augmente, vos équipes doivent soit ajouter
de la puissance de calcul (UC, RAM) à vos machines existantes, soit ajouter des
serveurs/machines supplémentaires (évolution horizontale)….

 L'évolutivité désigne la disponibilité de la puissance de calcul, de l'espace serveur et
des ressources pour croître (ou ralentir) en fonction des besoins de cette entreprise. Si
leur puissance de calcul doit augmenter, par exemple, on souhaite que la capacité de
leur serveur s'adapte à ces besoins. Si leur puissance de calcul doit baisser de 2 à 4
heures du matin, heure locale, on souhaite alors que vos serveurs soient moins
gourmands en ressources (et moins coûteux) pendant ces heures creuses.

 L’application de l’entreprise connaît une augmentation du trafic (de vos serveurs) et il
devient alors, difficile d’adapter les ressources à la volée pour répondre à la demande
croissante, de configurer des équilibreurs de charge, conçus pour équilibrer le trafic
sur vos serveurs afin d'éviter les surcharges, de repondre aux pannes des serveurs….

Par conséquent il est nécessaire d’adopter une solution évolutive comme la solution
Cloud.

 Garantir la sécurité dans le cloud : la solution cloud (dans ce cas Atlassian Cloud)
optimise les performances et la disponibilité et par la suite faire disparaite les mises à
niveau de service et les temps d'arrêt de service.

En plus, le Cloud assure aujourdhui la securité aux entreprises en offrant, par exemple,
des tests de sécurité rigoureux, des plans de reprise d'activité et des techniques de
chiffrement…
CORRECTION de l’Exercice 2

Le principal raison pour lequel l’entreprise Domino's adopte un système Cloud computing est :

Booster la vitesse et les performances dans le cloud. En effet :

Le problème majeur Domino's est le ralentissement de processus des workflows donc il fallait
accélérer ces processus au sein de cet entreprise. En adoptant la solution Cloud Atlassian
Cloud Premium, on accelere les processus au sein de Domino’s par :

 Meilleures performances réseau : Amélioration des performances reseaux et par la


suite le processus devient très rapide. En effet, les performances n'ont pas seulement
un impact sur les équipes informatiques qui travaille dans cette entreprise. Si les
systèmes des entreprises ne sont pas performants, on risque également de perdre des
clients (on parle de la fidélisation des clients). Et par la suite les performances réseau
influent directement sur les résultats de l'entreprise.

 Garanties de disponibilité de systèmes 24 h/24, 7 j/7

 Mise à niveau automatique des performances : Les mises à niveau automatiques


améliorent les performances, tout en garantissant l'absence de latence (puisqu'aucun
processus de mise à niveau manuel n'est impliqué). Ainsi, les responsables de des
entreprises ont toujours accès aux outils les plus performants et ne prennent jamais de
retard sur leurs concurrents.

 Développement et déploiement plus rapides de produits : L'intégration continue


(pratique consistant à synchroniser le travail des développeurs tout au long de la
journée) et la livraison continue (déploiement rapide et régulier de petits changements
logiciels) sont d'autres avantages du cloud par rapport aux systèmes classiques. En
effet, l’integration continue au sein de Domino's augmente la vitesse (et la cohérence)
lorsque l’équipe de travail se prépare au déploiement.
Université de Jendouba
Faculté des Sciences Juridiques Economiques et de Gestion de Jendouba
Module: Introduction au Big data et Cloud Département: Informatique

Chargée de cours: Dr. Mouna Jouini Classes:3 LFBI/ 3LFEB


A.U: 2022-2023

Travaux Dirigés N°3

Exercice 1

Choisir la bonne réponse

1- Combien il y a-t-il de modèle(s) de service Cloud ?


a) 1
b) 3
c) 4

2- Combien il y a-t-il de modèle(s) de déplacement (ou déploiement) Cloud?


a) 2
b) 3
c) 4

3- Quel est le risque majeur du non protection des données ?


a) L'impossibilité de piratage du Cloud
b) La récupération des données
c) Aucun juridiquement

4- Les infrastructures et applications utilisées pour le stockage des données sont :


a) communes à tous les utilisateurs
b) réservée à un client particulier
c) une architecture multi-tenant

5- Lequel des éléments suivants est lié au service fourni par le Cloud?
a) Sourcing OU externalisation
b) Fiabilité
c) AaaS
d) Aucune de ces réponses n’est vraie.

6- C’est est un environnement d’exploitation complet avec une interface utilisateur et des
applications.

a) IaaS
b) SaaS
c) PaaS
d) Tout les réponses sont vraies
7- Quel est le prestataire de services IaaS?
a) EC2
b) EC1
c) EC10
d) Hybride

8- C’est un fournisseur PaaS dans le système Google App Engine.


a) Google
b) Amazone
c) Microsoft
d) Aucune de ces réponses n’est vraie.

9- Parmi les critères suivants, lequel est le plus pertinent pour choisir un fournisseur ?
a) Le prix
b) Le portefeuille de clients du fournisseur
c) L'adresse MAC du fournisseur
d) La méthode de sécurité et de confidentialité du fournisseur

Exercice 2

1- Quelle fonctionnalité du cloud computing permet au service de changer de taille ou de


volume afin de répondre aux besoins des utilisateurs.
2- Quels sont les modes d’utilisation des services Cloud suivant : SaaS, PaaS, et IaaS ?
3- Donner le modèle de service Cloud permettant d’ajouter une pile de logiciels, telle qu’un
système d’exploitation et des applications
4- Donner les définitions des modèles de déploiement Cloud suivant : Cloud public, Cloud
privé, Cloud hybride
5- Quel type de Cloud les entreprises préfèrent-elles ? Privé, public, communautaire ou
hybrid

Exercice 3

1. Que fait référence à l’emplacement et à la gestion de l’infrastructure du cloud


2. Lequel des fournisseurs de services suivants offre moins de sécurité?
3. En quoi la virtualisation a-t-elle favorisé l’émergence du Cloud ?
4. On s'intéresse à deux types de virtualisation :
 Isolateur
 hyperviseur
On vous demande pour chacun de ces deux types :
a) d'expliquer en quoi il consiste
b) de les comparer (performances, …)
CORRECTION DU TD N°3

CORRECTION DE L’Exercice 1

Choisir la bonne réponse

1- Combien il y a-t-il de modèle(s) de service Cloud ?


a) 1
b) 3
c) 4
2- Combien il y a-t-il de modèle(s) de déplacement (ou déploiement) Cloud?
a) 2
b) 3
c) 4

3- Quel est le risque majeur du non protection des données ?


d) L'impossibilité de piratage du Cloud
e) La récupération des données
f) Aucun juridiquement

4- Les infrastructures et applications utilisées pour le stockage des données sont :


d) communes à tous les utilisateurs
e) réservée à un client particulier
f) une architecture multi-tenant

5- Lequel des éléments suivants est lié au service fourni par le Cloud?
e) Sourcing OU externalisation
f) Fiabilité
g) AaaS
h) Aucune de ces réponses n’est vraie.

Sourcing ou externalisation signifie que le service est fourni par le client ou par le fournisseur
de services.

6- C’est est un environnement d’exploitation complet avec une interface utilisateur et des
applications.
e) IaaS
f) SaaS
g) PaaS
h) Tout les réponses sont vraies

Dans le modèle SaaS, l’application est fournie au client via une interface client léger.
7- Quel est le prestataire de services IaaS?
e) EC2
f) EC1
g) EC10
h) hybride
8- C’est un fournisseur PaaS dans le système Google App Engine.
i) Google
j) Amazon
k) Microsof
l) Aucune de ces réponses n’est vraie.

9- Parmi les critères suivants, lequel est le plus pertinent pour choisir un fournisseur ?
e) Le prix
f) Le portefeuille de clients du fournisseur
g) L'adresse MAC du fournisseur
h) La méthode de sécurité et de confidentialité du fournisseur

Correction de l’Exercice 2

6- Quelle fonctionnalité du cloud computing permet au service de changer de taille ou de


volume afin de répondre aux besoins des utilisateurs.
C’est la scalabilité
La Scalabilité dans le cloud computing permet d’augmenter ou de réduire rapidement et
facilement la taille ou la puissance d’une solution informatique.
La Scalabilité est la capacité d’un processus, d’un réseau, d’un logiciel ou d’une application à
croître et à gérer des demandes croissantes. C’est l’une des caractéristiques les plus précieuses
et prédominantes du cloud computing. Grâce à la Scalabilité, vous pouvez augmenter votre
capacité de stockage de données ou la réduire pour répondre aux demandes des clients.

La Scalabilité vous permet de gérer des charges de travail plus importantes sans interruption
ni transformation complète de l’infrastructure existante.

7- Quels sont les modes d’utilisation : SaaS, PaaS, et IaaS ?


PaaS : Est la plate-forme d’exécution, de déploiement et de développement des applications
sur la plate-forme du Cloud Computing
IaaS : Permet d'externaliser les serveurs, le réseau, le stockage dans des salles informatiques
distantes. Les entreprises démarrent ou arrêtent des serveurs virtuels hébergés sur la plate-
forme de Cloud Computing
SaaS : Est celle applicative mettant à disposition des applications complètes fournies à la
demande. On y trouve différents types d'application allant du CRM, à la gestion des
ressources humaines, comptabilité, outils collaboratifs, messagerie et d'autres applications
métiers
8- Donner le modèle de service Cloud permettant d’ajouter une pile de logiciels, telle qu’un
système d’exploitation et des applications

Software as a service (SaaS) est un modèle de distribution de logiciels dans lequel un


fournisseur tiers héberge des applications et les met à la disposition des clients via Internet. Le
SaaS est l’une des trois principales catégories du cloud computing.

9- Associer les différentes notions avec leurs définitions : Cloud public, Cloud privé, Cloud
hybride
Cloud hybride : L'entreprise fait le choix d'héberger une partie de son infrastructure sur une
plate-forme publique, l'autre partie est hébergée en interne et est notamment utilisée pour les
données critiques de l'entreprise
Cloud privé : L'infrastructure de Cloud Computing est hébergée sur des serveurs à l'intérieur
de l'entreprise
Cloud public : L'infrastructure de Cloud Computing est hébergée sur une plate-forme
localisée à l'extérieur de l'entreprise

a)
10- Quel type de Cloud les entreprises préfèrent-elles ? Privé, public, communautaire ou
hybrid

Comme nous l’avons vu, il existe différents types de cloud computing. Mais, le type de
services cloud n’est pas le seul critère à prendre en considération lorsque l’on souhaite passer
au cloud computing. Il existe différentes implémentations qui offrent des niveaux de sécurité
et de personnalisation variables.
Le cloud public : les ressources informatiques de l’entreprise sont stockées sur un serveur
mutualisé, autrement dit partagé entre plusieurs clients, et accessibles par Internet. Ces
serveurs sont partitionnés de manière à interdire les fuites de données.
Le cloud privé : comme son nom l’indique, il est dédié à un seul utilisateur. L’avantage du
cloud privé est son important niveau de sécurité. Le cloud privé est administré par l’entreprise
elle-même ou un prestataire de services.
Le cloud hybride : l’entreprise utilise à la fois le cloud privé et le cloud public pour mettre en
œuvre certaines activités. Par exemple, le cloud public est utilisé par les collaborateurs pour
les tâches opérationnelles, tandis que le cloud privé sert à héberger le site web e-commerce de
l’entreprise ou ses données financières, pour réduire le risque de piratage. Et donc c’est le
modèle le plus préférés aux entreprises
Le cloud communautaire : plus rarement utilisé, il consiste à partager un espace donné entre
plusieurs entreprises ayant les mêmes exigences en matière de sécurité et de confidentialité. Il
s’apparente donc à un cloud privé partagé.

Correction de l’ Exercice 3

1- Que fait référence à l’emplacement et à la gestion de l’infrastructure du cloud


C’est le modèle de deploiement

L’un des éléments clés du Cloud Computing est le modèle de déploiement. Le modèle de
déploiement en Cloud indique comment les services en Cloud sont mis à la disposition des
utilisateurs. Les quatre modèles de déploiement associés au cloud computing sont les
suivants:
 Cloud privé
 Cloud publique
 Cloud hybrid
 Cloud communautaire

2- Selon vous Lequel des fournisseurs de services suivants offre moins de sécurité?
Iaas

Infrastructure as a Service (IaaS) sert de couche de base pour les autres modèles de
distribution, et le manque de sécurité de cette couche affectera certainement les autres
modèles de distribution.

3- En quoi la virtualisation a-t-elle favorisé l’émergence du Cloud ?


La virtualisation a facilité l’échange de ressources entre utilisateurs tout en réduisant les
coûts.

En effet, elle favorise le partage par différents systèmes d’exploitation des differentes
ressources du serveur.

Cette réduction de coût se traduit par :


- La réduction du nombre de serveurs.
- La réduction de l'espace occupé dans les datacenters.
- La réduction de la consommation énergétique des datacenters.
- Réduction des coûts d'administration.
- Amélioration de la flexibilité et de la rapidité des services.
- Amélioration de la qualité de services.

4- On s'intéresse à deux types de virtualisation :


 Isolateur
 hyperviseur
On vous demande pour chacun de ces deux types :
c) d'expliquer en quoi il consiste
d) de les comparer (performances, …)

a)
 L'isolation (aussi appelée cloisonnement) est une technique qui intervient au sein
d’un même système d'exploitation. Elle permet de séparer un système en plusieurs
contextes ou environnements : c-à-d que chaque système d’exploitation a un
fonctionnement indépendant, et ne peut interférer avec les autres en aucune manière.
 Il permet ainsi de faire tourner plusieurs fois la même application dans un mode
multi-instance (plusieurs instances d’exécution) même si elle n’était pas conçue pour
ça
 L’hyperviseur est un logiciel qui alloue et gère aux machines virtuelles des
ressources matérielles : il alloue de la mémoire, de l’espace disque, des composants
réseau ou de la puissance de traitement au sein du système. Ainsi, plusieurs machines
virtuelles différentes peuvent fonctionner sur un seul système hôte, puisque
l’hyperviseur veille à ce qu’elles n’interfèrent pas entre elles et à ce que toutes
disposent des capacités requises.

b)

L’isolateur : Cette solution est très performante, du fait du peu de surcharge (temps passé par
un système à ne rien faire d’autre que se gérer), mais les programmes de chaque contexte ou
environnement ne peuvent communiquer qu'avec les processus et les ressources associées à
leur propre contexte. Ce qui affecte la perfoarmance.

Un hyperviseur est performant mais il doit accéder aux ressources de calcul, de mémoire et
de réseau via le système d'exploitation hôte qui a un accès principal à la machine physique.
Cela pose des problèmes de délai d'attente qui affectent les performances, et présente des
risques potentiels pour la sécurité si un pirate informatique compromet le système
d'exploitation hôte, car il pourrait alors manipuler n'importe quel système d'exploitation
invité fonctionnant dans l'hyperviseur.
Université de Jendouba
Faculté des Sciences Juridiques Economiques et de Gestion de Jendouba
Module: Big data et Cloud Département: Informatique

Chargée de cours: Dr. Mouna Jouini Classes:3 LFBI/ 3LFEB


A.U: 2022-2023

Travaux Dirigés N°4

Questions de réflexion

Répondez aux questions suivantes en choisissant la bonne réponse

1. Choisissez la bonne réponse :


a) Hadoop a besoin de matériel spécialisé pour traiter les données
b) Hadoop 2.0 permet le traitement en temps réel des données en temps réel
c) Dans le cadre de programmation Hadoop, les fichiers de sortie sont divisés en lignes
ou enregistrements
d) Aucune des réponses précédentes

2. Selon les analystes, en quoi les systèmes informatiques traditionnels peuvent-ils


fournir un socle de base lorsqu'ils sont intégrés aux grandes technologies de données
comme Hadoop ?
a) Big data et data mining
b) Data warehousing et Business Intelligence
c) Gestion des clusters Hadoop
d) Collecter et stocker des données non structurées

3. Choisissez la bonne réponse :


a) Hadoop est idéal pour la charge de travail analytique, post-opérationnelle, d'entrepôt
de données
b) HDFS s'exécute sur un petit groupe de nœuds
c) NoSQL est souvent le point de collecte pour le big data
d) Aucune des réponses précédentes

4.Hadoop est un framework qui fonctionne avec une variété d'outils connexes. Les
cohorts communes incluent :
a) MapReduce, HDFS et NoSQL
b) MapReduce, MySQL and Google Apps
c) MapReduce, et Spark
d) MapReduce, oracle, et HDFS
e) Toutes les réponses précédentes

5. Tous les éléments suivants décrivent avec précision Hadoop, SAUF :


a) Open source
b) Temps réel
c) Basé sur du Java
d) Approche de programmation distribué

6. C’est est un modèle de calcul à usage général et un système d'exécution pour l'analyse
de données distribuées.
a) Hadoop
b) Sparks
c) Flume
d) Aucune des réponses précédentes

7. Quels sont les avantages du schéma de réplication 3x dans Hadoop ?


a) Tolérance aux pannes
b) La haute disponibilité
c) Fiabilité
d) Tout ce qui précède

Exercice 1

1) Comment fonctionne la distribution de fichiers sur HDFS ?


2) Donner les caractéristiques d'Hadoop ?
3) Par rapport aux systèmes de gestion de base de données relationnels (SGBDR),
quelle est la spécificité d’Apache Hadoop ?
4) Donner les caractéristiques d’Apache Spark ?
CORRECTION DU TD N°4

Questions de réflexion : CORRECTION


Répondez aux questions suivantes en choisissant la bonne réponse

1. Choisissez la bonne réponse :


a) Hadoop a besoin de matériel spécialisé pour traiter les données
b) Hadoop 2.0 permet le traitement en temps réel des données en temps réel
c) Dans le cadre de programmation Hadoop, les fichiers de sortie sont divisés en lignes ou
enregistrements
d) Aucune des réponses précédentes

2. Selon les analystes, en quoi les systèmes informatiques traditionnels peuvent-ils


fournir un socle de base lorsqu'ils sont intégrés aux grandes technologies de données
comme Hadoop ?
a) Big data et data mining
b) Data warehousing et Business Intelligence
c) Gestion des clusters Hadoop
d) Collecter et stocker des données non structurées

3. Choisissez la bonne réponse :


a) Hadoop est idéal pour la charge de travail analytique, post-opérationnelle, d'entrepôt de
données
b) HDFS s'exécute sur un petit groupe de nœuds
c) NoSQL est souvent le point de collecte pour le big data
d) Aucune des réponses précédentes

4. Hadoop est un framework qui fonctionne avec une variété d'outils connexes. Les
cohorts communes incluent :
a) MapReduce, HDFS et NoSQL
b) MapReduce, MySQL and Google Apps
c) MapReduce, et Spark
d) MapReduce, oracle, et HDFS
e) Toutes les réponses précédentes

5. Tous les éléments suivants décrivent avec précision Hadoop, SAUF :


a) Open source
b) Temps réel
c) Basé sur du Java
d) Approche de programmation distribué

6. C’est est un modèle de calcul à usage général et un système d'exécution pour l'analyse
de données distribuées.
a) Hadoop
b) Sparks
c) Flume
d) Aucune des réponses précédentes

7. Quels sont les avantages du schéma de réplication 3x dans Hadoop ?


a) Tolérance aux pannes
b) La haute disponibilité
c) Fiabilité
d) Tout ce qui précède

Exercice 1 : CORRECTION

1) Comment fonctionne la distribution de fichiers sur HDFS ?


IL permet la répartition en blocs répliqués sur les nœuds du cluster. En effet, Chaque
fichier est séparé en blocs d'une certaine taille et est répliqué sur les noeuds du cluster un
nombre fini de fois déterminé par l'administrateur du cluster.
2) Donner les caractéristiques d'Hadoop
• Open source
• Tolérance de panne : Si un nœud tombe, cela ne doit pas entrainer l’arrêt du calcul ou
la perte de données
• La haute disponibilité : par le HDFS, Chaque bloc est sauvegardé 3 fois, au moins,
pour augmenter la disponibilité et la sécurité des données

• Traitement efficace et fiable de données : Un cluster Hadoop (un sous ensemble de


machine) doit pouvoir stocker et traiter des gros volumes de données dans des délais
et couts acceptables
3) Par rapport au SGBDR, quelle est la spécificité d’Apache Hadoop :

Il fonctionne mieux sur les données non structurées et semi-structurées

4) Donner les caractéristiques d’Apache Spark ?

 Spark traite les données par lots ainsi qu'en temps réel
 Spark fonctionne rapidement par rapport aux systèmes traditionnels
 Spark stocke les données dans la RAM, c'est-à-dire en mémoire. Ainsi, il est plus
facile de le récupérer
 Spark fournit la mise en cache et le stockage de données en mémoire
 Apache Spark est flexible pour fonctionner avec HDFS ainsi qu’avec d’autres
stockages de données

Vous aimerez peut-être aussi