Vous êtes sur la page 1sur 40

Cours Big data et Cloud

Dr. Mouna Jouini


jouini.mouna@yahoo.fr

3ème année LF en Business Intelligence /


3ème année LF en Electronic Business

Faculté des Sciences Juridiques Economiques et de Gestion de Jendouba

2020/2021

Bases de données réparties - 3ème LFBI/ LFEB


Plan

• Chapitre I: Introduction générale au Cloud


Computing
• Chapitre II: Les principaux modèles de service
du cloud
• Chapitre III: Développement pour le cloud
• Chapitre IV: Emergence du Big Data
• Chapitre V: Big Data dans l’entreprise
Chapitre II: Les principaux modèles
de service du cloud
Services fourni par le CLOUD
• Les Services du Cloud peuvent être divisés en 3 couches (pile) :

• 1. Infrastructure as a Service: IaaS


• Infrastructure en tant que service.
• 2. Platform as a Service: PaaS
• Plateforme en tant que service.
• 3. Software as a Service: SaaS
• Logiciels en tant que service.
Selon le National Institute of Standards and
Technology il existe trois catégories de
services qui peuvent être offerts en cloud
computing : IaaS, PaaS et SaaS.
4
Services fourni par le CLOUD

Software as a Service
Platform as a Service

Infrastructure as a Service

5
Modèle de service

Azure

Platform as a
Cloud Computing

Service (PaaS)
 Moyens de calculs mutualisés
 Infrastructures de stockage
 Services fonctionnels standards
 Hébergés sur Internet Gmail
SalesForce
 Paiement à la consommation

Software as a
Service (SaaS)
Amazon Web Svcs

Infrastructure
as a Service
(IaaS)
CLOUD – Services 7

Infrastructure as a Service (IaaS)


• Ceci est la couche de base du modèle de la pile du Cloud.
• Il sert de base pour les deux autres couches, pour leur exécution.
Le mot-clé derrière cette couche est de virtualisation.
• Essayons de comprendre cela en utilisant Amazon EC2. Dans
Amazon EC2 (Elastic Compute Cloud) votre demande sera
exécutée sur un ordinateur virtuel (instance virtuelle). Vous avez le
choix de l'ordinateur virtuel, où vous pouvez sélectionner une
configuration de processeur, de mémoire et de stockage qui est
optimale pour votre application. L'ensemble de l’infrastructure
globale du Cloud _ i.e. les serveurs, routeurs, matériel à partage de
charge (load balancing hardware), pare-feu, stockage et autres
équipements réseau _ sont fournis par le fournisseur de l’IaaS. Le
client achète ces ressources comme un service, sur la base de ses
besoins.
CLOUD – Services

Infrastructure as a Service (IaaS)


C'est le service de plus bas niveau. Il consiste à offrir un accès à un
parc informatique virtualisé. Des machines virtuelles sur lesquelles
le consommateur peut installer un système d'exploitation et des
applications. Le consommateur est ainsi dispensé de l'achat de
matériel informatique. Ce service s'apparente aux services
d'hébergement classiques des centre de traitement de données
[datacenter (°) …] et la tendance est en faveur de services de plus
haut niveau, qui font davantage abstraction de détails techniques10.
(°) Datacenter : usine ou centre de stockage de données, fonctionnant jour et
nuit.

8
CLOUD – Services

Platform as a Service (PaaS)


• PaaS propose à l'utilisateur d'avoir accès à une véritable plate-
forme de développement (langage de programmation, outils de
développements, modules).

• Exemples de PaaS

Force.Com (SalesForce), Titan (Microsoft Dynamics CRM) (Gestion


Relation Client).
Google App Engine (Développer un site web dynamique)
Intuit (Comptabilité)

9
CLOUD – Services

Platform as a Service (PaaS)


•Dans ce type de service, situé juste au-dessus du précédent, le
système d'exploitation et les outils d'infrastructure sont sous la
responsabilité du fournisseur.

•Le consommateur a le contrôle des applications et peut ajouter


ses propres outils.

•Le consommateur loue l'exploitation de serveurs sur lesquels les


outils nécessaires sont préalablement placés et contrôlés par le
fournisseur. La différence étant que les systèmes sont mutualisés et
offrent une grande élasticité - capacité de s'adapter
automatiquement à la demande, alors que dans une offre classique
d'hébergement web l'adaptation fait suite à une demande formelle
du consommateur.
10
SaaS (Software as a Service)
concerne la mise à disposition d’applications d’entreprise : CRM,
outils collaboratifs, messagerie, Business Intelligence, ERP, etc.

Les applications ici sont mises à la disposition des


consommateurs. Elles peuvent être manipulées à l'aide d'un
navigateur web ou installées de façon locative sur un PC, et le
consommateur n'a pas à se soucier d'effectuer des mises à jour,
d'ajouter des patches de sécurité et d'assurer la disponibilité du
service.

Le fournisseur offre une fonction opérationnelle et gère de


façon transparente pour l’utilisateur l’ensemble des aspects
techniques requérant des compétences informatiques. Le
client garde la possibilité d’effectuer quelques paramétrages de
l’application.
Software as a Service (SaaS)
•Exemples

Salesforce CRM, Microsoft Dynamics CRM on line (Gestion


Relation Client).
Google Apps (Outils bureautiques) : Google documents,
Agenda, Talk…
BaseCamp (Gestion de projets) – La tendance est au travail en
mode projet et il est important d’y avoir accès en continue.
FaceBook, Viadeo (Réseaux sociaux) : nouveau mode de
communication.
Gmail est un exemple de tel service. Il offre au consommateur
un service de courrier électronique.

12
Software as a Service (SaaS)

•Office 365 propose un ensemble de services en abonnement


dont la suite logicielle Office qui se met automatiquement à jour,
l'utilisateur ne se soucie pas de racheter un nouveau logiciel ou
de le mettre à jour. On parle ici de location de services hébergés
par Microsoft.

•Autres exemples : Google Apps, Office Online ou LotusLive


(IBM)

•Un fournisseur de software as a service peut exploiter des


services de type platform as a service, qui peut lui-même se
servir de infrastructure as a service.

13
CLOUD – Services
Autres services également disponibles :

• Data as a Service : correspond à la mise à disposition de données


délocalisées quelque part sur le réseau.

• BPaaS : il s'agit du concept de Business Process as a service (BPaaS)


qui consiste à externaliser une procédure d'entreprise suffisamment
industrialisée pour s'adresser directement aux managers d'une
organisation, sans nécessiter l'aide de professionnels de
l'informatique

• Network as a Service (NaaS) : le Network as a Service correspond à


la fourniture de services réseaux, suivant le concept de Software
Defined Networking (SDN).

14
CLOUD – Services
Autres services disponibles (suite) :

• STaaS : STorage as a Service correspond au stockage de fichiers chez


des prestataires externes, qui les hébergent pour le compte de leurs
clients. Des services grand public, tels que Microsoft OneDrive,
SugarSync et Box.net, proposent ce type de stockage, le plus souvent à
des fins de sauvegarde ou de partage de fichiers. Voici d'autres
exemples : Microsoft SharePoint, Amazon S3, Dropbox, Google Drive,
HubiC, iCloud, Ubuntu One, Windows Live Mesh, Wuala.

• Communication as a Service (CaaS): correspond à la fourniture de


solutions de communication substituant aux matériels et serveurs
locaux (PABX, ACD, SVI...) des ressources partagées sur Internet.

15
Autres exemples

Source : Gartner AADI Summit Dec 2009

16
Qui contrôle le cloud

Cette
représentation des
différents modèles
de service montre
comment les
responsabilités sont
théoriquement
réparties suivant les
modèles interne,
IaaS, PaaS, SaaS

17
Les acteurs du marché
CLOUD – Exemples

DROPBOX :

•Dropbox, permet de synchroniser


ses dossiers, ainsi que ses sous-
dossiers applicatifs … et ses fichiers
préférences, entre ses ordinateurs
distants, sa tablette et son
Smartphone [étant tous connectés
à Internet _ ADSL, WiFi …).

•Dropbox assure un accès sécurisé


à tous vos fichiers. Collaborez avec
amis, famille et collègues depuis
tout appareil. 19
CLOUD – Exemples

DROPBOX :

•Au lieu de lancer un


programme de messagerie (un
gestionnaire de vos e-mail) sur
votre ordinateur, vous vous
connectez à un compte e-mail
Web à distance. Le logiciel et le
stockage, pour votre compte,
n’existe pas sur votre ordinateur
- ce est sur le « nuage
d'ordinateurs » du service de
messagerie distant. Exemples :
Yahoo!, GMail, Hotmail … 20
CLOUD – Exemples
Exemple de Cloud public pour le stockage
Produits
Basic Features 15 Go Gratuit Gratuit 2 GO+ 15 Go Gratuit Gratuit Gratuit Gratuit Standard Free

Meilleurs prix Adrive Box Dropbox Google Drive Hubic Mega OneDrive Shared
Source :
http://www.toms Analyse Un outil de stockage Un service assez Streaming, édition Tout y est : du Un bon site, qui offre Le fameux site de Dommage que sa Un service qui offre
guide.fr/article/c qui manque de complet et surtout de contenu, facilité streaming à l'édition 25 Go gratuitement. Kim Dotcom chiffre vitesse de 100 Go, mais qui
fonctionnalités. On dédié au monde de d'accès : tout y est. de fichiers, en En revanche, on peut vos données, offre chargement ne soit manque vraiment
omparatif- apprécie pourtant l'entreprise, qui On se sent juste un passant par une lui reprocher sa 50 Go et ne manque pas à la hauteur, car d'originalité et de
stockage-ligne- son interface Web. regorge de plugin en peu à l'étroit avec 2 disponibilité vitesse de transfert pas de rapidité. le service de fonctionnalités.
gratuit-cloud,2- tout genre. En Go par défaut. exemplaire. On limitée et son Vivement que les Microsoft est
revanche, sa version espère juste qu'un absence de logiciels de vraiment très
1231.html → gratuite est jour, Google chiffre streaming. synchronisation pour complet.
relativement lente les données sur ses PC et MAC fassent
(environ 500 ko/s en serveurs. leur apparition.
upload), ce qui gâche
l'ensemble.
Capacité en Go 50 10 2 15 25 50 15 100
Taille limite des
2 250 Mo 2 10 25 50 10 2
fichiers en Go
Streaming oui partiel audio et vidéo audio et vidéo non non audio et vidéo non
oui (30 jours ou 100
Historique non non oui (30 jours) non non 25 dernières versions non
révisions)
Client Windows non oui oui oui oui non oui non
Client Mac OS X non oui oui oui oui non oui non
Client Linux non non oui non oui non non non
Application
non oui oui non non non oui non
Windows 8/8.1/RT
Application officielle
oui oui oui oui oui oui oui non
Android
Application officielle
oui oui oui oui oui oui oui non
iOS
Application officielle
non oui non non oui non oui non
Windows Phone
Application officielle
non non oui non non non oui non
Symbian
Application officielle
non oui oui non oui non non non
Blackberry
URL
http://www.adrive.c https://www.box.co https://www.dropbo https://drive.google.
https://hubic.com https://mega.co.nz
21
http://onedrive.com https://shared.com
om m x.com com
CLOUD – Principaux acteurs
Les fournisseurs de services de Cloud Computing sont des
hébergeurs, Ils mettent à disposition des infrastructures physiques
proposant une plate-forme de Cloud. Les principaux acteurs:
Salesforce.com, Amazon, Google, VMware et Microsoft :

1. SALESFORCE
Salesforce.com est une société créée en 1999. Elle est devenue l'une
des pionnières du modèle SaaS grâce à son outil historique de CRM
(Customer Relationship Management) intitulé Salesforce.
2. Google
En 2008, Google a lancé son Cloud public orienté pour les services
Web offrant une plate - forme (PaaS) nommée « Google App Engine
» et permettant l'hébergement d'applications Python ou Java, ainsi
que des applications SaaS regroupées dans la gamme «Google App».
22
CLOUD – Principaux acteurs
1. Amazon
Amazon, au travers d’ « Amazon Web Services » (AWS) met à
disposition un Cloud public depuis 2006. Aujourd'hui, Amazon
propose un service d’IaaS avec « EC2 » (Elastic Compute Cloud) et
différents PaaS liés ou non à leur boutique.

1. VMware
VMware est une entreprise créée en 1998. Pendant plus de 10 ans,
elle a conçu différents produits liés à la virtualisation. En 1999
apparaissait la première version de VMware Workstation, un logiciel
client permettant la virtualisation de machines virtuelles.
Depuis 2008, VMware n'a cessé d'investir dans le marché du
Computing, en rachetant différentes entreprises comme Zimbra
(application SaaS de collaboration)
23
CLOUD – Principaux acteurs
1. Microsoft
Microsoft annonçait l'arrivée de sa propre solution de Cloud
Computing nommée Windows Azure. Cette dernière a été rendue
commerciale en janvier 2010, Le Cloud de Microsoft s'est aussi des
applications SaaS de la gamme Live et Online Service.

Huawei
La solution de cloud computing Huawei intègre la convergence dans
le sens horizontal, vertical, l'accès et contextes de données. Il
remodèle l'infrastructure informatique des centres de données
classiques. Huawei met en oeuvre le fonctionnement et la gestion
unifiée de l'infrastructure informatique.

24
CLOUD – Principaux acteurs
1. Le cloud computing Rackspace
Créée en 1998. Elle est aujourd’hui avec Amazon Web Services ou
Microsoft Azure un des leaders mondiaux du cloud computing : elle
revendique près de 200 000 clients et a réalisé plus d’un milliard de
chiffre d’affaires en 2011. Rackspace est aussi à l’origine, avec la
Nasa, de la création d’OpenStack, plateforme open source de cloud
IAAS public ou privé, lancé en juillet 2010.
Rackspace possède des datacenters principalement aux Etats-Unis mais
aussi en Europe et en Asie.

1. Le Cloud computing Numergy


Numergy est une société française créée en 2012. Numergy est l'un
des 2 cloud soutenus par l'Etat pour lancer des offres cloud français
capables de concurrencer les acteurs majeurs du secteur comme
Amazon Web Services ou Microsoft Azure. 25
Présentation d’OpenStack

De nombreuses entreprises ont rejoint la fondation


OpenStack (°). Parmi celles-ci on retrouve : Canonical, Red
Hat, SUSE, eNovance,AT&T, Cisco, Dell, HP, IBM, Yahoo!,
Oracle, Orange, Cloudwatt, EMC, VMware, Intel.
(°) OpenStack est un ensemble de logiciels open source permettant de déployer des
infrastructures de cloud computing (infrastructure en tant que service).

26
Présentation d’OpenStack

Créé en juillet 2010 par la NASA et l'hébergeur américain Rackspace,


OpenStack est une offre d'IaaS 100% open-source encore en
développement qui a livré son code source récemment et qui
permet aux sociétés de développer leurs propres solutions
d'infrastructure du Cloud Computing.

OpenStack est un ensemble de projets logiciels open source que les


entreprises / fournisseurs de services peuvent utiliser pour
configurer et exécuter leur infrastructure de calcul et de stockage en
nuage, géré via un tableau de bord ou via l'API OpenStack.

Ce projet est soutenu par quelques fournisseurs tels que : Intel, Dell
et Citrix.
27
Présentation d’OpenStack

Architecture OpenStack

• L’architecture d’OpenStack,
représenté par, est modulaire
fragmentée et distribuée.

• Elle comporte
essentiellement trois projets
en liaison
1. OpenStack Compute
(Nova),
2. OpenStack Object Storage
(Swift) et
3. OpenStack Image Service
(Glance). 28
Présentation d’OpenStack

Architecture OpenStack

•Ces trois composants permettent la gestion des différentes


ressources des VMs : le calcul CPU, le stockage ou encore le réseau
du datacenter associé. Ainsi que d’autres : Identity, Network
Service…

• Regardons chacun à tour de rôle :


• Object storage (nommé « Swift ») : Permet de stocker ou de
récupérer des fichiers avec une réplication de données
•Image (codé « Glance ») : Fournit un référentiel pour les
images de disque virtuel. Ces images de disque sont
couramment utilisées dans OpenStack Compute.

29
Présentation d’OpenStack

Architecture OpenStack

• Compute (codé « Nova ») : Fournit un ensemble des serveurs


virtuels (instances) sur demande et gère les ressources de
l’infrastructures
• Dashbord (codé « Horizon ») : Fournit une interface utilisateur
de contrôle modulaire basée sur le Web et intéragit avec les
APIs de tous les services OpenStack.
• Identité (codé « Keystone ») : Fournit une authentification et
une autorisation pour tous les services OpenStack.

30
Présentation d’OpenStack

Architecture OpenStack

• Réseau (codé « Neutron ») : Fournit une connectivité réseau en


tant que service entre les périphériques d'interface gérés par
d'autres services OpenStack (probablement Nova). Le service
fonctionne en permettant aux utilisateurs de créer leurs
propres réseaux, puis de leur attacher des interfaces.
• Stockage en bloc (codé « Cinder ») : Fournit un stockage en
blocs persistant aux machines virtuelles invitées (instances en
cours d’exécutions).

31
32

SECURITE DU CLOUD
Sécurité
• La sécurité du Cloud englobe les technologies, les contrôles, les
processus et les politiques qui se combinent pour protéger vos
systèmes, données et infrastructures basés sur le Cloud.

• Il s’agit d’une responsabilité partagée entre le client et son


fournisseur de services de Cloud.

• Avec les dernières études de l’(ISC)2 (International Information


System Security Certification Consortium) indiquant que 93 %
des organisations sont modérément ou extrêmement
préoccupées par la sécurité dans le Cloud.

33
Pourquoi la sécurité du Cloud est nécessaire

• La sécurité dans le Cloud est une exigence essentielle.


Les menaces pour la cybersécurité continuent de s’accroître
Prévention des violations et des pertes de données

Le rapport sur les menaces émergentes de Norton (2019) a souligné


que plus de 4 milliards d’enregistrements ont été violés.
Et Une perte ou une violation de données peut avoir des
implications juridiques, financières et de réputation importantes.
IBM estime maintenant le coût moyen d’une violation de données à
3,92 millions de dollars US dans son dernier rapport.

Éviter les violations de conformité


Il faut surveiller la vie privée des entitiés et de leurs.
34
Pourquoi la sécurité du Cloud est nécessaire

Maintenir la continuité des activités


La protection contre les menaces telles que les attaques par déni de
service (DDoS), mles interruptions de service imprévues et
les temps d’arrêt du système interrompent la continuité de vos
activités.
Une étude de Gartner estime ce temps d’arrêt à une moyenne de 5
600 $ américains par minute.
Choisir un fournisseur de confiance
Les meilleures pratiques en matière de sécurité dans le Cloud
reposent sur la sélection d’un fournisseur de services de confiance.
Le client doit associer à un fournisseur de services dans le Cloud qui
offre les meilleurs protocoles de sécurité intégrés et qui se conforme
aux plus hauts niveaux des meilleures pratiques du secteur.
35
CLOUD – Problèmes de SECURITE

• Gestion des identifiants (identités).


• Secret. Sécurité et confidentialité des données.
• Sécurité physique et personnelle.
• Non maîtrise de son informatique confiée des tiers. Confiance
accordée dans le prestataire tiers. Dépendance ou liberté par rapport
à ce dernier ? Pérennité de l’hébergeur.
• Disponibilité (garantie à 99 % ? Ou bien à combien ? Quel contrat ?).
• Maturité des applications. Certaines applications sont peu ou pas
adaptées à l’interface web.
• Contrôle des applications.
• Questions juridiques _ localisation des données ou du data center,
dépendantes de législations territoriales.
• Aspects contractuels : Les clauses des contrats de services cloud
concernent principalement la disponibilité, la sécurité, la
confidentialité et le support.
CLOUD – Problèmes de SECURITE
Problématiques de sécurité spécifiques

Confidentialité, intégrité,
disponibilité
Juridique, souveraineté
• Accès aux données par du
personnel externe à l’entreprise
et pas directement sous contrat
(exemple prestataire réseau). • De quelle juridiction/pays
• Authentification hors défenses vont dépendre vos données
périmétriques (login/password et les machines de votre
sur internet). fournisseur de cloud ?
• Hébergement des données sur
du matériel n’appartenant pas à
l’entreprise (exemple espace de
stockage à la demande).
•…
Sécurité
• Il existe un ensemble de stratégies et d’outils largement établis que
vous pouvez utiliser pour mettre en place une solide sécurité dans
le Cloud, notamment:
Gestion des identités et des accès
Toutes les entreprises doivent disposer d’un système de gestion des
identités et des accès (IAM) pour contrôler l’accès aux informations.
Un IAM combine des politiques d’authentification et d’accès des
utilisateurs pour aider à contrôler leurs applications et leurs données.
Sécurité physique
Il s’agit d’une combinaison de mesures visant à empêcher l’accès
direct et la perturbation du matériel hébergé dans le centre de
données de votre fournisseur de cloud computing. La sécurité
physique comprend le contrôle de l’accès direct par la protection
contre les incendies, etc. 38
Sécurité
Renseignement, surveillance et prévention des menaces
Les outils de renseignement sur les menaces et les IDS offrent des
fonctionnalités pour identifier les attaquants qui ciblent
actuellement ces systèmes ou qui constitueront une menace future.
Cryptage (chiffrement)
En utilisant la technologie du Cloud, vous envoyez des données vers
et depuis la plateforme du fournisseur de Cloud, souvent en les
stockant dans leur infrastructure. C’est pour protéger les données,
en les encodant lorsqu’elles sont au repos et en transit et garantir
que les données sont quasiment impossibles à déchiffrer.
Test de vulnérabilité et de pénétration du Cloud
Se sont des pratiques impliquent que le client peut (ou son
fournisseur) – attaquer son propre infrastructure de Cloud afin
d’identifier toute faiblesse ou exploitation potentielle.
39
Sécurité
Micro-Segmentation
Il s’agit de la pratique consistant à diviser le déploiement de client
dans le Cloud en segments de sécurité distincts, jusqu’au niveau de
la charge de travail individuelle.
En isolant les charges de travail individuelles, on applique des
politiques de sécurité flexibles pour minimiser les dommages qu’un
attaquant pourrait causer, s’il y avait accès.

40

Vous aimerez peut-être aussi