Bienvenue sur Scribd !

Ignorer le carrousel

Atelier2 Sqoop

Transféré par

MarwenCherif

0% ont trouvé ce document utile (0 vote)

57 vues4 pages

Titre original

Atelier2-Sqoop

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

57 vues4 pages

Atelier2 Sqoop

Transféré par

MarwenCherif

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 4

Rechercher à l'intérieur du document

Matière : Big Data avancées Atelier 2

Enseignant : MNIF Ahmed

Atelier 2 : Sqoop
I. Objectif
Cet atelier a pour but :

 Importer des données d’un SGBDR vers HDFS

 Exporter des données de HDFS vers un SGBDR

II. Utiliser sqoop pour importer et exporter des données de mysql vers
HDFS
1. Utiliser sqoop pour importer les données de la table « movies » dans la base de
données « movielens » dans hdfs sous le répertoire de l’utilisateur « maria_dev »
$ mysql -u root -p

 Remarque : on doit ajouter les privilèges à tous les utilisateurs pour permettre de lire la
base de données « movielens ». utiliser localhost et l’adresse ip local de la machine.

mysql> grant all privileges on movielens.* to ''@'172.17.0.2';

mysql> grant all privileges on movielens.* to ''@'localhost';

mysql> grant all privileges on movielens.* to ''@'sandbox.hortonworks.com';

$ sqoop import --connect jdbc:mysql://172.17.0.2/movielens --username root --password hadoop

--driver com.mysql.jdbc.Driver --table movies --m 1

 Remarque : 1 mapper par ce qu’on travaille en mode standalone (une seule machine)

1
2. Naviguer vers le répertoire de l’utilisateur maria_dev dans HDFS et vérifier que les
données sont importées sous HDFS

3. Effacer le dossier movies dans hdfs et utiliser à nouveau une commande Sqoop
pour importer les données de la table « movies » directement dans Hive dans une
table sous une nouvelle base de données « movielens_bigdata »
Tout d’abord on doit créer un nouveau schéma « movielens_bigdata » dans hive

$ hive

> create database movielens_bigdata ;

Maintenant on va charger les données à partir de mysql vers hive en spécifiant le nom de la table
dans hive.

$ sqoop import --connect jdbc:mysql://172.17.0.2/movielens --username root --password hadoop

--driver com.mysql.jdbc.Driver --table movies --hive-table movielens_bigdata.movies --hive-
import --m 1

4. Vérifier que les données sont importées dans Hive

2
 Remarque : Les données sont importées en premier lieu temporairement par défaut sous
le chemin « /user/maria_dev/movies » puisqu’on n’a pas spécifié l’option « --target-dir »
dans la commande « sqoop » puis ils ont été déplacées et chargées dans la table
« movielens_bigdata.movies » sous le data warehouse par défaut de hive dans HDFS
c’est à dire sous le chemin « /apps/hive/warehouse/movielens_bigdata.db »

5. Exporter les données dans l’autre sens maintenant (de Hdfs vers Mysql) dans une
nouvelle table « exported_movies » dans la base de données « movielens »
$ mysql -u root -p

mysql> use movielens ;

mysql> CREATE TABLE exported_movies (id INTEGER , title VARCHAR(255) , relaseDate

DATE ) ;

3
mysql> exit ;

$ sqoop export --connect jdbc:mysql://172.17.0.2/movielens --m 1 --driver

com.mysql.jdbc.Driver --table exported_movies --export-dir
/apps/hive/warehouse/movielens_bigdata.db/movies --input-fields-terminated-by '\0001'

 Remarque : '\0001' est le délimiteur par défaut de hive

6. Vérifier que les données sont bien importées dans la table exported_movies.
$ mysql -u root -p

mysql> use movielens ;

mysql> select * from exported_movies limit 5 ;

Vous aimerez peut-être aussi

Tp3 - TP Sqoop
Document7 pages
Tp3 - TP Sqoop
Chouchen Nizar
Pas encore d'évaluation
TP N°1 - Installation Via Paquets
Document6 pages
TP N°1 - Installation Via Paquets
Ferdaous Hd
Pas encore d'évaluation
TP01 Installation de Hadoop Sous Linux
Document10 pages
TP01 Installation de Hadoop Sous Linux
Manal Ess
Pas encore d'évaluation
Big Data Analytics Sqoop - CDH 4.7
Document11 pages
Big Data Analytics Sqoop - CDH 4.7
fida
Pas encore d'évaluation
Tp1 Bigdata Mapreduce 171031163107
Document8 pages
Tp1 Bigdata Mapreduce 171031163107
Koffi Kanga
Pas encore d'évaluation
Apache Sqoop Interview Questions and
Document11 pages
Apache Sqoop Interview Questions and
Mohamed Rahal
Pas encore d'évaluation
Cours Laravel 9 - Mix
Document5 pages
Cours Laravel 9 - Mix
KHALID EDAIG
Pas encore d'évaluation
Sqoop Rapport
Document35 pages
Sqoop Rapport
Houda Mabrouk
Pas encore d'évaluation
Tester Wordpress en Local Avec XAMPP
Document9 pages
Tester Wordpress en Local Avec XAMPP
Mathieu Sagot
Pas encore d'évaluation
Leçon 1: Introduction À Spring Boot
Document11 pages
Leçon 1: Introduction À Spring Boot
charfeddine fredj
Pas encore d'évaluation
Atelier 1 - RDD
Document1 page
Atelier 1 - RDD
Taha Belakhdher
0% (1)
Hibernate (Par BOUSETTA)
Document20 pages
Hibernate (Par BOUSETTA)
M B
Pas encore d'évaluation
Cours Configuration Symfony Enasic PDF
Document75 pages
Cours Configuration Symfony Enasic PDF
Mahamat Abdraman Fadoul
Pas encore d'évaluation
Cours Symfony
Document28 pages
Cours Symfony
Parfait Sandiwidi
Pas encore d'évaluation
Communication Entre Android Et PHP - Mysql
Document27 pages
Communication Entre Android Et PHP - Mysql
Gahi Said
50% (2)
Hadoop
Document13 pages
Hadoop
hamid ouhnni
Pas encore d'évaluation
TP Haproxy
Document3 pages
TP Haproxy
BAILA ATHIMAN ROLAND
Pas encore d'évaluation
Langage PHP
Document38 pages
Langage PHP
Med HARRANE
Pas encore d'évaluation
Configuration D Un Ordinateur Dans Nagios
Document5 pages
Configuration D Un Ordinateur Dans Nagios
JAHSWANTO
Pas encore d'évaluation
Tp3 Docker
Document19 pages
Tp3 Docker
ABID Hanane
Pas encore d'évaluation
Servlet JSP
Document4 pages
Servlet JSP
wagih belguith
Pas encore d'évaluation
0590 PHP Avance Gerer Une DB Avec Pdo
Document22 pages
0590 PHP Avance Gerer Une DB Avec Pdo
tona yves
Pas encore d'évaluation
TP - Initiation À MongoDB
Document11 pages
TP - Initiation À MongoDB
ilyas sarya
Pas encore d'évaluation
Bases de Données PHP
Document30 pages
Bases de Données PHP
Mohamed Es-Sedraty
Pas encore d'évaluation
Resume SQL Partie 1 PDF
Document8 pages
Resume SQL Partie 1 PDF
Hajar Salimi
Pas encore d'évaluation
TP SQL
Document13 pages
TP SQL
yassinedo
Pas encore d'évaluation
Support de Cours TSQL 2000
Document20 pages
Support de Cours TSQL 2000
Joom LA
Pas encore d'évaluation
Servlet Course
Document68 pages
Servlet Course
Koutheir ELBEHI
Pas encore d'évaluation
MVC Controleur
Document22 pages
MVC Controleur
Tuan Dao Duy
Pas encore d'évaluation
tp4 PHP Mysql Cor
Document9 pages
tp4 PHP Mysql Cor
Mahieddine Djoudi
Pas encore d'évaluation
TP2 Hadoop 22 23
Document3 pages
TP2 Hadoop 22 23
Morrocan Dream
Pas encore d'évaluation
Java de Base
Document126 pages
Java de Base
Moussa Sy
Pas encore d'évaluation
Semaine 1
Document53 pages
Semaine 1
aymen.ayari
Pas encore d'évaluation
TP 1 Spark
Document7 pages
TP 1 Spark
rihab benmarzouk
Pas encore d'évaluation
Cours8 - PHP Et BD
Document62 pages
Cours8 - PHP Et BD
ouameur abderrahim
Pas encore d'évaluation
M20409 Formation Virtualisation de Serveurs Avec Windows Server Hyper V Et System Center PDF
Document2 pages
M20409 Formation Virtualisation de Serveurs Avec Windows Server Hyper V Et System Center PDF
CertyouFormation
Pas encore d'évaluation
Rapport Du Projet
Document48 pages
Rapport Du Projet
Ayoub Tarhouchi
100% (1)
tp3 Scala
Document2 pages
tp3 Scala
fafa
Pas encore d'évaluation
Laravel Generer Un PDF Avec Laravel Dompdf 19092021
Document5 pages
Laravel Generer Un PDF Avec Laravel Dompdf 19092021
avy orana
Pas encore d'évaluation
TP N°2 PDF
Document3 pages
TP N°2 PDF
kira525
Pas encore d'évaluation
PDO en PHP
Document11 pages
PDO en PHP
Aymane Sabri
Pas encore d'évaluation
Couplage Apache Tomcat
Document8 pages
Couplage Apache Tomcat
totobubu
Pas encore d'évaluation
tp1 IRS
Document7 pages
tp1 IRS
Zohra CHANNOUF
100% (1)
Ionic Framework Introduction
Document50 pages
Ionic Framework Introduction
kyo007
Pas encore d'évaluation
Travaux Pratiques de BDD
Document19 pages
Travaux Pratiques de BDD
Amice Quentin Mavoungou
Pas encore d'évaluation
Atelier 1 - Projet Spring Boot
Document10 pages
Atelier 1 - Projet Spring Boot
Jouhaina Nasri
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
Document9 pages
TP1 BigDataAnalytics Initiation Hadoop
Souley
Pas encore d'évaluation
PrésentationJavaFX FXML Version Finale
Document33 pages
PrésentationJavaFX FXML Version Finale
Hajar hajar
100% (2)
Compilation Du Noyau Linux
Document26 pages
Compilation Du Noyau Linux
agire
Pas encore d'évaluation
TP HAproxy
Document1 page
TP HAproxy
MedAyhem Kh
Pas encore d'évaluation
tp1 Hadoop Mapreduce 2023
Document5 pages
tp1 Hadoop Mapreduce 2023
mohamedfarouk.hamadi
100% (1)
TP N°6 - Devpt - Web - Coté - Serveur
Document3 pages
TP N°6 - Devpt - Web - Coté - Serveur
nawel amara
Pas encore d'évaluation
09 JDBC
Document112 pages
09 JDBC
Oumaima Alfa
100% (1)
BDATP5MongoDB PDF
Document14 pages
BDATP5MongoDB PDF
haifa zrelli
Pas encore d'évaluation
TP5 ConnexionBD Hibernate
Document4 pages
TP5 ConnexionBD Hibernate
Houda
Pas encore d'évaluation
CSRF Laravel
Document5 pages
CSRF Laravel
crunch
Pas encore d'évaluation
TD MVC Pour RMI
Document6 pages
TD MVC Pour RMI
Pooopo
Pas encore d'évaluation
Procédure de Masterisation
Document2 pages
Procédure de Masterisation
Anonymous xb9RP466
Pas encore d'évaluation
Maitrisez La Configuration Apache Tomcat Sous Linux
D'Everand
Maitrisez La Configuration Apache Tomcat Sous Linux
Koru Lenag
Pas encore d'évaluation
La Biologie De Synthèse: Reconcevoir les organismes pour avoir de nouvelles capacités
D'Everand
La Biologie De Synthèse: Reconcevoir les organismes pour avoir de nouvelles capacités
Fouad Sabry
Pas encore d'évaluation
TP Modèle Linéaire - Python
Document6 pages
TP Modèle Linéaire - Python
MarwenCherif
Pas encore d'évaluation
Cours Big Data Avancee Chp2 Data-Ingestion
Document46 pages
Cours Big Data Avancee Chp2 Data-Ingestion
MarwenCherif
Pas encore d'évaluation
Cours Big Data Avancee Chp1 Introduction
Document28 pages
Cours Big Data Avancee Chp1 Introduction
MarwenCherif
Pas encore d'évaluation
Atelier1 Installation Environnement
Document12 pages
Atelier1 Installation Environnement
MarwenCherif
Pas encore d'évaluation
Demarrage Dun Ordinateur
Document20 pages
Demarrage Dun Ordinateur
You Ssëf CH
Pas encore d'évaluation
Annexe 1 Fiche Descriptive Flutter
Document6 pages
Annexe 1 Fiche Descriptive Flutter
Belgrada DONGMO
Pas encore d'évaluation
Ax3 Range FR
Document7 pages
Ax3 Range FR
richard.fsd
Pas encore d'évaluation
Support de Formation Caneco BT 1586190055
Document285 pages
Support de Formation Caneco BT 1586190055
fatima-ezzahra moujjane
100% (2)
Trace Master
Document19 pages
Trace Master
Edwin Vitovis Torres
Pas encore d'évaluation
2 Investigation
Document11 pages
2 Investigation
tapha06300
Pas encore d'évaluation
Comment Installer Nginx Sur Ubuntu 20.04 - DigitalOcean
Document1 page
Comment Installer Nginx Sur Ubuntu 20.04 - DigitalOcean
Nico Sully
Pas encore d'évaluation
Monde Des Animaux
Document60 pages
Monde Des Animaux
Mohamed Fadel Bourhim
Pas encore d'évaluation
Les Dilemmes de L Economie Numerique La Transformation Des Economies Sous L Influence de L Innovation
Document36 pages
Les Dilemmes de L Economie Numerique La Transformation Des Economies Sous L Influence de L Innovation
nangaayissi
100% (1)
VISUEL BASIC Dragondatax
Document78 pages
VISUEL BASIC Dragondatax
anon-282007
100% (4)
Cadre Référentiel 6AP Toutes Les Disciplines
Document8 pages
Cadre Référentiel 6AP Toutes Les Disciplines
SAIDA HAMMADOU
Pas encore d'évaluation
Cours PL SQL 2
Document39 pages
Cours PL SQL 2
Amira Skander
Pas encore d'évaluation
Zed Graph
Document8 pages
Zed Graph
Aymen Rabboudi
Pas encore d'évaluation
1 Cours Spss
Document147 pages
1 Cours Spss
Youssef Alami
Pas encore d'évaluation
3 TD1
Document5 pages
3 TD1
Musta Ya
Pas encore d'évaluation
Cours - TIC - Bases de Données Et Internet - Chapitre 4 - Introduction À SQL Et À MySQL
Document74 pages
Cours - TIC - Bases de Données Et Internet - Chapitre 4 - Introduction À SQL Et À MySQL
iranao
Pas encore d'évaluation
C# 9 C# 9. Visual Studio Développez Des Applications Windows. Visual Studio 2019
Document24 pages
C# 9 C# 9. Visual Studio Développez Des Applications Windows. Visual Studio 2019
Abdoul Karim Dosso
Pas encore d'évaluation
Epson Cpd42772
Document458 pages
Epson Cpd42772
Romuald Lobet
Pas encore d'évaluation
Cours Socket
Document104 pages
Cours Socket
Sef SandMan
Pas encore d'évaluation
Crystal Report - Avance PDF
Document1 page
Crystal Report - Avance PDF
Youcef Benz
Pas encore d'évaluation
Tutoriel Sur Une Introduction À CDI
Document20 pages
Tutoriel Sur Une Introduction À CDI
T.M
Pas encore d'évaluation
Aide Mémoire Git
Document3 pages
Aide Mémoire Git
abdoulaye nguini
Pas encore d'évaluation
Audit de La Base de Données Oracle
Document7 pages
Audit de La Base de Données Oracle
Babacar Ngom
100% (2)
D50 NT (FR) 03
Document148 pages
D50 NT (FR) 03
Svbhygtrf Tfgtrfetd
Pas encore d'évaluation
Git
Document45 pages
Git
sadekbelmesk
Pas encore d'évaluation
WP Creer Son Child Theme
Document8 pages
WP Creer Son Child Theme
Chica De Panama
Pas encore d'évaluation
TP Guide WAVRANT MARRAGOU
Document27 pages
TP Guide WAVRANT MARRAGOU
Pascal Berthou
Pas encore d'évaluation
Raport de Projet
Document115 pages
Raport de Projet
Fatima Khanfri
100% (1)
Projet Module: Réseau Industrielle: Départent Informatique Industrielle ENISO Université de Sousse
Document10 pages
Projet Module: Réseau Industrielle: Départent Informatique Industrielle ENISO Université de Sousse
Lotfi H
Pas encore d'évaluation
Rapport Systeme Info 12-05-09
Document82 pages
Rapport Systeme Info 12-05-09
TOUJI Amine
Pas encore d'évaluation