Bienvenue sur Scribd !

Ignorer le carrousel

05 Pig

Transféré par

helmi.sassi.hs

0% ont trouvé ce document utile (0 vote)

10 vues2 pages

Titre original

05_Pig

Copyright

Formats disponibles

DOCX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

10 vues2 pages

05 Pig

Transféré par

helmi.sassi.hs

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

PIG

Démarrer PIG en local

pig -x local

Chargement des données

movies = LOAD '/home/cloudera/workspace/data/movies_data.csv' USING PigStorage(',') as

(id:int,name:chararray,year:int,rating:double,duration:int) ;

DUMP
Pour le tester

La commande "dump" permet d’afficher le contenu du flux de données dans la sortie

standard.

grunt> DUMP movies ;

LIMIT
Créer un nouvel alias nommé movies_lim contenant que les 10 premiers films. Puis tester.

grunt>movies_lim = LIMIT movies 10;

grunt>DUMP movies_lim;

FILTER
A titre d’exemple, filtrons le flux de données pour ne retenir que les films dont la sortie en
salle est entre 1950 et 1960

grunt> movies_between_50_60 = FILTER movies by year>1950 and year<1960;

Tester

grunt> DUMP movies_between_50_60 ;

GROUP BY Regrouper les données
L’opérateur group permet de regrouper des enregistrements partageant une donnée en
commun, les mettant ainsi en relation.

Grouper les données par date.

grunt> movies_grp_date = GROUP movies BY year;

Nous pouvons voir la structure du regroupement avec DESCRIBE ;

DESCRIBE

grunt> DESCRIBE movies_grp_date ;

FOREACH … GENERATE
L’utilisation de l’expression foreach / generate permet de réaliser une projection, c’est-à-dire
un réarrangement du flux de données.

Lister le nom et la durée des films

grunt> movie_duration = FOREACH movies GENERATE name, (double)(duration/60);

Vérifier avec la commande DUMP.

grunt> DUMP movie_duration ;

ORDER BY

Trier et lister les films suivant l’année (year) ordre=ascendant.

grunt> desc_movies_by_year = ORDER movies BY year ASC;

grunt> DUMP desc_movies_by_year;

Vous aimerez peut-être aussi

Semaine6 Normal
Document14 pages
Semaine6 Normal
Sidi Ali
Pas encore d'évaluation
TD 9 Vue Index Corrige
Document3 pages
TD 9 Vue Index Corrige
Dorra Chakroun
Pas encore d'évaluation
TD9VueIndexCorrige 2
Document3 pages
TD9VueIndexCorrige 2
Manar Jalled
Pas encore d'évaluation
Bases de Données TD: Vue Et Index: Exercice 1: Vues Sur Le Cinéma
Document2 pages
Bases de Données TD: Vue Et Index: Exercice 1: Vues Sur Le Cinéma
GEEKGHAZI
Pas encore d'évaluation
Configuration Réseau Avec Netplan Et Changement Du Nom Sur Ubuntu
Document6 pages
Configuration Réseau Avec Netplan Et Changement Du Nom Sur Ubuntu
Asmae Benkhayi
Pas encore d'évaluation
Pig TP
Document5 pages
Pig TP
rad
Pas encore d'évaluation
TP Scala
Document2 pages
TP Scala
fafa
Pas encore d'évaluation
ABDOUL MOUMINI Harouna (TP 2)
Document9 pages
ABDOUL MOUMINI Harouna (TP 2)
Abdoul Lepropre
Pas encore d'évaluation
Abdoul Moumini Harouna (TP 2)
Document9 pages
Abdoul Moumini Harouna (TP 2)
Abdoul Lepropre
Pas encore d'évaluation
TP5 XML 2020
Document3 pages
TP5 XML 2020
Imane Abkadri
Pas encore d'évaluation
D 2010 Dbexpressfirebird
Document18 pages
D 2010 Dbexpressfirebird
mohjava
Pas encore d'évaluation
09-Xuat-Nhap Du Lieu
Document10 pages
09-Xuat-Nhap Du Lieu
21020279 Trần Diệu Anh
Pas encore d'évaluation
TdSQLCorrection PDF
Document2 pages
TdSQLCorrection PDF
Hamza Rahali
Pas encore d'évaluation
Le Flashback Query Sous Oracle 9i
Document10 pages
Le Flashback Query Sous Oracle 9i
Alain Massie
Pas encore d'évaluation
TD SQL - Corrige (BD-Films)
Document15 pages
TD SQL - Corrige (BD-Films)
Felix Mwaka
Pas encore d'évaluation
Chap 6
Document12 pages
Chap 6
makitata
Pas encore d'évaluation
Zimbra Samba Openvpn Manuel de Deploiement
Document20 pages
Zimbra Samba Openvpn Manuel de Deploiement
Yv Peg
Pas encore d'évaluation
Ateliers Oracle-DBA
Document5 pages
Ateliers Oracle-DBA
OUMAIMA BAHAFID
Pas encore d'évaluation
Gestion Mémoire Avec PostgreSQL
Document12 pages
Gestion Mémoire Avec PostgreSQL
Moïse Kouadio
Pas encore d'évaluation
Clonezilla Serveur
Document12 pages
Clonezilla Serveur
hornet76
Pas encore d'évaluation
Procédure GLPI
Document13 pages
Procédure GLPI
Ghoual Mohamed
Pas encore d'évaluation
TP Optimiseur
Document3 pages
TP Optimiseur
Salma Amirach
Pas encore d'évaluation
CMD Mvs
Document10 pages
CMD Mvs
Waly Diom
Pas encore d'évaluation
SPFILE - INITORA - Utilisation Sous Oracle 9i
Document9 pages
SPFILE - INITORA - Utilisation Sous Oracle 9i
ericazur
Pas encore d'évaluation
SYMANTEC GHOST en Réseau PDF
Document22 pages
SYMANTEC GHOST en Réseau PDF
Fouad Boutat
100% (1)
Installation Bind Sous Linux
Document6 pages
Installation Bind Sous Linux
oumaima deroui
Pas encore d'évaluation
BonessoJ Rapport Asterisk
Document14 pages
BonessoJ Rapport Asterisk
MrCassoulet93
Pas encore d'évaluation
TP PIG Hadoop
Document3 pages
TP PIG Hadoop
Chouchen Nizar
Pas encore d'évaluation
Chaki
Document1 page
Chaki
ayoubnajjad3
Pas encore d'évaluation
SUN - Configuration - Parametrage - Explorer
Document2 pages
SUN - Configuration - Parametrage - Explorer
Tanishsadan A
Pas encore d'évaluation
Lif4 td10 Correction
Document3 pages
Lif4 td10 Correction
YOUNES MOUSTAQUIM
Pas encore d'évaluation
Résume Linux
Document11 pages
Résume Linux
Kacim Yazin
Pas encore d'évaluation
TP - DFSR
Document6 pages
TP - DFSR
hugodx
Pas encore d'évaluation
TP2 Pig
Document4 pages
TP2 Pig
Bechir Mathlouthi
Pas encore d'évaluation
Ghost en Réseau
Document22 pages
Ghost en Réseau
ClubTutorielInformatique
100% (1)
Résume Linux (REDHAT)
Document11 pages
Résume Linux (REDHAT)
nabilaelkaoutari286
Pas encore d'évaluation
Administration Réseau Sous Linux Linux: Prof: Zytoune
Document32 pages
Administration Réseau Sous Linux Linux: Prof: Zytoune
AMINE HABIBALLAH
Pas encore d'évaluation
3-OrA File CTL Pfile
Document20 pages
3-OrA File CTL Pfile
Youness Bakache
Pas encore d'évaluation
CM5-SQL-requeÌ Te-Avancee (Correction) 2023
Document39 pages
CM5-SQL-requeÌ Te-Avancee (Correction) 2023
Guichel Mouanou
Pas encore d'évaluation
Configuration Du Serveur DNS
Document5 pages
Configuration Du Serveur DNS
elhadjpedre mbodj
Pas encore d'évaluation
TD4 TP4 Xpath - Xquery
Document2 pages
TD4 TP4 Xpath - Xquery
IT'ss Mę
Pas encore d'évaluation
1 - Rappel Sur Les Structure
Document15 pages
1 - Rappel Sur Les Structure
sanaa.ait
Pas encore d'évaluation
200 Suivi Des Performances CentOS 7 Avec Collectd Influxdb Grafana
Document9 pages
200 Suivi Des Performances CentOS 7 Avec Collectd Influxdb Grafana
mormorromrom
Pas encore d'évaluation
TP 2 DNS
Document8 pages
TP 2 DNS
h22381043
Pas encore d'évaluation
Linux Resume
Document5 pages
Linux Resume
Zach II
Pas encore d'évaluation
Résumé Linux
Document10 pages
Résumé Linux
El Amrani Laila
Pas encore d'évaluation
Utilisation de Gammu Avec Avec Une Base PDF
Document7 pages
Utilisation de Gammu Avec Avec Une Base PDF
george duc
Pas encore d'évaluation
Installation Cast 3 M
Document6 pages
Installation Cast 3 M
Hammou Morsli
Pas encore d'évaluation
Résumé LINUX
Document103 pages
Résumé LINUX
Driss Zouita
100% (2)
Installation de Samba Sous Centos 5
Document4 pages
Installation de Samba Sous Centos 5
Kmahassine8686
Pas encore d'évaluation
Nouveau Document Texte
Document3 pages
Nouveau Document Texte
Youness Achoulitt
Pas encore d'évaluation
Configuration de DNS Sous Centos PDF
Document22 pages
Configuration de DNS Sous Centos PDF
marboy
100% (3)
TP 1 SOA
Document3 pages
TP 1 SOA
yosra mahjoub
Pas encore d'évaluation
CC GL3 Bases Donnees Distribuees
Document29 pages
CC GL3 Bases Donnees Distribuees
Anicet Krenna
Pas encore d'évaluation
Apprenez À Utiliser IpTable, Le Meilleur Firewall Sous Linux
Document5 pages
Apprenez À Utiliser IpTable, Le Meilleur Firewall Sous Linux
Dago Bilton
Pas encore d'évaluation
Linux Ts4 Final
Document1 page
Linux Ts4 Final
Youssef Tv
Pas encore d'évaluation
Expose Linux Configuration Serveur
Document11 pages
Expose Linux Configuration Serveur
ududewu
Pas encore d'évaluation
Ubuntu Server 10.04
D'Everand
Ubuntu Server 10.04
MARTIN Pierre-Jean
Pas encore d'évaluation