Bienvenue sur Scribd !

Ignorer le carrousel

Pig Programming - Create Your First Apache Pig Script - Edureka PDF

Transféré par

ratneshkumarg

0% ont trouvé ce document utile (0 vote)

73 vues5 pages

Titre original

Pig Programming | Create Your First Apache Pig Script | Edureka.pdf

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

73 vues5 pages

Pig Programming - Create Your First Apache Pig Script - Edureka PDF

Transféré par

ratneshkumarg

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 5

Rechercher à l'intérieur du document

Blog Home

COURSES »
Webinars
Blog »
Interview Questions

Pig Programming: Create Your First Apache

Pig Script
November 6, 2013 | Big Data and Hadoop

As is the case with scripts in other programming languages such as SQL, Unix Shell, etc., Pig scripts
are used to execute a set of Apache Pig commands collectively. This helps in reducing the time and
effort invested in writing and executing each command manually while doing the Pig
programming. This blog (Pig Programming: Create Your First Apache Pig script) is a step by step
guide to help you create your first Apache Pig script.

Pig Programming: Create Your First Apache Pig Script

An Apache Pig script works in two modes:

Local Mode: In ‘local mode’, you can execute the pig script in local file system. In this case you
don’t need to store the data in Hadoop HDFS file system, instead you can work with the data stored
in local file system itself.
HDFS Mode: In ‘HDFS mode’, the data needs to be stored in HDFS file system and you can process
the data with the help of pig script.

Pig Script in HDFS Mode:

Step1: Writing a script

Open an editor (e.g. gedit) in your Cloudera Demo VM environment:

Command: gedit sample.pig

This command will create a ‘sample.pig’ file inside the home directory of cloudera user.

Let’s write few PIG commands in the sample script.

Let us say our task is to read data from a data file and to display the required contents on the as
output.

The sample data file contains following data:

Shabbir Khan 9314573259 Bangalore Engineer

Manish Sharma 8882148796 Gurgaon Lecturer

Mahesh Kumar 8521548932 Noida Business

Sampath Reddy 8547987412 Hyderabad Engineer

Mohan Reddy 9256458798 Hyderabad Professor

Save the text file with the name ‘information.txt’

The sample data file contains five columns FirstName, LastName, MobileNo,

City, and Profession separated by tab key. Our task is to read the content of this file in to HDFS and
display First Name, Mobile Number and Profession of these contacts.

To process this data using Pig, this file should be present in Apache Hadoop HDFS.
Use the following command:

Command: hadoop dfs –copyFromLocal information.txt hdfs:/

Edit the Pig script (sample.pig) to include following commands:

A = LOAD ‘/information.txt’ using PigStorage (‘\t’) as (FName: chararray, LName: chararray,

MobileNo: chararray, City: chararray, Profession: chararray);

B = FOREACH A generate FName, MobileNo, Profession;

DUMP B;

Save and close the file.

The first command loads the file ‘information.txt’ into variable A with indirect schema (FName,
LName, MobileNo, City, Profession).
The second command loads the required data from variable A to variable B.
The third line displays the content of variable B on the terminal/console.

Step 2: Execute the Pig Script

To execute the pig script in HDFS mode, run the following command:
Command: pig sample.pig

Review the result.

Congratulations on executing your first Pig script successfully!

Got a question for us? Mention them in the comments section and we will get back to you.

Big Data Challenges

Why BI professionals need to be skilled in Hadoop

About Shabir Khan (3 Posts)

Like 46 Tweet 10 5

Vous aimerez peut-être aussi

Introduction to Apache Pig - Represent Big Data Flows
Document58 pages
Introduction to Apache Pig - Represent Big Data Flows
Durga Bisht
Pas encore d'évaluation
BigData Module 2
Document18 pages
BigData Module 2
Sushmith Shettigar
Pas encore d'évaluation
Big Data File
Document16 pages
Big Data File
Arnav Shrivastava
Pas encore d'évaluation
Bda Lab Manual_ (2)
Document20 pages
Bda Lab Manual_ (2)
RAKSHIT AYACHIT
Pas encore d'évaluation
Demonstration: Understanding Pig: HDP Developer: Apache Pig and Hive
Document26 pages
Demonstration: Understanding Pig: HDP Developer: Apache Pig and Hive
NIKITA TAYAL
Pas encore d'évaluation
Linux Basic Commands
Document34 pages
Linux Basic Commands
Brasil Terraplanista
Pas encore d'évaluation
Basic Pig Commands
Document9 pages
Basic Pig Commands
Aman Jain
Pas encore d'évaluation
Big Data Analytics Lab compendium overview
Document6 pages
Big Data Analytics Lab compendium overview
KiS Mint
Pas encore d'évaluation
Big Data Manual Ai
Document33 pages
Big Data Manual Ai
smitcse2021
Pas encore d'évaluation
Pig Slides
Document46 pages
Pig Slides
Sreedhar Arikatla
Pas encore d'évaluation
Program No 13
Document3 pages
Program No 13
Harshit Rajput
Pas encore d'évaluation
BDALab Assn5
Document16 pages
BDALab Assn5
Deepti Agrawal
Pas encore d'évaluation
Hadoop Administrator Training - Lab Hand Book
Document12 pages
Hadoop Administrator Training - Lab Hand Book
debkrc
Pas encore d'évaluation
Big Data Analytics: Essential Hadoop Tools
Document41 pages
Big Data Analytics: Essential Hadoop Tools
VISHNU
Pas encore d'évaluation
BDA Lab Manual-1
Document60 pages
BDA Lab Manual-1
pavan chittala
Pas encore d'évaluation
Unit 4
Document5 pages
Unit 4
Prince Rathore
Pas encore d'évaluation
Pig Latin Makes Hadoop Easier with Simple Data Flows
Document9 pages
Pig Latin Makes Hadoop Easier with Simple Data Flows
Devi Kondaveti
Pas encore d'évaluation
Introduction to Hadoop Big Data Analysis Workshop
Document22 pages
Introduction to Hadoop Big Data Analysis Workshop
Sahera Shabnam
Pas encore d'évaluation
Big Data & Analytics Lab Manual
Document51 pages
Big Data & Analytics Lab Manual
Sathish
Pas encore d'évaluation
BigData Module 2
Document41 pages
BigData Module 2
R SANJAY CS
Pas encore d'évaluation
Pig Full Lecture
Document38 pages
Pig Full Lecture
Atharv Chaudhari
Pas encore d'évaluation
Big Data Analytics Unit 4
Document83 pages
Big Data Analytics Unit 4
18-1211 Apoorva Gangyada
Pas encore d'évaluation
Integration of Python With Hadoop and Spark
Document10 pages
Integration of Python With Hadoop and Spark
Ramon Vargas Montañes
Pas encore d'évaluation
Trắc Nghiệm Big data
Document69 pages
Trắc Nghiệm Big data
Minh
Pas encore d'évaluation
Unit IV - Big Data Programming
Document17 pages
Unit IV - Big Data Programming
jasmine
Pas encore d'évaluation
Pig, Grunt, Hive: Presented By:Akila 20Spcs01
Document16 pages
Pig, Grunt, Hive: Presented By:Akila 20Spcs01
Tech Talk Paper Presentation
Pas encore d'évaluation
Big Data
Document17 pages
Big Data
gtfhbmnvh
Pas encore d'évaluation
Setting up Hadoop in Standalone, Pseudo and Fully Distributed Modes
Document15 pages
Setting up Hadoop in Standalone, Pseudo and Fully Distributed Modes
ZEESHAN KHAN
Pas encore d'évaluation
Pig Latin Modes
Document3 pages
Pig Latin Modes
yohetad
Pas encore d'évaluation
UNIT 5 Notes by ARUN JHAPATE
Document21 pages
UNIT 5 Notes by ARUN JHAPATE
Ankit “अंकित मौर्य” Mourya
Pas encore d'évaluation
Pig Tutorial
Document22 pages
Pig Tutorial
vishnu
Pas encore d'évaluation
Pig Tutorial PDF
Document22 pages
Pig Tutorial PDF
vishnu
Pas encore d'évaluation
Lab Chapter 10 Use RDDs
Document4 pages
Lab Chapter 10 Use RDDs
Nicolas Valbuena
0% (1)
UNIT IV PART - 2
Document59 pages
UNIT IV PART - 2
Nithya Naraparaju
Pas encore d'évaluation
Big Data Analytics With Hadoop and Apache Spark
Document17 pages
Big Data Analytics With Hadoop and Apache Spark
Fernando Andrés Hinojosa Villarreal
Pas encore d'évaluation
L Hadoop 1 PDF
Document12 pages
L Hadoop 1 PDF
Dao Van Hang
Pas encore d'évaluation
Lab 5: Mini-Project: /etc/init.d/apache2 Restart
Document2 pages
Lab 5: Mini-Project: /etc/init.d/apache2 Restart
Mohammed Ali
Pas encore d'évaluation
Unit No. 8
Document24 pages
Unit No. 8
vishal phule
Pas encore d'évaluation
EX. NO Date Program NO Sign
Document80 pages
EX. NO Date Program NO Sign
Dheepa
Pas encore d'évaluation
L Apachepigdataquery PDF
Document10 pages
L Apachepigdataquery PDF
savio77
Pas encore d'évaluation
Apache Pig: For Live Hadoop Training, Please See Courses
Document25 pages
Apache Pig: For Live Hadoop Training, Please See Courses
Almase
Pas encore d'évaluation
Setting-up HDFS Cluster
Document3 pages
Setting-up HDFS Cluster
Roberto Martinez
Pas encore d'évaluation
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
Document11 pages
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
saiconze
Pas encore d'évaluation
How To Set Up A Hadoop Cluster in Docker
Document13 pages
How To Set Up A Hadoop Cluster in Docker
NP Neupane
Pas encore d'évaluation
BDT Lab Manual
Document48 pages
BDT Lab Manual
Vishnu Vardhan H
Pas encore d'évaluation
Tpi Lab Python Eng
Document22 pages
Tpi Lab Python Eng
Vlad Manole
Pas encore d'évaluation
04 Hadoop Setup 05 CLI 06 Running MapRed-1
Document42 pages
04 Hadoop Setup 05 CLI 06 Running MapRed-1
Manjula Annamalai
Pas encore d'évaluation
5 PIG Big Data Analytics Final Year
Document25 pages
5 PIG Big Data Analytics Final Year
RISHIKA ARORA
Pas encore d'évaluation
DAN Lab ManuaL
Document53 pages
DAN Lab ManuaL
SARANYA A
Pas encore d'évaluation
1) Discuss The Design of Hadoop Distributed File System (HDFS) and Concept in Detail
Document11 pages
1) Discuss The Design of Hadoop Distributed File System (HDFS) and Concept in Detail
Mudit Kumar
Pas encore d'évaluation
Pig
Document12 pages
Pig
ysakhare94
Pas encore d'évaluation
Hadoop Pig
Document111 pages
Hadoop Pig
Jhumri Talaiya
Pas encore d'évaluation
Hadoop File Complte
Document18 pages
Hadoop File Complte
rashant
Pas encore d'évaluation
Tutorial MapReduce
Document13 pages
Tutorial MapReduce
pavan2711
Pas encore d'évaluation
Cherry Py
Document10 pages
Cherry Py
elbrakbanse17
Pas encore d'évaluation
Docker images on a diet: optimize size with Alpine Linux
Document17 pages
Docker images on a diet: optimize size with Alpine Linux
Shirouit
Pas encore d'évaluation
RPM File Extraction and Storage Configuration
Document62 pages
RPM File Extraction and Storage Configuration
Isha Tripathi
Pas encore d'évaluation
210968244 - BDA - Week04_10
Document41 pages
210968244 - BDA - Week04_10
Aditya Raj
Pas encore d'évaluation
Living with Linux in the Industrial World
D'Everand
Living with Linux in the Industrial World
Elaiya Iswera Lallan
Pas encore d'évaluation
Hadoop in Action
D'Everand
Hadoop in Action
Chuck Lam
Pas encore d'évaluation
Informatica Selftestengine PR000041 v2015-03-19 by Carmelo 70q PDF
Document23 pages
Informatica Selftestengine PR000041 v2015-03-19 by Carmelo 70q PDF
ratneshkumarg
Pas encore d'évaluation
C# Coding Standards and Naming Conventions
Document12 pages
C# Coding Standards and Naming Conventions
ratneshkumarg
100% (1)
CramPDF - Leading Exam Cram PDF Provider
Document12 pages
CramPDF - Leading Exam Cram PDF Provider
ratneshkumarg
Pas encore d'évaluation
Read Property File
Document12 pages
Read Property File
ratneshkumarg
Pas encore d'évaluation
Pig Programming: Create Your First Apache Pig Script
Document5 pages
Pig Programming: Create Your First Apache Pig Script
ratneshkumarg
Pas encore d'évaluation
Practise Quiz Ccd-410 Exam (02-2014) - Cloudera Quiz Learning
Document50 pages
Practise Quiz Ccd-410 Exam (02-2014) - Cloudera Quiz Learning
ratneshkumarg
Pas encore d'évaluation
Access hundreds of terabytes with HBase
Document44 pages
Access hundreds of terabytes with HBase
ratneshkumarg
Pas encore d'évaluation
Practise Quiz Ccd-470 Exam (05-2014) - Cloudera Quiz Learning
Document74 pages
Practise Quiz Ccd-470 Exam (05-2014) - Cloudera Quiz Learning
ratneshkumarg
Pas encore d'évaluation
A Natural Tutorial: Adabas and Natural Developer Community
Document28 pages
A Natural Tutorial: Adabas and Natural Developer Community
Leandro Gabriel López
Pas encore d'évaluation
JAVA Certification
Document248 pages
JAVA Certification
tnvraman
100% (6)
Quiz On ArrayLists and Iterators
Document6 pages
Quiz On ArrayLists and Iterators
ratneshkumarg
Pas encore d'évaluation
Hadoop MapReduce
Document7 pages
Hadoop MapReduce
ratneshkumarg
Pas encore d'évaluation
SCJP Mock Exam For Overriding & Overloading - Nikos' Java Blog
Document26 pages
SCJP Mock Exam For Overriding & Overloading - Nikos' Java Blog
ratneshkumarg
Pas encore d'évaluation
Hadoop Interview Questions For HDFS - Edureka
Document15 pages
Hadoop Interview Questions For HDFS - Edureka
ratneshkumarg
Pas encore d'évaluation
17 Java Overview Interview Questions and Answers PDF
Document13 pages
17 Java Overview Interview Questions and Answers PDF
ratneshkumarg
Pas encore d'évaluation
Java Programmer Certification
Document59 pages
Java Programmer Certification
api-27399718
Pas encore d'évaluation
Java Enums
Document11 pages
Java Enums
ratneshkumarg
Pas encore d'évaluation
OLTP Vs OLAP
Document3 pages
OLTP Vs OLAP
Sai Lakshmi
Pas encore d'évaluation
SCJP Potential Trips-N-Traps
Document2 pages
SCJP Potential Trips-N-Traps
amit.thechosen1
100% (3)
Cloudera Certification Dump - 410-Anil
Document49 pages
Cloudera Certification Dump - 410-Anil
sp40694
100% (3)
Vmware Serials
Document1 page
Vmware Serials
ratneshkumarg
Pas encore d'évaluation
OLTP Vs OLAP
Document3 pages
OLTP Vs OLAP
Sai Lakshmi
Pas encore d'évaluation
Spark RDD Dataframes SQL
Document3 pages
Spark RDD Dataframes SQL
leongladxton
Pas encore d'évaluation
Active Directory Services: Workgroup vs Domain Models
Document11 pages
Active Directory Services: Workgroup vs Domain Models
hclraj406
Pas encore d'évaluation
73 MySQL
Document3 pages
73 MySQL
Vinicius Monteiro Tito
Pas encore d'évaluation
SQL DB Toc Fromms02
Document159 pages
SQL DB Toc Fromms02
Pipe Castillo
Pas encore d'évaluation
Important Trace Flags For SQL DBA
Document1 page
Important Trace Flags For SQL DBA
Nageswara Reddy
Pas encore d'évaluation
File Management: Lesson 6
Document3 pages
File Management: Lesson 6
Erlene Linsangan
Pas encore d'évaluation
BDSCP Module 08 Mindmap
Document1 page
BDSCP Module 08 Mindmap
pietropes
Pas encore d'évaluation
Dhruti Contractor - Resume
Document2 pages
Dhruti Contractor - Resume
Andy Patel
Pas encore d'évaluation
Make HQ Combo
Document10 pages
Make HQ Combo
kalisi balkisi
Pas encore d'évaluation
Improving Efficiency of Apriori Algorithm Using Transaction Reduction
Document4 pages
Improving Efficiency of Apriori Algorithm Using Transaction Reduction
Arun Mozhi
Pas encore d'évaluation
Install LogChief 2.2 Guide
Document22 pages
Install LogChief 2.2 Guide
El Zurdo Obregon
Pas encore d'évaluation
2546 10997 1 PB
Document7 pages
2546 10997 1 PB
Putri Santika
Pas encore d'évaluation
WMB Using Ant
Document14 pages
WMB Using Ant
Marcel An
Pas encore d'évaluation
Forensics 1
Document49 pages
Forensics 1
Pranjal Bagrecha
Pas encore d'évaluation
Data and Metadata
Document6 pages
Data and Metadata
gkrkrk
Pas encore d'évaluation
Cluster Analysis of Customer Spending Data
Document4 pages
Cluster Analysis of Customer Spending Data
Visalakshi Venkat
Pas encore d'évaluation
Exam AZ-305 Title Designing Microsoft Azure Infrastructure Solutions (Beta) 1.0 Product Type 59 Q&A With Explanations
Document64 pages
Exam AZ-305 Title Designing Microsoft Azure Infrastructure Solutions (Beta) 1.0 Product Type 59 Q&A With Explanations
MD. Ruhul Amin
Pas encore d'évaluation
Unit-I Directory Commands 1. The PWD Command
Document19 pages
Unit-I Directory Commands 1. The PWD Command
ninadchandekar
100% (1)
Lumangbayan Dec
Document99 pages
Lumangbayan Dec
Angelika Calingasan
Pas encore d'évaluation
Exchange Database Defragmentation Process
Document14 pages
Exchange Database Defragmentation Process
mailforasif
Pas encore d'évaluation
Ebook: Data Visualization Tools For Users (English)
Document26 pages
Ebook: Data Visualization Tools For Users (English)
BBVA Innovation Center
Pas encore d'évaluation
Install and Configure Spacewalk Satellite Server on CentOS 5 40/40
Document3 pages
Install and Configure Spacewalk Satellite Server on CentOS 5 40/40
ne0oh
Pas encore d'évaluation
Linux Commands
Document25 pages
Linux Commands
shubham
Pas encore d'évaluation
Database Administrator (DBA) roles and responsibilities
Document9 pages
Database Administrator (DBA) roles and responsibilities
Rushikesh Maid
Pas encore d'évaluation
Envestnet Yodlee Interview Experience
Document3 pages
Envestnet Yodlee Interview Experience
Pranava Pranu
Pas encore d'évaluation
EXECUTE IMMEDIATE Option For Dynamic SQL and PL PDF
Document5 pages
EXECUTE IMMEDIATE Option For Dynamic SQL and PL PDF
julio25c
Pas encore d'évaluation
EN CDSFIN Syllabus V1.0
Document7 pages
EN CDSFIN Syllabus V1.0
Daniel Aasa
Pas encore d'évaluation
16 S
Document8 pages
16 S
Pratyush
Pas encore d'évaluation
Data Mining An Overview From A Database Perspective
Document18 pages
Data Mining An Overview From A Database Perspective
Thanish Rao
Pas encore d'évaluation