0% found this document useful (0 votes)

12 views6 pages

Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description

Uploaded by

bodanaji5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views6 pages

Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description

Uploaded by

bodanaji5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

Practical-2

Aim: Write a program of Word Count in Map Reduce over HDFS.

Description:

MapReduce is a framework for processing large datasets using a large number of computers
(nodes), collectively referred to as a cluster. Processing can occur on data stored in a file
system (HDFS).A method for distributing computation across multiple nodes.Each node
processes the data that is stored at that node.

Consists of two main phases

Mapper Phase

Reduce phase

Input data set is split into independent blocks – processed in parallel. Each input split is
converted in Key Value pairs. Mapper logic processes each key value pair and produces and
intermediate key value pairs based on the implementation logic. Resultant key value pairs can
be of different type from that of input key value pairs. The output of Mapper is passed to the
reducer. Output of Mapper function is the input for Reducer. Reducer sorts the intermediate
key value pairs. Applies reducer logic upon the key value pairs and produces the output in
desired format.Output is stored in HDFS
Execution Step:

http://content.udacity-data.com/courses/ud617/Cloudera-Udacity-Training-VM-4.1.1.c.zip

Create the jar file of this program and name it wordcount.jar.

Run the jar file

hadoop fs –mkdir /input

hadoop fs –put /home/training/Desktop/sample.txt /input

hadoop jar /home/training/Desktop/wc.jar wordcount /input/sample.txt /output

Output:

hadoop fs –cat /output/part-00000

Word Count Java Program

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.FileInputFormat;

import org.apache.hadoop.mapred.FileOutputFormat;

import org.apache.hadoop.mapred.JobClient;

import org.apache.hadoop.mapred.JobConf;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

public class wordcount extends Configured implements Tool {

@Override
public int run(String[] args) throws Exception {

if(args.length<2)

System.out.println("Plz Give Input Output Directory Correctly");

return -1;

JobConf conf = new JobConf(wordcount.class);

FileInputFormat.setInputPaths(conf,new Path(args[0]));

FileOutputFormat.setOutputPath(conf, new Path(args[1]));

conf.setMapperClass(wordmapper.class);

conf.setReducerClass(wordreducer.class);

conf.setMapOutputKeyClass(Text.class);

conf.setMapOutputValueClass(IntWritable.class);

conf.setOutputKeyClass(Text.class);

conf.setOutputValueClass(IntWritable.class);

JobClient.runJob(conf);

return 0;

public static void main(String args[]) throws Exception

int exitcode = ToolRunner.run(new wordcount(), args);

System.exit(exitcode);

}
import java.io.IOException;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.MapReduceBase;

import org.apache.hadoop.mapred.Mapper;

import org.apache.hadoop.mapred.OutputCollector;

import org.apache.hadoop.mapred.Reporter;

public class wordmapper extends MapReduceBase implements

Mapper<LongWritable,Text,Text,IntWritable>

public void map(LongWritable key, Text value,

OutputCollector<Text, IntWritable> output, Reporter r)

throws IOException {

String s =value.toString();

for(String word:s.split(" "))

if(word.length()>0)

output.collect(new Text(word), new IntWritable(1));

}
}

import java.io.IOException;

import java.util.Iterator;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.MapReduceBase;

import org.apache.hadoop.mapred.OutputCollector;

import org.apache.hadoop.mapred.Reducer;

import org.apache.hadoop.mapred.Reporter;

public class wordreducer extends MapReduceBase implements

Reducer<Text,IntWritable,Text,IntWritable>

public void reduce(Text key, Iterator<IntWritable> values,

OutputCollector<Text, IntWritable> output, Reporter r)

throws IOException {

int count=0;

while(values.hasNext())
{

IntWritable i= values.next();

count+= i.get();

output.collect(key, new IntWritable(count));

Advanced Mapreduce
No ratings yet
Advanced Mapreduce
37 pages
Practical 2-1
No ratings yet
Practical 2-1
4 pages
Pandas Python For Data Science
100% (1)
Pandas Python For Data Science
1 page
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
No ratings yet
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
9 pages
CS702 Big Data Programs
No ratings yet
CS702 Big Data Programs
58 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Word Count (2021)
No ratings yet
Word Count (2021)
50 pages
Map Reduce
No ratings yet
Map Reduce
57 pages
BDF Programs
No ratings yet
BDF Programs
32 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
M3R5 Python Notes
No ratings yet
M3R5 Python Notes
142 pages
Ravikant Hadoop File
No ratings yet
Ravikant Hadoop File
22 pages
Unit IV Programming Model
No ratings yet
Unit IV Programming Model
30 pages
DSBDA GRP B Print
No ratings yet
DSBDA GRP B Print
21 pages
53 Human Resource Management System
No ratings yet
53 Human Resource Management System
35 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
Hadoop and Map Reduce
No ratings yet
Hadoop and Map Reduce
27 pages
Dsbda 11
No ratings yet
Dsbda 11
15 pages
3 MapReduce Program Ex Code
No ratings yet
3 MapReduce Program Ex Code
14 pages
Engineering - Ebook - PDF - Matlab Programming
No ratings yet
Engineering - Ebook - PDF - Matlab Programming
283 pages
Basic Concepts of Oop
No ratings yet
Basic Concepts of Oop
18 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
Word Count
No ratings yet
Word Count
10 pages
Bda Experiment No2
No ratings yet
Bda Experiment No2
12 pages
Lab3 BigData-MapReduce
No ratings yet
Lab3 BigData-MapReduce
8 pages
Bda Exp2 Chinmay
No ratings yet
Bda Exp2 Chinmay
7 pages
B1 Instructions
No ratings yet
B1 Instructions
9 pages
CLAD Sample Exam-1
No ratings yet
CLAD Sample Exam-1
18 pages
BDA3
No ratings yet
BDA3
7 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
MapReduce Programs
No ratings yet
MapReduce Programs
10 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
Practical 3bcbs
No ratings yet
Practical 3bcbs
5 pages
Mapreduce Programming Framework
No ratings yet
Mapreduce Programming Framework
23 pages
Experiment 3
No ratings yet
Experiment 3
5 pages
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
No ratings yet
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
5 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
Exp 11
No ratings yet
Exp 11
4 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
21CS43 Module 5 Microcontroller and Embedded Systems Prof VANARASAN
No ratings yet
21CS43 Module 5 Microcontroller and Embedded Systems Prof VANARASAN
41 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
WordCount Program Hadoop Task 2
No ratings yet
WordCount Program Hadoop Task 2
7 pages
Palak
No ratings yet
Palak
10 pages
Ex No 04
No ratings yet
Ex No 04
4 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
Developing A Simple Map-Reduce Program For Hadoop: Big Data Course CS6350 Professor: Dr. Latifur Khan
No ratings yet
Developing A Simple Map-Reduce Program For Hadoop: Big Data Course CS6350 Professor: Dr. Latifur Khan
22 pages
Experiment 6 BDA
No ratings yet
Experiment 6 BDA
4 pages
PART 1 - Install Java and Hadoop On Ubuntu
No ratings yet
PART 1 - Install Java and Hadoop On Ubuntu
4 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
5 pages
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
No ratings yet
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
13 pages
Source Code For Wordcount
No ratings yet
Source Code For Wordcount
3 pages
Wordcount
No ratings yet
Wordcount
3 pages
Big Data 4 Vivek
No ratings yet
Big Data 4 Vivek
3 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
Nginx Modules Reference r6
No ratings yet
Nginx Modules Reference r6
331 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
Assignment 11 DSBDA
No ratings yet
Assignment 11 DSBDA
4 pages
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
Example - (Map Function in Word Count)
No ratings yet
Example - (Map Function in Word Count)
6 pages
MapReduce Enhanced Guide
No ratings yet
MapReduce Enhanced Guide
3 pages
Lab2 WC
No ratings yet
Lab2 WC
2 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
Prerequisites: Single Node Setup Cluster Setup
No ratings yet
Prerequisites: Single Node Setup Cluster Setup
5 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
579 BDA Week-04
No ratings yet
579 BDA Week-04
1 page
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Introduction To Angular
No ratings yet
Introduction To Angular
42 pages
Assignment-1 Bda Student
100% (1)
Assignment-1 Bda Student
2 pages
Web Question Bank
No ratings yet
Web Question Bank
6 pages
Data Science Fir Civil Engineering Unit 1 Notes and Assignments
No ratings yet
Data Science Fir Civil Engineering Unit 1 Notes and Assignments
29 pages
Software Engineering - 1
No ratings yet
Software Engineering - 1
13 pages
Complete All The Tasks As Per The Instructions Given. All The Programming Solutions Must Contain The Output Screen Shots of The Programs
No ratings yet
Complete All The Tasks As Per The Instructions Given. All The Programming Solutions Must Contain The Output Screen Shots of The Programs
14 pages
Bda 3
No ratings yet
Bda 3
70 pages
Heap Data Structure: Zahoor Jan
No ratings yet
Heap Data Structure: Zahoor Jan
38 pages
EE3206 Java Programming and Applications: Lecture 4. Object-Oriented Programming (Classes, Objects, Inheritance)
No ratings yet
EE3206 Java Programming and Applications: Lecture 4. Object-Oriented Programming (Classes, Objects, Inheritance)
89 pages
Unit-2 Functions (E-Next - In)
No ratings yet
Unit-2 Functions (E-Next - In)
40 pages
Coding and Programming-Introduction
No ratings yet
Coding and Programming-Introduction
4 pages
INS - Assignment - 2 & 3 - Very Important Questions
No ratings yet
INS - Assignment - 2 & 3 - Very Important Questions
1 page
Unit Ii: Inheritance, Packages and Interfaces
No ratings yet
Unit Ii: Inheritance, Packages and Interfaces
26 pages
BC 414 - Programming Database Changes Complee
No ratings yet
BC 414 - Programming Database Changes Complee
80 pages
SQL Tutorial
No ratings yet
SQL Tutorial
6 pages
IMP Questions PDF in Big Data
No ratings yet
IMP Questions PDF in Big Data
15 pages
Amer Filesys
No ratings yet
Amer Filesys
57 pages
Testbench For Full Adder in Verilog: Timescale 1ns / 1ps
No ratings yet
Testbench For Full Adder in Verilog: Timescale 1ns / 1ps
5 pages
Design and Analysis of Algorithm - Webview
No ratings yet
Design and Analysis of Algorithm - Webview
10 pages
Python
No ratings yet
Python
7 pages
Python Revision Tour 1
No ratings yet
Python Revision Tour 1
3 pages
Programming Assignment7
No ratings yet
Programming Assignment7
4 pages
How To Write Shared Libraries
No ratings yet
How To Write Shared Libraries
0 pages
Practical 6
No ratings yet
Practical 6
4 pages
(NS) NodePosition
No ratings yet
(NS) NodePosition
6 pages
Readme
No ratings yet
Readme
3 pages
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
3/5 (4)

Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description

Uploaded by

Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description

Uploaded by

Practical-2

Aim: Write a program of Word Count in Map Reduce over HDFS.

Consists of two main phases

Create the jar file of this program and name it wordcount.jar.

Run the jar file

hadoop fs –mkdir /input

hadoop fs –put /home/training/Desktop/sample.txt /input

hadoop jar /home/training/Desktop/wc.jar wordcount /input/sample.txt /output

hadoop fs –cat /output/part-00000

Word Count Java Program

public class wordcount extends Configured implements Tool {

System.out.println("Plz Give Input Output Directory Correctly");

JobConf conf = new JobConf(wordcount.class);

FileOutputFormat.setOutputPath(conf, new Path(args[1]));

public static void main(String args[]) throws Exception

int exitcode = ToolRunner.run(new wordcount(), args);

public class wordmapper extends MapReduceBase implements

public void map(LongWritable key, Text value,

OutputCollector<Text, IntWritable> output, Reporter r)

for(String word:s.split(" "))

output.collect(new Text(word), new IntWritable(1));

public class wordreducer extends MapReduceBase implements

public void reduce(Text key, Iterator<IntWritable> values,

OutputCollector<Text, IntWritable> output, Reporter r)

output.collect(key, new IntWritable(count));

You might also like