Exp 4 Word Count

The document describes a MapReduce WordCount program that counts the number of occurrences of each word in a given text input. The MapReduce algorithm contains map and reduce tasks - the map task breaks down data into key-value pairs, and the reduce task combines the output of the map into smaller sets of pairs. The WordCount program implements mapper and reducer classes to count word frequencies, with the mapper emitting <word, 1> pairs and reducer summing the counts for each word.

Uploaded by

munish kumar agarwal

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

99 views4 pages

Exp 4 Word Count

Uploaded by

munish kumar agarwal

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Assignment 4

Objective: Run a basic Word Count Map Reduce program to understand Map Reduce Paradigm.
Description:
MapReduce is a processing technique and a program model for distributed computing based on
java. The MapReduce algorithm contains two important tasks, namely Map and Reduce. Map takes
a set of data and converts it into another set of data, where individual elements are broken down
into tuples (key/value pairs). Secondly, reduce task, which takes the output from a map as an input
and combines those data tuples into a smaller set of tuples. As the sequence of the name
MapReduce implies, the reduce task is always performed after the map job. WordCount is a simple
program that counts the number of occurrences of each word in a given text input set.
Program:
Mapper Class:
import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.Mapper;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reporter;

public class WCMapper extends MapReduceBase implements Mapper<LongWritable,

Text, Text, IntWritable> {
// Map function
public void map(LongWritable key, Text value, OutputCollector<Text,
IntWritable> output, Reporter rep) throws IOException
{

String line = value.toString();

// Splitting the line on spaces

for (String word : line.split(" "))
{
if (word.length() > 0)
{
output.collect(new Text(word), new IntWritable(1));
}
}
}
}
Reducer:
import java.io.IOException;
import java.util.Iterator;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reducer;
import org.apache.hadoop.mapred.Reporter;

public class WCReducer extends MapReduceBase implements Reducer<Text,

IntWritable, Text, IntWritable> {

// Reduce function
public void reduce(Text key, Iterator<IntWritable> value,
OutputCollector<Text, IntWritable> output,
Reporter rep) throws IOException
{

int count = 0;

// Counting the frequency of each words

while (value.hasNext())
{
IntWritable i = value.next();
count += i.get();
}

output.collect(key, new IntWritable(count));

}
}
Driver code:
import java.io.IOException;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.FileOutputFormat;
import org.apache.hadoop.mapred.JobClient;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

public class WCDriver extends Configured implements Tool {

public int run(String args[]) throws IOException

{
if (args.length < 2)
{
System.out.println("Please give valid inputs");
return -1;
}

JobConf conf = new JobConf(WCDriver.class);

FileInputFormat.setInputPaths(conf, new Path(args[0]));
FileOutputFormat.setOutputPath(conf, new Path(args[1]));
conf.setMapperClass(WCMapper.class);
conf.setReducerClass(WCReducer.class);
conf.setMapOutputKeyClass(Text.class);
conf.setMapOutputValueClass(IntWritable.class);
conf.setOutputKeyClass(Text.class);
conf.setOutputValueClass(IntWritable.class);
JobClient.runJob(conf);
return 0;
}

// Main Method
public static void main(String args[]) throws Exception
{
int exitCode = ToolRunner.run(new WCDriver(), args);
System.out.println(exitCode);
}
}
Output:
Input File:
Welcome everyone.
Welcome to Hadoop lab.
Today we are going to work on Hadoop MapReduce concept.

Output File:
MapReduce 1
Today 1
Welcome 2
are 1
concept. 1
everyone 1
going 1
Hadoop 2
lab. 1
on 1
to 2
we 1
work 1

CCBDI Full Lab Manual Anurag Removed
No ratings yet
CCBDI Full Lab Manual Anurag Removed
97 pages
CS702 Big Data Programs
No ratings yet
CS702 Big Data Programs
58 pages
Map Reduce
No ratings yet
Map Reduce
57 pages
Psychopathology An Integrative Approach To Mental Disorders 9th Edition by David H Barlow V Mark Durand Stefan G Hofmann
No ratings yet
Psychopathology An Integrative Approach To Mental Disorders 9th Edition by David H Barlow V Mark Durand Stefan G Hofmann
351 pages
MR Progs For Self Excercise
No ratings yet
MR Progs For Self Excercise
14 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
3 MapReduce Program Ex Code
No ratings yet
3 MapReduce Program Ex Code
14 pages
Dsbda 11
No ratings yet
Dsbda 11
15 pages
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
No ratings yet
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
9 pages
Kick Start Hadoop: Word Count - Hadoop Map Reduce Example
No ratings yet
Kick Start Hadoop: Word Count - Hadoop Map Reduce Example
13 pages
MapReduce Programs
No ratings yet
MapReduce Programs
10 pages
B1 Instructions
No ratings yet
B1 Instructions
9 pages
BDA3
No ratings yet
BDA3
7 pages
Hadoop Mini Project
No ratings yet
Hadoop Mini Project
8 pages
Lab3 BigData-MapReduce
No ratings yet
Lab3 BigData-MapReduce
8 pages
Ravikant Hadoop File
No ratings yet
Ravikant Hadoop File
22 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
Hadoop Developingapps PDF
No ratings yet
Hadoop Developingapps PDF
17 pages
Cloud LAB 10.1,11.1,12.1
No ratings yet
Cloud LAB 10.1,11.1,12.1
6 pages
Map Reduce
No ratings yet
Map Reduce
4 pages
Practical 2-1
No ratings yet
Practical 2-1
4 pages
CS-702 (D) BigData
No ratings yet
CS-702 (D) BigData
61 pages
Practical 2-3
No ratings yet
Practical 2-3
3 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Hadoop Wordcount Program
No ratings yet
Hadoop Wordcount Program
20 pages
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
No ratings yet
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
5 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
Source Code For Wordcount
No ratings yet
Source Code For Wordcount
3 pages
Classcreation
No ratings yet
Classcreation
2 pages
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
No ratings yet
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
6 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
Wrordcount
No ratings yet
Wrordcount
2 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
Sribharanitharan.M 71762234049
No ratings yet
Sribharanitharan.M 71762234049
2 pages
WordCountApp
No ratings yet
WordCountApp
2 pages
Word Count Program
No ratings yet
Word Count Program
2 pages
Experiment 6 BDA
No ratings yet
Experiment 6 BDA
4 pages
WordCount Program Hadoop Task 2
No ratings yet
WordCount Program Hadoop Task 2
7 pages
BDA Lab 8 Manual
No ratings yet
BDA Lab 8 Manual
7 pages
Codigo Haddop
No ratings yet
Codigo Haddop
3 pages
Palak
No ratings yet
Palak
10 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
7 pages
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
No ratings yet
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
13 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
Parlab Parallel Boot Camp Cloud Computing With Mapreduce and Hadoop
No ratings yet
Parlab Parallel Boot Camp Cloud Computing With Mapreduce and Hadoop
49 pages
Big Data 4 Vivek
No ratings yet
Big Data 4 Vivek
3 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
Academic Full Length Practice Test
0% (1)
Academic Full Length Practice Test
25 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Master Plan Porto Romano Bay Albania
100% (1)
Master Plan Porto Romano Bay Albania
138 pages
Example - (Map Function in Word Count)
No ratings yet
Example - (Map Function in Word Count)
6 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
Daily Accomplishment Report
No ratings yet
Daily Accomplishment Report
13 pages
Prerequisites: Single Node Setup Cluster Setup
No ratings yet
Prerequisites: Single Node Setup Cluster Setup
5 pages
PR Electronics 5715v104 - Uk
No ratings yet
PR Electronics 5715v104 - Uk
25 pages
Time and Decision Economic and Psychological Perspectives of Intertemporal Choice George Loewenstein
No ratings yet
Time and Decision Economic and Psychological Perspectives of Intertemporal Choice George Loewenstein
82 pages
Sag - Trainers Methodology I PDF
No ratings yet
Sag - Trainers Methodology I PDF
9 pages
Measurement Ipsas 46
No ratings yet
Measurement Ipsas 46
11 pages
Appraisal Form
No ratings yet
Appraisal Form
12 pages
MapReduce Example
No ratings yet
MapReduce Example
3 pages
RULE 64 Rev of Judgm of COMELEC & COA
No ratings yet
RULE 64 Rev of Judgm of COMELEC & COA
5 pages
SPH Catalogue
No ratings yet
SPH Catalogue
127 pages
To College DESIGN OF TAPER SLOT ARRAY FOR ULTRA WIDE Review 1.1
No ratings yet
To College DESIGN OF TAPER SLOT ARRAY FOR ULTRA WIDE Review 1.1
24 pages
Law Assignment (Final)
No ratings yet
Law Assignment (Final)
10 pages
Design Basis: CE 315-Design of Concrete Structure - I Instructor: Dr. E. R. Latifee
No ratings yet
Design Basis: CE 315-Design of Concrete Structure - I Instructor: Dr. E. R. Latifee
2 pages
(MDS-G6) PMS
No ratings yet
(MDS-G6) PMS
22 pages
Fisheries Code
No ratings yet
Fisheries Code
33 pages
Natwar Lal Joshi - Resume 2023
No ratings yet
Natwar Lal Joshi - Resume 2023
1 page
Rooster
No ratings yet
Rooster
15 pages
WI For FMEA
No ratings yet
WI For FMEA
2 pages
Chapter 2 Architectural Models
No ratings yet
Chapter 2 Architectural Models
44 pages
CBSE Class 3 Mathematics - 4 Digit Numbers-2
No ratings yet
CBSE Class 3 Mathematics - 4 Digit Numbers-2
4 pages
Conbextra AT
No ratings yet
Conbextra AT
2 pages
BST Weekly Coaching Guide
No ratings yet
BST Weekly Coaching Guide
37 pages
HW8-smoother Tuning DIAL
100% (1)
HW8-smoother Tuning DIAL
5 pages
Company Details - 豐達-2 - eAuditNet
No ratings yet
Company Details - 豐達-2 - eAuditNet
3 pages
TOPIC 7 Unemployment
No ratings yet
TOPIC 7 Unemployment
13 pages
Brake Drum
No ratings yet
Brake Drum
4 pages
Density Based Clustering
No ratings yet
Density Based Clustering
22 pages
Nav Report
No ratings yet
Nav Report
3 pages
Adora Seedless One Sheet 2015
No ratings yet
Adora Seedless One Sheet 2015
1 page
Core Java Programming Book
From Everand
Core Java Programming Book
Manish Soni
No ratings yet

Exp 4 Word Count

Uploaded by

Exp 4 Word Count

Uploaded by

Assignment 4

public class WCMapper extends MapReduceBase implements Mapper<LongWritable,

String line = value.toString();

// Splitting the line on spaces

public class WCReducer extends MapReduceBase implements Reducer<Text,

// Counting the frequency of each words

output.collect(key, new IntWritable(count));

public class WCDriver extends Configured implements Tool {

public int run(String args[]) throws IOException

JobConf conf = new JobConf(WCDriver.class);

You might also like