0% found this document useful (0 votes)

20 views3 pages

Source Code For Wordcount

The document contains Java source code for a Hadoop MapReduce program that performs word counting. It includes a driver class, a mapper class that tokenizes input text, and a reducer class that sums the occurrences of each word. The program is structured to take input and output directories as arguments and utilizes Hadoop's framework for processing large datasets.

Uploaded by

shravya.pattiri

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views3 pages

Source Code For Wordcount

Uploaded by

shravya.pattiri

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

//Source Code for Wordcount:

//Driver Code:

package naiduwc;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

Job job = Job.getInstance(conf, "WordCount");

job.setJarByClass(Wordc.WordCount.class);

// TODO: specify a mapper

job.setMapperClass(WordCountMapper.class);

// TODO: specify a reducer

job.setReducerClass(WordCountReducer.class);

// TODO: specify output types

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);
// TODO: specify input and output DIRECTORIES (not files)

FileInputFormat.setInputPaths(job, new Path(args[1]));

FileOutputFormat.setOutputPath(job, new Path(args[2]));

if (!job.waitForCompletion(true))

return;

//Mapper code:

package naiduwc;

import java.util.*;

import java.io.*;

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.io.IntWritable;

public class WordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable>

public void map(LongWritable key, Text value, Context context)

throws IOException, InterruptedException {

Text word=new Text();

String line=value.toString();

StringTokenizer s=new StringTokenizer(line);

while(s.hasMoreTokens())

{
word.set(s.nextToken());

context.write(word,new IntWritable(1));

//Reducer Code:

package naiduwc;

import java.util.*;

import java.io.IOException;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.mapreduce.Reducer;

public class WordCountReducer extends Reducer<Text, IntWritable ,Text, IntWritable>

public void reduce(Text key, Iterable<IntWritable> value, Context context)

throws IOException, InterruptedException

int sum=0;

for (IntWritable values : value) {

sum=sum+values.get();

context.write(key, new IntWritable(sum));

Adc Lab Manual PDF
75% (4)
Adc Lab Manual PDF
74 pages
Ravikant Hadoop File
No ratings yet
Ravikant Hadoop File
22 pages
BDF Programs
No ratings yet
BDF Programs
32 pages
MapReduce Programs
No ratings yet
MapReduce Programs
10 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
3 MapReduce Program Ex Code
No ratings yet
3 MapReduce Program Ex Code
14 pages
Dsbda 11
No ratings yet
Dsbda 11
15 pages
B1 Instructions
No ratings yet
B1 Instructions
9 pages
Kick Start Hadoop: Word Count - Hadoop Map Reduce Example
No ratings yet
Kick Start Hadoop: Word Count - Hadoop Map Reduce Example
13 pages
DSBDA GRP B Print
No ratings yet
DSBDA GRP B Print
21 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
MR Progs For Self Excercise
No ratings yet
MR Progs For Self Excercise
14 pages
Cloud LAB 10.1,11.1,12.1
No ratings yet
Cloud LAB 10.1,11.1,12.1
6 pages
Lab3 BigData-MapReduce
No ratings yet
Lab3 BigData-MapReduce
8 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
Geography 200 Questions 1547013925 78.
100% (1)
Geography 200 Questions 1547013925 78.
21 pages
Logan Lubricated Bumper Sub (English)
No ratings yet
Logan Lubricated Bumper Sub (English)
20 pages
GP1 Q1 Week-1
No ratings yet
GP1 Q1 Week-1
18 pages
PART 1 - Install Java and Hadoop On Ubuntu
No ratings yet
PART 1 - Install Java and Hadoop On Ubuntu
4 pages
Wordcount
No ratings yet
Wordcount
3 pages
Map Reduce Program
No ratings yet
Map Reduce Program
2 pages
Practical 3bcbs
No ratings yet
Practical 3bcbs
5 pages
Experiment 6 BDA
No ratings yet
Experiment 6 BDA
4 pages
WordCountApp
No ratings yet
WordCountApp
2 pages
BDA3
No ratings yet
BDA3
7 pages
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
No ratings yet
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
5 pages
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
3/5 (4)
Ex No 04
No ratings yet
Ex No 04
4 pages
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
No ratings yet
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
6 pages
Word Count Program
No ratings yet
Word Count Program
2 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
Sribharanitharan.M 71762234049
No ratings yet
Sribharanitharan.M 71762234049
2 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
Map Reduce Java Program
No ratings yet
Map Reduce Java Program
2 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
Exp 11
No ratings yet
Exp 11
4 pages
1 Word Count
No ratings yet
1 Word Count
2 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
Hadoop WordCount
No ratings yet
Hadoop WordCount
2 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
Islamic 5 Fold
100% (1)
Islamic 5 Fold
21 pages
Practical 2-1
No ratings yet
Practical 2-1
4 pages
Sense and Sensibility - Jane Austen
No ratings yet
Sense and Sensibility - Jane Austen
300 pages
Data Explorer Engine Ecu Decoding Version 6.0
No ratings yet
Data Explorer Engine Ecu Decoding Version 6.0
7 pages
Wrordcount
No ratings yet
Wrordcount
2 pages
Map Reduce
No ratings yet
Map Reduce
4 pages
Design and Analysis of Grass Cutting Machine: - Manual Method, Mechanized Method, Peak Working, Grass Cutting
No ratings yet
Design and Analysis of Grass Cutting Machine: - Manual Method, Mechanized Method, Peak Working, Grass Cutting
8 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
Wordcount
No ratings yet
Wordcount
3 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
Classcreation
No ratings yet
Classcreation
2 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
7 pages
Codigo Haddop
No ratings yet
Codigo Haddop
3 pages
579 BDA Week-04
No ratings yet
579 BDA Week-04
1 page
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
Lakme
No ratings yet
Lakme
23 pages
Map Reduce Example
No ratings yet
Map Reduce Example
6 pages
Example - (Map Function in Word Count)
No ratings yet
Example - (Map Function in Word Count)
6 pages
Thiele Small Parameters Measurement
No ratings yet
Thiele Small Parameters Measurement
5 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
To Count Using Map and Reduce Program: Wordcount - Java
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
2 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
Ce Unit Iii PDF
No ratings yet
Ce Unit Iii PDF
116 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
JD - Cto
No ratings yet
JD - Cto
3 pages
Word Count
No ratings yet
Word Count
3 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
Parts of Speech Exercise
No ratings yet
Parts of Speech Exercise
8 pages
C1 Introduction of Risks and Business Risks
No ratings yet
C1 Introduction of Risks and Business Risks
37 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Flame Scanner
No ratings yet
Flame Scanner
4 pages
Terms For Mechanical Engineering
0% (1)
Terms For Mechanical Engineering
5 pages
CO IPL Schedule
No ratings yet
CO IPL Schedule
8 pages
RP - Provide - From - FRST - Earliest Record RP - Provide - From - Last - Read Newest Record (Current)
No ratings yet
RP - Provide - From - FRST - Earliest Record RP - Provide - From - Last - Read Newest Record (Current)
9 pages
PN Junctions The Foundation of Modern Electronics
No ratings yet
PN Junctions The Foundation of Modern Electronics
10 pages
Dell Storage sc7020 Spec
No ratings yet
Dell Storage sc7020 Spec
5 pages
Schools of Thought: Structuralism
No ratings yet
Schools of Thought: Structuralism
29 pages
CHAPTER I (Jumalon and Montoya Thesis)
No ratings yet
CHAPTER I (Jumalon and Montoya Thesis)
18 pages
Dangerous Road
No ratings yet
Dangerous Road
8 pages
Mycom Selection n4wb
No ratings yet
Mycom Selection n4wb
1 page
2010 Geographies of Risk Catalog Final2
No ratings yet
2010 Geographies of Risk Catalog Final2
2 pages
Layout Mata101n
No ratings yet
Layout Mata101n
5 pages
HW 4 Solutions
No ratings yet
HW 4 Solutions
5 pages
Syllabus of Oracle Project Accounting Training
No ratings yet
Syllabus of Oracle Project Accounting Training
3 pages
FMS
No ratings yet
FMS
3 pages
s1 Edited PDF
No ratings yet
s1 Edited PDF
1 page

Source Code For Wordcount

Uploaded by

Source Code For Wordcount

Uploaded by

//Source Code for Wordcount:

public class WordCount {

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

Job job = Job.getInstance(conf, "WordCount");

// TODO: specify a mapper

// TODO: specify a reducer

// TODO: specify output types

FileInputFormat.setInputPaths(job, new Path(args[1]));

FileOutputFormat.setOutputPath(job, new Path(args[2]));

public class WordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable>

public void map(LongWritable key, Text value, Context context)

throws IOException, InterruptedException {

Text word=new Text();

StringTokenizer s=new StringTokenizer(line);

public class WordCountReducer extends Reducer<Text, IntWritable ,Text, IntWritable>

public void reduce(Text key, Iterable<IntWritable> value, Context context)

throws IOException, InterruptedException

for (IntWritable values : value) {

context.write(key, new IntWritable(sum));

You might also like