Hadoop WordCount

Uploaded by

kavya kav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views2 pages

Hadoop WordCount

Uploaded by

kavya kav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

import java.io.

IOException;
import java.util.regex.Pattern;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;

import org.apache.log4j.Logger;

public class WordCount extends Configured implements Tool {

private static final Logger LOG = Logger.getLogger(WordCount.class);

public static void main(String[] args) throws Exception {

int res = ToolRunner.run(new WordCount(), args);
System.exit(res);
}

public int run(String[] args) throws Exception {

Job job = Job.getInstance(getConf(), "wordcount");
job.setJarByClass(this.getClass());
// Use TextInputFormat, the default unless job.setInputFormatClass is used
FileInputFormat.addInputPath(job, new Path("input.txt"));
FileOutputFormat.setOutputPath(job, new Path("output"));
job.setMapperClass(Map.class);
job.setReducerClass(Reduce.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
return job.waitForCompletion(true) ? 0 : 1;
}

public static class Map extends Mapper<LongWritable, Text, Text, IntWritable> {

private final static IntWritable one = new IntWritable(1);
private Text word = new Text();
private long numRecords = 0;
private static final Pattern WORD_BOUNDARY = Pattern.compile("\\s*\\b\\s*");

public void map(LongWritable offset, Text lineText, Context context)

throws IOException, InterruptedException {
String line = lineText.toString();
Text currentWord = new Text();
for (String word : WORD_BOUNDARY.split(line)) {
if (word.isEmpty()) {
continue;
}
currentWord = new Text(word);
context.write(currentWord,one);
}
}
}

public static class Reduce extends Reducer<Text, IntWritable, Text, IntWritable> {

@Override
public void reduce(Text word, Iterable<IntWritable> counts, Context context)
throws IOException, InterruptedException {
int sum = 0;
for (IntWritable count : counts) {
sum += count.get();
}
context.write(word, new IntWritable(sum));
}
}
}

DSBDA Manual
No ratings yet
DSBDA Manual
54 pages
All
No ratings yet
All
11 pages
Hadoop Mini Project
No ratings yet
Hadoop Mini Project
8 pages
Cloud LAB 10.1,11.1,12.1
No ratings yet
Cloud LAB 10.1,11.1,12.1
6 pages
Wordcount
No ratings yet
Wordcount
3 pages
BDF Programs
No ratings yet
BDF Programs
32 pages
BDA MapReduce Program
No ratings yet
BDA MapReduce Program
8 pages
DSBDA11 Code
No ratings yet
DSBDA11 Code
3 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
3 MapReduce Program Ex Code
No ratings yet
3 MapReduce Program Ex Code
14 pages
Map Reduce Program
No ratings yet
Map Reduce Program
2 pages
MapReduce Programs
No ratings yet
MapReduce Programs
10 pages
B1 Instructions
No ratings yet
B1 Instructions
9 pages
Source Code For Wordcount
No ratings yet
Source Code For Wordcount
3 pages
Lab3 BigData-MapReduce
No ratings yet
Lab3 BigData-MapReduce
8 pages
Exp 11
No ratings yet
Exp 11
4 pages
Word Count Program
No ratings yet
Word Count Program
2 pages
PART 1 - Install Java and Hadoop On Ubuntu
No ratings yet
PART 1 - Install Java and Hadoop On Ubuntu
4 pages
DSBDA GRP B Print
No ratings yet
DSBDA GRP B Print
21 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
WordCountApp
No ratings yet
WordCountApp
2 pages
Sribharanitharan.M 71762234049
No ratings yet
Sribharanitharan.M 71762234049
2 pages
1 Word Count
No ratings yet
1 Word Count
2 pages
Ex No 04
No ratings yet
Ex No 04
4 pages
BDA3
No ratings yet
BDA3
7 pages
Ravikant Hadoop File
No ratings yet
Ravikant Hadoop File
22 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
Map Reduce Java Program
No ratings yet
Map Reduce Java Program
2 pages
Problem 3
No ratings yet
Problem 3
1 page
Practical 3bcbs
No ratings yet
Practical 3bcbs
5 pages
Map Reduce
No ratings yet
Map Reduce
4 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Classcreation
No ratings yet
Classcreation
2 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
No ratings yet
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
5 pages
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
No ratings yet
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
6 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
579 BDA Week-04
No ratings yet
579 BDA Week-04
1 page
CTBD Sol02
No ratings yet
CTBD Sol02
2 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
Experiment 6 BDA
No ratings yet
Experiment 6 BDA
4 pages
Wordcount
No ratings yet
Wordcount
3 pages
COFIMCO Installation and Operation Manual
100% (2)
COFIMCO Installation and Operation Manual
11 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
WordCount Program Hadoop Task 2
No ratings yet
WordCount Program Hadoop Task 2
7 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
Map Reduce Example
No ratings yet
Map Reduce Example
6 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
Palak
No ratings yet
Palak
10 pages
Codigo Haddop
No ratings yet
Codigo Haddop
3 pages
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
To Count Using Map and Reduce Program: Wordcount - Java
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
2 pages
IA Carpentry
No ratings yet
IA Carpentry
103 pages
Word Count
No ratings yet
Word Count
3 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
Algonquin College Oda Check List
No ratings yet
Algonquin College Oda Check List
17 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
DL Industries Investor Presentation
No ratings yet
DL Industries Investor Presentation
28 pages
MIP GET VIEW BOQDripSystem
No ratings yet
MIP GET VIEW BOQDripSystem
6 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
KPCSW Report.2022
No ratings yet
KPCSW Report.2022
43 pages
Flowchart and Guidelines For Non-Degree Applications 2025 Via Google Form
No ratings yet
Flowchart and Guidelines For Non-Degree Applications 2025 Via Google Form
2 pages
Spare Parts List: Forward and Reversible Plate
No ratings yet
Spare Parts List: Forward and Reversible Plate
44 pages
SpyGlass DS System Brochure
No ratings yet
SpyGlass DS System Brochure
6 pages
Toms River Animal Shelter Expenses 2023
No ratings yet
Toms River Animal Shelter Expenses 2023
27 pages
Fisheries Code
No ratings yet
Fisheries Code
33 pages
Heartofcoaching Sample
100% (1)
Heartofcoaching Sample
19 pages
DL24/DL24P User Manual
No ratings yet
DL24/DL24P User Manual
9 pages
Chapter 2 - Classification of Business
No ratings yet
Chapter 2 - Classification of Business
22 pages
FCB UnO ControlCenter Manual
No ratings yet
FCB UnO ControlCenter Manual
30 pages
Brochure Digital Showroom Plans
No ratings yet
Brochure Digital Showroom Plans
14 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
BS-08 Partitionof Bengal
No ratings yet
BS-08 Partitionof Bengal
23 pages
Corporate Governanceand Ethics
No ratings yet
Corporate Governanceand Ethics
8 pages
Banquet Personnel
No ratings yet
Banquet Personnel
21 pages
FVC Labor Union-Ptgwo vs. Sanama-Fvc-Siglo
100% (1)
FVC Labor Union-Ptgwo vs. Sanama-Fvc-Siglo
3 pages
Is 14223 1 1995
No ratings yet
Is 14223 1 1995
10 pages
Mobile Data
No ratings yet
Mobile Data
5 pages
pp2 Coursework 1 - 201808
No ratings yet
pp2 Coursework 1 - 201808
3 pages
Company Details - 豐達-2 - eAuditNet
No ratings yet
Company Details - 豐達-2 - eAuditNet
3 pages
LSIQNF2309462 - Pak Ageng
No ratings yet
LSIQNF2309462 - Pak Ageng
1 page
Leave Application Form: To Be Filled-Out by Employee
No ratings yet
Leave Application Form: To Be Filled-Out by Employee
4 pages
Types of Plants:: Operations
No ratings yet
Types of Plants:: Operations
2 pages
Digiscope Slimhole MWD Ps
No ratings yet
Digiscope Slimhole MWD Ps
2 pages
BBMF2063 Tutorial Questions - 202306-10
No ratings yet
BBMF2063 Tutorial Questions - 202306-10
1 page
701
100% (2)
701
35 pages
Core Java Programming Book
From Everand
Core Java Programming Book
Manish Soni
No ratings yet

Hadoop WordCount

Uploaded by

Hadoop WordCount

Uploaded by

import java.io.

public class WordCount extends Configured implements Tool {

private static final Logger LOG = Logger.getLogger(WordCount.class);

public static void main(String[] args) throws Exception {

public int run(String[] args) throws Exception {

public static class Map extends Mapper<LongWritable, Text, Text, IntWritable> {

public void map(LongWritable offset, Text lineText, Context context)

public static class Reduce extends Reducer<Text, IntWritable, Text, IntWritable> {

You might also like