0% found this document useful (0 votes)

8 views4 pages

Map Reduce

MapReduce is a programming model for processing large datasets in a distributed system. The document discusses MapReduce and provides an example Java program that implements a word count algorithm using Hadoop MapReduce to count the frequency of words in a file. The program takes an input file and output location as parameters.

Uploaded by

chetanruparel07aws

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views4 pages

Map Reduce

Uploaded by

chetanruparel07aws

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

Output

Map Reduce Programming in Java

MapReduce is a programming model and an associated implementation for processing and
generating large data sets with a parallel, distributed algorithm on a cluster. Conceptually
similar approaches have been very well known since 1995 with the Message Passing
Interface standard having reduce and scatter operations.

Running sample Word Count program in hadoop

1) Install Eclipse in ubuntu 14.04
2) Add all the external jar files from hadoop folder to eclipse project
3) Run the application giving input.txt and output parameters
Word Count program:
import java.io.*;
import java.util.*;

import org.apache.hadoop.fs.Path;
import org.apache.hadoop.filecache.DistributedCache;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapred.*;
import org.apache.hadoop.util.*;

public class WordCount extends Configured implements Tool {

public static class Map extends MapReduceBase implements Mapper<LongWritable, Text,

Text, IntWritable> {

static enum Counters { INPUT_WORDS }

private final static IntWritable one = new IntWritable(1);

private Text word = new Text();

private boolean caseSensitive = true;

private Set<String> patternsToSkip = new HashSet<String>();

private long numRecords = 0;

private String inputFile;

public void configure(JobConf job) {

caseSensitive = job.getBoolean("wordcount.case.sensitive", true);
inputFile = job.get("map.input.file");

if (job.getBoolean("wordcount.skip.patterns", false)) {
Path[] patternsFiles = new Path[0];
try {
patternsFiles = DistributedCache.getLocalCacheFiles(job);
} catch (IOException ioe) {
System.err.println("Caught exception while getting cached files: " +
StringUtils.stringifyException(ioe));
}
for (Path patternsFile : patternsFiles) {
parseSkipFile(patternsFile);
}
}
}

private void parseSkipFile(Path patternsFile) {

try {
BufferedReader fis = new BufferedReader(new FileReader(patternsFile.toString()));
String pattern = null;
while ((pattern = fis.readLine()) != null) {
patternsToSkip.add(pattern);
}
} catch (IOException ioe) {
System.err.println("Caught exception while parsing the cached file '" + patternsFile +
"' : " + StringUtils.stringifyException(ioe));
}
}

public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable>

output, Reporter reporter) throws IOException {
String line = (caseSensitive) ? value.toString() : value.toString().toLowerCase();

for (String pattern : patternsToSkip) {

line = line.replaceAll(pattern, "");
}

StringTokenizer tokenizer = new StringTokenizer(line);

while (tokenizer.hasMoreTokens()) {
word.set(tokenizer.nextToken());
output.collect(word, one);
reporter.incrCounter(Counters.INPUT_WORDS, 1);
}

if ((++numRecords % 100) == 0) {
reporter.setStatus("Finished processing " + numRecords + " records " + "from the input
file: " + inputFile);
}
}
}

public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable,

Text, IntWritable> {
public void reduce(Text key, Iterator<IntWritable> values, OutputCollector<Text,
IntWritable> output, Reporter reporter) throws IOException {
int sum = 0;
while (values.hasNext()) {
sum += values.next().get();
}
output.collect(key, new IntWritable(sum));
}
}

public int run(String[] args) throws Exception {

JobConf conf = new JobConf(getConf(), WordCount.class);
conf.setJobName("wordcount");

conf.setOutputKeyClass(Text.class);
conf.setOutputValueClass(IntWritable.class);

conf.setMapperClass(Map.class);
conf.setCombinerClass(Reduce.class);
conf.setReducerClass(Reduce.class);

conf.setInputFormat(TextInputFormat.class);
conf.setOutputFormat(TextOutputFormat.class);

List<String> other_args = new ArrayList<String>();

for (int i=0; i < args.length; ++i) {
if ("-skip".equals(args[i])) {
DistributedCache.addCacheFile(new Path(args[++i]).toUri(), conf);
conf.setBoolean("wordcount.skip.patterns", true);
} else {
other_args.add(args[i]);
}
}

FileInputFormat.setInputPaths(conf, new Path(other_args.get(0)));

FileOutputFormat.setOutputPath(conf, new Path(other_args.get(1)));

JobClient.runJob(conf);
return 0;
}

public static void main(String[] args) throws Exception {

int res = ToolRunner.run(new Configuration(), new WordCount(), args);
System.exit(res);
}
}

Lip Filler Masterclass Presentation Oct 24
No ratings yet
Lip Filler Masterclass Presentation Oct 24
86 pages
Habre International Trading Co LTD V Ebrahim A. Kassam
No ratings yet
Habre International Trading Co LTD V Ebrahim A. Kassam
28 pages
English Code 1 9781292322711 AB UNIT 1
No ratings yet
English Code 1 9781292322711 AB UNIT 1
17 pages
Beauty Trends Asia 2022 Shared by WorldLine Technology
No ratings yet
Beauty Trends Asia 2022 Shared by WorldLine Technology
45 pages
Mainstreaming The Victims of Crimes and The Witnesses To It - AISHANI PATTANAIK
No ratings yet
Mainstreaming The Victims of Crimes and The Witnesses To It - AISHANI PATTANAIK
20 pages
Brain Herniation PDF
No ratings yet
Brain Herniation PDF
5 pages
HausaGrammar 10845680
No ratings yet
HausaGrammar 10845680
217 pages
SANSKRIT English - pdf-81 PDF
No ratings yet
SANSKRIT English - pdf-81 PDF
5 pages
Eds Sem Q.B Final
No ratings yet
Eds Sem Q.B Final
70 pages
Books Doubtnut Question Bank
No ratings yet
Books Doubtnut Question Bank
80 pages
Aristotle Short Notes by E - 53
No ratings yet
Aristotle Short Notes by E - 53
3 pages
The Origin of Life On Earth
No ratings yet
The Origin of Life On Earth
72 pages
Pro-Choice Violence in Massachusetts
No ratings yet
Pro-Choice Violence in Massachusetts
15 pages
IO Wheel Balancer WB220L - CE - 1.1 - ENG - Set910710984
No ratings yet
IO Wheel Balancer WB220L - CE - 1.1 - ENG - Set910710984
18 pages
IoT-Based Efficient Storage System For Sustainable Agriculture
No ratings yet
IoT-Based Efficient Storage System For Sustainable Agriculture
4 pages
Marketing Across Cultures cw2
No ratings yet
Marketing Across Cultures cw2
19 pages
Design and Modeling of Zvs Resonantsepic Converter For High Frequencyapplications
No ratings yet
Design and Modeling of Zvs Resonantsepic Converter For High Frequencyapplications
8 pages
6 To 8 Final Answer Key
No ratings yet
6 To 8 Final Answer Key
8 pages
DSBDA Manual
No ratings yet
DSBDA Manual
54 pages
Cephalopelvic Disproportion
60% (5)
Cephalopelvic Disproportion
2 pages
Previous Year 6th Sem Question
No ratings yet
Previous Year 6th Sem Question
18 pages
Notification Regarding Online Form Fill-Up For H. S. Final Examination-2025
No ratings yet
Notification Regarding Online Form Fill-Up For H. S. Final Examination-2025
2 pages
Effects of Exchange Rate Fluctuations On The Balance of Payment in The Nigerian Economy
No ratings yet
Effects of Exchange Rate Fluctuations On The Balance of Payment in The Nigerian Economy
8 pages
HBR - Leadership - Styles. Individual Coursework Case Study
No ratings yet
HBR - Leadership - Styles. Individual Coursework Case Study
7 pages
Blaw Work
No ratings yet
Blaw Work
4 pages
The Science of Consequences How They Affect Genes
No ratings yet
The Science of Consequences How They Affect Genes
6 pages
Shoes
No ratings yet
Shoes
1 page
Word Count Example
No ratings yet
Word Count Example
4 pages
Hart Vs Oconner
No ratings yet
Hart Vs Oconner
2 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
BDT Lab 6 22mis1067
No ratings yet
BDT Lab 6 22mis1067
13 pages
Cloud LAB 10.1,11.1,12.1
No ratings yet
Cloud LAB 10.1,11.1,12.1
6 pages
DSBDA GRP B 1
No ratings yet
DSBDA GRP B 1
8 pages
DSBDA GRP B 1
No ratings yet
DSBDA GRP B 1
8 pages
Dsbda Group B 1
No ratings yet
Dsbda Group B 1
5 pages
Map Reduce Program
No ratings yet
Map Reduce Program
2 pages
Word Count Program
No ratings yet
Word Count Program
2 pages
Sribharanitharan.M 71762234049
No ratings yet
Sribharanitharan.M 71762234049
2 pages
Customer - 3.java: Import Import Import Import Import Import Import Import
No ratings yet
Customer - 3.java: Import Import Import Import Import Import Import Import
15 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
1 Word Count
No ratings yet
1 Word Count
2 pages
BDA3
No ratings yet
BDA3
7 pages
3 MapReduce Program Ex Code
No ratings yet
3 MapReduce Program Ex Code
14 pages
Source Code For Wordcount
No ratings yet
Source Code For Wordcount
3 pages
Classcreation
No ratings yet
Classcreation
2 pages
Exp 11
No ratings yet
Exp 11
4 pages
WordCountApp
No ratings yet
WordCountApp
2 pages
Hadoop WordCount
No ratings yet
Hadoop WordCount
2 pages
Map Reduce Java Program
No ratings yet
Map Reduce Java Program
2 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
Practical 2-3
No ratings yet
Practical 2-3
3 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
579 BDA Week-04
No ratings yet
579 BDA Week-04
1 page
Codigo Haddop
No ratings yet
Codigo Haddop
3 pages
To Count Using Map and Reduce Program: Wordcount - Java
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
2 pages
Lab3 BigData-MapReduce
No ratings yet
Lab3 BigData-MapReduce
8 pages
PART 1 - Install Java and Hadoop On Ubuntu
No ratings yet
PART 1 - Install Java and Hadoop On Ubuntu
4 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
Phantom
No ratings yet
Phantom
6 pages
B1 Instructions
No ratings yet
B1 Instructions
9 pages
Wordcount
No ratings yet
Wordcount
3 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
Practical 3bcbs
No ratings yet
Practical 3bcbs
5 pages
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
No ratings yet
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
13 pages
Suzette Resume Offical Rev 1-2020
No ratings yet
Suzette Resume Offical Rev 1-2020
2 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
Shannon Butler Resume
No ratings yet
Shannon Butler Resume
3 pages
Ravikant Hadoop File
No ratings yet
Ravikant Hadoop File
22 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
Unit IV Programming Model
No ratings yet
Unit IV Programming Model
30 pages
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
No ratings yet
Practical-2 Aim: Write A Program of Word Count in Map Reduce Over HDFS. Description
6 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
7 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
No ratings yet
Steps To Create Jar File and Execute Word Count Problem in Mapper Reducer
5 pages
Week-8 de
No ratings yet
Week-8 de
9 pages
WordCount Program Hadoop Task 2
No ratings yet
WordCount Program Hadoop Task 2
7 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
Palak
No ratings yet
Palak
10 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
Practical 2-1
No ratings yet
Practical 2-1
4 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Example - (Map Function in Word Count)
No ratings yet
Example - (Map Function in Word Count)
6 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
From Everand
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
Manish Soni
No ratings yet

Map Reduce

Uploaded by

Map Reduce

Uploaded by

Output

Map Reduce Programming in Java

Running sample Word Count program in hadoop

public class WordCount extends Configured implements Tool {

public static class Map extends MapReduceBase implements Mapper<LongWritable, Text,

static enum Counters { INPUT_WORDS }

private final static IntWritable one = new IntWritable(1);

private boolean caseSensitive = true;

private long numRecords = 0;

public void configure(JobConf job) {

private void parseSkipFile(Path patternsFile) {

public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable>

for (String pattern : patternsToSkip) {

StringTokenizer tokenizer = new StringTokenizer(line);

public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable,

public int run(String[] args) throws Exception {

List<String> other_args = new ArrayList<String>();

FileInputFormat.setInputPaths(conf, new Path(other_args.get(0)));

public static void main(String[] args) throws Exception {

You might also like