0% found this document useful (0 votes)

4 views

✅ PART 1- Install Java and Hadoop on Ubuntu

This document provides a step-by-step guide to install Java and Hadoop on Ubuntu, configure environment variables, and write a WordCount Java program. It includes instructions for compiling the program, creating a JAR file, and running a MapReduce job to count word occurrences in a text file. The final output displays the count of each word processed by the job.

Uploaded by

ayeshagujrati00

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views

✅ PART 1- Install Java and Hadoop on Ubuntu

Uploaded by

ayeshagujrati00

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

✅ PART 1: Install Java and Hadoop on Ubuntu

🧰 Step 1: Install Java (JDK)

sudo apt update
sudo apt install openjdk-11-jdk -y
java -version

📦 Step 2: Download and Configure Hadoop (Standalone Mode)

🔽 Download Hadoop
cd ~
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
tar -xzf hadoop-3.3.6.tar.gz
mv hadoop-3.3.6 hadoop

🔧 Set Environment Variables

Edit ~/.bashrc:

nano ~/.bashrc

Add these at the end:

export HADOOP_HOME=~/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
export HADOOP_CLASSPATH=$JAVA_HOME/lib/tools.jar

Apply the changes:

source ~/.bashrc

✅ Test:
hadoop version

✅ PART 2: Write the WordCount Java Code

Create a folder and Java file:

mkdir ~/wordcount
cd ~/wordcount
nano WordCount.java

import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {

public static class TokenizerMapper

extends Mapper<Object, Text, Text, IntWritable> {
private final static IntWritable one = new IntWritable(1);
private Text word = new Text();
public void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
word.set(itr.nextToken());
context.write(word, one);
}
}
}

public static class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {
private IntWritable result = new IntWritable();
public void reduce(Text key, Iterable<IntWritable> values,
Context context) throws IOException, InterruptedException {
int sum = 0;
for (IntWritable val : values) {
sum += val.get();
}
result.set(sum);
context.write(key, result);
}
}

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();
Job job = Job.getInstance(conf, "word count");
job.setJarByClass(WordCount.class);
job.setMapperClass(TokenizerMapper.class);
job.setCombinerClass(IntSumReducer.class);
job.setReducerClass(IntSumReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}

✅ PART 3: Compile and Run the Program

🔧 Step 1: Compile
mkdir classes
javac -classpath
"$HADOOP_HOME/share/hadoop/common/*:$HADOOP_HOME/share/hadoop/mapreduce/*" -d
classes WordCount.java

📦 Step 2: Create a JAR

jar -cvf wordcount.jar -C classes/ .

✅ PART 4: Run WordCount Job (Standalone)

📁 Step 1: Create Input File
mkdir input
echo "hadoop mapreduce hadoop word count word count" > input/test.txt

▶️ Step 2: Run MapReduce Job

hadoop jar wordcount.jar WordCount input output

📄 Step 3: View Output

cat output/part-r-00000

count 2
hadoop 2
mapreduce 1
word 2

POD Pro XT Service Manual
No ratings yet
POD Pro XT Service Manual
215 pages
X Steel Book System
No ratings yet
X Steel Book System
291 pages
To Count Using Map and Reduce Program: Wordcount - Java
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
2 pages
Wordcount
No ratings yet
Wordcount
3 pages
Word Count Program
No ratings yet
Word Count Program
2 pages
049
No ratings yet
049
2 pages
Practical 3bcbs
No ratings yet
Practical 3bcbs
5 pages
1WordCount
No ratings yet
1WordCount
2 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
Hadoop WordCount
No ratings yet
Hadoop WordCount
2 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
WordCount Program Hadoop Task 2
No ratings yet
WordCount Program Hadoop Task 2
7 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
ExNo04
No ratings yet
ExNo04
4 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
579 BDA Week-04
No ratings yet
579 BDA Week-04
1 page
Exp-11
No ratings yet
Exp-11
4 pages
Experiment 6 BDA
No ratings yet
Experiment 6 BDA
4 pages
Codigo Haddop
No ratings yet
Codigo Haddop
3 pages
Source Code for Wordcount
No ratings yet
Source Code for Wordcount
3 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
Ravikant_Hadoop_file
No ratings yet
Ravikant_Hadoop_file
22 pages
Bdt Lab 6 22mis1067
No ratings yet
Bdt Lab 6 22mis1067
13 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
11. WordCountApp
No ratings yet
11. WordCountApp
2 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
ContarPalabras Java
No ratings yet
ContarPalabras Java
2 pages
Map Reduce Example
No ratings yet
Map Reduce Example
6 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
BDF Programs
No ratings yet
BDF Programs
32 pages
CTBD Sol02
No ratings yet
CTBD Sol02
2 pages
BDA3
No ratings yet
BDA3
7 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Classcreation
No ratings yet
Classcreation
2 pages
Lab3_BigData-MapReduce
No ratings yet
Lab3_BigData-MapReduce
8 pages
Dsa Prac 5 19DCS038
No ratings yet
Dsa Prac 5 19DCS038
16 pages
Map Reduce Java Program
No ratings yet
Map Reduce Java Program
2 pages
Map Reduce
No ratings yet
Map Reduce
4 pages
Running Jar Program
No ratings yet
Running Jar Program
3 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
BDA
No ratings yet
BDA
6 pages
3 MapReduce program ex code
No ratings yet
3 MapReduce program ex code
14 pages
wc
No ratings yet
wc
13 pages
Steps to create jar file and execute word count problem in mapper reducer
No ratings yet
Steps to create jar file and execute word count problem in mapper reducer
5 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
DSBDA 11
No ratings yet
DSBDA 11
15 pages
Palak
No ratings yet
Palak
10 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
7 pages
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
Core Java Programming Book
From Everand
Core Java Programming Book
Manish Soni
No ratings yet
Example - (Map Function in Word Count)
No ratings yet
Example - (Map Function in Word Count)
6 pages
DSBDA GRP B Print
No ratings yet
DSBDA GRP B Print
21 pages
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
No ratings yet
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
11 pages
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
3/5 (4)
40W No Tune FM Broadcast Power Amplifier Design
No ratings yet
40W No Tune FM Broadcast Power Amplifier Design
15 pages
Autodesk - Corrupt CascadeInfo
No ratings yet
Autodesk - Corrupt CascadeInfo
2 pages
Mesh Analysis and Nodal Analysis: Mapúa University
No ratings yet
Mesh Analysis and Nodal Analysis: Mapúa University
9 pages
SQF Audit Checklist: Module A7
No ratings yet
SQF Audit Checklist: Module A7
59 pages
Thesis About Technology in Society
100% (4)
Thesis About Technology in Society
8 pages
13 Transfer Claim Form-Ericsson 1st To Present
No ratings yet
13 Transfer Claim Form-Ericsson 1st To Present
2 pages
2024 Jan Mark Scheme BTEC DIT
No ratings yet
2024 Jan Mark Scheme BTEC DIT
17 pages
ReadMe MotopilotMP v1.0
No ratings yet
ReadMe MotopilotMP v1.0
3 pages
Mobile Banking
No ratings yet
Mobile Banking
3 pages
Jawaharlal Nehru Technological University Kakinada: College Name: Vikas College of Engg and Tech., Nunna, Vijayawada:Nq
No ratings yet
Jawaharlal Nehru Technological University Kakinada: College Name: Vikas College of Engg and Tech., Nunna, Vijayawada:Nq
6 pages
CV of Asaduzzaman Saikot
No ratings yet
CV of Asaduzzaman Saikot
2 pages
Cluster-Analysis
No ratings yet
Cluster-Analysis
89 pages
Ug - Tv-Ip851wc - Tv-Ip851wic - (V1 0R)
No ratings yet
Ug - Tv-Ip851wc - Tv-Ip851wic - (V1 0R)
51 pages
PhpStorm DatabasesandSQLEditorinPhpStorm 200116 0026 2492
No ratings yet
PhpStorm DatabasesandSQLEditorinPhpStorm 200116 0026 2492
23 pages
Manual Dccdip2 en
No ratings yet
Manual Dccdip2 en
7 pages
Ubifs
No ratings yet
Ubifs
47 pages
Object Oriented Programming Interview Questions & Answers
No ratings yet
Object Oriented Programming Interview Questions & Answers
58 pages
External Content
No ratings yet
External Content
301 pages
DIALux Evo Manual
No ratings yet
DIALux Evo Manual
101 pages
SpaceX Letter in Res
No ratings yet
SpaceX Letter in Res
4 pages
Project01 Specification
No ratings yet
Project01 Specification
9 pages
The Nuts and Bolts of Marine Fasteners
No ratings yet
The Nuts and Bolts of Marine Fasteners
10 pages
Media and Information Literacy (MIL)
No ratings yet
Media and Information Literacy (MIL)
70 pages
Clip On Analog Trunk Group: Alcatel Omnipcx Enterprise
No ratings yet
Clip On Analog Trunk Group: Alcatel Omnipcx Enterprise
26 pages
Test Guide Distance Nari Pcs-902
No ratings yet
Test Guide Distance Nari Pcs-902
8 pages
Sara Kim Resume 2018
No ratings yet
Sara Kim Resume 2018
2 pages
Europass Curriculum Vitae: Personal Information Constantin-Catalin Sima
No ratings yet
Europass Curriculum Vitae: Personal Information Constantin-Catalin Sima
3 pages
Slide 03
No ratings yet
Slide 03
155 pages

✅ PART 1- Install Java and Hadoop on Ubuntu

Uploaded by

✅ PART 1- Install Java and Hadoop on Ubuntu

Uploaded by

✅ PART 1: Install Java and Hadoop on Ubuntu

🧰 Step 1: Install Java (JDK)

📦 Step 2: Download and Configure Hadoop (Standalone Mode)

🔧 Set Environment Variables

Add these at the end:

Apply the changes:

✅ PART 2: Write the WordCount Java Code

public class WordCount {

​ public static class TokenizerMapper

​ public static class IntSumReducer

​ public static void main(String[] args) throws Exception {

✅ PART 3: Compile and Run the Program

📦 Step 2: Create a JAR

✅ PART 4: Run WordCount Job (Standalone)

▶️ Step 2: Run MapReduce Job

📄 Step 3: View Output

You might also like

public static class TokenizerMapper

public static class IntSumReducer

public static void main(String[] args) throws Exception {