HarshYadav 20CS3032 Assignment1

This document outlines the steps to install and configure Hadoop on Ubuntu, including installing Java, creating a Hadoop user, downloading and extracting Hadoop, configuring core-site.xml, hdfs-site.xml, mapred-site.xml, and yarn-site.xml files, formatting the namenode, starting HDFS and YARN services, and running a word count example job. The objectives are to learn how to install Hadoop, configure HDFS, and create and run Java mappers and reducers.

Uploaded by

Devanshu Kaushik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views22 pages

HarshYadav 20CS3032 Assignment1

Uploaded by

Devanshu Kaushik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 22

WORKING WITH HADOOP,

HDFS AND
CONFIGURATION

- Ashutosh Singh
20CS3013
TEAM MEMBERS

• Devanshu Kaushik
• Harsh Aditya
• Ashutosh Singh
• Animay Prakash
• Harsh Yadav
OBJECTIVES

• Installation of Hadoop in our system

• Learning Hadoop File System (HDFS)
• Creating Java Mapper and Reducer objects
• Launching Java Mappers and Reducers using Hadoop
INSTALLING JAVA ON UBUNTU

• Command – sudo apt install default-jdk default-jre –y

• Verification – java –version
CREATE HADOOP USER AND CONFIGURE
SSH
• Create user - sudo adduser hadoop
• Add to sudo - sudo usermod –aG sudo Hadoop
• Configure SSH : Generate keys, add public key to authorized_keys
DOWNLOAD AND INSTALL APACHE HADOOP
ON UBUNTU
• Download - wget https://downloads.apache.org/hadoop/common/stable/hadoop-
3.3.4.tar.gz
• Extract and move - tar -xvzf hadoop-3.3.4.tar.gz, sudo mv hadoop-3.3.4 /usr/local/hadoop
CONFIGURE HADOOP ON UBUNTU

• Edit.bashrc – Set Hadoop environment variable

• Edit Hadoop-env.sh – Set java environment variables.
CONFIGURING JAVA ENVIRONMENT
VARIABLES
• Edit hadoop-env.sh - Set Java environment variables
• Download Activation File - sudo wget
https://jcenter.bintray.com/javax/activation/javax.activation-api/1.2.0/javax.activation-
api-1.2.0.jar
• Check Hadoop Version - hadoop version
CONFIGURE CORE-SITE.XML

• Edit core-site.xml - Set default file system URI.

• Create Directories - sudo mkdir -p /home/hadoop/hdfs/{namenode,datanode}.
CONFIGURE HDFS-SITE.XML

• Edit hdfs-site.xml - Set replication and data directories

CONFIGURE MAPRED-SITE.XML

• Edit mapred-site.xml - Set MapReduce framework name.

CONFIGURE YARN-SITE.XML

• Edit yarn-site.xml - Set YARN settings.

VALIDATE HADOOP CONFIGURATION

• Format NameNode – hdfs namenode –format.

• Verify Configuration – hadoop version.
START THE HADOOP CLUSTER

• Start NameNode and DataNode – start-dfs.sh

• Start NodeManager and ResourceManager – start-yarn.sh
• Verify running services – jps
ACCESS HADOOP WEB INTERFACE

• Access Interface – http://server-IP:9870

INPUT TEXT
WORD COUNT JAVA FILE
COMPILATION OF WORD COUNT JAVA FILE
TO JAR FILE
JAR FILE TO MAPPER REDUCER FILE
OUTPUT
OUTPUT
THANK YOU

BDA Lab Manual-1
No ratings yet
BDA Lab Manual-1
60 pages
Vndna
No ratings yet
Vndna
12 pages
Hadoop Installation Manual 2.odt
No ratings yet
Hadoop Installation Manual 2.odt
20 pages
BDA LAB Programs
No ratings yet
BDA LAB Programs
56 pages
Configure HBase Hadoop and Hbase Client
No ratings yet
Configure HBase Hadoop and Hbase Client
16 pages
Sqoop Tutorial: Sqoop: "SQL To Hadoop and Hadoop To SQL"
No ratings yet
Sqoop Tutorial: Sqoop: "SQL To Hadoop and Hadoop To SQL"
11 pages
DAN Lab ManuaL
No ratings yet
DAN Lab ManuaL
53 pages
EX. NO Date Program NO Sign
No ratings yet
EX. NO Date Program NO Sign
80 pages
Hadoop Single Node Cluster Setup Steps
No ratings yet
Hadoop Single Node Cluster Setup Steps
7 pages
Big Data Manual Ai
No ratings yet
Big Data Manual Ai
33 pages
BDA Practical
No ratings yet
BDA Practical
38 pages
Hadoop
No ratings yet
Hadoop
4 pages
BDAO
No ratings yet
BDAO
23 pages
2 - Installation
No ratings yet
2 - Installation
15 pages
Online:: Setting Up The Environment
No ratings yet
Online:: Setting Up The Environment
9 pages
Bda Record
No ratings yet
Bda Record
27 pages
Hadoop Installation
No ratings yet
Hadoop Installation
12 pages
Install Sqoop
No ratings yet
Install Sqoop
7 pages
Step 1 - Install Oracle Java 8 On Ubuntu
No ratings yet
Step 1 - Install Oracle Java 8 On Ubuntu
7 pages
Hadoop 2.7.3 Setup On Ubuntu 15.10
No ratings yet
Hadoop 2.7.3 Setup On Ubuntu 15.10
7 pages
Hadoop Administrator Training - Lab Hand Book
No ratings yet
Hadoop Administrator Training - Lab Hand Book
12 pages
$ Sudo Apt-Get Install Oracle-Java8-Installer
No ratings yet
$ Sudo Apt-Get Install Oracle-Java8-Installer
4 pages
Experiment 1 Hadoop Installation
No ratings yet
Experiment 1 Hadoop Installation
6 pages
Hadoopfile PP
No ratings yet
Hadoopfile PP
83 pages
Experiment No - 1
No ratings yet
Experiment No - 1
13 pages
Experiment: - 1: Aim: Installing Hadoop, Configure HDFS, Configuring Hadoop
No ratings yet
Experiment: - 1: Aim: Installing Hadoop, Configure HDFS, Configuring Hadoop
67 pages
How To Install Hadoop On Ubuntu 18.04 or 20.04
No ratings yet
How To Install Hadoop On Ubuntu 18.04 or 20.04
15 pages
Hadoop Installation Steps
100% (1)
Hadoop Installation Steps
6 pages
Big Data Analytics Lab Experiments
No ratings yet
Big Data Analytics Lab Experiments
16 pages
Hadoop 3 Installation
No ratings yet
Hadoop 3 Installation
10 pages
Big Data Analytics Lab Manual
No ratings yet
Big Data Analytics Lab Manual
80 pages
Final Copy - BDA LAB Record
No ratings yet
Final Copy - BDA LAB Record
44 pages
Hadoop Installation Step by Step
No ratings yet
Hadoop Installation Step by Step
8 pages
PRACTICAL 4 - Single and Multi Node Hadoop Install
No ratings yet
PRACTICAL 4 - Single and Multi Node Hadoop Install
11 pages
Hadoop Installation
No ratings yet
Hadoop Installation
6 pages
Unit 1 Bdhall
No ratings yet
Unit 1 Bdhall
66 pages
Hadoop Installation Guide
No ratings yet
Hadoop Installation Guide
18 pages
Big Data
No ratings yet
Big Data
32 pages
Hadoop Installation
No ratings yet
Hadoop Installation
6 pages
Amc Engineering College: Dept. of Computer Science and Engineering
No ratings yet
Amc Engineering College: Dept. of Computer Science and Engineering
6 pages
Installation of Hadoop in Ubuntu
No ratings yet
Installation of Hadoop in Ubuntu
15 pages
Installation of Hadoop
No ratings yet
Installation of Hadoop
6 pages
Week 1 in Terminal
No ratings yet
Week 1 in Terminal
10 pages
213nt1306 - Big Data Analytics Lab Manual
No ratings yet
213nt1306 - Big Data Analytics Lab Manual
80 pages
Install Hadoop
No ratings yet
Install Hadoop
8 pages
Group A 1st
No ratings yet
Group A 1st
4 pages
Lab Manual
No ratings yet
Lab Manual
27 pages
BDA Lab Manual
No ratings yet
BDA Lab Manual
49 pages
BDA Lab Manual UPDATED
No ratings yet
BDA Lab Manual UPDATED
45 pages
Exp 1-2
No ratings yet
Exp 1-2
9 pages
Big Data Lab Manual
No ratings yet
Big Data Lab Manual
32 pages
Bi Lab File
No ratings yet
Bi Lab File
19 pages
Hbase Installationn
No ratings yet
Hbase Installationn
12 pages
BDA Manual
No ratings yet
BDA Manual
41 pages
Hive INstallation
No ratings yet
Hive INstallation
13 pages
Hadoop Configuration
No ratings yet
Hadoop Configuration
12 pages
Big Data Lab Record
No ratings yet
Big Data Lab Record
30 pages
Setup Hadoop On Windows 10 Machines
No ratings yet
Setup Hadoop On Windows 10 Machines
4 pages
Bdamanual
No ratings yet
Bdamanual
8 pages
Quick Configuration of Openldap and Kerberos In Linux and Authenicating Linux to Active Directory
From Everand
Quick Configuration of Openldap and Kerberos In Linux and Authenicating Linux to Active Directory
Dr. Hidaia Mahmood Alassouli
No ratings yet