0% found this document useful (0 votes)

72 views5 pages

SRM Institute of Science and Technology: Vadapalani Campus Department of Computer Science and Engineeering

This document provides steps to install Hadoop cluster on an EC2 Ubuntu instance for educational purposes. It involves installing Java 8, openssh server, downloading Hadoop files and configuring core-site.xml, yarn-site.xml, mapred-site.xml and hdfs-site.xml files. Directories are created for datanode, namenode and permissions set. Hadoop is started using start-dfs.sh and start-yarn.sh scripts. The status of daemons can be verified using jps command and Hadoop UI accessed via ports 8088 and 50070.

Uploaded by

Vidhyasagar B S Naidu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as RTF, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

72 views5 pages

SRM Institute of Science and Technology: Vadapalani Campus Department of Computer Science and Engineeering

Uploaded by

Vidhyasagar B S Naidu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as RTF, PDF, TXT or read online on Scribd

You are on page 1/ 5

SRM INSTITUTE OF SCIENCE AND TECHNOLOGY: VADAPALANI CAMPUS

DEPARTMENT OF COMPUTER SCIENCE AND ENGINEEERING

Prerequisite

ubuntu 16.04

Make ec2 as password Authentication:

use command for setting password to ec2 ubuntu image: sudo passwd ubuntu

Step:1 JAVA 8-----

1. sudo add-apt-repository ppa:webupd8team/java

2. sudo apt-get update
3. sudo apt-get install oracle-java8-installer
4. sudo apt-get install oracle-java8-set-default

Step 2: SSH SERVER INSTALLATION

5. sudo apt-get install openssh-server

6. sudo sed -i -e 's/PasswordAuthentication no/PasswordAuthentication yes/g'

/etc/ssh/sshd_config

7. ssh-keygen -t dsa -P “” -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

8. sudo service ssh restart

9. ssh localhost
//passwordless login
10. exit

Step 3: Download hadoop package

https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-2.7.3.tar.gz

10 .wget https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-
2.7.3.tar.gz

11. sudo tar -xzvf hadoop-2.7.3.tar.gz

sudo mkdir -p /usr/local/hadoop

sudo mv hadoop-2.7.3/* /usr/local/hadoop/

12. sudo chown -R ubuntu:ubuntu /usr/local/hadoop

//create folder for datanode and name node

13sudo mkdir -p /app/hadoop/tmp

14 sudo mkdir -p /app/hadoop/tmp

set permission

15 sudo chown -R ubuntu /app/hadoop/tmp

Step 4: Configure Hadoop:

 Check where your Java is installed:
 16 readlink -f /usr/bin/java

If you get something like /usr/lib/jvm/java-8-oracle/jre/bin/java,

/usr/lib/jvm/java-8-oracle is what you should used for JAVA_HOME.

 Add to ~/.bashrc file:

17 sudo nano ~/.bashrc

export JAVA_HOME=/usr/lib/jvm/java-8-oracle
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib/native"

 Reload ~/.bashrc file:

18 source ~/.bashrc
 Modify JAVA_HOME in

19 sudo nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/java-8-oracle

 Modify
20. sudo nano /usr/local/hadoop/etc/hadoop/core-site.xml

to have something like:

<configuration>
...
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>

<name>hadoop.tmp.dir</name>

<value>/app/hadoop/tmp</value>

<description>A base for other temporary directories.</description>

</property>

...
</configuration>

 Modify
21. sudo nano /usr/local/hadoop/etc/hadoop/yarn-site.xml

to have something like:

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:8025</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:8030</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master:8040</value>
</property>

 Create /usr/local/lib/hadoop-2.7.0/etc/hadoop/mapred-site.xml
from template:

21. cp /usr/local/hadoop/etc/hadoop/mapred-site.xml.template
/usr/local/hadoop/etc/hadoop/mapred-site.xml

 Modify
22. sudo nano /usr/local/hadoop/etc/hadoop/mapred-site.xml

to have something like:

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

 Modify
23. sudo nano /usr/local/hadoop/etc/hadoop/hdfs-site.xml

to have something like:

<property>
<name>dfs.replication</name>
<value>1</value>
</property>

</configuration>

 Format file system:

24. hdfs namenode -format

 Start Hadoop:
25. start-dfs.sh
26. start-yarn.sh
You might be asked to accept machine’s key.
 Check if everything is running:
27. jps

You should get something like:

Jps
NodeManager
NameNode
ResourceManager
DataNode
SecondaryNameNode

TYPE IN WEB BROWSER

28. http://localhost:8088/cluster
29. http://localhost:50070/

INSTALLED HADOOP CLUSTER SUCCESSFULLY IN AMAZON EC2

Github Copilot Coding With Copilot
100% (2)
Github Copilot Coding With Copilot
41 pages
Hadoop Installation On Linux
No ratings yet
Hadoop Installation On Linux
4 pages
Single Node Hadoop Cluster
No ratings yet
Single Node Hadoop Cluster
9 pages
Updated CMD
No ratings yet
Updated CMD
23 pages
Setting Hadoop and Mysql 8.0
No ratings yet
Setting Hadoop and Mysql 8.0
3 pages
BDA Practical1 MC18-23
No ratings yet
BDA Practical1 MC18-23
17 pages
Experiment No - 1
No ratings yet
Experiment No - 1
13 pages
Bdamanual
No ratings yet
Bdamanual
8 pages
Hadoop Installation Steps
100% (1)
Hadoop Installation Steps
6 pages
Hadoop 2 - Pseudo Node Installation
No ratings yet
Hadoop 2 - Pseudo Node Installation
9 pages
Support of Hadoop Cluster Installation and Administration
No ratings yet
Support of Hadoop Cluster Installation and Administration
10 pages
Big Data Analytics - Lab-Manual
No ratings yet
Big Data Analytics - Lab-Manual
19 pages
BDA Practical
No ratings yet
BDA Practical
38 pages
Installationof Hadoop 3
No ratings yet
Installationof Hadoop 3
6 pages
Installing A Single Node Hadoop Cluster
No ratings yet
Installing A Single Node Hadoop Cluster
4 pages
Hadoop
No ratings yet
Hadoop
5 pages
BDA LAB Programs
No ratings yet
BDA LAB Programs
56 pages
Step 1 - Install Oracle Java 8 On Ubuntu
No ratings yet
Step 1 - Install Oracle Java 8 On Ubuntu
7 pages
Hadoop InstallSteps
No ratings yet
Hadoop InstallSteps
14 pages
Single Node Cluster Creation in AWS Educate EC2
No ratings yet
Single Node Cluster Creation in AWS Educate EC2
4 pages
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster)
No ratings yet
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster)
27 pages
Hadoop Installation Step by Step
No ratings yet
Hadoop Installation Step by Step
8 pages
Installation of Hadoop in Ubuntu
No ratings yet
Installation of Hadoop in Ubuntu
15 pages
Online:: Setting Up The Environment
No ratings yet
Online:: Setting Up The Environment
9 pages
Hadoop Cluster Creation
No ratings yet
Hadoop Cluster Creation
8 pages
Hadoop
No ratings yet
Hadoop
4 pages
BDAO
No ratings yet
BDAO
23 pages
$ Sudo Apt-Get Install Oracle-Java8-Installer
No ratings yet
$ Sudo Apt-Get Install Oracle-Java8-Installer
4 pages
Hadoop 2.6.5 Installing On Ubuntu 16.04 and 18.04 (Single-Node Cluster)
No ratings yet
Hadoop 2.6.5 Installing On Ubuntu 16.04 and 18.04 (Single-Node Cluster)
7 pages
PRACTICAL 4 - Single and Multi Node Hadoop Install
No ratings yet
PRACTICAL 4 - Single and Multi Node Hadoop Install
11 pages
Hadoop Installation Final
No ratings yet
Hadoop Installation Final
32 pages
Big Data
No ratings yet
Big Data
5 pages
DataVisuaization Lab
No ratings yet
DataVisuaization Lab
5 pages
Hadoop Installation Commands
No ratings yet
Hadoop Installation Commands
3 pages
Bda Lab Manual
No ratings yet
Bda Lab Manual
45 pages
Hadoop Installation
No ratings yet
Hadoop Installation
5 pages
Hadoop Single Node Installation
No ratings yet
Hadoop Single Node Installation
7 pages
Hadoop 3 Installation
No ratings yet
Hadoop 3 Installation
10 pages
Hadoop Install
No ratings yet
Hadoop Install
19 pages
Bda Lab
No ratings yet
Bda Lab
37 pages
Nitish Steps To Install Hadoop
No ratings yet
Nitish Steps To Install Hadoop
3 pages
Hadoop Installation
No ratings yet
Hadoop Installation
7 pages
Installing Standalone and Pseudocode Hadoop Cluster: 1. Setting Up Vmware Virtual Machine
No ratings yet
Installing Standalone and Pseudocode Hadoop Cluster: 1. Setting Up Vmware Virtual Machine
14 pages
HADOOP 1.X Installation Steps On Ubuntu
No ratings yet
HADOOP 1.X Installation Steps On Ubuntu
3 pages
Hadoop 2.7.3 Setup On Ubuntu 15.10
No ratings yet
Hadoop 2.7.3 Setup On Ubuntu 15.10
7 pages
Hadoop Installation
No ratings yet
Hadoop Installation
6 pages
Hadoop Installation Manual 2.odt
No ratings yet
Hadoop Installation Manual 2.odt
20 pages
Java-Hadoop 2.X Setting Up
No ratings yet
Java-Hadoop 2.X Setting Up
12 pages
CP5261Data Analytics Laboratory
No ratings yet
CP5261Data Analytics Laboratory
57 pages
Big Data Analytics Lab Manual
No ratings yet
Big Data Analytics Lab Manual
80 pages
Anurag 1-6 Merged
No ratings yet
Anurag 1-6 Merged
60 pages
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster) STEP:1
No ratings yet
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster) STEP:1
13 pages
Experiment 1 Hadoop Installation
No ratings yet
Experiment 1 Hadoop Installation
6 pages
Single Node Cluster
No ratings yet
Single Node Cluster
31 pages
BDA Lab Manual
No ratings yet
BDA Lab Manual
49 pages
BDA Lab Manual UPDATED
No ratings yet
BDA Lab Manual UPDATED
45 pages
Original
No ratings yet
Original
17 pages
Hadoop Installation
No ratings yet
Hadoop Installation
7 pages
Hadoop Installation Final
No ratings yet
Hadoop Installation Final
5 pages
How To Install Hadoop On Ubuntu 18.04 or 20.04
No ratings yet
How To Install Hadoop On Ubuntu 18.04 or 20.04
15 pages
Resume Patel Subhash
No ratings yet
Resume Patel Subhash
4 pages
7 Comparing Algorithms
No ratings yet
7 Comparing Algorithms
7 pages
TESA REFLEX Panel Product Presentation V1 EN
No ratings yet
TESA REFLEX Panel Product Presentation V1 EN
24 pages
Networking Assignment
No ratings yet
Networking Assignment
82 pages
Best Websites
No ratings yet
Best Websites
34 pages
Library Management
73% (11)
Library Management
60 pages
Lab4 Top Level SSN Insertion
No ratings yet
Lab4 Top Level SSN Insertion
19 pages
Falancs User en PDF
No ratings yet
Falancs User en PDF
784 pages
FUSION TECH Intro
No ratings yet
FUSION TECH Intro
32 pages
XTS - Speed Dome IP Camera Quick Guide
No ratings yet
XTS - Speed Dome IP Camera Quick Guide
2 pages
Awt Questions
No ratings yet
Awt Questions
9 pages
Why The Business Model Canvas Is: But Not Great
No ratings yet
Why The Business Model Canvas Is: But Not Great
2 pages
CCSP Whitepaper
No ratings yet
CCSP Whitepaper
9 pages
The Security Workbench Application
No ratings yet
The Security Workbench Application
2 pages
Section23 - BPC Data Load4
No ratings yet
Section23 - BPC Data Load4
22 pages
Java Project
No ratings yet
Java Project
2 pages
RPI AR8600MK2 Instructions
No ratings yet
RPI AR8600MK2 Instructions
3 pages
Riso CV 3030
100% (2)
Riso CV 3030
2 pages
Marblesorterprojectreport
No ratings yet
Marblesorterprojectreport
10 pages
Cs Option: Illustrated Parts List
No ratings yet
Cs Option: Illustrated Parts List
11 pages
Orcad Component Information System: User's Guide
No ratings yet
Orcad Component Information System: User's Guide
142 pages
Fourpot Manu
No ratings yet
Fourpot Manu
34 pages
Lenovo Server Storage Price List 2019 Singapore
No ratings yet
Lenovo Server Storage Price List 2019 Singapore
57 pages
The Theatre of Max Reinhardt
No ratings yet
The Theatre of Max Reinhardt
351 pages
UT 300 R2U With DSL Lamp Type 1: If Configuration Is Not Saved, DO NOT Click
No ratings yet
UT 300 R2U With DSL Lamp Type 1: If Configuration Is Not Saved, DO NOT Click
11 pages
HEXAPP Readme
No ratings yet
HEXAPP Readme
3 pages
CCNA Routing and Switching - Introduction To Networks ITN Practice Skills Assessment - Packet Tracer
No ratings yet
CCNA Routing and Switching - Introduction To Networks ITN Practice Skills Assessment - Packet Tracer
3 pages
Priya Paper Final
No ratings yet
Priya Paper Final
9 pages
Bluecoat Syslog - Access Logs
No ratings yet
Bluecoat Syslog - Access Logs
4 pages

SRM Institute of Science and Technology: Vadapalani Campus Department of Computer Science and Engineeering

Uploaded by

SRM Institute of Science and Technology: Vadapalani Campus Department of Computer Science and Engineeering

Uploaded by

SRM INSTITUTE OF SCIENCE AND TECHNOLOGY: VADAPALANI CAMPUS

DEPARTMENT OF COMPUTER SCIENCE AND ENGINEEERING

Make ec2 as password Authentication:

Step:1 JAVA 8-----

1. sudo add-apt-repository ppa:webupd8team/java

Step 2: SSH SERVER INSTALLATION

5. sudo apt-get install openssh-server

6. sudo sed -i -e 's/PasswordAuthentication no/PasswordAuthentication yes/g'

7. ssh-keygen -t dsa -P “” -f ~/.ssh/id_dsa

8. sudo service ssh restart

Step 3: Download hadoop package

11. sudo tar -xzvf hadoop-2.7.3.tar.gz

sudo mv hadoop-2.7.3/* /usr/local/hadoop/

12. sudo chown -R ubuntu:ubuntu /usr/local/hadoop

//create folder for datanode and name node

13sudo mkdir -p /app/hadoop/tmp

14 sudo mkdir -p /app/hadoop/tmp

15 sudo chown -R ubuntu /app/hadoop/tmp

Step 4: Configure Hadoop:

If you get something like /usr/lib/jvm/java-8-oracle/jre/bin/java,

/usr/lib/jvm/java-8-oracle is what you should used for JAVA_HOME.

 Add to ~/.bashrc file:

17 sudo nano ~/.bashrc

 Reload ~/.bashrc file:

19 sudo nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh

to have something like:

<description>A base for other temporary directories.</description>

to have something like:

to have something like:

to have something like:

 Format file system:

You should get something like:

TYPE IN WEB BROWSER

INSTALLED HADOOP CLUSTER SUCCESSFULLY IN AMAZON EC2

You might also like