3.4 Introduction To HADOOP System

The document discusses the challenges of big data, focusing on volume, variety, and velocity, and presents Hadoop as a solution for managing these issues. Hadoop offers advantages such as low cost, scalability, and inherent data protection through features like Replication Factor and MapReduce programming. It emphasizes Hadoop's capabilities for massive data storage and faster data processing across multiple nodes.

Uploaded by

seceh93562

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views6 pages

3.4 Introduction To HADOOP System

Uploaded by

seceh93562

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 6

Big Data Challenges

•Volume, Variety and Velocity

• “How to store terabytes of
mounting data?”
• VOLUME
• “How to handle structured,
semi-structured and
unstructured data?”
• VARIETY
• “How to manage the data that
is getting generated at very fast
speed?”
• VELOCITY
Why Hadoop?
• Key consideration
• Hadoop can handle
ü Massive amount of data
ü Different kinds of data
ü In fast manner

Low cost – open source

• Advantages
Computing power – many nodes can be used for computation

Scalability – simple add nodes in system

Storage Flexibility – can store unstructured data easily

Inherent data protection – protects against hardware failures

Distributed Computing Challenges

• Problems and Solutions

• Storage of huge amount of data
ü More systems , more failures
ü How to retrieve the data stored on the failed node?
ü Hadoop solves this by Replication Factor (RF)
ü Number of data copies of a given data item / data block stored across the network

ü Processing the huge amount of data

ü Data is spread across systems, how to process it in quick manner
ü Challenge is to integrate data from different machines before processing
ü Hadoop solves this by MapReduce Programming
ü Programming model to process huge amount of data at same time in quick manner
What is Hadoop?

• Key Aspects
• Two Tasks
ü Massive Data Storage
q Huge of amount of data across several nodes
q Uses low cost commodity storage

ü Faster Data Processing

q Has everything needed for data processing
application development
q Computation done parallel on several nodes at
same time
Hadoop Ecosystem
Hadoop Ecosystem
Hadoop High Level Architecture

BAD601 Module 2 PDF
No ratings yet
BAD601 Module 2 PDF
61 pages
Practice Sums
No ratings yet
Practice Sums
2 pages
Big Data & Hadoop Training Material 0 1 PDF
50% (2)
Big Data & Hadoop Training Material 0 1 PDF
168 pages
Apache Hadoop Developer Training PDF
100% (1)
Apache Hadoop Developer Training PDF
397 pages
Unit 1 - Intro To Cloud Computing - 2024
No ratings yet
Unit 1 - Intro To Cloud Computing - 2024
79 pages
Seminar Report PDF
100% (2)
Seminar Report PDF
35 pages
Apache Hadoop Training
No ratings yet
Apache Hadoop Training
377 pages
Big Data Introduction PDF
No ratings yet
Big Data Introduction PDF
180 pages
Unit 4 Cloud Security 25
No ratings yet
Unit 4 Cloud Security 25
90 pages
Cash - Flow - Forecasting - Revised
No ratings yet
Cash - Flow - Forecasting - Revised
16 pages
Meanings of Terms
No ratings yet
Meanings of Terms
14 pages
Types of Analytics2
No ratings yet
Types of Analytics2
14 pages
Hadoop Phase1 Notes
No ratings yet
Hadoop Phase1 Notes
4 pages
Unit 5
No ratings yet
Unit 5
32 pages
Hadoop Presentation
No ratings yet
Hadoop Presentation
19 pages
Asian Development Bank (ADB)
No ratings yet
Asian Development Bank (ADB)
6 pages
NOSQL Database
No ratings yet
NOSQL Database
6 pages
Costs and Budgeting
No ratings yet
Costs and Budgeting
15 pages
Module 2
No ratings yet
Module 2
34 pages
Examples of Sensitivity Analysis in Financial Modeling
No ratings yet
Examples of Sensitivity Analysis in Financial Modeling
5 pages
Internal Assessment SYFinTech 2024
No ratings yet
Internal Assessment SYFinTech 2024
5 pages
3.3 Computing
No ratings yet
3.3 Computing
5 pages
BIGDATA
No ratings yet
BIGDATA
180 pages
Cases Against Quick Heal
No ratings yet
Cases Against Quick Heal
3 pages
Important Questions
No ratings yet
Important Questions
3 pages
Fintech Sybcom - SQL Syllabus
No ratings yet
Fintech Sybcom - SQL Syllabus
3 pages
Hadoop
No ratings yet
Hadoop
3 pages
Unit IV Hadoop
No ratings yet
Unit IV Hadoop
90 pages
Big Data 2 - Part
No ratings yet
Big Data 2 - Part
40 pages
Apache Hadoop and Spark:: and Use Cases For Data Analysis
No ratings yet
Apache Hadoop and Spark:: and Use Cases For Data Analysis
48 pages
Bsd1313 Chapter 4
No ratings yet
Bsd1313 Chapter 4
129 pages
C-1.1 Types of Digital Data
No ratings yet
C-1.1 Types of Digital Data
20 pages
SQL Syntax
No ratings yet
SQL Syntax
11 pages
Quickheal Yr 2022-23
No ratings yet
Quickheal Yr 2022-23
7 pages
Quickheal Yr 2023-24
No ratings yet
Quickheal Yr 2023-24
7 pages
Unit-I Material
No ratings yet
Unit-I Material
32 pages
SY - Practice Sums - Answer Keys
No ratings yet
SY - Practice Sums - Answer Keys
2 pages
FA and Capital Budgeting
No ratings yet
FA and Capital Budgeting
2 pages
Case Studies - Cash Flow& Ratio
No ratings yet
Case Studies - Cash Flow& Ratio
2 pages
Quickheal Yr 2020-21
No ratings yet
Quickheal Yr 2020-21
6 pages
Top Hadoop Interview Q&A
No ratings yet
Top Hadoop Interview Q&A
25 pages
BDA Final Notes
No ratings yet
BDA Final Notes
53 pages
Case Studies - Corporate Accounting
No ratings yet
Case Studies - Corporate Accounting
2 pages
Bda QB
No ratings yet
Bda QB
18 pages
Cloud Computing Unit-5
No ratings yet
Cloud Computing Unit-5
22 pages
Bda Ut-1 Qbank Ans by Rba
No ratings yet
Bda Ut-1 Qbank Ans by Rba
29 pages
Big Data Analysis Unit 1-5 Extended
No ratings yet
Big Data Analysis Unit 1-5 Extended
35 pages
Hadoop in Bigdata Processing Concept
No ratings yet
Hadoop in Bigdata Processing Concept
2 pages
Big Data
No ratings yet
Big Data
3 pages
Apache Hadoop Developer Training PDF
No ratings yet
Apache Hadoop Developer Training PDF
394 pages
Unit-5 - Hadoop
No ratings yet
Unit-5 - Hadoop
29 pages
Elementary Concepts of Big Data and Hadoop
No ratings yet
Elementary Concepts of Big Data and Hadoop
4 pages
Quickheal Yr 2021-22
No ratings yet
Quickheal Yr 2021-22
7 pages
Apache Hadoop Developer Training
100% (1)
Apache Hadoop Developer Training
394 pages
Big Data
No ratings yet
Big Data
4 pages
IET Udaipur BDA Unit-1
No ratings yet
IET Udaipur BDA Unit-1
10 pages
BDA Unit-3
No ratings yet
BDA Unit-3
47 pages
Big Data
No ratings yet
Big Data
27 pages
HADOOP
No ratings yet
HADOOP
55 pages
International Economics SY FINTECH
No ratings yet
International Economics SY FINTECH
2 pages
Bda Ut1 Que Ans
No ratings yet
Bda Ut1 Que Ans
13 pages
Sdcbdasparkweek1 1
No ratings yet
Sdcbdasparkweek1 1
9 pages
Shortnotes For Cloud
No ratings yet
Shortnotes For Cloud
22 pages
Big Data Analysis
No ratings yet
Big Data Analysis
8 pages
Analyzing Big Data in Hadoop Spark
No ratings yet
Analyzing Big Data in Hadoop Spark
30 pages
Big Data and Mapreduce Challenges, Opportunities and Trends
No ratings yet
Big Data and Mapreduce Challenges, Opportunities and Trends
9 pages
11 Lecture
No ratings yet
11 Lecture
22 pages
CC Unit - 5
No ratings yet
CC Unit - 5
27 pages
Lect 2 Big Data Lesson01
No ratings yet
Lect 2 Big Data Lesson01
26 pages
The Age OF: Every Minute
No ratings yet
The Age OF: Every Minute
47 pages
Haddob Lab Report
No ratings yet
Haddob Lab Report
12 pages
Hadoop Lab
100% (1)
Hadoop Lab
32 pages
Apache Hadoop
No ratings yet
Apache Hadoop
27 pages
Big Data Analytics
No ratings yet
Big Data Analytics
12 pages
Cloud Comp Techno
No ratings yet
Cloud Comp Techno
5 pages
Updated Unit-2
0% (1)
Updated Unit-2
55 pages
A Review Paper On Big Data
No ratings yet
A Review Paper On Big Data
5 pages
Testing Big Data: Camelia Rad
No ratings yet
Testing Big Data: Camelia Rad
31 pages
Big Data
No ratings yet
Big Data
29 pages
BDA Answers-1
No ratings yet
BDA Answers-1
15 pages
Subject: Data Driven Decision Making: Apache Hadoop For Big Data
No ratings yet
Subject: Data Driven Decision Making: Apache Hadoop For Big Data
5 pages
Big Data
No ratings yet
Big Data
3 pages
Hadoop Ecosystem for Big Data
From Everand
Hadoop Ecosystem for Big Data
Dr. Zemelak Goraga
No ratings yet
Big Data Analytics
From Everand
Big Data Analytics
Nitin Kumar Yadav
No ratings yet
Database And Computer Management: SERIES 1, #3
From Everand
Database And Computer Management: SERIES 1, #3
Elias Mutegi
No ratings yet
Apache Hive Handbook: Query, Analyze, and Optimize Big Data
From Everand
Apache Hive Handbook: Query, Analyze, and Optimize Big Data
Robert Johnson
No ratings yet
The Power of Big Data: Transforming Industries and Shaping the Future
From Everand
The Power of Big Data: Transforming Industries and Shaping the Future
Tom Henricksen
No ratings yet

3.4 Introduction To HADOOP System

Uploaded by

3.4 Introduction To HADOOP System

Uploaded by

Big Data Challenges

•Volume, Variety and Velocity

Low cost – open source

Scalability – simple add nodes in system

Storage Flexibility – can store unstructured data easily

Inherent data protection – protects against hardware failures

• Problems and Solutions

ü Processing the huge amount of data

ü Faster Data Processing

You might also like