Big Data Lecture

Uploaded by

sonia

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views49 pages

Big Data Lecture

Uploaded by

sonia

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 49

Big Data Query Language

20CS2005
The student will be able to
1. understand the importance and challenges of Big data
2. design applications using HADOOP and RHADOOP
3. identify the appropriate function of PIG data model to be used in development
4. model Big data applications schema and use HIVE QL
5. develop applications with Cassandra.
6. build applications with HDFS and MapReduce
Module 2: Data Analysis using R and Hadoop
Features of R language - HADOOP Features - HDFS and MapReduce architecture - R and Hadoop
Integrated Programming Environment (RHIPE) Introduction - Architecture of RHIPE - RHIPE function
reference - RHADOOP Introduction - Architecture of RHADOOP - RHADOOP function reference, SQL on
HADOOP.
Big Data
Hadoop and
Spark
History of
Spark
Given to the
Apache Software Exists as a next
Started at UC generation real-
Berkeley Foundation and
time and batch
AM PLab by the license was processing
Matei Zaharia changed to Apache framework
2.0
201
2009 3 Present

2010 2014

Open Became an Apache

sourced top- level project.
under a Used by Databricks
BSD to set a world
license record in large-scale
sorting
Limitations of MapReduce in
Hadoop

Unsuitable for real-time processing

Being batch oriented, it takes minutes to execute jobs
depending on
the amount of data and number of nodes in the cluster.

Unsuitable for trivial operations

For operations like Filter and Joins, you might need to rewrite
the jobs,
which becomes complex because of the key-value pattern.

Unsuitable for large data on network

Since it works on the data locality principle, it cannot
process a lot of data that requires shuffl ing over the
network.
Limitations of MapReduce in
Hadoop

Unsuitable with OLTP

OLTP requires a large number of short transactions, as it
works on the batch-oriented framework.

Unsuitable for processing graphs

The Apache Graph library processes graphs, that adds
additional
complexity on top of MapReduce.

Unsuitable for iterative execution

Being a stateless execution, MapReduce doesn’t fit in use
cases like k- means that need iterative execution.
Click icon to add picture

THANK YOU

Voltlogic230 Manual en
No ratings yet
Voltlogic230 Manual en
51 pages
The Flexible Body Move Better Anywhere Anytime
No ratings yet
The Flexible Body Move Better Anywhere Anytime
1 page
Big Data & Hadoop Training Material 0 1 PDF
50% (2)
Big Data & Hadoop Training Material 0 1 PDF
168 pages
Big Data Emerging Technologie
No ratings yet
Big Data Emerging Technologie
10 pages
BDA-2 Hadoop
No ratings yet
BDA-2 Hadoop
28 pages
Hadoop Ecosystem
No ratings yet
Hadoop Ecosystem
21 pages
BDA Presentations Unit-4 - Hadoop, Ecosystem
100% (1)
BDA Presentations Unit-4 - Hadoop, Ecosystem
25 pages
Chap3 OverviewOfBigDataEcosystem
No ratings yet
Chap3 OverviewOfBigDataEcosystem
91 pages
226 Unit-7
No ratings yet
226 Unit-7
26 pages
BigData Unit 2
No ratings yet
BigData Unit 2
15 pages
Module 2.2
No ratings yet
Module 2.2
32 pages
A Critical Analysis of Apache Hadoop and Spark For Big Data Processing
No ratings yet
A Critical Analysis of Apache Hadoop and Spark For Big Data Processing
6 pages
BIG Data Analytics 21CSH-471: Computer Science & Engineering
No ratings yet
BIG Data Analytics 21CSH-471: Computer Science & Engineering
24 pages
Unit 5 Bda
No ratings yet
Unit 5 Bda
42 pages
BigData Nov2019
No ratings yet
BigData Nov2019
50 pages
Dhan Singh Big Data File - 7
No ratings yet
Dhan Singh Big Data File - 7
1 page
Hadoop Tools - A Brief Overview
No ratings yet
Hadoop Tools - A Brief Overview
18 pages
4 Hadoop Ecosystem
No ratings yet
4 Hadoop Ecosystem
16 pages
Open Source Technologies
No ratings yet
Open Source Technologies
19 pages
CC Unit 2
No ratings yet
CC Unit 2
29 pages
Big Data BASICS
No ratings yet
Big Data BASICS
3 pages
Lab Manual BDA
No ratings yet
Lab Manual BDA
36 pages
DA Unit 5
100% (1)
DA Unit 5
191 pages
DM - Topic Five
No ratings yet
DM - Topic Five
30 pages
Big Data Handling Techniques
No ratings yet
Big Data Handling Techniques
21 pages
09 Programming Hadoop - Spark, R and Pig
No ratings yet
09 Programming Hadoop - Spark, R and Pig
80 pages
Introduction To BigData Hadoop
No ratings yet
Introduction To BigData Hadoop
12 pages
Module 2
No ratings yet
Module 2
20 pages
Unit 3 ETI (BDA)
No ratings yet
Unit 3 ETI (BDA)
34 pages
Unit 4 Hadoop Eco System PDF
No ratings yet
Unit 4 Hadoop Eco System PDF
78 pages
Big Data Course Agenda
No ratings yet
Big Data Course Agenda
3 pages
Spark Streaming Research
No ratings yet
Spark Streaming Research
6 pages
06 Big Data
No ratings yet
06 Big Data
52 pages
CASE STUDY On Application of Hadoop
No ratings yet
CASE STUDY On Application of Hadoop
16 pages
Bba13 Notes BDF Unit 1
No ratings yet
Bba13 Notes BDF Unit 1
3 pages
Module 2. 16974328568170
No ratings yet
Module 2. 16974328568170
113 pages
Unit 4 BDTT
No ratings yet
Unit 4 BDTT
23 pages
HADOOP
No ratings yet
HADOOP
10 pages
MA - VaishuAchini - VIT - 24 - ICT703 - A3
No ratings yet
MA - VaishuAchini - VIT - 24 - ICT703 - A3
21 pages
Big Data Analytics QP
No ratings yet
Big Data Analytics QP
36 pages
Hadoop MCQ Challenge
No ratings yet
Hadoop MCQ Challenge
63 pages
Unit 2
No ratings yet
Unit 2
9 pages
Hadoop PPT
No ratings yet
Hadoop PPT
25 pages
Hadoop V.01
No ratings yet
Hadoop V.01
24 pages
What Is Apache Pig
No ratings yet
What Is Apache Pig
8 pages
8 MapReduce Different Phases 08-01-2025
No ratings yet
8 MapReduce Different Phases 08-01-2025
28 pages
Hadoop and Their Ecosystem
100% (2)
Hadoop and Their Ecosystem
24 pages
Big Data Analytics Using Hadoop
No ratings yet
Big Data Analytics Using Hadoop
26 pages
Poetic Seminar
No ratings yet
Poetic Seminar
17 pages
Big Data?: Hadoop?
No ratings yet
Big Data?: Hadoop?
2 pages
Big Data 2 - Part
No ratings yet
Big Data 2 - Part
40 pages
Big Data Engines: Binary Batch Processing
No ratings yet
Big Data Engines: Binary Batch Processing
12 pages
Bda Unit Iv Notes
No ratings yet
Bda Unit Iv Notes
32 pages
SPARK
No ratings yet
SPARK
47 pages
Data Analytics Chapter 5
No ratings yet
Data Analytics Chapter 5
14 pages
Unit 2-1
No ratings yet
Unit 2-1
43 pages
Big Data Analytics Using Hadoop Tools - Apache Hive VS Apache Pig - 1604726800
No ratings yet
Big Data Analytics Using Hadoop Tools - Apache Hive VS Apache Pig - 1604726800
5 pages
Big Data and Its Impact On Data Warehousing
No ratings yet
Big Data and Its Impact On Data Warehousing
18 pages
Replication-Based Query Management For Resource Allocation Using Hadoop and MapReduce Over Big Data
No ratings yet
Replication-Based Query Management For Resource Allocation Using Hadoop and MapReduce Over Big Data
13 pages
Professional Hadoop Solutions
From Everand
Professional Hadoop Solutions
Boris Lublinsky
4/5 (2)
Kafka Up and Running for Network DevOps: Set Your Network Data in Motion
From Everand
Kafka Up and Running for Network DevOps: Set Your Network Data in Motion
Eric Chou
No ratings yet
Learning Hadoop 2
From Everand
Learning Hadoop 2
Garry Turkington
4/5 (1)
Module 4 - Yarn
No ratings yet
Module 4 - Yarn
34 pages
Module 5 - Flume
No ratings yet
Module 5 - Flume
23 pages
Module 4 - Yarn Schedulers
No ratings yet
Module 4 - Yarn Schedulers
21 pages
Module 5 - Mahout
No ratings yet
Module 5 - Mahout
20 pages
Module 5
No ratings yet
Module 5
4 pages
Control Engineering August 2020
No ratings yet
Control Engineering August 2020
70 pages
Annual Maintenance Contract - IMA, Pune
No ratings yet
Annual Maintenance Contract - IMA, Pune
5 pages
Career in IT
No ratings yet
Career in IT
19 pages
Clonamos El Repositorio para Obtener Los Dataset: From Import
No ratings yet
Clonamos El Repositorio para Obtener Los Dataset: From Import
23 pages
Grammy Awards Emmy Awards Tony Awards: Page 1 of 3 Deus-0755405492
No ratings yet
Grammy Awards Emmy Awards Tony Awards: Page 1 of 3 Deus-0755405492
3 pages
Distributed Network Protocol & IEC 61850 - COPA DATA
No ratings yet
Distributed Network Protocol & IEC 61850 - COPA DATA
8 pages
MS Office
No ratings yet
MS Office
8 pages
Ffmpeg Watch-Folder PDF
No ratings yet
Ffmpeg Watch-Folder PDF
2 pages
SAP-Solution Manager Manual
No ratings yet
SAP-Solution Manager Manual
9 pages
Coding Problems
No ratings yet
Coding Problems
3 pages
GDM December 1999
No ratings yet
GDM December 1999
43 pages
JSS3 Exam Ist Term
100% (1)
JSS3 Exam Ist Term
10 pages
Introducing Web Forms: VB Intro1.aspx
No ratings yet
Introducing Web Forms: VB Intro1.aspx
42 pages
Certificate of Calibration Traceable To NIST
No ratings yet
Certificate of Calibration Traceable To NIST
43 pages
Network Security Lab
No ratings yet
Network Security Lab
3 pages
Chapter 1 Part 2
No ratings yet
Chapter 1 Part 2
48 pages
Irfan Jalal Bhat
No ratings yet
Irfan Jalal Bhat
19 pages
Introduction To Access Database
No ratings yet
Introduction To Access Database
29 pages
Computer Engineering Thesis Ideas
100% (2)
Computer Engineering Thesis Ideas
4 pages
OS Unit 5
No ratings yet
OS Unit 5
63 pages
Anshul Final Ultra
No ratings yet
Anshul Final Ultra
3 pages
GATE Electrical Engineering 2014 Set 1
No ratings yet
GATE Electrical Engineering 2014 Set 1
21 pages
Topic 4 - Data Mining Tools and Technique
No ratings yet
Topic 4 - Data Mining Tools and Technique
22 pages
C Library Functions
No ratings yet
C Library Functions
62 pages
Coa Unit 4 Digital Notes
No ratings yet
Coa Unit 4 Digital Notes
160 pages
Starplat 1 41 Datasheet v5-1 Eng
No ratings yet
Starplat 1 41 Datasheet v5-1 Eng
9 pages
Anviz C2Slim QuickGuide EN 8.28.2018
No ratings yet
Anviz C2Slim QuickGuide EN 8.28.2018
2 pages
Mag GTI Issue 2018-3
No ratings yet
Mag GTI Issue 2018-3
100 pages

Big Data Lecture

Uploaded by

Big Data Lecture

Uploaded by

Big Data Query Language

Open Became an Apache

Unsuitable for real-time processing

Unsuitable for trivial operations

Unsuitable for large data on network

Unsuitable with OLTP

Unsuitable for processing graphs

Unsuitable for iterative execution

You might also like