6 H Data With Hive Big Data Analytics B.tech. Final Year

Uploaded by

RISHIKA ARORA

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

106 views24 pages

6 H Data With Hive Big Data Analytics B.tech. Final Year

Uploaded by

RISHIKA ARORA

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 24

Women Engg.

College, Ajmer

Presented by : Monalisa Meena

Assistant Professor
Dept. of Computer Enginerring
Big Data Analytics
Credit: 3
Max. Marks: 150(IA:30, ETE:120) 3L+0T+0P End Term Exam: 3 Hours
 Objective,
 scope and
 outcome of the course.
 Big data features and challenges, Problems
with Traditional Large-Scale System , Sources
of Big Data, 3 V’s of Big Data, Types of Data.
Working with Big Data: Google File System.
Hadoop Distributed File System (HDFS) -
Building blocks of Hadoop (Namenode. Data
node. Secondary Namenode. Job Tracker.
Task Tracker), Introducing and Configuring
Hadoop cluster (Local. Pseudo- distributed
mode, Fully Distributed mode). Configuring
XML files.
 A Weather Dataset. Understanding Hadoop
API for MapReduce Framework (Old and New).
Basic programs of Hadoop MapReduce: Driver
code. Mapper code, Reducer code. Record
Reader, Combiner,Partitioner.
 The Writable Interface. Writable Comparable
and comparators. Writable Classes: Writable
wrappers for Java primitives. Text. Bytes
Writable. Null Writable, Object Writable and
Generic Writable. Writable collections.
Implementing a Custom Writable:
Implementing a Raw Comparator for speed,
Custom comparators.
 Hadoop Programming Made Easier Admiring
the Pig Architecture, Going with the Pig Latin
Application Flow. Working through the ABCs
of Pig Latin. Evaluating Local and Distributed
Modes of Running Pig Scripts, Checking out
the Pig Script Interfaces, Scripting with Pig
Latin.
 Saying Hello to Hive, Seeing How the Hive is
Put Together, Getting Started with Apache
Hive. Examining the Hive Clients. Working
with Hive Data Types. Creating and Managing
Databases and Tables, Seeing How the Hive
Data Manipulation Language Works, Querying
and Analyzing Data.
 Most Popular Dataware House
 The Apache Hive ™ data warehouse software
facilitates reading, writing, and managing
large datasets residing in distributed storage
using SQL.
 Originaly developed by facebook
 Now maintained by Apache Hive by Apache
Foundation
 A command line tool and JDBC driver are
provided to connect users to Hive.
 Traditional- SQL queries for extracting data.
 Hadoop and big data
 Hive provides SQL intellect, so that users can
write SQL like queries-HQL to extract the data
from hadoop
 Used in OLAP
 Scalable, Flexible and fast
 Helpful for the users to write SQL like queries
for the dataset which resides in HDFS.
 It is not the relational databases.
 Not be used in OLTP
 Not be used for real time updates and
queries, and applications where low latency
data retrieval is required
1. Used for data Analysis
2. Supports different file formats
3. Metadata is in RDBMS
4. Compression techniques
5. HQL support
6. UDF support
7. Specialized join operations
8. Simplifies and abstracts load on hadoop
9. No need to learn java and hadoop API
 Data Mining
 Document Indexing
 Predictive modelling
 Business Intelligence
 Log processing
 SQL type Queries
 OLAP based design
 Fast
 Scalable
 Hive closely associated with RDBMS/EDW
technology is extract, transform, and load
(ETL) technology.
 extract unstructured text data from an
Internet forum
 transform the data into a structured format
 then load the structured data into its EDW.
 Apache Hive gives you powerful analytical
tools, all within the framework of HiveQL.
1. Hive command-line interface (CLI)
2. Hive Web Interface (HWI) Server
3. Open source SQuirreL client using the JDBC
driver.
hadoop-and-big-data-unit-6.pdf
 Integers
◦ Tinyint
◦ Smallint
◦ Int
◦ Bigint
 Float
◦ Float
◦ Double

 String
 Boolean
 Same as RDBMS with default settings
 Alter table emp rename to Employee
 Alter table employee add column(address
string)
 Alter table employee change name string to
firstname string
 hadoop-and-big-data-unit-6.pdf

Module 4
No ratings yet
Module 4
51 pages
DA Unit-5
No ratings yet
DA Unit-5
78 pages
BDA Session 5
No ratings yet
BDA Session 5
41 pages
Hive - PIG - HBase - Zookeeper
100% (1)
Hive - PIG - HBase - Zookeeper
31 pages
Big-Data-Unit 5
No ratings yet
Big-Data-Unit 5
54 pages
Bda 4 Og
No ratings yet
Bda 4 Og
18 pages
Lecture 11 - Introduction To Apache Hive
No ratings yet
Lecture 11 - Introduction To Apache Hive
12 pages
Hadoop Intro - Part1
No ratings yet
Hadoop Intro - Part1
45 pages
Unit-IV - BDA
No ratings yet
Unit-IV - BDA
42 pages
Big-Data-Unit 5
No ratings yet
Big-Data-Unit 5
54 pages
Big Data Unit 5 (Easy Notes) Edushine Classes
No ratings yet
Big Data Unit 5 (Easy Notes) Edushine Classes
42 pages
Session 3.1
No ratings yet
Session 3.1
29 pages
Hive Updated
No ratings yet
Hive Updated
18 pages
S Pig Hive HBase
No ratings yet
S Pig Hive HBase
19 pages
Unit 4 Hadoop Eco System PDF
No ratings yet
Unit 4 Hadoop Eco System PDF
78 pages
BD Unit3 Summary
No ratings yet
BD Unit3 Summary
6 pages
Bda Ia-3 QB-1
No ratings yet
Bda Ia-3 QB-1
17 pages
Cof-C02 5
No ratings yet
Cof-C02 5
38 pages
BIGDATUNIT5
No ratings yet
BIGDATUNIT5
32 pages
06 Hadoop Query Languages
No ratings yet
06 Hadoop Query Languages
23 pages
Big Data Analytics Using Hadoop Tools - Apache Hive VS Apache Pig - 1604726800
No ratings yet
Big Data Analytics Using Hadoop Tools - Apache Hive VS Apache Pig - 1604726800
5 pages
Unit 5 (Pig, Hive, Hbase)
No ratings yet
Unit 5 (Pig, Hive, Hbase)
18 pages
BD U-5 (Anupam Sir)
No ratings yet
BD U-5 (Anupam Sir)
12 pages
Unit 5 Short
No ratings yet
Unit 5 Short
14 pages
Unit-5 (1) BD
No ratings yet
Unit-5 (1) BD
18 pages
Bda Report
No ratings yet
Bda Report
16 pages
Unit-V CC&BD CS62
No ratings yet
Unit-V CC&BD CS62
73 pages
Hive Full Lecture
No ratings yet
Hive Full Lecture
17 pages
Hive - Self Learning Notes
No ratings yet
Hive - Self Learning Notes
69 pages
BDA Module-4
No ratings yet
BDA Module-4
4 pages
Big Data Overview
No ratings yet
Big Data Overview
39 pages
BigData Analytics Unit-V
No ratings yet
BigData Analytics Unit-V
21 pages
Unit 5-1
No ratings yet
Unit 5-1
8 pages
Big Data
No ratings yet
Big Data
120 pages
Bda Bi Jit Chapter-5
No ratings yet
Bda Bi Jit Chapter-5
27 pages
Unit 5 Lecture No-1 (Hive)
No ratings yet
Unit 5 Lecture No-1 (Hive)
30 pages
Data Analytics Chapter 5
No ratings yet
Data Analytics Chapter 5
14 pages
Unit 3 BDA
No ratings yet
Unit 3 BDA
44 pages
Unit 5 Lecture No-1 (Hive)
No ratings yet
Unit 5 Lecture No-1 (Hive)
30 pages
Module 5 - Data Analytics
No ratings yet
Module 5 - Data Analytics
4 pages
Bda 06
No ratings yet
Bda 06
15 pages
Hive Pig
No ratings yet
Hive Pig
20 pages
Lecture38 PDF
No ratings yet
Lecture38 PDF
23 pages
Leçon4 Hadoop Query Languages
No ratings yet
Leçon4 Hadoop Query Languages
21 pages
Module 5 Dbms Notes bcs403
No ratings yet
Module 5 Dbms Notes bcs403
11 pages
(R17a0528) Big Data Analytics-57-100
No ratings yet
(R17a0528) Big Data Analytics-57-100
44 pages
Hive Data Types and Data Models
No ratings yet
Hive Data Types and Data Models
24 pages
Hive
No ratings yet
Hive
5 pages
IET Udaipur BDA Unit-5
No ratings yet
IET Udaipur BDA Unit-5
9 pages
Unit 5 (BDC)
No ratings yet
Unit 5 (BDC)
59 pages
Session 3.2
No ratings yet
Session 3.2
27 pages
Bda Notes Jntuk R20 Unit 4
No ratings yet
Bda Notes Jntuk R20 Unit 4
14 pages
Teradata To Snowflake Migration Guide
100% (2)
Teradata To Snowflake Migration Guide
15 pages
Big Data Analytics Unit 4
No ratings yet
Big Data Analytics Unit 4
83 pages
RDBMS Lab Manual Mechanical RGPV
0% (1)
RDBMS Lab Manual Mechanical RGPV
14 pages
Mysql Interview Questions For Experienced
No ratings yet
Mysql Interview Questions For Experienced
8 pages
BD - Unit - IV - Hive and Pig
No ratings yet
BD - Unit - IV - Hive and Pig
41 pages
Unit 5 Bda
No ratings yet
Unit 5 Bda
18 pages
Big Data Hadoop - Course Curriculum - V1
No ratings yet
Big Data Hadoop - Course Curriculum - V1
7 pages
Top 50 SQL Interview Questions
No ratings yet
Top 50 SQL Interview Questions
8 pages
Using Hive For Data Warehousing: Introduction To Hive
No ratings yet
Using Hive For Data Warehousing: Introduction To Hive
4 pages
Procedure For DB Refresh
No ratings yet
Procedure For DB Refresh
3 pages
Summarization Levels - Profitability Analysis (COPA) - SAP Library
No ratings yet
Summarization Levels - Profitability Analysis (COPA) - SAP Library
3 pages
10 Popular Data Science Tools To Consider Exploring
No ratings yet
10 Popular Data Science Tools To Consider Exploring
9 pages
15 Free SEO Tools To Drive Traffic
100% (1)
15 Free SEO Tools To Drive Traffic
44 pages
Data Base Systems
No ratings yet
Data Base Systems
179 pages
Cassandra Hadoop Integration
No ratings yet
Cassandra Hadoop Integration
2 pages
PL SQL
No ratings yet
PL SQL
27 pages
Business Intelligence Be Aids (End Sem) (2019 Pa - 250529 - 203606
No ratings yet
Business Intelligence Be Aids (End Sem) (2019 Pa - 250529 - 203606
3 pages
Constraints and Triggers: Deferring Constraint Checking
No ratings yet
Constraints and Triggers: Deferring Constraint Checking
82 pages
SQL - Injctions Loop Joks
No ratings yet
SQL - Injctions Loop Joks
35 pages
Employee Database Template
No ratings yet
Employee Database Template
3 pages
Chapter 2 File Systems
No ratings yet
Chapter 2 File Systems
4 pages
CH 05 Data Engineering
No ratings yet
CH 05 Data Engineering
28 pages
MSSQL To Tibero Migration
No ratings yet
MSSQL To Tibero Migration
20 pages
00 Introduction
No ratings yet
00 Introduction
23 pages
Homeshopping - PK: The Largest Store For Online Shopping in Pakistan
No ratings yet
Homeshopping - PK: The Largest Store For Online Shopping in Pakistan
12 pages
Grade 7-Term 2 - Computer Practical Exam - Sample Question Paper
No ratings yet
Grade 7-Term 2 - Computer Practical Exam - Sample Question Paper
2 pages
Backup and Recovery and Security
No ratings yet
Backup and Recovery and Security
10 pages
M.D.V.Lakshmi Resume
No ratings yet
M.D.V.Lakshmi Resume
2 pages
CV 50
No ratings yet
CV 50
2 pages
Stimulsoft Reports - Mobile FAQ - en
No ratings yet
Stimulsoft Reports - Mobile FAQ - en
6 pages
Student Record Keeping System
No ratings yet
Student Record Keeping System
1 page
SQL Server Cheat Sheet: by Via
No ratings yet
SQL Server Cheat Sheet: by Via
1 page
Summary:: Project Details: Customer Knowledge Platform Application in Wal-Mart
No ratings yet
Summary:: Project Details: Customer Knowledge Platform Application in Wal-Mart
1 page
Big Data Analytics
From Everand
Big Data Analytics
Nitin Kumar Yadav
No ratings yet
Learning Hadoop 2
From Everand
Learning Hadoop 2
Garry Turkington
4/5 (1)
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
From Everand
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
Wei Liu
No ratings yet
Apache Hive Handbook: Query, Analyze, and Optimize Big Data
From Everand
Apache Hive Handbook: Query, Analyze, and Optimize Big Data
Robert Johnson
No ratings yet
Learn Hive in 24 Hours
From Everand
Learn Hive in 24 Hours
Alex Nordeen
No ratings yet

6 H Data With Hive Big Data Analytics B.tech. Final Year

Uploaded by

6 H Data With Hive Big Data Analytics B.tech. Final Year

Uploaded by

Women Engg.

Presented by : Monalisa Meena

You might also like