0% found this document useful (0 votes)

54 views3 pages

Advanta Innovation: Course Objective Summary

This course covers the fundamentals of big data, Hadoop, and related technologies like MapReduce, HDFS, Pig, Hive, HBase and Oozie. Students will learn about big data challenges and how Hadoop provides a framework to process vast amounts of data in a distributed manner. The course includes hands-on exercises for developing MapReduce applications, interacting with HDFS and running jobs on a Hadoop cluster. Students will also learn conceptual aspects of Pig, Hive, HBase and scheduling workflows with Oozie. Real-life use cases are discussed to demonstrate how companies employ Hadoop technologies at scale.

Uploaded by

Faraz Matin

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

54 views3 pages

Advanta Innovation: Course Objective Summary

Uploaded by

Faraz Matin

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Advanta Innovation

Course Objective Summary

During this course, you will learn:
Introduction to Big Data and Hadoop
Hadoop ecosystem - Concepts
Hadoop Map-reduce concepts and
features
Developing the map-reduce
Applications
Pig concepts
Hive concepts
Oozie workflow concepts
HBASE Concepts
Real Life Use Cases

Introduction to Big Data and

Hadoop

HDFS
Map Reduce
Statistics

Understanding the Cluster

Typical workflow
Writing files to HDFS
Reading files from HDFS
Rack Awareness
5 daemons

Let's talk Map Reduce

Before Map reduce
Map Reduce Overview

What is Big Data?

Word Count Problem

What are the challenges for processing

big data?

Word Count Flow and Solution

What technologies support big data?

What is Hadoop?

Map Reduce Flow

Algorithms for simple & Complex
problems

Why Hadoop?
History of Hadoop
Use Cases of Hadoop
Hadoop eco System

Developing the Map Reduce

Application
Data Types
File Formats

Advanta Innovation
Explain the Driver, Mapper and
Reducer code
Configuring development environment
- Eclipse
Writing Unit Test

Output Formats - text Output, binary

output, multiple outputs, lazy output
and database output
Hands on Exercises

Map Reduce Features

Running locally

Counters

Running on Cluster

Sorting

Hands on exercises

Joins - Map Side and Reduce Side

How Map-Reduce Works

Side Data Distribution

Anatomy of Map Reduce Job run

MapReduce Combiner

Job Submission

MapReduce Partitioner

Job Initialization

MapReduce Distributed Cache

Task Assignment

Hands Exercises

Job Completion

Hive and PIG

Job Scheduling

Fundamentals

Job Failures

When to Use PIG and HIVE

Shuffle and sort

Concepts

Oozie Workflows

Hands on Exercises

Map Reduce Types and Formats

HBASE
CAP Theorem

MapReduce Types

Introduction to NOSQL

Input Formats - Input splits & records,

text input, binary input, multiple inputs
& database input

Hbase Architecture and concepts

Programming and Hands on Exercises

Advanta Innovation
Case Studies Discussions
Certification Guidance

Data Science Training Content Naresh IT Hyderabad
No ratings yet
Data Science Training Content Naresh IT Hyderabad
13 pages
Practical Guide To Risk Assessment (PWC 2008)
83% (6)
Practical Guide To Risk Assessment (PWC 2008)
40 pages
Big Data
No ratings yet
Big Data
10 pages
Big Data
No ratings yet
Big Data
10 pages
4.Syllabus_Copy
No ratings yet
4.Syllabus_Copy
2 pages
Specialised Programme On Big Data Analytics
No ratings yet
Specialised Programme On Big Data Analytics
3 pages
Inceptez Fullstack Bigdata & Cloud Engineer 2024
No ratings yet
Inceptez Fullstack Bigdata & Cloud Engineer 2024
36 pages
DVS Hadoop Development Course Content: M 1-I B D
No ratings yet
DVS Hadoop Development Course Content: M 1-I B D
4 pages
Big Data - Hadoop & Spark Training Syllabus: Tamilboomi
No ratings yet
Big Data - Hadoop & Spark Training Syllabus: Tamilboomi
4 pages
Townhome Development Project
100% (1)
Townhome Development Project
8 pages
Heuristic Ladder: Hadoop - Big Data Analytics Course
No ratings yet
Heuristic Ladder: Hadoop - Big Data Analytics Course
5 pages
MCA- II Sem- Curriculum and Syllabus
No ratings yet
MCA- II Sem- Curriculum and Syllabus
15 pages
2015 Examination Pricing: Americas and All Other Regions Not Listed Below
No ratings yet
2015 Examination Pricing: Americas and All Other Regions Not Listed Below
1 page
Document (1)
No ratings yet
Document (1)
4 pages
4 2 PDF
No ratings yet
4 2 PDF
2 pages
Question Bank Big Data analytics
No ratings yet
Question Bank Big Data analytics
2 pages
Big Data and Hadoop Developer
No ratings yet
Big Data and Hadoop Developer
7 pages
Understanding Big Data
No ratings yet
Understanding Big Data
3 pages
DeZyre - Apache - Spark
No ratings yet
DeZyre - Apache - Spark
12 pages
I Chresemo Technologies: Oracle Hyperion Training
No ratings yet
I Chresemo Technologies: Oracle Hyperion Training
5 pages
Data Bots Training Courses
100% (1)
Data Bots Training Courses
36 pages
Big Data Technology E1UJ502B
No ratings yet
Big Data Technology E1UJ502B
11 pages
Getting an Overview of Big Data
No ratings yet
Getting an Overview of Big Data
8 pages
Syllabus Hadoop
No ratings yet
Syllabus Hadoop
4 pages
Big Data
No ratings yet
Big Data
2 pages
Program Transition Chart
No ratings yet
Program Transition Chart
4 pages
Hadoop Updated Course Content
No ratings yet
Hadoop Updated Course Content
3 pages
1 Month Big Data Boot Camp
No ratings yet
1 Month Big Data Boot Camp
6 pages
Introduction Big Data With Hadoop
No ratings yet
Introduction Big Data With Hadoop
3 pages
MCAD2232 (PRESS) BIG DATA and Its Applications
No ratings yet
MCAD2232 (PRESS) BIG DATA and Its Applications
140 pages
Big Data Black Book
16% (25)
Big Data Black Book
2 pages
Data Engineering Brochure FXSr63lN9T
No ratings yet
Data Engineering Brochure FXSr63lN9T
14 pages
Big Data Hadoop
No ratings yet
Big Data Hadoop
13 pages
Learn Well Technocraft: Hadoop/Big Data Syllabus
No ratings yet
Learn Well Technocraft: Hadoop/Big Data Syllabus
12 pages
Hadoop Architect Brochure
No ratings yet
Hadoop Architect Brochure
13 pages
Hadoop Course Circulum
No ratings yet
Hadoop Course Circulum
2 pages
Big Data Training in Chennai - Big Data Course in Chennai
No ratings yet
Big Data Training in Chennai - Big Data Course in Chennai
1 page
Big Data Hadoop & Spark Curriculum
No ratings yet
Big Data Hadoop & Spark Curriculum
10 pages
Hadoop Development Download Syllabus PDF
No ratings yet
Hadoop Development Download Syllabus PDF
5 pages
20IT503 - Big Data Analytics - Unit4
No ratings yet
20IT503 - Big Data Analytics - Unit4
73 pages
Big Data analyticsNEW SYLLABUS FRAMING
No ratings yet
Big Data analyticsNEW SYLLABUS FRAMING
3 pages
Annexure - I - Syllabus PG-DBDA Aug 16
No ratings yet
Annexure - I - Syllabus PG-DBDA Aug 16
4 pages
Big Data Hadoop & Spark: Certification Training
No ratings yet
Big Data Hadoop & Spark: Certification Training
22 pages
Had Oop Details
No ratings yet
Had Oop Details
21 pages
Hadoop Online Training
No ratings yet
Hadoop Online Training
7 pages
Big Data & Hadoop - Course Curriculum
No ratings yet
Big Data & Hadoop - Course Curriculum
6 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
Syllabus Big Data Analytics
No ratings yet
Syllabus Big Data Analytics
2 pages
B.Tech. CS_CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS_CE and CSE Syllabus 3rd Year 2024-25
2 pages
IIT Kharagpur Data Science PDF
No ratings yet
IIT Kharagpur Data Science PDF
22 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
DE_Python
No ratings yet
DE_Python
11 pages
Training For Bigdata and Hadoop: #I Background and Introduction
No ratings yet
Training For Bigdata and Hadoop: #I Background and Introduction
9 pages
Bigdata Hadoop Spark - Python
No ratings yet
Bigdata Hadoop Spark - Python
8 pages
Big Data Black Book PDF
15% (20)
Big Data Black Book PDF
2 pages
Course Contents of Hadoop and Big Data
No ratings yet
Course Contents of Hadoop and Big Data
11 pages
Big Data Hadoop Training Certification 7
No ratings yet
Big Data Hadoop Training Certification 7
40 pages
Hadoop (Big Data) : Skills Gained
No ratings yet
Hadoop (Big Data) : Skills Gained
8 pages
Big Data and Hadoop For Developers - Syllabus
No ratings yet
Big Data and Hadoop For Developers - Syllabus
6 pages
Big Data Hadoop Certification Training: About Intellipaat
No ratings yet
Big Data Hadoop Certification Training: About Intellipaat
13 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
RACI - Chart
No ratings yet
RACI - Chart
3 pages
Hadoop Beginner's Guide
From Everand
Hadoop Beginner's Guide
Garry Turkington
4/5 (7)
Mastering Hadoop
From Everand
Mastering Hadoop
Sandeep Karanth
No ratings yet
Learning Hadoop 2
From Everand
Learning Hadoop 2
Garry Turkington
4/5 (1)

Advanta Innovation: Course Objective Summary

Uploaded by

Advanta Innovation: Course Objective Summary

Uploaded by

Advanta Innovation

Course Objective Summary

Introduction to Big Data and

Understanding the Cluster

Let's talk Map Reduce

What is Big Data?

Word Count Problem

What are the challenges for processing

Word Count Flow and Solution

What technologies support big data?

Map Reduce Flow

Developing the Map Reduce

Output Formats - text Output, binary

Map Reduce Features

Joins - Map Side and Reduce Side

How Map-Reduce Works

Side Data Distribution

Anatomy of Map Reduce Job run

MapReduce Distributed Cache

Hive and PIG

When to Use PIG and HIVE

Shuffle and sort

Map Reduce Types and Formats

Input Formats - Input splits & records,

Hbase Architecture and concepts

You might also like