Drawbacks of Fixed Partitioning in Hadoop

Fixed partitioning in Hadoop requires knowing the number of partitions in advance, which may not align with actual data distribution and can lead to unevenly sized partitions and inefficient resource usage. It is generally better to let the cluster determine the number of partitions to allow for efficient resource utilization, though in some special cases like zero or one reducer, fixed partitioning may be appropriate. The MultipleOutputs class can be used to write multiple output files from each reducer when using a partitioner like HashPartitioner.

Uploaded by

ponnaraseebk999

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views1 page

Drawbacks of Fixed Partitioning in Hadoop

Uploaded by

ponnaraseebk999

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 1

Drawbacks of Fixed Partitioning in Hadoop:

Two drawbacks of this approach:

 You need to know the number of partitions (reducers) in advance, which may not align with
the actual number of weather stations.
 Fixed partitioning can lead to unevenly sized partitions and inefficient resource usage.

Special Cases for Setting the Number of Partitions (Reducers):

 Two special cases where setting the number of partitions makes sense:
 Zero reducers: No partitions, only map tasks are run.
 One reducer: Useful for small jobs when combining the output of previous jobs into a single
file.

Letting the Cluster Determine Partitions:

 It's generally better to let the cluster determine the number of partitions, allowing for efficient
resource utilization.
 The default HashPartitioner works well as it adapts to the available resources and helps create
more evenly-sized partitions.

Using MultipleOutputs:
 When using HashPartitioner, each partition contains multiple stations.
 To create a file per station, you can use the MultipleOutputs class, which allows each reducer
to write multiple files with different names.

Hadoop Classroom Notes
100% (2)
Hadoop Classroom Notes
76 pages
Unit-Iii: A Weather Dataset
No ratings yet
Unit-Iii: A Weather Dataset
12 pages
100+ Hadoop Interview Questions From Interviews
No ratings yet
100+ Hadoop Interview Questions From Interviews
32 pages
Hadoop Mapred
100% (1)
Hadoop Mapred
11 pages
Top Answers To Map Reduce Interview Questions
No ratings yet
Top Answers To Map Reduce Interview Questions
6 pages
Unit-Iv CC&BD CS62
No ratings yet
Unit-Iv CC&BD CS62
76 pages
Bda CHP2
No ratings yet
Bda CHP2
105 pages
Unit V Programming Model
No ratings yet
Unit V Programming Model
53 pages
ADBMS-Module 3
No ratings yet
ADBMS-Module 3
115 pages
Bda Unit 3
No ratings yet
Bda Unit 3
22 pages
Unit-Iii: A Weather Dataset
No ratings yet
Unit-Iii: A Weather Dataset
12 pages
B. Hadoop Ecosystem - III (MapReduce)
No ratings yet
B. Hadoop Ecosystem - III (MapReduce)
55 pages
Unit 2
No ratings yet
Unit 2
22 pages
MapReduce and Yarn
No ratings yet
MapReduce and Yarn
39 pages
Lec21Notes Merged
No ratings yet
Lec21Notes Merged
20 pages
BDA Unit 4 Notes
No ratings yet
BDA Unit 4 Notes
20 pages
Analyzing Data With Hadoop
No ratings yet
Analyzing Data With Hadoop
54 pages
Unit IV BDA
No ratings yet
Unit IV BDA
32 pages
BigData Fundamental and Hadoop Interview Questions
No ratings yet
BigData Fundamental and Hadoop Interview Questions
33 pages
5 Partitioning
No ratings yet
5 Partitioning
23 pages
Hadoop Architecture - Hadoop Distributed File System (HDFS) - 2
No ratings yet
Hadoop Architecture - Hadoop Distributed File System (HDFS) - 2
39 pages
MapReduce Exam 2019 - Solved Paper
No ratings yet
MapReduce Exam 2019 - Solved Paper
25 pages
Lecture 04
No ratings yet
Lecture 04
25 pages
BD Unit-IIINotes
No ratings yet
BD Unit-IIINotes
17 pages
Unit 4 Handouts
No ratings yet
Unit 4 Handouts
13 pages
Big Data 11 TH Class
No ratings yet
Big Data 11 TH Class
15 pages
Compare Hadoop & Spark Criteria Hadoop Spark
No ratings yet
Compare Hadoop & Spark Criteria Hadoop Spark
18 pages
Mapreduce Introduction
No ratings yet
Mapreduce Introduction
14 pages
Contour and Heat Map Graphs by NetCDF Files PDF
No ratings yet
Contour and Heat Map Graphs by NetCDF Files PDF
7 pages
Document 6
No ratings yet
Document 6
15 pages
There Are 7 Tips For Improving Map Reduce Performance:: Configuring The Cluster Correctly
No ratings yet
There Are 7 Tips For Improving Map Reduce Performance:: Configuring The Cluster Correctly
4 pages
DA Lab Program-3
No ratings yet
DA Lab Program-3
9 pages
Practical 2-2
No ratings yet
Practical 2-2
9 pages
Tutorial Partitioner
No ratings yet
Tutorial Partitioner
8 pages
Mod4 BDA
No ratings yet
Mod4 BDA
8 pages
Scenario Based Hadoop Interview Questions
No ratings yet
Scenario Based Hadoop Interview Questions
5 pages
Hadoop Primitives
No ratings yet
Hadoop Primitives
6 pages
Weather Data Analysis Using Had Oop
No ratings yet
Weather Data Analysis Using Had Oop
9 pages
121 - PDFsam - Programming Pig
No ratings yet
121 - PDFsam - Programming Pig
10 pages
Q1. What Is The Purpose of Recordreader in Hadoop?
No ratings yet
Q1. What Is The Purpose of Recordreader in Hadoop?
5 pages
Worksheet 6th
No ratings yet
Worksheet 6th
6 pages
Map Reduce 1
No ratings yet
Map Reduce 1
8 pages
Group B PR 3 DSBDA
No ratings yet
Group B PR 3 DSBDA
6 pages
Job Scheduling in MR
No ratings yet
Job Scheduling in MR
6 pages
22MCC20017 Suraj Kumar Thakur BIG Data 2.2
No ratings yet
22MCC20017 Suraj Kumar Thakur BIG Data 2.2
5 pages
BDA Assignment 2
No ratings yet
BDA Assignment 2
5 pages
MR Running Notes
No ratings yet
MR Running Notes
4 pages
Hadoop Weather
No ratings yet
Hadoop Weather
4 pages
NodeJS Streaming Cluster
No ratings yet
NodeJS Streaming Cluster
4 pages
2009 Dfs Hotpower
No ratings yet
2009 Dfs Hotpower
5 pages
Explain Distributed File System and Features of Hadoop
No ratings yet
Explain Distributed File System and Features of Hadoop
3 pages
Interview Questions - Introduction To Hadoop and MapReduce Programming
No ratings yet
Interview Questions - Introduction To Hadoop and MapReduce Programming
4 pages
Partition
No ratings yet
Partition
3 pages
Partitioning Vs Recoalescing
No ratings yet
Partitioning Vs Recoalescing
3 pages
Text Output Lecture
No ratings yet
Text Output Lecture
2 pages
Hadoop Administration Question Bank CAE-1
No ratings yet
Hadoop Administration Question Bank CAE-1
2 pages
Partitioner & Combiner
No ratings yet
Partitioner & Combiner
2 pages
Key Partitioning
No ratings yet
Key Partitioning
1 page

Drawbacks of Fixed Partitioning in Hadoop

Uploaded by

Drawbacks of Fixed Partitioning in Hadoop

Uploaded by

Drawbacks of Fixed Partitioning in Hadoop:

Two drawbacks of this approach:

Special Cases for Setting the Number of Partitions (Reducers):

Letting the Cluster Determine Partitions:

You might also like