Assignment No.1

This document contains an assignment for a Big Data Analytics course. It includes 3 questions that assess various topics related to big data and Hadoop. Question 1 asks students to explain the roles of different components in Hadoop and why HDFS is suited for large datasets. Question 2 asks students to write MapReduce pseudocode to multiply matrices and describe the shuffle and sort operations. Question 3 distinguishes between replication and sharding, discusses uses of key-value stores with a business example, and notes one weakness. The document also lists the course outcomes and Bloom's taxonomy levels addressed by each question.

Uploaded by

ishita ghutake

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

64 views1 page

Assignment No.1

Uploaded by

ishita ghutake

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

RAMRAO ADIK INSTITUTE OF TECHNOLOGY, NERUL

DEPARTMENT OF COMPUTER ENGINEERING

Assignment-I
Subject: Big Data Analytics Academic Year: 2020-21
Class/Sem.: BE / VII Div.: A,B,C

Q.No. Question Marks CO BT

Explain the role of NameNode, DataNode, JobTracker and
Q.1 TaskTracker. Justify why is HDFS more suited for applications 06m CO1 BT4
having large datasets and not when there are small files?
Write Map Reduce Pseudo code to multiply two matrices. Illustrate
the procedure on the following matrices. Cleary show all the steps.

Q.2.a 07m CO2 BT5

Q.2.b Evaluate the operations of “shuffle” and “Sort” in the Map Reduce 08m CO2 BT4
framework? Justify with the help of to calculate Average
Temperature example.

Distinguish between replication and sharding? Discuss uses of key-

Q.3 value store with a business use-case and also state its weakness. 9m CO3 BT4

===================================================================
Course Outcomes (CO) Students’ will be able to:
CO1: Identify the key issues in big data management and use Hadoop framework for
resolving these issues.
CO2: Apply various tools and techniques for big data analytics like Hadoop, Map Reduce
and PySpark.
CO3: Understand the NoSQL Data Architecure Patterns and apply various tools and
techniques for NoSQL like MongoDB/Cassandra/ HBase/ Hypertable etc.
CO4: Apply fundamental enabling techniques and scalable algorithms for stream
mining and frequent-itemset mining.
CO5: Interpret business models and scientific computing paradigms, and apply software tools
for big data analytics.
CO6: Analyze the web links for relevant information retrieval and Achieve adequate
perspectives of big data analytics in various applications like recommender systems,
social media applications etc
----------------------------------------------------------------------------------------------------------------
Bloom's Taxonomy
BT1- Remember, BT2- Understand, BT3- Apply, BT4- Analyze, BT5- Evaluate, BT6- Create

Subject Incharge DQA Member

Syllabus BCS714D-Big Data Analytics
50% (2)
Syllabus BCS714D-Big Data Analytics
3 pages
Bda Solved Sample Question Paper 70 Marks
No ratings yet
Bda Solved Sample Question Paper 70 Marks
29 pages
BDA Practical File
No ratings yet
BDA Practical File
61 pages
Question Papers Question Bank BDA
No ratings yet
Question Papers Question Bank BDA
54 pages
Big Data SV Publication
No ratings yet
Big Data SV Publication
142 pages
Bda Solved Sample Question Paper 70 Marks
No ratings yet
Bda Solved Sample Question Paper 70 Marks
29 pages
Model Paper BDA R20 VII Sem
No ratings yet
Model Paper BDA R20 VII Sem
3 pages
2022-23-BDA-LAB Manual
No ratings yet
2022-23-BDA-LAB Manual
59 pages
Language and The Pursuit of Hap - Chalmers Brothers
100% (2)
Language and The Pursuit of Hap - Chalmers Brothers
1,184 pages
BDA Notes
No ratings yet
BDA Notes
70 pages
Bda Pyq
No ratings yet
Bda Pyq
4 pages
2022-23-BDA-LAB Manual
No ratings yet
2022-23-BDA-LAB Manual
59 pages
Blda Pract 2024
No ratings yet
Blda Pract 2024
59 pages
5 It 22cs702 QBM
No ratings yet
5 It 22cs702 QBM
11 pages
Big Data Question Bank
No ratings yet
Big Data Question Bank
11 pages
Group 8 - PM Final
No ratings yet
Group 8 - PM Final
35 pages
DS Bda QB Ug24
No ratings yet
DS Bda QB Ug24
28 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
Bda Mid - 2 10-4-25
No ratings yet
Bda Mid - 2 10-4-25
3 pages
Gujarat Technological University
No ratings yet
Gujarat Technological University
1 page
Guidelines Writing A Biography
100% (1)
Guidelines Writing A Biography
13 pages
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
No ratings yet
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
55 pages
Big Data (8th) - ASSIGNMENT1
No ratings yet
Big Data (8th) - ASSIGNMENT1
1 page
Mrcet R20 Iv 1 QB
No ratings yet
Mrcet R20 Iv 1 QB
79 pages
10 - Imp Question of Big Data 7080310258
No ratings yet
10 - Imp Question of Big Data 7080310258
8 pages
3 Hours / 70 Marks: Instructions
100% (1)
3 Hours / 70 Marks: Instructions
2 pages
U20 - Bda QB-1
No ratings yet
U20 - Bda QB-1
6 pages
Bda Nov-Dec 2022
No ratings yet
Bda Nov-Dec 2022
2 pages
Big Data Analytics - Sem 7 CVMU
No ratings yet
Big Data Analytics - Sem 7 CVMU
4 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
Service Allocation CSE 2018
No ratings yet
Service Allocation CSE 2018
22 pages
Syllabus
No ratings yet
Syllabus
7 pages
Bda QB
No ratings yet
Bda QB
3 pages
Big Data Sessional
No ratings yet
Big Data Sessional
1 page
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
Bda Unitwise QB
No ratings yet
Bda Unitwise QB
3 pages
Supplementary Exam 23CP309T BDA ESE Question Paper
No ratings yet
Supplementary Exam 23CP309T BDA ESE Question Paper
2 pages
Dynamic Mattress Company - Financial Planning
No ratings yet
Dynamic Mattress Company - Financial Planning
11 pages
Assignment BDA1
No ratings yet
Assignment BDA1
2 pages
Merged
No ratings yet
Merged
7 pages
Business Culture of Usa, China, Japan &india
100% (1)
Business Culture of Usa, China, Japan &india
17 pages
Wa0005.
No ratings yet
Wa0005.
3 pages
Singapore Airlines Report On Strategic Alliance and Political Risk
0% (1)
Singapore Airlines Report On Strategic Alliance and Political Risk
11 pages
Big Data Analytics April 2023
No ratings yet
Big Data Analytics April 2023
4 pages
Y Wang China Africa Transport Strategy Institute
No ratings yet
Y Wang China Africa Transport Strategy Institute
32 pages
Te-C4-17ce8007-Krutuja Lasne-Ml1
No ratings yet
Te-C4-17ce8007-Krutuja Lasne-Ml1
16 pages
Election Record
No ratings yet
Election Record
42 pages
BDA Merged
No ratings yet
BDA Merged
7 pages
Big Data With Hadoop & Spark - VII
No ratings yet
Big Data With Hadoop & Spark - VII
3 pages
3 Hours / 70 Marks: Seat No
No ratings yet
3 Hours / 70 Marks: Seat No
2 pages
PR Plan: Showing Starbucks The Right Track
No ratings yet
PR Plan: Showing Starbucks The Right Track
14 pages
Consumer Behaviour and Neuromarketing (Assignment - 2) "A Review On Biometrics"
No ratings yet
Consumer Behaviour and Neuromarketing (Assignment - 2) "A Review On Biometrics"
33 pages
Final Draft-Literature Review: Modern Understanding of Poverty
No ratings yet
Final Draft-Literature Review: Modern Understanding of Poverty
5 pages
American Colonization and Modern ARTS
No ratings yet
American Colonization and Modern ARTS
22 pages
Problems Encountered by Researchers in India
No ratings yet
Problems Encountered by Researchers in India
9 pages
Victimology
100% (1)
Victimology
1 page
Big Data Technologies Course Outline
No ratings yet
Big Data Technologies Course Outline
2 pages
6-& 11 M - Big Data Analytics-VII Set1 BAO-Set 2 ECOM RA
No ratings yet
6-& 11 M - Big Data Analytics-VII Set1 BAO-Set 2 ECOM RA
4 pages
HT Delhi 26 - 7 (1) - 3
No ratings yet
HT Delhi 26 - 7 (1) - 3
5 pages
The Case Against Human Rights
No ratings yet
The Case Against Human Rights
10 pages
Pue Big Data
No ratings yet
Pue Big Data
2 pages
GDPR - Why It Matters and Isaca Impact Assessment Solutions: Prof. Dr. Kris Seeburn
No ratings yet
GDPR - Why It Matters and Isaca Impact Assessment Solutions: Prof. Dr. Kris Seeburn
42 pages
Srikant H 2016
No ratings yet
Srikant H 2016
4 pages
Assignment 2
No ratings yet
Assignment 2
2 pages
KWL Strengths
No ratings yet
KWL Strengths
12 pages
21cs71BDA Question Bank
No ratings yet
21cs71BDA Question Bank
4 pages
2024 25 ODD CE449 BDA Syllabus
No ratings yet
2024 25 ODD CE449 BDA Syllabus
4 pages
GTU Big Data Analysis Question Paper Summer 2022
No ratings yet
GTU Big Data Analysis Question Paper Summer 2022
1 page
Exit Process Deck - V1.16
No ratings yet
Exit Process Deck - V1.16
24 pages
Community Festivals - Involvement and Inclusion
No ratings yet
Community Festivals - Involvement and Inclusion
16 pages
Ict 10-4TH Quarter Exam
No ratings yet
Ict 10-4TH Quarter Exam
2 pages
The Effectiveness of Different Learning Styles Among The Senior High School Students in St. Martin de Porres Catholic School
No ratings yet
The Effectiveness of Different Learning Styles Among The Senior High School Students in St. Martin de Porres Catholic School
8 pages
Big Data Qpapers
No ratings yet
Big Data Qpapers
4 pages
21CS71
No ratings yet
21CS71
2 pages
KCS061 Big Data
No ratings yet
KCS061 Big Data
2 pages
W'22
No ratings yet
W'22
1 page
TOEFL Speaking Task Summary
No ratings yet
TOEFL Speaking Task Summary
7 pages
21CS71 Model Set 1 Paper
No ratings yet
21CS71 Model Set 1 Paper
2 pages
Social Statistics
No ratings yet
Social Statistics
8 pages
Winter 2023
No ratings yet
Winter 2023
1 page
Ese - Dec2020 - Socs - B Tech Cse Iotsc - Sem Vii - Csba4001 - Big Data Analytics
No ratings yet
Ese - Dec2020 - Socs - B Tech Cse Iotsc - Sem Vii - Csba4001 - Big Data Analytics
2 pages
IGNOU MCA Cloud Computing and IoT Previous year Unsolved Papers MCS 227
From Everand
IGNOU MCA Cloud Computing and IoT Previous year Unsolved Papers MCS 227
Manish Soni
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
2pages 6
No ratings yet
2pages 6
2 pages
Abhishek Majumdar: Areas of Expertise in The Domain of HR Management
No ratings yet
Abhishek Majumdar: Areas of Expertise in The Domain of HR Management
4 pages
Gujarat Technological University
No ratings yet
Gujarat Technological University
2 pages
Self-Check - Curricularist
No ratings yet
Self-Check - Curricularist
4 pages
Anh 10 - Unit 8 - Practice Test 1
No ratings yet
Anh 10 - Unit 8 - Practice Test 1
11 pages
Dr. Savita Sable. MCT College of Education
No ratings yet
Dr. Savita Sable. MCT College of Education
6 pages
Syllabus
No ratings yet
Syllabus
3 pages
Definition of 'Human Development Index'
No ratings yet
Definition of 'Human Development Index'
5 pages
Las PPG Melc 10 11 Week 5 6 Q2
No ratings yet
Las PPG Melc 10 11 Week 5 6 Q2
8 pages
18CS72-BDA Question Bank of First Internal Syllabus
No ratings yet
18CS72-BDA Question Bank of First Internal Syllabus
1 page
Computational Geometry: Exploring Geometric Insights for Computer Vision
From Everand
Computational Geometry: Exploring Geometric Insights for Computer Vision
Fouad Sabry
No ratings yet

Assignment No.1

Uploaded by

Assignment No.1

Uploaded by

RAMRAO ADIK INSTITUTE OF TECHNOLOGY, NERUL

DEPARTMENT OF COMPUTER ENGINEERING

Q.No. Question Marks CO BT

Q.2.a 07m CO2 BT5

Distinguish between replication and sharding? Discuss uses of key-

Subject Incharge DQA Member

You might also like