Big Data QB

The document contains a question bank for the subject Big Data Analytics. It has three parts with multiple choice questions divided into five units related to topics like Hadoop, MapReduce, HDFS, NoSQL databases, and Big Data tools. The questions cover concepts like unstructured data, Hadoop ecosystem, Cassandra architecture, MapReduce workflows, and features of tools like Hive and Pig.

Uploaded by

21UGIT44 Prarthana

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views5 pages

Big Data QB

Uploaded by

21UGIT44 Prarthana

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

Academic Year 2023-2024 (Odd Semester)

Department of Information Technology

_______________________________________________
Question Bank

Subject Code & Subject Name :CCS334 & Big Data Analytics
Year & Sem :III & V
Name of Faculty :M.JEBA MALAR
Designation & Department :Assistant Professor & IT

Part A

S.No Question BL CO PI MM/YY

Unit 1
1. What is unstructured data? L1 CO1 1.4.1
2. What do you mean by big data analytics? L2 CO1 1.4.1
3. What is Hadoop? L1 CO1 1.4.1
4. How big data is used in marketing? L4 CO1 1.4.1
5. Define streaming data. L1 CO1 1.4.1
6. What is data science? L1 CO1 1.4.1
7. What is a web log file? L1 CO1 1.4.1
8. What is a web crawler? L1 CO1 1.4.1
9. What are the characteristics of a firewall? L2 CO1 1.4.1
10. Compare Cloud computing and Big Data. L4 CO1 1.4.1
Unit 2
1. Define Cassandra. L1 CO2 1.4.1
2. What is the difference between sharding and L4 CO2 1.4.1
replication?
3. What are schemaless databases? L2 CO2 1.4.1
4. List the advantages of graph data L1 CO2 1.4.1
5. What is the use of Bloom filters in Cassandra? L2 CO2 1.4.1
6. Define session consistency. L1 CO2 1.4.1
7. What is database sharding? L1 CO2 1.4.1
8. Why are NOSQL database known as schemaless L2 CO2 1.4.1
database?
9. How is sharding different from partitioning? L4 CO2 1.4.1
10. Waht are write-write and read-write conflicts? L1 CO2 1.4.1
Unit 3
1. Why do we need Hadoop streaming? L4 CO3 1.4.1
2. How HDFS services support big data? L4 CO3 1.4.1
3. Define Serialization L1 CO3 1.4.1
4. What is MapFile? L1 CO3 1.4.1
5. What is the Hadoop distributed file system? L1 CO3 1.4.1
6. What is data locality optimization? L1 CO3 1.4.1
7. What if writable were not there in Hadoop? L4 CO3 1.4.1
8. What is writables in Hadoop? L1 CO3 1.4.1
9. What happens if a client detects an error when L2 CO3 1.4.1
reading a block in Hadoop?
10. What are Hadoop pipes? L2 CO3 1.4.1
Unit 4
1. Define MapReduce. L2 CO4 1.4.1
2. List the characteristictics of MapReduce? L1 CO4 1.4.1
3. What are the major responsibilities L4 CO4 1.4.1
4. Why is YARN used? L1 CO4 1.4.1
5. What is fair scheduler? L1 CO4 1.4.1
6. List the failures of MapReduce. L1 CO4 1.4.1
7. Explain First in First out Scheduling. L2 CO4 1.4.1
8. Why Hadoop works better with a small number L1 CO4 1.4.1
of large files?
9. What is TextInputFormat? L4 CO4 1.4.1
10. What is Node Manager failure in YARN? L1 CO4 1.4.1
Unit 5
1. What is HBase? L1 CO5 1.4.1
2. What is Hive? L2 CO5 1.4.1
3. What is Hive data definition? L1 CO5 1.4.1
4. Explain services provided by Zookeeper in L4 CO5 1.4.1
Hbase
5. What is Zookeeper? L1 CO5 1.4.1
6. What are the responsibitities of HMaster? L1 CO5 1.4.1
7. Where to Use HBase? L1 CO5 1.4.1
8. Explain unique features of Hbase? L2 CO5 1.4.1
9. Explain data model in Hbase? L2 CO5 1.4.1
10. What is the difference between Pig Latin and Pig L2 CO5 1.4.1
engine?
Part B

S.No Question BL CO PI MM/YY

Unit 1
1. What is unstructured data?Compare structured L2 CO1 1.4.1
and unstructured data.
2. Explain the application of big data. L1 CO1 1.4.1
3. What is web analytics?Why web analytics is L1 CO1 1.4.1
important?
4. Draw and explain Hadoop ecosystem L2 CO1 1.4.1
5. Discuss about crowd sourcing and Trans firewall L2 CO1 1.4.1
analytics.
Unit 2
1 Briefly discuss schemaless database L2 CO2 1.4.1
2. What is CAP theorem?Explain. L1 CO2 1.4.1
3. What is sharding?Compare sahrding with L1 CO2 1.4.1
replication.
4. Discuss read and write Quorums. L2 CO2 1.4.1
5. Explain in detail about Casandra Architecture L2 CO2 1.4.1
and Casandra Data model.
Unit 3
1. What is Hadoop streaming?Explain the feature L2 CO3 1.4.1
of Hadoop streaming.
2. Explain heartbeat mechanism of HDFS. L1 CO3 1.4.1
3. Explain in detail about i)writable interface of L1 CO3 1.4.1
Hadoop ii)Avro
4. Explain in detail about i)Data integrity in HDFS L2 CO3 1.4.1
ii)Hadoop local file system.
5. Explain in detail about Hadoop I/O. L2 CO3 1.4.1
Unit 4

1. Explain in detail about MapReduce workflows L2 CO4 1.4.1

2. Explain in detail about anatomy of MapReduce L1 CO4 1.4.1
Job Run.
3. Write short notes on YARN. L1 CO4 1.4.1
4. Discuss Input-Output format of MapReduce. L2 CO4 1.4.1
5. What is capacity scheduler? Compare capacity L2 CO4 1.4.1
and fair scheduler.
Unit 5
1. Explain in detail about Hbase architecture. L2 CO5 1.4.1
2. Difference between HDFS and Hbase. L1 CO5 1.4.1
3. Write short notes on Hbaseclient. L1 CO5 1.4.1
4. What is pig?Explain the features of pig. L2 CO5 1.4.1
5. Draw the architecture of pig. L2 CO5 1.4.1

Part C

C
S.No Question BL PI MM/YY
O
Unit 1
1. What is open source technology? Explain L2 CO1 1.4.1
advantage,disadvantages and application of open
source.
2. Explain about convergence of key trends in Big L1 CO1 1.4.1
data.
3. Describe about industry examples of Big data L1 CO1 1.4.1

Unit 2
1. Explain with diagram various aggregate data L2 CO2 1.4.1
model of NoSQL.
2. Discuss about distributed models L1 CO2 1.4.1
Unit 3
1. Explain the data flow between client reading data L2 CO3 1.4.1
from HDFS.
2 Demonstrate the execution of streaming and L2 CO3 1.4.1
pipes in Hadoop.
Unit 4
1. Explain in detail about Job Scheduling L2 CO4 1.4.1
2. Describe about shuffle and sort. L2 CO4 1.4.1
3. Explain failures in classic map reduce and L2 CO4 1.4.1
YARN.
Unit 5
1. What is Hbase? Draw architecture of Hbase. L1 CO5 1.4.1
Explain the difference between HDFS and
Hbase.
2. Explain in detail about Hive architecture. L1 CO5 1.4.1
3. Explain in detail HiveQL Queries. L2 CO5 1.4.1

Prepared By Verified By
(Name & Sign) (Name & Sign)

Format No : TLP 50 Rev.No : 1.0 Date : 19-07-2023

SYLLBUS:

UNIT I UNDERSTANDING BIG DATA 5 Introduction to big data – convergence of key trends –
unstructured data – industry examples of big data – web analytics – big data applications– big data
technologies – introduction to Hadoop – open source technologies – cloud and big data – mobile
business intelligence – Crowd sourcing analytics – inter and trans firewall analytics.
UNIT II NOSQL DATA MANAGEMENT 7 Introduction to NoSQL – aggregate data models – key-value
and document data models – relationships – graph databases – schemaless databases – materialized
views – distribution models – master-slave replication – consistency - Cassandra – Cassandra data
model – Cassandra examples – Cassandra clients
UNIT IV MAP REDUCE APPLICATIONS 6 MapReduce workflows – unit tests with MRUnit – test data
and local tests – anatomy of MapReduce job run – classic Map-reduce – YARN – failures in classic
Map-reduce and YARN – job scheduling – shuffle and sort – task execution – MapReduce types –
input formats – output formats.
UNIT III BASICS OF HADOOP 6 Data format – analyzing data with Hadoop – scaling out – Hadoop
streaming – Hadoop pipes – design of Hadoop distributed file system (HDFS) – HDFS concepts – Java
interface – data flow – Hadoop I/O – data integrity – compression – serialization – Avro – file-based
data structures - Cassandra – Hadoop integration.
UNIT V HADOOP RELATED TOOLS 6 Hbase – data model and implementations – Hbase cllients –
Hbase examples – praxis. Pig – Grunt – pig data model – Pig Latin – developing and testing Pig Latin
scripts. Hive – data types and file formats – HiveQL data definition – HiveQL data manipulation –
HiveQL queries. 30 PER

Go Programming Essentials: From Zero to Production-Ready Applications
From Everand
Go Programming Essentials: From Zero to Production-Ready Applications
Marcus Hartwell
No ratings yet
Ccs334-Big Data Analysis Question Bank
No ratings yet
Ccs334-Big Data Analysis Question Bank
7 pages
CCS334 Bda
No ratings yet
CCS334 Bda
5 pages
Model Question Paper - Big Data - 2024-25 - Kca022
No ratings yet
Model Question Paper - Big Data - 2024-25 - Kca022
3 pages
ProCash NDC V2000 ProConsult NDC V2000 UserGuide en
100% (1)
ProCash NDC V2000 ProConsult NDC V2000 UserGuide en
420 pages
Unified Process Model
No ratings yet
Unified Process Model
3 pages
Question Bank BDA-CCS334
No ratings yet
Question Bank BDA-CCS334
6 pages
Big Data Question Bank
No ratings yet
Big Data Question Bank
11 pages
Last Year Question Paper - Big Data - (BCS 061)
No ratings yet
Last Year Question Paper - Big Data - (BCS 061)
9 pages
Question Bank
No ratings yet
Question Bank
10 pages
DBMS Question Bank
No ratings yet
DBMS Question Bank
9 pages
Big Data Analytics - Sem 7 CVMU
No ratings yet
Big Data Analytics - Sem 7 CVMU
4 pages
CCS334 Bda QB
No ratings yet
CCS334 Bda QB
6 pages
BDA Model QP
No ratings yet
BDA Model QP
2 pages
CCS334 - Bda - QB - Sec A
No ratings yet
CCS334 - Bda - QB - Sec A
12 pages
CopperTree Kaizen Brochure
No ratings yet
CopperTree Kaizen Brochure
12 pages
Elegance CV Template
No ratings yet
Elegance CV Template
3 pages
Big Data Important Questions AKTU
No ratings yet
Big Data Important Questions AKTU
3 pages
Question Bank
No ratings yet
Question Bank
12 pages
CS 6675 2025-1
No ratings yet
CS 6675 2025-1
5 pages
Big Data Lab File
No ratings yet
Big Data Lab File
49 pages
PLC Konversi Bilangan
No ratings yet
PLC Konversi Bilangan
9 pages
BDA Question Bank
No ratings yet
BDA Question Bank
10 pages
10 - Imp Question of Big Data 7080310258
No ratings yet
10 - Imp Question of Big Data 7080310258
8 pages
Big Data Important Questions
No ratings yet
Big Data Important Questions
4 pages
Bigdata Imp Ques
No ratings yet
Bigdata Imp Ques
5 pages
Big Data
No ratings yet
Big Data
3 pages
Introduction To Data Analytics Syllabus
No ratings yet
Introduction To Data Analytics Syllabus
3 pages
1) Introduction To Big Data
No ratings yet
1) Introduction To Big Data
6 pages
BgiData QB
100% (1)
BgiData QB
3 pages
Manual
No ratings yet
Manual
72 pages
Big Data BCS061 Complete Question Bank With RealWorld
No ratings yet
Big Data BCS061 Complete Question Bank With RealWorld
5 pages
Question Bank - Big Data Analytics - Final1
100% (1)
Question Bank - Big Data Analytics - Final1
6 pages
Bda Question Bank
No ratings yet
Bda Question Bank
10 pages
Swol
No ratings yet
Swol
2 pages
Ccs334 Big Data Analytics
0% (1)
Ccs334 Big Data Analytics
2 pages
iOS Challenge Pokemon
No ratings yet
iOS Challenge Pokemon
6 pages
Big Data V.imp Ques + PYQs (Edushine Classes)
No ratings yet
Big Data V.imp Ques + PYQs (Edushine Classes)
4 pages
IOT Fundamentals
No ratings yet
IOT Fundamentals
104 pages
Web App Success
No ratings yet
Web App Success
369 pages
Ccs334 - Big Data Analytics
75% (4)
Ccs334 - Big Data Analytics
2 pages
AAU3940 Hardware Description 03 PDF en PDF
100% (2)
AAU3940 Hardware Description 03 PDF en PDF
28 pages
Bigdata QB
No ratings yet
Bigdata QB
7 pages
III II CSM 10m Bda Question Bank
No ratings yet
III II CSM 10m Bda Question Bank
2 pages
Big Data Analytics Syallabus
No ratings yet
Big Data Analytics Syallabus
3 pages
Cs Practical Exam
No ratings yet
Cs Practical Exam
2 pages
Question Bank Big Data Analytics
No ratings yet
Question Bank Big Data Analytics
2 pages
Answer: C: Department of Information Technology UNIT-III-CAO-MCQ B.Tech 4 SEM
No ratings yet
Answer: C: Department of Information Technology UNIT-III-CAO-MCQ B.Tech 4 SEM
4 pages
BDA Question Bank
No ratings yet
BDA Question Bank
5 pages
HPE - A00123403en - Us - NonStop System Console Installer and Management Guide
No ratings yet
HPE - A00123403en - Us - NonStop System Console Installer and Management Guide
50 pages
Big Data Analtytics QB
No ratings yet
Big Data Analtytics QB
3 pages
Containers and Virtual Machines at Scale: A Comparative Study
No ratings yet
Containers and Virtual Machines at Scale: A Comparative Study
13 pages
Wa0037.
No ratings yet
Wa0037.
3 pages
Wa0005.
No ratings yet
Wa0005.
3 pages
NZS4402 2 2-1986
No ratings yet
NZS4402 2 2-1986
10 pages
Angel International School - Manipay: Information & Communication Technology
No ratings yet
Angel International School - Manipay: Information & Communication Technology
4 pages
Lab Manual Big Data Analytics Lab (LC-CSE-410G) : Department of Computer Science and Engineering
No ratings yet
Lab Manual Big Data Analytics Lab (LC-CSE-410G) : Department of Computer Science and Engineering
28 pages
Bda Model Aids 1
No ratings yet
Bda Model Aids 1
4 pages
Mrcet R20 Iv 1 QB
No ratings yet
Mrcet R20 Iv 1 QB
79 pages
20IT503 - Big Data Analytics - Unit4
No ratings yet
20IT503 - Big Data Analytics - Unit4
73 pages
BDAA Semister Question Bank
No ratings yet
BDAA Semister Question Bank
2 pages
100+ Free SEO Tools & Resources
No ratings yet
100+ Free SEO Tools & Resources
5 pages
Syllabus
No ratings yet
Syllabus
2 pages
21PCS203 - Big Data Analytics
No ratings yet
21PCS203 - Big Data Analytics
4 pages
6.BDA Question Bank
No ratings yet
6.BDA Question Bank
5 pages
Bdamodel Cse Set2 11112024
No ratings yet
Bdamodel Cse Set2 11112024
2 pages
Part A & B Big Data Questions
No ratings yet
Part A & B Big Data Questions
5 pages
Important Questions-Bigdata
No ratings yet
Important Questions-Bigdata
4 pages
TB 1300 - SAP Business One SDK
No ratings yet
TB 1300 - SAP Business One SDK
19 pages
BigData and Hadoop - Syllabus
No ratings yet
BigData and Hadoop - Syllabus
2 pages
III-II Big Data Analytics Question Bank
100% (1)
III-II Big Data Analytics Question Bank
3 pages
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
2 pages
Important Questions
No ratings yet
Important Questions
1 page
Koe097big Data
No ratings yet
Koe097big Data
1 page
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
Growth Strategy For Digital Champion Program
No ratings yet
Growth Strategy For Digital Champion Program
3 pages
Btech Cs 6 Sem Big Data Kcs 061 2023
No ratings yet
Btech Cs 6 Sem Big Data Kcs 061 2023
2 pages
Btech Oe 8 Sem Big Data Koe 097 2023
No ratings yet
Btech Oe 8 Sem Big Data Koe 097 2023
2 pages
IV Yr II Sem Lesson Plans
No ratings yet
IV Yr II Sem Lesson Plans
19 pages
DT 1
No ratings yet
DT 1
8 pages
Experiment - 1: Aim: To Determine The Nature of Roots of A Quadratic Equation, Its Input Is Triple of Positive
No ratings yet
Experiment - 1: Aim: To Determine The Nature of Roots of A Quadratic Equation, Its Input Is Triple of Positive
22 pages
ESP and ETS Integration Plans
No ratings yet
ESP and ETS Integration Plans
2 pages
Hadoop Course Content
No ratings yet
Hadoop Course Content
2 pages
Questions Answered in This Lecture:: - Why Are Threads Useful? - How Does One Use POSIX Pthreads?
No ratings yet
Questions Answered in This Lecture:: - Why Are Threads Useful? - How Does One Use POSIX Pthreads?
6 pages
Subnetting Class C Addresses
No ratings yet
Subnetting Class C Addresses
9 pages
Syllabus Big Data Analytics
No ratings yet
Syllabus Big Data Analytics
2 pages
FTezDAQ - Manual1 - 3-1
No ratings yet
FTezDAQ - Manual1 - 3-1
29 pages
Fujitsu PRIMERGY RX600 S6 Quad Socket 4 U Rack Server: Data Sheet
No ratings yet
Fujitsu PRIMERGY RX600 S6 Quad Socket 4 U Rack Server: Data Sheet
9 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
Computer Capsule July 2015
No ratings yet
Computer Capsule July 2015
19 pages

Big Data QB

Uploaded by

Big Data QB

Uploaded by

Academic Year 2023-2024 (Odd Semester)

Department of Information Technology

S.No Question BL CO PI MM/YY

S.No Question BL CO PI MM/YY

1. Explain in detail about MapReduce workflows L2 CO4 1.4.1

Format No : TLP 50 Rev.No : 1.0 Date : 19-07-2023

You might also like