Unit-3 BDA

The document provides an overview of NoSQL data management, highlighting its flexibility, scalability, and various data models such as key-value, document, and graph databases. It discusses aggregate data models, distribution models, sharding, versioning, and the significance of MapReduce in processing large datasets. Key takeaways emphasize the importance of NoSQL for modern data management needs and encourage exploration of emerging trends in the field.

Uploaded by

gideonjayaraj2002

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views21 pages

Unit-3 BDA

Uploaded by

gideonjayaraj2002

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 21

Unit - 3

NOSQL Data Management

Introduction to NoSQL Data Management
 NoSQL databases are a category of databases that do not
adhere to the traditional relational database management system
(RDBMS) model.
 They are designed to handle large volumes of unstructured or
semi-structured data, providing flexible data models and
scalability.
 NoSQL databases offer various data models, including key-value,
document, columnar, and graph databases, each suited for
different types of data and use cases.
 Key benefits include improved scalability, performance, and
flexibility for modern data management needs.
Aggregate Data Models: Definition and Examples
Definition: Aggregate data models group data together for
efficient storage and retrieval.

Examples:
 Arrays, lists,
 Nested documents,
 Sets.

A simple diagram showing how data is grouped

together in an aggregate model.
Aggregate Data Models: Use Cases and Benefits
Use Cases: Ideal for scenarios where data naturally groups together,
like social media posts with comments or product catalogs with
reviews.
Benefits: Simplified data organization, faster queries, and improved
performance.
Example: A social media platform leveraging aggregate data models
where,Each user profile is an aggregate containing various
data points such as username, bio, profile picture, etc.
User Profile:-
Username: JohnDoe
Posts: "Coding marathon! 💻" & "Excited for the weekend! 🎉"
Comments & Likes aggregated under each post .
Key-Value Data Model
Explanation:
• Simplest form of NoSQL.
• Each data item is stored as a key-value pair.
• Examples: Redis, Amazon DynamoDB.
Advantages:
Fast retrieval by key.
Scalable and flexible.
Disadvantages:
Limited querying capabilities.
Not suitable for complex data relationships.
Document Data Model
Explanation:
 Stores data as JSON-like documents.
 Each document can have its own structure.
 Examples: MongoDB, Couchbase.
Advantages:
Flexible schema.
Supports complex data structures.
Disadvantages:
Can lead to data redundancy.
Limited to document size constraints.
Relationships and Use Cases
Relationships: Connect nodes
representing how entities are related.
Use Cases:
• Social networks:
Friend connections.
• Recommendations:
Product or content ecommendations.

• Fraud detection:
Patterns in financial transactions.
Introduction to Graph Databases
Graph Databases:
 Store data as nodes, edges, and properties.
 Nodes represent entities, edges represent relationships,
properties contain attributes.

Examples:
 Neo4j
 Amazon Neptune
Schema-less Databases
Definition:
Schema-less databases, also known as schema-less or
schema-flexible databases, allow for storing data without
a predefined schema.
Benefits:
• Flexibility: Data can be added or modified without altering the
entire database schema.
• Agility: Rapid development and iteration, especially in evolving or
experimental projects.
• Scalability: Easier to scale horizontally as there are no
constraints on schema changes.
Materialized Views
Purpose:
Materialized views are precomputed views of data that are stored
physically and updated periodically based on changes to the underlying
data.
Benefits:
– Improved Performance: Materialized views can significantly speed up
query processing by precomputing and storing frequently accessed or
complex query results.
– Reduced Complexity: They simplify query execution by reducing the
need for complex joins or computations, leading to more efficient data
retrieval.
– Enhanced Scalability: Materialized views can help distribute query load
and improve scalability by offloading heavy query processing tasks to
precomputed views.
Distribution Models
 Distribution models in NoSQL databases determine
how data is distributed across multiple nodes or servers in
a distributed environment.
 Common distribution models include replication,
partitioning, and hybrid approaches.
 Distribution models decide how data spreads across
many servers.
 Think of it like sharing a pizza—everyone gets a slice.
Overview of Sharding
 Sharding is a database partitioning technique where large
datasets are divided into smaller, more manageable parts
called shards.
 Each shard is stored on a separate server or node.
 Sharding helps distribute data and query load evenly across
multiple servers, improving scalability and performance.
 Imagine it like organizing a library: spreading books across
multiple shelves for quicker access.
 Minimizes risks—if one server fails, others keep running .
 Speeds up data access by spreading the workload.
Versioning
 Versioning tracks changes made to data or documents over
time, creating a historical record of edits and updates.
 Enables auditing, compliance, and error recovery.
Methods:
 Timestamps: Assigns a timestamp to each data change, enabling
chronological tracking of revisions.
 Incremental Versioning: Assigns a unique version number to each
update, allowing easy comparison and retrieval of specific
versions.
 Branch Versioning: Creates separate branches for different
versions or branches of data, enabling parallel development or
experimentation without affecting the main version.
MapReduce: Overview and Significance
Overview:
 MapReduce is a programming model for processing and
generating large datasets in parallel.
 It consists of two phases: Map and Reduce.

Significance:
Revolutionized big data processing by enabling
distributed computing on large datasets.
Key component in processing and analyzing massive
volumes of data efficiently.
MapReduce in NoSQL Databases
How it Works:
 NoSQL databases leverage MapReduce for distributed data processing.
 MapReduce tasks are executed across multiple nodes in the database
cluster.
Benefits:
 Enables parallel processing and distributed computation.
 Enhances scalability and performance of NoSQL databases for handling
large datasets.
MapReduce Phases: Map,Shuffle & Sort/Reduce.
Example:
In MongoDB, MapReduce can be used for aggregating, filtering, and
analyzing large volumes of data stored in document collections.
Utilization of Partitioning and Combining
 NoSQL databases employ Partitioning to distribute data across
nodes for scalability and fault tolerance.
 Combining is utilized during query processing to aggregate and
summarize data from multiple partitions, reducing the need for
data movement and improving query performance.
Example:
 Partitioning: Imagine dividing a large library into smaller sections.
 NoSQL databases use partitioning to split data across servers.
 Combining: Then, you count or summarize information from all
sections.
 Combining merges data from partitions for efficient querying.
Partitioning and Combining
 Partitioning involves dividing a large dataset into
smaller, manageable partitions or shards.
 It enables horizontal scalability by distributing data
across multiple nodes.

 Combining, also known as aggregation, merges data

from multiple partitions to generate a unified result.
 It enhances performance by reducing the amount of data
transferred and processed during aggregation operations.
Composing MapReduce Calculations
Techniques:
Map Function: Breaks down input data into key-value pairs for
processing.
Reduce Function: Aggregates and processes intermediate
results from map tasks.

Examples:
Word Count: Counts the frequency of words in a document.
Average Calculation: Computes the average value of a dataset.
Sorting: Orders data based on specific criteria, like alphabetical
order or numerical value.
Conclusion: Recap of Key Points
NoSQL Data Management:
Explored various NoSQL concepts including aggregate data models, graph databases,
and MapReduce.
Importance:
NoSQL offers flexibility, scalability, and performance for modern data management
needs.
Key Takeaways:
– NoSQL databases provide diverse data models suited for different use cases.
– MapReduce enables distributed processing of large datasets.
– Techniques like partitioning and combining improve scalability and efficiency.
Future Directions:
Explore emerging trends and advancements in NoSQL technology for continued
innovation and growth.
Questions and Discussion
Feel free to ask questions or share insights. We're here to engage
and learn together.
Topics to Explore:
 NoSQL databases
 Aggregate data models
 Graph databases
 MapReduce
 Partitioning and combining
 Any related topics of interest
THANK
YOU

Unit 2 BDA
No ratings yet
Unit 2 BDA
32 pages
ZXONM E300 V3 19 Operation Manual Volume II SDH Network Element Operations
100% (3)
ZXONM E300 V3 19 Operation Manual Volume II SDH Network Element Operations
292 pages
NoSQL DBs
No ratings yet
NoSQL DBs
46 pages
Deswik - Suite 2019.1 Release Notes
100% (1)
Deswik - Suite 2019.1 Release Notes
173 pages
Big Data - No SQL Databases and Related Concepts
100% (1)
Big Data - No SQL Databases and Related Concepts
101 pages
NoSQL MongoDB HBase Cassandra
100% (1)
NoSQL MongoDB HBase Cassandra
142 pages
Introduction To NoSQL
No ratings yet
Introduction To NoSQL
43 pages
Unit Ii
No ratings yet
Unit Ii
70 pages
NoSQL Database Comprehensive Report
No ratings yet
NoSQL Database Comprehensive Report
75 pages
Unit 6
No ratings yet
Unit 6
143 pages
Module 1
No ratings yet
Module 1
69 pages
Lecture NoSqlIntro
No ratings yet
Lecture NoSqlIntro
30 pages
Unit II - BDA NEW
No ratings yet
Unit II - BDA NEW
48 pages
Introduction To Nosql: - Key Value Databases
No ratings yet
Introduction To Nosql: - Key Value Databases
14 pages
Unit 2
No ratings yet
Unit 2
41 pages
BDA (2) Merged
No ratings yet
BDA (2) Merged
29 pages
Unit II Nosql Data Management
No ratings yet
Unit II Nosql Data Management
57 pages
Unit Ii - Nosql Databases
No ratings yet
Unit Ii - Nosql Databases
112 pages
BDA Module 5 - Part1 (No SQL) 2023
No ratings yet
BDA Module 5 - Part1 (No SQL) 2023
32 pages
No SQL
No ratings yet
No SQL
109 pages
NoSQL M1
No ratings yet
NoSQL M1
48 pages
Lecture 6 - NoSQL
No ratings yet
Lecture 6 - NoSQL
28 pages
NoSQL D
No ratings yet
NoSQL D
26 pages
Exam Solutions
100% (3)
Exam Solutions
43 pages
Deep-Healthcare System Analyst
100% (1)
Deep-Healthcare System Analyst
8 pages
Unit II No-SQL DB Managment
No ratings yet
Unit II No-SQL DB Managment
33 pages
Chapter14 BigData&NoSQLDatabases
No ratings yet
Chapter14 BigData&NoSQLDatabases
39 pages
Big Data
No ratings yet
Big Data
53 pages
Non Relational Database Management Systems
No ratings yet
Non Relational Database Management Systems
15 pages
Unit 4 BDA
No ratings yet
Unit 4 BDA
22 pages
DBA's Guide to NoSQL
From Everand
DBA's Guide to NoSQL
The Enlightened DBA
5/5 (1)
Overview of NoSQL
No ratings yet
Overview of NoSQL
17 pages
Internship Report
No ratings yet
Internship Report
26 pages
Nosql Module 1
No ratings yet
Nosql Module 1
23 pages
Lecture 1 - NoSQL
No ratings yet
Lecture 1 - NoSQL
31 pages
Module 5
No ratings yet
Module 5
31 pages
Unit 2 (Big Data Analytics)
No ratings yet
Unit 2 (Big Data Analytics)
11 pages
Introduction To NoSQL
No ratings yet
Introduction To NoSQL
29 pages
CC - Lecture 6-Data
No ratings yet
CC - Lecture 6-Data
44 pages
NOSQL Lecture 1 Notes
No ratings yet
NOSQL Lecture 1 Notes
31 pages
Bcse302l Dbms Module-7 Nosql
No ratings yet
Bcse302l Dbms Module-7 Nosql
30 pages
Unit 1
No ratings yet
Unit 1
23 pages
SA - Assignment - CFME (Cloud Form)
No ratings yet
SA - Assignment - CFME (Cloud Form)
14 pages
Lecture 1
No ratings yet
Lecture 1
31 pages
Nosql
No ratings yet
Nosql
20 pages
Introduction To NoSQL
No ratings yet
Introduction To NoSQL
13 pages
Cs 620 / Dasc 600 Introduction To Data Science & Analytics: Lecture 6-Nosql
No ratings yet
Cs 620 / Dasc 600 Introduction To Data Science & Analytics: Lecture 6-Nosql
31 pages
DBMS MASTER: Become Pro in Database Management System
From Everand
DBMS MASTER: Become Pro in Database Management System
Ummed Singh
No ratings yet
2.1.SummerSOC2015 Tutorial NoSQL
No ratings yet
2.1.SummerSOC2015 Tutorial NoSQL
62 pages
DMND 1
No ratings yet
DMND 1
8 pages
NoSQL Big Data Management
No ratings yet
NoSQL Big Data Management
36 pages
NoSQL Databases
No ratings yet
NoSQL Databases
20 pages
Unit No 1
No ratings yet
Unit No 1
34 pages
PowerBI 50 Interview Questions
100% (2)
PowerBI 50 Interview Questions
16 pages
Unit 4: Big Data Tehnology Landscape Two Inportant Technologies
No ratings yet
Unit 4: Big Data Tehnology Landscape Two Inportant Technologies
42 pages
Learning Guide 2.1 - CloudDatabase - NOSQL PDF
No ratings yet
Learning Guide 2.1 - CloudDatabase - NOSQL PDF
44 pages
Introduction To: Nosql
No ratings yet
Introduction To: Nosql
27 pages
Dbms Presentation
No ratings yet
Dbms Presentation
22 pages
Introduction To Nosql: Gabriele Pozzani
No ratings yet
Introduction To Nosql: Gabriele Pozzani
49 pages
NOsql Presentation
No ratings yet
NOsql Presentation
20 pages
No SQL
No ratings yet
No SQL
12 pages
No SQL
No ratings yet
No SQL
38 pages
Oracle 1z0-083 Exam - Questions and Answers
No ratings yet
Oracle 1z0-083 Exam - Questions and Answers
10 pages
NoSQL - U1
No ratings yet
NoSQL - U1
8 pages
BDA Assignment1 BE6 20
No ratings yet
BDA Assignment1 BE6 20
10 pages
Unit 2 Handouts
No ratings yet
Unit 2 Handouts
11 pages
Japananditseduca 031578 MBP
No ratings yet
Japananditseduca 031578 MBP
401 pages
Snowflake Admin Keypoints
No ratings yet
Snowflake Admin Keypoints
3 pages
DataMasking Using DataStage
No ratings yet
DataMasking Using DataStage
60 pages
Mathematics 2
No ratings yet
Mathematics 2
86 pages
Big Data Unit-Ii Notes
No ratings yet
Big Data Unit-Ii Notes
7 pages
Databases: System Concepts, Designs, Management, and Implementation
From Everand
Databases: System Concepts, Designs, Management, and Implementation
Jonathan Rigdon
No ratings yet
Industrial Social 00 Van M Rich
No ratings yet
Industrial Social 00 Van M Rich
148 pages
M3 Unit 4efggg
No ratings yet
M3 Unit 4efggg
102 pages
Dr. Arjumand Sattar (Dcet) 1
No ratings yet
Dr. Arjumand Sattar (Dcet) 1
55 pages
BDA UNIT-2dhhhhbv
No ratings yet
BDA UNIT-2dhhhhbv
23 pages
Management Information Systems
100% (2)
Management Information Systems
137 pages
993903983-M2 (Unit 5) ... Laplace Transform
No ratings yet
993903983-M2 (Unit 5) ... Laplace Transform
47 pages
Bumblebees, Life Cycle and Their Role in Pollination - A Review
No ratings yet
Bumblebees, Life Cycle and Their Role in Pollination - A Review
16 pages
IOT Bases Accident Detction and Rescue System Research Paper
No ratings yet
IOT Bases Accident Detction and Rescue System Research Paper
12 pages
Technical Questions of Cognizent: 13. Write A Program To Print First 10 Fibonacci Series
No ratings yet
Technical Questions of Cognizent: 13. Write A Program To Print First 10 Fibonacci Series
7 pages
Manav Rachna Online Bca Syllabus
100% (1)
Manav Rachna Online Bca Syllabus
6 pages
Appendix 06 Professors
No ratings yet
Appendix 06 Professors
18 pages
1st & 2nd Year FYUGP Syllabus
No ratings yet
1st & 2nd Year FYUGP Syllabus
25 pages
P2P Networking Project Report
100% (1)
P2P Networking Project Report
55 pages
Muhammad Hassan Resume
No ratings yet
Muhammad Hassan Resume
2 pages
Metallic Technical Overview
No ratings yet
Metallic Technical Overview
15 pages
M-I, Q - B, U - I, II - Imteywuwuhp
No ratings yet
M-I, Q - B, U - I, II - Imteywuwuhp
5 pages
Satyagraha Volume67 Book 100
No ratings yet
Satyagraha Volume67 Book 100
2 pages
Multiset Cheat Sheet
No ratings yet
Multiset Cheat Sheet
1 page
Hyderabad Metropolitan Water Supply & Sewerage Board - Online Bill Payment
No ratings yet
Hyderabad Metropolitan Water Supply & Sewerage Board - Online Bill Payment
1 page
Dream - Full Stack
No ratings yet
Dream - Full Stack
6 pages
MIS Final Project
No ratings yet
MIS Final Project
51 pages
Press
No ratings yet
Press
1 page
定制论文写作
100% (1)
定制论文写作
13 pages
Questions and Answers (Second Pass) : RFP/2014/605 DER - Global Focus Website Redesign (GFW)
No ratings yet
Questions and Answers (Second Pass) : RFP/2014/605 DER - Global Focus Website Redesign (GFW)
14 pages
Fd4 SQL Testing
No ratings yet
Fd4 SQL Testing
24 pages
Pentaho Performance and Scalability Overview
No ratings yet
Pentaho Performance and Scalability Overview
11 pages
Gaurav Gupta XD
No ratings yet
Gaurav Gupta XD
19 pages
Deepika Resume
No ratings yet
Deepika Resume
3 pages
Magna-Mike 8600 SW Installation 8600 Fa and Cal Program: Rel/Eco No
No ratings yet
Magna-Mike 8600 SW Installation 8600 Fa and Cal Program: Rel/Eco No
9 pages
The Use of Computer Simulations in Training
No ratings yet
The Use of Computer Simulations in Training
12 pages
Teradata Certification: Developer Exam
No ratings yet
Teradata Certification: Developer Exam
3 pages

Unit-3 BDA

Uploaded by

Unit-3 BDA

Uploaded by

Unit - 3

NOSQL Data Management

A simple diagram showing how data is grouped

 Combining, also known as aggregation, merges data

You might also like