LS1.1 - V2 Scaling With Traditional Databases

This document discusses scaling traditional databases to handle increasing load from a web analytics application. Initially, the application uses a simple database table to track page visits. As the portal grows popular with many concurrent users, the database write load becomes a bottleneck. To address this, an intermediate queue is introduced between the web server and database to hold messages and prevent data loss. However, as load increases further, database partitioning is used to divide data across multiple machines for parallel writes. While this improves scalability, it introduces complexity in management and repartitioning. Traditional approaches struggle with scalability due to the need for complex, bug-prone application code to handle issues like sharding and replication. In contrast, big data

Uploaded by

R Krish

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

55 views7 pages

LS1.1 - V2 Scaling With Traditional Databases

Uploaded by

R Krish

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 7

Scaling with Traditional Databases

Pravin Y Pawar
Web Analytics Application
Example Analytics Application
• Designing an application to monitor the page hits for a portal
• Every time a user visiting a portal page in browser, the server side keeps track of that visit
• Maintains a simple database table that holds information about each page hit
• If user visits the same page again, the page hit count is increased by one
• Uses this information for doing analysis of popular pages among the users

Source : Adapted from Big Data by Nathan Marz

Scaling with intermediate layer
Using a queue
• Portal is very popular, lot of users visiting it
 Many users are concurrently visiting the pages of portal
 Every time a page is visited, database needs to be updated to keep track of this visit
 Database write is heavy operation
 Database write is now a bottleneck

• Solution
 Use an intermediate queue between the web server and database
 Queue will hold messages
 Message will not be lost
Scaling with Database Partitions
Using Database shards
• Application is too popular
 Users are using it very heavily, increasing the load on application
 Maintaining the page view count is becoming difficult even with queue

• Solution
• Use database partitions
 Data is divided into partitions which are hosted on multiple machines
 Database writes are parallelized
 Scalability increasing
 Also complexity increasing
Issues Begins
Bottlenecks
• Disks are prone to failure, hence partition can be inaccessible
• Complicated to manage many number of shards
• Repartitioning is again required when load increased
• More buggy application code as complexity increasing
• Difficult to retrieve from the mistakes done either by application code or humans
Rise of Big Data Systems
How it helps
• Main issue with traditional data processing applications
 Hard to make them scalable
 Hard to keep them simple
• Because everything is managed by application code
 Which is more prone to mistakes due to buggy implementations

• New edge systems aka Big Data Systems

 Handles high data volume, at very fast rate coming from variety of sources
 Systems aware about the distributed nature, hence capable of working with each other
 Application does not need to bother about common issues like sharding, replication etc
 Scalability is achieved by horizontal scaling – just add new machines
 Developers more focused on application logic rather than maintaining the environment
Thank You!
In our next session: Big Data Systems

Twinmotion 2021.1 Free Download With Crack
No ratings yet
Twinmotion 2021.1 Free Download With Crack
3 pages
BDS Session 6
No ratings yet
BDS Session 6
53 pages
Ebook - Cracking The System Design Interview Course
100% (2)
Ebook - Cracking The System Design Interview Course
91 pages
Ebook Fast Data Architectures For Streaming Applications 2
No ratings yet
Ebook Fast Data Architectures For Streaming Applications 2
58 pages
Different Stored Procedures in SQL Server
No ratings yet
Different Stored Procedures in SQL Server
1,978 pages
Course Introduction: Dsecl Zc556 Stream Processing and Analytics Lecture No. 1.0
No ratings yet
Course Introduction: Dsecl Zc556 Stream Processing and Analytics Lecture No. 1.0
52 pages
Lecture 2 Scalable Data Systems
No ratings yet
Lecture 2 Scalable Data Systems
41 pages
BDS Session 1
100% (1)
BDS Session 1
70 pages
Big Data Analytics
100% (1)
Big Data Analytics
14 pages
Kolomvatsos K., Anagnostopoulos C., Hadjiefthymiades S., An Efficient Time Optimized Scheme For Progressive Analytics in Big Data", Big Data Research, Vol. 2, 2015, S. 155-165
No ratings yet
Kolomvatsos K., Anagnostopoulos C., Hadjiefthymiades S., An Efficient Time Optimized Scheme For Progressive Analytics in Big Data", Big Data Research, Vol. 2, 2015, S. 155-165
11 pages
Adbms
No ratings yet
Adbms
70 pages
Big Data
No ratings yet
Big Data
25 pages
Digitization Week 3
No ratings yet
Digitization Week 3
13 pages
Cluster Basics
No ratings yet
Cluster Basics
34 pages
Hadoop - MapReduce
No ratings yet
Hadoop - MapReduce
51 pages
Introduction To Big Data
No ratings yet
Introduction To Big Data
30 pages
Unit 4 LT
No ratings yet
Unit 4 LT
16 pages
Big Data Slides
No ratings yet
Big Data Slides
26 pages
Chapter 4 - Building Scalable Web Applications
No ratings yet
Chapter 4 - Building Scalable Web Applications
19 pages
Module 1-BDA
No ratings yet
Module 1-BDA
82 pages
Scalable SQL: How Do Large-Scale Sites and Applications Remain SQL-based?
No ratings yet
Scalable SQL: How Do Large-Scale Sites and Applications Remain SQL-based?
8 pages
ECS781P-9-Cloud Data Management
No ratings yet
ECS781P-9-Cloud Data Management
79 pages
Module1 ADBMS
No ratings yet
Module1 ADBMS
99 pages
Parallel Database: Architecture For Parallel Databases. Parallel Query Evaluation Parallelizing Individual Operations
No ratings yet
Parallel Database: Architecture For Parallel Databases. Parallel Query Evaluation Parallelizing Individual Operations
27 pages
WhitePaper Adding Speed and Scale To PostgreSQL
No ratings yet
WhitePaper Adding Speed and Scale To PostgreSQL
11 pages
Databace 1
No ratings yet
Databace 1
7 pages
Database Backup
No ratings yet
Database Backup
26 pages
Wa0000.
No ratings yet
Wa0000.
35 pages
Big Data and Hadoop Overview
100% (1)
Big Data and Hadoop Overview
17 pages
System Design Cheat Sheet
No ratings yet
System Design Cheat Sheet
6 pages
LS1.1 - V6 Generalized Architecture of Big Data Systems
No ratings yet
LS1.1 - V6 Generalized Architecture of Big Data Systems
8 pages
Big Data
No ratings yet
Big Data
25 pages
Bigdata
No ratings yet
Bigdata
12 pages
System Design Scale System From Zero To Million Users #Systemdesign (English) (DownloadYoutubeSubtitles - Com)
No ratings yet
System Design Scale System From Zero To Million Users #Systemdesign (English) (DownloadYoutubeSubtitles - Com)
8 pages
Chapter - 1 Introduction
No ratings yet
Chapter - 1 Introduction
22 pages
Lecture 16
No ratings yet
Lecture 16
31 pages
Big Data Components
No ratings yet
Big Data Components
58 pages
Hadoop & BigData (UNIT - 2)
No ratings yet
Hadoop & BigData (UNIT - 2)
22 pages
Hadoop Big Data Unit 2
No ratings yet
Hadoop Big Data Unit 2
23 pages
Stream Processing
No ratings yet
Stream Processing
70 pages
Parallel Dbms
No ratings yet
Parallel Dbms
5 pages
BigData AmberSahai1
No ratings yet
BigData AmberSahai1
32 pages
Big Data Unit 1 AKTU Notes
No ratings yet
Big Data Unit 1 AKTU Notes
87 pages
Uc PDF
No ratings yet
Uc PDF
10 pages
Hadoop Ecosystem Large PDF
No ratings yet
Hadoop Ecosystem Large PDF
229 pages
Big Data Streams Analytics: Challenges, Analysis, and Applications
No ratings yet
Big Data Streams Analytics: Challenges, Analysis, and Applications
55 pages
Unit1 - BDH
No ratings yet
Unit1 - BDH
77 pages
Presentation EBTIC D1 M1
No ratings yet
Presentation EBTIC D1 M1
106 pages
Algomasterio System Design Interview Handbook
No ratings yet
Algomasterio System Design Interview Handbook
19 pages
SPA Full Course PPTs (9 Files Merged)
No ratings yet
SPA Full Course PPTs (9 Files Merged)
239 pages
07 BigData DataAnalysis
No ratings yet
07 BigData DataAnalysis
66 pages
Introducing Relational Database Products-2
No ratings yet
Introducing Relational Database Products-2
43 pages
Big Data Distributed Platforms
No ratings yet
Big Data Distributed Platforms
18 pages
Proposed Database Update - IngMar RespiSim SW
No ratings yet
Proposed Database Update - IngMar RespiSim SW
11 pages
Introduction To Big Data and NoSQL
No ratings yet
Introduction To Big Data and NoSQL
52 pages
IET Udaipur BDA Unit-1
No ratings yet
IET Udaipur BDA Unit-1
10 pages
Chapter - 2 Hadoop
No ratings yet
Chapter - 2 Hadoop
32 pages
TDD: Topics in Distributed Databases: Parallel Database Management Systems
No ratings yet
TDD: Topics in Distributed Databases: Parallel Database Management Systems
38 pages
BDA Module-1
No ratings yet
BDA Module-1
9 pages
Big Data Framework
No ratings yet
Big Data Framework
6 pages
Module 2
No ratings yet
Module 2
40 pages
Practical Data Strategies and Recipes
From Everand
Practical Data Strategies and Recipes
Tom Henricksen
No ratings yet
The Evolution of Web Development
From Everand
The Evolution of Web Development
Thandazani Mbutho
No ratings yet
LS1.1 - V1 Reliable, Scalable and Maintainable Data Applications
No ratings yet
LS1.1 - V1 Reliable, Scalable and Maintainable Data Applications
10 pages
LS1.0 - 0 DSECL ZC556 SPA Course Introduction
No ratings yet
LS1.0 - 0 DSECL ZC556 SPA Course Introduction
9 pages
BDS Session 5
No ratings yet
BDS Session 5
57 pages
Guidelines For Visual Basic DDE Client Apps PDF
No ratings yet
Guidelines For Visual Basic DDE Client Apps PDF
2 pages
DBMS Project Final
No ratings yet
DBMS Project Final
21 pages
Santhosh - MFC Book
100% (2)
Santhosh - MFC Book
661 pages
CV Bhimo Bhaskoro
No ratings yet
CV Bhimo Bhaskoro
4 pages
PIMS Manual Rev 4.0
No ratings yet
PIMS Manual Rev 4.0
24 pages
Learning Assessment - Answers: Unit 1
No ratings yet
Learning Assessment - Answers: Unit 1
2 pages
Aconex Case Study
No ratings yet
Aconex Case Study
9 pages
Belogrivov Informaatika 2018
No ratings yet
Belogrivov Informaatika 2018
25 pages
Working With Node Red (LAB-V)
No ratings yet
Working With Node Red (LAB-V)
80 pages
Kaiser Template Manual
No ratings yet
Kaiser Template Manual
4 pages
SCM - Enterprise Contracts Product Highlights
No ratings yet
SCM - Enterprise Contracts Product Highlights
49 pages
AART SEO Audit Checklist - Google Sheets
No ratings yet
AART SEO Audit Checklist - Google Sheets
1 page
Log
No ratings yet
Log
20 pages
Handout 5740 PD5740
No ratings yet
Handout 5740 PD5740
15 pages
OWASP Kerberoasting
No ratings yet
OWASP Kerberoasting
31 pages
EOS 40D Firmware Update Procedures: Precaution
No ratings yet
EOS 40D Firmware Update Procedures: Precaution
0 pages
E Book Library Management System
No ratings yet
E Book Library Management System
23 pages
Process Control Narratives
No ratings yet
Process Control Narratives
7 pages
Scripting Languages A2 PF1 1
No ratings yet
Scripting Languages A2 PF1 1
4 pages
Timeline
No ratings yet
Timeline
5 pages
Unix and Posix Standards
100% (1)
Unix and Posix Standards
37 pages
STQA
No ratings yet
STQA
53 pages
Mac Most Cheat Sheet Monterey
No ratings yet
Mac Most Cheat Sheet Monterey
1 page
TMS PPT Nrgfyj
No ratings yet
TMS PPT Nrgfyj
34 pages
Quiz 2 Inputs
No ratings yet
Quiz 2 Inputs
8 pages
Opentext Log4j KB19864995
No ratings yet
Opentext Log4j KB19864995
5 pages
CN Lab Record Part B
No ratings yet
CN Lab Record Part B
32 pages
Reignier SlidesCarnival
No ratings yet
Reignier SlidesCarnival
28 pages

LS1.1 - V2 Scaling With Traditional Databases

Uploaded by

LS1.1 - V2 Scaling With Traditional Databases

Uploaded by

Scaling with Traditional Databases

Source : Adapted from Big Data by Nathan Marz

• New edge systems aka Big Data Systems

You might also like