3

Uploaded by

Arul John Bosco Susairaj

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views2 pages

3

Uploaded by

Arul John Bosco Susairaj

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

Batch Layer

Stores the raw, immutable data (e.g., in a Data Lake or distributed file system
like Hadoop).
Processes the data in bulk at regular intervals using batch jobs.
Produces a batch view, which contains precomputed results for accurate querying.
Tools: Hadoop, Apache Spark, Azure Data Lake, etc.
Speed Layer

Processes data in real-time as it arrives (e.g., events, transactions).

Provides low-latency, approximate results immediately.
Complements the batch layer by covering only the most recent data.
Tools: Apache Kafka, Apache Flink, Azure Event Hub, etc.
Serving Layer

Combines the batch and real-time outputs to provide a unified, queryable view of
the data.
Delivers results to end-users or applications via APIs or dashboards.
Tools: Databases (e.g., Cassandra, Elasticsearch), Power BI, etc.
How it Works:
Data Ingestion: Raw data flows into both the batch and speed layers simultaneously.
Processing:
The batch layer processes the entire dataset at regular intervals to ensure
accuracy.
The speed layer processes incoming data in real-time for low-latency responses.
Serving:
The serving layer combines outputs from both layers, prioritizing real-time data
for immediacy but relying on the batch layer for historical and accurate results.
Example: Social Media Analytics
Imagine a social media platform tracking user interactions like likes, shares, and
comments.

Batch Layer:
Historical data of all user interactions is stored in a data lake and processed
nightly to generate accurate metrics like monthly active users (MAU) or engagement
trends.

Speed Layer:
Real-time interactions are processed as they happen to display the latest trending
topics or live user counts.

Serving Layer:
A dashboard shows a combination of real-time stats (current active users, live
trends) and historical data (engagement over the last month).

Underlying Architecture
Data Sources: Events, logs, sensors, transactions, etc.
Ingestion Layer: Tools like Apache Kafka, Azure Event Hubs, or Amazon Kinesis bring
data into the system.
Batch Layer Storage: Data is stored in distributed file systems (HDFS, Azure Data
Lake) for processing.
Batch Layer Processing: Engines like Apache Spark or Hadoop process the data in
large-scale jobs.
Stream Layer Processing: Stream processing tools (Flink, Storm) handle real-time
events.
Serving Layer: Combines and serves data using databases or visualization tools
(e.g., Power BI, Tableau).
Benefits of Lambda Architecture
Scalability: Handles vast amounts of data.
Fault Tolerance: Each layer ensures resilience in case of failures.
Flexibility: Can process both real-time and historical data.
Limitations
Complexity: Maintaining separate batch and speed layers requires more effort.
Data Duplication: Raw data is processed in both layers, leading to redundancy.
Latency in Batch Layer: Accurate batch results are delayed until the job completes.
Would you like to explore a practical implementation of Lambda Architecture?

Functions of Housekeeping Department and Inter Relationship With Other Departments
No ratings yet
Functions of Housekeeping Department and Inter Relationship With Other Departments
12 pages
Data Pipelines From Zero To Solid
No ratings yet
Data Pipelines From Zero To Solid
58 pages
Soil Information System
No ratings yet
Soil Information System
2 pages
TR Manual
No ratings yet
TR Manual
286 pages
Week 4 - Azure-AWSStorage
No ratings yet
Week 4 - Azure-AWSStorage
97 pages
Data Engineering Life Cycle
No ratings yet
Data Engineering Life Cycle
33 pages
DBT Unit 4 Slides
No ratings yet
DBT Unit 4 Slides
286 pages
Week 1 Lecture 2
No ratings yet
Week 1 Lecture 2
92 pages
COVID BoE Amended Complaint and PI
No ratings yet
COVID BoE Amended Complaint and PI
564 pages
Lambda Architecture
No ratings yet
Lambda Architecture
20 pages
Harishchandragad Trek & Camping
No ratings yet
Harishchandragad Trek & Camping
9 pages
BDA Unit3
No ratings yet
BDA Unit3
17 pages
Real Time Analytics With Spark and Kafka
No ratings yet
Real Time Analytics With Spark and Kafka
53 pages
Rad Stack
No ratings yet
Rad Stack
10 pages
4
No ratings yet
4
2 pages
Anatomy and Physiology Workbook FINAL
100% (1)
Anatomy and Physiology Workbook FINAL
66 pages
Details
No ratings yet
Details
2 pages
Lambda Archi
No ratings yet
Lambda Archi
2 pages
Compute Engine
No ratings yet
Compute Engine
49 pages
Data Engineering Concepts For Mid-to-Senior Professionals
No ratings yet
Data Engineering Concepts For Mid-to-Senior Professionals
27 pages
What Is Lambda Architecture
No ratings yet
What Is Lambda Architecture
5 pages
Lambda - A Modern Big Data Architecture 5 - 12 PDF
No ratings yet
Lambda - A Modern Big Data Architecture 5 - 12 PDF
128 pages
7
No ratings yet
7
1 page
6
No ratings yet
6
1 page
32 Unnamed 26 03 2025
No ratings yet
32 Unnamed 26 03 2025
19 pages
DSPL Casestidy
No ratings yet
DSPL Casestidy
3 pages
5
No ratings yet
5
1 page
8
No ratings yet
8
1 page
SA Unit 1 PPT 5
No ratings yet
SA Unit 1 PPT 5
14 pages
Stream Processing Hands On With Apache Flink Free Lms Version
No ratings yet
Stream Processing Hands On With Apache Flink Free Lms Version
232 pages
Day5 Patterns Use Cases
No ratings yet
Day5 Patterns Use Cases
45 pages
Design A Workflow Management Platform Like Apache Airflo
No ratings yet
Design A Workflow Management Platform Like Apache Airflo
4 pages
AP LMS 2021-2025 Batch Not Verified List
No ratings yet
AP LMS 2021-2025 Batch Not Verified List
127 pages
Women With Epilepsy: Clinically Relevant Issues: A B C D, E, F
No ratings yet
Women With Epilepsy: Clinically Relevant Issues: A B C D, E, F
8 pages
Thermodynamics Problems
No ratings yet
Thermodynamics Problems
10 pages
Bookshop Business Quick Guide: by Crack A Business Kenya
No ratings yet
Bookshop Business Quick Guide: by Crack A Business Kenya
19 pages
Simplified! SFM Theory v2 by Jatin Nagpal
No ratings yet
Simplified! SFM Theory v2 by Jatin Nagpal
41 pages
Mariel Sofia S. Pulbosa 8-Gauss
No ratings yet
Mariel Sofia S. Pulbosa 8-Gauss
8 pages
1
No ratings yet
1
2 pages
Data Ingestion, Processing and Architecture Layers For Big Data and Iot
No ratings yet
Data Ingestion, Processing and Architecture Layers For Big Data and Iot
32 pages
Stream Processing With: Tamás István Ujj
No ratings yet
Stream Processing With: Tamás István Ujj
27 pages
Data Pipelines From Zero To Solid
No ratings yet
Data Pipelines From Zero To Solid
16 pages
DBT Unit4 PDF
No ratings yet
DBT Unit4 PDF
152 pages
Choose The Right Stream Processing Engine Whitepaper
No ratings yet
Choose The Right Stream Processing Engine Whitepaper
16 pages
Ebook Fast Data Architectures For Streaming Applications 2
No ratings yet
Ebook Fast Data Architectures For Streaming Applications 2
58 pages
9
No ratings yet
9
1 page
Hoffmann, Goethe, and Miyazaki's Spirited Away
No ratings yet
Hoffmann, Goethe, and Miyazaki's Spirited Away
4 pages
Install+SSL+Odoo+12+Ubuntu+18 04+actualizado
No ratings yet
Install+SSL+Odoo+12+Ubuntu+18 04+actualizado
7 pages
Calculus - I - OER (SP2024)
No ratings yet
Calculus - I - OER (SP2024)
150 pages
Lowara SV Series
No ratings yet
Lowara SV Series
68 pages
Lambda Architecure On For Batch Aws
No ratings yet
Lambda Architecure On For Batch Aws
12 pages
Big Data Analytics Using Apache Hadoop
No ratings yet
Big Data Analytics Using Apache Hadoop
33 pages
Big Data Architecture
No ratings yet
Big Data Architecture
41 pages
Lectur 5
No ratings yet
Lectur 5
37 pages
Project 1 Brief AVA313 Fall24
No ratings yet
Project 1 Brief AVA313 Fall24
4 pages
Big Data Analytics
100% (1)
Big Data Analytics
14 pages
1) Discuss Big Data Architecture in Detail With Help of Neat and Clean Diagram
No ratings yet
1) Discuss Big Data Architecture in Detail With Help of Neat and Clean Diagram
18 pages
Parental Involvement and The Reading Ability Skills of Grade Three Learners
No ratings yet
Parental Involvement and The Reading Ability Skills of Grade Three Learners
15 pages
Unit II Big Data Architecture
No ratings yet
Unit II Big Data Architecture
5 pages
Hunter Run Time Calculator - Door Card - X-Core Main
No ratings yet
Hunter Run Time Calculator - Door Card - X-Core Main
1 page
Lez.a-03 Architectures BigData NewStyle
No ratings yet
Lez.a-03 Architectures BigData NewStyle
23 pages
Interview Topics 1749449767
No ratings yet
Interview Topics 1749449767
5 pages
Stream Processing and Website Tracking
No ratings yet
Stream Processing and Website Tracking
2 pages
SA Unit 1 PPT 2
No ratings yet
SA Unit 1 PPT 2
27 pages
Caste Wise Schemes Abstract
No ratings yet
Caste Wise Schemes Abstract
2 pages
Mind Map Loyalty - Google Penelusuran
No ratings yet
Mind Map Loyalty - Google Penelusuran
1 page
10 Civics Ch-1 Notes
No ratings yet
10 Civics Ch-1 Notes
4 pages
Review Till Priliminary
No ratings yet
Review Till Priliminary
56 pages
2023 Palarong Pampaaralan Dance Sports Guidelines
No ratings yet
2023 Palarong Pampaaralan Dance Sports Guidelines
4 pages
Bigdata
No ratings yet
Bigdata
3 pages
Lec 4 - Big Data Ecosystem Architecture
No ratings yet
Lec 4 - Big Data Ecosystem Architecture
28 pages
Gunluk - Plan 7 Ingilizce 33 39924
No ratings yet
Gunluk - Plan 7 Ingilizce 33 39924
1 page
4 Building Blocks of A Streaming Data Architecture
No ratings yet
4 Building Blocks of A Streaming Data Architecture
11 pages
T09 Data Streaming
No ratings yet
T09 Data Streaming
52 pages
1 - Big Data Analytics & IoT
No ratings yet
1 - Big Data Analytics & IoT
13 pages
Data Report Martin Inline Graphics R8 1
No ratings yet
Data Report Martin Inline Graphics R8 1
6 pages
Big Data Architectures
No ratings yet
Big Data Architectures
8 pages
Data Report Martin Inline Graphics R7 PDF
No ratings yet
Data Report Martin Inline Graphics R7 PDF
6 pages
Big Data Architecture
No ratings yet
Big Data Architecture
4 pages
Kobelev Vladimir Durability of Springs
100% (1)
Kobelev Vladimir Durability of Springs
291 pages
Company-List - Import Injection Machine From 2012 - 5001-6000
No ratings yet
Company-List - Import Injection Machine From 2012 - 5001-6000
63 pages
Ebin - Pub Hands On Guide To Apache Spark 3 Build Scalable Computing Engines For Batch and Stream Data Processing 1nbsped 1484293797 9781484293799
100% (1)
Ebin - Pub Hands On Guide To Apache Spark 3 Build Scalable Computing Engines For Batch and Stream Data Processing 1nbsped 1484293797 9781484293799
307 pages
O Reilly Data Lake Bootcamp Day 11694182865124
No ratings yet
O Reilly Data Lake Bootcamp Day 11694182865124
46 pages
Exploring Hadoop Ecosystem (Volume 2): Stream Processing
From Everand
Exploring Hadoop Ecosystem (Volume 2): Stream Processing
Wei Liu
No ratings yet
Big Data
0% (1)
Big Data
2 pages
IFRS 8 Operating Segments
No ratings yet
IFRS 8 Operating Segments
2 pages
Kafka Up and Running for Network DevOps: Set Your Network Data in Motion
From Everand
Kafka Up and Running for Network DevOps: Set Your Network Data in Motion
Eric Chou
No ratings yet
Dragonshards - 2007-04-16 - The - Children - of - Khyber
No ratings yet
Dragonshards - 2007-04-16 - The - Children - of - Khyber
8 pages
Learn HANA in 24 Hours
From Everand
Learn HANA in 24 Hours
Alex Nordeen
5/5 (1)
Learn Cassandra in 24 Hours
From Everand
Learn Cassandra in 24 Hours
Alex Nordeen
No ratings yet

3

Uploaded by

3

Uploaded by

Batch Layer

Processes data in real-time as it arrives (e.g., events, transactions).

You might also like