0% found this document useful (0 votes)

23 views12 pages

Starburst Introduction - March 2021

Starburst provides a high-performance SQL query engine that enables businesses to reduce decision risk, increase revenue, and accelerate time to market. The platform supports both on-premise and cloud deployments, offering a federated semantic layer for real-time data access and improved analytics. With significant performance improvements and cost reductions, Starburst aims to streamline data management and analytics processes for enterprises.

Uploaded by

Angel Valencia Lopez-Quiñones

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

23 views12 pages

Starburst Introduction - March 2021

Uploaded by

Angel Valencia Lopez-Quiñones

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

Analytics Anywhere

About Starburst Our Platform

600% Growth YoY Named Open Source ANSI SQL MPP On-Prem, High Massive
Startup to Watch Query Engine or Cloud Concurrency Scale
2020

100+ NPS Score Rapid Time to Low Cost of Enterprise 24x7 Expert
Enterprise Insights Ownership Grade Security Support
Customers

2
Our Customers Our Value to Them

Reduced
Decision Risk

Increased Revenue
and Proﬁt

Higher Customer
Retention

Accelerated Time
to Market

3
Today’s data management approach delays analytics
Business has a question Data Engineering services the request Business gets an answer

ETL Data Data Lake

Warehouses

Database

Multiple Copies
Cloud Data Cloud Data
Warehouse Lake

Delays decision-making, increases data costs & complexity

4
Comcast Journey

18 Months 5 Weeks 0 Disruption 93% Faster

Existing Hadoop $200M in Migrating to S3 Adding Delta Lake
Data Lake too Revenue from Teradata and Kafka
TimelineSlow
provided by Timeline to execute the Accelerate cloud Begin ingesting new data
team to execute CMO same CMO cross sell migration without sources in real time for
cross sell campaign campaign business disruption predictive analytics

5
Connectivity: Creating a Portable Access Layer
Data Scientists Finance Marketers Data Analysts

Existing analytics tools

The Data Consumption Layer

Fine-grained access Column + Row-level

Data Masking Data Encryption Query Auditing Global Security control permissions

Data Lakes Relational Databases NoSQL Stores Publish/Subscribe

Azure Event Hub

6
Starburst Trino: SQL Engine Architecture
Data: Storage
Trino Cluster: Compute
Report,
SQL Coordinator Parse
Node Metadata
API Glue/Hive
Optimize
Catalog
Results (CBO)
Data Location
BI Tool, SQL Client, API
CLI Schedule

Key Data
Worker
Coordinator Node GCS ADLS Blob Storage S3

Worker Worker
Node
Auto-scaling group
Data
Worker
Connectors
Node
ODBC/JDBC, CLI
Intra-Cluster
API Call
Separation of compute and storage
Deploy Starburst everywhere - On-premise or Cloud

Hive Metastore
Horizontal Pod
via Helm Charts Service Object Store
Autoscaler (HPA) Storage
Pod

Hadoop / Hive
/ Delta

Starburst Starburst Admin Starburst Worker

Service Presto Worker
Pod Presto Worker Any RDBMS
Pod
Pod Config Properties:
connection-url=<pgsql_url>
connection-password=<password
>
Starburst connection-user=<sb-user>
RDS=PostgreSQL
Coordinator
Pod
Hybrid Deployment - Standard Approach
Global Users
Local Users

● High Latency for large

datasets dependent on the
network connectivity

● High Costs generated by

data movement required for
each query
Data Read
● Metadata duplicated in
Data Read
different environments

● No Control around Data

Residency

Cloud Storage Local Storage

Hybrid Deployment - Starburst Approach
Global users Local Users

● Low Query Latency with reduced

network traffic

Starburst-Remote
● Fully scalable approach that
Connector allows connection between all
your environments

● Uniﬁed Metadata model with no

Data Read data duplication
Data Read

● Improved Security Model that

meets any data residency
requirements

Local Storage
Cloud Storage
A Federated Semantic Layer - powered by Trino ( formerly Presto SQL )

● Access data in real-time -

where it lies

● Connect the tool of your

choice

● Different clusters for

different functions
(chargeback)

● Build business views over a

variety of sources

● Additional access control

over all sources
Don’t just take our word for it…
Faster analytics on data in your data lake Faster analytics on data anywhere + query federation

Data Engineers Data Engineers

• “This streamlined workﬂow helps our executives make

• 99.9% cluster uptime to drive higher CEX
the right decisions on time, and fosters innovation
• 3x performance improvement over OS Presto through machine learning.”

• 25% reduction in TCO • 50% savings on infrastructure compute costs to

expand use cases with same budget

Data Engineers

• Achieved GDPR compliance by leaving data where it lives • Eliminated ETL for joining Oracle, HDFS while
locally replacing Spark/Impala

• Reduced infrastructure usage by 30% • Reduce time to insight for critical risk models 96%

• Improved time to insights for engineers/analysts by 800% • De-risk business decisions in real time

Starburst Analytics SolutionBrief
No ratings yet
Starburst Analytics SolutionBrief
5 pages
Top 10 Big Data Trends
No ratings yet
Top 10 Big Data Trends
13 pages
Future Trends in Database Administration
No ratings yet
Future Trends in Database Administration
4 pages
Alluxio 2024 Atc
No ratings yet
Alluxio 2024 Atc
15 pages
Fast Presto SQL Query Performance - Download Starburst Presto
No ratings yet
Fast Presto SQL Query Performance - Download Starburst Presto
1 page
MIE1628 Big Data Analytics Lecture10
No ratings yet
MIE1628 Big Data Analytics Lecture10
41 pages
Data Ingreation Approaches
No ratings yet
Data Ingreation Approaches
9 pages
Day 06
No ratings yet
Day 06
34 pages
Linode UnderstandingDatabases ExtendedEdition
No ratings yet
Linode UnderstandingDatabases ExtendedEdition
259 pages
Deutsche Telekom Perspective On HADOOP and Big Data Technologies
No ratings yet
Deutsche Telekom Perspective On HADOOP and Big Data Technologies
19 pages
Session 1
No ratings yet
Session 1
48 pages
Ebook Starburst Enterprise Security Guide
No ratings yet
Ebook Starburst Enterprise Security Guide
23 pages
Whitepaper Top 10 Big Data Trends 2017
No ratings yet
Whitepaper Top 10 Big Data Trends 2017
13 pages
Camellia Institute of Technology: Sujay Kumar Kotal
No ratings yet
Camellia Institute of Technology: Sujay Kumar Kotal
12 pages
DP 900 Day 4
No ratings yet
DP 900 Day 4
40 pages
Introduction To Big Data, Hadoop and Spark
No ratings yet
Introduction To Big Data, Hadoop and Spark
40 pages
Introduction-to-Data-Storage-and-Retrieval
No ratings yet
Introduction-to-Data-Storage-and-Retrieval
26 pages
APJ Lakehouse Optimisation Webinar
No ratings yet
APJ Lakehouse Optimisation Webinar
53 pages
Choosing Technologies For A Big Data Solution in The Cloud: James Serra
No ratings yet
Choosing Technologies For A Big Data Solution in The Cloud: James Serra
58 pages
Cloud Data CHP 1 Et CHP 2
No ratings yet
Cloud Data CHP 1 Et CHP 2
5 pages
Business Analytics
No ratings yet
Business Analytics
3 pages
DWH
No ratings yet
DWH
7 pages
WED 0830 McKnight William COLOR 10015
No ratings yet
WED 0830 McKnight William COLOR 10015
21 pages
Data Engineering - Behind The Scene of Data by Hoda Ragaie
No ratings yet
Data Engineering - Behind The Scene of Data by Hoda Ragaie
44 pages
Storage Options For Transformed Data
No ratings yet
Storage Options For Transformed Data
3 pages
Selected Topic
No ratings yet
Selected Topic
14 pages
Data Warehousing and Online Analytical Processing
No ratings yet
Data Warehousing and Online Analytical Processing
31 pages
Azure Data Platform End2End - 1day
No ratings yet
Azure Data Platform End2End - 1day
90 pages
Introducing Snowflake: Data Warehousing For Everyone
No ratings yet
Introducing Snowflake: Data Warehousing For Everyone
15 pages
CC Unit-5
No ratings yet
CC Unit-5
9 pages
Data Engineering Part 1 1735286787
No ratings yet
Data Engineering Part 1 1735286787
22 pages
Recent Advancements in Database Management System
No ratings yet
Recent Advancements in Database Management System
5 pages
Day5 Patterns Use Cases
No ratings yet
Day5 Patterns Use Cases
45 pages
Chapter 6 Summary
No ratings yet
Chapter 6 Summary
8 pages
Architectures of Big Data
No ratings yet
Architectures of Big Data
27 pages
Designing A Modern Data Warehouse in Azure
100% (1)
Designing A Modern Data Warehouse in Azure
25 pages
Unit3 - Cloud Data Storage
No ratings yet
Unit3 - Cloud Data Storage
7 pages
Test 12 File
No ratings yet
Test 12 File
18 pages
BDE ManagedHadoopDataLakes PAVLIK PDF
No ratings yet
BDE ManagedHadoopDataLakes PAVLIK PDF
10 pages
Big Data Analysis
No ratings yet
Big Data Analysis
26 pages
Wa0003.
No ratings yet
Wa0003.
23 pages
Lec 4 - Big Data Ecosystem Architecture
No ratings yet
Lec 4 - Big Data Ecosystem Architecture
28 pages
DW Vs Data Lake
No ratings yet
DW Vs Data Lake
5 pages
DP 201
No ratings yet
DP 201
108 pages
What Is A Data Platform
No ratings yet
What Is A Data Platform
18 pages
Azure Data Platform Overview
100% (2)
Azure Data Platform Overview
57 pages
IDG-CIO Research WP - Oracle Autonomous Data Warehouse - The Future of Data Warehousing in The Cloud - Updated
No ratings yet
IDG-CIO Research WP - Oracle Autonomous Data Warehouse - The Future of Data Warehousing in The Cloud - Updated
4 pages
GCP - DataPlex - Building A Data Lakehouse
No ratings yet
GCP - DataPlex - Building A Data Lakehouse
19 pages
New World Hadoop Architectures (& What Problems They Really Solve) For Dbas
No ratings yet
New World Hadoop Architectures (& What Problems They Really Solve) For Dbas
44 pages
Cloud Training
No ratings yet
Cloud Training
14 pages
C-Cdlilt-B - CDL Ilt Deck - Module 2 (v1.1)
No ratings yet
C-Cdlilt-B - CDL Ilt Deck - Module 2 (v1.1)
95 pages
Leveraging Data-Fiscloud Google
No ratings yet
Leveraging Data-Fiscloud Google
97 pages
Azure Data Engineering Complete Guide
No ratings yet
Azure Data Engineering Complete Guide
130 pages
Unit 4 LT
No ratings yet
Unit 4 LT
16 pages
Session 9
No ratings yet
Session 9
12 pages
Unit 1
No ratings yet
Unit 1
60 pages
Data Engineering - Session 01
No ratings yet
Data Engineering - Session 01
34 pages
DataSunrise Database Security Release Notes
No ratings yet
DataSunrise Database Security Release Notes
28 pages
Adv Java Notes
No ratings yet
Adv Java Notes
14 pages
MultiDimensional Data Model
No ratings yet
MultiDimensional Data Model
22 pages
DBMS Unit-2 Notes
No ratings yet
DBMS Unit-2 Notes
43 pages
Dbms Jennys Lectures Watermarked
No ratings yet
Dbms Jennys Lectures Watermarked
92 pages
Dbms Notes
No ratings yet
Dbms Notes
28 pages
Jurnal Rancang Bangun Sistem Informasi Pencatatan Transaksi Keuangan Pada Klinik Graha Amani Sidoarjo
No ratings yet
Jurnal Rancang Bangun Sistem Informasi Pencatatan Transaksi Keuangan Pada Klinik Graha Amani Sidoarjo
7 pages
SQL Server Physical Architecture
100% (1)
SQL Server Physical Architecture
45 pages
Index Creation For Mutli Value Fields
No ratings yet
Index Creation For Mutli Value Fields
3 pages
CSE - 311L, Lab - 01
No ratings yet
CSE - 311L, Lab - 01
8 pages
Tuple and Domain Relational Calculus
No ratings yet
Tuple and Domain Relational Calculus
10 pages
Ids 521 HW 3
No ratings yet
Ids 521 HW 3
11 pages
Assignment Cover Sheet Qualification Module Number and Title
No ratings yet
Assignment Cover Sheet Qualification Module Number and Title
13 pages
The Power Bi Professional Guide To Azure Synapse
No ratings yet
The Power Bi Professional Guide To Azure Synapse
35 pages
Quiz App Development Guide
No ratings yet
Quiz App Development Guide
7 pages
Unit Four - Filing Procedures
No ratings yet
Unit Four - Filing Procedures
20 pages
CSE 470 - Software Architecture: BRAC University
No ratings yet
CSE 470 - Software Architecture: BRAC University
19 pages
SQL Worksheet
No ratings yet
SQL Worksheet
2 pages
Data Fabric Corp
No ratings yet
Data Fabric Corp
2 pages
Group Activity Cs
No ratings yet
Group Activity Cs
5 pages
Big Data Analytics Using HQL: Part B
No ratings yet
Big Data Analytics Using HQL: Part B
18 pages
SQL-1 (Scratch To Advance)
No ratings yet
SQL-1 (Scratch To Advance)
31 pages
Lecture 10: BCSE302L - DBMS: Functional Dependencies
No ratings yet
Lecture 10: BCSE302L - DBMS: Functional Dependencies
35 pages
Data Cube
No ratings yet
Data Cube
55 pages
2022-03-12 - SQL Bits - Advanced Data Modeling - Marc Lelijveld
No ratings yet
2022-03-12 - SQL Bits - Advanced Data Modeling - Marc Lelijveld
34 pages
AWS Event Bridge Deep Dive
No ratings yet
AWS Event Bridge Deep Dive
22 pages
Databricks - Data Analyst
No ratings yet
Databricks - Data Analyst
5 pages
Chapter 1
No ratings yet
Chapter 1
44 pages
DBMS Lab Manual
No ratings yet
DBMS Lab Manual
56 pages
Dbms All Pyq With Solution
No ratings yet
Dbms All Pyq With Solution
38 pages

Starburst Introduction - March 2021

Uploaded by

Starburst Introduction - March 2021

Uploaded by

Analytics Anywhere

About Starburst Our Platform

ETL Data Data Lake

Delays decision-making, increases data costs & complexity

18 Months 5 Weeks 0 Disruption 93% Faster

Existing analytics tools

The Data Consumption Layer

Fine-grained access Column + Row-level

Data Lakes Relational Databases NoSQL Stores Publish/Subscribe

Azure Event Hub

Starburst Starburst Admin Starburst Worker

● High Latency for large

● High Costs generated by

● No Control around Data

Cloud Storage Local Storage

● Low Query Latency with reduced

● Uniﬁed Metadata model with no

● Improved Security Model that

● Access data in real-time -

● Connect the tool of your

● Different clusters for

● Build business views over a

● Additional access control

Data Engineers Data Engineers

• “This streamlined workﬂow helps our executives make

• 25% reduction in TCO • 50% savings on infrastructure compute costs to

You might also like