SQL Interview Questions For A Data Engineer

The document outlines SQL interview questions specifically designed for Data Engineers with 3-5 years of experience. It includes various SQL queries related to sales data, employee salaries, duplicate records, and data normalization versus denormalization. Additionally, it explains the differences between clustered and non-clustered indexes and their impact on query performance.

Uploaded by

Deepak Sarswa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

348 views11 pages

SQL Interview Questions For A Data Engineer

Uploaded by

Deepak Sarswa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

🔥🔥🔥Tech Mahindra🔥🔥🔥

🔥🔥🔥SQL interview questions for a Data Engineer

(3-5 years of experience.)🔥🔥🔥
--====================
--?? 25/02/2025
--====================
--PROBLEM STATEMENT :--TOP 10 SQL
--1. SQL INTERVIEW QUESTIONS FOR A
DATA ENGINEER (3-5 YEARS OF
EXPERIENCE.)
DROP TABLE ##CITY
CREATE TABLE ##CITY(SALE_ID INT, CITY
VARCHAR (50),SALE_DATE DATE, AMOUNT
INT)
GO
INSERT INTO ##CITY(SALE_ID,
CITY,SALE_DATE, AMOUNT )VALUES
(1,'MUMBAI','2024-01-10','5000'),
(2,'DELHI','2024-01-15','7000'),
(3,'BANGALORE','2024-01-20','10000'),
(4,'CHENNAI','2024-02-05','3000'),
(5,'MUMBAI','2024-02-08','9000'),
(6,'DELHI','2024-01-18','2000'),
(7,'CHENNAI','2024-02-09','3000'),
(8,'NOIDA','2024-02-18','9000')
SELECT * FROM ##CITY

WITH MONTHLYSALES AS (
SELECT
FORMAT(SALE_DATE, 'YYYY-MM')
AS SALE_MONTH,
CITY,
SUM(AMOUNT) AS TOTAL_SALES
FROM ##CITY
GROUP BY FORMAT(SALE_DATE, 'YYYY-
MM'), CITY
),
RANKEDSALES AS (
SELECT
SALE_MONTH,
CITY,
TOTAL_SALES,
RANK() OVER (PARTITION BY
SALE_MONTH ORDER BY TOTAL_SALES DESC)
AS RNK
FROM MONTHLYSALES
)
SELECT SALE_MONTH, CITY, TOTAL_SALES
FROM RANKEDSALES
WHERE RNK <= 3
ORDER BY SALE_MONTH, RNK;
--[Link] AN SQL QUERY TO CALCULATE
THE RUNNING TOTAL OF SALES FOR EACH
CITY. (SALES_DATA):
DROP TABLE ##CITY
CREATE TABLE ##CITY(SALE_ID INT, CITY
VARCHAR (50),SALE_DATE DATE, AMOUNT
INT)
GO
INSERT INTO ##CITY(SALE_ID,
CITY,SALE_DATE, AMOUNT )VALUES
(1,'MUMBAI','2024-01-10','5000'),
(2,'DELHI ','2024-01-15','7000'),
(3,'MUMBAI','2024-01-20','3000'),
(4,'DELHI ','2024-02-05','6000'),
(5,'MUMBAI','2024-02-08','8000')

SELECT CITY,SUM(AMOUNT) OVER

(PARTITION BY CITY ORDER BY
SALE_DATE)RUNNINGSALE FROM ##CITY
-- 3. FIND THE SECOND HIGHEST SALARY
OF EMPLOYEES. (EMPLOYEES):
DROP TABLE ##EMPLOYEES
CREATE TABLE ##EMPLOYEES(EMP_ID
INT,EMP_NAME VARCHAR(50),SALARY INT,
DEPARTMENT VARCHAR(50))
GO
INSERT INTO
##EMPLOYEES(EMP_ID,EMP_NAME,SALARY,
DEPARTMENT) VALUES
(1,'RAVI ','70000','HR'),
(2,'PRIYA','90000','IT'),
(3,'KUNAL','85000','FINANCE'),
(4,'AISHA','60000','IT'),
(5,'RAHUL','95000','HR')

SELECT * FROM (
SELECT *, DENSE_RANK()OVER(ORDER BY
SALARY DESC)RNK FROM ##EMPLOYEES
)AA WHERE RNK=2

-- 4. FIND EMPLOYEES WHO HAVE THE SAME

SALARY AS SOMEONE IN THE SAME
DEPARTMENT. (EMPLOYEE_SALARY):
DROP TABLE ##EMPLOYEE_SALARY
CREATE TABLE ##EMPLOYEE_SALARY(EMP_ID
INT,EMP_NAME VARCHAR (50),SALARY INT,
DEPARTMENT VARCHAR (50))
GO
INSERT INTO
##EMPLOYEE_SALARY(EMP_ID,EMP_NAME,SALA
RY,DEPARTMENT) VALUES
(1,'NEHA','50000','HR'),
(2,'RAVI','70000','IT'),
(3,'AMAN','50000','HR'),
(4,'POOJA','90000','IT'),
(5,'KARAN','70000','IT')
SELECT * FROM ##EMPLOYEE_SALARY ORDER
BY DEPARTMENT,SALARY

WITH CTE AS(

SELECT
DEPARTMENT,SALARY,DENSE_RANK()OVER
(PARTITION BY DEPARTMENT ORDER BY
DEPARTMENT,SALARY)RNK
FROM ##EMPLOYEE_SALARY
)SELECT DISTINCT
EMP_ID,EMP_NAME,[Link],[Link]
FROM CTE C JOIN ##EMPLOYEE_SALARY E ON
[Link]=[Link] AND
[Link]=[Link]
WHERE RNK=1 ORDER BY
[Link],[Link]
--5. WRITE AN SQL QUERY TO FIND
DUPLICATE RECORDS IN A TABLE.
(USERS):
DROP TABLE ##USERS
GO
CREATE TABLE ##USERS(USERID
INT,USERNAME VARCHAR (50),EMAIL
VARCHAR (50))
GO
INSERT INTO
##USERS(USERID,USERNAME,EMAIL)VALUES
(1,'SAMEER','SAMEER@[Link]'),
(2,'ANJALI','ANJALI@[Link]'),
(3,'SAMEER','SAMEER@[Link]'),
(4,'ROHAN','ROHAN@[Link]'),
(5,'ROHAN','ROHAN@[Link]')

SELECT * FROM (
SELECT * , DENSE_RANK()OVER(PARTITION
BY USERNAME,EMAIL ORDER BY USERID)RNK
FROM ##USERS
) AA WHERE RNK>1
-- 6. WRITE AN SQL QUERY TO DELETE
DUPLICATE ROWS WHILE KEEPING ONLY ONE
UNIQUE RECORD. (SAME SAMPLE DATA AS
QUESTION 5)

SELECT * FROM (
SELECT * , DENSE_RANK()OVER(PARTITION
BY USERNAME,EMAIL ORDER BY USERID)RNK
FROM ##USERS
) AA WHERE RNK=1

--7. WRITE AN SQL QUERY TO PIVOT A

TABLE BY MONTHS. SAMPLE DATA
(SALES_DATA):
DROP TABLE ##PIVOT
CREATE TABLE ##PIVOT(SALE_ID INT,CITY
VARCHAR (20),SALE_DATE DATE, AMOUNT
INT)
GO
INSERT INTO ##PIVOT
(SALE_ID,CITY,SALE_DATE, AMOUNT)
VALUES
(1,'MUMBAI','2024-01-10','5000'),
(2,'DELHI ','2024-02-15','7000'),
(3,'MUMBAI','2024-01-20','3000'),
(4,'DELHI ','2024-03-05','6000'),
(5,'MUMBAI','2024-02-08','8000')

SELECT * FROM ##PIVOT

SELECT CITY, ISNULL(JAN,0)JAN,

ISNULL(FEB,0)FEB, ISNULL(MAR,0)MAR
FROM (
SELECT
CITY,FORMAT(SALE_DATE,'MMM')SALE_DATE,
AMOUNT FROM ##PIVOT
)AA PIVOT (SUM(AMOUNT) FOR SALE_DATE
IN([JAN],[FEB],[MAR])) AS PT

SELECT CITY,
ISNULL([1],0)[1],ISNULL([2],0)[2],ISNU
LL([3],0)[3]
,ISNULL([1],0)+ISNULL([2],0)+ISNULL([3
],0)[GTOTAL] FROM (
SELECT CITY,MONTH(SALE_DATE)SALE_DATE,
AMOUNT FROM ##PIVOT
)AA PIVOT (SUM(AMOUNT) FOR SALE_DATE
IN([1],[2],[3])) AS PT
--8. FIND CUSTOMERS WHO PLACED AT
LEAST 3 ORDERS IN THE LAST 6 MONTHS.
SAMPLE DATA (ORDERS):
DROP TABLE ##ORDERS
CREATE TABLE ##ORDERS(ORDER_ID INT,
CUSTOMER_ID INT, ORDER_DATE DATE,
AMOUNT INT)
GO
INSERT INTO ##ORDERS(ORDER_ID,
CUSTOMER_ID, ORDER_DATE,AMOUNT) VALUES
(1,'101','2024-10-10','1000'),
(2,'102','2024-11-15','2000'),
(3,'101','2024-12-20','1500'),
(4,'103','2025-01-05','2500'),
(5,'101','2025-02-08','3000')

SELECT * FROM (
SELECT * ,COUNT(1)OVER(ORDER BY
CUSTOMER_ID)RNK FROM ##ORDERS WHERE
ORDER_DATE<=DATEADD(MONTH,-
6,GETDATE())
) AA WHERE RNK=3
--9. NORMALIZATION VS. DENORMALIZATION
– WHAT ARE THEY, AND WHEN SHOULD EACH
BE USED IN A DATA PIPELINE?
FEATURE<--->NORMALIZATION (OLTP)<---
>DENORMALIZATION (OLAP)
GOAL<--->REDUCE REDUNDANCY, ENSURE
INTEGRITY<--->IMPROVE READ/QUERY
PERFORMANCE
JOINS<--->MORE JOINS (COMPLEX
QUERIES)<--->FEWER JOINS (FASTER
QUERIES)
STORAGE<--->LESS STORAGE REQUIRED<---
>MORE STORAGE DUE TO REDUNDANCY
USE CASE<--->TRANSACTIONAL SYSTEMS
(BANKING, E-COMMERCE)<--->ANALYTICAL
SYSTEMS (DATA WAREHOUSES, REPORTING)
UPDATE SPEED<--->FASTER UPDATES (LESS
REDUNDANT DATA)<--->SLOWER UPDATES
(MULTIPLE COPIES OF DATA)
QUERY PERFORMANCE<--->SLOWER (DUE TO
JOINS)<--->FASTER (PRE-AGGREGATED OR
REDUNDANT DATA)
--10. INDEXING IN SQL – EXPLAIN
CLUSTERED VS. NON-CLUSTERED INDEXES.
HOW DO THEY IMPACT QUERY PERFORMANCE?

CLUSTERED INDEX
DETERMINES THE PHYSICAL ORDER OFDATA
IN A TABLE. IT CHANGES THE WAY THE
DATA IS STOREDON DISK AND CAN BE
CREATED ON ONLY ONE COLUMN. ATABLE CAN
HAVE ONLY ONE CLUSTERED INDEX.

NON-CLUSTERED INDEX
DOES NOT AFFECT THE PHYSICALORDER OF
DATA IN A TABLE. IT IS STORED
SEPARATELY ANDCONTAINS A POINTER TO
THE ACTUAL DATA. A TABLE CANHAVE
MULTIPLE NON-CLUSTERED INDEXES.

A Data Pipeline Should Address These Issues:: Topics To Study
No ratings yet
A Data Pipeline Should Address These Issues:: Topics To Study
10 pages
Azure Data Engineer Mock Interview - Project Special
No ratings yet
Azure Data Engineer Mock Interview - Project Special
11 pages
Spark QA
No ratings yet
Spark QA
34 pages
Snowflake
No ratings yet
Snowflake
11 pages
Snowflake Interview Question
No ratings yet
Snowflake Interview Question
20 pages
Naresh DE
No ratings yet
Naresh DE
5 pages
Top 100+ Data Engineer Interview Questions and Answers For 2022
No ratings yet
Top 100+ Data Engineer Interview Questions and Answers For 2022
4 pages
Advanced Project For Data Engineering in Azure
100% (1)
Advanced Project For Data Engineering in Azure
5 pages
SQL Joins and Aggregate Functions Guide
100% (1)
SQL Joins and Aggregate Functions Guide
73 pages
Aksha Interview Questions
100% (1)
Aksha Interview Questions
52 pages
PySpark Cheat Sheet
No ratings yet
PySpark Cheat Sheet
6 pages
HCL Interview Prepration
No ratings yet
HCL Interview Prepration
4 pages
Interview Series ADF Part-1
No ratings yet
Interview Series ADF Part-1
17 pages
Data Engineer
No ratings yet
Data Engineer
5 pages
Deloitte Pyspark Interview Questions For Data Engineer 2024 - by Ronit Malhotra - Jun, 2024 - Medium
No ratings yet
Deloitte Pyspark Interview Questions For Data Engineer 2024 - by Ronit Malhotra - Jun, 2024 - Medium
9 pages
PySpark DataFrame Operations Guide
No ratings yet
PySpark DataFrame Operations Guide
7 pages
Lead Data Engineer with AWS Expertise
No ratings yet
Lead Data Engineer with AWS Expertise
2 pages
Azure DE Interview Que
100% (2)
Azure DE Interview Que
25 pages
Snowflake External Tables Guide
No ratings yet
Snowflake External Tables Guide
105 pages
Snowflake Mini Project Overview
No ratings yet
Snowflake Mini Project Overview
7 pages
Azure Data Engineer Interview Guide
No ratings yet
Azure Data Engineer Interview Guide
15 pages
Snowflake Optimization and Tokenization Insights
No ratings yet
Snowflake Optimization and Tokenization Insights
3 pages
Data Engineer Interview Questions With Examples
No ratings yet
Data Engineer Interview Questions With Examples
8 pages
Apache Spark 101 For Data Engineering
No ratings yet
Apache Spark 101 For Data Engineering
15 pages
PySpark Optimization Interview Scenarios
No ratings yet
PySpark Optimization Interview Scenarios
8 pages
Amazon Data Engineer Interview Guide - Experienced
No ratings yet
Amazon Data Engineer Interview Guide - Experienced
19 pages
Top Pyspark InterviewQuestions
No ratings yet
Top Pyspark InterviewQuestions
21 pages
Senior Data Engineer Resume Example
No ratings yet
Senior Data Engineer Resume Example
1 page
RAJU AWS Data Engineer Resume
No ratings yet
RAJU AWS Data Engineer Resume
6 pages
SQL and PySpark Interview Questions
No ratings yet
SQL and PySpark Interview Questions
15 pages
SQL - & - Pyspak
No ratings yet
SQL - & - Pyspak
6 pages
SQL Developer Interview Questions & Answers
No ratings yet
SQL Developer Interview Questions & Answers
89 pages
ADE Azure Data Engineer Interview
No ratings yet
ADE Azure Data Engineer Interview
12 pages
Dp203 Notes
No ratings yet
Dp203 Notes
87 pages
A - Learning - Oreilly.com-Preface Data Engineering With AWS
No ratings yet
A - Learning - Oreilly.com-Preface Data Engineering With AWS
6 pages
Spark Big Data Tuning Guide
100% (1)
Spark Big Data Tuning Guide
20 pages
Spark Interview Q&A
No ratings yet
Spark Interview Q&A
31 pages
Azure Storage Solutions Overview
No ratings yet
Azure Storage Solutions Overview
7 pages
Data Engineering Interview Prep
No ratings yet
Data Engineering Interview Prep
8 pages
Data Engineer Interview Prep
No ratings yet
Data Engineer Interview Prep
27 pages
Databricks Questions
No ratings yet
Databricks Questions
23 pages
Py Spark
No ratings yet
Py Spark
10 pages
Snowpro Advanced: Data Engineer: Exam Study Guide
No ratings yet
Snowpro Advanced: Data Engineer: Exam Study Guide
14 pages
Databricks Exam
No ratings yet
Databricks Exam
14 pages
Snowflake
No ratings yet
Snowflake
122 pages
Data Engineering Concepts and Hadoop
No ratings yet
Data Engineering Concepts and Hadoop
6 pages
PySpark Cheatsheet
100% (1)
PySpark Cheatsheet
12 pages
(Big Data Analytics With PySpark) (CheatSheet)
No ratings yet
(Big Data Analytics With PySpark) (CheatSheet)
7 pages
Azure Data Engineer Content
No ratings yet
Azure Data Engineer Content
6 pages
Data Engineering 101 - Databricks Optimization
No ratings yet
Data Engineering 101 - Databricks Optimization
16 pages
TCS Azure Data Engineer Interview Questions and Answers
No ratings yet
TCS Azure Data Engineer Interview Questions and Answers
7 pages
PySpark Interview Questions
0% (1)
PySpark Interview Questions
3 pages
2025 Pyspark Interview Questions Collections
No ratings yet
2025 Pyspark Interview Questions Collections
50 pages
Oracle PLSQL Notes
100% (4)
Oracle PLSQL Notes
59 pages
Tech Mahindra SQL Interview Questions For Data Engineer
No ratings yet
Tech Mahindra SQL Interview Questions For Data Engineer
6 pages
Data Engineer (3-5 Years of Experience.) PDF
No ratings yet
Data Engineer (3-5 Years of Experience.) PDF
7 pages
Real Data Analyst Interview Questions Answers
No ratings yet
Real Data Analyst Interview Questions Answers
15 pages
Tech Mahindra Data Analyst Interview Questions
No ratings yet
Tech Mahindra Data Analyst Interview Questions
11 pages
Myntra SQL
100% (1)
Myntra SQL
34 pages
DWM Exp2 - 60
No ratings yet
DWM Exp2 - 60
7 pages
Infra SAP SDI
No ratings yet
Infra SAP SDI
374 pages
Hostel Management Information System Abstract
100% (9)
Hostel Management Information System Abstract
3 pages
Resource 20241226104515 Chapter-4 Working With Forms Queries and Reports
No ratings yet
Resource 20241226104515 Chapter-4 Working With Forms Queries and Reports
2 pages
Mysql 8.0 en 121 150
No ratings yet
Mysql 8.0 en 121 150
30 pages
SQL Error Codes and Troubleshooting
No ratings yet
SQL Error Codes and Troubleshooting
2,085 pages
OCA Solaris 11 System Admin Exam Guide
No ratings yet
OCA Solaris 11 System Admin Exam Guide
12 pages
Data Engineering Brochure
No ratings yet
Data Engineering Brochure
24 pages
SqlConnection Class in ADO.NET Explained
No ratings yet
SqlConnection Class in ADO.NET Explained
23 pages
New Database 11gR2 Features Overview
No ratings yet
New Database 11gR2 Features Overview
48 pages
A Level Computer Science OCR - Unit 4 Exchanging Data HW
No ratings yet
A Level Computer Science OCR - Unit 4 Exchanging Data HW
15 pages
How To Move Your Home Folder To Another Partition in Ubuntu
No ratings yet
How To Move Your Home Folder To Another Partition in Ubuntu
25 pages
Real-time Slurm Monitoring with InfluxDB
No ratings yet
Real-time Slurm Monitoring with InfluxDB
19 pages
5.functional Dependencies
No ratings yet
5.functional Dependencies
31 pages
SnowFlake Notes
100% (1)
SnowFlake Notes
40 pages
SAP Datasphere Discovery WS-Master Deck Partner 2024
No ratings yet
SAP Datasphere Discovery WS-Master Deck Partner 2024
46 pages
Three Level Database Architecture Explained
No ratings yet
Three Level Database Architecture Explained
36 pages
Census of India, 1951, Contents - Punjab PDF
No ratings yet
Census of India, 1951, Contents - Punjab PDF
46 pages
Ou - 2451 Ou - 2451
No ratings yet
Ou - 2451 Ou - 2451
1 page
File Control Block and Disk Access Basics
No ratings yet
File Control Block and Disk Access Basics
59 pages
Data Modeling Design Technical Guardrail 20220906
No ratings yet
Data Modeling Design Technical Guardrail 20220906
36 pages
Memory Hierarchy Design and Its Characteristics
No ratings yet
Memory Hierarchy Design and Its Characteristics
5 pages
Tableau Skills for Career-Ready Students
No ratings yet
Tableau Skills for Career-Ready Students
23 pages
SQL Developer Interview Prep
No ratings yet
SQL Developer Interview Prep
89 pages
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
No ratings yet
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
6 pages
SQL Daywise Topics
No ratings yet
SQL Daywise Topics
6 pages
PowerBI Session 1 2
No ratings yet
PowerBI Session 1 2
47 pages
EasyFit 8
No ratings yet
EasyFit 8
1 page
From Query Plan To Query Performance:: Supercharging Your Spark Queries Using The Spark UI SQL Tab
No ratings yet
From Query Plan To Query Performance:: Supercharging Your Spark Queries Using The Spark UI SQL Tab
52 pages
Weather Forescasting Systems
No ratings yet
Weather Forescasting Systems
37 pages
Redis Introduction
No ratings yet
Redis Introduction
6 pages

SQL Interview Questions For A Data Engineer

Uploaded by

SQL Interview Questions For A Data Engineer

Uploaded by

🔥🔥🔥Tech Mahindra🔥🔥🔥

🔥🔥🔥SQL interview questions for a Data Engineer

SELECT CITY,SUM(AMOUNT) OVER

-- 4. FIND EMPLOYEES WHO HAVE THE SAME

WITH CTE AS(

--7. WRITE AN SQL QUERY TO PIVOT A

SELECT * FROM ##PIVOT

SELECT CITY, ISNULL(JAN,0)JAN,

You might also like