0% found this document useful (0 votes)

8 views3 pages

Python Scenario Based Interview QA

The document presents various scenario-based Python interview questions tailored for freshers applying for data analysis roles. Each scenario includes a specific data-related challenge, such as cleaning data, analyzing sales, preparing datasets for churn prediction, identifying outliers, merging datasets, visualizing trends, and preparing categorical data for machine learning. The document provides sample code snippets and methodologies to address these scenarios effectively.

Uploaded by

gauri pingat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views3 pages

Python Scenario Based Interview QA

Uploaded by

gauri pingat

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Scenario-Based Python Interview Questions for Data Analysis Roles (Freshers)

1. Scenario: You receive a CSV file with missing values, inconsistent casing, and duplicate

rows. How would you clean this data using Python?

Answer:

import pandas as pd

df = pd.read_csv('data.csv')

# Remove duplicates

df = df.drop_duplicates()

# Standardize casing (e.g., for a 'Name' column)

df['Name'] = df['Name'].str.title()

# Handle missing values

df = df.fillna(method='ffill')

2. Scenario: You have a sales dataset with columns: Date, Product, and Revenue. How would

you find the top 3 products with the highest average monthly revenue?

Answer:

df['Date'] = pd.to_datetime(df['Date'])

df['Month'] = df['Date'].dt.to_period('M')

monthly_avg = df.groupby(['Month', 'Product'])['Revenue'].mean().reset_index()

top_products =

monthly_avg.groupby('Product')['Revenue'].mean().sort_values(ascending=False).head(3)

3. Scenario: How would you prepare customer data with demographic info and activity logs
for a churn prediction model?

Answer:

- Handle missing values

- Convert categorical features to numeric using pd.get_dummies()

- Normalize/scale numerical features

- Merge datasets if activity logs are separate

- Label churn (e.g., Churn = 1 if customer left, else 0)

4. Scenario: You suspect some products have incorrect prices in a dataset. How would you

identify and handle outliers?

Answer:

Q1 = df['Price'].quantile(0.25)

Q3 = df['Price'].quantile(0.75)

IQR = Q3 - Q1

outliers = df[(df['Price'] < Q1 - 1.5IQR) | (df['Price'] > Q3 + 1.5IQR)]

df = df[~df.index.isin(outliers.index)]

5. Scenario: You have two datasets: users.csv and transactions.csv. How would you

combine them to analyze total spending per user?

Answer:

users = pd.read_csv('users.csv')

transactions = pd.read_csv('transactions.csv')

merged = pd.merge(users, transactions, on='user_id')

spending = merged.groupby('user_id')['amount'].sum()

6. Scenario: You have daily temperature data. How would you visualize trends and seasonal

patterns?
Answer:

import matplotlib.pyplot as plt

df['Date'] = pd.to_datetime(df['Date'])

df.set_index('Date', inplace=True)

plt.figure(figsize=(10,5))

plt.plot(df['Temperature'])

plt.title('Daily Temperature Trends')

plt.xlabel('Date')

plt.ylabel('Temperature')

plt.show()

7. Scenario: You have a column 'Country' with many categories. How would you prepare this

for machine learning?

Answer:

# Use OneHotEncoder or pd.get_dummies

df = pd.get_dummies(df, columns=['Country'], drop_first=True)

8. Scenario: Your dataset has a column 'Join_Date'. What features can you extract from it?

Answer:

df['Join_Date'] = pd.to_datetime(df['Join_Date'])

df['Year'] = df['Join_Date'].dt.year

df['Month'] = df['Join_Date'].dt.month

df['Weekday'] = df['Join_Date'].dt.day_name()

df['Join_Quarter'] = df['Join_Date'].dt.quarter

Biology Nmdcat Book DR Sohail by Study Corner
100% (6)
Biology Nmdcat Book DR Sohail by Study Corner
372 pages
Data Cleaning in Python
No ratings yet
Data Cleaning in Python
14 pages
Python MCQs
No ratings yet
Python MCQs
21 pages
Cours
No ratings yet
Cours
26 pages
Cleaning
No ratings yet
Cleaning
4 pages
Class 12 Practical File Informatics Practices Python
No ratings yet
Class 12 Practical File Informatics Practices Python
19 pages
Oddstudents
No ratings yet
Oddstudents
35 pages
Female Pelvis Anatomy 400 MCQ Questions Only
No ratings yet
Female Pelvis Anatomy 400 MCQ Questions Only
67 pages
Data Preprocessing
No ratings yet
Data Preprocessing
84 pages
MY Question Bank
No ratings yet
MY Question Bank
3 pages
Chapter2 - Data Wrangling
No ratings yet
Chapter2 - Data Wrangling
48 pages
IP Lab Record
No ratings yet
IP Lab Record
23 pages
Python Questions BA
No ratings yet
Python Questions BA
5 pages
Assignment 2
No ratings yet
Assignment 2
6 pages
Even Students
No ratings yet
Even Students
36 pages
Assignment
No ratings yet
Assignment
12 pages
CSE445 NSU Week - 3
No ratings yet
CSE445 NSU Week - 3
48 pages
Practical No. 01
No ratings yet
Practical No. 01
114 pages
HCLTech
No ratings yet
HCLTech
5 pages
DAP Writeups - Merged
No ratings yet
DAP Writeups - Merged
33 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
Create A Pandas Series From A Dictionary of Values and An Ndarray
No ratings yet
Create A Pandas Series From A Dictionary of Values and An Ndarray
15 pages
Normal Pattern #164523 - BraceletBook
No ratings yet
Normal Pattern #164523 - BraceletBook
5 pages
Task2 Eda Cleaning
No ratings yet
Task2 Eda Cleaning
33 pages
Practical File Infomatics Practices 2024-25
No ratings yet
Practical File Infomatics Practices 2024-25
39 pages
Python - Pandas - Numpy Interview Q&A
No ratings yet
Python - Pandas - Numpy Interview Q&A
12 pages
Mastering Data Analyst Interview Scenarios
No ratings yet
Mastering Data Analyst Interview Scenarios
20 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
Lab 1 ML Lab
No ratings yet
Lab 1 ML Lab
15 pages
Consumed by The Universe - Peel
100% (1)
Consumed by The Universe - Peel
5 pages
Document (4) - 1
No ratings yet
Document (4) - 1
15 pages
UNiversal Puller Machine Daily Checklist
No ratings yet
UNiversal Puller Machine Daily Checklist
2 pages
Go Getter 1 Unit 7 Test
No ratings yet
Go Getter 1 Unit 7 Test
2 pages
Data Cleaning - Cheatsheet
100% (2)
Data Cleaning - Cheatsheet
8 pages
Exp 8 - LM
No ratings yet
Exp 8 - LM
10 pages
Endgame Tactics Training Improve Your Chess With Yasser Seirawan
No ratings yet
Endgame Tactics Training Improve Your Chess With Yasser Seirawan
32 pages
Cleaning Data in Python
No ratings yet
Cleaning Data in Python
8 pages
Data Cleaning
No ratings yet
Data Cleaning
13 pages
MCQ
No ratings yet
MCQ
8 pages
South Korea UNSC MUN Speeches
No ratings yet
South Korea UNSC MUN Speeches
7 pages
L6 and 7-Data Preprocessing-Coding
No ratings yet
L6 and 7-Data Preprocessing-Coding
34 pages
PDS Exp 7 To 9
No ratings yet
PDS Exp 7 To 9
10 pages
Data Handling Ques
No ratings yet
Data Handling Ques
2 pages
1504 Enthuse Block-24 SRG Ans Key 1901cja101021230131-Allen
No ratings yet
1504 Enthuse Block-24 SRG Ans Key 1901cja101021230131-Allen
8 pages
IP Record Final-1
No ratings yet
IP Record Final-1
34 pages
04 DS 2023
No ratings yet
04 DS 2023
63 pages
Overview of Data Cleaning
No ratings yet
Overview of Data Cleaning
17 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
Class 12 Practical File Informatics Practices
No ratings yet
Class 12 Practical File Informatics Practices
16 pages
Dataframing in CSV
No ratings yet
Dataframing in CSV
14 pages
DW Lab File
No ratings yet
DW Lab File
18 pages
Note On Defamation Case
No ratings yet
Note On Defamation Case
5 pages
Practical File IP
No ratings yet
Practical File IP
27 pages
Lec 04
No ratings yet
Lec 04
79 pages
Bangladesh Bank: Bankers' Selection Committee Secretariat
No ratings yet
Bangladesh Bank: Bankers' Selection Committee Secretariat
1 page
Arjun Erigaisi
No ratings yet
Arjun Erigaisi
5 pages
Class 12 Practical File Informatics Practices
No ratings yet
Class 12 Practical File Informatics Practices
28 pages
ANL252 SU4 Jul2022
No ratings yet
ANL252 SU4 Jul2022
55 pages
Score 15768
No ratings yet
Score 15768
2 pages
Statistical Transform Data Cleaning
No ratings yet
Statistical Transform Data Cleaning
30 pages
String (Pandas) - Removing $ After Int Sales ( Revenue') Sales ( Revenue') .STR - Strip ( $') #Convert String To Int
No ratings yet
String (Pandas) - Removing $ After Int Sales ( Revenue') Sales ( Revenue') .STR - Strip ( $') #Convert String To Int
12 pages
DS Question Bank Unit-1 Part-2
No ratings yet
DS Question Bank Unit-1 Part-2
3 pages
B Tech-AIML-question Bank-2 Answer Key
No ratings yet
B Tech-AIML-question Bank-2 Answer Key
9 pages
Level 4
No ratings yet
Level 4
5 pages
16 Jan, 2025
No ratings yet
16 Jan, 2025
1 page
AIML
No ratings yet
AIML
13 pages
Dejene Chala Stat606 Screening Quiz Programming Part
No ratings yet
Dejene Chala Stat606 Screening Quiz Programming Part
12 pages
FN پين اوت رانا
No ratings yet
FN پين اوت رانا
2 pages
Seismic Calculation
No ratings yet
Seismic Calculation
5 pages
Bobby Tanqueray
No ratings yet
Bobby Tanqueray
2 pages
Unit 1: Exercise 1: Complete The Table With These Phrases
No ratings yet
Unit 1: Exercise 1: Complete The Table With These Phrases
11 pages
Text 3
No ratings yet
Text 3
3 pages
IP - Pandas 1 & 2 (Worksheet) Class 12
No ratings yet
IP - Pandas 1 & 2 (Worksheet) Class 12
16 pages
12 Ip Practical List With Solution Complete
No ratings yet
12 Ip Practical List With Solution Complete
5 pages
Sci4 Summative 01
No ratings yet
Sci4 Summative 01
2 pages
Microsoft Azure Database Administrator DP 300
From Everand
Microsoft Azure Database Administrator DP 300
Manish Soni
No ratings yet
Python Interview Questions 1653100147
No ratings yet
Python Interview Questions 1653100147
24 pages
EDS - Python Cheat Sheet
0% (1)
EDS - Python Cheat Sheet
3 pages
Reservorio 55m3
No ratings yet
Reservorio 55m3
1 page
Data Exploration Preparation
No ratings yet
Data Exploration Preparation
12 pages
Administering Microsoft Azure SQL Solutions DP 300
From Everand
Administering Microsoft Azure SQL Solutions DP 300
Manish Soni
No ratings yet
62nd SR State Circular 2022 Balasore
No ratings yet
62nd SR State Circular 2022 Balasore
3 pages
PH 400
No ratings yet
PH 400
147 pages
Pandas
No ratings yet
Pandas
5 pages
Ip Practice Test (14in)
No ratings yet
Ip Practice Test (14in)
9 pages
Lecture Chess
No ratings yet
Lecture Chess
25 pages
Max Life Monthly Income Advantage Plan Premium Rates
No ratings yet
Max Life Monthly Income Advantage Plan Premium Rates
4 pages
Boeing 777-300ER KLM New Livery
No ratings yet
Boeing 777-300ER KLM New Livery
18 pages
Alleluia Luo-1
No ratings yet
Alleluia Luo-1
1 page
Detailed Lesson Plan P E 8 Chess
No ratings yet
Detailed Lesson Plan P E 8 Chess
8 pages

Python Scenario Based Interview QA

Uploaded by

Python Scenario Based Interview QA

Uploaded by

Scenario-Based Python Interview Questions for Data Analysis Roles (Freshers)

rows. How would you clean this data using Python?

# Standardize casing (e.g., for a 'Name' column)

# Handle missing values

monthly_avg = df.groupby(['Month', 'Product'])['Revenue'].mean().reset_index()

- Handle missing values

- Convert categorical features to numeric using pd.get_dummies()

- Normalize/scale numerical features

- Merge datasets if activity logs are separate

- Label churn (e.g., Churn = 1 if customer left, else 0)

identify and handle outliers?

outliers = df[(df['Price'] < Q1 - 1.5*IQR) | (df['Price'] > Q3 + 1.5*IQR)]

combine them to analyze total spending per user?

merged = pd.merge(users, transactions, on='user_id')

import matplotlib.pyplot as plt

plt.title('Daily Temperature Trends')

for machine learning?

# Use OneHotEncoder or pd.get_dummies

df = pd.get_dummies(df, columns=['Country'], drop_first=True)

You might also like

outliers = df[(df['Price'] < Q1 - 1.5IQR) | (df['Price'] > Q3 + 1.5IQR)]