Code

Uploaded by

Houssam Alrifaii

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views1 page

Code

Uploaded by

Houssam Alrifaii

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

import pandas as pd

# Load the data

df = pd.read_csv('loyalty.csv')

# 1. Identify and replace missing values

# Replace missing 'spend' values with 0
df['spend'].fillna(0, inplace=True)

# Ensure to replace missing values for other relevant fields as specified

df['first_month'].fillna(0, inplace=True)
df['items_in_first_month'].fillna(0, inplace=True)
df['region'].fillna('Unknown', inplace=True) # Missing regions
replaced with 'Unknown'
df['loyalty_years'].fillna('0-1', inplace=True) # Missing loyalty
years replaced with '0-1'
df['joining_month'].fillna('Unknown', inplace=True) # Missing joining
month replaced with 'Unknown'
df['promotion'].fillna('No', inplace=True) # Missing promotion
values replaced with 'No'

# 2. Convert values between data types

# Convert numeric fields from string (if necessary) ensuring type (including
rounding)
df['spend'] = pd.to_numeric(df['spend'], errors='coerce').fillna(0).round(2) #
Convert 'spend' to float and round to 2 decimals
df['first_month'] = pd.to_numeric(df['first_month'],
errors='coerce').fillna(0).round(2) # Convert 'first_month' to float and round
df['items_in_first_month'] = df['items_in_first_month'].fillna(0).astype(int) #
Convert 'items_in_first_month' from float to int

# 3. Clean categorical and text data by manipulating strings

# Convert categorical columns to the proper format
# For 'region' and 'joining_month', we can standardize string formats
df['region'] = df['region'].str.strip().str.title() # Strip whitespace and title
case for consistency
df['joining_month'] = df['joining_month'].str.strip().str.capitalize() # Strip
whitespace and capitalize

# Ensure all categorical features are of type 'category' for efficient memory usage

df['region'] = df['region'].astype('category')
df['loyalty_years'] = df['loyalty_years'].astype('category')
df['joining_month'] = df['joining_month'].astype('category')
df['promotion'] = df['promotion'].astype('category')

# Display the cleaned DataFrame

print(df.head())

# Saving cleaned data to a new CSV file if needed

df.to_csv('cleaned_loyalty.csv', index=False)

LTI CheckList Assignment 1.ipynb - Colab
No ratings yet
LTI CheckList Assignment 1.ipynb - Colab
13 pages
Cleaning Data in Python
No ratings yet
Cleaning Data in Python
8 pages
Chip Analysis
No ratings yet
Chip Analysis
2 pages
Exp 8 - LM
No ratings yet
Exp 8 - LM
10 pages
Pandas Syntax Revision For ML
No ratings yet
Pandas Syntax Revision For ML
10 pages
Customer Segmentation Analysis
No ratings yet
Customer Segmentation Analysis
34 pages
Analyzing Supermarket Sales Data
No ratings yet
Analyzing Supermarket Sales Data
6 pages
Supermarket Sales Insights
No ratings yet
Supermarket Sales Insights
8 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
2 pages
Data Wrangling Notebook Summary
No ratings yet
Data Wrangling Notebook Summary
9 pages
Task2 Eda Cleaning
No ratings yet
Task2 Eda Cleaning
33 pages
Sales Management Project Report
No ratings yet
Sales Management Project Report
18 pages
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
No ratings yet
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
10 pages
Pandas Data Manipulation Extended CheatSheet 1731972219
No ratings yet
Pandas Data Manipulation Extended CheatSheet 1731972219
9 pages
Practice Questions2
No ratings yet
Practice Questions2
2 pages
BankX Marketing 1744722258
No ratings yet
BankX Marketing 1744722258
29 pages
Python CheatSheet
No ratings yet
Python CheatSheet
2 pages
Cheat Sheet - Pandas
No ratings yet
Cheat Sheet - Pandas
6 pages
Data Analysis for Sales Insights
No ratings yet
Data Analysis for Sales Insights
4 pages
Quantium Task 1
No ratings yet
Quantium Task 1
4 pages
Data Preprocessing 2
No ratings yet
Data Preprocessing 2
5 pages
CSV Data Handling Guide
No ratings yet
CSV Data Handling Guide
14 pages
Session-3 DS Practical
No ratings yet
Session-3 DS Practical
7 pages
Basics of Pandas
No ratings yet
Basics of Pandas
5 pages
EDA With Pandas CheatSheet
No ratings yet
EDA With Pandas CheatSheet
3 pages
Data Analysis in The Banking Sector: Pandas Fundamentals
No ratings yet
Data Analysis in The Banking Sector: Pandas Fundamentals
16 pages
Python Pandas: 12 Data Manipulation Techniques
100% (2)
Python Pandas: 12 Data Manipulation Techniques
19 pages
Data Wrangling - Jupyter Notebook
No ratings yet
Data Wrangling - Jupyter Notebook
5 pages
Kunal Assignment 3
No ratings yet
Kunal Assignment 3
19 pages
Lab 1 ML
No ratings yet
Lab 1 ML
2 pages
Python - Pandas - Numpy Interview Q&A
No ratings yet
Python - Pandas - Numpy Interview Q&A
12 pages
Churn Prediction Model
No ratings yet
Churn Prediction Model
36 pages
Pandas Notes
No ratings yet
Pandas Notes
8 pages
Numpy - Pandas - Colab
No ratings yet
Numpy - Pandas - Colab
6 pages
Pandas Trampas
No ratings yet
Pandas Trampas
9 pages
Python Data Science Cheat Sheet
0% (1)
Python Data Science Cheat Sheet
3 pages
Task 6
No ratings yet
Task 6
14 pages
Customer Segmentation Analysis
No ratings yet
Customer Segmentation Analysis
18 pages
Pandas Data Cleaning Techniques Guide
No ratings yet
Pandas Data Cleaning Techniques Guide
11 pages
Pandas Introduction: What Is Python Pandas Used For?
No ratings yet
Pandas Introduction: What Is Python Pandas Used For?
28 pages
Task-by-Task Guide - Retail Data Analysis
No ratings yet
Task-by-Task Guide - Retail Data Analysis
6 pages
Quikr Car Price Prediction Using Linear Regression 1717999953
No ratings yet
Quikr Car Price Prediction Using Linear Regression 1717999953
12 pages
Python for Business Analysts
No ratings yet
Python for Business Analysts
21 pages
IP Class 12 Worksheet-02
No ratings yet
IP Class 12 Worksheet-02
3 pages
Pandas Commands
No ratings yet
Pandas Commands
3 pages
Exp 3
No ratings yet
Exp 3
10 pages
EXP 5 DE Lab
No ratings yet
EXP 5 DE Lab
5 pages
Quantium Task 2
No ratings yet
Quantium Task 2
30 pages
Sunbase Data Assignment
No ratings yet
Sunbase Data Assignment
11 pages
Pyspark Interview Questions
No ratings yet
Pyspark Interview Questions
4 pages
DW Lab File
No ratings yet
DW Lab File
18 pages
Exercises 2
No ratings yet
Exercises 2
10 pages
Exploratry Data Analysis of The Telecom Customer Churn
No ratings yet
Exploratry Data Analysis of The Telecom Customer Churn
16 pages
Laptop Dataset Analysis & Visualization
No ratings yet
Laptop Dataset Analysis & Visualization
1 page
Pandas Dataframe Cheat Sheet
No ratings yet
Pandas Dataframe Cheat Sheet
3 pages
Intro To Pandas For Data Analytics
No ratings yet
Intro To Pandas For Data Analytics
20 pages
NumPy and Pandas Step
No ratings yet
NumPy and Pandas Step
9 pages
EDA Cheat Sheet
No ratings yet
EDA Cheat Sheet
7 pages

Code

Uploaded by

Code

Uploaded by

import pandas as pd

# Load the data

# 1. Identify and replace missing values

# Ensure to replace missing values for other relevant fields as specified

# 2. Convert values between data types

# 3. Clean categorical and text data by manipulating strings

# Display the cleaned DataFrame

# Saving cleaned data to a new CSV file if needed

You might also like