0% found this document useful (0 votes)

5 views

Phase 2

The document describes building an e-commerce product recommendation system. It covers data collection, preprocessing, feature engineering, model development using collaborative filtering, and deploying a recommendation engine. The goal is to enhance user experience by providing personalized product recommendations on an e-commerce platform.

Uploaded by

Harsha Varthini

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

Phase 2

Uploaded by

Harsha Varthini

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 17

E-commerce Product Recommendation System

Introduction

E-commerce platforms have revolutionized the way we shop, offering a

vast array of products to users. However, with the increasing number of
products, users often struggle to find items that best match their
preferences and needs. Recommendation systems address this
challenge by providing personalized suggestions based on user
interactions, enhancing user engagement and satisfaction.

Objectives

Cleanse the dataset: Data cleaning involves handling missing values and
outliers to ensure data integrity and accuracy.

Explore dataset characteristics through EDA: Exploratory Data Analysis

(EDA) helps in understanding dataset characteristics through
visualization and statistical analysis.

Engineer relevant features: Feature engineering involves extracting and

creating relevant features from raw data to improve recommendation
accuracy.

2
Develop a recommendation engine: Train and deploy a
recommendation model to deliver personalized product
recommendations.

Dataset Description

The dataset includes user interaction data from an e-commerce

platform, including user profiles, product items, and user interactions
such as ratings, views, and purchases. Each row represents a user's
interaction with a specific product, forming the basis for personalized
product recommendations.

System Architecture

Our e-commerce product recommendation system consists of the

following components:

Data Collection:Collect user interaction data, including user profiles,

product items, and user interactions such as ratings, views, and
purchases.

Data Preprocessing:Cleanse the dataset by handling missing values

and outliers.Explore the dataset's characteristics through EDA.Engineer
relevant features for model development.

Model Development:Implement recommendation algorithms such as

collaborative filtering, content-based filtering, and hybrid
methods.Train the recommendation model using the preprocessed
dataset.

3
Recommendation Engine:Generate personalized product
recommendations for users based on their preferences and
interactions.Deploy the recommendation engine on the e-commerce
platform.

Data Wrangling Techniques

1. Data Description:

Head: Displaying the first few rows of the dataset to get an initial
overview.

Tail: Examining the last few rows of the dataset to ensure

completeness.

Info: Obtaining information about the dataset structure, data types,

and memory usage.

Describe: Generating descriptive statistics for numerical features to

understand their distributions and central tendencies.

CODE

import pandas as pd

import numpy as np

np.random.seed(0)

data = pd.DataFrame({

'user_id': np.random.randint(1, 100, 100),

4
'product_id': np.random.randint(1, 50, 100),

'product_category': np.random.choice(['Electronics', 'Clothing',

'Books'], 100),

'product_brand': np.random.choice(['Brand_A', 'Brand_B', 'Brand_C'],

100),

'product_popularity': np.random.randint(1, 100, 100),

'interaction_type': np.random.choice(['view', 'purchase'], 100)

})

X = data[['user_id', 'product_id', 'product_popularity']]

X = pd.get_dummies(X, columns=['product_id', 'product_popularity'],

drop_first=True)

y = data['interaction_type']

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,

random_state=42)

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

X_train_scaled = scaler.fit_transform(X_train)

X_test_scaled = scaler.transform(X_test)

5
import seaborn as sns

import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))

sns.histplot(y_train, color='blue', alpha=0.5, label='Train')

sns.histplot(y_test, color='red', alpha=0.5, label='Test')

plt.title('Distribution of Interaction Types in Train and Test Sets')

plt.xlabel('Interaction Type')

plt.ylabel('Frequency')

plt.legend()

plt.show()

OUTPUT

6
2.Data Cleaning:

● Data cleaning involves handling missing values and outliers to

ensure data integrity and accuracy.

CODE

import pandas as pd

import numpy as np

data_dict = {

'user_id': [1, 2, 3, 4, 5],

'product_id': [101, 102, 103, 104, 105],

'interaction_type': ['view', 'purchase', 'view', 'purchase', 'view']

data = pd.DataFrame(data_dict)

data.dropna(inplace=True)

from scipy import stats

numeric_cols = ['user_id', 'product_id']

z_scores = np.abs(stats.z score(data[numeric_cols]))

threshold = 3

data = data[(z_scores < threshold).all(axis=1)]

7
data

OUTPUT

2. Exploratory Data Analysis (EDA)

● Exploratory Data Analysis (EDA) helps in understanding dataset

characteristics through visualization and statistical analysis.

CODE

import numpy as np

8
import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

np.random.seed(0)

n = 1000

data = pd.DataFrame({

'user_id': np.random.randint(1, 100, n),

'product_id': np.random.randint(1, 50, n),

'interaction_type': np.random.choice(['view', 'click', 'purchase'], n)

})

plt.figure(figsize=(10, 6))

sns.countplot(data['interaction_type'])

plt.title('User Interactions with Products')

plt.xlabel('Interaction Type')

plt.ylabel('Frequency')

plt.show()

OUTPUT

9
4.Feature Engineering

● Feature engineering involves extracting and creating relevant

features from raw data to improve recommendation accuracy.

CODE

import pandas as pd

data = {

'user_id': [1, 1, 2, 2, 3, 3],

'product_id': [101, 102, 101, 103, 102, 104],

'interaction_type': ['view', 'purchase', 'view', 'rating', 'purchase', 'view'],

'product_name': ['Product A', 'Product B', 'Product A', 'Product C',

'Product B', 'Product D'],

'timestamp': ['2022-01-01 10:00:00', '2022-01-01 10:15:00',

'2022-01-01 11:00:00', '2022-01-01 12:00:00', '2022-01-01 13:00:00',
'2022-01-01 14:00:00']

10
}

data = pd.DataFrame(data)

user_profiles =
data.groupby('user_id').size().to_frame('num_interactions')

data['timestamp'] = pd.to_datetime(data['timestamp'])

data['hour_of_day'] = data['timestamp'].dt.hour

data['product_category'] = data['product_name'].apply(lambda x:
x.split()[0])

data['product_brand'] = data['product_name'].apply(lambda x:
x.split()[1])

data['product_popularity'] =
data.groupby('product_name')['user_id'].transform('count')

print("Modified Dataset:")

print(data)

print("\nUser Profiles:")

print(user_profiles)

OUTPUT

11
5. Data Transformation

Data transformation involves selecting relevant features, splitting the

dataset into training and testing sets, and standardizing numerical
features to ensure consistent scaling.

CODE

X = pd.get_dummies(data[['user_id', 'product_id', 'product_category',

'product_brand']])

y = data['interaction_type']

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,

random_state=42)

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler() # Instantiate StandardScaler

12
X_train_scaled = scaler.fit_transform(X_train)

X_test_scaled = scaler.transform(X_test)

X_train_scaled[:5]

OUTPUT

Model Development

Collaborative Filtering :

● Collaborative filtering is a recommendation algorithm that makes

automatic predictions about the interests of a user by collecting
preferences from many users.

CODE

data = {

'user_id': [1, 1, 2, 2, 3, 3, 4, 4],

'product_id': [101, 102, 101, 103, 102, 104, 101, 103],

'interaction_type': ['view', 'purchase', 'view', 'view', 'purchase', 'view',

'purchase', 'purchase']

13
}

data_df = pd.DataFrame(data)

interaction_type_map = {'view': 1, 'purchase': 5}

data_df['interaction_type'] =
data_df['interaction_type'].map(interaction_type_map)

reader = Reader(rating_scale=(1, 5))

data_cf = Dataset.load_from_df(data_df[['user_id', 'product_id',

'interaction_type']], reader)

trainset, testset = train_test_split(data_cf, test_size=0.2,

random_state=42)

algo_cf = KNNBasic()

algo_cf.fit(trainset)

predictions_cf = algo_cf.test(testset)

rmse_cf = accuracy.rmse(predictions_cf)

OUTPUT

14
Recommendation Engine

Collaborative Filtering Recommendations :

● Collaborative filtering recommendations are generated based on

the preferences and interactions of similar users.

CODE

def get_top_n_recommendations(user_id, n=10):

user_items = data_df[data_df['user_id'] ==
user_id]['product_id'].tolist()

all_items = data_df['product_id'].unique().tolist()

items_to_predict = list(set(all_items) - set(user_items))

predictions = [algo_cf.predict(user_id, item).est for item in

items_to_prediction

top_n_items = [x for _, x in sorted(zip(predictions, items_to_predict),

reverse=True)][:n]

return top_n_items

user_id = 12345

top_n_recommendations = get_top_n_recommendations(user_id, n=10)

top_n_recommendations

OUTPUT

15
Assumed Scenario

● Scenario: The e-commerce platform aims to enhance user

experience by providing personalized product recommendations.
● Objective: Deliver relevant and tailored product
recommendations to users.
● Target Audience: Users seeking personalized product
recommendations across various categories.

Conclusion

Phase 2 of the project focuses on preparing the dataset for building an

e-commerce product recommendation system. By employing data
wrangling techniques and system architecture, we aim to develop a
recommendation engine that delivers product recommendations to
users, thereby enhancing their shopping experience on the
e-commerce platform.

CODE

def get_top_n_recommendations(user_id, n=10):

all_products = [i for i in range(1, 1000)]

top_n_items = np.random.choice(all_products, n, replace=False)

16
return top_n_items

user_id = 12345

top_n_recommendations = get_top_n_recommendations(user_id, n=10)

print("Top 10 recommendations for user",

OUTPUT

George Lindsay - Selected Articles PDF
No ratings yet
George Lindsay - Selected Articles PDF
98 pages
C-17 Globemaster III Manual
67% (3)
C-17 Globemaster III Manual
30 pages
340AJ Service 3121259 Jan-2012 Global English PDF
No ratings yet
340AJ Service 3121259 Jan-2012 Global English PDF
356 pages
Team8_Presentation
No ratings yet
Team8_Presentation
15 pages
Problem Statement - RS - Amazon Product Recommendation
No ratings yet
Problem Statement - RS - Amazon Product Recommendation
2 pages
Bookrecommendations 230615063942 3b1016c9
No ratings yet
Bookrecommendations 230615063942 3b1016c9
22 pages
Quick Guide Build Recommendation Engine Python
No ratings yet
Quick Guide Build Recommendation Engine Python
17 pages
BDA POORVIKA.pdf_20241105_191824_0000
No ratings yet
BDA POORVIKA.pdf_20241105_191824_0000
15 pages
E-Commerce E3s Conference
No ratings yet
E-Commerce E3s Conference
7 pages
Best Product Recommendation System
No ratings yet
Best Product Recommendation System
37 pages
Product Recommendation System Priya
No ratings yet
Product Recommendation System Priya
3 pages
Ankit Survey Paper (1)
No ratings yet
Ankit Survey Paper (1)
6 pages
Chen 2014
No ratings yet
Chen 2014
7 pages
Final Project Report
No ratings yet
Final Project Report
18 pages
High Level Design Document: Online Grocery Recommendation Using Collaborative Filtering
No ratings yet
High Level Design Document: Online Grocery Recommendation Using Collaborative Filtering
18 pages
Shopping Cart Items Recommendation PDF
No ratings yet
Shopping Cart Items Recommendation PDF
8 pages
Seminar Report Final
No ratings yet
Seminar Report Final
46 pages
Project Synopsis: Department Title of The Project
No ratings yet
Project Synopsis: Department Title of The Project
4 pages
Product Recommendation System (ML)
No ratings yet
Product Recommendation System (ML)
5 pages
Gen AI Hackathon
No ratings yet
Gen AI Hackathon
8 pages
In Tenshi PPP Tte Jum Am
No ratings yet
In Tenshi PPP Tte Jum Am
23 pages
A Comparative Study of Recommendation Algorithms in E-Commerce Applications
No ratings yet
A Comparative Study of Recommendation Algorithms in E-Commerce Applications
23 pages
Pdf-3
No ratings yet
Pdf-3
9 pages
Consumer Behavior Analytics Using Machine Learning Algorithms
No ratings yet
Consumer Behavior Analytics Using Machine Learning Algorithms
3 pages
E-COMMERCE PRODUCT RECOMMENDATION SYSTEM_
No ratings yet
E-COMMERCE PRODUCT RECOMMENDATION SYSTEM_
14 pages
COSC221103017
No ratings yet
COSC221103017
15 pages
ML_(ProjectName)_document_template_v1.0
No ratings yet
ML_(ProjectName)_document_template_v1.0
7 pages
Recommendation System
No ratings yet
Recommendation System
11 pages
DOC-20240501-WA0004.
No ratings yet
DOC-20240501-WA0004.
20 pages
Recommender System Not Recognition
No ratings yet
Recommender System Not Recognition
4 pages
Research Paper
No ratings yet
Research Paper
5 pages
Kavin
No ratings yet
Kavin
13 pages
Rating Prediction
No ratings yet
Rating Prediction
20 pages
AI Recommendation System
No ratings yet
AI Recommendation System
20 pages
Document from Mohanapriya ?
No ratings yet
Document from Mohanapriya ?
5 pages
Your Paragraph Text
No ratings yet
Your Paragraph Text
13 pages
Ghadekar 2019
No ratings yet
Ghadekar 2019
5 pages
JackFruit Problem
No ratings yet
JackFruit Problem
3 pages
Ai Case Study
No ratings yet
Ai Case Study
9 pages
Review1 (1)
No ratings yet
Review1 (1)
10 pages
UI21CS29_Lab2
No ratings yet
UI21CS29_Lab2
11 pages
Product Recommendation SystemV
No ratings yet
Product Recommendation SystemV
2 pages
Final Report - PBL
No ratings yet
Final Report - PBL
15 pages
KanagalMukhul Fall2020
No ratings yet
KanagalMukhul Fall2020
32 pages
A Case Study in A Recommender System Based On
No ratings yet
A Case Study in A Recommender System Based On
9 pages
Ai Based Electronic Gadget Recommendation System
No ratings yet
Ai Based Electronic Gadget Recommendation System
12 pages
DWDM
No ratings yet
DWDM
19 pages
SYNOPSIS (2)
No ratings yet
SYNOPSIS (2)
2 pages
41 Perusse Alexander Aperusse PDF
No ratings yet
41 Perusse Alexander Aperusse PDF
7 pages
assignment-1
No ratings yet
assignment-1
4 pages
Ir Recommendation & KNN
No ratings yet
Ir Recommendation & KNN
9 pages
Final HLD
No ratings yet
Final HLD
11 pages
Report
No ratings yet
Report
10 pages
Synopsis
No ratings yet
Synopsis
8 pages
Projects
No ratings yet
Projects
31 pages
Recommender - Introduction
No ratings yet
Recommender - Introduction
25 pages
ML CA1 Ecommerce
No ratings yet
ML CA1 Ecommerce
8 pages
2015-17 Web
No ratings yet
2015-17 Web
68 pages
Module4-RecommenderSystem
No ratings yet
Module4-RecommenderSystem
11 pages
Essential n8n Playbook
From Everand
Essential n8n Playbook
Leandro Calado
No ratings yet
Data Science with R: Beginner to Expert
From Everand
Data Science with R: Beginner to Expert
Narayana Nemani
No ratings yet
Microsoft Certified: Power BI Data Analyst Associate PL 300 Practice Tests
From Everand
Microsoft Certified: Power BI Data Analyst Associate PL 300 Practice Tests
CertSquad Professional Trainers
No ratings yet
Artificial Intelligence 2024 Book 2 of 2: AI, #2
From Everand
Artificial Intelligence 2024 Book 2 of 2: AI, #2
Yang Yen Thaw
No ratings yet
Attitudes and Behaviours
No ratings yet
Attitudes and Behaviours
18 pages
Apple
No ratings yet
Apple
5 pages
234,052 199,129 190,901 Total Putr-1 & Putr-3: Kalis BSD Jan 19
No ratings yet
234,052 199,129 190,901 Total Putr-1 & Putr-3: Kalis BSD Jan 19
1 page
List of Store To Buy Bitcoin in Rudkøbing - Google Search
No ratings yet
List of Store To Buy Bitcoin in Rudkøbing - Google Search
1 page
Quotation-Bhramari City1
No ratings yet
Quotation-Bhramari City1
6 pages
DNM Soln
No ratings yet
DNM Soln
27 pages
What Is Action Research?: Action Research Is Focused On Solving Specific Classroom or School Problems, Improving
No ratings yet
What Is Action Research?: Action Research Is Focused On Solving Specific Classroom or School Problems, Improving
7 pages
Haryana Group D Vacancy Details 2022 05 31 1
No ratings yet
Haryana Group D Vacancy Details 2022 05 31 1
21 pages
Aa BGC
No ratings yet
Aa BGC
26 pages
Pile Driving Equipment
100% (1)
Pile Driving Equipment
16 pages
M201 Tech CKLST r4
No ratings yet
M201 Tech CKLST r4
32 pages
Team Innoreva Orientation 2K23
No ratings yet
Team Innoreva Orientation 2K23
106 pages
Some Basic Concepts of Chemistry: Unit 1
No ratings yet
Some Basic Concepts of Chemistry: Unit 1
25 pages
T.V.I.S.: Thatcham Vehicle Identification System
No ratings yet
T.V.I.S.: Thatcham Vehicle Identification System
1,369 pages
2.2.2 Grease Ground Inst
No ratings yet
2.2.2 Grease Ground Inst
10 pages
Stellram Turning Cutting Speeds Inch PDF
No ratings yet
Stellram Turning Cutting Speeds Inch PDF
4 pages
Thesis Discussion Template
100% (3)
Thesis Discussion Template
8 pages
Thesis About Racism PDF
100% (3)
Thesis About Racism PDF
4 pages
PEL130 Zero Lecture PPT 2024
No ratings yet
PEL130 Zero Lecture PPT 2024
43 pages
Barrogo Carl Kimbo Quiz2
No ratings yet
Barrogo Carl Kimbo Quiz2
17 pages
Module 2 - Entrepreneurship
No ratings yet
Module 2 - Entrepreneurship
10 pages
Learning Competency/ies: (Taken From The Curriculum Guide) Key Concepts/ Understandings To Be Developed 1. Objectives
67% (3)
Learning Competency/ies: (Taken From The Curriculum Guide) Key Concepts/ Understandings To Be Developed 1. Objectives
2 pages
Bookshelf NBK232127
No ratings yet
Bookshelf NBK232127
393 pages
28
No ratings yet
28
18 pages
MSCCS - 104
No ratings yet
MSCCS - 104
5 pages
Mons. Vicente Zazpe 2790 - S 3000 CXJ Santa Fe - Tel.: (0342) 4582288 - 4594061 Javier de La Rosa 597 - S 3004 AZI - Tel.: (0342) 4601395 - 4191395
No ratings yet
Mons. Vicente Zazpe 2790 - S 3000 CXJ Santa Fe - Tel.: (0342) 4582288 - 4594061 Javier de La Rosa 597 - S 3004 AZI - Tel.: (0342) 4601395 - 4191395
5 pages
Instant ebooks textbook (Ebook) Aggressive and Violent Peasant Elites in the Nordic Countries, C. 1500-1700 by Ulla Koskinen (eds.) ISBN 9783319406879, 9783319406886, 3319406876, 3319406884 download all chapters
100% (7)
Instant ebooks textbook (Ebook) Aggressive and Violent Peasant Elites in the Nordic Countries, C. 1500-1700 by Ulla Koskinen (eds.) ISBN 9783319406879, 9783319406886, 3319406876, 3319406884 download all chapters
55 pages