0% found this document useful (0 votes)

14 views

Assignment 5

The project aims to build a movie recommendation system using both Collaborative Filtering and Content-Based Filtering based on user viewing history. It involves data collection from the MovieLens dataset, preprocessing, implementing recommendation algorithms, and evaluating model performance. The system combines both methods to enhance the accuracy and diversity of movie recommendations, with suggestions for further improvements such as hybrid models and a user interface.

Uploaded by

zeerakzoya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views

Assignment 5

Uploaded by

zeerakzoya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

Zeerak Mustafa khan 2200911540131

CSDS 2

PROJECT TITLE : Build a system that recommends movies to users

based on their viewing history.

Steps Involved:
1. Data Collection: We will use a simplified version of the MovieLens dataset (which
contains user ratings and movie details).
2. Data Preprocessing: Clean and prepare the data.
3. Recommendation Algorithms: Implement Collaborative Filtering and Content-Based
Filtering.
4. Model Evaluation: Evaluate the performance using metrics like RMSE.
5. Integration: A simple script to demonstrate how the system works.

1. Install Required Libraries

First, you need to install some Python libraries that we will use for this project. You can install
them via pip.

pip install pandas numpy scikit-learn surprise

2. Data Collection

For this project, we will use a small, sample dataset. You can download the MovieLens
dataset (or use any small version of the MovieLens dataset). For simplicity, we will use
a dataset that contains movie ratings by users. Here is an example dataset:

movie_id,title,genre 1,Toy Story (1995),Animation|Children|Comedy 2,Jumanji

user_id,movie_id,rating 1,1,5 1,2,4 2,1,4 2,3,3 3,2,5 3,4,2

3. Data Preprocessing

First, we load and clean the data.

import pandas as pd

# Load movie and ratings data

Zeerak Mustafa khan 2200911540131
CSDS 2

PROJECT TITLE : Build a system that recommends movies to users

based on their viewing history.
movies = pd.read_csv('movies.csv')
ratings = pd.read_csv('ratings.csv')

# Display data
print(movies.head())
print(ratings.head())

4. Collaborative Filtering with surprise

We will use the surprise library to implement collaborative filtering. Specifically, we’ll
use Singular Value Decomposition (SVD) to predict ratings and recommend movies.

from surprise import SVD, Dataset, Reader

from surprise.model_selection import train_test_split

from surprise import accuracy

# Prepare the data for Surprise

reader = Reader(line_format='user item rating timestamp', sep=',')

data = Dataset.load_from_df(ratings[['user_id', 'movie_id', 'rating']], reader)

# Split the data into training and testing sets

trainset, testset = train_test_split(data, test_size=0.2)

# Build and train the SVD model

model = SVD()

model.fit(trainset)
Zeerak Mustafa khan 2200911540131
CSDS 2

PROJECT TITLE : Build a system that recommends movies to users

based on their viewing history.

# Make predictions

predictions = model.test(testset)

# Evaluate the model

rmse = accuracy.rmse(predictions)

print(f"RMSE: {rmse}")

5. Content-Based Filtering

Content-based filtering recommends items (movies) based on the attributes of the items
and user preferences. In this case, we'll recommend movies based on genres that the
user has already liked.

Steps:

1. Vectorize Movie Genres: We'll use one-hot encoding for movie genres.
2. Compute Similarity: We'll calculate similarity between movies based on genres
using cosine similarity.

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.metrics.pairwise import cosine_similarity

# One-hot encode the genres

count = CountVectorizer(stop_words='english')

genre_matrix = count.fit_transform(movies['genre'])

# Compute cosine similarity

Zeerak Mustafa khan 2200911540131
CSDS 2

PROJECT TITLE : Build a system that recommends movies to users

based on their viewing history.
cosine_sim = cosine_similarity(genre_matrix, genre_matrix)

# Create a DataFrame for the cosine similarity

cosine_sim_df = pd.DataFrame(cosine_sim, index=movies['title'],

columns=movies['title'])

print(cosine_sim_df)

6. Movie Recommendation

We now combine both filtering approaches to recommend movies to a user based on

their history.

Example: Recommend Movies for a User Who Rated "Toy Story (1995)" Highly

def recommend_movies(user_id, ratings, cosine_sim_df, model):

# Get the movies the user has already watched

user_ratings = ratings[ratings['user_id'] == user_id]

rated_movies = user_ratings['movie_id'].values

recommended_movies = []

for movie_id in rated_movies:

movie_title = movies[movies['movie_id'] == movie_id]['title'].values[0]

# Get movies similar to the ones rated highly

similar_movies =
cosine_sim_df[movie_title].sort_values(ascending=False).index[1:3]
Zeerak Mustafa khan 2200911540131
CSDS 2

PROJECT TITLE : Build a system that recommends movies to users

based on their viewing history.
recommended_movies.extend(similar_movies)

# Recommend movies based on Collaborative Filtering as well

user_predictions = [model.predict(user_id, movie_id) for movie_id in range(1,

len(movies) + 1)]

sorted_predictions = sorted(user_predictions, key=lambda x: x.est, reverse=True)

# Get top 5 movie recommendations

top_5_recommendations = [x.iid for x in sorted_predictions[:5]]

return list(set(recommended_movies)), top_5_recommendations

# Test the function for user_id 1

recommended_movies_content, recommended_movies_collab =
recommend_movies(1, ratings, cosine_sim_df, model)

print("Content-Based Recommendations:", recommended_movies_content)

print("Collaborative Filtering Recommendations:", recommended_movies_collab)

Content-Based Recommendations: Based on movie genres similar to the one that the
user watched.

Collaborative Filtering Recommendations: Based on what other similar users rated

highly.

7. Conclusion:
Zeerak Mustafa khan 2200911540131
CSDS 2

PROJECT TITLE : Build a system that recommends movies to users

based on their viewing history.
This system uses both Collaborative Filtering and Content-Based Filtering to
recommend movies to users based on their viewing history. The system evaluates
movie preferences using a combination of user behavior and movie attributes.

● Collaborative Filtering helps predict ratings based on past user-item

interactions.
● Content-Based Filtering suggests movies based on similar genres to those the
user has already watched.

By combining both techniques, the system offers more accurate and diverse movie
recommendations.

Further Improvements:

● Use hybrid models to combine both collaborative and content-based methods

effectively.
● Implement Matrix Factorization techniques like SVD++ for better
recommendations.
● Add a user interface to display the recommendations dynamically in a web
application.

SRMDB - in (B28 - Research Paper)
No ratings yet
SRMDB - in (B28 - Research Paper)
5 pages
Project Report "E-Commerce Recommendation"
No ratings yet
Project Report "E-Commerce Recommendation"
20 pages
Assignment 5zeerak
No ratings yet
Assignment 5zeerak
6 pages
Dl Project
No ratings yet
Dl Project
9 pages
Movie Recommendation System
No ratings yet
Movie Recommendation System
22 pages
Divya_NM[1]-2
No ratings yet
Divya_NM[1]-2
41 pages
Recommendation System in Python
No ratings yet
Recommendation System in Python
6 pages
Title: Movie Recommendation System Documentation: 1. Demographic Filtering
No ratings yet
Title: Movie Recommendation System Documentation: 1. Demographic Filtering
4 pages
Project Report on Movie Recommendation System
No ratings yet
Project Report on Movie Recommendation System
10 pages
Project Synopsis
No ratings yet
Project Synopsis
14 pages
Jangan Hapus 1
No ratings yet
Jangan Hapus 1
14 pages
Anand Yadav Internship
No ratings yet
Anand Yadav Internship
12 pages
Movie_Recommendation_System_project[1]
No ratings yet
Movie_Recommendation_System_project[1]
9 pages
smlPBL
No ratings yet
smlPBL
18 pages
Final Synopsis
No ratings yet
Final Synopsis
18 pages
Team 10 Movie Prediction
No ratings yet
Team 10 Movie Prediction
14 pages
Exp 2_3a10397ea76773097770b923fd29524b
No ratings yet
Exp 2_3a10397ea76773097770b923fd29524b
14 pages
IV YEAR_MINI PROJECT_FINAL REVIEW PPT SAMPLE FORMAT
No ratings yet
IV YEAR_MINI PROJECT_FINAL REVIEW PPT SAMPLE FORMAT
25 pages
Movie_Recommendation_Report
No ratings yet
Movie_Recommendation_Report
27 pages
Movie Recommendation Engine Using Artificial Intelligence
No ratings yet
Movie Recommendation Engine Using Artificial Intelligence
30 pages
ML Project Movie Recommendation System
No ratings yet
ML Project Movie Recommendation System
2 pages
Recommendation System
No ratings yet
Recommendation System
11 pages
NM (2)_merged
No ratings yet
NM (2)_merged
16 pages
Advanced Recommender Systems With Python
No ratings yet
Advanced Recommender Systems With Python
13 pages
rosp PPT
No ratings yet
rosp PPT
17 pages
Seminar Report
No ratings yet
Seminar Report
13 pages
NM (2)_merged_organized
No ratings yet
NM (2)_merged_organized
16 pages
DSBDA_Mini_Project
No ratings yet
DSBDA_Mini_Project
11 pages
Dr.B.C.Royengi Neeri Ngcollege: Academyofprofessi Onalcourses Durgapur
No ratings yet
Dr.B.C.Royengi Neeri Ngcollege: Academyofprofessi Onalcourses Durgapur
33 pages
Movie _recommendations _system_Synopsis[6]
No ratings yet
Movie _recommendations _system_Synopsis[6]
11 pages
MOvie Recommendation System Project Report
No ratings yet
MOvie Recommendation System Project Report
30 pages
ML CASE STUDY
No ratings yet
ML CASE STUDY
4 pages
PPT
No ratings yet
PPT
15 pages
Vaibhav - Project Report On Movie Recommender System Using Machine Learning
No ratings yet
Vaibhav - Project Report On Movie Recommender System Using Machine Learning
11 pages
Movie Recommendation System: Synopsis For Project (KCA 353)
No ratings yet
Movie Recommendation System: Synopsis For Project (KCA 353)
17 pages
Recommender System Unit Ii
No ratings yet
Recommender System Unit Ii
14 pages
Project Report in House
No ratings yet
Project Report in House
19 pages
dsv_final
No ratings yet
dsv_final
14 pages
Batch D17
No ratings yet
Batch D17
17 pages
Movie Recommender Systems
No ratings yet
Movie Recommender Systems
11 pages
Final Report Ai Application
No ratings yet
Final Report Ai Application
18 pages
Karan Mini Proj
No ratings yet
Karan Mini Proj
11 pages
Project Report MRS (1)
No ratings yet
Project Report MRS (1)
47 pages
BDA Report-Numbered
No ratings yet
BDA Report-Numbered
11 pages
Movie Recommdation Report
No ratings yet
Movie Recommdation Report
10 pages
INN AAT REPORT
No ratings yet
INN AAT REPORT
10 pages
Recommendation Engines
No ratings yet
Recommendation Engines
17 pages
Synopsis
No ratings yet
Synopsis
12 pages
Ali Docs
No ratings yet
Ali Docs
32 pages
Movie Recommendation Project Report
No ratings yet
Movie Recommendation Project Report
9 pages
PYTHON CBP - Removed
No ratings yet
PYTHON CBP - Removed
15 pages
Report Final-MovieLens
No ratings yet
Report Final-MovieLens
47 pages
Lecture9 Recommender Systems V0
No ratings yet
Lecture9 Recommender Systems V0
52 pages
Minor Presentation
No ratings yet
Minor Presentation
20 pages
Movie Rec
No ratings yet
Movie Rec
13 pages
Movie Recommendations
No ratings yet
Movie Recommendations
12 pages
Final Report Format SSP[1][1]
No ratings yet
Final Report Format SSP[1][1]
14 pages
BDA report final
No ratings yet
BDA report final
11 pages
Recommender System
No ratings yet
Recommender System
45 pages
DATA MINING AND MACHINE LEARNING. PREDICTIVE TECHNIQUES: REGRESSION, GENERALIZED LINEAR MODELS, SUPPORT VECTOR MACHINE AND NEURAL NETWORKS
From Everand
DATA MINING AND MACHINE LEARNING. PREDICTIVE TECHNIQUES: REGRESSION, GENERALIZED LINEAR MODELS, SUPPORT VECTOR MACHINE AND NEURAL NETWORKS
César Pérez López
No ratings yet
Is Harmonized Curriculum 2014 Revised MTU
No ratings yet
Is Harmonized Curriculum 2014 Revised MTU
229 pages
Control Software v7.1 Release Notes: Foxboro Evo Process Automation System
100% (1)
Control Software v7.1 Release Notes: Foxboro Evo Process Automation System
164 pages
Codigos Invertex II.
100% (3)
Codigos Invertex II.
96 pages
Salesforce Developer Interview Questions and Answers
No ratings yet
Salesforce Developer Interview Questions and Answers
8 pages
RC of HCL Computer
No ratings yet
RC of HCL Computer
46 pages
RPM Counter Using Micro Controller
100% (1)
RPM Counter Using Micro Controller
16 pages
Zuora
No ratings yet
Zuora
11 pages
Uninstalling DB2 UDB
No ratings yet
Uninstalling DB2 UDB
5 pages
Keywords
No ratings yet
Keywords
3 pages
What Changed Snapshot1 Registry HKCR
No ratings yet
What Changed Snapshot1 Registry HKCR
426 pages
C Dac Cet Asignments Solved by Lalit Naphade
No ratings yet
C Dac Cet Asignments Solved by Lalit Naphade
54 pages
Automation Testing With Python
100% (1)
Automation Testing With Python
13 pages
The FEBS Journal - 2022 - Dhillon - How To Write A Good Scientific Review Article
No ratings yet
The FEBS Journal - 2022 - Dhillon - How To Write A Good Scientific Review Article
11 pages
Bachelor of Computer Application BCA
No ratings yet
Bachelor of Computer Application BCA
149 pages
Mysql and Nosql Database Comparison For Iot Application: Sharvari Rautmare Dr. D. M. Bhalerao
No ratings yet
Mysql and Nosql Database Comparison For Iot Application: Sharvari Rautmare Dr. D. M. Bhalerao
4 pages
Sift Gpu
No ratings yet
Sift Gpu
5 pages
Module 1 Introduction To Operating Systems
No ratings yet
Module 1 Introduction To Operating Systems
3 pages
Notes For Manufacturing Instructors From Class To Workshop 2024
No ratings yet
Notes For Manufacturing Instructors From Class To Workshop 2024
322 pages
Skill Matrix: Multi Skill Criteria Level Description Criteria Symbol
No ratings yet
Skill Matrix: Multi Skill Criteria Level Description Criteria Symbol
5 pages
5 Pen PC Technology Seminar Report
62% (13)
5 Pen PC Technology Seminar Report
24 pages
Learning Episode 11 Updated
No ratings yet
Learning Episode 11 Updated
7 pages
Microsoft Excel Inside Out Office 2021 and Microsoft 365 1st Edition Bill Jelen - Own the complete ebook with all chapters in PDF format
100% (1)
Microsoft Excel Inside Out Office 2021 and Microsoft 365 1st Edition Bill Jelen - Own the complete ebook with all chapters in PDF format
67 pages
Migtion Guide
No ratings yet
Migtion Guide
70 pages
RahulBairagi InternshalaResume
No ratings yet
RahulBairagi InternshalaResume
2 pages
Markdown Guide
No ratings yet
Markdown Guide
11 pages
Design Quote
No ratings yet
Design Quote
2 pages
The Third Manifesto: All Logical Differences Are Big Differences
No ratings yet
The Third Manifesto: All Logical Differences Are Big Differences
11 pages
The 25-Year History of SOA
No ratings yet
The 25-Year History of SOA
8 pages
SIM7100 SIM7500 SIM7600 Series LBS Application Note V2.00
No ratings yet
SIM7100 SIM7500 SIM7600 Series LBS Application Note V2.00
9 pages
Accelerate Computing Vision and Image Processing Using VPI 1.1 by Rodolfo Lima
No ratings yet
Accelerate Computing Vision and Image Processing Using VPI 1.1 by Rodolfo Lima
23 pages

Assignment 5

Uploaded by

Assignment 5

Uploaded by

Zeerak Mustafa khan 2200911540131

PROJECT TITLE : Build a system that recommends movies to users

1. Install Required Libraries

pip install pandas numpy scikit-learn surprise

movie_id,title,genre 1,Toy Story (1995),Animation|Children|Comedy 2,Jumanji

user_id,movie_id,rating 1,1,5 1,2,4 2,1,4 2,3,3 3,2,5 3,4,2

First, we load and clean the data.

# Load movie and ratings data

PROJECT TITLE : Build a system that recommends movies to users

4. Collaborative Filtering with surprise

from surprise import SVD, Dataset, Reader

from surprise.model_selection import train_test_split

from surprise import accuracy

# Prepare the data for Surprise

reader = Reader(line_format='user item rating timestamp', sep=',')

data = Dataset.load_from_df(ratings[['user_id', 'movie_id', 'rating']], reader)

# Split the data into training and testing sets

trainset, testset = train_test_split(data, test_size=0.2)

# Build and train the SVD model

PROJECT TITLE : Build a system that recommends movies to users

# Evaluate the model

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.metrics.pairwise import cosine_similarity

# One-hot encode the genres

# Compute cosine similarity

PROJECT TITLE : Build a system that recommends movies to users

# Create a DataFrame for the cosine similarity

cosine_sim_df = pd.DataFrame(cosine_sim, index=movies['title'],

We now combine both filtering approaches to recommend movies to a user based on

def recommend_movies(user_id, ratings, cosine_sim_df, model):

# Get the movies the user has already watched

user_ratings = ratings[ratings['user_id'] == user_id]

for movie_id in rated_movies:

movie_title = movies[movies['movie_id'] == movie_id]['title'].values[0]

# Get movies similar to the ones rated highly

PROJECT TITLE : Build a system that recommends movies to users

# Recommend movies based on Collaborative Filtering as well

user_predictions = [model.predict(user_id, movie_id) for movie_id in range(1,

sorted_predictions = sorted(user_predictions, key=lambda x: x.est, reverse=True)

# Get top 5 movie recommendations

top_5_recommendations = [x.iid for x in sorted_predictions[:5]]

return list(set(recommended_movies)), top_5_recommendations

# Test the function for user_id 1

print("Content-Based Recommendations:", recommended_movies_content)

print("Collaborative Filtering Recommendations:", recommended_movies_collab)

Collaborative Filtering Recommendations: Based on what other similar users rated

PROJECT TITLE : Build a system that recommends movies to users

● Collaborative Filtering helps predict ratings based on past user-item

● Use hybrid models to combine both collaborative and content-based methods

You might also like