0% found this document useful (0 votes)

30 views10 pages

PRJ Car Price Prediction For Data Science

The document describes building several machine learning models to predict car prices using a dataset of Audi cars. It performs exploratory data analysis on the dataset, including feature engineering like encoding and scaling. Several regression models are trained and compared, including random forest, linear regression, extra trees, and CatBoost regressors. The top-performing CatBoost model is saved using pickle for future use in predicting car prices.

Uploaded by

shivaybhargava33

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views10 pages

PRJ Car Price Prediction For Data Science

Uploaded by

shivaybhargava33

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 10

CAR PRICE PREDICTION

pip install pandas-profiling

Data Set: audi.csv

Dependent variable: price

Import Library
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os

Check Current Directory

os.getcwd()

Change the directory

os.chdir ('C:\\Noble\\Training\\Acmegrade\\Data Science\\Projects\\PRJ Car
Price Prediction\\')
os.getcwd()
Read Data, display records
df=pd.read_csv("audi.csv")
display(df)

Automated Exploratory Data Analysis (EDA)

Pandas Profiling Report

import pandas_profiling as pf
display(pf.ProfileReport(df))

Manual EDA
Number of records
len(df)

Number of records- Shape

display (df.shape)

Checking the data types

display (df.dtypes )

Checking null values

display (df.isna().sum() )

Data set details – Info

df.info()

Data set details – Describe

df.describe ()

Create X
X = df.iloc[:,[0,1,3,4,5,6,7,8]].values
display (X)

Create Y
Y = df.iloc[:,[2]].values
display (Y)

Display Top 5 - X variable

display(pd.DataFrame(X).head(5))

Label Encoding
from sklearn.preprocessing import LabelEncoder
le1 = LabelEncoder()
X[:,0] = le1.fit_transform(X[:,0])
le2 = LabelEncoder()
X[:,-4] = le2.fit_transform(X[:,-4])
display (X)

One hot Encoding to column – transmission

from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
ct = ColumnTransformer(transformers = [('encoder',OneHotEncoder(),
[2])],remainder='passthrough')
X = ct.fit_transform(X)
display (pd.DataFrame(X))

Display – X
display (pd.DataFrame(X))

Features Scaling – Standardization

from sklearn.preprocessing import StandardScaler

sc = StandardScaler()
X = sc.fit_transform(X)
display (pd.DataFrame(X))
Train Test Split
from sklearn.model_selection import train_test_split
(X_train,X_test,Y_train,Y_test) =
train_test_split(X,Y,test_size=0.2,random_state=0)

Create Random Forest Regressor

from sklearn.ensemble import RandomForestRegressor

regression = RandomForestRegressor(random_state=0)
regression.fit(X_train,Y_train)

Prediction with Test Data

y_pred = regression.predict(X_test)
display (y_pred)

Display actual and Predicted Values

print(np.concatenate((y_pred.reshape(len(y_pred),1),Y_test.reshape(len(Y_tes
t),1)),1))

Display – Accuracy and Mean Absolute Error

from sklearn.metrics import r2_score,mean_absolute_error

print ('R2 Score ', r2_score(Y_test, y_pred))
print ('Mean Absolute Error', mean_absolute_error(Y_test,y_pred))

Create a Linear Regression Model

from sklearn.linear_model import LinearRegression

reg = LinearRegression()
reg.fit(X_train,Y_train)

Prediction with Test Data

y_pred = reg.predict(X_test)
display (y_pred)

Display actual and Predicted Values

print(np.concatenate((y_pred.reshape(len(y_pred),1),Y_test.reshape(len(Y_tes
t),1)),1))

Display – Accuracy and Mean Absolute Error

from sklearn.metrics import r2_score,mean_absolute_error

print ('R2 Score ', r2_score(Y_test, y_pred))
print ('Mean Absolute Error', mean_absolute_error(Y_test,y_pred))

Prediction for complete data set

y_pred = reg.predict(X)
display (y_pred)
Display the Actual and predicted data

result = pd.concat([df,pd.DataFrame(y_pred)],axis=1)
display( result)

Create Model Extra Tree Regressor

from sklearn.ensemble import ExtraTreesRegressor
ET_Model=ExtraTreesRegressor(n_estimators = 120)
ET_Model.fit(X_train,Y_train)
y_predict=ET_Model.predict(X_test)
from sklearn.metrics import r2_score,mean_absolute_error
print ('R2 Score ', r2_score(Y_test, y_predict))
print ('Mean Absolute Error', mean_absolute_error(Y_test,y_predict))

Display the Result

y_pred = reg.predict(X)
display (y_pred)
result = pd.concat([df,pd.DataFrame(y_pred)],axis=1)
display( result)

RandomizedSearchCV
# Hyperparameter Tuning and RandomizedSearchCV - Model used –
RandomForestRegressor

from sklearn.model_selection import RandomizedSearchCV

n_estimators = [int(x) for x in np.linspace(start = 80, stop = 1500, num = 10)]
max_features = ['auto', 'sqrt']
max_depth = [int(x) for x in np.linspace(6, 45, num = 5)]
min_samples_split = [2, 5, 10, 15, 100]
min_samples_leaf = [1, 2, 5, 10]

# create random grid

rand_grid={'n_estimators': n_estimators,
'max_features': max_features,
'max_depth': max_depth,
'min_samples_split': min_samples_split,
'min_samples_leaf': min_samples_leaf}

rf=RandomForestRegressor()

rCV=RandomizedSearchCV(estimator=rf,param_distributions=rand_grid,scorin
g='neg_mean_squared_error',n_iter=3,cv=3,random_state=42, n_jobs = 1)

Fit Model
import warnings
warnings.filterwarnings('ignore')

rCV.fit(X_train,Y_train)

Prediction
rf_pred=rCV.predict(X_test)
display (rf_pred)

Mean_absolute_error and mean_squared_error

from sklearn.metrics import mean_absolute_error,mean_squared_error

print('MAE',mean_absolute_error(Y_test,rf_pred))
print('MSE',mean_squared_error(Y_test,rf_pred))

Display Accuracy
display (r2_score(Y_test,rf_pred))

Install Cat boost

pip install catboost

Model CatBoostRegressor
from catboost import CatBoostRegressor
cat=CatBoostRegressor()
cat.fit(X_train,Y_train)

Cat Boost Prediction

cat_pred=cat.predict(X_test)
display (cat_pred)

Cat Boost Accuracy

display (r2_score(Y_test,cat_pred))

Create Pickle File

#Use pickle to save our model so that we can use it later
import pickle
# Saving model to disk
pickle.dump(cat, open('model.pkl','wb'))

Load Pickle File and do Prediction

model=pickle.load(open('model.pkl','rb'))
model.predict (X_train)

Data Mining
No ratings yet
Data Mining
10 pages
API 6d 24ed. & 25ed. Comparision
100% (5)
API 6d 24ed. & 25ed. Comparision
23 pages
Problem: # Partition
No ratings yet
Problem: # Partition
5 pages
Ipc - Jedec J-STD-020C
100% (1)
Ipc - Jedec J-STD-020C
14 pages
House Price Prediction Using Machine Learning in Python
No ratings yet
House Price Prediction Using Machine Learning in Python
13 pages
Problem Statement Is To Predict Price Column Based On Data With 24 Columns With Over 200 Data Entries Using Linear Regression
No ratings yet
Problem Statement Is To Predict Price Column Based On Data With 24 Columns With Over 200 Data Entries Using Linear Regression
5 pages
Supple Maximizing Performance in Cs CuBiCl
No ratings yet
Supple Maximizing Performance in Cs CuBiCl
5 pages
Car Price Prediction
No ratings yet
Car Price Prediction
18 pages
Linear Regression
100% (1)
Linear Regression
16 pages
Class Participation
No ratings yet
Class Participation
9 pages
UCD Linear Reg2
No ratings yet
UCD Linear Reg2
3 pages
Car Mock - ML Ans
No ratings yet
Car Mock - ML Ans
6 pages
Data Analysis Report
No ratings yet
Data Analysis Report
74 pages
ML External Xerox
No ratings yet
ML External Xerox
1 page
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
No ratings yet
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
7 pages
Machine Learning Project Car Price Prediction Algorithm
No ratings yet
Machine Learning Project Car Price Prediction Algorithm
4 pages
ML Internal Answers
No ratings yet
ML Internal Answers
9 pages
SVM (Support Vector Machine) For Classification - by Aditya Kumar - Towards Data Science
100% (1)
SVM (Support Vector Machine) For Classification - by Aditya Kumar - Towards Data Science
28 pages
ML5&6&7&8&9&10
No ratings yet
ML5&6&7&8&9&10
35 pages
Exp - 6-Model Development - SDK - Ok
No ratings yet
Exp - 6-Model Development - SDK - Ok
11 pages
Content Beyond Syllabus and Case Based Program
No ratings yet
Content Beyond Syllabus and Case Based Program
8 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Capstone Project
No ratings yet
Capstone Project
24 pages
INSY446 - 02 - Linear Model Part 1
No ratings yet
INSY446 - 02 - Linear Model Part 1
27 pages
Notebook034d0e6953 Ipynb
No ratings yet
Notebook034d0e6953 Ipynb
8 pages
Lab 1. Boston House
No ratings yet
Lab 1. Boston House
7 pages
1
No ratings yet
1
13 pages
Untitled 57
No ratings yet
Untitled 57
4 pages
21BEI052 2EI503 ML SpecialAssignmentReport
No ratings yet
21BEI052 2EI503 ML SpecialAssignmentReport
12 pages
Iml 51
No ratings yet
Iml 51
10 pages
Kaggle Course Notes
No ratings yet
Kaggle Course Notes
87 pages
Machine Learning Presentaion
No ratings yet
Machine Learning Presentaion
15 pages
Car Price Prediction Using Machine Learning
33% (3)
Car Price Prediction Using Machine Learning
15 pages
ML Lab File Final
No ratings yet
ML Lab File Final
17 pages
Data Wrangling Python.
No ratings yet
Data Wrangling Python.
8 pages
Netflix Stock Price Prediction
No ratings yet
Netflix Stock Price Prediction
20 pages
Car Price Detection Based On The Travelling Distance
No ratings yet
Car Price Detection Based On The Travelling Distance
15 pages
AI Assignment-6
No ratings yet
AI Assignment-6
7 pages
Task 3 Car Price Prediction Using Machine Learning
No ratings yet
Task 3 Car Price Prediction Using Machine Learning
30 pages
Car Resales Price Prediction
No ratings yet
Car Resales Price Prediction
5 pages
Report
No ratings yet
Report
4 pages
S 10
No ratings yet
S 10
11 pages
AI
No ratings yet
AI
16 pages
SimpleLinear Regression
No ratings yet
SimpleLinear Regression
2 pages
DT As Regressor-Follow
No ratings yet
DT As Regressor-Follow
4 pages
Predictive Modeling Machine Learning
No ratings yet
Predictive Modeling Machine Learning
16 pages
Tesla Stock Price Prediction Analysis
No ratings yet
Tesla Stock Price Prediction Analysis
4 pages
ML Manual
No ratings yet
ML Manual
18 pages
MACHINE LEARNING Manual
No ratings yet
MACHINE LEARNING Manual
36 pages
Automobile Linear Regression
No ratings yet
Automobile Linear Regression
1 page
DSPY Lab Project (Formatted) 2
No ratings yet
DSPY Lab Project (Formatted) 2
14 pages
Train
No ratings yet
Train
17 pages
ML Internal 2
No ratings yet
ML Internal 2
7 pages
Advanced ML PDF
No ratings yet
Advanced ML PDF
25 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
Udacity Machine Learning Analysis Supervised Learning
100% (1)
Udacity Machine Learning Analysis Supervised Learning
504 pages
5) Randomforest - Ipynb - Colaboratory
No ratings yet
5) Randomforest - Ipynb - Colaboratory
12 pages
AML Code For m2
No ratings yet
AML Code For m2
7 pages
Xətti Reqressiya Modelinin Qurulması
No ratings yet
Xətti Reqressiya Modelinin Qurulması
4 pages
Aiml Practicals
No ratings yet
Aiml Practicals
22 pages
Car Price Prediction Project
No ratings yet
Car Price Prediction Project
34 pages
PRJ Movie Recommendation Data Science..
No ratings yet
PRJ Movie Recommendation Data Science..
7 pages
SL Classification For Data Science..
No ratings yet
SL Classification For Data Science..
4 pages
Matplotlib For Data Science..
No ratings yet
Matplotlib For Data Science..
11 pages
Machine Learning Project Presentation
No ratings yet
Machine Learning Project Presentation
14 pages
AZ E-Lite
100% (1)
AZ E-Lite
85 pages
Moba Compaction Assistance
No ratings yet
Moba Compaction Assistance
12 pages
Nhi Huynh-Literature Planning
No ratings yet
Nhi Huynh-Literature Planning
5 pages
Weekly Home Learning Plan g10 q4 w7
No ratings yet
Weekly Home Learning Plan g10 q4 w7
3 pages
Automotive and Small Engine Tools Assessment For CO
No ratings yet
Automotive and Small Engine Tools Assessment For CO
2 pages
DLL - English 4 - Q1 - W5
No ratings yet
DLL - English 4 - Q1 - W5
5 pages
Calculation Sheet For External Surface Areas (Including Glass)
No ratings yet
Calculation Sheet For External Surface Areas (Including Glass)
20 pages
K-73-02 Addressable Linear Heath Detector 10-7-14
No ratings yet
K-73-02 Addressable Linear Heath Detector 10-7-14
6 pages
Profile Skills: Contacto
No ratings yet
Profile Skills: Contacto
1 page
Controller
No ratings yet
Controller
2 pages
Drug Calculation Tutorial
100% (2)
Drug Calculation Tutorial
13 pages
04 Samss 035
No ratings yet
04 Samss 035
16 pages
Formal and Informal Communication
No ratings yet
Formal and Informal Communication
10 pages
Schools Division of Parañaque City Technology and Livelihood Education Electrical Installation & Maintenance 9 Quarter 4 Week 7 & 8 Wiring Diagrams
No ratings yet
Schools Division of Parañaque City Technology and Livelihood Education Electrical Installation & Maintenance 9 Quarter 4 Week 7 & 8 Wiring Diagrams
4 pages
Column Interaction Diagram
No ratings yet
Column Interaction Diagram
4 pages
Thesis Approval Muhs 2016
100% (1)
Thesis Approval Muhs 2016
7 pages
Reviewer in Entrepreneurship
No ratings yet
Reviewer in Entrepreneurship
2 pages
Unit 4
100% (1)
Unit 4
7 pages
LYONS, Martin. New Directions in The History of Written Culture
No ratings yet
LYONS, Martin. New Directions in The History of Written Culture
9 pages
Monthly Bill
No ratings yet
Monthly Bill
1 page
Chapter Xi Correlation Coefficient
No ratings yet
Chapter Xi Correlation Coefficient
7 pages
Data Warehouse References
No ratings yet
Data Warehouse References
40 pages
What Is New in Netbackup 6.5
No ratings yet
What Is New in Netbackup 6.5
42 pages
QI Business Presentation 2
No ratings yet
QI Business Presentation 2
35 pages
Cylinder Head Valves
No ratings yet
Cylinder Head Valves
6 pages
Final Theory 2022 en
No ratings yet
Final Theory 2022 en
31 pages
Ni 2671
No ratings yet
Ni 2671
20 pages
Math Investigation
No ratings yet
Math Investigation
20 pages