0% found this document useful (0 votes)

10 views9 pages

Linear Regression

The document outlines a data preprocessing and analysis workflow for a CO2 emissions dataset, including data loading, cleaning, and feature encoding. It employs linear regression to predict CO2 emissions based on various vehicle attributes, evaluating model performance with metrics such as R-squared and Mean Absolute Error. Visualizations, including correlation heatmaps and scatter plots, are also utilized to illustrate relationships and model predictions.

Uploaded by

hmussawar477

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views9 pages

Linear Regression

Uploaded by

hmussawar477

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 9

Data Preprocessing

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn import metrics
from sklearn.metrics import mean_absolute_error, mean_squared_error,
r2_score

df = pd.read_csv('co2.csv')
df.head()

Make Model Vehicle Class Engine Size(L) Cylinders

Transmission \
0 ACURA ILX COMPACT 2.0 4
AS5
1 ACURA ILX COMPACT 2.4 4
M6
2 ACURA ILX HYBRID COMPACT 1.5 4
AV7
3 ACURA MDX 4WD SUV - SMALL 3.5 6
AS6
4 ACURA RDX AWD SUV - SMALL 3.5 6
AS6

Fuel Type Fuel Consumption City (L/100 km) \

0 Z 9.9
1 Z 11.2
2 Z 6.0
3 Z 12.7
4 Z 12.1

Fuel Consumption Hwy (L/100 km) Fuel Consumption Comb (L/100

km) \
0 6.7 8.5

1 7.7 9.6

2 5.8 5.9

3 9.1 11.1

4 8.7 10.6

Fuel Consumption Comb (mpg) CO2 Emissions(g/km)

0 33 196
1 29 221
2 48 136
3 25 255
4 27 244

df.shape
df.columns

Index(['Make', 'Model', 'Vehicle Class', 'Engine Size(L)',

'Cylinders',
'Transmission', 'Fuel Type', 'Fuel Consumption City (L/100
km)',
'Fuel Consumption Hwy (L/100 km)', 'Fuel Consumption Comb
(L/100 km)',
'Fuel Consumption Comb (mpg)', 'CO2 Emissions(g/km)'],
dtype='object')

df = df.drop(['Make', 'Model','Vehicle Class','Transmission'], axis=1)

df.shape

(7385, 8)

df["Fuel Type"].value_counts()

Fuel Type
X 3637
Z 3202
E 370
D 175
N 1
Name: count, dtype: int64

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()
df["Fuel Type"] = le.fit_transform(df["Fuel Type"])
df["Fuel Type"].value_counts()

Fuel Type
3 3637
4 3202
1 370
0 175
2 1
Name: count, dtype: int64

Correlation
correlation = df.corr()
correlation
Engine Size(L) Cylinders Fuel Type
\
Engine Size(L) 1.000000 0.927653 0.058296

Cylinders 0.927653 1.000000 0.125175

Fuel Type 0.058296 0.125175 1.000000

Fuel Consumption City (L/100 km) 0.831379 0.800702 -0.075605

Fuel Consumption Hwy (L/100 km) 0.761526 0.715252 -0.129812

Fuel Consumption Comb (L/100 km) 0.817060 0.780534 -0.095539

Fuel Consumption Comb (mpg) -0.757854 -0.719321 -0.016880

CO2 Emissions(g/km) 0.851145 0.832644 0.100306

Fuel Consumption City (L/100 km) \

Engine Size(L) 0.831379
Cylinders 0.800702
Fuel Type -0.075605
Fuel Consumption City (L/100 km) 1.000000
Fuel Consumption Hwy (L/100 km) 0.948180
Fuel Consumption Comb (L/100 km) 0.993810
Fuel Consumption Comb (mpg) -0.927059
CO2 Emissions(g/km) 0.919592

Fuel Consumption Hwy (L/100 km) \

Engine Size(L) 0.761526
Cylinders 0.715252
Fuel Type -0.129812
Fuel Consumption City (L/100 km) 0.948180
Fuel Consumption Hwy (L/100 km) 1.000000
Fuel Consumption Comb (L/100 km) 0.977299
Fuel Consumption Comb (mpg) -0.890638
CO2 Emissions(g/km) 0.883536

Fuel Consumption Comb (L/100 km) \

Engine Size(L) 0.817060
Cylinders 0.780534
Fuel Type -0.095539
Fuel Consumption City (L/100 km) 0.993810
Fuel Consumption Hwy (L/100 km) 0.977299
Fuel Consumption Comb (L/100 km) 1.000000
Fuel Consumption Comb (mpg) -0.925576
CO2 Emissions(g/km) 0.918052

Fuel Consumption Comb (mpg) \

Engine Size(L) -0.757854
Cylinders -0.719321
Fuel Type -0.016880
Fuel Consumption City (L/100 km) -0.927059
Fuel Consumption Hwy (L/100 km) -0.890638
Fuel Consumption Comb (L/100 km) -0.925576
Fuel Consumption Comb (mpg) 1.000000
CO2 Emissions(g/km) -0.907426

CO2 Emissions(g/km)
Engine Size(L) 0.851145
Cylinders 0.832644
Fuel Type 0.100306
Fuel Consumption City (L/100 km) 0.919592
Fuel Consumption Hwy (L/100 km) 0.883536
Fuel Consumption Comb (L/100 km) 0.918052
Fuel Consumption Comb (mpg) -0.907426
CO2 Emissions(g/km) 1.000000

# constructing a heatmap to nderstand the correlation

plt.figure(figsize=(8,8))
sns.heatmap(correlation, cbar=True, square=True, fmt='.1f',
annot=True, annot_kws={'size':8}, cmap='Blues')

<Axes: >
DATA SPLITING
X = df.drop(['CO2 Emissions(g/km)'], axis=1)
Y = df['CO2 Emissions(g/km)']

X.head()

Engine Size(L) Cylinders Fuel Type Fuel Consumption City (L/100

km) \
0 2.0 4 4
9.9
1 2.4 4 4
11.2
2 1.5 4 4
6.0
3 3.5 6 4
12.7
4 3.5 6 4
12.1

Fuel Consumption Hwy (L/100 km) Fuel Consumption Comb (L/100

km) \
0 6.7 8.5

1 7.7 9.6

2 5.8 5.9

3 9.1 11.1

4 8.7 10.6

Fuel Consumption Comb (mpg)

0 33
1 29
2 48
3 25
4 27

from sklearn.model_selection import train_test_split

X_TRAIN , X_TEST , Y_TRAIN, Y_TEST = train_test_split(X,Y, test_size =
0.25, random_state=25)
print("Size of Train X = " , len(X_TRAIN))
print("Size of Train Y = " , len(Y_TRAIN))
print("Size of Test X = " , len(X_TEST))
print("Size of Test Y = " , len(Y_TEST))

Size of Train X = 5538

Size of Train Y = 5538
Size of Test X = 1847
Size of Test Y = 1847

LINEAR REGRESSION
from sklearn.linear_model import LinearRegression
model= LinearRegression()
model.fit(X_TRAIN, Y_TRAIN)

LinearRegression()
Evaluation
Prediction on Training Data
# accuracy for prediction on training data
training_data_prediction = model.predict(X_TRAIN)
print(training_data_prediction)

[277.53821201 312.33640233 147.36539728 ... 298.22931218 239.77783577

201.51288521]

# R squared error
score_1 = metrics.r2_score(Y_TRAIN, training_data_prediction)

# Mean Absolute Error

score_2 = metrics.mean_absolute_error(Y_TRAIN,
training_data_prediction)

print("R squared : ", score_1)

print('Mean Absolute Error : ', score_2)

R squared : 0.9124830358066793
Mean Absolute Error : 11.128722988272692

plt.scatter(Y_TRAIN, training_data_prediction)
plt.xlabel("Actual Prices")
plt.ylabel("Predicted Prices")
plt.title("Actual Price vs Preicted Price")
plt.show()
Prediction on Test Data
y_pred = model.predict(X_TEST)
y_pred
print(y_pred)

[232.4062013 280.46048354 246.9986957 ... 232.6947596 188.04758241

175.35879895]

# R squared Score
score_1 = metrics.r2_score(Y_TEST, y_pred)

# Mean Absolute Error

score_2 = metrics.mean_absolute_error(Y_TEST, y_pred)

print("R squared Score : ", score_1)

print('Mean Absolute Error : ', score_2)

R squared Score : 0.915458485471068

Mean Absolute Error : 10.936146875715842

plt.scatter(Y_TEST, y_pred)
plt.xlabel("Actual")
plt.ylabel("Predicted")
plt.title("Actual vs Preicted")
plt.show()

Pneumatic Braking System
0% (1)
Pneumatic Braking System
8 pages
Fuels
86% (7)
Fuels
28 pages
Focus 1.0-Litre EcoBoost TechSpecs EU
No ratings yet
Focus 1.0-Litre EcoBoost TechSpecs EU
5 pages
CEE 4674 Airport Planning and Design
No ratings yet
CEE 4674 Airport Planning and Design
37 pages
Echnical Pecifications: Ford C-Max & Grand C-Max Specifications
100% (2)
Echnical Pecifications: Ford C-Max & Grand C-Max Specifications
19 pages
5 Pillars of Traffic MNGT
No ratings yet
5 Pillars of Traffic MNGT
147 pages
Persuasive Speech Against Agressive Driving
100% (13)
Persuasive Speech Against Agressive Driving
3 pages
Prado
No ratings yet
Prado
18 pages
Who - Music Video Call Sheet
No ratings yet
Who - Music Video Call Sheet
4 pages
Fiat Stilo 1.9 JTD 115 Active Manual 3 Door Specs
100% (1)
Fiat Stilo 1.9 JTD 115 Active Manual 3 Door Specs
3 pages
How To Calculate Fuel Consumption
No ratings yet
How To Calculate Fuel Consumption
8 pages
Bike Carrier Compatibility Chart 2018 en
No ratings yet
Bike Carrier Compatibility Chart 2018 en
10 pages
MINI Countryman Techncial Data - US (R60)
100% (2)
MINI Countryman Techncial Data - US (R60)
4 pages
SORT Sunumu Yeni 2023 - Ekim
No ratings yet
SORT Sunumu Yeni 2023 - Ekim
44 pages
Consumo Combustible: SCANIA (BJM-749) SCANIA (BJM-812)
No ratings yet
Consumo Combustible: SCANIA (BJM-749) SCANIA (BJM-812)
5 pages
Saudi Smart Cities Brochure - V3
No ratings yet
Saudi Smart Cities Brochure - V3
17 pages
Volvo Parts
No ratings yet
Volvo Parts
2 pages
Surface Vehicle Standard: Fuel Economy Measurement Road Test Procedure
No ratings yet
Surface Vehicle Standard: Fuel Economy Measurement Road Test Procedure
22 pages
Lagos Apapa Port Complex
No ratings yet
Lagos Apapa Port Complex
10 pages
Engine Data Sheet K2000E
No ratings yet
Engine Data Sheet K2000E
3 pages
ABS Uber
No ratings yet
ABS Uber
14 pages
Bertling Kamsarmax Class
No ratings yet
Bertling Kamsarmax Class
2 pages
Guide: On The Fuel Economy, CO2-Emissions and Power Consumption
No ratings yet
Guide: On The Fuel Economy, CO2-Emissions and Power Consumption
74 pages
Van Fuel Data
No ratings yet
Van Fuel Data
19 pages
Echnical Pecifications: Ford Focus Specifications
No ratings yet
Echnical Pecifications: Ford Focus Specifications
21 pages
UK CAA Examiners Doc24 V4oct16
No ratings yet
UK CAA Examiners Doc24 V4oct16
81 pages
DOBLOCARGO 2021 24p CT ING Web
No ratings yet
DOBLOCARGO 2021 24p CT ING Web
13 pages
Dangerous Goods Inspector: Manual
No ratings yet
Dangerous Goods Inspector: Manual
47 pages
Technical Data: Program For Germany
No ratings yet
Technical Data: Program For Germany
2 pages
Reefer Ships Versus Containers: A Lot of Demand
No ratings yet
Reefer Ships Versus Containers: A Lot of Demand
3 pages
FordMondeo TechnicalSpecifications EU
No ratings yet
FordMondeo TechnicalSpecifications EU
13 pages
Ddec Reports - Trip Activity: PDF Created With Fineprint Pdffactory Pro Trial Version
No ratings yet
Ddec Reports - Trip Activity: PDF Created With Fineprint Pdffactory Pro Trial Version
31 pages
FordSMAX TechnicalSpecifications EU
No ratings yet
FordSMAX TechnicalSpecifications EU
8 pages
10V1600G70S - Motor TLY450
No ratings yet
10V1600G70S - Motor TLY450
23 pages
Range Rover Sport WLTP Insert 1L4942150000WXXEN01P Tcm281 791195
No ratings yet
Range Rover Sport WLTP Insert 1L4942150000WXXEN01P Tcm281 791195
8 pages
Se Python - Merged
No ratings yet
Se Python - Merged
77 pages
B MAX Specifications EU
No ratings yet
B MAX Specifications EU
6 pages
Kuga Euro TechSpec
No ratings yet
Kuga Euro TechSpec
10 pages
Hilux Appendix
No ratings yet
Hilux Appendix
24 pages
Major Technical Specifications: Carburetor Type or Injection Pump Type (Diesel)
No ratings yet
Major Technical Specifications: Carburetor Type or Injection Pump Type (Diesel)
18 pages
Twingo 3 & Clio 4
No ratings yet
Twingo 3 & Clio 4
10 pages
Echnical Pecifications: Ford Focus Specifications
No ratings yet
Echnical Pecifications: Ford Focus Specifications
14 pages
Transportation Law Course Outline 3
No ratings yet
Transportation Law Course Outline 3
16 pages
Fuels
No ratings yet
Fuels
28 pages
2534-WAMP AD 2.1 To AD 2.24 AIRAC AIP AMDT 125 26 JAN 23
No ratings yet
2534-WAMP AD 2.1 To AD 2.24 AIRAC AIP AMDT 125 26 JAN 23
7 pages
History of Technology - Technology in The Ancient World - Britannica
No ratings yet
History of Technology - Technology in The Ancient World - Britannica
18 pages
Lab Exploratory-Data-Analysis
No ratings yet
Lab Exploratory-Data-Analysis
25 pages
Car Price
No ratings yet
Car Price
17 pages
Vacancy Notice: (No.48/2019) Recruitment For The Post of Junior Engineer/Civil
No ratings yet
Vacancy Notice: (No.48/2019) Recruitment For The Post of Junior Engineer/Civil
5 pages
Ice-Tap Assignment: Submitted by
100% (1)
Ice-Tap Assignment: Submitted by
16 pages
Spain Aerodrome Directory
No ratings yet
Spain Aerodrome Directory
28 pages
Citroen C5 2.0 HDi 110 Specs, Performance, Comparisons
No ratings yet
Citroen C5 2.0 HDi 110 Specs, Performance, Comparisons
7 pages
Citroen C5 2.0 HPi Specs, Performance, Comparisons
No ratings yet
Citroen C5 2.0 HPi Specs, Performance, Comparisons
6 pages
Range Rover Sport TD Insert 1L4612400000XXEN02P
No ratings yet
Range Rover Sport TD Insert 1L4612400000XXEN02P
13 pages
Vehicle Fuel Efficiency, Improving Fuel Economy and
No ratings yet
Vehicle Fuel Efficiency, Improving Fuel Economy and
18 pages
CONTROL DE CONBUSTIBLE v1
No ratings yet
CONTROL DE CONBUSTIBLE v1
13 pages
M Hi Lux Tech Spec
No ratings yet
M Hi Lux Tech Spec
3 pages
2000 Picup
No ratings yet
2000 Picup
3 pages
Katherine - Alvarez EX Assignment 5 2
No ratings yet
Katherine - Alvarez EX Assignment 5 2
9 pages
Focus1.0-Litre EcoBoost TechSpecs EU
No ratings yet
Focus1.0-Litre EcoBoost TechSpecs EU
5 pages
1 Cep Ice
No ratings yet
1 Cep Ice
6 pages
M Hi Lux Tech Spec
No ratings yet
M Hi Lux Tech Spec
3 pages
2000 Picup
No ratings yet
2000 Picup
3 pages
DGR Sep
No ratings yet
DGR Sep
6 pages
Engine & Performance: Configuration Combustion
No ratings yet
Engine & Performance: Configuration Combustion
2 pages
Untitled 21
No ratings yet
Untitled 21
6 pages
Porsche Cayenne S - Porsche International
No ratings yet
Porsche Cayenne S - Porsche International
14 pages
Range Rover Evoque WLElectricTP Insert 1L5512020000WGBEN01P - tcm295 775257
No ratings yet
Range Rover Evoque WLElectricTP Insert 1L5512020000WGBEN01P - tcm295 775257
4 pages
Descriptive Analysis
No ratings yet
Descriptive Analysis
4 pages
Untitled - Ipynb - (5) - JupyterLab
No ratings yet
Untitled - Ipynb - (5) - JupyterLab
4 pages
Wick 100G
No ratings yet
Wick 100G
2 pages
Commercial Vehicle Insurance Schedule: E.G. To Engine, Body, Wheels, Suspension
No ratings yet
Commercial Vehicle Insurance Schedule: E.G. To Engine, Body, Wheels, Suspension
3 pages
Bill 0152
No ratings yet
Bill 0152
2 pages
45428-Rachel Salangsang-1: OD-sd83vsj0md
No ratings yet
45428-Rachel Salangsang-1: OD-sd83vsj0md
2 pages
DS 5 - E1AB01NPP0 - 23 - 13 - 09 - 2021 - Organisation Bulletin - Oil Adaptive Maintenance (OAM) Operation and Features
No ratings yet
DS 5 - E1AB01NPP0 - 23 - 13 - 09 - 2021 - Organisation Bulletin - Oil Adaptive Maintenance (OAM) Operation and Features
3 pages
1230ES Spec Sheet
No ratings yet
1230ES Spec Sheet
2 pages
Compare Opel Astra K 1.4 Turbo 150HP 2015 Vs Opel Astra K 1.4 Turbo 125HP 2015
No ratings yet
Compare Opel Astra K 1.4 Turbo 150HP 2015 Vs Opel Astra K 1.4 Turbo 125HP 2015
1 page
Manual de Usuario Mitsubishi L200 (2015) (418 Páginas)
No ratings yet
Manual de Usuario Mitsubishi L200 (2015) (418 Páginas)
1 page
Toyota 5FG33 45 5FD33 45 5FGE35 5FDE35 Forklift Service Repair Manual PDF - p048
No ratings yet
Toyota 5FG33 45 5FD33 45 5FGE35 5FDE35 Forklift Service Repair Manual PDF - p048
1 page
Bookme - E-Ticket
No ratings yet
Bookme - E-Ticket
2 pages
JD-Roads-PGE and Intern
No ratings yet
JD-Roads-PGE and Intern
1 page
2011 Explorer Specs
No ratings yet
2011 Explorer Specs
3 pages
Capacity Submission Warrant HL CSW
No ratings yet
Capacity Submission Warrant HL CSW
1 page
E Brochure Urbancruiser Hyryder Spec
No ratings yet
E Brochure Urbancruiser Hyryder Spec
1 page
Comparacion
No ratings yet
Comparacion
2 pages
Preston Stiglets - Evidence of Learning - 1
No ratings yet
Preston Stiglets - Evidence of Learning - 1
3 pages
The Efficient Driver’s Handbook: Your guide to fuel efficient driving techniques and car choice
From Everand
The Efficient Driver’s Handbook: Your guide to fuel efficient driving techniques and car choice
Dave Moss
No ratings yet
World Merit Factor Analysis for Hydrogen Fueled Transportation
From Everand
World Merit Factor Analysis for Hydrogen Fueled Transportation
Dr. Ayfer Veziroglu
No ratings yet
Rolls-Royce Silver Shadow & Bentley T-Series: The Essential Buyer’s Guide
From Everand
Rolls-Royce Silver Shadow & Bentley T-Series: The Essential Buyer’s Guide
Malcolm Bobbitt
No ratings yet
NIMBUS Maintenance: 2. English Edition 2018
From Everand
NIMBUS Maintenance: 2. English Edition 2018
Knud Jørgensen
No ratings yet

Linear Regression

Uploaded by

Linear Regression

Uploaded by

Data Preprocessing

Make Model Vehicle Class Engine Size(L) Cylinders

Fuel Type Fuel Consumption City (L/100 km) \

Fuel Consumption Hwy (L/100 km) Fuel Consumption Comb (L/100

Fuel Consumption Comb (mpg) CO2 Emissions(g/km)

Index(['Make', 'Model', 'Vehicle Class', 'Engine Size(L)',

df = df.drop(['Make', 'Model','Vehicle Class','Transmission'], axis=1)

from sklearn.preprocessing import LabelEncoder

Cylinders 0.927653 1.000000 0.125175

Fuel Type 0.058296 0.125175 1.000000

Fuel Consumption City (L/100 km) 0.831379 0.800702 -0.075605

Fuel Consumption Hwy (L/100 km) 0.761526 0.715252 -0.129812

Fuel Consumption Comb (L/100 km) 0.817060 0.780534 -0.095539

Fuel Consumption Comb (mpg) -0.757854 -0.719321 -0.016880

CO2 Emissions(g/km) 0.851145 0.832644 0.100306

Fuel Consumption City (L/100 km) \

Fuel Consumption Hwy (L/100 km) \

Fuel Consumption Comb (L/100 km) \

Fuel Consumption Comb (mpg) \

# constructing a heatmap to nderstand the correlation

Engine Size(L) Cylinders Fuel Type Fuel Consumption City (L/100

Fuel Consumption Hwy (L/100 km) Fuel Consumption Comb (L/100

Fuel Consumption Comb (mpg)

from sklearn.model_selection import train_test_split

Size of Train X = 5538

[277.53821201 312.33640233 147.36539728 ... 298.22931218 239.77783577

# Mean Absolute Error

print("R squared : ", score_1)

[232.4062013 280.46048354 246.9986957 ... 232.6947596 188.04758241

# Mean Absolute Error

print("R squared Score : ", score_1)

R squared Score : 0.915458485471068

You might also like