0% found this document useful (0 votes)

20 views4 pages

Dsbda 4

The document shows code for loading and exploring a Boston housing dataset using pandas and scikit-learn. It splits the data into training and test sets, fits a linear regression model to predict housing prices, and calculates metrics like mean squared error.

Uploaded by

Arbaz Shaikh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views4 pages

Dsbda 4

Uploaded by

Arbaz Shaikh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

3/22/24, 6:42 PM COTB12

In [1]: import pandas as pd

import numpy as np
import matplotlib.pyplot as plt

In [19]: x=np.array([95,85,80,70,60])
y=np.array([85,95,70,65,70])

In [20]: model=np.polyfit(x,y,1)

In [21]: model

array([ 0.64383562, 26.78082192])

Out[21]:

In [22]: predict = np.poly1d(model)

predict(65)

68.63013698630137
Out[22]:

In [23]: y_pred=predict(x)
y_pred

array([87.94520548, 81.50684932, 78.28767123, 71.84931507, 65.4109589 ])

Out[23]:

In [24]: from sklearn.metrics import r2_score

r2_score(y, y_pred)

0.4803218090889326
Out[24]:

In [25]: y_line = model[1] + model[0]* x

plt.plot(x, y_line, c = 'r')
plt.scatter(x, y_pred)
plt.scatter(x,y,c='r')

<matplotlib.collections.PathCollection at 0x7fb3fed92f50>
Out[25]:

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 1/4

3/22/24, 6:42 PM COTB12

In [2]: data=pd.read_csv("/home/student/Desktop/Boston.csv")

In [3]: data

Out[3]: Unnamed:
crim zn indus chas nox rm age dis rad tax ptratio black
0

0 1 0.00632 18.0 2.31 0 0.538 6.575 65.2 4.0900 1 296 15.3 396.90

1 2 0.02731 0.0 7.07 0 0.469 6.421 78.9 4.9671 2 242 17.8 396.90

2 3 0.02729 0.0 7.07 0 0.469 7.185 61.1 4.9671 2 242 17.8 392.83

3 4 0.03237 0.0 2.18 0 0.458 6.998 45.8 6.0622 3 222 18.7 394.63

4 5 0.06905 0.0 2.18 0 0.458 7.147 54.2 6.0622 3 222 18.7 396.90

... ... ... ... ... ... ... ... ... ... ... ... ... ...

501 502 0.06263 0.0 11.93 0 0.573 6.593 69.1 2.4786 1 273 21.0 391.99

502 503 0.04527 0.0 11.93 0 0.573 6.120 76.7 2.2875 1 273 21.0 396.90

503 504 0.06076 0.0 11.93 0 0.573 6.976 91.0 2.1675 1 273 21.0 396.90

504 505 0.10959 0.0 11.93 0 0.573 6.794 89.3 2.3889 1 273 21.0 393.45

505 506 0.04741 0.0 11.93 0 0.573 6.030 80.8 2.5050 1 273 21.0 396.90

506 rows × 15 columns

In [4]: data.isnull().sum()

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 2/4

3/22/24, 6:42 PM COTB12
Unnamed: 0 0
Out[4]:
crim 0
zn 0
indus 0
chas 0
nox 0
rm 0
age 0
dis 0
rad 0
tax 0
ptratio 0
black 0
lstat 0
medv 0
dtype: int64

In [5]: x = data.drop(['medv'], axis = 1)

y = data['medv']

In [10]: from sklearn.model_selection import train_test_split

xtrain, xtest, ytrain, ytest =train_test_split(x, y, test_size =0.2,random_state =

In [11]: import sklearn

from sklearn.linear_model import LinearRegression

In [12]: lm = LinearRegression()
model=lm.fit(xtrain, ytrain)

In [13]: ytrain_pred = lm.predict(xtrain)

ytest_pred = lm.predict(xtest)

In [14]: df=pd.DataFrame(ytrain_pred,ytrain)
df=pd.DataFrame(ytest_pred,ytest)

In [15]: from sklearn.metrics import mean_squared_error, r2_score

mse = mean_squared_error(ytest, ytest_pred)
print(mse)
mse = mean_squared_error(ytrain_pred,ytrain)
print(mse)

33.266961459239134
19.302216223048

In [16]: mse = mean_squared_error(ytest, ytest_pred)

print(mse)

33.266961459239134

In [18]: plt.scatter(ytrain ,ytrain_pred,c='blue',marker='o',label='Training data')

plt.scatter(ytest,ytest_pred ,c='lightgreen',marker='s',label='Test data')
plt.xlabel('True values')
plt.ylabel('Predicted')
plt.title("True value vs Predicted value")
plt.legend(loc= 'upper left')
#plt.hlines(y=0,xmin=0,xmax=50)
plt.plot()
plt.show()

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 3/4

3/22/24, 6:42 PM COTB12

In [ ]:

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 4/4

CBHRMD For SK and Lydo - Final
No ratings yet
CBHRMD For SK and Lydo - Final
42 pages
Linear Regression Besant
No ratings yet
Linear Regression Besant
11 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
21brs1474 ML Lab 2
No ratings yet
21brs1474 ML Lab 2
25 pages
Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
Adi Dsbda4 Final
No ratings yet
Adi Dsbda4 Final
2 pages
Logistic Regression
No ratings yet
Logistic Regression
3 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
4 Linear Regression Model
No ratings yet
4 Linear Regression Model
4 pages
Supervised Learning For Data Science...
No ratings yet
Supervised Learning For Data Science...
14 pages
Assignment 2
No ratings yet
Assignment 2
3 pages
Data Science
No ratings yet
Data Science
1 page
Ridge - Lasso - Regression (1) .Ipynb - Colaboratory
No ratings yet
Ridge - Lasso - Regression (1) .Ipynb - Colaboratory
4 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
Da 012307
No ratings yet
Da 012307
8 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
Big Data Assignment - 4
No ratings yet
Big Data Assignment - 4
6 pages
Assignment 1
No ratings yet
Assignment 1
5 pages
Naive Bayes
No ratings yet
Naive Bayes
58 pages
ML L - Ab
No ratings yet
ML L - Ab
13 pages
Wa0002.
No ratings yet
Wa0002.
5 pages
Linear Reg 33
No ratings yet
Linear Reg 33
3 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
Data - Preprocessing - Tools - Ipynb - Colaboratory
No ratings yet
Data - Preprocessing - Tools - Ipynb - Colaboratory
4 pages
MLL
No ratings yet
MLL
2 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
ML Lab Prgms Split
No ratings yet
ML Lab Prgms Split
3 pages
1
No ratings yet
1
13 pages
Regression Model
No ratings yet
Regression Model
6 pages
HW2A - Jiarui Han
No ratings yet
HW2A - Jiarui Han
6 pages
ML Lab File Final
No ratings yet
ML Lab File Final
17 pages
Ann Experiential Learning
No ratings yet
Ann Experiential Learning
43 pages
AML Lab
No ratings yet
AML Lab
14 pages
Tutorial 7.ipynb - Colab
No ratings yet
Tutorial 7.ipynb - Colab
7 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
Aiml Practicals
No ratings yet
Aiml Practicals
22 pages
ML Internal 2
No ratings yet
ML Internal 2
7 pages
ML Journal
No ratings yet
ML Journal
45 pages
Print Out ML - Finallllllllllllllll
No ratings yet
Print Out ML - Finallllllllllllllll
11 pages
ML Remaining
No ratings yet
ML Remaining
17 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
47 pages
ML Lab Record
No ratings yet
ML Lab Record
17 pages
Minor Lab
No ratings yet
Minor Lab
4 pages
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
100% (1)
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
73 pages
EX. NO: 4 Exploring Regression Performance With Kernel Function DATE: 28/08/2024
No ratings yet
EX. NO: 4 Exploring Regression Performance With Kernel Function DATE: 28/08/2024
9 pages
Final ML File
No ratings yet
Final ML File
34 pages
MLfull
No ratings yet
MLfull
29 pages
4 LinearRegression
No ratings yet
4 LinearRegression
1 page
Python File
No ratings yet
Python File
5 pages
ML Practicals
No ratings yet
ML Practicals
11 pages
Mlaifile1 3
No ratings yet
Mlaifile1 3
27 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
23 pages
# Linear Regression
No ratings yet
# Linear Regression
3 pages
Linear Regression
No ratings yet
Linear Regression
6 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
ML Lab Experiment Shortened With Same Output
No ratings yet
ML Lab Experiment Shortened With Same Output
6 pages
DSBDA05
No ratings yet
DSBDA05
5 pages
M.E Machine Learning - CP4252 Lab Manual4716718074353656238
No ratings yet
M.E Machine Learning - CP4252 Lab Manual4716718074353656238
26 pages
Microsoft Visual Basic Interview Questions: Microsoft VB Certification Review
From Everand
Microsoft Visual Basic Interview Questions: Microsoft VB Certification Review
Equity Press
No ratings yet
HPC Miniproject
No ratings yet
HPC Miniproject
11 pages
Bi 4
No ratings yet
Bi 4
6 pages
BI Miniproject B-25
No ratings yet
BI Miniproject B-25
14 pages
Uber ml1 - Jupyter Notebook
No ratings yet
Uber ml1 - Jupyter Notebook
10 pages
22 Ai 4
No ratings yet
22 Ai 4
4 pages
9709 s11 Ms 62 PDF
No ratings yet
9709 s11 Ms 62 PDF
6 pages
Jamia Millia Islamia: Ownership
0% (1)
Jamia Millia Islamia: Ownership
16 pages
SP Pts Course
100% (1)
SP Pts Course
8 pages
The State of AI in The Cloud 2025
No ratings yet
The State of AI in The Cloud 2025
7 pages
Geometrical Optics ASSIGN - Student
No ratings yet
Geometrical Optics ASSIGN - Student
29 pages
Student Feedback Analysis
No ratings yet
Student Feedback Analysis
3 pages
The SM Store - Application Form
No ratings yet
The SM Store - Application Form
1 page
Design Brief
No ratings yet
Design Brief
1 page
CS User Manual
No ratings yet
CS User Manual
53 pages
Peirano 1998 When Anthropology Is at Home PDF
No ratings yet
Peirano 1998 When Anthropology Is at Home PDF
25 pages
NASSCOM HR Summit Presentation - Final Event
No ratings yet
NASSCOM HR Summit Presentation - Final Event
16 pages
Minutes Portafolio
No ratings yet
Minutes Portafolio
7 pages
Ntn-Needle Roller Bearings
No ratings yet
Ntn-Needle Roller Bearings
348 pages
Mental Fitness PDF
100% (1)
Mental Fitness PDF
9 pages
RM1038-e - Pasio 50
No ratings yet
RM1038-e - Pasio 50
6 pages
PDF - Mathematics - The Complexity of Boolean Functions
No ratings yet
PDF - Mathematics - The Complexity of Boolean Functions
469 pages
HWMonitor
No ratings yet
HWMonitor
32 pages
GB6 Shear Strength
No ratings yet
GB6 Shear Strength
7 pages
20~47液晶屏规格书下载
100% (3)
20~47液晶屏规格书下载
6 pages
High Voltage Engineering Theory and Practice by M. Khalifa
No ratings yet
High Voltage Engineering Theory and Practice by M. Khalifa
554 pages
Foreword: Frank G. Ripel: Nagualism
No ratings yet
Foreword: Frank G. Ripel: Nagualism
5 pages
ConfD Kick Start Guide
No ratings yet
ConfD Kick Start Guide
37 pages
Stefano Boni
No ratings yet
Stefano Boni
2 pages
Term Paper Huffman Coding
No ratings yet
Term Paper Huffman Coding
9 pages
Stress Less, Smile More Module
No ratings yet
Stress Less, Smile More Module
7 pages
Basic Components of Computer
No ratings yet
Basic Components of Computer
22 pages
Lesson Plan Digital
No ratings yet
Lesson Plan Digital
3 pages
Administrative Discretion AND Judicial Review: Project On
No ratings yet
Administrative Discretion AND Judicial Review: Project On
13 pages

Dsbda 4

Uploaded by

Dsbda 4

Uploaded by

3/22/24, 6:42 PM COTB12

In [1]: import pandas as pd

array([ 0.64383562, 26.78082192])

In [22]: predict = np.poly1d(model)

array([87.94520548, 81.50684932, 78.28767123, 71.84931507, 65.4109589 ])

In [24]: from sklearn.metrics import r2_score

In [25]: y_line = model[1] + model[0]* x

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 1/4

506 rows × 15 columns

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 2/4

In [5]: x = data.drop(['medv'], axis = 1)

In [10]: from sklearn.model_selection import train_test_split

In [11]: import sklearn

In [13]: ytrain_pred = lm.predict(xtrain)

In [15]: from sklearn.metrics import mean_squared_error, r2_score

In [16]: mse = mean_squared_error(ytest, ytest_pred)

In [18]: plt.scatter(ytrain ,ytrain_pred,c='blue',marker='o',label='Training data')

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 3/4

file:///C:/Users/Arbaz shaikh/AppData/Local/Microsoft/Windows/INetCache/IE/X2ZVULOZ/DSBDA_4[1].html 4/4

You might also like