0% found this document useful (0 votes)

22 views6 pages

ML Exp-5,6

Uploaded by

prasunagummadi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views6 pages

ML Exp-5,6

Uploaded by

prasunagummadi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

MACHINE LEARNING

Date:05-09-2024

EXPERIMENT-05
Aim: To Predict house prices using linear regression and evaluate model performance with MAE, MSE,
and RMSE.

Program:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import
train_test_split from sklearn.linear_model import
LinearRegression from sklearn import metrics
import pandas as pd

#load the dataset

USAhousing=pd.read_csv('C:/22261A6630/USA_Housing (1).csv')

#Display yje first few row of the dataset

print(USAhousing.head())

#define the features(independent variables ) and target(dependent variable)

#x:matrix features(multiple independent variables)
X=USAhousing[['Avg. Area Income','Avg. Area House Age','Avg. Area Number of Rooms','Avg.
Area Number of Bedrooms','Area Population']]

#Y:Target variable(dependent variable)

y=USAhousing['Price']

#Split the data into training and testing sets

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=0)

#initialize the linear regression model

lm= LinearRegression()

#train the model on the traing data

lm.fit(X_train,y_train)

#use the trained model to make the predictions on the test data
predictions=lm.predict(X_test)

#visualise the predictions vs the actual

values plt.scatter(y_test,predictions)
plt.xlabel('actual prices')
plt.ylabel('predicted prices')
plt.title('actual vs predicted prices')
plt.show()

#evaluate the model using various error metrics

print('MAE(Mean Absolute Error):',metrics.mean_absolute_error(y_test,predictions))
print('MSE(Mean Squared Error):',metrics.mean_squared_error(y_test,predictions))
print('RMSE(Root Mean Squared Error):',np.sqrt(metrics.mean_squared_error(y_test,predictions)))

22261A6623 1
MACHINE LEARNING
Date:05-09-2024
OUTPUT:

Avg. Area Income Avg. Area House Age Avg. Area Number of Rooms \
0 79545.458574 5.682861 7.009188
1 79248.642455 6.002900 6.730821
2 61287.067179 5.865890 8.512727
3 63345.240046 7.188236 5.586729
4 59982.197226 5.040555 7.839388

Avg. Area Number of Bedrooms Area Population Price \

0 4.09 23086.800503 1.059034e+06
1 3.09 40173.072174 1.505891e+06
2 5.13 36882.159400 1.058988e+06
3 3.26 34310.242831 1.260617e+06
4 4.23 26354.109472 6.309435e+05

Address
0 208 Michael Ferry Apt. 674\nLaurabury, NE 3701...
1 188 Johnson Views Suite 079\nLake Kathleen, CA...
2 9127 Elizabeth Stravenue\nDanieltown, WI 06482...
3 USS Barnett\nFPO AP 44820
4 USNS Raymond\nFPO AE 09386

MAE(Mean Absolute Error): 81563.14733994054

MSE(Mean Squared Error): 10337337828.267305
RMSE(Root Mean Squared Error): 101672.69952286752

22261A6623 2
MACHINE LEARNING
Date:05-09-2024

Aim:To Predict tennis play outcomes using a decision tree classifier and evaluate model
performance with accuracy, precision, recall, and F1-score.

Program:
import numpy as np
import pandas as pd
from sklearn import metrics
df=pd.read_csv('C:/22261A6630/play_tennis.csv')
value=['outlook','temp','humidity','wind']
df
len(df)
df.shape
df.head()
df.tail()
df.describe()
from sklearn import preprocessing
string_to_int = preprocessing.LabelEncoder()
df=df.apply(string_to_int.fit_transform)
feature_cols=['outlook','temp','humidity','wind']
X=df[feature_cols]
y=df.play
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.30)
#PERFORM training
from sklearn.tree import DecisionTreeClassifier
classifier = DecisionTreeClassifier(criterion='entropy',random_state=100)
classifier.fit(X_train,y_train)
y_pred=classifier.predict(X_test)
from sklearn.metrics import accuracy_score
print("accuracy:",metrics.accuracy_score(y_test,y_pred))
data_p=pd.DataFrame({'Actual':y_test,'predicted':y_pred})
data_p
from sklearn.metrics import classification_report,confusion_matrix
print(confusion_matrix(y_test,y_pred))
print(classification_report(y_test,y_pred))

OUTPUT:
accuracy: 0.6
[[1 2]
[0 2]]
precision recall f1-score support

0 1.00 0.33 0.50 3

1 0.50 1.00 0.67 2

accuracy 0.60 5
macro avg 0.75 0.67 0.58 5
weighted avg 0.80 0.60 0.57 5

22261A6623 3
MACHINE LEARNING
Date:12-09-2024

EXPERIMENT-06

Aim:Tune hyperparameters to find the best decision tree model, evaluate its performance, and
visualize the best tree along with its classification metrics.

Program:

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import
DecisionTreeClassifier,plot_tree from
sklearn.preprocessing import LabelEncoder
from sklearn.metrics import classification_report,accuracy_score,confusion_matrix
import matplotlib.pyplot as plt
df=pd.read_csv('C:/Users/MGIT/OneDrive/Desktop/22261A6621/archive (2)/play_tennis.csv')
Label_Encoders={}
for column in df.columns:
le=LabelEncoder()
df[column]=le.fit_transform(df[column])
Label_Encoders[column]=le
X=df.drop('play',axis=1)
y=df['play']

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.33,random_state=42)hyperparameters
=[
{'criterion':'gini','max_depth':None,'min_samples_split':2,'min_samples_leaf':1},
{'criterion':'entropy','max_depth':4,'min_samples_split':2,'min_samples_leaf':1},
{'criterion':'gini','max_depth':6,'min_samples_split':5,'min_samples_leaf':2},
{'criterion':'entropy','max_depth':8,'min_samples_split':10,'min_samples_leaf':4},
]
best_accuracy=0
best_params=None
best_tree=None
for params in hyperparameters:
tree=DecisionTreeClassifier(**params,random_state=42)
tree.fit(x_train,y_train)
y_pred=tree.predict(x_test)
accuracy=accuracy_score(y_test,y_pred)
print(f"Parameters:{paimport pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import classification_report, accuracy_score, confusion_matrix
import matplotlib.pyplot as plt
df=pd.read_csv('C:/Users/MGIT/OneDrive/Desktop/22261A6621/archive (2)/play_tennis.csv')
label_encoders={}
for column in df.columns:
le=LabelEncoder()
df[column]=le.fit_trarams},Accuracy:{accuracy:.4f}")
if accuracy>best_accuracy:
22261A6623 4
MACHINE LEARNING
Date:12-09-2024
best_accuracy=accuracy
best_params=params
best_tree=tree
print(f"\nBest Parameters:{best_params},Best Accuracy:{best_accuracy:.4f}")
plt.figure(figsize=(12,8))
plot_tree(best_tree,filled=True,feature_names=list(x.columns),class_names=list(label_encoders['play
'].classes_),rounded=True)
plt.title('Best Decision Tree')
plt.show()
y_pred_best=best_tree.predict(x_test)
print("Best Decision Tree - Classification Report:")
print(classification_report(y_test,y_pred_best,target_names=label_encoders['play'].classes_))
print("Best Decision Tree - Confusion Matrix:")
print(confusion_matrix(y_test,y_pred_best))
print("Best Decision Tree - Accuracy Score:")
print(accuracy_score(y_test,y_pred_best))

OUTPUT:

Parameters:{'criterion': 'gini', 'max_depth': None, 'min_samples_split': 2, 'min_samples_leaf':

1},Accuracy:0.6000
Parameters:{'criterion': 'entropy', 'max_depth': 4, 'min_samples_split': 2, 'min_samples_leaf':
1},Accuracy:0.6000
Parameters:{'criterion': 'gini', 'max_depth': 6, 'min_samples_split': 5, 'min_samples_leaf': 2},Accuracy:0.8000
Parameters:{'criterion': 'entropy', 'max_depth': 8, 'min_samples_split': 10, 'min_samples_leaf':
4},Accuracy:0.6000
Best Parameters:{'criterion': 'gini', 'max_depth': 6, 'min_samples_split': 5, 'min_samples_leaf': 2},Best
Accuracy:0.8000

Best Decision Tree - Classification Report:

precision recall f1-score support

No 1.00 0.50 0.67 2

Yes 0.75 1.00 0.86 3

accuracy 0.80 5
macro avg 0.88 0.75 0.76 5
weighted avg 0.85 0.80 0.78 5

Best Decision Tree - Confusion Matrix:

[[1 1]
[0 3]]
Best Decision Tree - Accuracy Score:
0.8

22261A6623 5
MACHINE LEARNING
Date:12-09-2024

Aim: To visualize a scatter plot of data points with X and Y coordinates, colored by class labels.

Program:

import matplotlib.pyplot as plt

X=[4,5,10,4,3,11,14,8,10,12]
Y=[21,19,24,17,16,25,24,22,21,21]
classes=[0,0,1,0,0,1,1,0,1,1]
plt.scatter(X,Y,c=classes)
plt.show()

OUTPUT:

22261A6623 6

PSLE Maths 2020 Paper 1 Booklet B
No ratings yet
PSLE Maths 2020 Paper 1 Booklet B
8 pages
23 Hack in Sight 2014
100% (2)
23 Hack in Sight 2014
652 pages
Iso 8503-1 - 8503-2 - Surface Roughness Comprator PDF
No ratings yet
Iso 8503-1 - 8503-2 - Surface Roughness Comprator PDF
4 pages
Corrosion Protection of Rock Bolts by Epoxy Coating and Its Effec PDF
No ratings yet
Corrosion Protection of Rock Bolts by Epoxy Coating and Its Effec PDF
9 pages
Handy Notes For Student Pilots
100% (1)
Handy Notes For Student Pilots
7 pages
Rexroth Servo Drives Programming:: Page 1 of 56
No ratings yet
Rexroth Servo Drives Programming:: Page 1 of 56
56 pages
Intrinsic Viscosities and Unperturbed Dimensions of Long Chain Molecules
No ratings yet
Intrinsic Viscosities and Unperturbed Dimensions of Long Chain Molecules
117 pages
BES - Lecture 10 - Simple Linear Regression
No ratings yet
BES - Lecture 10 - Simple Linear Regression
15 pages
Chapter 2 Part 1
No ratings yet
Chapter 2 Part 1
23 pages
Ultrapac 2000 Standard, Ultrapac 2000 Superplus, Mini (Typ 0005 Bis 0025)
No ratings yet
Ultrapac 2000 Standard, Ultrapac 2000 Superplus, Mini (Typ 0005 Bis 0025)
3 pages
Drafting and Making The Shieldmaiden Corset
100% (2)
Drafting and Making The Shieldmaiden Corset
6 pages
Training & Experience and Project Report
100% (1)
Training & Experience and Project Report
16 pages
Strength Tests On Concrete: (1) Compressive Strength Test (ASTM C 39)
No ratings yet
Strength Tests On Concrete: (1) Compressive Strength Test (ASTM C 39)
12 pages
Lec1 PDF
No ratings yet
Lec1 PDF
28 pages
Guia Desmontaje Pavilion Dv7t
No ratings yet
Guia Desmontaje Pavilion Dv7t
16 pages
Blas Lapack
No ratings yet
Blas Lapack
21 pages
5 PB
No ratings yet
5 PB
18 pages
Homomorphism
No ratings yet
Homomorphism
10 pages
How To Know (Check) My Own Mobile Number - Airtel, Idea, Jio Vodafone, Tata Docomo, Reliance, BSNL, Aircel, MTNL, Videocon, Virgin, Uninor
No ratings yet
How To Know (Check) My Own Mobile Number - Airtel, Idea, Jio Vodafone, Tata Docomo, Reliance, BSNL, Aircel, MTNL, Videocon, Virgin, Uninor
3 pages
Photonics Element For Sensing and Optical Conversions
No ratings yet
Photonics Element For Sensing and Optical Conversions
310 pages
P05 The Regression Pipeline - Training and Testing Ans
No ratings yet
P05 The Regression Pipeline - Training and Testing Ans
13 pages
Determine and Describe The Intersection of Sets Using Various Representations and B
No ratings yet
Determine and Describe The Intersection of Sets Using Various Representations and B
18 pages
Machine
100% (1)
Machine
45 pages
Boston Housing Kaggle Challenge With Linear Regression
No ratings yet
Boston Housing Kaggle Challenge With Linear Regression
3 pages
Notebook034d0e6953 Ipynb
No ratings yet
Notebook034d0e6953 Ipynb
8 pages
2 - Linear - Regression - Multivariate - Ipynb - Colaboratory
No ratings yet
2 - Linear - Regression - Multivariate - Ipynb - Colaboratory
4 pages
Machine Learning
No ratings yet
Machine Learning
22 pages
9100 Manual
No ratings yet
9100 Manual
11 pages
Signals and Systems PDF
No ratings yet
Signals and Systems PDF
1 page
Zerox Ready
No ratings yet
Zerox Ready
21 pages
Decision Tree Algorithm in Machine Learning
No ratings yet
Decision Tree Algorithm in Machine Learning
13 pages
IoT Task4 21BEC0384
No ratings yet
IoT Task4 21BEC0384
9 pages
ABHAYMLFILE
No ratings yet
ABHAYMLFILE
16 pages
Edexcel IGCSE Mathematics B 4MB1 Revision Notes
No ratings yet
Edexcel IGCSE Mathematics B 4MB1 Revision Notes
42 pages
Machine Learning Presentaion
No ratings yet
Machine Learning Presentaion
15 pages
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
No ratings yet
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
3 pages
Dr. Devang Sharma
No ratings yet
Dr. Devang Sharma
6 pages
HousepricedataDT - Ipynb - Colab
No ratings yet
HousepricedataDT - Ipynb - Colab
3 pages
LAB MANUAL For Machine Learning
No ratings yet
LAB MANUAL For Machine Learning
15 pages
ML L - Ab
No ratings yet
ML L - Ab
13 pages
DA Practicle Answers Easyw
No ratings yet
DA Practicle Answers Easyw
30 pages
CBSE Computer Science Class 12 Question Paper 2024 Solutions FREE PDF
No ratings yet
CBSE Computer Science Class 12 Question Paper 2024 Solutions FREE PDF
44 pages
MLT 1 - 7 Kanish
No ratings yet
MLT 1 - 7 Kanish
24 pages
FDS Lab Manual
No ratings yet
FDS Lab Manual
10 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
23 pages
ML Lab File Final
No ratings yet
ML Lab File Final
17 pages
QB 1
No ratings yet
QB 1
11 pages
Perform Prediction Using Regression Algorithm: Ex No: 1 Date
No ratings yet
Perform Prediction Using Regression Algorithm: Ex No: 1 Date
13 pages
CP4252 Machine Learning Lab Manual
No ratings yet
CP4252 Machine Learning Lab Manual
26 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Shrivastava Et Al 2023 Rapid Estimation of Size Based Heterogeneity in Monoclonal Antibodies by Machine Learning
No ratings yet
Shrivastava Et Al 2023 Rapid Estimation of Size Based Heterogeneity in Monoclonal Antibodies by Machine Learning
11 pages
Train
No ratings yet
Train
17 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
22 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
Exp4 (Linear Regression)
No ratings yet
Exp4 (Linear Regression)
2 pages
ML Internal Answers
No ratings yet
ML Internal Answers
9 pages
1 - Lab Manual (ML)
No ratings yet
1 - Lab Manual (ML)
42 pages
Write A Program To Demonstrate Decision Tree Algorithm For A Classification Problem and Perform Parameter Tuning For Better Results
No ratings yet
Write A Program To Demonstrate Decision Tree Algorithm For A Classification Problem and Perform Parameter Tuning For Better Results
5 pages
Head Vs Capacity
No ratings yet
Head Vs Capacity
3 pages
Global Elevation Data Download Tool - January 15, 2025
No ratings yet
Global Elevation Data Download Tool - January 15, 2025
5 pages
ML Lab Manual 4-8
No ratings yet
ML Lab Manual 4-8
11 pages
Decision Tree
No ratings yet
Decision Tree
6 pages
Aiml Practicals
No ratings yet
Aiml Practicals
22 pages
Asynch Exercise 2 WACC APV
No ratings yet
Asynch Exercise 2 WACC APV
2 pages
ML Record
No ratings yet
ML Record
21 pages
ML5&6&7&8&9&10
No ratings yet
ML5&6&7&8&9&10
35 pages
Da 012307
No ratings yet
Da 012307
8 pages
ML Yogesh
No ratings yet
ML Yogesh
23 pages
ML Keshav
No ratings yet
ML Keshav
23 pages
ML Using Python Programs
No ratings yet
ML Using Python Programs
12 pages
7 A
No ratings yet
7 A
2 pages
ML Lab Programs 2
No ratings yet
ML Lab Programs 2
16 pages
ML Manual
No ratings yet
ML Manual
24 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
ML Full For Print New 1
No ratings yet
ML Full For Print New 1
38 pages
ML Manual
No ratings yet
ML Manual
9 pages
Supervised Learning
No ratings yet
Supervised Learning
1 page
DT As Regressor-Follow
No ratings yet
DT As Regressor-Follow
4 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
CR Lab
No ratings yet
CR Lab
5 pages
ML Lab Record
No ratings yet
ML Lab Record
17 pages
Aiml Practical
No ratings yet
Aiml Practical
17 pages
ML Record
No ratings yet
ML Record
19 pages
Integrated System Lab
No ratings yet
Integrated System Lab
25 pages
ML Functions
No ratings yet
ML Functions
12 pages
Data Mining Final Assignment
No ratings yet
Data Mining Final Assignment
4 pages
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
No ratings yet
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
24 pages
Big Data Practical
No ratings yet
Big Data Practical
20 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages

ML Exp-5,6

Uploaded by

ML Exp-5,6

Uploaded by

MACHINE LEARNING

#load the dataset

#Display yje first few row of the dataset

#define the features(independent variables ) and target(dependent variable)

#Y:Target variable(dependent variable)

#Split the data into training and testing sets

#initialize the linear regression model

#train the model on the traing data

#visualise the predictions vs the actual

#evaluate the model using various error metrics

Avg. Area Number of Bedrooms Area Population Price \

MAE(Mean Absolute Error): 81563.14733994054

0 1.00 0.33 0.50 3

Parameters:{'criterion': 'gini', 'max_depth': None, 'min_samples_split': 2, 'min_samples_leaf':

Best Decision Tree - Classification Report:

No 1.00 0.50 0.67 2

Best Decision Tree - Confusion Matrix:

import matplotlib.pyplot as plt

You might also like