0% found this document useful (0 votes)

22 views

Assignment 2

The document provides the results of applying Naive Bayes, ID3, and Random Forest classifiers to the Iris and Titanic datasets. For each algorithm and dataset, it reports the accuracy, training time, test time, and includes the code used. It shows that the ID3 and Random Forest algorithms achieved 100% accuracy on the Iris dataset, while Naive Bayes achieved the highest accuracy on the Titanic dataset.

Uploaded by

Muhammad Asad Chadhar

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views

Assignment 2

Uploaded by

Muhammad Asad Chadhar

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 10

COMSATS University Islamabad, Lahore Campus

Fall 2022 – Assignment No. 2

Course Title: Machine Learning Course Code: CSC 354
Course Instructor/s: Dr. Allah Bux Sargano Program Name: BSCS
Topic Dataset Classifiers Max. marks: 30
Out Date: 1-11-2022 Due Date: 10-11-2022
Student’s Name: Muhammad Asad Reg. No. SP20-BCS-158
Important Instructions:
1. Zero tolerance for plagiarism: Plagiarism from any sources, including internet sources and
your fellow students (except allowed sources by the instructor), will result in ZERO marks.
2. Submission requirements:
1. Start page(s): this sheet
2. Code
3. Screenshots of results (Input & output)
3. Late submission policy: deduction @ of 20% of total marks per day
(CLO: 2)
Question No. 1

# Machine Learning Accuracy Training Test Time Dataset

Algorithm (%age) Time

1 Naïve Bayes 96.67 0.1 0.1 IRIS

2 ID3 100 0.3 0.5 IRIS

4 Random Forest 100 0.2 0.4 IRIS

# Machine Learning Accuracy Training Test Time Dataset

Algorithm (%age) Time

1 Naïve Bayes 76.223 0.5 0.8 Titanic

2 ID3 74.82 0.7 0.9 Titanic

4 Random Forest 70.94 0.6 1.1 Titanic

# Naive Bayes Iris

import numpy as np
import pandas as pd
dataset=pd.read_csv('IRIS.csv')
dataset=pd.DataFrame(dataset)
X=dataset.iloc[:,[0,1,2,3]]
Y=dataset.iloc[:,[4]]

dataset.replace(to_replace=['Iris-setosa','Iris-virginica','Iris-
versicolor'],value=['1','2','3'],inplace=True)
dataset.head()

from sklearn.model_selection import train_test_split

xtrain,xtest,ytrain,ytest=train_test_split(X,Y,test_size=0.2,random_state=0)
#applying naive bayes model for classification
from sklearn.naive_bayes import GaussianNB
classifier=GaussianNB()
classifier.fit(xtrain,ytrain)
ypred=classifier.predict(xtest)

from sklearn.metrics import confusion_matrix

from sklearn.metrics import accuracy_score

print('accuracy is =', accuracy_score(ytest,ypred)*100)

print(confusion_matrix(ytest,ypred))
# Iris Id3
import pandas as pd
from sklearn.metrics import accuracy_score
from sklearn import tree
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

df = pd.read_csv('./IRIS.csv')

X = df.iloc[:, [0, 1, 2, 3]].values

y = df['species']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20, random_state = 0)

clf = DecisionTreeClassifier()

clf.fit(X_train, y_train)

y_pred = clf.predict(X_test)

plt.figure(figsize=(10, 10))
tree.plot_tree(clf)
#Accuray of the model
ac = accuracy_score(y_test, y_pred)

print("Accuracy: ", ac*100)

print(confusion_matrix(y_test,y_pred))

# Iris random forest

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

df = pd.read_csv('./IRIS.csv')
X = df.iloc[:, [0, 1, 2, 3]].values
y = df['species']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20, random_state = 0)

rand_forest = RandomForestClassifier(n_estimators=10)

clf.fit(X_train,y_train)

y_pred = clf.predict(X_test)

ac = accuracy_score(y_test, y_pred)
print("Accuracy: ", ac*100)
print(confusion_matrix(y_test,y_pred))

# TiTanic NBayes
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score

df = pd.read_csv('./titanic.csv')
dataset = df[df['Age'].notna()]
dataset = dataset.sample(frac = 1, random_state = 5).reset_index()
dataset = dataset.drop('index', axis = 1)

X = dataset.iloc[:, [2, 5, 6, 7, 9]].values

y = dataset['Survived']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20, random_state = 0)

clf = GaussianNB()
clf.fit(X_train, y_train)

y_pred = clf.predict(X_test)

ac = accuracy_score(y_test,y_pred)
print('\nAccuracy = ', ac*100,'%')

print(confusion_matrix(y_test,y_pred))

# Titanic id3
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
from sklearn.metrics import accuracy_score

# Importing the dataset

df = pd.read_csv('./titanic.csv')
dataset = df[df['Age'].notna()] #Discarding the NaN Values (from Age Column) of titanic
dataset
dataset = dataset.sample(frac = 1, random_state = 18).reset_index()
dataset = dataset.drop('index', axis = 1)

X = dataset.iloc[:, [2, 5, 6, 7, 9]].values #Loading the attributes in X

y = dataset['Survived']#Loading the Survived Labels in y

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20, random_state = 2)

cls = DecisionTreeClassifier()

cls.fit(X_train, y_train)

y_pred = cls.predict(X_test)

plt.figure(figsize=(15, 15))
tree.plot_tree(cls)

ac = accuracy_score(y_test, y_pred)
print("\nAccuracy: ", ac*100)

print(confusion_matrix(y_test,y_pred))
# Titanic Random Forest
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

df = pd.read_csv('./titanic.csv')

X = df.iloc[:, [2,6,7]].values #Loading the attributes in X

y = df['Survived'] #Loading the Classes in y

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20, random_state = 0)

#n_estimators are no. of trees

rand_forest = RandomForestClassifier(n_estimators=10)

clf.fit(X_train,y_train)

y_pred = clf.predict(X_test)

ac = accuracy_score(y_test, y_pred)
print("Accuracy: ", ac*100)

print(confusion_matrix(y_test,y_pred))

Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Naive Bayes Classification
No ratings yet
Naive Bayes Classification
8 pages
23BCE7199 ML Lab Assignment[1]
No ratings yet
23BCE7199 ML Lab Assignment[1]
15 pages
Exp 5
No ratings yet
Exp 5
8 pages
23BCE7092_ML_Lab_Assignment[1]
No ratings yet
23BCE7092_ML_Lab_Assignment[1]
14 pages
ML - LAB - FILE Amrit
No ratings yet
ML - LAB - FILE Amrit
13 pages
Home Work
No ratings yet
Home Work
12 pages
Assignment - 01
No ratings yet
Assignment - 01
4 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Remaining ML Program
No ratings yet
Remaining ML Program
12 pages
ML - LAB - FILE Pankaj
No ratings yet
ML - LAB - FILE Pankaj
13 pages
Aman Agarwal
No ratings yet
Aman Agarwal
6 pages
ML File
No ratings yet
ML File
10 pages
6. Data Analytics III
No ratings yet
6. Data Analytics III
5 pages
ML Assignment
No ratings yet
ML Assignment
34 pages
Naive Bayes Algorithm With Classification Example 1697128543
No ratings yet
Naive Bayes Algorithm With Classification Example 1697128543
16 pages
1st PGM
No ratings yet
1st PGM
10 pages
Unit 2
No ratings yet
Unit 2
5 pages
Exp 3 Bi 30
No ratings yet
Exp 3 Bi 30
7 pages
Lab 3
No ratings yet
Lab 3
7 pages
MLT 1 - 7 Kanish
No ratings yet
MLT 1 - 7 Kanish
24 pages
DA_012307
No ratings yet
DA_012307
8 pages
Machine Learning
No ratings yet
Machine Learning
3 pages
Naive Biase
No ratings yet
Naive Biase
6 pages
SVM
No ratings yet
SVM
8 pages
Lab Week 7
No ratings yet
Lab Week 7
3 pages
Exp 3 Bi
No ratings yet
Exp 3 Bi
12 pages
decision tree
No ratings yet
decision tree
2 pages
ML With Python Practical
No ratings yet
ML With Python Practical
22 pages
Machine Learning Lab New
No ratings yet
Machine Learning Lab New
14 pages
ML LAB 146
No ratings yet
ML LAB 146
50 pages
MLSolutions
No ratings yet
MLSolutions
4 pages
Titanic Survival Prediction Using Machine Learning
No ratings yet
Titanic Survival Prediction Using Machine Learning
7 pages
ML_Prac1-10
No ratings yet
ML_Prac1-10
32 pages
Name: Mussab Bin Shahid Sap-Id: 2024 Assignment: Machine-Learning
No ratings yet
Name: Mussab Bin Shahid Sap-Id: 2024 Assignment: Machine-Learning
5 pages
ML P-6 - 024
No ratings yet
ML P-6 - 024
22 pages
6 Binary Classifier
No ratings yet
6 Binary Classifier
4 pages
Perform Prediction Using Regression Algorithm: Ex No: 1 Date
No ratings yet
Perform Prediction Using Regression Algorithm: Ex No: 1 Date
13 pages
Mllabprog 5
No ratings yet
Mllabprog 5
6 pages
Btech1007022_lab5.1
No ratings yet
Btech1007022_lab5.1
9 pages
Machine learning with Titanic dataset tutorial
No ratings yet
Machine learning with Titanic dataset tutorial
7 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
MLT Practical 3 and 4
No ratings yet
MLT Practical 3 and 4
2 pages
ML Lab
No ratings yet
ML Lab
7 pages
Btech1007022_lab5
No ratings yet
Btech1007022_lab5
14 pages
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
3 Classification
No ratings yet
3 Classification
16 pages
ML Lab PT
No ratings yet
ML Lab PT
25 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
W8 Naive Bayes Lab
No ratings yet
W8 Naive Bayes Lab
4 pages
8&9 Assignment ADS
No ratings yet
8&9 Assignment ADS
20 pages
Naive Bayes
No ratings yet
Naive Bayes
9 pages
ADS_phase 3
No ratings yet
ADS_phase 3
34 pages
Data Mining Assignment No. 1
No ratings yet
Data Mining Assignment No. 1
7 pages
SHASHANK ML.docx
No ratings yet
SHASHANK ML.docx
23 pages
01 Machine Learning
No ratings yet
01 Machine Learning
25 pages
Logistic Regression On Titanic Dataset
No ratings yet
Logistic Regression On Titanic Dataset
6 pages
21CSC305P Ml - Lab Programs 1 -9
No ratings yet
21CSC305P Ml - Lab Programs 1 -9
36 pages
Iris - Regression - Jupyter Notebook
No ratings yet
Iris - Regression - Jupyter Notebook
5 pages
DR Shabbir Title Pages Thesis, Final.,..
No ratings yet
DR Shabbir Title Pages Thesis, Final.,..
54 pages
Sta. Fe National High School
No ratings yet
Sta. Fe National High School
6 pages
SCIENCE-4-DLL-2nd-Q-WEEK_7
No ratings yet
SCIENCE-4-DLL-2nd-Q-WEEK_7
7 pages
Reaction Paper Educational Technology
No ratings yet
Reaction Paper Educational Technology
3 pages
T - Year 1 - SA1 - DD - MathMagic
No ratings yet
T - Year 1 - SA1 - DD - MathMagic
7 pages
Form 1KA Lesson Plan - Speaking
No ratings yet
Form 1KA Lesson Plan - Speaking
2 pages
AI interview Questions Odd Sem 24-25
No ratings yet
AI interview Questions Odd Sem 24-25
8 pages
Educ314 Finals
No ratings yet
Educ314 Finals
13 pages
ENG-8 Q3 Explain How A Selection Is Influenced
No ratings yet
ENG-8 Q3 Explain How A Selection Is Influenced
14 pages
Comments, Feedbacks and Observations: Lesson 3
No ratings yet
Comments, Feedbacks and Observations: Lesson 3
4 pages
Auroville School
No ratings yet
Auroville School
6 pages
Attendance g12 Ga A (Eapp)
No ratings yet
Attendance g12 Ga A (Eapp)
58 pages
PPST Priority Indicators For Proficient Teachers and Means of Verification
100% (2)
PPST Priority Indicators For Proficient Teachers and Means of Verification
27 pages
Cyril Pottor College of Education Pv2B Home Economics (Major) Svetlana Dowding Pedagogy 2 Assignment #2 Essay On Micro Teaching
No ratings yet
Cyril Pottor College of Education Pv2B Home Economics (Major) Svetlana Dowding Pedagogy 2 Assignment #2 Essay On Micro Teaching
3 pages
Go To Page Word 2022 Final
No ratings yet
Go To Page Word 2022 Final
17 pages
FS3 Ep1 Roxanne Lomandas
No ratings yet
FS3 Ep1 Roxanne Lomandas
5 pages
Invitation Hsiac 2019 Exhibitor Edx
No ratings yet
Invitation Hsiac 2019 Exhibitor Edx
2 pages
Analysis of Barriers in Listening Compre
No ratings yet
Analysis of Barriers in Listening Compre
7 pages
HUMSS - Culminating Activity CG - 1 PDF
No ratings yet
HUMSS - Culminating Activity CG - 1 PDF
3 pages
D.O. No. 044 S. 2021
100% (3)
D.O. No. 044 S. 2021
34 pages
Entrepreneurship Week
No ratings yet
Entrepreneurship Week
4 pages
2nd Quarter Curriculum Map 9
No ratings yet
2nd Quarter Curriculum Map 9
4 pages
CNN E: Learning Convolutional Neural Networks With Interactive Visualization
No ratings yet
CNN E: Learning Convolutional Neural Networks With Interactive Visualization
11 pages
Assessment of Learning
94% (33)
Assessment of Learning
65 pages
Idaho Core Teacher Standards and Framework
No ratings yet
Idaho Core Teacher Standards and Framework
24 pages
CSTP 5 Bugenske
No ratings yet
CSTP 5 Bugenske
9 pages
Echo State Network
No ratings yet
Echo State Network
4 pages
Young Learners: WWW - Oupjapan.co - JP
No ratings yet
Young Learners: WWW - Oupjapan.co - JP
15 pages
Aces Learning Continuity Plan: Delia Caryl C. Tubera
No ratings yet
Aces Learning Continuity Plan: Delia Caryl C. Tubera
4 pages
Thomas Angelo's (1993) 14 Principles For Improving Higher Learning
No ratings yet
Thomas Angelo's (1993) 14 Principles For Improving Higher Learning
2 pages