Data Analytics III

The document outlines a laboratory exercise for a Data Science and Big Data Analytics course, focusing on implementing a Naïve Bayes classifier using the Iris dataset. It details the steps for importing libraries, loading data, splitting it into training and testing sets, training the model, making predictions, and evaluating performance metrics. The results, including the confusion matrix and various metrics such as accuracy, precision, and recall, are also displayed.

Uploaded by

Chirag Patekar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views5 pages

Data Analytics III

Uploaded by

Chirag Patekar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

Third Year Engineering (2019 Pattern)

Course Code: 310256

Course Name: Data Science and Big Data Analytics Laboratory
Group A
6) Data Analytics III
# Import necessary libraries
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import confusion_matrix, accuracy_score, precision_score,
recall_score

# Load the Iris dataset

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
columns = ["sepal_length", "sepal_width", "petal_length", "petal_width",
"species"]
df = pd.read_csv(url, names=columns)

# Split the dataset into features and target

X = df.iloc[:, :-1] # All columns except the last one as features
y = df.iloc[:, -1] # Last column as target

# Split into training and testing data (70% training, 30% testing)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=42)

# Create and train the Naïve Bayes classifier

model = GaussianNB()
model.fit(X_train, y_train)

# Predict on test data

y_pred = model.predict(X_test)

# Generate confusion matrix

cm = confusion_matrix(y_test, y_pred)

# Extract True Positive, False Positive, True Negative, False Negative

TP = cm[0][0]
FP = cm.sum(axis=0)[0] - TP
FN = cm.sum(axis=1)[0] - TP
TN = cm.sum() - (TP + FP + FN)

# Compute metrics
accuracy = accuracy_score(y_test, y_pred)
error_rate = 1 - accuracy
precision = precision_score(y_test, y_pred, average='macro')
recall = recall_score(y_test, y_pred, average='macro')

# Display Results
print(f"Confusion Matrix:\n{cm}")
print(f"True Positive (TP): {TP}")
print(f"False Positive (FP): {FP}")
print(f"True Negative (TN): {TN}")
print(f"False Negative (FN): {FN}")
print(f"Accuracy: {accuracy:.2f}")
print(f"Error Rate: {error_rate:.2f}")
print(f"Precision: {precision:.2f}")
print(f"Recall: {recall:.2f}")

Explanation of Each Step:

1. Import Libraries
o pandas – For handling data.
o train_test_split – For splitting data into training and testing sets.
o GaussianNB – For creating a Naïve Bayes classifier.
o confusion_matrix, accuracy_score, precision_score, recall_score – For
evaluating model performance.
2. Load Dataset
o Load iris.csv using pd.read_csv()
3. Split Features and Target
o X = feature columns
o y = target column (species)
4. Split into Training and Testing Sets
o 70% for training, 30% for testing
5. Create and Train Naïve Bayes Classifier
o GaussianNB() assumes data follows a normal distribution
o fit() trains the model on training data
6. Make Predictions
o predict() predicts species on test data
7. Generate Confusion Matrix
o confusion_matrix() compares predicted vs actual values
8. Extract Confusion Matrix Values
o TP, FP, FN, TN calculated from confusion matrix
9. Compute Performance Metrics
o Accuracy = Correct predictions / Total predictions
o Error rate = 1 - Accuracy
o Precision = TP / (TP + FP)
o Recall = TP / (TP + FN)
10. Display Results
 Print confusion matrix and computed metrics

OUTPUT-

Machine and Industrial Design in Mechanical Engineering (Milan Rackov, Radivoje Mitrović, Maja Čavić) (Z-Library)
No ratings yet
Machine and Industrial Design in Mechanical Engineering (Milan Rackov, Radivoje Mitrović, Maja Čavić) (Z-Library)
725 pages
Designing A Roller Coaster
100% (6)
Designing A Roller Coaster
18 pages
ML Lab
No ratings yet
ML Lab
26 pages
Codes and Other Relevant Explanations For Supervised Learning (Part 1) - Session by Sabyasachi Mukhopadhyay - August 3
No ratings yet
Codes and Other Relevant Explanations For Supervised Learning (Part 1) - Session by Sabyasachi Mukhopadhyay - August 3
5 pages
Machine Learning With Scikit Learn Strata 2015
No ratings yet
Machine Learning With Scikit Learn Strata 2015
72 pages
Ds Notes Mca
No ratings yet
Ds Notes Mca
30 pages
ML Prac1-10
No ratings yet
ML Prac1-10
32 pages
ML New Record
No ratings yet
ML New Record
51 pages
Machine Learning
No ratings yet
Machine Learning
3 pages
Tensor Flow and Keras Sample Programs
No ratings yet
Tensor Flow and Keras Sample Programs
22 pages
3 Classification
No ratings yet
3 Classification
16 pages
Amlnew
No ratings yet
Amlnew
25 pages
Aiml Practical
No ratings yet
Aiml Practical
17 pages
Naive Bayes Classifier 066
No ratings yet
Naive Bayes Classifier 066
14 pages
Exp 3 Bi
No ratings yet
Exp 3 Bi
12 pages
Komatsu Avance Loader WA470 3 Wheel Loader Operating Maintenance Manual
0% (1)
Komatsu Avance Loader WA470 3 Wheel Loader Operating Maintenance Manual
235 pages
Remaining ML Program
No ratings yet
Remaining ML Program
12 pages
CS3491 Lab Manual
No ratings yet
CS3491 Lab Manual
21 pages
Code Examples in Space
No ratings yet
Code Examples in Space
13 pages
Wa0001
No ratings yet
Wa0001
39 pages
Bagging, Random Forest, Gradient Boost, AdaBoost & PCA
No ratings yet
Bagging, Random Forest, Gradient Boost, AdaBoost & PCA
8 pages
Machine Learning Aiml
No ratings yet
Machine Learning Aiml
7 pages
Allcodesml 2
No ratings yet
Allcodesml 2
10 pages
ML Lab Manual
No ratings yet
ML Lab Manual
6 pages
Practical # 11
No ratings yet
Practical # 11
10 pages
AAM PR QB
No ratings yet
AAM PR QB
13 pages
ML Manual With Outputs
No ratings yet
ML Manual With Outputs
30 pages
Aman Agarwal
No ratings yet
Aman Agarwal
6 pages
Practical 3
No ratings yet
Practical 3
11 pages
ML Lab PT
No ratings yet
ML Lab PT
25 pages
Dsbda 10
No ratings yet
Dsbda 10
5 pages
Practical-4: Write A Python Program To Perform Multiclass Classification On Iris Dataset
No ratings yet
Practical-4: Write A Python Program To Perform Multiclass Classification On Iris Dataset
3 pages
2 Machine Learning
No ratings yet
2 Machine Learning
21 pages
Naive Bayes Classification
No ratings yet
Naive Bayes Classification
8 pages
Prac4 AAM
No ratings yet
Prac4 AAM
2 pages
NaiveBayesClassifier - Jupyter Notebook
No ratings yet
NaiveBayesClassifier - Jupyter Notebook
2 pages
ANN
No ratings yet
ANN
2 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
Purva Rawale - BDA Practical No 2
No ratings yet
Purva Rawale - BDA Practical No 2
9 pages
AIML Lab 3 4
No ratings yet
AIML Lab 3 4
5 pages
178 hw1
No ratings yet
178 hw1
4 pages
Iris - Regression - Jupyter Notebook
No ratings yet
Iris - Regression - Jupyter Notebook
5 pages
Part A Assignment 6
No ratings yet
Part A Assignment 6
2 pages
Lab 1 - Machine Learning with Python - ML Engineering مهم
No ratings yet
Lab 1 - Machine Learning with Python - ML Engineering مهم
10 pages
Naive Bates Classifier
No ratings yet
Naive Bates Classifier
18 pages
Exp 3 Bi 30
No ratings yet
Exp 3 Bi 30
7 pages
Assignment - 01
No ratings yet
Assignment - 01
4 pages
ML Lab 146
No ratings yet
ML Lab 146
50 pages
Prog 6
No ratings yet
Prog 6
3 pages
Data Mining and Warehousing Concepts Lab: (ITPC - 228)
No ratings yet
Data Mining and Warehousing Concepts Lab: (ITPC - 228)
6 pages
(Viral) Kamal Kaur Viral Video Original Link
No ratings yet
(Viral) Kamal Kaur Viral Video Original Link
5 pages
Naïve Bayes Classifier Algorithm
No ratings yet
Naïve Bayes Classifier Algorithm
11 pages
Lab Week 7
No ratings yet
Lab Week 7
3 pages
Practical-3 Ritesh
No ratings yet
Practical-3 Ritesh
5 pages
ML Lab
No ratings yet
ML Lab
7 pages
ML
No ratings yet
ML
8 pages
Lab 6
No ratings yet
Lab 6
4 pages
DS6BAYES
No ratings yet
DS6BAYES
2 pages
Ai/Ml Lab-4: Name: Pratik Jadhav PRN: 20190802050
No ratings yet
Ai/Ml Lab-4: Name: Pratik Jadhav PRN: 20190802050
5 pages
ML Algorithm
No ratings yet
ML Algorithm
2 pages
CBSE Class 6 Maths Practice Worksheets
100% (1)
CBSE Class 6 Maths Practice Worksheets
2 pages
ML Lab1 PGM
No ratings yet
ML Lab1 PGM
4 pages
CP4252 Machine Learning Lab Manual
No ratings yet
CP4252 Machine Learning Lab Manual
33 pages
Mixed Methods Research
No ratings yet
Mixed Methods Research
10 pages
Rate and Perception of Parents Towards The Implementation of Fatima National High School Drive
No ratings yet
Rate and Perception of Parents Towards The Implementation of Fatima National High School Drive
34 pages
U2 Direct Shear Test & Unconfined Compression Test
88% (8)
U2 Direct Shear Test & Unconfined Compression Test
34 pages
English Proficiency Test For Aviation: Set 33-Pilot
No ratings yet
English Proficiency Test For Aviation: Set 33-Pilot
13 pages
CS178 Homework #1: Problem 0: Getting Connected
No ratings yet
CS178 Homework #1: Problem 0: Getting Connected
4 pages
Attachment 14940535 2 4 - S-GATE - Presentation
No ratings yet
Attachment 14940535 2 4 - S-GATE - Presentation
14 pages
Group 4 Travel Device
No ratings yet
Group 4 Travel Device
8 pages
Type VR Vacuum Circuit Breaker Interruptor Automático Al Vacío Tipo VR Disjoncteur Sous Vide Type VR
No ratings yet
Type VR Vacuum Circuit Breaker Interruptor Automático Al Vacío Tipo VR Disjoncteur Sous Vide Type VR
113 pages
Florida Department of Children and Families Legislative Budget Request FY 2010-11
No ratings yet
Florida Department of Children and Families Legislative Budget Request FY 2010-11
419 pages
636379840590994941
100% (1)
636379840590994941
55 pages
Imo Cnew Series
No ratings yet
Imo Cnew Series
6 pages
NCR GDCE Notification 2019 English 2019
No ratings yet
NCR GDCE Notification 2019 English 2019
10 pages
Maths - Matrices - Matrices Multiplication Symmetric - Skew-Symmetric - Assingment - 9 June 2020
100% (1)
Maths - Matrices - Matrices Multiplication Symmetric - Skew-Symmetric - Assingment - 9 June 2020
2 pages
Avatar Courage - AHTS Brochure Dec 2022 (Singapore Flag)
No ratings yet
Avatar Courage - AHTS Brochure Dec 2022 (Singapore Flag)
2 pages
Template Sop 2 & 3-Sheryl A. Vicente
No ratings yet
Template Sop 2 & 3-Sheryl A. Vicente
8 pages
G2 3 1 2HowBearLostHisTail5
No ratings yet
G2 3 1 2HowBearLostHisTail5
15 pages
Đề Cương Ôn Thi CK 2 k10
No ratings yet
Đề Cương Ôn Thi CK 2 k10
9 pages
Lecture 15 - Summing Up of Part-1 (Policy) & Introduction To Housing Planning
No ratings yet
Lecture 15 - Summing Up of Part-1 (Policy) & Introduction To Housing Planning
17 pages
San Ildefonso College: Table of Specification
No ratings yet
San Ildefonso College: Table of Specification
11 pages
Ems, TCP
No ratings yet
Ems, TCP
12 pages
ARUNKUMAR K - Profama Invoice
No ratings yet
ARUNKUMAR K - Profama Invoice
2 pages
INtro To Eco
No ratings yet
INtro To Eco
5 pages
Lesson Plan: Veer Surendra Sai University of Technology
No ratings yet
Lesson Plan: Veer Surendra Sai University of Technology
2 pages
Dharma Fiber Reactive Procion Dyes
No ratings yet
Dharma Fiber Reactive Procion Dyes
1 page
Quikcalc Eplus - Esercizio 21
No ratings yet
Quikcalc Eplus - Esercizio 21
1 page
Personal Letter Exercise
No ratings yet
Personal Letter Exercise
3 pages