Data Mining Project Using Naive Bayes

The document is a student assignment submission for a Data Warehousing and Data Mining course. It discusses using the Naive Bayes classification algorithm to predict whether patients will have a stroke based on attributes like gender, age, and smoking status from a dataset containing over 5,000 records obtained from Kaggle. The student performs preprocessing like splitting the data into training and test sets, trains a Naive Bayes model on the training set which achieves an accuracy of 90.7697%, and tests it on the held-out test set for an accuracy of 92.4658%.

Uploaded by

Mr SHINIGAMI

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views10 pages

Data Mining Project Using Naive Bayes

Uploaded by

Mr SHINIGAMI

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 10

DWDM Midterm Assignment

Course: Data Warehousing & Data Mining

Submitted by:
ID:
Section:
To
Course Teacher:

Date of Submission:

American International University-Bangladesh (AIUB)

I am selecting Naive Bayes classification because,
1. This algorithm works very fast and can easily predict the class of a test
dataset.
2. We can use it to solve multi-class prediction problems as it’s quite useful
with them.
3. Naive Bayes classifier performs better than other models with less training
data if the assumption of independence of features holds.
4. If we have categorical input variables, the Naive Bayes algorithm performs
exceptionally well in comparison to numerical variables.

I have selected this dataset from Kaggle website. This dataset is used to
predict whether a patient is likely to get stroke based on the input
parameters like gender, age, and smoking status. Each row in the data
provides relevant information about the patient.
There are,
Attribute: 9
 ID
 Gender
 Age
 Ever Married
 Work Type
 Residence
 Avg Glucose Level
 Smoking Status
 Stroke
Stroke represents class attribute.

Total instance: 5110

Processes in WEKA:
Original Dataset:
Training Dataset:

Here are the data that were selected by using WEKA,

60% of instances were taken in this step.
Data of training set,

By using Naïve Bayes my accuracy of this training set is 90.7697%,

Test Dataset:
Here are the rest half of 40% data that were not taken during training
set,
By using Naïve Bayes my accuracy of this test set is 92.4658%,
Cross Validation:
By using Naïve Bayes my accuracy of this Cross Validation is 91.7808%,
Predicted Data:
Here is the prediction from our data,

Brain Stroke Shiva
100% (1)
Brain Stroke Shiva
21 pages
Major p3
No ratings yet
Major p3
24 pages
DSC652 Project-Stroke Prediction System
No ratings yet
DSC652 Project-Stroke Prediction System
22 pages
Classification Data Mining
No ratings yet
Classification Data Mining
84 pages
22mbada303 Module 5
No ratings yet
22mbada303 Module 5
61 pages
Bayes Classifier
No ratings yet
Bayes Classifier
20 pages
Final.52 Plag.
No ratings yet
Final.52 Plag.
48 pages
Naive Bayes Algorithm
No ratings yet
Naive Bayes Algorithm
46 pages
Nayes Bayes Classifier
No ratings yet
Nayes Bayes Classifier
46 pages
Pgm5 With Output
No ratings yet
Pgm5 With Output
13 pages
Data Mining Classification: Naïve Bayes Classifier Lecture Notes For Chapter 4 &5
No ratings yet
Data Mining Classification: Naïve Bayes Classifier Lecture Notes For Chapter 4 &5
26 pages
Enhancing Stroke Prediction Using The Waikato Environment For Knowledge Analysis
No ratings yet
Enhancing Stroke Prediction Using The Waikato Environment For Knowledge Analysis
8 pages
Weka Project1 Sajeena
No ratings yet
Weka Project1 Sajeena
14 pages
AI and ML Lab Manual
No ratings yet
AI and ML Lab Manual
29 pages
20210913115710D3708 - Session 09-12 Bayes Classifier
No ratings yet
20210913115710D3708 - Session 09-12 Bayes Classifier
30 pages
Lecture Slide 03 - Bayesian Classifier - Summer 2023
No ratings yet
Lecture Slide 03 - Bayesian Classifier - Summer 2023
23 pages
Update Ai 2
No ratings yet
Update Ai 2
22 pages
Rapport
No ratings yet
Rapport
21 pages
Lecturer3 - Naive Bayes Classifier
No ratings yet
Lecturer3 - Naive Bayes Classifier
23 pages
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Data Mining
No ratings yet
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Data Mining
16 pages
Group Assessment
No ratings yet
Group Assessment
20 pages
Diabetes Classification Report
No ratings yet
Diabetes Classification Report
17 pages
Bayesian Classification: Dr. Navneet Goyal BITS, Pilani
No ratings yet
Bayesian Classification: Dr. Navneet Goyal BITS, Pilani
35 pages
Second Progres Report
No ratings yet
Second Progres Report
10 pages
BANASD603
No ratings yet
BANASD603
11 pages
Bayesian Classification: Dr. Navneet Goyal BITS, Pilani
No ratings yet
Bayesian Classification: Dr. Navneet Goyal BITS, Pilani
35 pages
DWM Exp4 A49
No ratings yet
DWM Exp4 A49
11 pages
9.3. Classification - Bayes
No ratings yet
9.3. Classification - Bayes
18 pages
Disease Pred
No ratings yet
Disease Pred
13 pages
Camera Ready
No ratings yet
Camera Ready
5 pages
Purnomo 2020 J. Phys. Conf. Ser. 1511 012001
No ratings yet
Purnomo 2020 J. Phys. Conf. Ser. 1511 012001
7 pages
DAL Assignment 3 Endsem
No ratings yet
DAL Assignment 3 Endsem
7 pages
DAL Assignment 3
No ratings yet
DAL Assignment 3
7 pages
Ai 5
No ratings yet
Ai 5
7 pages
PBL Big Data
No ratings yet
PBL Big Data
14 pages
Lecturer3 - Naive Bayes Classifier
No ratings yet
Lecturer3 - Naive Bayes Classifier
23 pages
I. Bstract Iii. ATA ET: Heart Disease Prediction Using Weka Tools On Machine Learning Anshu Garg, Jasleen Kaur
No ratings yet
I. Bstract Iii. ATA ET: Heart Disease Prediction Using Weka Tools On Machine Learning Anshu Garg, Jasleen Kaur
9 pages
36504-Article Text-88429-2-10-20200111
No ratings yet
36504-Article Text-88429-2-10-20200111
8 pages
Stroke Prediction Using Machine Learning
No ratings yet
Stroke Prediction Using Machine Learning
8 pages
Heart Disease Prediction Using Data Mining
No ratings yet
Heart Disease Prediction Using Data Mining
3 pages
IEEE Conference Team ATOM
No ratings yet
IEEE Conference Team ATOM
5 pages
Class-Work-Naive-Bayes (21-10-2024)
No ratings yet
Class-Work-Naive-Bayes (21-10-2024)
5 pages
Comparative Study of Heart Disease Prediction Using Machine Learning Algorithms
No ratings yet
Comparative Study of Heart Disease Prediction Using Machine Learning Algorithms
6 pages
Lab 03
No ratings yet
Lab 03
10 pages
10 1109@iccubea 2018 8697439
No ratings yet
10 1109@iccubea 2018 8697439
6 pages
A5 PDF
No ratings yet
A5 PDF
9 pages
An Empirical Study of The Naive Bayes Classifier
No ratings yet
An Empirical Study of The Naive Bayes Classifier
7 pages
Stroke Prediction Analysis
No ratings yet
Stroke Prediction Analysis
5 pages
Heart Disease Prediction System Using Naive Bayes: Dhanashree S. Medhekar, Mayur P. Bote, Shruti D. Deshmukh
No ratings yet
Heart Disease Prediction System Using Naive Bayes: Dhanashree S. Medhekar, Mayur P. Bote, Shruti D. Deshmukh
5 pages
LAB08 Bayes Theory
No ratings yet
LAB08 Bayes Theory
4 pages
Assignment No 2
No ratings yet
Assignment No 2
5 pages
Safari
No ratings yet
Safari
6 pages
Framework For Classifying Clinical Datasets Using Genetic Algorithm, Coevolution and Neural Network
No ratings yet
Framework For Classifying Clinical Datasets Using Genetic Algorithm, Coevolution and Neural Network
5 pages
FP Report - Group 2
No ratings yet
FP Report - Group 2
4 pages
Prediction Diabetic NBayes
No ratings yet
Prediction Diabetic NBayes
3 pages
2022-KIU-BS2363 12842 1750182854 pKFgotsmWV Attachment
No ratings yet
2022-KIU-BS2363 12842 1750182854 pKFgotsmWV Attachment
4 pages