0% found this document useful (0 votes)

21 views7 pages

My Code

Uploaded by

oyelekeayomide1

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views7 pages

My Code

Uploaded by

oyelekeayomide1

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

Import necessary libraries

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

From displaying all features of dataset

pd.pandas.set_option('display.max_columns', None)

# Reading Dataset:
dataset = pd.read_csv("/content/drive/MyDrive/Project Work/Kidney_data.csv")
# Top 5 records:
dataset.head()

Data Set Information

We use the following representation to collect the dataset

age - age

bp - blood pressure

sg - specific gravity

al - albumin

su - sugar

rbc - red blood cells

pc - pus cell

pcc - pus cell clumps

ba - bacteria

bgr - blood glucose random

bu - blood urea

sc - serum creatinine

sod - sodium

pot - potassium

hemo - hemoglobin

pcv - packed cell volume

wc - white blood cell count

rc - red blood cell count

htn - hypertension

dm - diabetes mellitus

cad - coronary artery disease

appet - appetite

pe - pedal edema

ane - anemia

class - class

Attribute Information:

We use 24 + class = 25 ( 11 numeric ,14 nominal)

Age(numerical) age in years

Blood Pressure(numerical) bp in mm/Hg

Specific Gravity(nominal) sg - (1.005,1.010,1.015,1.020,1.025)

Albumin(nominal) al - (0,1,2,3,4,5)

Sugar(nominal) su - (0,1,2,3,4,5)

Red Blood Cells(nominal) rbc - (normal,abnormal)

Pus Cell (nominal) pc - (normal,abnormal)

Pus Cell clumps(nominal) pcc - (present,notpresent)

Bacteria(nominal) ba - (present,notpresent)

Blood Glucose Random(numerical) bgr in mgs/dl

Blood Urea(numerical) bu in mgs/dl

Serum Creatinine(numerical) sc in mgs/dl

Sodium(numerical) sod in mEq/L

Potassium(numerical) pot in mEq/L

Hemoglobin(numerical) hemo in gms

Packed Cell Volume(numerical)

White Blood Cell Count(numerical) wc in cells/cumm

Red Blood Cell Count(numerical) rc in millions/cmm

Hypertension(nominal) htn - (yes,no)

Diabetes Mellitus(nominal) dm - (yes,no)

Coronary Artery Disease(nominal) cad - (yes,no)

Appetite(nominal) appet - (good,poor)

Pedal Edema(nominal) pe - (yes,no)

Anemia(nominal) ane - (yes,no)

Class (nominal) class - (ckd,notckd)

# Dropping unneccesary feature :

dataset = dataset.drop('id', axis=1)

# Shape of dataset:
dataset.shape

# Checking Missing (NaN) Values:

dataset.isnull().sum()

# Description:
dataset.describe()

dataset.columns

dataset.dtypes

Replacing Categorical values with numbers:

1. rbc

dataset['rbc'].value_counts()

dataset['rbc'] = dataset['rbc'].replace(to_replace = {'normal' : 0, 'abnormal' : 1})

2. pc

dataset['pc'].value_counts()
dataset['pc'] = dataset['pc'].replace(to_replace = {'normal' : 0, 'abnormal' : 1})

3. pcc

dataset['pcc'].value_counts()

dataset['pcc'] = dataset['pcc'].replace(to_replace = {'notpresent':0,'present':1})

4. ba

dataset['ba'].value_counts()

dataset['ba'] = dataset['ba'].replace(to_replace = {'notpresent':0,'present':1})

5. htn

dataset['htn'].value_counts()

dataset['htn'] = dataset['htn'].replace(to_replace = {'yes' : 1, 'no' : 0})

6. dm

dataset['dm'].value_counts()

dataset['dm'] = dataset['dm'].replace(to_replace = {'\tyes':'yes', ' yes':'yes', '\tno':'no'})

dataset['dm'] = dataset['dm'].replace(to_replace = {'yes' : 1, 'no' : 0})

7. cad

dataset['cad'].value_counts()

dataset['cad'] = dataset['cad'].replace(to_replace = {'\tno':'no'})

dataset['cad'] = dataset['cad'].replace(to_replace = {'yes' : 1, 'no' : 0})

8. appet

dataset['appet'].unique()

dataset['appet'] = dataset['appet'].replace(to_replace={'good':1,'poor':0,'no':np.nan})

9. pe

dataset['pe'].value_counts()

dataset['pe'] = dataset['pe'].replace(to_replace = {'yes' : 1, 'no' : 0})

10. ane

dataset['ane'].value_counts()
dataset['ane'] = dataset['ane'].replace(to_replace = {'yes' : 1, 'no' : 0})

11. classification

dataset['classification'].value_counts()

dataset['classification'] = dataset['classification'].replace(to_replace={'ckd\t':'ckd'})

dataset["classification"] = [1 if i == "ckd" else 0 for i in dataset["classification"]]

dataset.head()

# Datatypes:
dataset.dtypes

Converting Object values into Numeric values:

dataset['pcv'] = pd.to_numeric(dataset['pcv'], errors='coerce')

dataset['wc'] = pd.to_numeric(dataset['wc'], errors='coerce')
dataset['rc'] = pd.to_numeric(dataset['rc'], errors='coerce')

# Datatypes:
dataset.dtypes

# Description:
dataset.describe()

# Checking Missing (NaN) Values:

dataset.isnull().sum().sort_values(ascending=False)

Handling Null Values:

There is Outliers present in our dataset so We fill NaN values with Median.

dataset.columns

features = ['age', 'bp', 'sg', 'al', 'su', 'rbc', 'pc', 'pcc', 'ba', 'bgr', 'bu',
'sc', 'sod', 'pot', 'hemo', 'pcv', 'wc', 'rc', 'htn', 'dm', 'cad',
'appet', 'pe', 'ane']

for feature in features:

dataset[feature] = dataset[feature].fillna(dataset[feature].median())

dataset.isnull().any().sum()

Heatmap

plt.figure(figsize=(24,14))
sns.heatmap(dataset.corr(), annot=True, cmap='YlGnBu')
plt.show()

1. We clearly see that 'pcv' and 'hemo' feature has 85% multicollinearity
2. So we remove one of the feature. i.e pcv

dataset.drop('pcv', axis=1, inplace=True)

dataset.head()
# Target feature:
sns.countplot(x='classification', data=dataset)

# Independent and Dependent Feature:

X = dataset.iloc[:, :-1]
y = dataset.iloc[:, -1]

X.head()

# Feature Importance:
from sklearn.ensemble import ExtraTreesClassifier
import matplotlib.pyplot as plt
model=ExtraTreesClassifier()
model.fit(X,y)

plt.figure(figsize=(8,6))
ranked_features=pd.Series(model.feature_importances_,index=X.columns)
ranked_features.nlargest(24).plot(kind='barh')
plt.show()

We take top 8 feature only.

ranked_features.nlargest(8).index

X = dataset[['sg', 'htn', 'hemo', 'dm', 'al', 'appet', 'rc', 'pc']]

X.head()

X.tail()

y.head()

# Train Test Split:

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y, test_size=0.3, random_state=33)

print(X_train.shape)
print(X_test.shape)

keyboard_arrow_down Random Forest Algorithm

# Importing Performance Metrics:
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
import seaborn as sns
from sklearn.metrics import classification_report
from sklearn import metrics

# Initialzing empty lists to append all model's name and corresponding name
acc = []
model = []
# RandomForestClassifier:
from sklearn.ensemble import RandomForestClassifier
RandomForest = RandomForestClassifier()
RandomForest = RandomForest.fit(X_train,y_train)

# Predictions:
y_pred_rf = RandomForest.predict(X_test)

# Performance:
accuracy_rf = accuracy_score(y_test, y_pred_rf)

print('Accuracy:', accuracy_score(y_test,y_pred_rf))
print(confusion_matrix(y_test,y_pred_rf))
print(classification_report(y_test, y_pred_rf))

rf_score= RandomForest.score(X_train,y_train)
report = classification_report(y_test, y_pred_rf, output_dict=True)
df = pd.DataFrame(report).transpose()
df = df.drop(['0', '1', 'accuracy', 'weighted avg'], axis=0)
df = df.drop('support', axis=1)
df.rename(index={"macro avg": "Random Forest"}, inplace=True)
df['accuracy'] = round((rf_score * 100), 2)

x = metrics.accuracy_score(y_test, y_pred_rf)

acc.append(x)
model.append('RF')

#Confusion Matrix
print(confusion_matrix(y_test, y_pred_rf))
df = {'y_Actual': y_test, 'y_Predicted': y_pred_rf}
df1 = pd.DataFrame(df, columns = ['y_Actual', 'y_Predicted'])
clf_confusion_matrix = pd.crosstab(df['y_Predicted'], df['y_Actual'], rownames = ['Predicted'], colnames = ['Actual'])
sns.heatmap(clf_confusion_matrix, annot=True)

keyboard_arrow_down Support Vector Machine

from sklearn.svm import SVC
svm= SVC(kernel = 'linear', random_state = 0)
svm=svm.fit(X_train, y_train)

# Predictions:
y_pred_svm = svm.predict(X_test)

# Performance:
accuracy_svm = accuracy_score(y_test, y_pred_svm)

print('Accuracy:', accuracy_score(y_test,y_pred_svm))
print(confusion_matrix(y_test,y_pred_svm))
print(classification_report(y_test,y_pred_svm))

svm_score= svm.score(X_train,y_train)
report1 = classification_report(y_test, y_pred_svm, output_dict=True)
df1 = pd.DataFrame(report).transpose()
df1 = df1.drop(['0', '1', 'accuracy', 'weighted avg'], axis=0)
df1 = df1.drop('support', axis=1)
df1.rename(index={"macro avg": "Support Vector Machine"}, inplace=True)
df1['accuracy'] = round((svm_score * 100), 2)

x = metrics.accuracy_score(y_test, y_pred_svm)
acc.append(x)
model.append('SVM')

#Confusion Matrix
print(confusion_matrix(y_test, y_pred_svm))
df = {'y_Actual': y_test, 'y_Predicted': y_pred_svm}
df1 = pd.DataFrame(df, columns = ['y_Actual', 'y_Predicted'])
clf_confusion_matrix = pd.crosstab(df['y_Predicted'], df['y_Actual'], rownames = ['Predicted'], colnames = ['Actual'])
sns.heatmap(clf_confusion_matrix, annot=True)
keyboard_arrow_down Accuracy Comparison
plt.figure(figsize=[10,5],dpi = 100)
plt.title('Accuracy Comparison')
plt.xlabel('Accuracy')
plt.ylabel('Algorithm')
sns.barplot(x = acc,y = model,palette='dark')

from sklearn.metrics import f1_score

from sklearn.metrics import recall_score
from sklearn.metrics import precision_score

# Calculate F1-score for SVM and Random Forest

f1_svm = f1_score(y_test, y_pred_svm)
f1_rf = f1_score(y_test, y_pred_rf)

# Calculate Recall for SVM and Random Forest

recall_svm = recall_score(y_test, y_pred_svm)
recall_rf = recall_score(y_test, y_pred_rf)

# Calculate Precision for SVM and Random Forest

precision_svm = precision_score(y_test, y_pred_svm)
precision_rf = precision_score(y_test, y_pred_rf)

# Create a DataFrame for better visualization

metrics_data = {
'Model': ['SVM', 'Random Forest'],
'Accuracy': [accuracy_svm, accuracy_rf],
'F1-Score': [f1_svm, f1_rf],
'Recall': [recall_svm, recall_rf],
'Precision': [precision_svm, precision_rf]
}

metrics_df = pd.DataFrame(metrics_data)

# Plotting
sns.set(style="whitegrid")
plt.figure(figsize=(8, 6))

# Bar plot for Accuracy

plt.subplot(2, 2, 1)
sns.barplot(x='Model', y='Accuracy', data=metrics_df, palette='viridis')
plt.title('Accuracy Comparison')

# Bar plot for F1-Score

plt.subplot(2, 2, 2)
sns.barplot(x='Model', y='F1-Score', data=metrics_df, palette='magma')
plt.title('F1-Score Comparison')

# Bar plot for Recall-Score

plt.subplot(2, 2, 3)
sns.barplot(x='Model', y='Recall', data=metrics_df, palette='mako')
plt.title('Recall-Score Comparison')

# Bar plot for Precision-Score

plt.subplot(2, 2, 4)
sns.barplot(x='Model', y='Precision', data=metrics_df, palette='inferno')
plt.title('Precision-Score Comparison')

plt.tight_layout()
plt.show()

Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
No ratings yet
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
12 pages
Hcin620 m6 Lab6 Hanifahmutesi-Finalproject
No ratings yet
Hcin620 m6 Lab6 Hanifahmutesi-Finalproject
5 pages
Diabetes Prediction 1704256341
No ratings yet
Diabetes Prediction 1704256341
17 pages
LAB8 LogisticReg HeartDisease
No ratings yet
LAB8 LogisticReg HeartDisease
31 pages
Razi AML Assignment2
No ratings yet
Razi AML Assignment2
18 pages
Eda-Ml-Decision-Tree - Ipynb - Colab
No ratings yet
Eda-Ml-Decision-Tree - Ipynb - Colab
20 pages
Healthcare-Project-Simplilearn - Week1
No ratings yet
Healthcare-Project-Simplilearn - Week1
6 pages
Capstone Project 2
No ratings yet
Capstone Project 2
15 pages
Project 190
No ratings yet
Project 190
6 pages
Diabetes EDA and Kears Modeling
No ratings yet
Diabetes EDA and Kears Modeling
26 pages
ML Practical 04
No ratings yet
ML Practical 04
20 pages
ADS Exp-1
No ratings yet
ADS Exp-1
3 pages
Apply Logistic Regression Model Techniques To Predict Data On Any Dataset
No ratings yet
Apply Logistic Regression Model Techniques To Predict Data On Any Dataset
5 pages
C2M4 - Assignment: 1 Cox Proportional Hazards and Random Survival Forests
No ratings yet
C2M4 - Assignment: 1 Cox Proportional Hazards and Random Survival Forests
18 pages
Logistic Regression
No ratings yet
Logistic Regression
12 pages
Logistic Regression 205
No ratings yet
Logistic Regression 205
8 pages
Project 10 Movie Recommendation - Ipynb - Colaboratory
No ratings yet
Project 10 Movie Recommendation - Ipynb - Colaboratory
6 pages
KNN For Classification
No ratings yet
KNN For Classification
5 pages
Heart Disease Indicator Prediction Model
No ratings yet
Heart Disease Indicator Prediction Model
17 pages
Data Pre-Processing
No ratings yet
Data Pre-Processing
22 pages
Mod 4
No ratings yet
Mod 4
2 pages
AML Sessional 1 Students
No ratings yet
AML Sessional 1 Students
16 pages
Documentation Code
No ratings yet
Documentation Code
20 pages
Exp 4
No ratings yet
Exp 4
4 pages
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
No ratings yet
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
71 pages
45 AIML Practical 09
No ratings yet
45 AIML Practical 09
6 pages
Personalized Healthcare Recommendations Unified Mentor Internship Project
No ratings yet
Personalized Healthcare Recommendations Unified Mentor Internship Project
3 pages
Binary Prediction of Smoker Status Using Bio-Signals
No ratings yet
Binary Prediction of Smoker Status Using Bio-Signals
20 pages
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
No ratings yet
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
8 pages
Heart - Disease - 1.ipynb - Colaboratory
No ratings yet
Heart - Disease - 1.ipynb - Colaboratory
9 pages
Anemia Code
No ratings yet
Anemia Code
33 pages
Experiment 5
No ratings yet
Experiment 5
9 pages
Project
No ratings yet
Project
8 pages
Diabetes
No ratings yet
Diabetes
10 pages
ML Data Preprocessing in Python
No ratings yet
ML Data Preprocessing in Python
9 pages
Ide To 6 Classification Algorithms
No ratings yet
Ide To 6 Classification Algorithms
34 pages
Natural Language Understanding
No ratings yet
Natural Language Understanding
14 pages
Ass 1 Dsbda
No ratings yet
Ass 1 Dsbda
8 pages
Logistic - Ipynb - Colaboratory
No ratings yet
Logistic - Ipynb - Colaboratory
6 pages
Medical Insurance Analysis ??
No ratings yet
Medical Insurance Analysis ??
17 pages
Medical Cost Analysis
No ratings yet
Medical Cost Analysis
17 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
42 pages
ML Practical 3D
No ratings yet
ML Practical 3D
4 pages
lab - 8 - - (6) عفان عبدالله احمد - التكليف -
No ratings yet
lab - 8 - - (6) عفان عبدالله احمد - التكليف -
18 pages
17.11.24 - Jupyter Notebook - Doc
No ratings yet
17.11.24 - Jupyter Notebook - Doc
6 pages
Cardio Screen RF
100% (1)
Cardio Screen RF
27 pages
Aids
No ratings yet
Aids
88 pages
ML Proj Diabetes
No ratings yet
ML Proj Diabetes
51 pages
Heart Failure Prediction
100% (1)
Heart Failure Prediction
41 pages
24MCB0021 VL2024250505870 Ast03
No ratings yet
24MCB0021 VL2024250505870 Ast03
4 pages
Baseline - Ipynb - Colab
No ratings yet
Baseline - Ipynb - Colab
5 pages
# Load Packages: Pandas Pandas PD PD Numpy Numpy NP NP
No ratings yet
# Load Packages: Pandas Pandas PD PD Numpy Numpy NP NP
17 pages
Diabetes
No ratings yet
Diabetes
97 pages
BDA Project Codes
No ratings yet
BDA Project Codes
20 pages
Dovdush KN-305 Lab3
No ratings yet
Dovdush KN-305 Lab3
2 pages
Ai in HC - 2
No ratings yet
Ai in HC - 2
9 pages
Ml4.ipynb - Colab
No ratings yet
Ml4.ipynb - Colab
3 pages
Random Forest - US - Heart - Patients - Class
100% (1)
Random Forest - US - Heart - Patients - Class
24 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Module 5 Mathematical Tools: Determinants and Matrices: True/False
No ratings yet
Module 5 Mathematical Tools: Determinants and Matrices: True/False
21 pages
Paper Zeping
No ratings yet
Paper Zeping
17 pages
Aero Linear Algebra and Calculus Lecture Notes
No ratings yet
Aero Linear Algebra and Calculus Lecture Notes
188 pages
Lecture 3 Slides
No ratings yet
Lecture 3 Slides
60 pages
BMS Project
No ratings yet
BMS Project
18 pages
Lecture 4, Vectors and Matrices-1
No ratings yet
Lecture 4, Vectors and Matrices-1
15 pages
Chapter 3 - Matrices Revision Notes
No ratings yet
Chapter 3 - Matrices Revision Notes
10 pages
Numpy For Matlab User
No ratings yet
Numpy For Matlab User
17 pages
MIT6 050JS08 Chapter3
No ratings yet
MIT6 050JS08 Chapter3
16 pages
LAB1
No ratings yet
LAB1
6 pages
Linear Algebra
No ratings yet
Linear Algebra
35 pages
MATH0047 Lecture Notes 1
No ratings yet
MATH0047 Lecture Notes 1
56 pages
Highest Weightage Chapters Maths
No ratings yet
Highest Weightage Chapters Maths
555 pages
A Brief Introduction To Polar Codes: Supplemental Material For Advanced Channel Coding Henry D. Pfister April 21st, 2014
No ratings yet
A Brief Introduction To Polar Codes: Supplemental Material For Advanced Channel Coding Henry D. Pfister April 21st, 2014
12 pages
For More Important Questions Visit:: Matrices and Determinants
No ratings yet
For More Important Questions Visit:: Matrices and Determinants
16 pages
Gde 333 Homework 1 (Rev)
No ratings yet
Gde 333 Homework 1 (Rev)
31 pages
Lec 18
No ratings yet
Lec 18
12 pages
Mathematics Xii Assessment Scheme 2024 25
No ratings yet
Mathematics Xii Assessment Scheme 2024 25
8 pages
MA111 Lec3 S2 2019
No ratings yet
MA111 Lec3 S2 2019
20 pages
Mathematics Notes and Formula For Class 12 Chapter 3. Matrices
No ratings yet
Mathematics Notes and Formula For Class 12 Chapter 3. Matrices
11 pages
Trans Array (JAVA PROGRAM PDF
No ratings yet
Trans Array (JAVA PROGRAM PDF
4 pages
Chapter 3 - Matrix Algebra
No ratings yet
Chapter 3 - Matrix Algebra
13 pages
COMPUTER AIDED ANALYSIS AND MODELLING Lectures
100% (1)
COMPUTER AIDED ANALYSIS AND MODELLING Lectures
41 pages
10-MAT U3Q MATRIX Kaviexpress
No ratings yet
10-MAT U3Q MATRIX Kaviexpress
2 pages
Numerical Methods For Physicists: Volker Hohmann Institute of Physics University of Oldenburg, Germany
No ratings yet
Numerical Methods For Physicists: Volker Hohmann Institute of Physics University of Oldenburg, Germany
90 pages
Homework 1 Key
100% (1)
Homework 1 Key
7 pages
ArrayList Notes
No ratings yet
ArrayList Notes
50 pages
Linear Algebra Module
No ratings yet
Linear Algebra Module
38 pages
Most Important For JEE
No ratings yet
Most Important For JEE
175 pages
ALGEBRA - Notes (Example and Practice Questions)
No ratings yet
ALGEBRA - Notes (Example and Practice Questions)
19 pages

My Code

Uploaded by

My Code

Uploaded by

Import necessary libraries

From displaying all features of dataset

Data Set Information

We use the following representation to collect the dataset

rbc - red blood cells

pcc - pus cell clumps

bgr - blood glucose random

pcv - packed cell volume

wc - white blood cell count

rc - red blood cell count

cad - coronary artery disease

We use 24 + class = 25 ( 11 numeric ,14 nominal)

Age(numerical) age in years

Blood Pressure(numerical) bp in mm/Hg

Red Blood Cells(nominal) rbc - (normal,abnormal)

Pus Cell (nominal) pc - (normal,abnormal)

Pus Cell clumps(nominal) pcc - (present,notpresent)

Blood Glucose Random(numerical) bgr in mgs/dl

Blood Urea(numerical) bu in mgs/dl

Serum Creatinine(numerical) sc in mgs/dl

Sodium(numerical) sod in mEq/L

Potassium(numerical) pot in mEq/L

Hemoglobin(numerical) hemo in gms

Packed Cell Volume(numerical)

White Blood Cell Count(numerical) wc in cells/cumm

Red Blood Cell Count(numerical) rc in millions/cmm

Hypertension(nominal) htn - (yes,no)

Diabetes Mellitus(nominal) dm - (yes,no)

Coronary Artery Disease(nominal) cad - (yes,no)

Appetite(nominal) appet - (good,poor)

Pedal Edema(nominal) pe - (yes,no)

Anemia(nominal) ane - (yes,no)

Class (nominal) class - (ckd,notckd)

# Dropping unneccesary feature :

# Checking Missing (NaN) Values:

Replacing Categorical values with numbers:

dataset['rbc'] = dataset['rbc'].replace(to_replace = {'normal' : 0, 'abnormal' : 1})

dataset['pcc'] = dataset['pcc'].replace(to_replace = {'notpresent':0,'present':1})

dataset['ba'] = dataset['ba'].replace(to_replace = {'notpresent':0,'present':1})

dataset['htn'] = dataset['htn'].replace(to_replace = {'yes' : 1, 'no' : 0})

dataset['dm'] = dataset['dm'].replace(to_replace = {'\tyes':'yes', ' yes':'yes', '\tno':'no'})

dataset['dm'] = dataset['dm'].replace(to_replace = {'yes' : 1, 'no' : 0})

dataset['cad'] = dataset['cad'].replace(to_replace = {'\tno':'no'})

dataset['cad'] = dataset['cad'].replace(to_replace = {'yes' : 1, 'no' : 0})

dataset['pe'] = dataset['pe'].replace(to_replace = {'yes' : 1, 'no' : 0})

dataset["classification"] = [1 if i == "ckd" else 0 for i in dataset["classification"]]

Converting Object values into Numeric values:

dataset['pcv'] = pd.to_numeric(dataset['pcv'], errors='coerce')

# Checking Missing (NaN) Values:

Handling Null Values:

for feature in features:

dataset.drop('pcv', axis=1, inplace=True)

# Independent and Dependent Feature:

We take top 8 feature only.

X = dataset[['sg', 'htn', 'hemo', 'dm', 'al', 'appet', 'rc', 'pc']]

# Train Test Split:

keyboard_arrow_down Random Forest Algorithm

keyboard_arrow_down Support Vector Machine

from sklearn.metrics import f1_score

# Calculate F1-score for SVM and Random Forest

# Calculate Recall for SVM and Random Forest

# Calculate Precision for SVM and Random Forest

# Create a DataFrame for better visualization

# Bar plot for Accuracy

# Bar plot for F1-Score

# Bar plot for Recall-Score

# Bar plot for Precision-Score

You might also like