0% found this document useful (0 votes)

47 views6 pages

Cancer Disease Classification

This document discusses classifying cancer types using machine learning. It loads breast cancer data, splits it into training and test sets, scales the features, and trains logistic regression, decision tree, and random forest models. It evaluates the models on the test set and prints the confusion matrices and test accuracies. Finally, it uses the best model to make predictions on new test data and outputs the results.

Uploaded by

BARATH P

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

47 views6 pages

Cancer Disease Classification

Uploaded by

BARATH P

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

FACULTY INITIATIVE – SLOT-3

BARATH P
II YEAR CSE

CANCER DISEASE CLASSIFICATION

Program and Output:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

#load the data

df = pd.read_csv('/content/data.csv')
df['diagnosis'] = df['diagnosis'].replace({'M':1,'B':0})
df.head()

print("Cancer data set dimensions : {}".format(df.shape))

df.isnull().sum()

df.describe()
X = df.iloc[:, 1:31].values
Y = df.iloc[:, 31].values
# Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.25, random_state = 0)

sns.countplot(x ='diagnosis', data = df)

plt.show()
B, M = df['diagnosis'].value_counts()
print('Number of Benign: ',B)
print('Number of Malignant : ',M)

df.corr()
#Visualize the correlation
f,ax = plt.subplots(figsize=(20, 20))
sns.heatmap(df.corr(), annot = True, fmt= '.2f')
#for data scaling
from sklearn.preprocessing import StandardScaler
#for splitting dataset
from sklearn.model_selection import train_test_split
#for fitting SVM model
from sklearn.svm import SVC
#for displaying evaluation metrics
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix

#Scale the data (Feature Scaling)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.fit_transform(X_test)

#Create a function for models

def models(X_train, Y_train):

#Logistic Regression
from sklearn.linear_model import LogisticRegression
log = LogisticRegression()
log.fit(X_train, Y_train)

#Decision Tree
from sklearn.tree import DecisionTreeClassifier
tree = DecisionTreeClassifier()
tree.fit(X_train, Y_train)
#Random Forest
from sklearn.ensemble import RandomForestClassifier
forest = RandomForestClassifier()
forest.fit(X_train, Y_train)

#Print the model accuracy of training data

print('[0]Logistic Regression Training Accuracy : ',log.score(X_train, Y_train))
print('[1]Decision Tree Training Accuracy : ',tree.score(X_train, Y_train))
print('[2]Random Forest Training Accuracy : ',forest.score(X_train, Y_train))

return log, tree, forest

#Getting all the models

model = models(X_train, Y_train)

#test model accuracy on test data using confusion matrix

from sklearn.metrics import confusion_matrix
for i in range (len(model)):
print('Model :',model[i])
cm = confusion_matrix(Y_test,model[i].predict(X_test))
TP = cm[0][0]
FP = cm[0][1]
FN = cm[1][0]
TN = cm[1][1]
print(cm)
print('Testing Accuracy =',(TP + TN)/(TP + FP + FN + TN))
print()
#test our trained model on the test data
test_df = pd.read_csv('/content/data.csv')
test = test_df.drop(['id','diagnosis'],axis = 1)
test.head()
y_pred = pd.DataFrame(model[0].predict(test), columns=['diagnosis'])
final_df = pd.DataFrame({'Id': test_df['id'], 'diagnosis': y_pred['diagnosis']})
final_df

Assignment 10
No ratings yet
Assignment 10
14 pages
DWDM Lab 3
No ratings yet
DWDM Lab 3
10 pages
Meaningful Predictive Modeling Week-4 Assignment Cancer Disease Prediction
No ratings yet
Meaningful Predictive Modeling Week-4 Assignment Cancer Disease Prediction
6 pages
AI ML - Cycle 2 Programs
No ratings yet
AI ML - Cycle 2 Programs
15 pages
SUMMARY
No ratings yet
SUMMARY
16 pages
I Avaliação Parcial - 25.0 PTS - Gabarito
No ratings yet
I Avaliação Parcial - 25.0 PTS - Gabarito
9 pages
Experiment 8
No ratings yet
Experiment 8
4 pages
Preductive Modelling Assignment
No ratings yet
Preductive Modelling Assignment
3 pages
ML Lab 5
No ratings yet
ML Lab 5
2 pages
Breast Cancer Classification Using DTC
No ratings yet
Breast Cancer Classification Using DTC
1 page
Additional Program
No ratings yet
Additional Program
573 pages
Data Mining Journal 4 Kashan
No ratings yet
Data Mining Journal 4 Kashan
8 pages
ML Lab
No ratings yet
ML Lab
4 pages
ML Model Report
No ratings yet
ML Model Report
8 pages
Bagging Codes
No ratings yet
Bagging Codes
1 page
Reast Cancer Prediction Using Debt
No ratings yet
Reast Cancer Prediction Using Debt
18 pages
NitinKumar 12112147 DecisionTreeAssignment
No ratings yet
NitinKumar 12112147 DecisionTreeAssignment
3 pages
Code and Output of Cancer Detection Model
No ratings yet
Code and Output of Cancer Detection Model
13 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
Section 2
No ratings yet
Section 2
2 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
Experiment 8 ML Vtu
No ratings yet
Experiment 8 ML Vtu
4 pages
Assignment ML
No ratings yet
Assignment ML
5 pages
PYHTONPRACT
No ratings yet
PYHTONPRACT
4 pages
ML Fat
No ratings yet
ML Fat
9 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
11 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
AIH Lab2
No ratings yet
AIH Lab2
10 pages
All in One
No ratings yet
All in One
13 pages
Bacdeaf 23032025 115708 Split 1
No ratings yet
Bacdeaf 23032025 115708 Split 1
37 pages
Appendix - Complete Code Implementation
No ratings yet
Appendix - Complete Code Implementation
8 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 7
No ratings yet
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 7
23 pages
PDF To Jpeg
No ratings yet
PDF To Jpeg
7 pages
Data Mining Assignment No. 1
No ratings yet
Data Mining Assignment No. 1
7 pages
Q3-Copy1: Pandas PD Numpy NP CSV
No ratings yet
Q3-Copy1: Pandas PD Numpy NP CSV
7 pages
LAB9
No ratings yet
LAB9
3 pages
Najir Shaikh Practical 4
No ratings yet
Najir Shaikh Practical 4
4 pages
PRJ-Parkinsons Disease Prediction
No ratings yet
PRJ-Parkinsons Disease Prediction
16 pages
1 KNN - Jupyter Notebook
No ratings yet
1 KNN - Jupyter Notebook
3 pages
Prakhar - Week 5
No ratings yet
Prakhar - Week 5
8 pages
Heart Dis
No ratings yet
Heart Dis
13 pages
Experiment 8
No ratings yet
Experiment 8
14 pages
Allcodesml 2
No ratings yet
Allcodesml 2
10 pages
Decision Tree Classifier
No ratings yet
Decision Tree Classifier
3 pages
Assignment 2
No ratings yet
Assignment 2
4 pages
Machine
100% (1)
Machine
45 pages
Scikit Learn What Were Covering
No ratings yet
Scikit Learn What Were Covering
15 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Decision Tree, Random Forest
No ratings yet
Decision Tree, Random Forest
37 pages
Exp 3 121a1047 Lavanya Kurup ML
No ratings yet
Exp 3 121a1047 Lavanya Kurup ML
4 pages
AML Lab
No ratings yet
AML Lab
14 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
6 Binary Classifier
No ratings yet
6 Binary Classifier
4 pages
Experiment01 Baseline Models Accuracy
No ratings yet
Experiment01 Baseline Models Accuracy
35 pages
FB Models PDF
No ratings yet
FB Models PDF
14 pages
6 - 2 - SVMS, - Randon - Forests - and - KNN - Ipynb - Colaboratory
No ratings yet
6 - 2 - SVMS, - Randon - Forests - and - KNN - Ipynb - Colaboratory
4 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

Cancer Disease Classification

Uploaded by

Cancer Disease Classification

Uploaded by

FACULTY INITIATIVE – SLOT-3

CANCER DISEASE CLASSIFICATION

#load the data

print("Cancer data set dimensions : {}".format(df.shape))

sns.countplot(x ='diagnosis', data = df)

#Scale the data (Feature Scaling)

#Create a function for models

#Print the model accuracy of training data

return log, tree, forest

#Getting all the models

#test model accuracy on test data using confusion matrix

You might also like