0% found this document useful (0 votes)

129 views4 pages

Diabetes Prediction - Logistic Regression - Jupyter Notebook

This document summarizes code for performing machine learning on a diabetes dataset using logistic regression. It loads data, splits it into training and test sets, standardizes the features, fits logistic regression models with and without standardization, calculates accuracy scores on the test sets, generates a correlation heatmap, and plots a confusion matrix. The standardized data achieves a slightly higher accuracy score than the non-standardized data.

Uploaded by

saravanakumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

129 views4 pages

Diabetes Prediction - Logistic Regression - Jupyter Notebook

Uploaded by

saravanakumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

In

[1]:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix,accuracy_score, plot_co
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler

In [2]:

data = pd.read_csv('diabetes.csv')
data.head()

Out[2]:

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction

0 6 148 72 35 0 33.6 0.627

1 1 85 66 29 0 26.6 0.35

2 8 183 64 0 0 23.3 0.672

3 1 89 66 23 94 28.1 0.167

4 0 137 40 35 168 43.1 2.288

In [3]:

data.groupby('Outcome').mean()

Out[3]:

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI Diab

Outcome

0 3.298000 109.980000 68.184000 19.664000 68.792000 30.304200

1 4.865672 141.257463 70.824627 22.164179 100.335821 35.142537

In [4]:

X=data.drop(columns='Outcome',axis=1)
y=data['Outcome']
print(X.shape,y.shape)

(768, 8) (768,)

The standard score of a sample x is calculated as:

z = (x - u) / s

where u is the mean of the training samples or zero if with_mean=False, and s is the standard deviation
of the training samples or one if with_std=False.

In [5]:

scalar=StandardScaler()
X_standard=scalar.fit_transform(X)
print(X_standard)

[[ 0.63994726 0.84832379 0.14964075 ... 0.20401277 0.46849198

1.4259954 ]

[-0.84488505 -1.12339636 -0.16054575 ... -0.68442195 -0.36506078

-0.19067191]

[ 1.23388019 1.94372388 -0.26394125 ... -1.10325546 0.60439732

-0.10558415]

...

[ 0.3429808 0.00330087 0.14964075 ... -0.73518964 -0.68519336

-0.27575966]

[-0.84488505 0.1597866 -0.47073225 ... -0.24020459 -0.37110101

1.17073215]

[-0.84488505 -0.8730192 0.04624525 ... -0.20212881 -0.47378505

-0.87137393]]

In [6]:

n,y_test=train_test_split(X,y,random_state=2)
andard_test,y_standard_train,y_standard_test=train_test_split(X_standard,y,random_state=2)

In [7]:

lr=LogisticRegression()
lr_standard=LogisticRegression()

In [8]:

lr.fit(X_train,y_train)
lr_standard.fit(X_standard_train,y_standard_train)

C:\Users\SUPER\anaconda3\lib\site-packages\sklearn\linear_model\_logistic.p
y:762: ConvergenceWarning: lbfgs failed to converge (status=1):

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:

https://scikit-learn.org/stable/modules/preprocessing.html (https://scik
it-learn.org/stable/modules/preprocessing.html)

Please also refer to the documentation for alternative solver options:

https://scikit-learn.org/stable/modules/linear_model.html#logistic-regre
ssion (https://scikit-learn.org/stable/modules/linear_model.html#logistic-re
gression)

n_iter_i = _check_optimize_result(

Out[8]:

LogisticRegression()
In [9]:

y_pred = lr.predict(X_test)
y_standard_pred = lr_standard.predict(X_standard_test)
print(accuracy_score(y_test,y_pred))
print(accuracy_score(y_test,y_standard_pred))

0.7604166666666666

0.765625

In [10]:

plt.figure(dpi=150)
sns.heatmap(data.corr(),annot=True)

Out[10]:

<AxesSubplot:>
In [11]:

plot_confusion_matrix(lr, X_test, y_test, display_labels=['Diabetic', 'Non-diabetic'],)

Out[11]:

<sklearn.metrics._plot.confusion_matrix.ConfusionMatrixDisplay at 0x22b8a65d
4f0>

In [ ]:

Lecture2-Supervised-Learning Slides
No ratings yet
Lecture2-Supervised-Learning Slides
56 pages
Diabetic Nephropathy
100% (2)
Diabetic Nephropathy
198 pages
Fds 1
No ratings yet
Fds 1
44 pages
COMP5318
No ratings yet
COMP5318
42 pages
Linear Merged Pagenumber
No ratings yet
Linear Merged Pagenumber
48 pages
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
No ratings yet
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
71 pages
Diabetes and Ocular Disease PDF
100% (1)
Diabetes and Ocular Disease PDF
513 pages
ProbList10 MOI SLN
No ratings yet
ProbList10 MOI SLN
25 pages
Omnipod 5 User Guide
No ratings yet
Omnipod 5 User Guide
516 pages
Pythone Code For Predicting Diabetes Using ML
No ratings yet
Pythone Code For Predicting Diabetes Using ML
18 pages
ML Lab Exp
No ratings yet
ML Lab Exp
7 pages
Step 1
No ratings yet
Step 1
10 pages
Binary Prediction of Smoker Status Using Bio-Signals
No ratings yet
Binary Prediction of Smoker Status Using Bio-Signals
20 pages
222 Diabetes Final
100% (1)
222 Diabetes Final
61 pages
ML Manual Final
No ratings yet
ML Manual Final
35 pages
Data Science Practical 9
No ratings yet
Data Science Practical 9
6 pages
Diabetes Mellitus in Children
No ratings yet
Diabetes Mellitus in Children
98 pages
ML Practical 3D
No ratings yet
ML Practical 3D
4 pages
Project 10 Movie Recommendation - Ipynb - Colaboratory
No ratings yet
Project 10 Movie Recommendation - Ipynb - Colaboratory
6 pages
Data Pre-Processing
No ratings yet
Data Pre-Processing
22 pages
C2M4 - Assignment: 1 Cox Proportional Hazards and Random Survival Forests
No ratings yet
C2M4 - Assignment: 1 Cox Proportional Hazards and Random Survival Forests
18 pages
Rapport
No ratings yet
Rapport
21 pages
SVM Diabetes
No ratings yet
SVM Diabetes
4 pages
Practical Guide To Diabetes Management in Ramadhan
100% (1)
Practical Guide To Diabetes Management in Ramadhan
44 pages
Report - SVM
No ratings yet
Report - SVM
13 pages
Ml4.ipynb - Colab
No ratings yet
Ml4.ipynb - Colab
3 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
5 pages
مختار النعيري - The Course Work Submission
No ratings yet
مختار النعيري - The Course Work Submission
31 pages
Null 1
No ratings yet
Null 1
2 pages
utf-8''C2M1 Assignment
No ratings yet
utf-8''C2M1 Assignment
24 pages
Logidtic Regression ASSIGNMENT
No ratings yet
Logidtic Regression ASSIGNMENT
13 pages
The Data Science Workshop: A New, Interactive Approach to Learning Data Science
From Everand
The Data Science Workshop: A New, Interactive Approach to Learning Data Science
Anthony So
No ratings yet
23UCC554
No ratings yet
23UCC554
9 pages
Medical Cost Prediction
No ratings yet
Medical Cost Prediction
27 pages
Assignment On ANOVA
No ratings yet
Assignment On ANOVA
7 pages
Week - 6 - SWI - MLP - LogisticRegression - Ipynb - Colaboratory
No ratings yet
Week - 6 - SWI - MLP - LogisticRegression - Ipynb - Colaboratory
15 pages
Project 3 - Diabetes Prediction - Ipynb - Colab
No ratings yet
Project 3 - Diabetes Prediction - Ipynb - Colab
4 pages
Case Study
No ratings yet
Case Study
21 pages
ML Practical 04
No ratings yet
ML Practical 04
20 pages
Documentation Code
No ratings yet
Documentation Code
20 pages
Understand Diabetes and Take Control - Bangla
100% (2)
Understand Diabetes and Take Control - Bangla
23 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
7 pages
Stroke Prediction Dataset
No ratings yet
Stroke Prediction Dataset
48 pages
KNN For Classification
No ratings yet
KNN For Classification
5 pages
Experiment 4
No ratings yet
Experiment 4
5 pages
222ECO01 Anand Advanced Econometrics Activity1
No ratings yet
222ECO01 Anand Advanced Econometrics Activity1
6 pages
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
No ratings yet
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
8 pages
Diabetes
No ratings yet
Diabetes
7 pages
Diabetes Prediction System
No ratings yet
Diabetes Prediction System
4 pages
ADS Exp-1
No ratings yet
ADS Exp-1
3 pages
Pharmacotherapy of DM
No ratings yet
Pharmacotherapy of DM
23 pages
20MIS7043 (LAB 7) .Ipynb Colaboratory
No ratings yet
20MIS7043 (LAB 7) .Ipynb Colaboratory
4 pages
Exp 5
No ratings yet
Exp 5
7 pages
20MIS7095 (LAB 7) .Ipynb Colaboratory
No ratings yet
20MIS7095 (LAB 7) .Ipynb Colaboratory
4 pages
Loading The Dataset: 'Diabetes - CSV'
No ratings yet
Loading The Dataset: 'Diabetes - CSV'
4 pages
Import As From Import From Import From Import From Import From Import From Import From Import From Import From Import From Import Import As
No ratings yet
Import As From Import From Import From Import From Import From Import From Import From Import From Import From Import From Import Import As
8 pages
Prediction Diabetic NBayes
No ratings yet
Prediction Diabetic NBayes
3 pages
G26 Report
No ratings yet
G26 Report
4 pages
Unit5 - Logistic Regression
No ratings yet
Unit5 - Logistic Regression
4 pages
Linear and Multilinear Regression
No ratings yet
Linear and Multilinear Regression
5 pages
Project
No ratings yet
Project
8 pages
Mean Vector and Correlation Matrix in R - Jupyter Notebook
No ratings yet
Mean Vector and Correlation Matrix in R - Jupyter Notebook
7 pages
Diabetic Prediction Using LogicalRegression
No ratings yet
Diabetic Prediction Using LogicalRegression
9 pages
Prof. Eman Rushdy Sulphonylurea A Golden Therapy For Diabetes
No ratings yet
Prof. Eman Rushdy Sulphonylurea A Golden Therapy For Diabetes
51 pages
ExNo 08ml
No ratings yet
ExNo 08ml
4 pages
Diabetes Dectection
No ratings yet
Diabetes Dectection
7 pages
Drilling Soal TBI 1
No ratings yet
Drilling Soal TBI 1
4 pages
DiaTribe - Research and Product News For People With Diabetes - Issue #4
100% (1)
DiaTribe - Research and Product News For People With Diabetes - Issue #4
20 pages
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
No ratings yet
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
12 pages
Logistic - Ipynb - Colaboratory
No ratings yet
Logistic - Ipynb - Colaboratory
6 pages
M 5 Insulin Administration
No ratings yet
M 5 Insulin Administration
19 pages
4hb1 02 Que 20230615
No ratings yet
4hb1 02 Que 20230615
24 pages
An Introduction To Diabetes Mellitus: ("Sweet Flow")
No ratings yet
An Introduction To Diabetes Mellitus: ("Sweet Flow")
31 pages
ML Minor May
No ratings yet
ML Minor May
5 pages
Dynamic Simulation of Insulin-Glucose Interaction in Type 1 Diabetes With MATLAB Simulink®
No ratings yet
Dynamic Simulation of Insulin-Glucose Interaction in Type 1 Diabetes With MATLAB Simulink®
11 pages
Tests Results 22924521176
No ratings yet
Tests Results 22924521176
2 pages
ORAL REVALIDA (Diabetes Mellitus)
No ratings yet
ORAL REVALIDA (Diabetes Mellitus)
5 pages
Diabetes Protocol
No ratings yet
Diabetes Protocol
4 pages
Dry Lab Exercise 4 Endocrine
No ratings yet
Dry Lab Exercise 4 Endocrine
4 pages
Fasting Yom Kippur Halacha
100% (1)
Fasting Yom Kippur Halacha
7 pages
Type 2 Diabetes Pharmacotherapy 1717578354
No ratings yet
Type 2 Diabetes Pharmacotherapy 1717578354
2 pages
Clasificacion y Diagnostico de La Diabetes Guias Ada 2015
No ratings yet
Clasificacion y Diagnostico de La Diabetes Guias Ada 2015
9 pages
Pathophysiology of Diabetes Mellitus Type 2
100% (3)
Pathophysiology of Diabetes Mellitus Type 2
1 page
Module 9 Elaborate
No ratings yet
Module 9 Elaborate
6 pages
Hba1c Report Format
No ratings yet
Hba1c Report Format
1 page
Cog 13 Disorders of Metabolism (Carbohydrates and Protein)
No ratings yet
Cog 13 Disorders of Metabolism (Carbohydrates and Protein)
8 pages
Dipiro 2017
No ratings yet
Dipiro 2017
2 pages
What Are Ketones, and Why Are They Dangerous?
No ratings yet
What Are Ketones, and Why Are They Dangerous?
4 pages
Empagliflozin
No ratings yet
Empagliflozin
2 pages
Scenario
No ratings yet
Scenario
2 pages

Diabetes Prediction - Logistic Regression - Jupyter Notebook

Uploaded by

Diabetes Prediction - Logistic Regression - Jupyter Notebook

Uploaded by

In

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction

0 6 148 72 35 0 33.6 0.627

2 8 183 64 0 0 23.3 0.672

4 0 137 40 35 168 43.1 2.288

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI Diab

0 3.298000 109.980000 68.184000 19.664000 68.792000 30.304200

1 4.865672 141.257463 70.824627 22.164179 100.335821 35.142537

The standard score of a sample x is calculated as:

[[ 0.63994726 0.84832379 0.14964075 ... 0.20401277 0.46849198

[-0.84488505 -1.12339636 -0.16054575 ... -0.68442195 -0.36506078

[ 1.23388019 1.94372388 -0.26394125 ... -1.10325546 0.60439732

[ 0.3429808 0.00330087 0.14964075 ... -0.73518964 -0.68519336

[-0.84488505 0.1597866 -0.47073225 ... -0.24020459 -0.37110101

[-0.84488505 -0.8730192 0.04624525 ... -0.20212881 -0.47378505

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Please also refer to the documentation for alternative solver options:

plot_confusion_matrix(lr, X_test, y_test, display_labels=['Diabetic', 'Non-diabetic'],)

You might also like