Set 3

The document performs bivariate and multivariate analysis on a diabetes dataset. It splits the data into training and test sets, performs linear regression, and calculates various metrics. Both single and multiple variable linear regression models are fitted to predict diabetes outcomes.

Uploaded by

gopika.26csa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

117 views2 pages

Set 3

Uploaded by

gopika.26csa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

SET 3

12. Use the diabetes data set from Pima Indians Diabetes , Perform Bivariate analysis
BIVARIATE ANALYSIS

Split Training & Testing Sets

[]
from numpy.lib.shape_base import split
x=df[['Glucose']]
y=df[['Outcome']]
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=0)
Linear Regression

[]
from sklearn.linear_model import LinearRegression

regressor = LinearRegression()
regressor.fit(x_train, y_train)
print(regressor.coef_)
print(regressor.intercept_)
account_circle
[[0.00693575]]
[-0.4785685]

Plotting Regression Line

[]
plt.scatter(x_train,y_train,color='g')
plt.plot(x_test,y_pred,color='k')
account_circle

[]
sns.lmplot(x = 'Glucose',
y = 'Outcome',
ci = None,
data = df)
account_circle
[]
from sklearn import metrics
print(metrics.mean_absolute_error(y_test,predictions))
print(metrics.mean_squared_error(y_test,predictions))

Multivariate Analysis

Split Training & Testing sets

[]
x=df[['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin',
'BMI', 'DiabetesPedigreeFunction', 'Age']]
y = df[['Outcome']]

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3, random_state=42)

[]
from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(x_train, y_train)
print(model.coef_)
print(model.intercept_)
account_circle
[[ 0.00899394 0.00574161 -0.00171114 -0.00025321 -0.0001265 0.01617347
0.07290169 0.0062645 ]]
[-1.0013847]

[]
plt.scatter(x_train,y_train,color='r')
plt.plot(x_test,y_pred,color='g')

[]
from sklearn import metrics
print(metrics.mean_absolute_error(y_test, predictions))
print(metrics.mean_squared_error(y_test, predictions))

Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
20 pages
Early Detection of Diabetes Using Logistic Regression Risk Factor Analysis and Probabilistic Prediction
No ratings yet
Early Detection of Diabetes Using Logistic Regression Risk Factor Analysis and Probabilistic Prediction
12 pages
Diabetes Prediction Using Logistic Regression - Untitled - Ipynb at Main Prajwal10031999 - Diabetes Prediction Using Logistic Regression GitHub
No ratings yet
Diabetes Prediction Using Logistic Regression - Untitled - Ipynb at Main Prajwal10031999 - Diabetes Prediction Using Logistic Regression GitHub
8 pages
Fds 1
No ratings yet
Fds 1
44 pages
Pima Indian Diabetes Data Analysis in Python - Canopus Business Management Group
No ratings yet
Pima Indian Diabetes Data Analysis in Python - Canopus Business Management Group
21 pages
Linear Merged Pagenumber
No ratings yet
Linear Merged Pagenumber
48 pages
1 Lecture 2: Supervised Machine Learning
No ratings yet
1 Lecture 2: Supervised Machine Learning
20 pages
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
No ratings yet
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
71 pages
Ex 6
No ratings yet
Ex 6
7 pages
Slide Presetatio
No ratings yet
Slide Presetatio
30 pages
Chapter Three 111
No ratings yet
Chapter Three 111
13 pages
IPL Winning Prediction Intern Report
No ratings yet
IPL Winning Prediction Intern Report
52 pages
Diabetes - Test Report
No ratings yet
Diabetes - Test Report
62 pages
MLPPT 11 45
No ratings yet
MLPPT 11 45
31 pages
CS334 - Machine Learning Lab 04 - Feature Selection Methods in ML (Part - 1)
No ratings yet
CS334 - Machine Learning Lab 04 - Feature Selection Methods in ML (Part - 1)
4 pages
22IM30025 Prakriti Assign 02 STL Lab
No ratings yet
22IM30025 Prakriti Assign 02 STL Lab
9 pages
Classifier Model For Diabetes Prediction
No ratings yet
Classifier Model For Diabetes Prediction
30 pages
Cia 2 ML 2348352
No ratings yet
Cia 2 ML 2348352
6 pages
23UCC554
No ratings yet
23UCC554
9 pages
Exp 4 ML
No ratings yet
Exp 4 ML
3 pages
Diabetes Classification Report
No ratings yet
Diabetes Classification Report
17 pages
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
No ratings yet
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
10 pages
Datascience Pgms
No ratings yet
Datascience Pgms
5 pages
Linear Regression
No ratings yet
Linear Regression
3 pages
BI Miniproject Report (Diabetes)
No ratings yet
BI Miniproject Report (Diabetes)
18 pages
Classification
No ratings yet
Classification
9 pages
Prediction of Diabetes
No ratings yet
Prediction of Diabetes
12 pages
Documentation Code
No ratings yet
Documentation Code
20 pages
Diabetes Prediction - ML
No ratings yet
Diabetes Prediction - ML
29 pages
222ECO01 Anand Advanced Econometrics Activity1
No ratings yet
222ECO01 Anand Advanced Econometrics Activity1
6 pages
Diabetics Data Set
No ratings yet
Diabetics Data Set
4 pages
22IZ023 Nikhil - Exercise 6 - Linear Regression
No ratings yet
22IZ023 Nikhil - Exercise 6 - Linear Regression
4 pages
TechnologyName Phase1
No ratings yet
TechnologyName Phase1
9 pages
Independent Project
No ratings yet
Independent Project
10 pages
Logistic Pima Indians - Ipynb - Colaboratory
No ratings yet
Logistic Pima Indians - Ipynb - Colaboratory
4 pages
20BCE7620 AP2021228000397 Experiment-6 Removed
No ratings yet
20BCE7620 AP2021228000397 Experiment-6 Removed
19 pages
Abdul Mateen
No ratings yet
Abdul Mateen
6 pages
Screens
No ratings yet
Screens
6 pages
Diabetes
No ratings yet
Diabetes
10 pages
Project
No ratings yet
Project
8 pages
Project Report
No ratings yet
Project Report
10 pages
Import As From Import From Import From Import From Import From Import From Import From Import From Import From Import From Import Import As
No ratings yet
Import As From Import From Import From Import From Import From Import From Import From Import From Import From Import From Import Import As
8 pages
Unit5 - Logistic Regression
No ratings yet
Unit5 - Logistic Regression
4 pages
Pima
No ratings yet
Pima
5 pages
AIML 2.2 Aayush
No ratings yet
AIML 2.2 Aayush
3 pages
Diabetes Predection
No ratings yet
Diabetes Predection
7 pages
Untitled5.Ipynb - Colab
No ratings yet
Untitled5.Ipynb - Colab
1 page
ML Exp 7
No ratings yet
ML Exp 7
3 pages
Logistic Regression - Ipynb - Colab
No ratings yet
Logistic Regression - Ipynb - Colab
2 pages
Pima Indians Diabetes Database Analysis - Kaggle
No ratings yet
Pima Indians Diabetes Database Analysis - Kaggle
37 pages
Report Diabetics
No ratings yet
Report Diabetics
8 pages
Diabetic Prediction Using LogicalRegression
No ratings yet
Diabetic Prediction Using LogicalRegression
9 pages
Diabetes Prediction Model
No ratings yet
Diabetes Prediction Model
7 pages
Univariate and Multivariate Analysis - Jupyter Notebook
No ratings yet
Univariate and Multivariate Analysis - Jupyter Notebook
5 pages
PR 6
No ratings yet
PR 6
2 pages
Untitled15.ipynb - Colaboratory
No ratings yet
Untitled15.ipynb - Colaboratory
1 page
Experiment 5
100% (1)
Experiment 5
6 pages
Devops Unit 1
No ratings yet
Devops Unit 1
57 pages
ML Minor May
No ratings yet
ML Minor May
5 pages
Penetration Testing
No ratings yet
Penetration Testing
27 pages
Cybersecurity
No ratings yet
Cybersecurity
16 pages
Oose Lab (Drawing)
No ratings yet
Oose Lab (Drawing)
6 pages
IT DB Pandocorp
No ratings yet
IT DB Pandocorp
2 pages

Set 3

Uploaded by

Set 3

Uploaded by

SET 3

Split Training & Testing Sets

Plotting Regression Line

Split Training & Testing sets

from sklearn.model_selection import train_test_split

You might also like