Diabetics Data Set

Uploaded by

vishveswari surendran

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views4 pages

Diabetics Data Set

Uploaded by

vishveswari surendran

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 4

Ex no:

Date: UNIVARIATE ANALYSIS USING DIABETICS DATA SET.

Aim:
To write a program to calculate a univariate analysis using diabetics data set.

Procedure:
Step 1: Load the Data:
 Load the diabetes dataset into a suitable data structure.
 If using Python, you can use libraries like Pandas to create a DataFrame.
Step 2: Explore the Data:
 Examine the first few rows of the dataset to understand its structure.
 Check for any missing values in the dataset.
Step 3: Understand the Features:
 Review the columns and understand the meaning of each feature in the dataset.
Step 4: Descriptive Statistics:
 Compute and display summary statistics for the dataset. This includes mean, median,
standard deviation, minimum, and maximum values.
Step5: Univariate Analysis:
 Conduct univariate analysis for each feature.
 This involves creating visualizations such as histograms and box plots to understand
the distribution of each variable.
PROGRAM:
import pandas as pd
import matplotlib.pyplot as plt
#column_names = ["Pregnancies", "Glucose", "BloodPressure", "SkinThickness", "Insulin", "BMI",
"DiabetesPedigreeFunction", "Age", "Outcome"]
df = pd.read_csv('D:\ARCHANA\FODS\FODS LAB\diabetes.csv')# header=None, names=column_names)
print (df.head())
# Example: Univariate analysis for the 'Glucose' variable
glucose_summary = df["Glucose"].describe()
print("Summary Statistics for Glucose:\n", glucose_summary)
# Example: Frequency analysis for the 'Glucose' variable
plt.hist(df["Glucose"],bins=20, edgecolor='black')
plt.title("Histogram of Glucose Levels")
plt.xlabel("Glucose Level")
plt.ylabel("Frequency")
plt.show ()
OUTPUT:

RESULT:
Thus the above program to calculate a univariate analysis using diabetics data set has been successfully
analysized.
Ex no:
Date: BIVARIATE ANALYSIS USING DIABETICS DATA SET.
Aim:
To write a program to calculate a bivariate analysis using diabetics data set.

PROGRAM:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Load the Pima Indians Diabetes dataset
#url = "https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-
diabetes.data"
#column_names = ["Pregnancies", "Glucose", "BloodPressure", "SkinThickness", "Insulin", "BMI",
"DiabetesPedigreeFunction", "Age", "Outcome"]
df = pd.read_csv('D:\ARCHANA\FODS\FODS LAB\diabetes.csv')
# Display the first few rows of the dataset
print(df.head())
# Bivariate analysis - pair plot
sns.pairplot(df, hue="Outcome", diag_kind='kde')
plt.show()
# Bivariate analysis - correlation matrix
correlation_matrix = df.corr()
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap="coolwarm", fmt=".2f", linewidths=0.5)
plt.title("Correlation Matrix")
plt.show()

OUTPUT:

RESULT:
Thus the above program to calculate a bivariate analysis using diabetics data set has been successfully
analysized.

Fitness Calculator Python Project
100% (1)
Fitness Calculator Python Project
12 pages
Linear Regression
No ratings yet
Linear Regression
20 pages
One Sample Z
No ratings yet
One Sample Z
4 pages
AS Maths Statistics Unit 1 MS
No ratings yet
AS Maths Statistics Unit 1 MS
8 pages
Spearman's Rank Correlation
No ratings yet
Spearman's Rank Correlation
22 pages
Normal-Distribution
No ratings yet
Normal-Distribution
31 pages
Statistics-1 With Exercises in Text Book
No ratings yet
Statistics-1 With Exercises in Text Book
17 pages
Measures of Relative Position Grouped 1
No ratings yet
Measures of Relative Position Grouped 1
20 pages
Canonical Correlation Analysis: James H. Steiger
No ratings yet
Canonical Correlation Analysis: James H. Steiger
35 pages
Interview Questions
No ratings yet
Interview Questions
13 pages
02c# - Guggenmos Et Al. (2018) - Custom Contrast Testing
No ratings yet
02c# - Guggenmos Et Al. (2018) - Custom Contrast Testing
23 pages
Validation by Design: The Statistical Handbook For Pharmaceutical Process Validation
No ratings yet
Validation by Design: The Statistical Handbook For Pharmaceutical Process Validation
18 pages
December 2015 Issue
No ratings yet
December 2015 Issue
359 pages
Chapter 9
No ratings yet
Chapter 9
22 pages
Lind 10e Chap008 PPT
No ratings yet
Lind 10e Chap008 PPT
27 pages
T-Test: Paired Two Sample For Means: Variable 1 Variable 2
No ratings yet
T-Test: Paired Two Sample For Means: Variable 1 Variable 2
4 pages
Shiela Marie Caña - Measures-Of-Variability - Nov.6, 2021
No ratings yet
Shiela Marie Caña - Measures-Of-Variability - Nov.6, 2021
3 pages
Department of Education: Practical Research 2 Second Periodical Test
No ratings yet
Department of Education: Practical Research 2 Second Periodical Test
2 pages
Ell784 Aq
No ratings yet
Ell784 Aq
2 pages
Assignment-Priya Singh
No ratings yet
Assignment-Priya Singh
3 pages
Diabetes Case Study
No ratings yet
Diabetes Case Study
1 page
Capstone Project 2
No ratings yet
Capstone Project 2
15 pages
2019 - Nissen Etal - Missing Data and Bias in Physics Education Research - A Case For Using Multiple Imputation
No ratings yet
2019 - Nissen Etal - Missing Data and Bias in Physics Education Research - A Case For Using Multiple Imputation
15 pages
Data Science Fundamentals
No ratings yet
Data Science Fundamentals
22 pages
Univariate and Multivariate Analysis - Jupyter Notebook
No ratings yet
Univariate and Multivariate Analysis - Jupyter Notebook
5 pages
Project 190
No ratings yet
Project 190
6 pages
Pima Indians Diabetes Database Analysis - Kaggle
No ratings yet
Pima Indians Diabetes Database Analysis - Kaggle
37 pages
Set 3
No ratings yet
Set 3
2 pages
CS3362 Data Science Laboratory Manual 2022-23
No ratings yet
CS3362 Data Science Laboratory Manual 2022-23
54 pages
ML Practical 04
No ratings yet
ML Practical 04
20 pages
FDS Aim Algorithm
No ratings yet
FDS Aim Algorithm
18 pages
Logistic Regression
No ratings yet
Logistic Regression
12 pages
Pima Indian Diabetes Data Analysis in Python - Canopus Business Management Group
No ratings yet
Pima Indian Diabetes Data Analysis in Python - Canopus Business Management Group
21 pages
Diabetes
No ratings yet
Diabetes
10 pages
Pima
No ratings yet
Pima
5 pages
FDS Lab Question Bank
No ratings yet
FDS Lab Question Bank
11 pages
K-Nearest Neighbors For Diabetes Prediction: Malik Yousaf (F2020019038) Ahsan Rauf (F2020019057)
No ratings yet
K-Nearest Neighbors For Diabetes Prediction: Malik Yousaf (F2020019038) Ahsan Rauf (F2020019057)
15 pages
ML Minor May
No ratings yet
ML Minor May
5 pages
Cia 2 ML 2348352
No ratings yet
Cia 2 ML 2348352
6 pages
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
No ratings yet
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
8 pages
Logistic - Ipynb - Colaboratory
No ratings yet
Logistic - Ipynb - Colaboratory
6 pages
ASM Quiz With Solution
No ratings yet
ASM Quiz With Solution
12 pages
Ensemble Methods
No ratings yet
Ensemble Methods
32 pages
Project
No ratings yet
Project
8 pages
Q4 Moderation Analysis
No ratings yet
Q4 Moderation Analysis
20 pages
Diabetic Prediction Using LogicalRegression
No ratings yet
Diabetic Prediction Using LogicalRegression
9 pages
ML Data Preprocessing in Python
No ratings yet
ML Data Preprocessing in Python
9 pages
Basic Mathematics - I BCA Syllabus 2024-25
No ratings yet
Basic Mathematics - I BCA Syllabus 2024-25
2 pages
Ex 6
No ratings yet
Ex 6
7 pages
MIE1628 A5 PartB
No ratings yet
MIE1628 A5 PartB
15 pages
Diabetes
No ratings yet
Diabetes
97 pages
Documentation Code
No ratings yet
Documentation Code
20 pages
Diabetes EDA and Kears Modeling
No ratings yet
Diabetes EDA and Kears Modeling
26 pages
Data Analysis
No ratings yet
Data Analysis
3 pages
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
No ratings yet
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
10 pages
Diabetes Data Analysis Using Python Report
No ratings yet
Diabetes Data Analysis Using Python Report
15 pages
ML Proj Diabetes
No ratings yet
ML Proj Diabetes
51 pages
Dpa 2
No ratings yet
Dpa 2
2 pages
Case Study - Healthcare Industry
No ratings yet
Case Study - Healthcare Industry
2 pages
Healthcare-Project-Simplilearn - Week2
No ratings yet
Healthcare-Project-Simplilearn - Week2
8 pages
Module 2. Concept of Sampling
No ratings yet
Module 2. Concept of Sampling
13 pages
3
No ratings yet
3
4 pages
DEV Question Bank
No ratings yet
DEV Question Bank
15 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
16 pages
Assignment On ANOVA
No ratings yet
Assignment On ANOVA
7 pages
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
No ratings yet
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
71 pages
20BCE7620 AP2021228000397 Experiment-6 Removed
No ratings yet
20BCE7620 AP2021228000397 Experiment-6 Removed
19 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
CS334 - Machine Learning Lab 04 - Feature Selection Methods in ML (Part - 1)
No ratings yet
CS334 - Machine Learning Lab 04 - Feature Selection Methods in ML (Part - 1)
4 pages
Diabetes Prediction 1704256341
No ratings yet
Diabetes Prediction 1704256341
17 pages
AML Sessional 1 Students
No ratings yet
AML Sessional 1 Students
16 pages
Healthcare-Project-Simplilearn - Week1
No ratings yet
Healthcare-Project-Simplilearn - Week1
6 pages
Dataset
No ratings yet
Dataset
13 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
20 pages
Diabetes - Test Report
No ratings yet
Diabetes - Test Report
62 pages
مختار النعيري - The Course Work Submission
No ratings yet
مختار النعيري - The Course Work Submission
31 pages
ADS Exp-1
No ratings yet
ADS Exp-1
3 pages
Datascience Pgms
No ratings yet
Datascience Pgms
5 pages
Linear Merged Pagenumber
No ratings yet
Linear Merged Pagenumber
48 pages
IITM - MLT End Term Question Paper April 2025
No ratings yet
IITM - MLT End Term Question Paper April 2025
11 pages
Data Pre-Processing
No ratings yet
Data Pre-Processing
22 pages
ML CHeat Sheet
No ratings yet
ML CHeat Sheet
3 pages
Pythone Code For Predicting Diabetes Using ML
No ratings yet
Pythone Code For Predicting Diabetes Using ML
18 pages
Diabetic Data Analysis and Visualization: Purpose
No ratings yet
Diabetic Data Analysis and Visualization: Purpose
13 pages
Step 1
No ratings yet
Step 1
10 pages
Fds 1
No ratings yet
Fds 1
44 pages
Exp 4
No ratings yet
Exp 4
4 pages

Diabetics Data Set

Uploaded by

Diabetics Data Set

Uploaded by

Ex no:

Date: UNIVARIATE ANALYSIS USING DIABETICS DATA SET.

You might also like