0% found this document useful (0 votes)

20 views6 pages

222ECO01 Anand Advanced Econometrics Activity1

This document describes a dataset on diabetes patients and examines various regression models. It provides background on the data and defines the dependent and explanatory variables. Both a linear probability model and logit model are estimated and their coefficients are interpreted.

Uploaded by

premium info2222

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views6 pages

222ECO01 Anand Advanced Econometrics Activity1

Uploaded by

premium info2222

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

222ECO01Anandadvanced_econometrics_activity1.

R
andand

2024-02-02
Question 1:

a) Source of data: This dataset is originally from the National Institute

of Diabetes and Digestive and Kidney Diseases.

b) Time Period of data: The data was collected between 1965 and 1988

c) Dependent variable: The dependent variable is “Outcome”. This is a

binary variable that takes the dummy value of 1 if a patient is
Diabetic and 0 if a patient is Not Diabetic

d) Explanatory variables: The explanatory variables include Pregnancies,

Glucose, Blood Pressure, Skin Thickness, Insulin, BMI, Diabetes
Pedigree Function, and Age of the patients.

The objective of the dataset is to predict whether or not a patient has

diabetes, based on the explanatory variables included in the dataset

library(dplyr)

## Warning: package 'dplyr' was built under R version 4.3.2

##
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':

##
## filter, lag

## The following objects are masked from 'package:base':

##
## intersect, setdiff, setequal, union

library(purrr)

## Warning: package 'purrr' was built under R version 4.3.2

library(Ecdat)

## Warning: package 'Ecdat' was built under R version 4.3.2

## Loading required package: Ecfun

## Warning: package 'Ecfun' was built under R version 4.3.2

##
## Attaching package: 'Ecfun'

## The following object is masked from 'package:base':

##
## sign

##
## Attaching package: 'Ecdat'

## The following object is masked from 'package:datasets':

##
## Orange

library(broom)

## Warning: package 'broom' was built under R version 4.3.2

library(aod)

## Warning: package 'aod' was built under R version 4.3.2

library(margins)

## Warning: package 'margins' was built under R version 4.3.2

library(lmtest)

## Warning: package 'lmtest' was built under R version 4.3.2

## Loading required package: zoo

## Warning: package 'zoo' was built under R version 4.3.2

##
## Attaching package: 'zoo'

## The following objects are masked from 'package:base':

##
## as.Date, as.Date.numeric

library(sandwich)

## Warning: package 'sandwich' was built under R version 4.3.2

library(DescTools)

## Warning: package 'DescTools' was built under R version 4.3.2

##
## Attaching package: 'DescTools'
## The following object is masked from 'package:Ecfun':
##
## BoxCox

library(mfx)

## Warning: package 'mfx' was built under R version 4.3.2

## Loading required package: MASS

##
## Attaching package: 'MASS'

## The following object is masked from 'package:Ecdat':

##
## SP500

## The following object is masked from 'package:dplyr':

##
## select

## Loading required package: betareg

## Warning: package 'betareg' was built under R version 4.3.2

library(brant)

## Warning: package 'brant' was built under R version 4.3.2

library(tidyr)

## Warning: package 'tidyr' was built under R version 4.3.2

library(janitor)

## Warning: package 'janitor' was built under R version 4.3.2

##
## Attaching package: 'janitor'

## The following objects are masked from 'package:stats':

##
## chisq.test, fisher.test

library(nnet)

## Warning: package 'nnet' was built under R version 4.3.2

library(readxl)

## Warning: package 'readxl' was built under R version 4.3.2

#Question 2) Run a Linear Probability Model and interpret the

coefficients
diabetes <- read_excel("C:\\Users\\andand\\Desktop\\diabetes.xlsx")
diabetes <- diabetes %>%
mutate(Outcome_num = ifelse(Outcome == "NotDiabetic", 0, 1))

model_lpm <- lm(Outcome_num ~ Pregnancies + Glucose + BloodPressure +

SkinThickness + Insulin + BMI + DiabetesPedigreeFunction +
Age, data = diabetes)
summary(model_lpm)

##
## Call:
## lm(formula = Outcome_num ~ Pregnancies + Glucose + BloodPressure +
## SkinThickness + Insulin + BMI + DiabetesPedigreeFunction +
## Age, data = diabetes)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.01348 -0.29513 -0.09541 0.32112 1.24160
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.8538943 0.0854850 -9.989 < 2e-16 ***
## Pregnancies 0.0205919 0.0051300 4.014 6.56e-05 ***
## Glucose 0.0059203 0.0005151 11.493 < 2e-16 ***
## BloodPressure -0.0023319 0.0008116 -2.873 0.00418 **
## SkinThickness 0.0001545 0.0011122 0.139 0.88954
## Insulin -0.0001805 0.0001498 -1.205 0.22857
## BMI 0.0132440 0.0020878 6.344 3.85e-10 ***
## DiabetesPedigreeFunction 0.1472374 0.0450539 3.268 0.00113 **
## Age 0.0026214 0.0015486 1.693 0.09092 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4002 on 759 degrees of freedom
## Multiple R-squared: 0.3033, Adjusted R-squared: 0.2959
## F-statistic: 41.29 on 8 and 759 DF, p-value: < 2.2e-16

Interpretation of coefficients

i) An increase in Pregnancies by one unit increases the probability of the

patient being Diabetic by 0.0205919, holding other variables constant

ii) An increase in Glucose by one unit increases the probability of the patient
being Diabetic by 0.0059203, holding other variables constant

iii) An increase in Blood Pressure by one unit decreases the probability of the
patient being Diabetic by 0.0023319, holding other variables constant
iv) An increase in Skin Thickness by one unit increases the probability of the
patient being Diabetic by 0.0001545, holding other variables constant

v) An increase in Insulin by one unit decreases the probability of the patient

being Diabetic by 0.0001805, holding other variables constant

vi) An increase in BMI by one unit increases the probability of the patient
being Diabetic by 0.0132440, holding other variables constant

vii) An increase in Diabetes Pedigree Function by one unit increases the

probability of the patient being Diabetic by 0.1472374, holding other
variables constant

viii) An increase in Age by one unit increases the probability of the patient
being Diabetic by 0.0026214, holding other variables constant

#Question 3) Run a Logit/Probit model and interpret the coefficients

model_logit <- glm(Outcome_num ~ Pregnancies + Glucose + BloodPressure +

SkinThickness + Insulin + BMI + DiabetesPedigreeFunction
+ Age, data = diabetes, family = binomial(link = "logit"))

summary(model_logit)

##
## Call:
## glm(formula = Outcome_num ~ Pregnancies + Glucose + BloodPressure +
## SkinThickness + Insulin + BMI + DiabetesPedigreeFunction +
## Age, family = binomial(link = "logit"), data = diabetes)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -8.4046964 0.7166359 -11.728 < 2e-16 ***
## Pregnancies 0.1231823 0.0320776 3.840 0.000123 ***
## Glucose 0.0351637 0.0037087 9.481 < 2e-16 ***
## BloodPressure -0.0132955 0.0052336 -2.540 0.011072 *
## SkinThickness 0.0006190 0.0068994 0.090 0.928515
## Insulin -0.0011917 0.0009012 -1.322 0.186065
## BMI 0.0897010 0.0150876 5.945 2.76e-09 ***
## DiabetesPedigreeFunction 0.9451797 0.2991475 3.160 0.001580 **
## Age 0.0148690 0.0093348 1.593 0.111192
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 993.48 on 767 degrees of freedom
## Residual deviance: 723.45 on 759 degrees of freedom
## AIC: 741.45
##
## Number of Fisher Scoring iterations: 5

Interpretation of the coefficients:

i) An increase in Pregnancies by one unit increases the log odds of a patient

being Diabetic by 0.1231823, holding other variables constant

ii) An increase in Glucose by one unit increases the log odds of a patient being
Diabetic by 0.0351637, holding other variables constant

iii) An increase in Blood Pressure by one unit decreases the log odds of a
patient being Diabetic by 0.0132955, holding other variables constant

iv) An increase in Skin Thickness by one unit increases the log odds of a
patient being Diabetic by 0.0006190, holding other variables constant

v) An increase in Insulin by one unit decreases the log odds of a patient being
Diabetic by 0.0011917, holding other variables constant

vi) An increase in BMI by one unit increases the log odds of a patient being
Diabetic by 0.0897010, holding other variables constant

vii) An increase in Diabetes Pedigree Function by one unit increases the log
odds of a patient being Diabetic by 0.9451797, holding other variables
constant

viii) An increase in Age by one unit increases the log odds of a patient being
Diabetic by 0.0148690, holding other variables constant

Basic 5 - 20240422 - 170006 - 0000
No ratings yet
Basic 5 - 20240422 - 170006 - 0000
5 pages
Mission Hospital Case Solution - Sec A
100% (1)
Mission Hospital Case Solution - Sec A
8 pages
The Apprentice Doctor® Control Bleeding Course
100% (2)
The Apprentice Doctor® Control Bleeding Course
68 pages
Pima Indian Diabetes Questions
No ratings yet
Pima Indian Diabetes Questions
6 pages
Diabetes Prediction Using Machine Learning
No ratings yet
Diabetes Prediction Using Machine Learning
20 pages
Pythone Code For Predicting Diabetes Using ML
No ratings yet
Pythone Code For Predicting Diabetes Using ML
18 pages
Pima Indians Diabetes Database Analysis - Kaggle
No ratings yet
Pima Indians Diabetes Database Analysis - Kaggle
37 pages
Univariate and Multivariate Analysis - Jupyter Notebook
No ratings yet
Univariate and Multivariate Analysis - Jupyter Notebook
5 pages
E AI Lab EX 2and 3
No ratings yet
E AI Lab EX 2and 3
9 pages
Homework 9 Solutions: Table (Type)
No ratings yet
Homework 9 Solutions: Table (Type)
6 pages
Diabetes
No ratings yet
Diabetes
97 pages
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
No ratings yet
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
10 pages
Logidtic Regression ASSIGNMENT
No ratings yet
Logidtic Regression ASSIGNMENT
13 pages
Mean Vector and Correlation Matrix in R - Jupyter Notebook
No ratings yet
Mean Vector and Correlation Matrix in R - Jupyter Notebook
7 pages
Week 04 Logistic Regression
No ratings yet
Week 04 Logistic Regression
5 pages
Documentation Code
No ratings yet
Documentation Code
20 pages
Fds 1
No ratings yet
Fds 1
44 pages
22IM30025 Prakriti Assign 02 STL Lab
No ratings yet
22IM30025 Prakriti Assign 02 STL Lab
9 pages
Diabetes
No ratings yet
Diabetes
7 pages
Cia 2 ML 2348352
No ratings yet
Cia 2 ML 2348352
6 pages
ADS Exp-1
No ratings yet
ADS Exp-1
3 pages
Diabetes Prediction
No ratings yet
Diabetes Prediction
1 page
Logistic - Ipynb - Colaboratory
No ratings yet
Logistic - Ipynb - Colaboratory
6 pages
Pima
No ratings yet
Pima
5 pages
Stroke Prediction Dataset
No ratings yet
Stroke Prediction Dataset
48 pages
Diabetes Dectection
No ratings yet
Diabetes Dectection
7 pages
2017 - 18 Exam
No ratings yet
2017 - 18 Exam
4 pages
8.perform Correlation and Scatter Plots
No ratings yet
8.perform Correlation and Scatter Plots
5 pages
ML Practical 04
No ratings yet
ML Practical 04
20 pages
DAL Experiment Outputs 6to10
No ratings yet
DAL Experiment Outputs 6to10
16 pages
Exp 5
No ratings yet
Exp 5
7 pages
Data Pre-Processing
No ratings yet
Data Pre-Processing
22 pages
Project
No ratings yet
Project
8 pages
Fundamentals of Business Analytics
No ratings yet
Fundamentals of Business Analytics
5 pages
Healthcare-Project-Simplilearn - Week1
No ratings yet
Healthcare-Project-Simplilearn - Week1
6 pages
Python 2025
No ratings yet
Python 2025
25 pages
ML Data Preprocessing in Python
No ratings yet
ML Data Preprocessing in Python
9 pages
Logistic Regression Notes
No ratings yet
Logistic Regression Notes
79 pages
Linear Merged Pagenumber
No ratings yet
Linear Merged Pagenumber
48 pages
مختار النعيري - The Course Work Submission
No ratings yet
مختار النعيري - The Course Work Submission
31 pages
CODE Project
No ratings yet
CODE Project
42 pages
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
No ratings yet
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
8 pages
Diabetes Prediction Report
No ratings yet
Diabetes Prediction Report
4 pages
Healthcare-Project-Simplilearn - Week2
No ratings yet
Healthcare-Project-Simplilearn - Week2
8 pages
Unit5 - Logistic Regression
No ratings yet
Unit5 - Logistic Regression
4 pages
ML Minor May
No ratings yet
ML Minor May
5 pages
21BCE9757 ITT Summer Internship AI ML Report
No ratings yet
21BCE9757 ITT Summer Internship AI ML Report
18 pages
IT0089 TB391 Decision Tree - Coyohan
No ratings yet
IT0089 TB391 Decision Tree - Coyohan
7 pages
Second Slideshow
No ratings yet
Second Slideshow
15 pages
IPL Winning Prediction Intern Report
No ratings yet
IPL Winning Prediction Intern Report
52 pages
Rplots
No ratings yet
Rplots
8 pages
Diabetes
No ratings yet
Diabetes
10 pages
Diabetes EDA and Kears Modeling
No ratings yet
Diabetes EDA and Kears Modeling
26 pages
Report Diabetics
No ratings yet
Report Diabetics
8 pages
Model Building Using Healthcare Dataset
No ratings yet
Model Building Using Healthcare Dataset
19 pages
Apply Logistic Regression Model Techniques To Predict Data On Any Dataset
No ratings yet
Apply Logistic Regression Model Techniques To Predict Data On Any Dataset
5 pages
Capstone Presentation Version 1.0
No ratings yet
Capstone Presentation Version 1.0
21 pages
Data Preparation: Diabetes Project Report
No ratings yet
Data Preparation: Diabetes Project Report
3 pages
ProbList5 24 SLN
No ratings yet
ProbList5 24 SLN
9 pages
Diabetic Prediction Using LogicalRegression
No ratings yet
Diabetic Prediction Using LogicalRegression
9 pages
Case Study - Healthcare Industry
No ratings yet
Case Study - Healthcare Industry
2 pages
Macro Economics: A Simplified Detailed Edition for Students Understanding Fundamentals of Macroeconomics
From Everand
Macro Economics: A Simplified Detailed Edition for Students Understanding Fundamentals of Macroeconomics
Hesbon R.M
No ratings yet
ExportWAContacts - Bangalore UPSC - 20240526134335
No ratings yet
ExportWAContacts - Bangalore UPSC - 20240526134335
4 pages
KPR Institute Drive - 2025
No ratings yet
KPR Institute Drive - 2025
2 pages
Syed Faizan - Curriculum Vitae
No ratings yet
Syed Faizan - Curriculum Vitae
3 pages
6756 Strategic Human Resource Management March 2023
No ratings yet
6756 Strategic Human Resource Management March 2023
3 pages
Vertex HR Services-SoW
No ratings yet
Vertex HR Services-SoW
4 pages
Travelling
No ratings yet
Travelling
13 pages
Sarvagram Mandates June'24
No ratings yet
Sarvagram Mandates June'24
2 pages
Sarvagram Fincare Private Limited - Job Description
No ratings yet
Sarvagram Fincare Private Limited - Job Description
1 page
NAGARAJ CV 2024 - May
No ratings yet
NAGARAJ CV 2024 - May
3 pages
69 Elective1 Advance Financial Managemen Repeaters 2014 15 Onwards
No ratings yet
69 Elective1 Advance Financial Managemen Repeaters 2014 15 Onwards
3 pages
Advertisement 8765354
No ratings yet
Advertisement 8765354
1 page
Clerk Post Code 692 C 549 Set A 32 Pdfdekho
No ratings yet
Clerk Post Code 692 C 549 Set A 32 Pdfdekho
25 pages
Ambedkar Jayanti
No ratings yet
Ambedkar Jayanti
6 pages
GST Chapter 2
No ratings yet
GST Chapter 2
24 pages
Us20 Allison
No ratings yet
Us20 Allison
10 pages
Economics EC 9418 Basic Econometrics October 2019 A
No ratings yet
Economics EC 9418 Basic Econometrics October 2019 A
2 pages
Msfe Week9
No ratings yet
Msfe Week9
5 pages
GST 231014 071243
No ratings yet
GST 231014 071243
8 pages
WEO Data
No ratings yet
WEO Data
11 pages
中國透析史2020
No ratings yet
中國透析史2020
7 pages
Assignment 2 BHCD 221
No ratings yet
Assignment 2 BHCD 221
8 pages
Jama Carson 2023 SC 230002 1696973901.0012-1
No ratings yet
Jama Carson 2023 SC 230002 1696973901.0012-1
11 pages
Compre R 1-150 Suge
No ratings yet
Compre R 1-150 Suge
31 pages
Establishment of The Campania Oncology Network (Re
No ratings yet
Establishment of The Campania Oncology Network (Re
5 pages
CV DR Siti Cahyani SP PK MKes
No ratings yet
CV DR Siti Cahyani SP PK MKes
3 pages
Meolcrt-Ciiy: Breast
No ratings yet
Meolcrt-Ciiy: Breast
4 pages
Inborn Errors of Metabolism
No ratings yet
Inborn Errors of Metabolism
10 pages
Strategies For Feeding Patients With Dementia.18
100% (1)
Strategies For Feeding Patients With Dementia.18
9 pages
Diabetes Treatment Literature Review
100% (1)
Diabetes Treatment Literature Review
7 pages
Knapp Final Thesis
No ratings yet
Knapp Final Thesis
277 pages
Care of Patient With Liver Cirrhosis For Nursing Process Related Nursing Care
100% (3)
Care of Patient With Liver Cirrhosis For Nursing Process Related Nursing Care
89 pages
Irjp Sept 24 Sushma
No ratings yet
Irjp Sept 24 Sushma
5 pages
Careplan 5 Medsurg
No ratings yet
Careplan 5 Medsurg
8 pages
Urology Infographics
No ratings yet
Urology Infographics
35 pages
CSS Typhoid and Paratyphoid Fevers
No ratings yet
CSS Typhoid and Paratyphoid Fevers
30 pages
CHN/PHN Bag & Bag Technique
No ratings yet
CHN/PHN Bag & Bag Technique
36 pages
First Exposure To Internal Medicine Ambulatory Medicine
No ratings yet
First Exposure To Internal Medicine Ambulatory Medicine
8 pages
Complications of Bed Rest 1
100% (3)
Complications of Bed Rest 1
4 pages
Tepid Sponge Bath
No ratings yet
Tepid Sponge Bath
3 pages
Chatanoga Transport Combo 2738
No ratings yet
Chatanoga Transport Combo 2738
88 pages
Mayapada Hospital
No ratings yet
Mayapada Hospital
14 pages
Coagulación Intravascular Diseminada - 2025
No ratings yet
Coagulación Intravascular Diseminada - 2025
24 pages
Colangitis Biliar Primaria - 2024
No ratings yet
Colangitis Biliar Primaria - 2024
14 pages
ESI - Presentation
No ratings yet
ESI - Presentation
1 page
Prevalence and Factors Associated With Puerperal Sepsis Among Women Attending The Postnatal Ward at Fort Portal Regional Referral Hospital
No ratings yet
Prevalence and Factors Associated With Puerperal Sepsis Among Women Attending The Postnatal Ward at Fort Portal Regional Referral Hospital
10 pages
1408391036-Erba ECL 105 - V02
100% (1)
1408391036-Erba ECL 105 - V02
2 pages
Dietary Sugar and Dental Caries
No ratings yet
Dietary Sugar and Dental Caries
6 pages

222ECO01 Anand Advanced Econometrics Activity1

Uploaded by

222ECO01 Anand Advanced Econometrics Activity1

Uploaded by

222ECO01__Anand__advanced_econometrics_activity1.

a) Source of data: This dataset is originally from the National Institute

c) Dependent variable: The dependent variable is “Outcome”. This is a

d) Explanatory variables: The explanatory variables include Pregnancies,

The objective of the dataset is to predict whether or not a patient has

## Warning: package 'dplyr' was built under R version 4.3.2

## The following objects are masked from 'package:stats':

## The following objects are masked from 'package:base':

## Warning: package 'purrr' was built under R version 4.3.2

## Warning: package 'Ecdat' was built under R version 4.3.2

## Warning: package 'Ecfun' was built under R version 4.3.2

## The following object is masked from 'package:base':

## The following object is masked from 'package:datasets':

## Warning: package 'broom' was built under R version 4.3.2

## Warning: package 'aod' was built under R version 4.3.2

## Warning: package 'margins' was built under R version 4.3.2

## Warning: package 'lmtest' was built under R version 4.3.2

## Loading required package: zoo

## Warning: package 'zoo' was built under R version 4.3.2

## The following objects are masked from 'package:base':

## Warning: package 'sandwich' was built under R version 4.3.2

## Warning: package 'DescTools' was built under R version 4.3.2

## Warning: package 'mfx' was built under R version 4.3.2

## Loading required package: MASS

## The following object is masked from 'package:Ecdat':

## The following object is masked from 'package:dplyr':

## Loading required package: betareg

## Warning: package 'betareg' was built under R version 4.3.2

## Warning: package 'brant' was built under R version 4.3.2

## Warning: package 'tidyr' was built under R version 4.3.2

## Warning: package 'janitor' was built under R version 4.3.2

## The following objects are masked from 'package:stats':

## Warning: package 'nnet' was built under R version 4.3.2

## Warning: package 'readxl' was built under R version 4.3.2

#Question 2) Run a Linear Probability Model and interpret the

model_lpm <- lm(Outcome_num ~ Pregnancies + Glucose + BloodPressure +

i) An increase in Pregnancies by one unit increases the probability of the

v) An increase in Insulin by one unit decreases the probability of the patient

vii) An increase in Diabetes Pedigree Function by one unit increases the

#Question 3) Run a Logit/Probit model and interpret the coefficients

model_logit <- glm(Outcome_num ~ Pregnancies + Glucose + BloodPressure +

Interpretation of the coefficients:

i) An increase in Pregnancies by one unit increases the log odds of a patient

You might also like

222ECO01Anandadvanced_econometrics_activity1.