0% found this document useful (0 votes)

186 views30 pages

Logistic Regression

Logistic regression can be used for classification problems where the target variable is categorical. The logistic regression model estimates the probability of an observation belonging to a particular class based on predictor variables. Several metrics can evaluate the classification performance of logistic regression models, including accuracy, confusion matrices, and information criteria scores. Variable selection methods may help identify the most predictive variables and reduce overfitting.

Uploaded by

Thành Cao Đức

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

186 views30 pages

Logistic Regression

Uploaded by

Thành Cao Đức

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 30

PHUONG NGUYEN

LOGISTIC REGRESSION
CONTENT
1. INTRODUCTION

2. LOGISTIC REGRESSION MODEL

3. EVALUATING CLASSIFICATION PERFORMANCE

INTRODUCTION
▪

▪
INTRODUCTION
▪
▪

▪
INTRODUCTION

5
LOGISTIC RESPONSE FUNCTION
1
𝑝=
1 + 𝑒 −𝑥

6
PROBABILITY

 

1
𝑝= −(𝛽 0 +𝛽 1 𝑥 1 +𝛽2 𝑥 2 + …𝛽 𝑞 𝑥 𝑞 )
1+ 𝑒
ODDS

𝑝
𝑂𝑑𝑑𝑠 =
1−𝑝

𝑂𝑑𝑑𝑠 1
𝑝= =
1 + 𝑂𝑑𝑑𝑠 1 + 𝑂𝑑𝑑𝑠 −1
ODDS

𝑝
𝑂𝑑𝑑𝑠 =
1−𝑝
LOGIT

𝑂𝑑𝑑𝑠 = 𝑒 𝛽0 +𝛽1𝑥1 +𝛽2𝑥2 +⋯+𝛽𝑞𝑥𝑞

ln(𝑂𝑑𝑑𝑠) = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑞 𝑥𝑞
LOGIT
𝑝
𝐿𝑜𝑔𝑖𝑡 = 𝑙𝑛
1−𝑝
LOGISTIC REGRESSION MODEL

▪
PERSONAL LOAN OFFER
UNIVERSALBANK.CSV

▪
▪

▪
SINGLE PREDICTOR MODEL

 
SINGLE PREDICTOR MODEL

▪
PYTHON FUNCTIONALITY NEEDED
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression,
LogisticRegressionCV
from sklearn.model_selection import train_test_split
import statsmodels.api as sm
from mord import LogisticIT
import matplotlib.pylab as plt
import seaborn as sns
from dmba import classificationSummary, gainsChart,
liftChart
from dmba.metric import AIC_score

https://github.com/nnbphuong/datascience4biz/blob/
master/Logistic_Regression.ipynb
DATA PREPROCESSING
bank_df = pd.read_csv('UniversalBank.csv')
bank_df.drop(columns=['ID', 'ZIP Code'], inplace=True)
bank_df.columns = [c.replace(' ', '_') for c in bank_df.columns]

# Treat education as categorical, convert to dummy variables

bank_df['Education'] = bank_df['Education'].astype('category')
new_categories = {1: 'Undergrad', 2: 'Graduate', 3:
'Advanced/Professional'}
bank_df.Education.cat.rename_categories(new_categories, inplace=True)
bank_df = pd.get_dummies(bank_df, prefix_sep='_', drop_first=True)

y = bank_df['Personal_Loan']
X = bank_df.drop(columns=['Personal_Loan’])

# partition data
train_X, valid_X, train_y, valid_y = train_test_split(X, y,
test_size=0.4, random_state=1)
FITTING THE MODEL
▪ 

# fit a logistic regression

logit_reg = LogisticRegression(penalty="l2", C=1e42,
solver='liblinear')
logit_reg.fit(train_X, train_y)
print('intercept ', logit_reg.intercept_[0])
print(pd.DataFrame({'coeff': logit_reg.coef_[0]},
index=X.columns).transpose())
print('AIC', AIC_score(valid_y, logit_reg.predict(valid_X),
df = len(train_X.columns) + 1))
FITTING THE MODEL OUTPUT
intercept -12.61895521314035

Age Experience Income Family CCAvg Mortgage

coeff -0.032549 0.03416 0.058824 0.614095 0.240534 0.001012

Securities_Account CD_Account Online CreditCard

coeff -1.026191 3.647933 -0.677862 -0.95598

Education_Graduate Education_Advanced/Professional
coeff 4.192204 4.341697

AIC -709.1524769205962
CONVERTING FROM LOGIT TO PROBABILITY
𝑙𝑜𝑔𝑖𝑡
𝑂𝑑𝑑𝑠
𝑂𝑑𝑑𝑠 = 𝑒 →𝑝=
1 + 𝑂𝑑𝑑𝑠
logit_reg_pred = logit_reg.predict(valid_X)
logit_reg_proba = logit_reg.predict_proba(valid_X)
logit_result = pd.DataFrame({'actual': valid_y,
'p(0)': [p[0] for p in logit_reg_proba],
'p(1)': [p[1] for p in logit_reg_proba],
'predicted': logit_reg_pred })

# display four different cases

interestingCases = [2764, 932, 2721, 702]
print(logit_result.loc[interestingCases])

OUTPUT
actual p(0) p(1) predicted
2764 0 0.976 0.024 0
932 0 0.335 0.665 1
2721 1 0.032 0.968 1
702 1 0.986 0.014 0
INTERPRETING PROBABILITY AND ODDS
▪

▪ 
EVALUATING CLASSIFICATION PERFORMANCE
classificationSummary(train_y, logit_reg.predict(train_X))
classificationSummary(valid_y, logit_reg.predict(valid_X))

OUTPUT
Confusion Matrix (Accuracy 0.9080)

Prediction
Actual 0 1
0 2632 81
1 195 92
Confusion Matrix (Accuracy 0.9110)

Prediction
Actual 0 1
0 1763 44
1 134 59
VARIABLE SELECTION
▪
▪
▪

▪
VARIABLE SELECTION
▪

×
VARIABLE SELECTION
▪

→
→
MODEL SELECTION
▪

▪
SUMMARY
▪

Machine Learning Lab Manual 06
100% (1)
Machine Learning Lab Manual 06
8 pages
Nopehjdgs Ufvvdyvhuf8trdsvtrveryter Treroetysiov5yhuetyutdbuzfoyifbvigxdftuvsdhuibrsh
0% (1)
Nopehjdgs Ufvvdyvhuf8trdsvtrveryter Treroetysiov5yhuetyutdbuzfoyifbvigxdftuvsdhuibrsh
2 pages
DataMining Course Handout PDF
No ratings yet
DataMining Course Handout PDF
5 pages
Chapter 10 Logistic Reg (Python)
No ratings yet
Chapter 10 Logistic Reg (Python)
29 pages
Chapter 10 Logistic Reg
No ratings yet
Chapter 10 Logistic Reg
29 pages
Chapter 10 - Logistic Regression: Data Mining For Business Intelligence
No ratings yet
Chapter 10 - Logistic Regression: Data Mining For Business Intelligence
20 pages
Logistic Regression
No ratings yet
Logistic Regression
25 pages
Logistic Regression
100% (1)
Logistic Regression
10 pages
BANA 560 Lecture - 4 - LogisticRegression
No ratings yet
BANA 560 Lecture - 4 - LogisticRegression
26 pages
Chap10 LogisticRegression
No ratings yet
Chap10 LogisticRegression
19 pages
Chap10 Logistic Regression
No ratings yet
Chap10 Logistic Regression
36 pages
ML DSBA Lab2
No ratings yet
ML DSBA Lab2
4 pages
Logistic+Regression - Done
100% (1)
Logistic+Regression - Done
41 pages
Logistic Regression
No ratings yet
Logistic Regression
25 pages
S4 LogisticRegression 15jan2025
No ratings yet
S4 LogisticRegression 15jan2025
25 pages
Lecture 6
No ratings yet
Lecture 6
19 pages
Logisticregression
No ratings yet
Logisticregression
22 pages
Chp2 Logistic Regression
No ratings yet
Chp2 Logistic Regression
6 pages
Lecture Notes 6 Logistic Regression
No ratings yet
Lecture Notes 6 Logistic Regression
8 pages
Logistic Regression
No ratings yet
Logistic Regression
21 pages
Logistic Regression in R and Python
No ratings yet
Logistic Regression in R and Python
9 pages
Logistic Regression
100% (2)
Logistic Regression
30 pages
Session 9-Logistic Regression
No ratings yet
Session 9-Logistic Regression
33 pages
Topic 7 Regression (Cont2) Logistic Regression
No ratings yet
Topic 7 Regression (Cont2) Logistic Regression
33 pages
ML-Unit 4
No ratings yet
ML-Unit 4
29 pages
ML Unit 3
No ratings yet
ML Unit 3
40 pages
Class
No ratings yet
Class
102 pages
B-56 Sanket Jambhulkar MLA-3
No ratings yet
B-56 Sanket Jambhulkar MLA-3
7 pages
Binary Logistic
No ratings yet
Binary Logistic
29 pages
Logistic Regression
No ratings yet
Logistic Regression
14 pages
Lec 20
No ratings yet
Lec 20
16 pages
09 23ECE216 LogisticRegression
No ratings yet
09 23ECE216 LogisticRegression
40 pages
Module-2 - Logistic Regression in Machine Learning
No ratings yet
Module-2 - Logistic Regression in Machine Learning
28 pages
Machine Learning (Analytics Vidhya) : What Is Logistic Regression?
100% (1)
Machine Learning (Analytics Vidhya) : What Is Logistic Regression?
5 pages
Logistic Regression
No ratings yet
Logistic Regression
13 pages
Wa0004.
No ratings yet
Wa0004.
9 pages
DMML Unit4
No ratings yet
DMML Unit4
77 pages
Logistic Regression
No ratings yet
Logistic Regression
20 pages
Logistic Regression
No ratings yet
Logistic Regression
34 pages
INSY446 - 4 - Classification Part 1
No ratings yet
INSY446 - 4 - Classification Part 1
26 pages
Logistic Regression
No ratings yet
Logistic Regression
12 pages
FEM 2063 - Data Analytics: CHAPTER 4: Classifications
100% (2)
FEM 2063 - Data Analytics: CHAPTER 4: Classifications
76 pages
ML Algo
No ratings yet
ML Algo
36 pages
SMDS Unit 5
No ratings yet
SMDS Unit 5
21 pages
DS535 Note 4 (With Marks)
No ratings yet
DS535 Note 4 (With Marks)
18 pages
Intro To Linear and Logistic Reg
No ratings yet
Intro To Linear and Logistic Reg
5 pages
Experiment No 3
No ratings yet
Experiment No 3
7 pages
Module 2
No ratings yet
Module 2
92 pages
Lecture 4-Logistic Regression
No ratings yet
Lecture 4-Logistic Regression
20 pages
Logistic Regression
No ratings yet
Logistic Regression
11 pages
1694600777-Unit2.2 Logistic Regression CU 2.0
100% (1)
1694600777-Unit2.2 Logistic Regression CU 2.0
37 pages
Logistic Regression Explained
No ratings yet
Logistic Regression Explained
7 pages
Logistic Regression
No ratings yet
Logistic Regression
14 pages
CO 2 Session 3
No ratings yet
CO 2 Session 3
39 pages
BFCAI BigDataAnalytics Lecture#5 2
No ratings yet
BFCAI BigDataAnalytics Lecture#5 2
69 pages
BA TopicB LoR
No ratings yet
BA TopicB LoR
29 pages
Logistic Regressions
No ratings yet
Logistic Regressions
11 pages
Misc 5
No ratings yet
Misc 5
1 page
Dav Exp4 66
No ratings yet
Dav Exp4 66
5 pages
Logistic Regression
100% (1)
Logistic Regression
56 pages
Artificial Intelligence: Long Short Term Memory Networks
No ratings yet
Artificial Intelligence: Long Short Term Memory Networks
14 pages
Predictive Performance
No ratings yet
Predictive Performance
33 pages
Trí tuệ nhân tạo trong điều khiển: Convolution Neural Networks Mạng nơron tích chập
No ratings yet
Trí tuệ nhân tạo trong điều khiển: Convolution Neural Networks Mạng nơron tích chập
25 pages
Artificial Intelligence: Binary Classifiers For Multi-Class Classification Problems
No ratings yet
Artificial Intelligence: Binary Classifiers For Multi-Class Classification Problems
12 pages
Artificial Intelligence
No ratings yet
Artificial Intelligence
47 pages
Artificial Intelligence: Alexnet
No ratings yet
Artificial Intelligence: Alexnet
20 pages
K-Nearest Neighbors
100% (1)
K-Nearest Neighbors
32 pages
Data Visualization
No ratings yet
Data Visualization
55 pages
Business Analytics
No ratings yet
Business Analytics
42 pages
Tree-Based Methods
No ratings yet
Tree-Based Methods
32 pages
The Data Science Process
100% (1)
The Data Science Process
53 pages
DATA SUMMARIZATION - Print
No ratings yet
DATA SUMMARIZATION - Print
28 pages
Phuong Nguyen: The Complete Guide To Cluster Analysis Using Python
No ratings yet
Phuong Nguyen: The Complete Guide To Cluster Analysis Using Python
68 pages
A Crash Course On Python
No ratings yet
A Crash Course On Python
27 pages
Introduction To Data Science and Analytics
100% (2)
Introduction To Data Science and Analytics
31 pages
NA Lec 11 Fall2024 Anzar Roots Bisection Method 04102024 123920pm
No ratings yet
NA Lec 11 Fall2024 Anzar Roots Bisection Method 04102024 123920pm
17 pages
Akar Persamaan 1
No ratings yet
Akar Persamaan 1
15 pages
Zigzag Core With QQE MOD and Advanced Indicator
No ratings yet
Zigzag Core With QQE MOD and Advanced Indicator
5 pages
Location of Critical Failure Surface and Some Further Studies On Slope Stability Analysis
No ratings yet
Location of Critical Failure Surface and Some Further Studies On Slope Stability Analysis
13 pages
S Sarkar Lec 17
No ratings yet
S Sarkar Lec 17
16 pages
Introduction To Feed Forward Neural Networks
No ratings yet
Introduction To Feed Forward Neural Networks
121 pages
Introduction To Non-Linear Control
No ratings yet
Introduction To Non-Linear Control
26 pages
Computer Science ISC Sample Paper 2 PDF
No ratings yet
Computer Science ISC Sample Paper 2 PDF
9 pages
19 Web Mining 2
No ratings yet
19 Web Mining 2
41 pages
OS Lab Manual
No ratings yet
OS Lab Manual
30 pages
Colour Image Watermarking Based On Wavelet and QR Decomposition
No ratings yet
Colour Image Watermarking Based On Wavelet and QR Decomposition
4 pages
Ci 10cs56 Flat
No ratings yet
Ci 10cs56 Flat
9 pages
Nov Dec 2023
No ratings yet
Nov Dec 2023
3 pages
3 Variable Cramers Rule PDF
No ratings yet
3 Variable Cramers Rule PDF
4 pages
Numerical Solution of Stochastic Differential Equations in Finance
No ratings yet
Numerical Solution of Stochastic Differential Equations in Finance
22 pages
Quantitative Methods For Economic Analysis 1 Solved MCQs (Set-7)
100% (1)
Quantitative Methods For Economic Analysis 1 Solved MCQs (Set-7)
5 pages
미분적분학 솔루션 2판 제임스 스튜어트 1 200
No ratings yet
미분적분학 솔루션 2판 제임스 스튜어트 1 200
201 pages
TABLE OF SPECIFICATION IN MATHEMATICS 8 2nd Quarter
100% (1)
TABLE OF SPECIFICATION IN MATHEMATICS 8 2nd Quarter
1 page
School of Advanced Sciences MAT5005: Advanced Mathematical Methods Question Bank
No ratings yet
School of Advanced Sciences MAT5005: Advanced Mathematical Methods Question Bank
2 pages
01 Overview of Data Structure PDF
No ratings yet
01 Overview of Data Structure PDF
20 pages
Discrete Probability Distribution
No ratings yet
Discrete Probability Distribution
21 pages
Network Flows 1.3 Network Representations 1.3 Network Representations
No ratings yet
Network Flows 1.3 Network Representations 1.3 Network Representations
35 pages
Revision F3
No ratings yet
Revision F3
2 pages
Assignment 1
No ratings yet
Assignment 1
3 pages
Block Cipher Design Principles
No ratings yet
Block Cipher Design Principles
13 pages
Probst DRFP
No ratings yet
Probst DRFP
21 pages
K Means Clustering Project - Sample
No ratings yet
K Means Clustering Project - Sample
9 pages
Resume PDF
No ratings yet
Resume PDF
15 pages