100% found this document useful (1 vote)

137 views19 pages

Linear Classifiers in Python: Chapter3

The document discusses linear classifiers in Python, including logistic regression and regularization. It covers how regularization affects training and test accuracy, the differences between L1 and L2 regularization, and how to perform multi-class classification with logistic regression using one-vs-rest and multinomial approaches. Code examples are provided to fit logistic regression models and examine coefficients and predictions.

Uploaded by

Nishant

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

100% found this document useful (1 vote)

137 views19 pages

Linear Classifiers in Python: Chapter3

Uploaded by

Nishant

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 19

DataCamp Linear

Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Logistic regression and

regularization

Michael (Mike) Gelbart

Instructor
The University of British Columbia
DataCamp Linear Classifiers in Python

Regularized logistic regression

DataCamp Linear Classifiers in Python

Regularized logistic regression

DataCamp Linear Classifiers in Python

How does regularization affect training accuracy?

In [1]: lr_weak_reg = LogisticRegression(C=100)

In [2]: lr_strong_reg = LogisticRegression(C=0.01)

In [3]: lr_weak_reg.fit(X_train, y_train)

In [4]: lr_strong_reg.fit(X_train, y_train)

In [3]: lr_weak_reg.score(X_train, y_train)
Out[3]: 1.0

In [4]: lr_strong_reg.score(X_train, y_train)

Out[4]: 0.92
regularized loss = original loss + large coefficient penalty
more regularization: lower training accuracy
DataCamp Linear Classifiers in Python

How does regularization affect test accuracy?

In [5]: lr_weak_reg.score(X_test, y_test)
Out[5]: 0.86

In [6]: lr_strong_reg.score(X_test, y_test)

Out[6]: 0.88
regularized loss = original loss + large coefficient penalty
more regularization: lower training accuracy
more regularization: (almost always) higher test accuracy
DataCamp Linear Classifiers in Python

L1 vs. L2 regularization
Lasso = linear regression with L1 regularization
Ridge = linear regression with L2 regularization
For other models like logistic regression we just say L1, L2, etc.
In [1]: lr_L1 = LogisticRegression(penalty='l1')

In [2]: lr_L2 = LogisticRegression() # penalty='l2' by default

In [3]: lr_L1.fit(X_train, y_train)

In [4]: lr_L2.fit(X_train, y_train)

In [5]: plt.plot(lr_L1.coef_.flatten())

In [6]: plt.plot(lr_L2.coef_.flatten())
DataCamp Linear Classifiers in Python

L2 vs. L1 regularization
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Let's practice!
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Logistic regression and

probabilities

Michael (Mike) Gelbart

Instructor
The University of British Columbia
DataCamp Linear Classifiers in Python

Logistic regression probabilities

Without regularization (C = 10 8 ):

model coefficients: [[1.55 1.57]]

model intercept: [-0.64]

DataCamp Linear Classifiers in Python

Logistic regression probabilities

Without regularization (C = 10 8 ):

model coefficients: [[1.55 1.57]]

model intercept: [-0.64]

DataCamp Linear Classifiers in Python

Logistic regression probabilities

Without regularization (C = 10 8 ): With regularization (C = 1):

model coefficients: [[1.55 1.57]] model coefficients: [[0.45 0.64]]

model intercept: [-0.64] model intercept: [-0.26]

DataCamp Linear Classifiers in Python

How are these probabilities computed?

logistic regression predictions: sign of raw model output
logistic regression probabilities: "squashed" raw model output
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Let's practice!
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Multi-class logistic
regression

Michael (Mike) Gelbart

Instructor
The University of British Columbia
DataCamp Linear Classifiers in Python

Combining binary classifiers with one-vs-rest

In [1]: lr0.fit(X, y==0)

In [2]: lr1.fit(X, y==1)

In [3]: lr2.fit(X, y==2)

In [4]: lr0.decision_function(X)[0] # get raw model output
Out[4]: 6.124

In [5]: lr1.decision_function(X)[0]
Out[5]: -5.429

In [6]: lr2.decision_function(X)[0]
Out[6]: -7.532
In [7]: lr.fit(X, y)
In [8]: lr.predict(X)[0]
Out[8]: 0
DataCamp Linear Classifiers in Python

One-vs-rest vs. multinomial/softmax

One-vs-rest: "Multinomial" or "softmax":

fit a binary classifier for each fit a single classifier for all
class classes
predict with all, take largest prediction directly outputs best
output class
pro: simple, modular con: more complicated, new
con: not directly optimizing code
accuracy pro: tackle the problem directly
common for SVMs as well possible for SVMs, but less
can produce probabilities common
DataCamp Linear Classifiers in Python

Model coefficients for multi-class

In [1]: lr_ovr = LogisticRegression() # one-vs-rest by default

In [2]: lr_ovr.fit(X,y)

In [3]: lr_ovr.coef_.shape
Out[3]: (3,13)

In [4]: lr_ovr.intercept_.shape
Out[4]: (3,)
In [5]: lr_mn = LogisticRegression(multi_class="multinomial",solver="lbfgs")

In [6]: lr_mn.fit(X,y)

In [7]: lr_mn.coef_.shape
Out[7]: (3,13)

In [8]: lr_mn.intercept_.shape
Out[8]: (3,)
DataCamp Linear Classifiers in Python

LINEAR CLASSIFIERS IN PYTHON

Let's practice!

Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet
Deep Learning Nanodegree Program
No ratings yet
Deep Learning Nanodegree Program
9 pages
Advanced Time Series and Forecasting Lecture 5
No ratings yet
Advanced Time Series and Forecasting Lecture 5
100 pages
Advanced NLP With Spacy Chapter2
100% (1)
Advanced NLP With Spacy Chapter2
28 pages
Practicing Rails Sample PDF
No ratings yet
Practicing Rails Sample PDF
32 pages
Data Mining CS4168 Lecture 5 Basics of Classification 1
No ratings yet
Data Mining CS4168 Lecture 5 Basics of Classification 1
25 pages
Multi-Tenant Analytics With Auth0 and Cube - Js - The Complete Guide
No ratings yet
Multi-Tenant Analytics With Auth0 and Cube - Js - The Complete Guide
27 pages
(IJIT-V6I5P7) :ravishankar Belkunde
No ratings yet
(IJIT-V6I5P7) :ravishankar Belkunde
9 pages
Generative AI For Pentesting The Good The Bad The
No ratings yet
Generative AI For Pentesting The Good The Bad The
24 pages
Convolutional Neural Networks in Python Master Data Science and Machine Learning With Modern Deep Learning in Python, Theano, and TensorFlow (Machine Learning in Python) by LazyProgrammer
No ratings yet
Convolutional Neural Networks in Python Master Data Science and Machine Learning With Modern Deep Learning in Python, Theano, and TensorFlow (Machine Learning in Python) by LazyProgrammer
183 pages
Q-Learning and Deep Q Networks (DQN)
No ratings yet
Q-Learning and Deep Q Networks (DQN)
52 pages
According To Kanthaswamy Balasubramaniam
No ratings yet
According To Kanthaswamy Balasubramaniam
8 pages
Deep Learning Nanodegree Syllabus
No ratings yet
Deep Learning Nanodegree Syllabus
15 pages
Yahya Thesis - Draft
100% (1)
Yahya Thesis - Draft
58 pages
215 - P G Diploma in Silambam Fencing
No ratings yet
215 - P G Diploma in Silambam Fencing
4 pages
Predictive Analytics Using Rattle and Qlik Sense - Sample Chapter
No ratings yet
Predictive Analytics Using Rattle and Qlik Sense - Sample Chapter
24 pages
How To Learn Machine Learning Algorithms For Interviews
No ratings yet
How To Learn Machine Learning Algorithms For Interviews
16 pages
CQRS Documents by Greg Young
No ratings yet
CQRS Documents by Greg Young
56 pages
Study Notes - Lesson 1 - 7 PDF
No ratings yet
Study Notes - Lesson 1 - 7 PDF
25 pages
Lectures Machine Learning
No ratings yet
Lectures Machine Learning
205 pages
ScreenETA Diagnostic Tool
No ratings yet
ScreenETA Diagnostic Tool
30 pages
Top 45 Machine Learning Interview Questions in 2025
100% (1)
Top 45 Machine Learning Interview Questions in 2025
37 pages
Credit Card Fraud Analysis Using Predictive Modeling
No ratings yet
Credit Card Fraud Analysis Using Predictive Modeling
31 pages
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
From Everand
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
Robert Johnson
No ratings yet
AI and Data Science
No ratings yet
AI and Data Science
12 pages
Machine Learning Algorithms
No ratings yet
Machine Learning Algorithms
9 pages
Clickstream Analysis
No ratings yet
Clickstream Analysis
25 pages
Feature Selection Engineering
No ratings yet
Feature Selection Engineering
72 pages
K Fold and Other Cross-Validation Techniques
No ratings yet
K Fold and Other Cross-Validation Techniques
10 pages
Confusion Matrix in Machine Learning
No ratings yet
Confusion Matrix in Machine Learning
10 pages
Tableau CheatSheet Zep
No ratings yet
Tableau CheatSheet Zep
1 page
ML Unit 1 Notes
100% (1)
ML Unit 1 Notes
19 pages
Exercises - Mastering Postgresql - Mastering SQL Using Postgresql
No ratings yet
Exercises - Mastering Postgresql - Mastering SQL Using Postgresql
25 pages
Batch Processing Vs Stream Processing
No ratings yet
Batch Processing Vs Stream Processing
3 pages
Machine Learning
No ratings yet
Machine Learning
31 pages
Data Preperation Prac
No ratings yet
Data Preperation Prac
230 pages
Scikit Learn User Guide 0.12
100% (1)
Scikit Learn User Guide 0.12
1,049 pages
Upgrad Liverpool John Moore MS ML & AI
No ratings yet
Upgrad Liverpool John Moore MS ML & AI
24 pages
Navigating The AI Landscape by Moody
No ratings yet
Navigating The AI Landscape by Moody
24 pages
Tensorflow 2 - 0 Slides PDF
No ratings yet
Tensorflow 2 - 0 Slides PDF
100 pages
Essential Python Libraries and Functions For Data Science 1706295212
No ratings yet
Essential Python Libraries and Functions For Data Science 1706295212
12 pages
Multi-Class Stress Detection Through Heart Rate Variability A Deep Neural Network Based Study
No ratings yet
Multi-Class Stress Detection Through Heart Rate Variability A Deep Neural Network Based Study
11 pages
Hemanshu Kumar Saraf - Resume New
No ratings yet
Hemanshu Kumar Saraf - Resume New
1 page
Text Mining Project Report
No ratings yet
Text Mining Project Report
27 pages
SAS AML Next Generation Apr2022
No ratings yet
SAS AML Next Generation Apr2022
12 pages
Databook PDF
No ratings yet
Databook PDF
64 pages
Introduction To Neo4j
No ratings yet
Introduction To Neo4j
14 pages
Data Mining Overview
No ratings yet
Data Mining Overview
14 pages
OOMD Summer
No ratings yet
OOMD Summer
12 pages
Hacker Rank
No ratings yet
Hacker Rank
29 pages
Distributed Load Testing in Apache JMeter
No ratings yet
Distributed Load Testing in Apache JMeter
5 pages
3.keylabs Training Parameterization
No ratings yet
3.keylabs Training Parameterization
42 pages
Mastering JBoss Drools 6 - Sample Chapter
No ratings yet
Mastering JBoss Drools 6 - Sample Chapter
26 pages
2.2 ML Session Bias Variance Tradeoffs
No ratings yet
2.2 ML Session Bias Variance Tradeoffs
38 pages
Ad3002 - Question Bank Health Care
100% (1)
Ad3002 - Question Bank Health Care
16 pages
ML3 - Evaluation
100% (1)
ML3 - Evaluation
65 pages
Jamie Tsao's Resume
No ratings yet
Jamie Tsao's Resume
4 pages
Ultimate Python for Fintech Solutions
From Everand
Ultimate Python for Fintech Solutions
Bhagvan Kommadi
No ratings yet
Java Reflection Complete Self-Assessment Guide
From Everand
Java Reflection Complete Self-Assessment Guide
Gerardus Blokdyk
No ratings yet
ColdFusion Interview Questions, Answers, and Explanations: ColdFusion Certification Review
From Everand
ColdFusion Interview Questions, Answers, and Explanations: ColdFusion Certification Review
equitypress
No ratings yet
16 Chinese CFB FGD PDF
No ratings yet
16 Chinese CFB FGD PDF
22 pages
03 - Reactions Between CaO and SO2 in Carbonating and No Carbonating Conditions
No ratings yet
03 - Reactions Between CaO and SO2 in Carbonating and No Carbonating Conditions
9 pages
08 - FGD by Ammonia Scrubbing in CFB Power Plant
No ratings yet
08 - FGD by Ammonia Scrubbing in CFB Power Plant
4 pages
Linear Classifiers in Python: Chapter4
No ratings yet
Linear Classifiers in Python: Chapter4
24 pages
PGDBA by ISI, IIT-kgp, IIM C Paper 2018
No ratings yet
PGDBA by ISI, IIT-kgp, IIM C Paper 2018
15 pages
PGDBA by ISI, IIT-kgp, IIM C Paper 2017
No ratings yet
PGDBA by ISI, IIT-kgp, IIM C Paper 2017
25 pages
Three Scenarios of Continual Learning
No ratings yet
Three Scenarios of Continual Learning
18 pages
V02 SS24 DLforCV NN Basics Teil1
No ratings yet
V02 SS24 DLforCV NN Basics Teil1
68 pages
ML Visuals
No ratings yet
ML Visuals
61 pages
Complete Guide To Parameter Tuning in XGBoost (With Codes in Python) PDF
No ratings yet
Complete Guide To Parameter Tuning in XGBoost (With Codes in Python) PDF
20 pages
2841 A Watermark For Large Language
No ratings yet
2841 A Watermark For Large Language
24 pages
Module 2
No ratings yet
Module 2
44 pages
Understanding and Coding Self-Attention, Multi-Head Attention, Cross-Attention, and Causal-Attention in LLMs
No ratings yet
Understanding and Coding Self-Attention, Multi-Head Attention, Cross-Attention, and Causal-Attention in LLMs
38 pages
LBDL
No ratings yet
LBDL
156 pages
Cs224n 2024 Lecture02 Wordvecs2
No ratings yet
Cs224n 2024 Lecture02 Wordvecs2
45 pages
Measuring Abstract Reasoning in Neural Networks
No ratings yet
Measuring Abstract Reasoning in Neural Networks
17 pages
Intelligent Vision System Quality Class Airport Lamp Prisms Corrected
No ratings yet
Intelligent Vision System Quality Class Airport Lamp Prisms Corrected
4 pages
I Image Caption Generation Using Contextual Information Fusion With Bi-LSTM-s
No ratings yet
I Image Caption Generation Using Contextual Information Fusion With Bi-LSTM-s
10 pages
Model-Based Deep Learning
No ratings yet
Model-Based Deep Learning
35 pages
Slides
No ratings yet
Slides
32 pages
DL Unit2 HD
No ratings yet
DL Unit2 HD
141 pages
Word2vector Paper PDF
No ratings yet
Word2vector Paper PDF
9 pages
Transformers From Scratch
No ratings yet
Transformers From Scratch
39 pages
Cs224n Text Generation
No ratings yet
Cs224n Text Generation
73 pages
RITA: Group Attention Is All You Need For Timeseries Analytics
No ratings yet
RITA: Group Attention Is All You Need For Timeseries Analytics
14 pages
MRI Based Brain Tumor Image Segmentation Model
No ratings yet
MRI Based Brain Tumor Image Segmentation Model
42 pages
LL Ma-A: E F - L L M - Z - A: A Dapter Fficient INE Tuning of Arge Anguage OD Els With ERO Initialized Ttention
No ratings yet
LL Ma-A: E F - L L M - Z - A: A Dapter Fficient INE Tuning of Arge Anguage OD Els With ERO Initialized Ttention
30 pages
机器学习绘图模板
No ratings yet
机器学习绘图模板
101 pages
Carlini and Wagner 2017 Towards - Evaluating - The - Robustness - of - Neural - Networks
No ratings yet
Carlini and Wagner 2017 Towards - Evaluating - The - Robustness - of - Neural - Networks
19 pages
Youtube-8M: A Large-Scale Video Classification Benchmark
No ratings yet
Youtube-8M: A Large-Scale Video Classification Benchmark
10 pages
Smart Fiber-Optic Distributed Acoustic Sensing sDAS With Multitask Learning For Time-Efficient Ground Listening Applications
No ratings yet
Smart Fiber-Optic Distributed Acoustic Sensing sDAS With Multitask Learning For Time-Efficient Ground Listening Applications
15 pages
Deep Learning
No ratings yet
Deep Learning
43 pages
Research Article: Classification and Detection of Autism Spectrum Disorder Based On Deep Learning Algorithms
No ratings yet
Research Article: Classification and Detection of Autism Spectrum Disorder Based On Deep Learning Algorithms
10 pages
DeepNotes Softmax&Crossentropy
No ratings yet
DeepNotes Softmax&Crossentropy
14 pages
Adversarial Attacks On LLMs - Lil'Log
No ratings yet
Adversarial Attacks On LLMs - Lil'Log
30 pages
Slideshare. Present Yourself
No ratings yet
Slideshare. Present Yourself
56 pages

Linear Classifiers in Python: Chapter3

Uploaded by

Linear Classifiers in Python: Chapter3

Uploaded by

DataCamp Linear

LINEAR CLASSIFIERS IN PYTHON

Logistic regression and

Michael (Mike) Gelbart

Regularized logistic regression

Regularized logistic regression

How does regularization affect training accuracy?

In [2]: lr_strong_reg = LogisticRegression(C=0.01)

In [4]: lr_strong_reg.fit(X_train, y_train)

In [4]: lr_strong_reg.score(X_train, y_train)

How does regularization affect test accuracy?

In [6]: lr_strong_reg.score(X_test, y_test)

In [2]: lr_L2 = LogisticRegression() # penalty='l2' by default

In [3]: lr_L1.fit(X_train, y_train)

In [4]: lr_L2.fit(X_train, y_train)

LINEAR CLASSIFIERS IN PYTHON

LINEAR CLASSIFIERS IN PYTHON

Logistic regression and

Michael (Mike) Gelbart

Logistic regression probabilities

model coefficients: [[1.55 1.57]]

model intercept: [-0.64]

Logistic regression probabilities

model coefficients: [[1.55 1.57]]

model intercept: [-0.64]

Logistic regression probabilities

Without regularization (C = 10 8 ): With regularization (C = 1):

model coefficients: [[1.55 1.57]] model coefficients: [[0.45 0.64]]

model intercept: [-0.64] model intercept: [-0.26]

How are these probabilities computed?

LINEAR CLASSIFIERS IN PYTHON

LINEAR CLASSIFIERS IN PYTHON

Michael (Mike) Gelbart

Combining binary classifiers with one-vs-rest

In [2]: lr1.fit(X, y==1)

In [3]: lr2.fit(X, y==2)

One-vs-rest vs. multinomial/softmax

One-vs-rest: "Multinomial" or "softmax":

Model coefficients for multi-class

LINEAR CLASSIFIERS IN PYTHON

You might also like