EEL 6935 Data Analytics: Probability Theory

This document summarizes key concepts from a lecture on probability theory, including: 1) Probability provides a framework for quantifying and manipulating uncertainty from inherent randomness, measurement noise, and finite data sizes. 2) Frequentist probability is based on frequencies of observations, while Bayesian probability allows quantification of both repeatable and non-repeatable events by updating probabilities with evidence. 3) Bayesian and frequentist approaches differ in their interpretations of probability and techniques for model selection, regularization, and accuracy evaluation.

Uploaded by

AlMuthanna Nassar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

28 views

EEL 6935 Data Analytics: Probability Theory

Uploaded by

AlMuthanna Nassar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

EEL

6935 Data Analytics

LECTURE 2

Probability Theory

Jan. 11, 2018

Uncertainty & Probability
• Uncertainty in data:
• inherent in the observed physical process (e.g., voltage measurement in power grid, # customers in a market)
• noise in measurement (e.g., hardware/software limitations)
• finite data size (i.e., lack of access to the entire population)
• Probability:
• a consistent framework for quantification and manipulation of uncertainty
• helps in decision making (e.g., our brains)
• Frequentist probability ~ frequency of observations
• marginal probability joint probability conditional probability
𝑝 𝑌 = 𝑜 = 𝑛/ /𝑛 𝑝 𝑋 = 𝑟, 𝑌 = 𝑔 = 𝑛)* /𝑛 𝑝 𝑌 = 𝑔 𝑋 = 𝑏 = 𝑛-* /𝑛-

• Sum rule: 𝑝 𝑋 = 2 𝑝(𝑋, 𝑌) 𝑛) 𝑛-

4
• Product rule: 𝑝 𝑋, 𝑌 = 𝑝 𝑌 𝑋 𝑝(𝑋)
𝑔 𝑛)* 𝑛-* 𝑛*
𝑝(𝑋, 𝑌) 𝑝 𝑌 𝑋 𝑝(𝑋) 𝑌
• Bayes Theorem: 𝑝 𝑋 𝑌 = =
𝑛)/
𝑝(𝑌) ∑7 𝑝 𝑌 𝑋 𝑝(𝑋) o 𝑛-/ 𝑛/

𝑝 𝑋 = 𝑏 𝑌 = 𝑔 =? 𝑟 𝑏
𝑋
Probability
• Probability density of a continuous variable
- B
𝑝 𝑥 𝜖 𝑎, 𝑏 = < 𝑝 𝑥 𝑑𝑥 𝑝(𝑥) ≥ 0 < 𝑝 𝑥 𝑑𝑥 = 1
> CB
F
𝑃 𝑦 = < 𝑝 𝑥 𝑑𝑥 𝑝(𝐱) ≥ 0 H 𝑝 𝐱 𝑑𝐱 = 1
CB

𝐸𝑓 𝑥 =
𝑝 𝑥 = < 𝑝 𝑥, 𝑦 𝑑𝑦 𝑝 𝑥, 𝑦 = 𝑝 𝑦 𝑥 𝑝(𝑥)
2 𝑓 𝑥 𝑝(𝑥)
K

𝐸K 𝑓 𝑥, 𝑦 = 𝐸K|F 𝑓 𝑥, 𝑦 |𝑦 =
𝐸𝑓 𝑥 = < 𝑓 𝑥 𝑝 𝑥 𝑑𝑥
< 𝑓 𝑥, 𝑦 𝑝 𝑥, 𝑦 𝑑𝑥 < 𝑓 𝑥, 𝑦 𝑝 𝑥|𝑦 𝑑𝑥

𝑉𝑎𝑟 𝑓 𝐶𝑜𝑣 𝑥, 𝑦 𝐶𝑜𝑣 𝐱, 𝐲

O = 𝐸K,F 𝑥 − 𝐸 𝑥 𝑦−𝐸 𝑦 𝑻
=𝐸 𝑓 𝑥 −𝐸 𝑓 𝑥 = 𝐸𝐱,𝐲 𝐱 − 𝐸 𝐱 𝐲−𝐸 𝐲
O O
=𝐸 𝑓 𝑥 −𝐸 𝑓 𝑥 = 𝐸K,F 𝑥𝑦 − 𝐸 𝑥 𝐸 𝑦 = 𝐸𝐱,𝐲 𝐱𝐲 𝑻 − 𝐸 𝐱 𝐸 𝐲 T
Bayesian Probability
• Classical/Frequentist interpretation of probability ~ frequencies of repeatable events
• Bayesian probability ~ a quantification of uncertainty
• repeatable and non-repeatable events, e.g., the probability of a dragon flying through the window
• update with evidence, e.g., it is shown that there exist dragons in Florida, and there are small ones
that can fit through a window.
𝑝 𝐷 𝐱 𝑝(𝐱)
𝑝 𝐱𝐷 =
𝑝(𝐷)

posterior α likelihood x prior

• Prior probability is not an arbitrary choice, reflects common sense (or uninformative)

• Challenge: for predictions and model comparison, marginalization typically difficult!

𝑝 𝐷 = H 𝑝 𝐷 𝐱 𝑝 𝐱 𝑑𝐱
Bayesian vs. Frequentist
Bayesian Frequentist
Likelihood fixed data, random parameters random data, fixed parameters
training data: training + validation data:
Model Selection evidence cross validation (may be
(Occam’s razor) computationally cumbersome)
Regularization naturally provided by prior needs additional penalty
(prevents overfitting)
Accuracy naturally provided by posterior needs additional techniques
(quality evaluation) (confidence interval, bootstrap)

• Bayesian prior may not be realistic, but more and more training data decreases the effect of prior

• Advances in computational power, as well as techniques for computing posterior & marginal
(e.g., sampling techniques such as MCMC, and approximate inference such as variational Bayes)
promote Bayesian approach, enable its use in Big Datasets.
Gaussian Distribution
Gaussian Mean and Variance
Multivariate Gaussian
Gaussian Parameter Estimation

Likelihood function
Maximum (Log) Likelihood
Properties of and

MS-102 Exam FULL
100% (3)
MS-102 Exam FULL
390 pages
Bayes ML Tutorial
No ratings yet
Bayes ML Tutorial
69 pages
BaYesian Models Machine Learning 2016
No ratings yet
BaYesian Models Machine Learning 2016
126 pages
BML Lecture Notes
No ratings yet
BML Lecture Notes
126 pages
Artificial Intelligence and Machine Learning
No ratings yet
Artificial Intelligence and Machine Learning
55 pages
BR 2
No ratings yet
BR 2
36 pages
Bayesian Inference: A Practical Primer: Outline
No ratings yet
Bayesian Inference: A Practical Primer: Outline
28 pages
Mod 4
No ratings yet
Mod 4
26 pages
Introduction To Probabilistic Learning
No ratings yet
Introduction To Probabilistic Learning
9 pages
Bayesian Data Analysis
No ratings yet
Bayesian Data Analysis
36 pages
Jeff Byers - Machine Learning and Advanced Statitics
No ratings yet
Jeff Byers - Machine Learning and Advanced Statitics
48 pages
Bayes Decision Theorylect3
No ratings yet
Bayes Decision Theorylect3
12 pages
Notes4_BayesianLearning
No ratings yet
Notes4_BayesianLearning
8 pages
Basics of Probabilistic/Bayesian Modeling and Parameter Estimation
No ratings yet
Basics of Probabilistic/Bayesian Modeling and Parameter Estimation
21 pages
Lecture Notes For Probability and Statistics
No ratings yet
Lecture Notes For Probability and Statistics
7 pages
Data Analytics Unit-2 PPT Notes
No ratings yet
Data Analytics Unit-2 PPT Notes
190 pages
MIT18 650F16 Bayesian Statistics
No ratings yet
MIT18 650F16 Bayesian Statistics
18 pages
Bayes For Beginners: Luca Chech and Jolanda Malamud Supervisor: Thomas Parr 13 February 2019
No ratings yet
Bayes For Beginners: Luca Chech and Jolanda Malamud Supervisor: Thomas Parr 13 February 2019
41 pages
Bark08 Ghahramani Samlbb 01
No ratings yet
Bark08 Ghahramani Samlbb 01
26 pages
Introduction To Bayesian Learning: Aaron Hertzmann University of Toronto SIGGRAPH 2004 Tutorial
No ratings yet
Introduction To Bayesian Learning: Aaron Hertzmann University of Toronto SIGGRAPH 2004 Tutorial
141 pages
IDS22Bayes Applications
No ratings yet
IDS22Bayes Applications
34 pages
ML_Lec 2- Review of probability and statistics
No ratings yet
ML_Lec 2- Review of probability and statistics
30 pages
2223hk1 Slide01 ML2022-2
No ratings yet
2223hk1 Slide01 ML2022-2
23 pages
Bayesian Statistics: Thomas Bayes
No ratings yet
Bayesian Statistics: Thomas Bayes
22 pages
Bayesian Modelling For Data Analysis and Learning From Data
No ratings yet
Bayesian Modelling For Data Analysis and Learning From Data
19 pages
Introduction To Bayesian Methods: Jessi Cisewski Department of Statistics Yale University
No ratings yet
Introduction To Bayesian Methods: Jessi Cisewski Department of Statistics Yale University
53 pages
An Overview of Bayesian Econometrics
No ratings yet
An Overview of Bayesian Econometrics
30 pages
bayesian-inference
No ratings yet
bayesian-inference
18 pages
ML Unit III
No ratings yet
ML Unit III
40 pages
Dealing With Uncertainty P (X - E) : Probability Theory The Foundation of Statistics
No ratings yet
Dealing With Uncertainty P (X - E) : Probability Theory The Foundation of Statistics
34 pages
A Beginner's Notes On Bayesian Econometrics (Art)
No ratings yet
A Beginner's Notes On Bayesian Econometrics (Art)
21 pages
Bayesian Modelling Tuts-4-9
No ratings yet
Bayesian Modelling Tuts-4-9
6 pages
6 Min Read: Siwei Xu Aug 27
No ratings yet
6 Min Read: Siwei Xu Aug 27
4 pages
Probability Theory For Machine Learning: Chris Cremer September 2015
No ratings yet
Probability Theory For Machine Learning: Chris Cremer September 2015
40 pages
ECE523 Engineering Applications of Machine Learning and Data Analytics - Bayes and Risk - 1
No ratings yet
ECE523 Engineering Applications of Machine Learning and Data Analytics - Bayes and Risk - 1
7 pages
Probabilistic Models in Machine Learning: Unit - III Chapter - 1
No ratings yet
Probabilistic Models in Machine Learning: Unit - III Chapter - 1
18 pages
24 Intro to Bayesian Inference (1)
No ratings yet
24 Intro to Bayesian Inference (1)
33 pages
Bayesian-inference-slides-2021
No ratings yet
Bayesian-inference-slides-2021
37 pages
Bayesian
No ratings yet
Bayesian
14 pages
Machine Learning and Data Mining: Prof. Alexander Ihler
No ratings yet
Machine Learning and Data Mining: Prof. Alexander Ihler
51 pages
Machine Learning and Data Mining: Prof. Alexander Ihler
No ratings yet
Machine Learning and Data Mining: Prof. Alexander Ihler
51 pages
Stat 535 C - Statistical Computing & Monte Carlo Methods: Arnaud Doucet
No ratings yet
Stat 535 C - Statistical Computing & Monte Carlo Methods: Arnaud Doucet
23 pages
Bayes Theorem
No ratings yet
Bayes Theorem
20 pages
(Ebook) Introduction To Bayesian Econometrics and Decision Theory
No ratings yet
(Ebook) Introduction To Bayesian Econometrics and Decision Theory
29 pages
Lecture 6
No ratings yet
Lecture 6
13 pages
Module05 - Bayesian Reasoning
No ratings yet
Module05 - Bayesian Reasoning
37 pages
ML Unit-Iii
No ratings yet
ML Unit-Iii
178 pages
MODULE - 4 QB SOLVED-1
No ratings yet
MODULE - 4 QB SOLVED-1
31 pages
Bayes and Frequentism: Return of An Old Controversy: Louis Lyons
No ratings yet
Bayes and Frequentism: Return of An Old Controversy: Louis Lyons
40 pages
Introduction To Bayesian Models
No ratings yet
Introduction To Bayesian Models
8 pages
CH 5
No ratings yet
CH 5
45 pages
18CS71 Module 4
No ratings yet
18CS71 Module 4
30 pages
3.1 New
No ratings yet
3.1 New
12 pages
Bayesian Basics: Ryan P. Adams
No ratings yet
Bayesian Basics: Ryan P. Adams
7 pages
Naive Bayes
No ratings yet
Naive Bayes
29 pages
Bayesian-Statistics Final 20140416 3
No ratings yet
Bayesian-Statistics Final 20140416 3
38 pages
2 Mle
No ratings yet
2 Mle
28 pages
Introduction To Discrete Bayesian Methods: Petri Nokelainen
No ratings yet
Introduction To Discrete Bayesian Methods: Petri Nokelainen
146 pages
15.097: Probabilistic Modeling and Bayesian Analysis
No ratings yet
15.097: Probabilistic Modeling and Bayesian Analysis
42 pages
Bayesian Methodology: an Overview With The Help Of R Software
From Everand
Bayesian Methodology: an Overview With The Help Of R Software
Editor IJSMI
No ratings yet
Student's Solutions Manual and Supplementary Materials for Econometric Analysis of Cross Section and Panel Data, second edition
From Everand
Student's Solutions Manual and Supplementary Materials for Econometric Analysis of Cross Section and Panel Data, second edition
Jeffrey M. Wooldridge
No ratings yet
Infoblox Poster Ipv6 Best Practices
No ratings yet
Infoblox Poster Ipv6 Best Practices
1 page
Optimizing Wireless Coverage For Rural Communities
No ratings yet
Optimizing Wireless Coverage For Rural Communities
30 pages
adding-genai-to-your-fraud-prevention-strategy
No ratings yet
adding-genai-to-your-fraud-prevention-strategy
16 pages
Tech Mathematics Collectable Marks For Grade12 1
No ratings yet
Tech Mathematics Collectable Marks For Grade12 1
4 pages
CS2 Corrections 2019
No ratings yet
CS2 Corrections 2019
6 pages
Test Bank for Systems Analysis and Design 11th Edition by Tilley all chapter instant download
100% (4)
Test Bank for Systems Analysis and Design 11th Edition by Tilley all chapter instant download
57 pages
Requirements Analysis and Specification: Module-2
No ratings yet
Requirements Analysis and Specification: Module-2
35 pages
Kace Sma 12.0 Adminguide En-Us
No ratings yet
Kace Sma 12.0 Adminguide En-Us
963 pages
MIL Module 16b Ien
50% (2)
MIL Module 16b Ien
19 pages
WFO V15 2 HFR7 WFM Package Release Notes
No ratings yet
WFO V15 2 HFR7 WFM Package Release Notes
11 pages
Pytest
No ratings yet
Pytest
487 pages
OTN - Overview - G709 - Optical Transport Network
No ratings yet
OTN - Overview - G709 - Optical Transport Network
15 pages
Backtracking:: Back Track
No ratings yet
Backtracking:: Back Track
30 pages
Software Engineer, Data - Ad Engineering
No ratings yet
Software Engineer, Data - Ad Engineering
2 pages
Instructions - Ransomware Playbook
No ratings yet
Instructions - Ransomware Playbook
38 pages
UseCaseDescriptions EXCELLENT
No ratings yet
UseCaseDescriptions EXCELLENT
110 pages
Android How To Program 3rd Edition Deitel Solutions Manual 1
100% (62)
Android How To Program 3rd Edition Deitel Solutions Manual 1
36 pages
ck88 en Om b0
No ratings yet
ck88 en Om b0
80 pages
Protected Internet, Intranet & Virtual Private Networks
No ratings yet
Protected Internet, Intranet & Virtual Private Networks
246 pages
CEF207 Tutorial1
No ratings yet
CEF207 Tutorial1
4 pages
February 2024 - Generative AI COE Complete Content Guide
No ratings yet
February 2024 - Generative AI COE Complete Content Guide
24 pages
Algorithmic Language Models With Neurally Compiled Libraries
No ratings yet
Algorithmic Language Models With Neurally Compiled Libraries
12 pages
BIM and GIS Data Integration Guidelines (June 2023 Edition)
No ratings yet
BIM and GIS Data Integration Guidelines (June 2023 Edition)
14 pages
GPS Pitch Deck
No ratings yet
GPS Pitch Deck
9 pages
From Pseudocode To "Real" Code
No ratings yet
From Pseudocode To "Real" Code
5 pages
Unit II - SECURE DEVELOPMENT AND DEPLOYMENT
No ratings yet
Unit II - SECURE DEVELOPMENT AND DEPLOYMENT
24 pages
Complete Test Series FOR: Service-Based Companies
No ratings yet
Complete Test Series FOR: Service-Based Companies
6 pages
Reviewer Robotics
No ratings yet
Reviewer Robotics
12 pages
Multiple Choice
No ratings yet
Multiple Choice
22 pages

EEL 6935 Data Analytics: Probability Theory

Uploaded by

EEL 6935 Data Analytics: Probability Theory

Uploaded by

EEL

6935 Data Analytics

Jan. 11, 2018

• Sum rule: 𝑝 𝑋 = 2 𝑝(𝑋, 𝑌) 𝑛) 𝑛-

𝑉𝑎𝑟 𝑓 𝐶𝑜𝑣 𝑥, 𝑦 𝐶𝑜𝑣 𝐱, 𝐲

posterior α likelihood x prior

• Challenge: for predictions and model comparison, marginalization typically difficult!

You might also like