0% found this document useful (0 votes)

18 views

Mstat Note7 Random Variable f23

Uploaded by

junmokim123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views

Mstat Note7 Random Variable f23

Uploaded by

junmokim123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 76

Random Variables

Math & Stat for Data Science

Graduate School of Data Science
Seoul National University
This note will cover
• Random variable
• Definition, CDF, PMF, PDF
• Discrete Random Variables
• Bernoulli, Binomial, Poisson, etc
• Continuous Random Variables
• Normal, chi-squared, Exponential, etc
• Multivariate RV
• Independence, conditional dist.
• Change of variables
Random Variables
• Sample space and events
• can determine probability
• But we need to assign them to a real number for
analysis

• Ex. 2 Coin toss

• Sample space
• {HH}, {HT}, {TH}, {TT}
• Need to convert them to a certain number for the
analysis
Random Variables

From this point, we will directly work with random variables.

Some examples
Some examples
Random variables
• Probability?
• Calculate the probability by inverting random variables
Random variables

Here, values of random variables are not 1:1 to the event

Probability and Distribution

• CDF has all the information about the random

variables
• CDF is non-decreasing, right continuous function
CDF
CDF

Right continuous
Non-decreasing
Probability mass function (PMF)

• Defined when X is discrete

• Can calculate CDF using PMF
PMF
PMF
Probability density function (PDF)
• Similarly, pdf can be defined for continuous variable
Probability density function (PDF)
• PDF of uniform(0,1) distribution

• Corresponding CDF
Probability density function (PDF)
• PDF is not a probability!!

• For continuous traits P(X=x)=0 for every x

• PDF can be larger than 1
• PDF of Uniform(0,1/5) = 5 for x in (0, 1/5)

• Mathematically, PDF is a something called Radon-

Nikodym derivative
Properties
Quantile function

.75 (third) Quantile?

Equal distribution
• Two random variable X and Y are equal in
distribution:
• FX(x) = FY(x) for all x

• Does not mean that X = Y

Well known Discrete RVs
Bernoulli Distribution
Bernoulli, p=0.3
0.6
Probability

0.3
0.0

0 1
Bernoulli Distribution
Examples
• Coin Toss
• 0: T
• 1: H
• p: probability to have H

• Disease Probability
• 0: Non disease
• 1: Disease
• p : probability to have the disease
Bernoulli Distribution
Examples
• Suppose there are 5 individuals, and the
probabilities to have the disease is p=0.2

Generate random sample?

# R-code
N=5
p=0.2
rbinom(N, 1, p)
Bernoulli Distribution
Examples
• Suppose there are 5 individuals, and the
probabilities to have the disease are all different as
p1=0.1, p2=0.2, p3=0.3, p4=0.4, p5=0.5

Generate random sample?

# R-code
N=5
p=c(0.1, 0.2, 0.3, 0.4, 0.5)
rbinom(N, 1, p)
Binomial Distribution
Binomial, n=10, p=0.3

0.00 0.10 0.20

Probability

0 1 2 3 4 5 6 7 8 9 10
Binomial Distribution
• Sum of n independent Bernoulli(p) random variables
follows Binomial(n, p)

• Sum of two independent Binomial random variables

follows Binomial distribution

• X1 ~ Binom(n1, p), X2~Binom(n2, p)

• X1+X2 = Binom(n1 + n2, p)
Binomial distribution
Examples
• Coin Toss
• Suppose toss coin 10 times
• x: the number of head
• p: probability to have H

• Disease Probability
• Suppose we sample 50 individuals in SNU
• x: number of individuals with disease
• p: probability to have the disease
Binomial Distribution
Binomial, n=1000, p=0.3 Large n: binomial distribution has a bell
shape
=> Close to Normal distribution
Probability

0.015
0.000

0 61 143 235 327 419 511 603 695 787 879 971

Binomial, n=1000, p=0.001

Very small p (rare event), binomial
distribution does not have the bell shape
0.30
Probability

=> Close to Poisson

0.15
0.00

0 2 4 6 8 10 12 14 16 18 20
Geometric Distribution
Geometric, p=0.3
0.30
Probability

0.15
0.00

0 2 4 6 8 10 12 14 16 18 20

Ex. Number of trials needed until the first head in coin toss
Poisson Distribution
Poisson, lambda=1

0.30
Probability

0.15
0.00

0 2 4 6 8 10 12 14 16 18 20
Poisson Distribution
Siméon Denis Poisson
Poisson, lambda=1
Binomial, n=1000, p=0.001

0.30
0.30

Probability
Probability

0.15
0.15

0.00
0.00

0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20

• Derived to model the number of rare event

• Poisson derived it to model wrongful conviction

• Ex. Binomial (1000, 0.001) and Poisson(1) are essentially

the same
Poisson Distribution - derivation
Poisson, lambda=1
Binomial, n=1000, p=0.001

0.30
0.30

Probability
Probability

0.15
0.15

0.00
0.00

0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20
Poisson Distribution

• 𝜆 : mean and variance of

the distribution

• Sum of two Poisson RVs

follows Poisson
• X1~Poisson(𝜆!),
X2~Poisson(𝜆")
• X1+X2 ~Poisson(𝜆! + 𝜆")

Plot from Wikipedia

Poisson Distribution
Examples
• Event incidence
• Suppose we are interested in the incidence of car
accident
• x: number of the incidence in each day
• 𝜆: average number

• DNA data
• The number of mutation in the region
• x: number of mutation
• 𝜆: average number
Well known Continuous RVs
Normal Distribution
Normal, mu=0, sigma=1
0.4
0.3
Density

0.2
0.1
0.0

-4 -2 0 2 4

x
Normal Distribution

Abraham de Moivre Carl Friedrich Gaussc

• One of the most important Prob. Distribution!!

• Derived to approximate the limit of the Binomial

trial (De Moivre, 1721) and to model error
distribution in Astronomy (Gauss, 1809)
Normal Distribution
• One of the feature of normal distribution is linear
transformation of Normal RV follows Normal
distribution.

• Ex. X ~ N(3, 5)
#$%
• Dist of &
?

• Calculate P(X > 1)?

Normal Distribution
Examples
• Widely used for model continuous measure

• Any measurement
• Noise (error) in the observation
• Linear regression is a good example
!
𝜒 distribution
Exponential Distribution
Exponential

0.8
Density

0.4
0.0

0 2 4 6 8 10

x
Exponential Distribution
• CDF
𝑥
𝐹 𝑥 = 1 − exp(− )
𝛽

• Memorylessness
P 𝑋 > 𝑡 + 𝑠 𝑋 > t) = P(X > s)

• The current waiting time is independent to the previous

waiting time
Multivariate Distribution
Bivariate Distribution
• Given a pair of random variables, (X, Y), we can
describe a joint distribution
• Discrete: joint mass function

• Continuous: joint pdf

Bivariate continuous
Marginal Distribution

Find an univariate distribution of X from the joint distribution of (X,Y)!

Marginal Distribution-discrete
Marginal Distribution-continuous
Independent Random Variables
Independent Random Variables
• To check the independence, we need to check the
equation (2.7). The following holds for continuous
Example

Independent?
Example

Joint distribution
of X and Y?
Independence
• Following theorem is very useful to identify the
independence
Independence

Independent?
Conditional Distribution

Discrete

Continuous
Example

Conditional Dist. of P(X < 1/4 | Y = 1/3) ?

Example

Marginal distribution of Y?
Multivariate Dist.
• For multivariate random variables, using vector-
notation is more convenient
• X= (X1,…, Xn)
• Corresponding PDF is f(X1,…, Xn)

• Independence of X1,…, Xn
• Can be confirmed using

• Or
IID sampling

Many of the observed data can be thought as IID samples

Multinomial
• Multivariate version of binomial
• Suppose there are k groups, and in each trial, one group can be
selected
• Ex. Dice throw
• 6 possible outcome
• Suppose to throw n times.
• 𝑋 = 𝑋! , 𝑋" , … , 𝑋# : number of each group
• 𝑝 = 𝑝! , 𝑝" , … , 𝑝# : probability to select each group

• X ~ Multinomial (n, p)
Multinomial
• Each element Xj marginally follows Binomial(n, pj)

• Commonly used in survey data

• Satisfaction

• Preference
Multivariate Normal

• One of the most important MV distribution

• Two parameters
• Mean: 𝜇=(𝜇1, …, 𝜇k)
• Variance (nxn matrix): Σ
• Variance should be symmetric and positive definite!!
Multivariate Normal (Extra)
• If each Xj follows IID N(0, 1) (so Z value) and then
Multivariate Normal (Extra)

Linear transformation of MVN follows MVN !

Multivariate Normal
Example: correlated outcomes
• Suppose we want to generate height and weight
• Height ~ N(170, 𝜎 "=25)
• Weight ~ N(72, 𝜎 " =16)
• Covariance = 12
Multivariate Normal
Example: correlated outcomes
Multivariate Normal (Extra)
Transformation of RV
Transformation of RV
• In many situations we need to consider to
transform RVs
• Ex. X -> X2 (for variance calculation)

• Suppose Y=r(X) is a transformation of X. PMF of Y is

Transformation of RV
• Ex. P(X=-1)=P(X=1)=1/4, P(X=0)=1/2. Let Y=X2, then
PDF of Y?
Transformation of RV
• Continuous case
Transformation of RV

Distribution of Y?
Transformation of multivariate RV
• Transform of several random variables
• Max(X, Y), Min(X, Y), X+Y, X/Y
• Ex. Minimum waiting time.
• Let Z=r(X,Y)
Transformation of multivariate RV
• Suppose X1 and X2 are independent RV and follows
exp(1) distribution. Y = Min(X1, X2 ).
Distribution of Y?
Summary
• Random variable
• Map sample space to real number (or vector)
• We actually use random variables (not sample space) to data
analysis
• Discrete Random Variables
• Bernoulli, Binomial, Poisson, etc
• Continuous Random Variables
• Normal, chi-squared, Exponential, etc
• Multivariate RV
• Independence, conditional dist.
• Change of variables

Remazol Ultra RGB
100% (4)
Remazol Ultra RGB
33 pages
Omron r88d-Wt User - Manual
No ratings yet
Omron r88d-Wt User - Manual
399 pages
Lecture 4: Random Variables and Distributions
No ratings yet
Lecture 4: Random Variables and Distributions
31 pages
2 Random Variables
No ratings yet
2 Random Variables
36 pages
Slide FU - W3
No ratings yet
Slide FU - W3
34 pages
R Variables
No ratings yet
R Variables
9 pages
Lecture Slides - Chapter 3
No ratings yet
Lecture Slides - Chapter 3
20 pages
Lecure-3 Probability
No ratings yet
Lecure-3 Probability
80 pages
Statistics For Business and Economics: Discrete Random Variables and Probability Distributions
No ratings yet
Statistics For Business and Economics: Discrete Random Variables and Probability Distributions
82 pages
lec23 random variable - Copy
No ratings yet
lec23 random variable - Copy
16 pages
Discrete Distribution
No ratings yet
Discrete Distribution
19 pages
Random variables distributions
No ratings yet
Random variables distributions
36 pages
Probability Random Variables Results PV
No ratings yet
Probability Random Variables Results PV
49 pages
Midterm2 Cheatsheet Annotated
No ratings yet
Midterm2 Cheatsheet Annotated
3 pages
استدلال احصائي
No ratings yet
استدلال احصائي
110 pages
Stats 1 - IITM BS Notes - Part 5
No ratings yet
Stats 1 - IITM BS Notes - Part 5
17 pages
Study Guide
No ratings yet
Study Guide
9 pages
3and4_main
No ratings yet
3and4_main
10 pages
Random Variables: Petter Mostad 2005.09.19
No ratings yet
Random Variables: Petter Mostad 2005.09.19
24 pages
Chapter 1
No ratings yet
Chapter 1
13 pages
POC Unit-1 Final
No ratings yet
POC Unit-1 Final
25 pages
Pro Ch2 (2019 20)
No ratings yet
Pro Ch2 (2019 20)
38 pages
1853_Random Variable & Distribution
No ratings yet
1853_Random Variable & Distribution
43 pages
Session 2 PDF
No ratings yet
Session 2 PDF
25 pages
Probability
No ratings yet
Probability
36 pages
1732725913353_STT201
No ratings yet
1732725913353_STT201
19 pages
TOPIC TWO. RANDOM VARIABLE AND PROBABILITY DISTRIBUTION pptx
No ratings yet
TOPIC TWO. RANDOM VARIABLE AND PROBABILITY DISTRIBUTION pptx
43 pages
Chap3 Discreate
No ratings yet
Chap3 Discreate
34 pages
statatics and probability chapter 3 and 4
No ratings yet
statatics and probability chapter 3 and 4
10 pages
QTA 3 - Common Univariate Random Variables
No ratings yet
QTA 3 - Common Univariate Random Variables
65 pages
D Models
No ratings yet
D Models
5 pages
AdvStats - W3 - Discrete
No ratings yet
AdvStats - W3 - Discrete
24 pages
SI_Chapter-1
No ratings yet
SI_Chapter-1
30 pages
DAily_LEC._sep_18_notes
No ratings yet
DAily_LEC._sep_18_notes
8 pages
ENENDA30 - Module 3
No ratings yet
ENENDA30 - Module 3
48 pages
Common Probability Distributions: 1.1 Bernoulli Distribution
No ratings yet
Common Probability Distributions: 1.1 Bernoulli Distribution
6 pages
Topic4 DiscreteRV
No ratings yet
Topic4 DiscreteRV
40 pages
MA1201-Probability-Notes
No ratings yet
MA1201-Probability-Notes
30 pages
Random Variables: - Definition - Probability Measures: CDF, PMF, PDF - Expected Values and Moments - Examples of Rvs
No ratings yet
Random Variables: - Definition - Probability Measures: CDF, PMF, PDF - Expected Values and Moments - Examples of Rvs
42 pages
Study Guide
No ratings yet
Study Guide
8 pages
Stats
No ratings yet
Stats
24 pages
2.1 Random Variables 2.1.1 Definition: PX PX X
100% (1)
2.1 Random Variables 2.1.1 Definition: PX PX X
13 pages
Random Variables: - Definition of Random Variable
No ratings yet
Random Variables: - Definition of Random Variable
29 pages
output (4)
No ratings yet
output (4)
6 pages
4 Random Variables
No ratings yet
4 Random Variables
68 pages
MAS.C3
No ratings yet
MAS.C3
36 pages
Study note chap 3
No ratings yet
Study note chap 3
32 pages
Lecture 1-1_Review of Probability
No ratings yet
Lecture 1-1_Review of Probability
36 pages
R-6 Theory
No ratings yet
R-6 Theory
4 pages
4 - Probability Theory II
No ratings yet
4 - Probability Theory II
85 pages
ECO 201 Lecture 2: Dr. Anomita Ghosh
No ratings yet
ECO 201 Lecture 2: Dr. Anomita Ghosh
46 pages
CH 3 3502
No ratings yet
CH 3 3502
9 pages
Chapter 6
No ratings yet
Chapter 6
5 pages
Business Inferential Statistics Lessons
No ratings yet
Business Inferential Statistics Lessons
7 pages
Basic Statistics in Fluid Mechanics
No ratings yet
Basic Statistics in Fluid Mechanics
34 pages
Lecture03 Discrete Random Variables Ver1
No ratings yet
Lecture03 Discrete Random Variables Ver1
37 pages
Discrete Random Variables and Probability Distributions
No ratings yet
Discrete Random Variables and Probability Distributions
4 pages
Basic Probability and Statistics: Random Variables Distribution Functions Various Probability Distributions
No ratings yet
Basic Probability and Statistics: Random Variables Distribution Functions Various Probability Distributions
39 pages
Probability 2 FPM
No ratings yet
Probability 2 FPM
55 pages
Lec 01
No ratings yet
Lec 01
44 pages
2-Garment Top Thread Consumption
No ratings yet
2-Garment Top Thread Consumption
7 pages
A Stitch in Time
No ratings yet
A Stitch in Time
19 pages
8 Waly Ginger Chapter
No ratings yet
8 Waly Ginger Chapter
29 pages
What Is Moment of Resistance in Case of A Structure
No ratings yet
What Is Moment of Resistance in Case of A Structure
33 pages
Arts 8
No ratings yet
Arts 8
36 pages
Netapp Prices
No ratings yet
Netapp Prices
91 pages
Agro Based Industries
No ratings yet
Agro Based Industries
7 pages
M 5250 Pis
No ratings yet
M 5250 Pis
1 page
Resistor Color Coding LP
No ratings yet
Resistor Color Coding LP
9 pages
Tpa 3250
No ratings yet
Tpa 3250
46 pages
Cost Data FY 2018-19
No ratings yet
Cost Data FY 2018-19
109 pages
Westport Electric Corporation:: Q) What Should Westport Do About The Evaluation Problem Raised in The Case?
No ratings yet
Westport Electric Corporation:: Q) What Should Westport Do About The Evaluation Problem Raised in The Case?
4 pages
Unit Plan Working Draft Trascription and Traslation Nick and Adrian 1
No ratings yet
Unit Plan Working Draft Trascription and Traslation Nick and Adrian 1
30 pages
Bsria Guide Bg 312012 Illustrated Guide To Mechanical Building Services David Bleicher pdf download
No ratings yet
Bsria Guide Bg 312012 Illustrated Guide To Mechanical Building Services David Bleicher pdf download
37 pages
Daftar Pustaka
No ratings yet
Daftar Pustaka
10 pages
Examples The "Burying Grandma" Example College Essay
No ratings yet
Examples The "Burying Grandma" Example College Essay
2 pages
1 One-Dimensional Random Variables
No ratings yet
1 One-Dimensional Random Variables
17 pages
FCL Reflection
No ratings yet
FCL Reflection
4 pages
Karel PBX Ms38s Installation & Maintenance
100% (1)
Karel PBX Ms38s Installation & Maintenance
65 pages
Chords
No ratings yet
Chords
24 pages
Z Pressure, P (Bar) Flowrate, Q (m3/hr) Speed (RPM) Voltage (V)
No ratings yet
Z Pressure, P (Bar) Flowrate, Q (m3/hr) Speed (RPM) Voltage (V)
3 pages
WHR Design Guidelines
No ratings yet
WHR Design Guidelines
53 pages
Tutorial W2 SCES3373
No ratings yet
Tutorial W2 SCES3373
7 pages
Computer Notes KLB F3
No ratings yet
Computer Notes KLB F3
117 pages
SCO Series Cutout: Compliance With Standards Ordering Code 1475.92.030
No ratings yet
SCO Series Cutout: Compliance With Standards Ordering Code 1475.92.030
2 pages
Warehouse Management
100% (8)
Warehouse Management
35 pages
Probability and Distribution
No ratings yet
Probability and Distribution
43 pages
Mna Mini English PDF
No ratings yet
Mna Mini English PDF
1 page