0% found this document useful (0 votes)

44 views39 pages

Machine Learning Numpy

The document discusses several machine learning concepts including text classification using Bayes' theorem, k-means clustering, and principal component analysis (PCA). It explains k-means clustering as an iterative process of calculating distances between data points and cluster centroids, and updating the centroids. It also discusses calculating the elbow method to determine the optimal number of clusters. The document provides three key uses of PCA: 1) data visualization by projecting high-dimensional data onto two dimensions, 2) reducing noise by rejecting less informative attributes, and 3) reducing memory usage by dropping redundant dimensions. It illustrates PCA by projecting random data points and showing how different component axes can better distinguish the classes.

Uploaded by

Amalina Sulaiman

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

44 views39 pages

Machine Learning Numpy

Uploaded by

Amalina Sulaiman

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 39

Machine learning numpy,

school of AI Kuala Lumpur

Husein Zolkepli
Bayes theorem text classification

Likelihood probability, probability Prior probability,

of vector X when class C probability of class C
going to occur

Posterior probability, probability of Marginal probability, probability of

class C going to happen when vector X, most of the case, its
vector is X unobserve
Rebranding bayes theorem
Rebranding bayes theorem
Rebranding bayes theorem
Rebranding bayes theorem
Rebranding bayes theorem
Text classification
index i like chicken meat label

1 1 1 1 0 0

2 1 1 0 1 1
Kmean

1. Initiate random centroids, or use kmeans++.

Kmean

2. Keep iterating to calculate distances between individuals and centroids, and

mean clustered individuals.
Kmean
3. To calculate ELBOW,

Iterate N K-means, every iteration, calculate sum of distances between centroids

and grouped individuals, and plot.
Principal Component Analysis
Principal Component Analysis
1. Visualization
Principal Component Analysis
1. Visualization

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b
Principal Component Analysis
1. Visualization

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

It does not makes sense if you want to plot this table into a vector space, we have
7 dimensions!
Principal Component Analysis
2. Reduce noise

Let say you want to study stress level of a student, based on,
Principal Component Analysis
2. Reduce noise

Let say you want to study stress level of a student, based on,

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

Not all these 7 dimensions bring important information! We want to reject some
attributes.
Principal Component Analysis
2. Reduce noise

Let say you want to study stress level of a student, based on,

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

Not all these 7 dimensions bring important information! We want to reject some
attributes. Maybe 7 does not hurt much. What happen if you have 512 * 512 * 3
(image) dimension?! insane!
Principal Component Analysis
3. Reduce memory (computer science)

Height, x Weight, y Bmi, z Score, a Hair Age, c Steps, d

length, b

Let say a float took 1 bytes, we have 7 columns and 1 billion of rows.

7 * 1,000,000,000 * 1 = 7,000,000,000 bytes == 70 GB!

Drop a column will save us 10 GB of memory!

Principal Component Analysis
I have data points
Principal Component Analysis
I have data points

I have data points

Principal Component Analysis
I have data points

I have data points

Let say, this plane is Rn , we only visualize it on R2 , I want to visualize the data
points at axis-0, which is x-axis.
Principal Component Analysis
Principal Component Analysis
Principal Component Analysis
Principal Component Analysis

We cannot distinguish between oranges and blues!

Principal Component Analysis

We cannot distinguish between oranges and blues! How about axis-2, which is,
axis-y?
Principal Component Analysis
Principal Component Analysis

It is quite okay, just a few data points overlapped each others.

Principal Component Analysis

It is quite okay, just a few data points overlapped each others. But we don’t
overlapping right?!
Principal component analysis

Eigenvector, R1, of our

covariance matrix
Principal component analysis
Principal component analysis
Principal component analysis

Im too tired man to draw one-by-one :(

Principal component analysis
How to make sense of it?
Principal component analysis
Principal component analysis
Principal component analysis

[5, 4], [5, -4],

[4, 6] [-4, 6]

Value 1 is y axis, 0 correlation

[5, 0],
[0, 1]
Principal component analysis

[1., 0.], lambda = 5

[5, 0],
[0, 1]

l, v = np.linalg.eig(np.array([[5,0],[0,1]]))
l, v
(array([5., 1.]), array([[1., 0.],
[0., 1.]]))

Chapter 10 Borgnakke Sonntag
67% (3)
Chapter 10 Borgnakke Sonntag
215 pages
IDS 4 (Week 14)
No ratings yet
IDS 4 (Week 14)
66 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
8 pages
Advanced Data Analysis Techniques 2
No ratings yet
Advanced Data Analysis Techniques 2
32 pages
ML (Unit 5)
No ratings yet
ML (Unit 5)
34 pages
EDAB Module 5 Singular Value Decomposition (SVD)
No ratings yet
EDAB Module 5 Singular Value Decomposition (SVD)
58 pages
10-2 Data Analysis and Pre-Processing Part 4 PDF
No ratings yet
10-2 Data Analysis and Pre-Processing Part 4 PDF
23 pages
Lecture-3 Unit 3
No ratings yet
Lecture-3 Unit 3
22 pages
Dimensionality Reduction (Pca)
No ratings yet
Dimensionality Reduction (Pca)
32 pages
What Is Principal Component Analysis For Dummies
No ratings yet
What Is Principal Component Analysis For Dummies
6 pages
5 Data Pre Processing III
No ratings yet
5 Data Pre Processing III
30 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
27 pages
Data Analytics Courses in Pune
No ratings yet
Data Analytics Courses in Pune
25 pages
Advanced Color Image Processing and Analysis
No ratings yet
Advanced Color Image Processing and Analysis
513 pages
What Is PCA: When Should You Use PCA?
No ratings yet
What Is PCA: When Should You Use PCA?
21 pages
Machine Learning: Unsupervised Learning Dimensionality Reduction K-Means Clustering
No ratings yet
Machine Learning: Unsupervised Learning Dimensionality Reduction K-Means Clustering
28 pages
315 F19 27 Pca1
No ratings yet
315 F19 27 Pca1
28 pages
Module 3
No ratings yet
Module 3
41 pages
Dimensionality Reduction: Motivation I: Data Compression
No ratings yet
Dimensionality Reduction: Motivation I: Data Compression
35 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
34 pages
Principal Component Analysis
100% (1)
Principal Component Analysis
10 pages
Chapter Five Principal Comonent Analysis (PCA)
No ratings yet
Chapter Five Principal Comonent Analysis (PCA)
33 pages
Clustering and Dimensionality Reduction Techniques PCA T SNE K Means
No ratings yet
Clustering and Dimensionality Reduction Techniques PCA T SNE K Means
15 pages
Data Mining For Business Analyst Assignment
100% (1)
Data Mining For Business Analyst Assignment
9 pages
What Is PCA?: Image Source
No ratings yet
What Is PCA?: Image Source
17 pages
PCA
100% (1)
PCA
33 pages
Module 3 ML
No ratings yet
Module 3 ML
19 pages
Assignment
No ratings yet
Assignment
24 pages
P-3.1.4 - Pca
No ratings yet
P-3.1.4 - Pca
44 pages
00 - SpaceX - Final Presentation - JF
100% (1)
00 - SpaceX - Final Presentation - JF
43 pages
U5@-Data Reduction
No ratings yet
U5@-Data Reduction
22 pages
Unit 3
No ratings yet
Unit 3
28 pages
Principal Component Analysis (PCA)
No ratings yet
Principal Component Analysis (PCA)
18 pages
Principal Component Analysis and Cluster Analysis
No ratings yet
Principal Component Analysis and Cluster Analysis
14 pages
Principal Component Analysis Concepts
No ratings yet
Principal Component Analysis Concepts
16 pages
Remote Sensing Assignment
No ratings yet
Remote Sensing Assignment
10 pages
STAT502
No ratings yet
STAT502
13 pages
DR Pca
No ratings yet
DR Pca
22 pages
Principal Component Analysis (PCA) Explained - Built in
No ratings yet
Principal Component Analysis (PCA) Explained - Built in
11 pages
Ai Notes V
No ratings yet
Ai Notes V
7 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
8 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
19 pages
1501589578da Mod15 Q1 e Text
No ratings yet
1501589578da Mod15 Q1 e Text
9 pages
Dimensional Reduction in R
No ratings yet
Dimensional Reduction in R
24 pages
PCA Complete
No ratings yet
PCA Complete
8 pages
6 Principal Component Analysis
No ratings yet
6 Principal Component Analysis
7 pages
Program 3
No ratings yet
Program 3
7 pages
Love Report
No ratings yet
Love Report
7 pages
Electroni Tongue Seminar Report
75% (4)
Electroni Tongue Seminar Report
27 pages
PCA - Ensemble Classifiers
No ratings yet
PCA - Ensemble Classifiers
9 pages
Sanjay Singh Principal Component Analysis
No ratings yet
Sanjay Singh Principal Component Analysis
9 pages
U4 - PCA - 5th Sem - DS
No ratings yet
U4 - PCA - 5th Sem - DS
14 pages
Reduce Data Dimensionality Using PCA
No ratings yet
Reduce Data Dimensionality Using PCA
6 pages
Pca&kmean
No ratings yet
Pca&kmean
6 pages
Love Report 1
No ratings yet
Love Report 1
10 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
6 pages
Kinya Sharon - Ass2 - Machine Learning
No ratings yet
Kinya Sharon - Ass2 - Machine Learning
12 pages
PCA Finds Representation Through Linear Transformation
No ratings yet
PCA Finds Representation Through Linear Transformation
28 pages
Unit II - RM Notes
No ratings yet
Unit II - RM Notes
12 pages
PCA Notes
No ratings yet
PCA Notes
3 pages
Dimensionality Reduction (Principal Component Analysis)
No ratings yet
Dimensionality Reduction (Principal Component Analysis)
12 pages
Linear Regression: Dimensionality Reduction
No ratings yet
Linear Regression: Dimensionality Reduction
7 pages
The Intuition Behind PCA: Machine Learning Assignment
No ratings yet
The Intuition Behind PCA: Machine Learning Assignment
11 pages
Principal Component Analysis vs. Exploratory Factor Analysis
No ratings yet
Principal Component Analysis vs. Exploratory Factor Analysis
11 pages
Pca Tutorial
No ratings yet
Pca Tutorial
11 pages
Agricolae PDF
100% (1)
Agricolae PDF
152 pages
An Overview On Indications and Chemical Composition of Aromatic Waters (Hydrosols)
No ratings yet
An Overview On Indications and Chemical Composition of Aromatic Waters (Hydrosols)
18 pages
AADE 03 NTCE 35 Power
No ratings yet
AADE 03 NTCE 35 Power
9 pages
Effects of A Novel Compound On Fungal Contamination
No ratings yet
Effects of A Novel Compound On Fungal Contamination
30 pages
Data Science AI Program Brochure
No ratings yet
Data Science AI Program Brochure
27 pages
Patrick Ahern-Informative Nature vs. Nurture
No ratings yet
Patrick Ahern-Informative Nature vs. Nurture
4 pages
HW 1
No ratings yet
HW 1
9 pages
HW#5-Solutions: Steven Tipton: The University of Tulsa
No ratings yet
HW#5-Solutions: Steven Tipton: The University of Tulsa
10 pages
Remain in Its State of Rest or of Uniform Motion in A Straight Line
No ratings yet
Remain in Its State of Rest or of Uniform Motion in A Straight Line
3 pages
Sohail DataScientist
No ratings yet
Sohail DataScientist
3 pages
Schlkopf 1998
No ratings yet
Schlkopf 1998
57 pages
Kus Preparation
No ratings yet
Kus Preparation
3 pages
Unit 2 Notes
No ratings yet
Unit 2 Notes
49 pages
Becser Norbert en
No ratings yet
Becser Norbert en
254 pages
Geology 3153: Sedimentary Rocks and Processes Guide To Using Past Exams
No ratings yet
Geology 3153: Sedimentary Rocks and Processes Guide To Using Past Exams
1 page
Pin Diameter (MM) Pin Diameter (Pixel) Factor
No ratings yet
Pin Diameter (MM) Pin Diameter (Pixel) Factor
2 pages
Overview of Factor Analysis
No ratings yet
Overview of Factor Analysis
11 pages
DS Internship Report
No ratings yet
DS Internship Report
34 pages
Operator Learning Algorithms and Analysis
No ratings yet
Operator Learning Algorithms and Analysis
36 pages
51 DA5400 - FML51 - 20250501 ProblemSet06
No ratings yet
51 DA5400 - FML51 - 20250501 ProblemSet06
4 pages
Blanz V, Vetter T:: Face Recognition Based On A 3D Morphable Model
No ratings yet
Blanz V, Vetter T:: Face Recognition Based On A 3D Morphable Model
58 pages
1 s2.0 S0959652624033961 Main
No ratings yet
1 s2.0 S0959652624033961 Main
11 pages
A Digitalization Strategy For Quality Control in Food Industry Based On Artificial Intelligence Techniques
No ratings yet
A Digitalization Strategy For Quality Control in Food Industry Based On Artificial Intelligence Techniques
6 pages
Gonçalves Et Al - 2021
No ratings yet
Gonçalves Et Al - 2021
21 pages
pp9 - v4 - Mejorado
No ratings yet
pp9 - v4 - Mejorado
6 pages
Buren Et Al, 2021
No ratings yet
Buren Et Al, 2021
12 pages
Spiritual Mind-5 Times Katam - Cara2 Solat - Mantapkan Aqidah - Like Facebook Agama - A - As - DD - FF - Ss - QQ - 33
No ratings yet
Spiritual Mind-5 Times Katam - Cara2 Solat - Mantapkan Aqidah - Like Facebook Agama - A - As - DD - FF - Ss - QQ - 33
1 page
Math Lab: Mondays - Thursdays, 2:00-6:00 PM, KEP 379
No ratings yet
Math Lab: Mondays - Thursdays, 2:00-6:00 PM, KEP 379
1 page
Knowledge Discovery in Databases: "We Are Drowning in Information and Starving For Knowledge"
No ratings yet
Knowledge Discovery in Databases: "We Are Drowning in Information and Starving For Knowledge"
22 pages
Social Sciences Humanities Open
No ratings yet
Social Sciences Humanities Open
14 pages
Data Mining Methods: Data Pre-Processing: Prof. Dr. Christina Andersson
No ratings yet
Data Mining Methods: Data Pre-Processing: Prof. Dr. Christina Andersson
33 pages
Single Image Super Resolution of MR Images Regularized With Gradient Profile Sharpness and Induced Sparsity
No ratings yet
Single Image Super Resolution of MR Images Regularized With Gradient Profile Sharpness and Induced Sparsity
14 pages
Small Ruminant Research: Irma Caro, Rocío Alaiz-Rodríguez, Victor González-Castro, Emiliano J. Quinto, Javier Mateo
No ratings yet
Small Ruminant Research: Irma Caro, Rocío Alaiz-Rodríguez, Victor González-Castro, Emiliano J. Quinto, Javier Mateo
6 pages
Lesson 07 7.02 Knowledge Check
No ratings yet
Lesson 07 7.02 Knowledge Check
7 pages
Unit 5 Mfds
No ratings yet
Unit 5 Mfds
4 pages