Principal Component Analysis For Data Science

Dimensionality reduction techniques like principal component analysis (PCA) can reduce the dimensionality of large datasets by transforming the data into a new coordinate system. The document demonstrates applying PCA to reduce the dimensions of economic trade data from multiple countries over years. PCA identifies the principal components that capture the most variance in the dataset and allows projecting the data onto a new 2D space for easier visualization and analysis.

Uploaded by

shivaybhargava33

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views

Principal Component Analysis For Data Science

Uploaded by

shivaybhargava33

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

Dimensionality Reduction

Maximum Data is clustered in one area

Eigen Value: New Dimension Values (Magnitude, Variance)
Eigen vector: Magnitude of information (Slice)
Multiple Slice

PCA - Principle Component Analysis

Dimensionality Reduction (Patient Data)

Import Libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import os

Load Data Set

os.chdir('C:\\Noble\\Training\\Top Mentor\\Training\\Data Set\\')
df = pd.read_csv('trans_us.csv', index_col = 0, thousands = ',')
df

Update Row and Column Headings

df.index.names = ['Country']
df.columns.names = ['Years']
df
Check for Null Values
df.isna().sum()

Create Model
from sklearn.decomposition import PCA
pca = PCA(n_components=2)
pca.fit(df)

Create PCA with two variables

PCA1 = pca.transform(df)
pd.DataFrame(PCA1)

Convert output to Data Frame

PCA2= pd.DataFrame(PCA1)
PCA2.index = df.index
PCA2.columns = ['PC1','PC2']
PCA2.head(50)

Display the variance Percentage

pd.DataFrame(pca.explained_variance_ratio_)

PCA with n -components = None

from sklearn.decomposition import PCA
pca = PCA()
pca.fit(df)

Transform and display data

PCA1 = pca.transform(df)
pd.DataFrame(PCA1)

MACHINE LEARNING manual
No ratings yet
MACHINE LEARNING manual
36 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
ml short
No ratings yet
ml short
2 pages
PRJ Car Price Prediction For Data Science
No ratings yet
PRJ Car Price Prediction For Data Science
10 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
ml lab
No ratings yet
ml lab
14 pages
Kanish 9-12
No ratings yet
Kanish 9-12
18 pages
ModuleAr Merged
No ratings yet
ModuleAr Merged
42 pages
Data_Mining_Practicals_Complete
No ratings yet
Data_Mining_Practicals_Complete
13 pages
Ml Solution
No ratings yet
Ml Solution
60 pages
pratham ML
No ratings yet
pratham ML
14 pages
Data Mining & Data Science Practical Slips
No ratings yet
Data Mining & Data Science Practical Slips
45 pages
Data Analysis W Pandas
No ratings yet
Data Analysis W Pandas
4 pages
Rainfall Prediction using Machine Learning
No ratings yet
Rainfall Prediction using Machine Learning
9 pages
Pratibha Sikheriya (Data Mining)
No ratings yet
Pratibha Sikheriya (Data Mining)
4 pages
Data Science Record_05
No ratings yet
Data Science Record_05
20 pages
ML LAB FILE (2)
No ratings yet
ML LAB FILE (2)
48 pages
Vid 4
No ratings yet
Vid 4
6 pages
Decision Trees.
No ratings yet
Decision Trees.
1 page
Exercise 3
No ratings yet
Exercise 3
12 pages
Compute2
No ratings yet
Compute2
10 pages
Aayushi ML File
No ratings yet
Aayushi ML File
37 pages
My Code
No ratings yet
My Code
7 pages
EX_1
No ratings yet
EX_1
3 pages
Module2_Python_programs
No ratings yet
Module2_Python_programs
5 pages
ML File
No ratings yet
ML File
37 pages
Untitled document-2-1-13-7-11.4
No ratings yet
Untitled document-2-1-13-7-11.4
5 pages
Correction
No ratings yet
Correction
3 pages
ML Lab File Final.docx - Google Docs
No ratings yet
ML Lab File Final.docx - Google Docs
17 pages
ML With Python Practical
No ratings yet
ML With Python Practical
22 pages
Rajeek8 12
No ratings yet
Rajeek8 12
21 pages
DWDM Lab Manual
No ratings yet
DWDM Lab Manual
32 pages
ML Remaining
No ratings yet
ML Remaining
17 pages
Anemia Code
No ratings yet
Anemia Code
33 pages
Abhiml ML File
No ratings yet
Abhiml ML File
74 pages
MLLabManual
No ratings yet
MLLabManual
24 pages
Machine Learning Lab Manual (1)
No ratings yet
Machine Learning Lab Manual (1)
42 pages
AIML 01 Merged
No ratings yet
AIML 01 Merged
25 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
Locally Weighted
No ratings yet
Locally Weighted
3 pages
Dataframe programs
No ratings yet
Dataframe programs
12 pages
BCSL606 MACHINE LEARNING LAB
No ratings yet
BCSL606 MACHINE LEARNING LAB
33 pages
629 ML Assignment
No ratings yet
629 ML Assignment
6 pages
Data Science Practical
No ratings yet
Data Science Practical
22 pages
python_for_rf
No ratings yet
python_for_rf
22 pages
DS-Food
No ratings yet
DS-Food
18 pages
LR Model
No ratings yet
LR Model
2 pages
Pandas Cheat Sheet
100% (2)
Pandas Cheat Sheet
6 pages
Experiment No.:1: Program
No ratings yet
Experiment No.:1: Program
7 pages
Data Science Manual
No ratings yet
Data Science Manual
16 pages
poojitha 5
No ratings yet
poojitha 5
6 pages
21CSC305P Ml - Lab Programs 1 -9
No ratings yet
21CSC305P Ml - Lab Programs 1 -9
36 pages
ML lab manual
No ratings yet
ML lab manual
25 pages
ML Lab Manual
No ratings yet
ML Lab Manual
24 pages
Untitled Document
No ratings yet
Untitled Document
19 pages
Additional Program
No ratings yet
Additional Program
573 pages
Ml Lab Manual
No ratings yet
Ml Lab Manual
36 pages
Lab Manual - MachineLearningLaboratory-DR.vaishnavi (1)
No ratings yet
Lab Manual - MachineLearningLaboratory-DR.vaishnavi (1)
71 pages
EX-02-Data manipulation pandas matplot
No ratings yet
EX-02-Data manipulation pandas matplot
9 pages
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
From Everand
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
Manish Soni
No ratings yet
PRJ Movie Recommendation Data Science..
No ratings yet
PRJ Movie Recommendation Data Science..
7 pages
SL Classification For Data Science..
No ratings yet
SL Classification For Data Science..
4 pages
Matplotlib For Data Science..
No ratings yet
Matplotlib For Data Science..
11 pages
Machine Learning Project Presentation
No ratings yet
Machine Learning Project Presentation
14 pages