Code 12 Updated

The document outlines a data analysis process using Python, focusing on fault classification from multiple datasets. It includes data loading, visualization of fault distribution, feature correlation heatmap, PCA for dimensionality reduction, and training of Random Forest and SVM models. Finally, it evaluates model performance using confusion matrices and classification reports.

Uploaded by

20112042paren

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views3 pages

Code 12 Updated

Uploaded by

20112042paren

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.model_selection import train_test_split, cross_val_score, ShuffleSplit
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
from mpl_toolkits.mplot3d import Axes3D

# Set plot styles

plt.rcParams.update({'font.size': 14, "font.family": "Times New Roman"})

# ----------------------
# Load Datasets
# ----------------------
# Read each CSV file separately
df_f0l = pd.read_csv(r'/F0L.csv')
df_f1l = pd.read_csv(r'/F1L.csv')
df_f5l = pd.read_csv(r'/F5L.csv')

# Concatenate the DataFrames into a single DataFrame

df1 = pd.concat([df_f0l, df_f1l, df_f5l], ignore_index=True)

# Add a 'Fault_Type' column to df1 based on the source file

df1['Fault_Type'] = pd.Series(['F0'] * len(df_f0l) + ['F1'] * len(df_f1l) + ['F5']
* len(df_f5l))

# Read each CSV file separately for df2

df_f0m = pd.read_csv(r'/F0M.csv')
df_f1m = pd.read_csv(r'/F1M.csv')
df_f5m = pd.read_csv(r'/F5M.csv')

# Concatenate the DataFrames into a single DataFrame

df2 = pd.concat([df_f0m, df_f1m, df_f5m], ignore_index=True)

# Add a 'Fault_Type' column to df2 based on the source file

df2['Fault_Type'] = pd.Series(['F0'] * len(df_f0m) + ['F1'] * len(df_f1m) + ['F5']
* len(df_f5m))

# ----------------------
# Data Visualization: Fault Distribution
# ----------------------
plt.figure(figsize=(5, 5))
# Assuming 'Fault_Type' is the correct column representing fault types
plt.pie(df1['Fault_Type'].value_counts(), labels=df1['Fault_Type'].unique(),
autopct='%2.1f%%', colors=sns.color_palette("pastel"))
plt.title("Fault Distribution in Limited Power Dataset")
plt.show()

# ----------------------
# Feature Correlation Heatmap
# ----------------------
X = df1.iloc[:, 1:-1] # Features
# Assuming 'Fault_Type' is the target variable column
Y = df1['Fault_Type'] # Target Labels

plt.figure(figsize=(12, 10))
sns.heatmap(X.corr(), annot=True, cmap='coolwarm', fmt=".2f")
plt.title("Feature Correlation Heatmap")
plt.show()
# ----------------------
# Data Preprocessing
# ----------------------
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2,
shuffle=True, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# ----------------------
# PCA: Dimensionality Reduction
# ----------------------
for i in range(1, 14):
pca = PCA(n_components=i)
pca.fit(X_train_scaled)
print(f"Cumulative explained variance for {i} components:
{np.sum(pca.explained_variance_ratio_):.4f}")

# Apply PCA with 2 components

pca_2 = PCA(n_components=2)
X_pca_2D = pca_2.fit_transform(X_train_scaled)
principalDf = pd.DataFrame(data=X_pca_2D, columns=['PC1', 'PC2'])
principalDf['Fault'] = np.array(y_train)

plt.figure(figsize=(10, 8))
sns.scatterplot(x=principalDf['PC1'], y=principalDf['PC2'],
hue=principalDf['Fault'], palette='Dark2', alpha=0.7)
plt.title("2D PCA Visualization")
plt.xlabel("Principal Component 1")
plt.ylabel("Principal Component 2")
plt.show()

# 3D PCA Visualization
pca_3 = PCA(n_components=3)
X_pca_3D = pca_3.fit_transform(X_train_scaled)
principalDf = pd.DataFrame(data=X_pca_3D, columns=['PC1', 'PC2', 'PC3'])
principalDf['Fault'] = np.array(y_train)

fig = plt.figure(figsize=(10, 10))

ax = fig.add_subplot(111, projection='3d')
colors = sns.color_palette("husl", len(y_train.unique()))
for fault, color in zip(y_train.unique(), colors):
indices = principalDf['Fault'] == fault
ax.scatter(principalDf.loc[indices, 'PC1'],
principalDf.loc[indices, 'PC2'],
principalDf.loc[indices, 'PC3'],
c=[color], label=fault, s=50)
ax.set_xlabel('Principal Component 1')
ax.set_ylabel('Principal Component 2')
ax.set_zlabel('Principal Component 3')
ax.set_title('3D PCA Visualization')
ax.legend()
plt.show()

# ----------------------
# Train & Evaluate Models
# ----------------------
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
rf_model.fit(X_train_scaled, y_train)
y_pred_rf = rf_model.predict(X_test_scaled)

svm_model = SVC(kernel='rbf', C=1.0, gamma='scale', random_state=42)

svm_model.fit(X_train_scaled, y_train)
y_pred_svm = svm_model.predict(X_test_scaled)

# ----------------------
# Confusion Matrix Plot
# ----------------------
def plot_confusion_matrix(y_true, y_pred, model_name):
cm = confusion_matrix(y_true, y_pred)
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt="d", cmap="viridis",
xticklabels=np.unique(y_true), yticklabels=np.unique(y_true))
plt.xlabel("Predicted Label")
plt.ylabel("True Label")
plt.title(f"Confusion Matrix - {model_name}")
plt.show()

plot_confusion_matrix(y_test, y_pred_rf, "Random Forest")

plot_confusion_matrix(y_test, y_pred_svm, "SVM")

# ----------------------
# Final Model Evaluations
# ----------------------
print("\nRandom Forest Results:")
print(f"Accuracy: {accuracy_score(y_test, y_pred_rf):.4f}")
print(classification_report(y_test, y_pred_rf))

print("\nSVM Results:")
print(f"Accuracy: {accuracy_score(y_test, y_pred_svm):.4f}")
print(classification_report(y_test, y_pred_svm))

First Quarterly Assessment in Tle-Ict
100% (1)
First Quarterly Assessment in Tle-Ict
6 pages
MXQ Pro 4K: Instruction Manual
100% (1)
MXQ Pro 4K: Instruction Manual
12 pages
DELTA IA-Robot ALL C EN Ver2023 20231026
No ratings yet
DELTA IA-Robot ALL C EN Ver2023 20231026
16 pages
E78330 PDF - 3364504 - en-US-6-3
No ratings yet
E78330 PDF - 3364504 - en-US-6-3
693 pages
Pcap 31 03
No ratings yet
Pcap 31 03
6 pages
Humidificador F&P MR850
100% (1)
Humidificador F&P MR850
67 pages
Patrick Siarry (Editor) - Metaheuristics-Springer (2016) PDF
No ratings yet
Patrick Siarry (Editor) - Metaheuristics-Springer (2016) PDF
497 pages
Mercedes-Benz Greener Manufacturing Ai
0% (1)
Mercedes-Benz Greener Manufacturing Ai
16 pages
Dvpd11 Merged Merged 27 83
No ratings yet
Dvpd11 Merged Merged 27 83
57 pages
Non-Creamy Layer Certificate: Government of Kerala
No ratings yet
Non-Creamy Layer Certificate: Government of Kerala
1 page
What Is PCA?: Image Source
No ratings yet
What Is PCA?: Image Source
17 pages
BIG DATA - Assign
No ratings yet
BIG DATA - Assign
28 pages
STD-848531 01
No ratings yet
STD-848531 01
10 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
34 pages
All-In-One PLC: KV Nano Application Guide Vol. 8
No ratings yet
All-In-One PLC: KV Nano Application Guide Vol. 8
12 pages
CP R80.20 Gaia AdminGuide
No ratings yet
CP R80.20 Gaia AdminGuide
343 pages
ML Programs
No ratings yet
ML Programs
14 pages
Sbi Yono FINAL PROJECT
No ratings yet
Sbi Yono FINAL PROJECT
46 pages
Eluthi Vaiththay Ennai
No ratings yet
Eluthi Vaiththay Ennai
126 pages
02 Practicle Bar Graphs
No ratings yet
02 Practicle Bar Graphs
20 pages
CMYK Colour Charts and Values - Mixam
No ratings yet
CMYK Colour Charts and Values - Mixam
19 pages
Shiva Teja
No ratings yet
Shiva Teja
19 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
ML Practical Solutions
No ratings yet
ML Practical Solutions
15 pages
Week 8 DS Practical
No ratings yet
Week 8 DS Practical
13 pages
Codeppsjf
No ratings yet
Codeppsjf
16 pages
Rest API Slides
No ratings yet
Rest API Slides
34 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
Internet Cafe (2) - 1
No ratings yet
Internet Cafe (2) - 1
19 pages
ML Lab File Final
No ratings yet
ML Lab File Final
17 pages
Principal Component Analysis: #Question 1
No ratings yet
Principal Component Analysis: #Question 1
6 pages
Assignment 2 Documentation
No ratings yet
Assignment 2 Documentation
15 pages
IDM Assignment
No ratings yet
IDM Assignment
15 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
6 pages
ML Assignment 01 Code
No ratings yet
ML Assignment 01 Code
21 pages
Assignment
No ratings yet
Assignment
24 pages
Dbscan Implementation in Python
No ratings yet
Dbscan Implementation in Python
5 pages
Module 1 Important Questions Solved
No ratings yet
Module 1 Important Questions Solved
14 pages
Predictivemaintenance FaultDetection
No ratings yet
Predictivemaintenance FaultDetection
12 pages
Main - Py Text File
No ratings yet
Main - Py Text File
5 pages
Market Analysis by Pchandru
No ratings yet
Market Analysis by Pchandru
10 pages
Pca 2382487
No ratings yet
Pca 2382487
8 pages
ML Lab - Exp1-10
No ratings yet
ML Lab - Exp1-10
4 pages
Feature Exploration PCA MNIST
No ratings yet
Feature Exploration PCA MNIST
4 pages
2020 - BCA 2 Sem Programming Through C-IISem-BCA2CC08
No ratings yet
2020 - BCA 2 Sem Programming Through C-IISem-BCA2CC08
17 pages
User Manual: HGM1750 Automatic Control Module
No ratings yet
User Manual: HGM1750 Automatic Control Module
10 pages
DS Prac 9
No ratings yet
DS Prac 9
3 pages
AML Lab
No ratings yet
AML Lab
14 pages
Justinrhill 2018@
No ratings yet
Justinrhill 2018@
9 pages
Linear SVM: 'Target'
No ratings yet
Linear SVM: 'Target'
13 pages
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 8
No ratings yet
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 8
31 pages
From Import Import As Import As From Import From Import From Import From Import
No ratings yet
From Import Import As Import As From Import From Import From Import From Import
9 pages
Untitled Document-2-1-13-7-11.4
No ratings yet
Untitled Document-2-1-13-7-11.4
5 pages
Syllabus - Malware Analysis and Development
No ratings yet
Syllabus - Malware Analysis and Development
4 pages
DAI Amberish LAB ASSIGNMENT 3
No ratings yet
DAI Amberish LAB ASSIGNMENT 3
7 pages
Advanced Payroll Software & HRIS To Enhance Your HR Business Process
No ratings yet
Advanced Payroll Software & HRIS To Enhance Your HR Business Process
15 pages
Spectral Clustering
No ratings yet
Spectral Clustering
5 pages
Py 2
No ratings yet
Py 2
7 pages
Compute2
No ratings yet
Compute2
10 pages
Ahmed Basha Shaik Ahmed Basha Shaik: Software Programmer - KJ Systems (India) Private Limited
No ratings yet
Ahmed Basha Shaik Ahmed Basha Shaik: Software Programmer - KJ Systems (India) Private Limited
5 pages
Program - 3
No ratings yet
Program - 3
4 pages
Code 1
No ratings yet
Code 1
3 pages
Implementing PCA in Python With Scikit
No ratings yet
Implementing PCA in Python With Scikit
6 pages
Experiment 10
No ratings yet
Experiment 10
3 pages
Modal Exercises
No ratings yet
Modal Exercises
3 pages
What Is PCA: When Should You Use PCA?
No ratings yet
What Is PCA: When Should You Use PCA?
21 pages
Văn Bản
No ratings yet
Văn Bản
3 pages
Computer Literacy Test 2
No ratings yet
Computer Literacy Test 2
11 pages
Practical 5
No ratings yet
Practical 5
6 pages
EDA Plots Code
No ratings yet
EDA Plots Code
13 pages
Principal Component Analysis Notes : Info
No ratings yet
Principal Component Analysis Notes : Info
22 pages
Orca Upgrades V5.3.B
No ratings yet
Orca Upgrades V5.3.B
3 pages
K-Means 10
No ratings yet
K-Means 10
2 pages
Import Pandas As PD
No ratings yet
Import Pandas As PD
2 pages
AIML
No ratings yet
AIML
5 pages
GPT Suggestions Final Project
No ratings yet
GPT Suggestions Final Project
6 pages
Unit1 ML Programs
No ratings yet
Unit1 ML Programs
5 pages
Graph Analysis Code
No ratings yet
Graph Analysis Code
2 pages
Clustering
No ratings yet
Clustering
1 page
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
Face Recognition Using PCA
No ratings yet
Face Recognition Using PCA
8 pages
Nouns Hindi
No ratings yet
Nouns Hindi
6 pages
ML Short
No ratings yet
ML Short
2 pages
Slip Clustering
No ratings yet
Slip Clustering
2 pages
EN CM900 Cutting Machine
No ratings yet
EN CM900 Cutting Machine
2 pages
Fem2063 Data Analytics - May 2020 Lab Practice 5 (Week 6)
No ratings yet
Fem2063 Data Analytics - May 2020 Lab Practice 5 (Week 6)
8 pages
SK-300 Tube Socket
No ratings yet
SK-300 Tube Socket
2 pages
Unnamed: 0 Sample Rock - Type Sio2 Tio2 Al2O3 Fe2O3 Mno Mgo Cao Na2O K2O P2O5 0 0 1 1 2 2 3 3 4 4
No ratings yet
Unnamed: 0 Sample Rock - Type Sio2 Tio2 Al2O3 Fe2O3 Mno Mgo Cao Na2O K2O P2O5 0 0 1 1 2 2 3 3 4 4
1 page
Hacking PSP
No ratings yet
Hacking PSP
6 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet