0% found this document useful (0 votes)

10 views3 pages

code 1

The document outlines a data analysis workflow using Python libraries to load datasets, visualize fault distributions, and preprocess data for machine learning. It employs PCA for dimensionality reduction and trains Random Forest and SVM models, evaluating their performance with confusion matrices and classification reports. The results highlight the accuracy and effectiveness of the models in classifying faults in the dataset.

Uploaded by

20112042paren

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views3 pages

code 1

Uploaded by

20112042paren

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.model_selection import train_test_split, cross_val_score, ShuffleSplit
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
from mpl_toolkits.mplot3d import Axes3D

# Set plot styles

plt.rcParams.update({'font.size': 14, "font.family": "Times New Roman"})

# ----------------------
# Load Datasets
# ----------------------
df1 = pd.read_csv(r'/F0L.csv, /F1L.csv, /F5L.csv')
df2 = pd.read_csv(r'/F0M.csv')

# ----------------------
# Data Visualization: Fault Distribution
# ----------------------
plt.figure(figsize=(5, 5))
plt.pie(df1['label'].value_counts(), labels=df1['label'].unique(), autopct='%2.1f%
%', colors=sns.color_palette("pastel"))
plt.title("Fault Distribution in Limited Power Dataset")
plt.show()

# ----------------------
# Feature Correlation Heatmap
# ----------------------
X = df1.iloc[:, 1:-1] # Features
Y = df1.iloc[:, -1] # Target Labels

plt.figure(figsize=(12, 10))
sns.heatmap(X.corr(), annot=True, cmap='coolwarm', fmt=".2f")
plt.title("Feature Correlation Heatmap")
plt.show()

# ----------------------
# Data Preprocessing
# ----------------------
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2,
shuffle=True, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# ----------------------
# PCA: Dimensionality Reduction
# ----------------------
for i in range(1, 14):
pca = PCA(n_components=i)
pca.fit(X_train_scaled)
print(f"Cumulative explained variance for {i} components:
{np.sum(pca.explained_variance_ratio_):.4f}")
# Apply PCA with 2 components
pca_2 = PCA(n_components=2)
X_pca_2D = pca_2.fit_transform(X_train_scaled)
principalDf = pd.DataFrame(data=X_pca_2D, columns=['PC1', 'PC2'])
principalDf['Fault'] = np.array(y_train)

plt.figure(figsize=(10, 8))
sns.scatterplot(x=principalDf['PC1'], y=principalDf['PC2'],
hue=principalDf['Fault'], palette='Dark2', alpha=0.7)
plt.title("2D PCA Visualization")
plt.xlabel("Principal Component 1")
plt.ylabel("Principal Component 2")
plt.show()

# 3D PCA Visualization
pca_3 = PCA(n_components=3)
X_pca_3D = pca_3.fit_transform(X_train_scaled)
principalDf = pd.DataFrame(data=X_pca_3D, columns=['PC1', 'PC2', 'PC3'])
principalDf['Fault'] = np.array(y_train)

fig = plt.figure(figsize=(10, 10))

ax = fig.add_subplot(111, projection='3d')
colors = sns.color_palette("husl", len(y_train.unique()))
for fault, color in zip(y_train.unique(), colors):
indices = principalDf['Fault'] == fault
ax.scatter(principalDf.loc[indices, 'PC1'],
principalDf.loc[indices, 'PC2'],
principalDf.loc[indices, 'PC3'],
c=[color], label=fault, s=50)
ax.set_xlabel('Principal Component 1')
ax.set_ylabel('Principal Component 2')
ax.set_zlabel('Principal Component 3')
ax.set_title('3D PCA Visualization')
ax.legend()
plt.show()

# ----------------------
# Train & Evaluate Models
# ----------------------
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
rf_model.fit(X_train_scaled, y_train)
y_pred_rf = rf_model.predict(X_test_scaled)

svm_model = SVC(kernel='rbf', C=1.0, gamma='scale', random_state=42)

svm_model.fit(X_train_scaled, y_train)
y_pred_svm = svm_model.predict(X_test_scaled)

# ----------------------
# Confusion Matrix Plot
# ----------------------
def plot_confusion_matrix(y_true, y_pred, model_name):
cm = confusion_matrix(y_true, y_pred)
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt="d", cmap="viridis",
xticklabels=np.unique(y_true), yticklabels=np.unique(y_true))
plt.xlabel("Predicted Label")
plt.ylabel("True Label")
plt.title(f"Confusion Matrix - {model_name}")
plt.show()
plot_confusion_matrix(y_test, y_pred_rf, "Random Forest")
plot_confusion_matrix(y_test, y_pred_svm, "SVM")

# ----------------------
# Final Model Evaluations
# ----------------------
print("\nRandom Forest Results:")
print(f"Accuracy: {accuracy_score(y_test, y_pred_rf):.4f}")
print(classification_report(y_test, y_pred_rf))

print("\nSVM Results:")
print(f"Accuracy: {accuracy_score(y_test, y_pred_svm):.4f}")
print(classification_report(y_test, y_pred_svm))

Focus On Teaching - Jim Knight
No ratings yet
Focus On Teaching - Jim Knight
213 pages
Image Processing
No ratings yet
Image Processing
5 pages
Mercedes-Benz Greener Manufacturing Ai
0% (1)
Mercedes-Benz Greener Manufacturing Ai
16 pages
Psycholinguistic. Language, Mind and Word 2nd Edition Danny Steinberg PDF
100% (2)
Psycholinguistic. Language, Mind and Word 2nd Edition Danny Steinberg PDF
104 pages
code 12 updated
No ratings yet
code 12 updated
3 pages
import pandas as pd
No ratings yet
import pandas as pd
2 pages
AML_lab[1] (1)
No ratings yet
AML_lab[1] (1)
14 pages
NF Assighment4
No ratings yet
NF Assighment4
5 pages
Market analysis by pchandru
No ratings yet
Market analysis by pchandru
10 pages
Clustering
No ratings yet
Clustering
1 page
From Import Import As Import As From Import From Import From Import From Import
No ratings yet
From Import Import As Import As From Import From Import From Import From Import
9 pages
graph_analysis_code
No ratings yet
graph_analysis_code
2 pages
Random Forest 1 Image
No ratings yet
Random Forest 1 Image
5 pages
Recsify Technologies Assignment
No ratings yet
Recsify Technologies Assignment
10 pages
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
100% (1)
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
73 pages
Vertopal.com Experiment4
No ratings yet
Vertopal.com Experiment4
3 pages
Linear SVM: 'Target'
No ratings yet
Linear SVM: 'Target'
13 pages
ml
No ratings yet
ml
11 pages
Slip Clustering
No ratings yet
Slip Clustering
2 pages
Machine Failure Prediction
No ratings yet
Machine Failure Prediction
11 pages
Untitled document-2-1-13-7-11.4
No ratings yet
Untitled document-2-1-13-7-11.4
5 pages
graph_analysis2_code
No ratings yet
graph_analysis2_code
2 pages
graph_analysis3_code
No ratings yet
graph_analysis3_code
2 pages
codeppsjf
No ratings yet
codeppsjf
16 pages
Main.py Text File
No ratings yet
Main.py Text File
5 pages
Dbscan implementation in python
No ratings yet
Dbscan implementation in python
5 pages
ml-1
No ratings yet
ml-1
11 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
import numpy as np
No ratings yet
import numpy as np
4 pages
Aiml 5-8
No ratings yet
Aiml 5-8
19 pages
Annex e Gui
No ratings yet
Annex e Gui
8 pages
Tutorial Classification Py
No ratings yet
Tutorial Classification Py
7 pages
ML Lab File Final.docx - Google Docs
No ratings yet
ML Lab File Final.docx - Google Docs
17 pages
vertopal.com_DAI_Amberish_LAB_ASSIGNMENT_3 (1)
No ratings yet
vertopal.com_DAI_Amberish_LAB_ASSIGNMENT_3 (1)
7 pages
Ml Short Code_under Updating
No ratings yet
Ml Short Code_under Updating
4 pages
ML Assignment 5
No ratings yet
ML Assignment 5
8 pages
Assignment 3
No ratings yet
Assignment 3
3 pages
Unit1 ML Programs
No ratings yet
Unit1 ML Programs
5 pages
Da Programs
No ratings yet
Da Programs
10 pages
Online Payment Fraud Detection Using Machine Learning
No ratings yet
Online Payment Fraud Detection Using Machine Learning
2 pages
Unnamed: 0 Sample Rock - Type Sio2 Tio2 Al2O3 Fe2O3 Mno Mgo Cao Na2O K2O P2O5 0 0 1 1 2 2 3 3 4 4
No ratings yet
Unnamed: 0 Sample Rock - Type Sio2 Tio2 Al2O3 Fe2O3 Mno Mgo Cao Na2O K2O P2O5 0 0 1 1 2 2 3 3 4 4
1 page
Ex 6,EX 7 AIML
No ratings yet
Ex 6,EX 7 AIML
9 pages
AAM CODES
No ratings yet
AAM CODES
8 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
ARBOL DEUDAS
No ratings yet
ARBOL DEUDAS
5 pages
Predictivemaintenance FaultDetection
No ratings yet
Predictivemaintenance FaultDetection
12 pages
A) What Is Motivation Behind Ensemble Methods? Give Your Answer in Probabilistic Terms
100% (1)
A) What Is Motivation Behind Ensemble Methods? Give Your Answer in Probabilistic Terms
6 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
Code
No ratings yet
Code
6 pages
Import Numpy As NP Import Pandas As PD
No ratings yet
Import Numpy As NP Import Pandas As PD
7 pages
Ml Lab Experiment Shortened With Same Output
No ratings yet
Ml Lab Experiment Shortened With Same Output
6 pages
Compute2
No ratings yet
Compute2
10 pages
Machine Downtime Prediction
No ratings yet
Machine Downtime Prediction
17 pages
Fem2063 Data Analytics - May 2020 Lab Practice 5 (Week 6)
No ratings yet
Fem2063 Data Analytics - May 2020 Lab Practice 5 (Week 6)
8 pages
PYHTONPRACT
No ratings yet
PYHTONPRACT
4 pages
Ex No 6
No ratings yet
Ex No 6
3 pages
Mll
No ratings yet
Mll
2 pages
Numpy NP Sklearn - Cluster Sklearn Sklearn - Datasets Sklearn - Preprocessing
No ratings yet
Numpy NP Sklearn - Cluster Sklearn Sklearn - Datasets Sklearn - Preprocessing
1 page
Week 8
No ratings yet
Week 8
11 pages
KMeans Clustering
No ratings yet
KMeans Clustering
1 page
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet
A Comparative Study Between Shuttle Cars and Battery Haulers
No ratings yet
A Comparative Study Between Shuttle Cars and Battery Haulers
5 pages
Nsi Mi Ele VMC Vector Measurement Controller v23
No ratings yet
Nsi Mi Ele VMC Vector Measurement Controller v23
5 pages
Vo Trong Nghia
No ratings yet
Vo Trong Nghia
5 pages
Transport Design A Travel History
No ratings yet
Transport Design A Travel History
241 pages
Temperature Measurement Second Edition L. Michalski - Own the ebook now with all fully detailed chapters
100% (3)
Temperature Measurement Second Edition L. Michalski - Own the ebook now with all fully detailed chapters
53 pages
LNL Notes
No ratings yet
LNL Notes
4 pages
Topology Rules Poster
No ratings yet
Topology Rules Poster
1 page
LMS UNIT 34docx
No ratings yet
LMS UNIT 34docx
2 pages
Course Notes DES (TU Berlin)
No ratings yet
Course Notes DES (TU Berlin)
93 pages
Aviation Weather Center
No ratings yet
Aviation Weather Center
1 page
Reg Exp 2 DFA
No ratings yet
Reg Exp 2 DFA
11 pages
TFTD
No ratings yet
TFTD
39 pages
TN COVID19 Info-30Apr-Collated From Publicly Available Information by Volunteers at VMware India
No ratings yet
TN COVID19 Info-30Apr-Collated From Publicly Available Information by Volunteers at VMware India
4 pages
GR8313 Grenergy
No ratings yet
GR8313 Grenergy
9 pages
Curriculum Vitae
No ratings yet
Curriculum Vitae
2 pages
Carreer Guidance Program (1)
No ratings yet
Carreer Guidance Program (1)
3 pages
MYP5 Deductive Geometry (Sheet 3)
No ratings yet
MYP5 Deductive Geometry (Sheet 3)
20 pages
PLET Installation in Deepwater Based On Tension Control and Length Control
100% (1)
PLET Installation in Deepwater Based On Tension Control and Length Control
13 pages
Separation Project (Chloroform & Actic Acid)
No ratings yet
Separation Project (Chloroform & Actic Acid)
20 pages
Diagnosis: Chirag Dhankhar 14496 / 20025569003 Submitted To Dr. Sudhida Gautam
No ratings yet
Diagnosis: Chirag Dhankhar 14496 / 20025569003 Submitted To Dr. Sudhida Gautam
2 pages
Velocity Calculator For Air Drilling
No ratings yet
Velocity Calculator For Air Drilling
14 pages
Citizen Science
No ratings yet
Citizen Science
19 pages
Generic Call Completion Example: Sip - Conf
No ratings yet
Generic Call Completion Example: Sip - Conf
2 pages
Get Absolute Essentials of Project Management 1st Edition Paul Roberts PDF ebook with Full Chapters Now
100% (2)
Get Absolute Essentials of Project Management 1st Edition Paul Roberts PDF ebook with Full Chapters Now
55 pages
Asus ROG Strix SCAR 15 2022 review (G533ZW - Core i9-12900H, RTX 3070Ti)
No ratings yet
Asus ROG Strix SCAR 15 2022 review (G533ZW - Core i9-12900H, RTX 3070Ti)
29 pages
F Heery Radulescu Paper
No ratings yet
F Heery Radulescu Paper
16 pages
Information and Communication Technology (Ict) Initiatives in Indian Agriculture
No ratings yet
Information and Communication Technology (Ict) Initiatives in Indian Agriculture
79 pages
Mind Test Unit 1
No ratings yet
Mind Test Unit 1
4 pages

code 1

Uploaded by

code 1

Uploaded by

import pandas as pd

# Set plot styles

fig = plt.figure(figsize=(10, 10))

svm_model = SVC(kernel='rbf', C=1.0, gamma='scale', random_state=42)

You might also like