0% found this document useful (0 votes)

12 views8 pages

Ass - 10.ipynb - Colab

The document provides a comprehensive analysis of the Iris dataset using Python, covering data loading, statistical feature extraction, normalization, and pattern recognition through machine learning models like K-Nearest Neighbors (KNN) and Support Vector Machine (SVM). It includes visualizations of feature distributions and model evaluation metrics such as accuracy, precision, recall, and F1 score. The KNN model outperformed the SVM model, achieving perfect accuracy and other metrics.

Uploaded by

brotin2503

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views8 pages

Ass - 10.ipynb - Colab

Uploaded by

brotin2503

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Start coding or generate with AI.

Double-click (or enter) to edit

chatgpt

# Import necessary libraries

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris

# Load the Iris dataset from sklearn

iris_sklearn = load_iris()
# Convert to a pandas DataFrame
iris_df = pd.DataFrame(data=iris_sklearn.data, columns=iris_sklearn.feature_names)
# Add the target variable
iris_df['species'] = pd.Categorical.from_codes(iris_sklearn.target, iris_sklearn.target_names)

# Display the first 5 rows of the dataset

print(iris_df.head())

# Identify features and labels

features = iris_df.columns[:-1]
label = iris_df.columns[-1]
print(f"Features: {features}")
print(f"Label: {label}")

# Plot the distribution of each feature using histograms

iris_df[features].hist(figsize=(10, 8))
plt.suptitle('Feature Distributions')
plt.show()

# Visualize the dataset using a scatterplot matrix

sns.pairplot(iris_df, hue='species', markers=["o", "s", "D"])
plt.suptitle('Scatterplot Matrix')
plt.show()
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) \
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2

species
0 setosa
1 setosa
2 setosa
3 setosa
4 setosa
Features: Index(['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)',
'petal width (cm)'],
dtype='object')
Label: species
# Part 1: Statistical Features and Feature Selection

# Step 1: Import necessary libraries

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler, StandardScaler

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)

# Step 2: Compute statistical features

statistical_summary = {
'Mean': iris_df.mean(),
'Median': iris_df.median(),
'Variance': iris_df.var(),
'Standard Deviation': iris_df.std(),
'Minimum': iris_df.min(),
'Maximum': iris_df.max()
}

# Convert to DataFrame for better visualization

statistical_summary_df = pd.DataFrame(statistical_summary)
print("Statistical Features:\n", statistical_summary_df)

# Step 3: Normalize the features

# Min-Max Scaling
min_max_scaler = MinMaxScaler()
iris_df_minmax = pd.DataFrame(min_max_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Z-score Normalization
z_score_scaler = StandardScaler()
iris_df_zscore = pd.DataFrame(z_score_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Display normalized data

print("\nMin-Max Normalized Data:\n", iris_df_minmax.head())
print("\nZ-score Normalized Data:\n", iris_df_zscore.head())

# Step 4: Discussing feature relevance

# Based on the statistical properties, we can discuss the relevance of features
# For example, we can look at the variance and mean values to determine which features are more spread out and have higher v

feature_relevance = {
'Feature': iris.feature_names,
'Mean': statistical_summary_df['Mean'],
'Variance': statistical_summary_df['Variance']
}

feature_relevance_df = pd.DataFrame(feature_relevance)
print("\nFeature Relevance based on Mean and Variance:\n", feature_relevance_df)

# Discussion on feature relevance

print("\nDiscussion on Feature Relevance:")
for index, row in feature_relevance_df.iterrows():
print(f"{row['Feature']}: Mean = {row['Mean']:.2f}, Variance = {row['Variance']:.2f}")
if row['Variance'] > 0.5: # Arbitrary threshold for variance
print(f" - This feature has a relatively high variance, indicating it may be useful for classification.")
else:
print(f" - This feature has a low variance, indicating it may not be very useful for classification.")

Statistical Features:
Mean Median Variance Standard Deviation Minimum \
sepal length (cm) 5.843333 5.80 0.685694 0.828066 4.3
sepal width (cm) 3.057333 3.00 0.189979 0.435866 2.0
petal length (cm) 3.758000 4.35 3.116278 1.765298 1.0
petal width (cm) 1.199333 1.30 0.581006 0.762238 0.1

Maximum
sepal length (cm) 7.9
sepal width (cm) 4.4
petal length (cm) 6.9
petal width (cm) 2.5

Min-Max Normalized Data:

sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 0.222222 0.625000 0.067797 0.041667
1 0.166667 0.416667 0.067797 0.041667
2 0.111111 0.500000 0.050847 0.041667
3 0.083333 0.458333 0.084746 0.041667
4 0.194444 0.666667 0.067797 0.041667

Z-score Normalized Data:

sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 -0.900681 1.019004 -1.340227 -1.315444
1 -1.143017 -0.131979 -1.340227 -1.315444
2 -1.385353 0.328414 -1.397064 -1.315444
3 -1.506521 0.098217 -1.283389 -1.315444
4 -1.021849 1.249201 -1.340227 -1.315444

Feature Relevance based on Mean and Variance:

Feature Mean Variance
sepal length (cm) sepal length (cm) 5.843333 0.685694
sepal width (cm) sepal width (cm) 3.057333 0.189979
petal length (cm) petal length (cm) 3.758000 3.116278
petal width (cm) petal width (cm) 1.199333 0.581006

Discussion on Feature Relevance:

sepal length (cm): Mean = 5.84, Variance = 0.69
- This feature has a relatively high variance, indicating it may be useful for classification.
sepal width (cm): Mean = 3.06, Variance = 0.19
- This feature has a low variance, indicating it may not be very useful for classification.
petal length (cm): Mean = 3.76, Variance = 3.12
- This feature has a relatively high variance, indicating it may be useful for classification.
petal width (cm): Mean = 1.20, Variance = 0.58
- This feature has a relatively high variance, indicating it may be useful for classification.

# pattern recognation

# Part 2: Pattern Recognition

# Step 1: Import necessary libraries

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
iris_df['species'] = iris.target

# Step 2: Data Splitting

# Split the dataset into training and testing sets (70% training, 30% testing)
X = iris_df[iris.feature_names]
y = iris_df['species']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Normalize the features

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Step 3: Model Implementation

# K-Nearest Neighbors (KNN)
knn_params = {'n_neighbors': range(1, 21)}
knn_grid = GridSearchCV(KNeighborsClassifier(), knn_params, cv=5)
knn_grid.fit(X_train_scaled, y_train)

# Support Vector Machine (SVM)

svm_params = {'kernel': ['linear', 'rbf', 'poly'], 'C': [0.1, 1, 10]}
svm_grid = GridSearchCV(SVC(), svm_params, cv=5)
svm_grid.fit(X_train_scaled, y_train)

# Step 4: Evaluation
# Evaluate KNN
knn_best = knn_grid.best_estimator_
y_pred_knn = knn_best.predict(X_test_scaled)

# Evaluate SVM
svm_best = svm_grid.best_estimator_
y_pred_svm = svm_best.predict(X_test_scaled)

# Calculate metrics
metrics = {
'Model': ['KNN', 'SVM'],
'Accuracy': [accuracy_score(y_test, y_pred_knn), accuracy_score(y_test, y_pred_svm)],
'Precision': [precision_score(y_test, y_pred_knn, average='weighted'), precision_score(y_test, y_pred_svm, average='weigh
'Recall': [recall_score(y_test, y_pred_knn, average='weighted'), recall_score(y_test, y_pred_svm, average='weighted')],
'F1 Score': [f1_score(y_test, y_pred_knn, average='weighted'), f1_score(y_test, y_pred_svm, average='weighted')]
}

metrics_df = pd.DataFrame(metrics)
print("\nEvaluation Metrics:\n", metrics_df)

# Step 5: Plot confusion matrices

def plot_confusion_matrix(y_true, y_pred, model_name):
cm = confusion_matrix(y_true, y_pred)
plt.figure(figsize=(6, 4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=iris.target_names, yticklabels=iris.target_names)
plt.title(f'Confusion Matrix for {model_name}')
plt.xlabel('Predicted')
plt.ylabel('True')
plt.show()

plot_confusion_matrix(y_test, y_pred_knn, 'KNN')

plot_confusion_matrix(y_test, y_pred_svm, 'SVM')
Evaluation Metrics:
Model Accuracy Precision Recall F1 Score
0 KNN 1.000000 1.000000 1.000000 1.000000
1 SVM 0.977778 0.979365 0.977778 0.977745

# 4. Comparison and Conclusion

# Part 3: Model Comparison and Conclusion

# Step 1: Import necessary libraries

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
iris_df['species'] = iris.target

# Step 2: Data Splitting

# Normalize the features

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Step 3: Model Implementation

# K-Nearest Neighbors (KNN)
knn_params = {'n_neighbors': range(1, 21)}
knn_grid = GridSearchCV(KNeighborsClassifier(), knn_params, cv=5)
knn_grid.fit(X_train_scaled, y_train)

# Support Vector Machine (SVM)

svm_params = {'kernel': ['linear', 'rbf', 'poly'], 'C': [0.1, 1, 10]}
svm_grid = GridSearchCV(SVC(), svm_params, cv=5)
svm_grid.fit(X_train_scaled, y_train)

# Step 4: Evaluation
# Evaluate KNN
knn_best = knn_grid.best_estimator_
y_pred_knn = knn_best.predict(X_test_scaled)

# Evaluate SVM
svm_best = svm_grid.best_estimator_
y_pred_svm = svm_best.predict(X_test_scaled)

# Calculate metrics
metrics = {
'Model': ['KNN', 'SVM'],
'Accuracy': [accuracy_score(y_test, y_pred_knn), accuracy_score(y_test, y_pred_svm)],
'Precision': [precision_score(y_test, y_pred_knn, average='weighted'), precision_score(y_test, y_pred_svm, average='weig
'Recall': [recall_score(y_test, y_pred_knn, average='weighted'), recall_score(y_test, y_pred_svm, average='weighted')],
'F1 Score': [f1_score(y_test, y_pred_knn, average='weighted'), f1_score(y_test, y_pred_svm, average='weighted')]
}

metrics_df = pd.DataFrame(metrics)
print("\nEvaluation Metrics:\n", metrics_df)

# Step 5: Plotting the comparison

metrics_df.set_index('Model').plot(kind='bar', figsize=(10, 6))
plt.title('Model Comparison')
plt.ylabel('Score')
plt.xticks(rotation=0)
plt.ylim(0, 1)
plt.grid(axis='y')
plt.show()

# Step 6: Discussion
best_model = metrics_df.loc[metrics_df['Accuracy'].idxmax()]
print("\nBest Model:")
print(f"Model: {best_model['Model']}")
print(f"Accuracy: {best_model['Accuracy']:.2f}")
print(f"Precision: {best_model['Precision']:.2f}")
print(f"Recall: {best_model['Recall']:.2f}")
print(f"F1 Score: {best_model['F1 Score']:.2f}")
Evaluation Metrics:
Model Accuracy Precision Recall F1 Score
0 KNN 1.000000 1.000000 1.000000 1.000000
1 SVM 0.977778 0.979365 0.977778 0.977745

Best Model:
Model: KNN
Accuracy: 1.00
Precision: 1.00
Recall: 1.00
F1 Score: 1.00

# delivarables:

# Part 1: Feature Extraction and Statistical Analysis

# Step 1: Import necessary libraries

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler, StandardScaler

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)

# Step 2: Compute statistical features

statistical_summary = {
'Mean': iris_df.mean(),
'Median': iris_df.median(),
'Variance': iris_df.var(),
'Standard Deviation': iris_df.std(),
'Minimum': iris_df.min(),
'Maximum': iris_df.max()
}

# Convert to DataFrame for better visualization

statistical_summary_df = pd.DataFrame(statistical_summary)
#print("Statistical Features:\n", statistical_summary_df)

# Step 3: Normalize the features

# Min-Max Scaling
min_max_scaler = MinMaxScaler()
iris_df_minmax = pd.DataFrame(min_max_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Z-score Normalization
z_score_scaler = StandardScaler()
iris_df_zscore = pd.DataFrame(z_score_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Display normalized data

#print("\nMin-Max Normalized Data:\n", iris_df_minmax.head())

Detection of Diseases in Rice Plants Using Machine Learning Techniques
No ratings yet
Detection of Diseases in Rice Plants Using Machine Learning Techniques
25 pages
CampusX DSMP 2.0 Syllabus
No ratings yet
CampusX DSMP 2.0 Syllabus
62 pages
Social Media Bullying Detection Using Machine Learning On Bangla Text
No ratings yet
Social Media Bullying Detection Using Machine Learning On Bangla Text
4 pages
Analysis and Detection of Autism Spectrum Disorder Using Machine Learning Techniques-Ppt-1
100% (3)
Analysis and Detection of Autism Spectrum Disorder Using Machine Learning Techniques-Ppt-1
28 pages
R18CSE4102-UNIT 2 Data Mining Notes
100% (1)
R18CSE4102-UNIT 2 Data Mining Notes
31 pages
R18B Tech CSE (AIML) IIIIVYearTentativeSyllabus
No ratings yet
R18B Tech CSE (AIML) IIIIVYearTentativeSyllabus
72 pages
Certified Professional Diploma in Data Science-1
No ratings yet
Certified Professional Diploma in Data Science-1
43 pages
Explainable Artificial Intelligence: A Comprehensive Review: Dang Minh H. Xiang Wang Y. Fen Li Tan N. Nguyen
No ratings yet
Explainable Artificial Intelligence: A Comprehensive Review: Dang Minh H. Xiang Wang Y. Fen Li Tan N. Nguyen
66 pages
FODS
No ratings yet
FODS
6 pages
Seminar
No ratings yet
Seminar
31 pages
MasterThesis V0
No ratings yet
MasterThesis V0
33 pages
Saikiran
No ratings yet
Saikiran
28 pages
AI Report Presentation
No ratings yet
AI Report Presentation
14 pages
Music Genre Classification Project Repor
No ratings yet
Music Genre Classification Project Repor
19 pages
Generative Certification Notes-1
No ratings yet
Generative Certification Notes-1
22 pages
Machine Learning Algorithms, Real-World Applications and Research Directions
No ratings yet
Machine Learning Algorithms, Real-World Applications and Research Directions
73 pages
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
No ratings yet
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
20 pages
Dsbda Ouput 1-10
No ratings yet
Dsbda Ouput 1-10
89 pages
Peru Mining Analysis and Forecast of Mining Produc
No ratings yet
Peru Mining Analysis and Forecast of Mining Produc
6 pages
Import As Import As From Import Import As Import As From Import From Import From Import
No ratings yet
Import As Import As From Import Import As Import As From Import From Import From Import
6 pages
AbhishekVallecha 2003184 ADS Exp9
No ratings yet
AbhishekVallecha 2003184 ADS Exp9
6 pages
Data Visualization
No ratings yet
Data Visualization
18 pages
Vansh 3089 CA2
No ratings yet
Vansh 3089 CA2
13 pages
F2 PDF
No ratings yet
F2 PDF
6 pages
Artculopublicado Applied Science
No ratings yet
Artculopublicado Applied Science
29 pages
Nandini Matplotlib Ws
No ratings yet
Nandini Matplotlib Ws
10 pages
Ploomber Notebook Conversion - 2
No ratings yet
Ploomber Notebook Conversion - 2
14 pages
Comparison of Machine Learning Algorithms Random Forest, Artificial Neural Network and Support Vector Machine To Maximum Likelihood For Supervised Crop Type Classification
No ratings yet
Comparison of Machine Learning Algorithms Random Forest, Artificial Neural Network and Support Vector Machine To Maximum Likelihood For Supervised Crop Type Classification
7 pages
ML Lab Record
No ratings yet
ML Lab Record
64 pages
Data Visualizationyuo
No ratings yet
Data Visualizationyuo
28 pages
Normalization
No ratings yet
Normalization
4 pages
Book's Solutions
No ratings yet
Book's Solutions
20 pages
Merge Sort
No ratings yet
Merge Sort
5 pages
Unit2 ML Notes
No ratings yet
Unit2 ML Notes
19 pages
085
No ratings yet
085
4 pages
Unsupervised ML
No ratings yet
Unsupervised ML
17 pages
What Truly Matters in Trajectory Prediction For Autonomous Driving
No ratings yet
What Truly Matters in Trajectory Prediction For Autonomous Driving
11 pages
Practical 10 Code
No ratings yet
Practical 10 Code
5 pages
AUJ Analysis and Implementation of Machine Learning Model For Detection of Parkinsons Disease
No ratings yet
AUJ Analysis and Implementation of Machine Learning Model For Detection of Parkinsons Disease
8 pages
10 (3146)
No ratings yet
10 (3146)
2 pages
Experiment 1
No ratings yet
Experiment 1
2 pages
Internship Report K
No ratings yet
Internship Report K
28 pages
Automated Digitization of Student's Marks From The Answer Book
No ratings yet
Automated Digitization of Student's Marks From The Answer Book
9 pages
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
No ratings yet
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
7 pages
Experiment 11 PML
No ratings yet
Experiment 11 PML
3 pages
Import As Import As Import As From Import Import As Import
No ratings yet
Import As Import As Import As From Import Import As Import
7 pages
Insertion Sort
No ratings yet
Insertion Sort
3 pages
Program1 MLA Lab 2025 250109 144615
No ratings yet
Program1 MLA Lab 2025 250109 144615
17 pages
Software Engineering Lab
No ratings yet
Software Engineering Lab
5 pages
Dsbda 3B
No ratings yet
Dsbda 3B
5 pages
Assignment 09
No ratings yet
Assignment 09
23 pages
2408.08126v1 Meme Template Id
No ratings yet
2408.08126v1 Meme Template Id
10 pages
Tarea - 1.ipynb - Colab Jose
No ratings yet
Tarea - 1.ipynb - Colab Jose
12 pages
137 Vsec 6
No ratings yet
137 Vsec 6
2 pages
Trần Mạnh Hùng 20192643.Ipynb - Colab
No ratings yet
Trần Mạnh Hùng 20192643.Ipynb - Colab
6 pages
Cota12 6
No ratings yet
Cota12 6
4 pages
25 - Assignment10.ipynb - Colaboratory
No ratings yet
25 - Assignment10.ipynb - Colaboratory
13 pages
DSBDA3
No ratings yet
DSBDA3
3 pages
Assign10.Ipynb - Colab
No ratings yet
Assign10.Ipynb - Colab
8 pages
Hyperparameters Optimization XGBoost For Network Intrusion Detection Using CSE-CIC-IDS 2018 Dataset
No ratings yet
Hyperparameters Optimization XGBoost For Network Intrusion Detection Using CSE-CIC-IDS 2018 Dataset
10 pages
Dsbda 3B
No ratings yet
Dsbda 3B
5 pages
Data Visualization With Maplotlib
No ratings yet
Data Visualization With Maplotlib
8 pages
LAB # 07 KNN - Iris Dataset - Ipynb - Colab
No ratings yet
LAB # 07 KNN - Iris Dataset - Ipynb - Colab
8 pages
Bubble Sort
No ratings yet
Bubble Sort
3 pages
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
No ratings yet
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
21 pages
Alice Treesa M
No ratings yet
Alice Treesa M
10 pages
6 Lab
No ratings yet
6 Lab
16 pages
Base de Datos IRIS Codigos R Utilizados para El Analisis
No ratings yet
Base de Datos IRIS Codigos R Utilizados para El Analisis
4 pages
Iris - Ipynb - Colaboratory
No ratings yet
Iris - Ipynb - Colaboratory
8 pages
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
No ratings yet
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
6 pages
ML#07
No ratings yet
ML#07
21 pages
Assignment 5'
No ratings yet
Assignment 5'
4 pages
Ass - 11.ipynb - Colab
No ratings yet
Ass - 11.ipynb - Colab
7 pages
Assignment 8
No ratings yet
Assignment 8
7 pages
Assignment No - 10
No ratings yet
Assignment No - 10
3 pages
Radix Sort
No ratings yet
Radix Sort
5 pages
Quick Sort
No ratings yet
Quick Sort
4 pages
Heap Sort
No ratings yet
Heap Sort
4 pages
Experiment 3
No ratings yet
Experiment 3
4 pages
Assignment 10
No ratings yet
Assignment 10
9 pages
Prac 10
No ratings yet
Prac 10
6 pages
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
No ratings yet
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
5 pages
Vsec PW 7
No ratings yet
Vsec PW 7
3 pages
b21 DSBDA Assignment No 10
No ratings yet
b21 DSBDA Assignment No 10
1 page
10 TH
No ratings yet
10 TH
7 pages
SVM and KNN
No ratings yet
SVM and KNN
3 pages
Exno 4
No ratings yet
Exno 4
13 pages
Selection Sort
No ratings yet
Selection Sort
3 pages
Kmeansrcode
No ratings yet
Kmeansrcode
2 pages
K Means On IRIS Dataset
No ratings yet
K Means On IRIS Dataset
4 pages
Name:-Nisha Ambike: Roll No: - 02
No ratings yet
Name:-Nisha Ambike: Roll No: - 02
2 pages
Data Mining Models: Techniques and Applications
From Everand
Data Mining Models: Techniques and Applications
Ravi Deshpande
No ratings yet
Assignment 3 Iris
No ratings yet
Assignment 3 Iris
2 pages
Import As Import As: "Iris - CSV"
No ratings yet
Import As Import As: "Iris - CSV"
4 pages
Matplotlib Styles: 1. Test - Generate - Plot - With - Style1
No ratings yet
Matplotlib Styles: 1. Test - Generate - Plot - With - Style1
2 pages
Data Visualization and Matplot
No ratings yet
Data Visualization and Matplot
11 pages
DML About Put
No ratings yet
DML About Put
2 pages
Summary (Iris) #View Statistical Summary of Dataset
No ratings yet
Summary (Iris) #View Statistical Summary of Dataset
1 page
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
ML3 Some Supervised
No ratings yet
ML3 Some Supervised
17 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet

Ass - 10.ipynb - Colab

Uploaded by

Ass - 10.ipynb - Colab

Uploaded by

Start coding or generate with AI.

Double-click (or enter) to edit

# Import necessary libraries

# Load the Iris dataset from sklearn

# Display the first 5 rows of the dataset

# Identify features and labels

# Plot the distribution of each feature using histograms

# Visualize the dataset using a scatterplot matrix

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Compute statistical features

# Convert to DataFrame for better visualization

# Step 3: Normalize the features

# Display normalized data

# Step 4: Discussing feature relevance

# Discussion on feature relevance

Min-Max Normalized Data:

Z-score Normalized Data:

Feature Relevance based on Mean and Variance:

Discussion on Feature Relevance:

# Part 2: Pattern Recognition

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Data Splitting

# Normalize the features

# Step 3: Model Implementation

# Support Vector Machine (SVM)

# Step 5: Plot confusion matrices

plot_confusion_matrix(y_test, y_pred_knn, 'KNN')

# 4. Comparison and Conclusion

# Part 3: Model Comparison and Conclusion

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Data Splitting

# Normalize the features

# Step 3: Model Implementation

# Support Vector Machine (SVM)

# Step 5: Plotting the comparison

# Part 1: Feature Extraction and Statistical Analysis

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Compute statistical features

# Convert to DataFrame for better visualization

# Step 3: Normalize the features

# Display normalized data

You might also like