21MIC0107 Da4

The document outlines a clustering analysis using the Iris dataset, implementing both Hierarchical and K-Means clustering methods. It includes data preparation, scaling, dendrogram construction, and visualizations for each clustering method, along with a comparison of their effectiveness using silhouette scores. The conclusion indicates that K-Means Clustering is more effective based on the silhouette score results.

Uploaded by

Dark Avenger

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views4 pages

21MIC0107 Da4

Uploaded by

Dark Avenger

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

#21MIC0107 Anirudh G

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from scipy.cluster.hierarchy import dendrogram, linkage
from sklearn.cluster import AgglomerativeClustering, KMeans
from sklearn.metrics import silhouette_score

#21MIC0107 Anirudh G
# 1. Dataset Preparation
# Load Iris dataset
iris = datasets.load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)

#21MIC0107 Anirudh G
# Data Cleaning & Preprocessing
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

#21MIC0107 Anirudh G
# 2. Hierarchical Clustering Implementation
# Construct Dendrogram
plt.figure(figsize=(12, 6))
linkage_matrix = linkage(X_scaled, method='ward')
dendrogram(linkage_matrix)
plt.title("Dendrogram for Hierarchical Clustering")
plt.xlabel("Samples")
plt.ylabel("Distance")
plt.show()
#21MIC0107 Anirudh G
# Applying Agglomerative Clustering
hierarchical = AgglomerativeClustering(n_clusters=3, linkage='ward')
y_hierarchical = hierarchical.fit_predict(X_scaled)

#21MIC0107 Anirudh G
# 3. Visualization of Hierarchical Clustering
plt.figure(figsize=(10, 6))
sns.scatterplot(x=X_scaled[:, 0], y=X_scaled[:, 1],
hue=y_hierarchical, palette='viridis')
plt.title("Hierarchical Clustering")
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[1])
plt.show()
#21MIC0107 Anirudh G
# 4. K-Means Clustering Implementation
kmeans = KMeans(n_clusters=3, random_state=42)
y_kmeans = kmeans.fit_predict(X_scaled)

#21MIC0107 Anirudh G
# Visualization of K-Means Clustering
plt.figure(figsize=(10, 6))
sns.scatterplot(x=X_scaled[:, 0], y=X_scaled[:, 1], hue=y_kmeans,
palette='coolwarm')
plt.title("K-Means Clustering")
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[1])
plt.show()
#21MIC0107 Anirudh G
# Silhouette Score Comparison
silhouette_hierarchical = silhouette_score(X_scaled, y_hierarchical)
silhouette_kmeans = silhouette_score(X_scaled, y_kmeans)
print(f"Silhouette Score (Hierarchical Clustering):
{silhouette_hierarchical:.2f}")
print(f"Silhouette Score (K-Means Clustering):
{silhouette_kmeans:.2f}")

Silhouette Score (Hierarchical Clustering): 0.45

,Silhouette Score (K-Means Clustering): 0.48

#21MIC0107 Anirudh G
# Conclusion
if silhouette_hierarchical > silhouette_kmeans:
print("Hierarchical Clustering is more effective based on the
Silhouette Score.")
else:
print("K-Means Clustering is more effective based on the
Silhouette Score.")

K-Means Clustering is more effective based on the Silhouette Score.

23MCA1104 - Exercise - 10 - Hierarchical Clustering - Ipynb - Colab
No ratings yet
23MCA1104 - Exercise - 10 - Hierarchical Clustering - Ipynb - Colab
2 pages
K-Means Clustering Numerical Example
No ratings yet
K-Means Clustering Numerical Example
5 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
10 pages
DSBA Master Codebook - Unsupervised Learning
No ratings yet
DSBA Master Codebook - Unsupervised Learning
7 pages
Ds Paper
No ratings yet
Ds Paper
35 pages
CSE 319 Pattern Recognition: Clustering
No ratings yet
CSE 319 Pattern Recognition: Clustering
58 pages
EastWestAirlines Cluster
100% (1)
EastWestAirlines Cluster
6 pages
Hierarchical Clustering and Data Science Group Project - Assignment 2
No ratings yet
Hierarchical Clustering and Data Science Group Project - Assignment 2
29 pages
Project Explanation
No ratings yet
Project Explanation
17 pages
Aiml Unit 3 4
No ratings yet
Aiml Unit 3 4
19 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
23 pages
Clustering
No ratings yet
Clustering
1 page
Lecture - 11 Hierarchical Clustering
No ratings yet
Lecture - 11 Hierarchical Clustering
28 pages
Introduction To Data Mining Clustering Analysis
No ratings yet
Introduction To Data Mining Clustering Analysis
84 pages
Basics of Hierarchical Clustering: Shaumik Daityari
No ratings yet
Basics of Hierarchical Clustering: Shaumik Daityari
30 pages
AIML Lab 7 8 9 10
No ratings yet
AIML Lab 7 8 9 10
10 pages
Experiment 4 1
No ratings yet
Experiment 4 1
4 pages
Kmeansclustering Sales Dataset
No ratings yet
Kmeansclustering Sales Dataset
6 pages
Intro Qugates
No ratings yet
Intro Qugates
4 pages
DMDW Lab10
No ratings yet
DMDW Lab10
6 pages
Baidurya Debnath 4
No ratings yet
Baidurya Debnath 4
37 pages
Exp 8
No ratings yet
Exp 8
5 pages
Lec 06 Clustering
No ratings yet
Lec 06 Clustering
44 pages
06 - Unsupervised Learning - 18 Dec 2023
No ratings yet
06 - Unsupervised Learning - 18 Dec 2023
50 pages
Report 2
No ratings yet
Report 2
7 pages
Clustering Lab Notebook Assignment
No ratings yet
Clustering Lab Notebook Assignment
6 pages
American Journal of Physics Volume 53 Issue 9 1985 (Doi 10.1119/1.14356) MacKeown, P. K. - Evaluation of Feynman Path Integrals by Monte Carlo Methods
No ratings yet
American Journal of Physics Volume 53 Issue 9 1985 (Doi 10.1119/1.14356) MacKeown, P. K. - Evaluation of Feynman Path Integrals by Monte Carlo Methods
6 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
11 pages
Liner Regression Chapter N5
No ratings yet
Liner Regression Chapter N5
2 pages
FMLASS3Q7 - Jupyter Notebook
No ratings yet
FMLASS3Q7 - Jupyter Notebook
6 pages
Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)
No ratings yet
Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)
8 pages
DV Exp 6
No ratings yet
DV Exp 6
2 pages
21BCE5775 Clustering
No ratings yet
21BCE5775 Clustering
42 pages
IMP Hierarchical Clustering
No ratings yet
IMP Hierarchical Clustering
3 pages
Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia
No ratings yet
Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia
8 pages
Najir Shaikh Practical 5 ML 2
No ratings yet
Najir Shaikh Practical 5 ML 2
4 pages
Kmean PGM
No ratings yet
Kmean PGM
3 pages
Hierarchical Clustering Mall Data
No ratings yet
Hierarchical Clustering Mall Data
2 pages
Metode Subtractive Fuzzy C-Means (SFCM) Dalam Pengelompokan
No ratings yet
Metode Subtractive Fuzzy C-Means (SFCM) Dalam Pengelompokan
13 pages
Zafira fk,+4 Vol11No1 855+ (36-47) +
No ratings yet
Zafira fk,+4 Vol11No1 855+ (36-47) +
12 pages
Python
No ratings yet
Python
5 pages
AIML LAB Week 4 1
No ratings yet
AIML LAB Week 4 1
3 pages
Agglomerative - Jupyter Notebook
No ratings yet
Agglomerative - Jupyter Notebook
2 pages
Código K-Means en Spyder
No ratings yet
Código K-Means en Spyder
3 pages
Gaussianmixture
No ratings yet
Gaussianmixture
2 pages
Data Science
No ratings yet
Data Science
2 pages
Clustering Algorithms CheatSheet 1710438661
No ratings yet
Clustering Algorithms CheatSheet 1710438661
6 pages
Marketing Analytics Week-10 LAQ
No ratings yet
Marketing Analytics Week-10 LAQ
5 pages
ML Clustering
No ratings yet
ML Clustering
3 pages
Density Based Clustering
No ratings yet
Density Based Clustering
70 pages
Data Tugas2 Data Mining Kmeans Clustering
No ratings yet
Data Tugas2 Data Mining Kmeans Clustering
4 pages
Objective: For One Dimensional Data Set (7,10,20,28,35), Perform Hierarchical Clustering
No ratings yet
Objective: For One Dimensional Data Set (7,10,20,28,35), Perform Hierarchical Clustering
13 pages
Data Mining Project - Clustering - State Wise Health Income
No ratings yet
Data Mining Project - Clustering - State Wise Health Income
9 pages
DWDM Lab All
No ratings yet
DWDM Lab All
20 pages
NJ - Corrected Final
No ratings yet
NJ - Corrected Final
27 pages
Compute2
No ratings yet
Compute2
10 pages
L08 Hierachical Agglomerative Clustering
No ratings yet
L08 Hierachical Agglomerative Clustering
41 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
41 pages
UAS Mechine Learning
No ratings yet
UAS Mechine Learning
5 pages
Clustering
No ratings yet
Clustering
7 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
96 pages
Unit IV
No ratings yet
Unit IV
51 pages
From Import Import As Import As From Import From Import From Import From Import
No ratings yet
From Import Import As Import As From Import From Import From Import From Import
9 pages
Atelier N5 PDF
No ratings yet
Atelier N5 PDF
5 pages
ML Unit 5
No ratings yet
ML Unit 5
50 pages
Week 8 DS Practical
No ratings yet
Week 8 DS Practical
13 pages
K - Means - Clustering - Ipynb - Colaboratory
No ratings yet
K - Means - Clustering - Ipynb - Colaboratory
2 pages
Ass6 (DMDS)
No ratings yet
Ass6 (DMDS)
7 pages
Hierarchical Clustering in Machine Learning
No ratings yet
Hierarchical Clustering in Machine Learning
10 pages
AML Clustering
No ratings yet
AML Clustering
7 pages
Partition
No ratings yet
Partition
52 pages
Wa0069.
No ratings yet
Wa0069.
4 pages
IR 5 Agglomerative Iris
No ratings yet
IR 5 Agglomerative Iris
1 page
Assign 7
No ratings yet
Assign 7
5 pages
Lesson 6 - Unsupervised Learning
No ratings yet
Lesson 6 - Unsupervised Learning
63 pages
IR 5 Agglomerative Iris
No ratings yet
IR 5 Agglomerative Iris
1 page
Customer Segmentation With K-Means Clustering and Visualization - Colab
No ratings yet
Customer Segmentation With K-Means Clustering and Visualization - Colab
3 pages
Income (K-Means Clustering On A Sample Data Set)
No ratings yet
Income (K-Means Clustering On A Sample Data Set)
3 pages
23CC554
No ratings yet
23CC554
10 pages
Unit 2 DMW
No ratings yet
Unit 2 DMW
26 pages
FullMarks - Clustering StudentSolution 2
No ratings yet
FullMarks - Clustering StudentSolution 2
13 pages
Unsupervisd Learning Algorithm
No ratings yet
Unsupervisd Learning Algorithm
6 pages
Agnes
No ratings yet
Agnes
25 pages
Hierarchical Clustering in Machine Learning
No ratings yet
Hierarchical Clustering in Machine Learning
11 pages
Expt 5
No ratings yet
Expt 5
3 pages
Cluster Analysis in R
No ratings yet
Cluster Analysis in R
8 pages
Day12 Hierarchical Clustering
No ratings yet
Day12 Hierarchical Clustering
9 pages
Pertemuan-X - Manajemen Data Bagian 2
No ratings yet
Pertemuan-X - Manajemen Data Bagian 2
31 pages
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet

21MIC0107 Da4

Uploaded by

21MIC0107 Da4

Uploaded by

#21MIC0107 Anirudh G

Silhouette Score (Hierarchical Clustering): 0.45

K-Means Clustering is more effective based on the Silhouette Score.

You might also like