0% found this document useful (0 votes)

25 views3 pages

IMP Hierarchical Clustering

The document outlines a Python script for performing hierarchical and agglomerative clustering on a dataset containing individuals' ages and incomes. It includes data preprocessing steps, linkage matrix creation, and visualization of dendrograms, as well as the calculation of silhouette scores for clustering performance evaluation. The results show cluster labels and cophenetic correlation coefficients for both agglomerative and divisive clustering methods.

Uploaded by

hetvibhora192

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

25 views3 pages

IMP Hierarchical Clustering

Uploaded by

hetvibhora192

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

ew1tg5dzo

December 22, 2024

[1]: import numpy as np

import pandas as pd
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import dendrogram, linkage, fcluster, cophenet
from scipy.spatial.distance import pdist
from sklearn.cluster import AgglomerativeClustering
from sklearn.metrics import silhouette_score

[2]: # Sample dataset (replace this with your dataset)

df = pd.read_csv("income.csv")
df.head()

[2]: Name Age Income($)

0 Rob 27 70000
1 Michael 29 90000
2 Mohan 29 61000
3 Ismail 28 60000
4 Kory 42 150000

[3]: df = df.drop(['Name'], axis = 1)

df.head()

[3]: Age Income($)

0 27 70000
1 29 90000
2 29 61000
3 28 60000
4 42 150000

[10]: # from scipy.cluster.hierarchy import dendrogram, linkage

linkage_matrix = linkage(df, method='ward') # 'ward', 'single', 'complete',␣

↪'average'

dendrogram(linkage_matrix)
plt.show()

1
[5]: # # Set a threshold for clustering (e.g., distance = 50)
# threshold = 50
# clusters = fcluster(linkage_matrix, t=threshold, criterion='distance')

# # Add cluster labels to the dataset

# df['Cluster'] = clusters

# # Display the dataset with clusters

# print(df)

[6]: # from scipy.cluster.hierarchy import cophenet

# from scipy.spatial.distance import pdist

# coph_corr, _ = cophenet(linkage_matrix, pdist(df))

# print(coph_corr)

[7]: # Agglomerative Clustering

agglo = AgglomerativeClustering(n_clusters=2, linkage='ward')
labels_agglo = agglo.fit_predict(df)
silhouette_agglo = silhouette_score(df, labels_agglo)
print("Agglomerative Clustering Labels:", labels_agglo)

2
print("Agglomerative Silhouette Score:", silhouette_agglo)

Agglomerative Clustering Labels: [0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0]

Agglomerative Silhouette Score: 0.8191238627089519

[8]: Z = linkage(df, method='ward')

max_clusters = 3
labels_divisive = fcluster(Z, t=max_clusters, criterion='maxclust')

coph_corr, _ = cophenet(Z, pdist(df)) # Cophenetic Correlation

print("Divisive Clustering Labels:", labels_divisive)
print("Divisive Cophenetic Correlation Coefficient:", coph_corr)

Divisive Clustering Labels: [3 2 3 3 1 1 1 1 1 1 1 3 3 3 3 3 3 3 3 2 2 3]

Divisive Cophenetic Correlation Coefficient: 0.9472115279959762

[8]:

Service Manual - Mispa CCXL Agappe - Final
No ratings yet
Service Manual - Mispa CCXL Agappe - Final
108 pages
1Z0-1041-24 Exam Questions
100% (1)
1Z0-1041-24 Exam Questions
25 pages
ISYE6501 HW1 Kevin
No ratings yet
ISYE6501 HW1 Kevin
7 pages
Business Report Data Mining
91% (11)
Business Report Data Mining
18 pages
1.1 Read The Data and Do Exploratory Data Analysis. Describe The Data Briefly
100% (19)
1.1 Read The Data and Do Exploratory Data Analysis. Describe The Data Briefly
50 pages
C1SE.38 SprintBacklog EQR
No ratings yet
C1SE.38 SprintBacklog EQR
8 pages
DBMS Hand Written Notes Made Easy
No ratings yet
DBMS Hand Written Notes Made Easy
135 pages
AADvance Controller Safety Manual Icstt-rm446P-En-p
100% (1)
AADvance Controller Safety Manual Icstt-rm446P-En-p
110 pages
Course Tittle:-Project Title:-: Object Oriented Software Analysis and Design
100% (1)
Course Tittle:-Project Title:-: Object Oriented Software Analysis and Design
24 pages
Automatic Transfer System Explained in Details Part 1
100% (1)
Automatic Transfer System Explained in Details Part 1
4 pages
Define Quota Arrangement Usage: SAP - Customizing Guide
No ratings yet
Define Quota Arrangement Usage: SAP - Customizing Guide
5 pages
Abb Utilities GMBH: Operation
No ratings yet
Abb Utilities GMBH: Operation
4 pages
Pioneer SPH-DA360DAB-Operation-Manual
No ratings yet
Pioneer SPH-DA360DAB-Operation-Manual
65 pages
Amazon Application Engineer - JD
No ratings yet
Amazon Application Engineer - JD
2 pages
Final Examination in Empowerment Technologies
No ratings yet
Final Examination in Empowerment Technologies
3 pages
Ofdm Basics Lte
No ratings yet
Ofdm Basics Lte
18 pages
DSP Lab 1
No ratings yet
DSP Lab 1
8 pages
SPPL Ca 2022 V18a
No ratings yet
SPPL Ca 2022 V18a
284 pages
Adobe Acrobat Xi Pro 1102 Torrent PDF
No ratings yet
Adobe Acrobat Xi Pro 1102 Torrent PDF
4 pages
Aiml Unit 3 4
No ratings yet
Aiml Unit 3 4
19 pages
Lesson 6 - Unsupervised Learning
No ratings yet
Lesson 6 - Unsupervised Learning
63 pages
IT Reviewer
No ratings yet
IT Reviewer
13 pages
Group 4 Review 1-1
No ratings yet
Group 4 Review 1-1
14 pages
Atelier N5 PDF
No ratings yet
Atelier N5 PDF
5 pages
Joseph Xavier J - FML
No ratings yet
Joseph Xavier J - FML
15 pages
Agglomerative Clustering
No ratings yet
Agglomerative Clustering
2 pages
New K Means - Jupyter Notebook
No ratings yet
New K Means - Jupyter Notebook
4 pages
Unit 1 - Session 6: Free Speaking
No ratings yet
Unit 1 - Session 6: Free Speaking
9 pages
FMLASS3Q7 - Jupyter Notebook
No ratings yet
FMLASS3Q7 - Jupyter Notebook
6 pages
DJ Final Resume
No ratings yet
DJ Final Resume
2 pages
K Means Clustering
No ratings yet
K Means Clustering
5 pages
Zscaler Private Access: Fast, Secure Access To Private Applications With Cloud-Delivered Zero Trust Network Access (ZTNA)
No ratings yet
Zscaler Private Access: Fast, Secure Access To Private Applications With Cloud-Delivered Zero Trust Network Access (ZTNA)
4 pages
KMeans Clustering Bidimensional Daniel Ames Camayo
No ratings yet
KMeans Clustering Bidimensional Daniel Ames Camayo
15 pages
6 - Machine Learning and Unlabeled Data
No ratings yet
6 - Machine Learning and Unlabeled Data
67 pages
Agnes
No ratings yet
Agnes
25 pages
Data Science
No ratings yet
Data Science
2 pages
5 - AML Lecture 5 - Linear Regression
No ratings yet
5 - AML Lecture 5 - Linear Regression
56 pages
Alantek UL 3P Certificate Data cable-CAT 6 PDF
No ratings yet
Alantek UL 3P Certificate Data cable-CAT 6 PDF
1 page
Hierarchical Clustering and Data Science Group Project - Assignment 2
No ratings yet
Hierarchical Clustering and Data Science Group Project - Assignment 2
29 pages
Compute2
No ratings yet
Compute2
10 pages
Program 2 Hierarchical Cluestring
No ratings yet
Program 2 Hierarchical Cluestring
5 pages
Hierarchical Clustering in Machine Learning
No ratings yet
Hierarchical Clustering in Machine Learning
11 pages
4 Clustering With K-Means - Kaggle
No ratings yet
4 Clustering With K-Means - Kaggle
9 pages
Moeketsi Mofokeng Computational Geophysics GEOP4004
No ratings yet
Moeketsi Mofokeng Computational Geophysics GEOP4004
2 pages
1 - AML - Manish
No ratings yet
1 - AML - Manish
72 pages
Practical 5
No ratings yet
Practical 5
6 pages
2 - Machine Learning - 130824
No ratings yet
2 - Machine Learning - 130824
81 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
Reading Data: #Importing Required Libraries
No ratings yet
Reading Data: #Importing Required Libraries
16 pages
Assg 3
No ratings yet
Assg 3
31 pages
Kmeansclustering Sales Dataset
No ratings yet
Kmeansclustering Sales Dataset
6 pages
21AI71 Module 5 Textbook
No ratings yet
21AI71 Module 5 Textbook
25 pages
Elbow Method
No ratings yet
Elbow Method
2 pages
Najir Shaikh Practical 5 ML 2
No ratings yet
Najir Shaikh Practical 5 ML 2
4 pages
3 - AML - Lecture 3 - Feature Engg
No ratings yet
3 - AML - Lecture 3 - Feature Engg
39 pages
Agglomerative - Jupyter Notebook
No ratings yet
Agglomerative - Jupyter Notebook
2 pages
Python
No ratings yet
Python
5 pages
Confusion Matrix Problem Solution
No ratings yet
Confusion Matrix Problem Solution
6 pages
From Import Import As Import As From Import From Import From Import From Import
No ratings yet
From Import Import As Import As From Import From Import From Import From Import
9 pages
IR 5 Agglomerative Iris
No ratings yet
IR 5 Agglomerative Iris
1 page
Clustering Algorithms CheatSheet 1710438661
No ratings yet
Clustering Algorithms CheatSheet 1710438661
6 pages
Intro Qugates
No ratings yet
Intro Qugates
4 pages
Implement Clustering Algorithms For Unsupervised Classification
No ratings yet
Implement Clustering Algorithms For Unsupervised Classification
4 pages
Kmeans
No ratings yet
Kmeans
5 pages
Nep 2020 Ciet Behera
No ratings yet
Nep 2020 Ciet Behera
15 pages
YUER™ NEW Mini LED Moving Head Light 150W Beam+S
No ratings yet
YUER™ NEW Mini LED Moving Head Light 150W Beam+S
1 page
Ass6 (DMDS)
No ratings yet
Ass6 (DMDS)
7 pages
Esquema Sensor de Temperatura Com LM 358
No ratings yet
Esquema Sensor de Temperatura Com LM 358
1 page
21MIC0107 Da4
No ratings yet
21MIC0107 Da4
4 pages
Clustering
No ratings yet
Clustering
19 pages
IR 5 Agglomerative Iris
No ratings yet
IR 5 Agglomerative Iris
1 page
Liner Regression Chapter N5
No ratings yet
Liner Regression Chapter N5
2 pages
Arbol Deudas
No ratings yet
Arbol Deudas
5 pages
4 - Outliers - +transformaations ML
No ratings yet
4 - Outliers - +transformaations ML
28 pages
Agglomerative Clustering 08122018
No ratings yet
Agglomerative Clustering 08122018
36 pages
Analysis of Netcode, Latency, and Packet-Loss in Online Multiplayer Games
No ratings yet
Analysis of Netcode, Latency, and Packet-Loss in Online Multiplayer Games
5 pages
Kmeans
No ratings yet
Kmeans
4 pages
Testbank For Before We Are Born 9th Edition Moore
No ratings yet
Testbank For Before We Are Born 9th Edition Moore
17 pages
Income (K-Means Clustering On A Sample Data Set)
No ratings yet
Income (K-Means Clustering On A Sample Data Set)
3 pages
ML Assignment
No ratings yet
ML Assignment
11 pages
Marketing Analytics Week-10 LAQ
No ratings yet
Marketing Analytics Week-10 LAQ
5 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
23 pages
Adsa Mid-1 MCQ Unit-1
No ratings yet
Adsa Mid-1 MCQ Unit-1
5 pages
Hierarchical Clustering Mall Data
No ratings yet
Hierarchical Clustering Mall Data
2 pages
K Means Clustering
No ratings yet
K Means Clustering
6 pages
Week 8 DS Practical
No ratings yet
Week 8 DS Practical
13 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
23CC554
No ratings yet
23CC554
10 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
10 pages
ML Lab
No ratings yet
ML Lab
8 pages
Agglomerative Min
No ratings yet
Agglomerative Min
4 pages
Hierarchical Clustering in Machine Learning
No ratings yet
Hierarchical Clustering in Machine Learning
10 pages
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet

IMP Hierarchical Clustering

Uploaded by

IMP Hierarchical Clustering

Uploaded by

ew1tg5dzo

December 22, 2024

[1]: import numpy as np

[2]: # Sample dataset (replace this with your dataset)

[2]: Name Age Income($)

[3]: df = df.drop(['Name'], axis = 1)

[3]: Age Income($)

[10]: # from scipy.cluster.hierarchy import dendrogram, linkage

linkage_matrix = linkage(df, method='ward') # 'ward', 'single', 'complete',␣

# # Add cluster labels to the dataset

# # Display the dataset with clusters

[6]: # from scipy.cluster.hierarchy import cophenet

# coph_corr, _ = cophenet(linkage_matrix, pdist(df))

[7]: # Agglomerative Clustering

Agglomerative Clustering Labels: [0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0]

[8]: Z = linkage(df, method='ward')

coph_corr, _ = cophenet(Z, pdist(df)) # Cophenetic Correlation

Divisive Clustering Labels: [3 2 3 3 1 1 1 1 1 1 1 3 3 3 3 3 3 3 3 2 2 3]

You might also like