0% found this document useful (0 votes)

4 views4 pages

K Means Clustering

The document outlines a data analysis process using the Iris dataset with KMeans clustering. It includes steps for data scaling, determining the optimal number of clusters using the Elbow method, and visualizing the clusters. The final Silhouette Score of 0.457 indicates moderate clustering quality for k=3.

Uploaded by

regularuse0001

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views4 pages

K Means Clustering

Uploaded by

regularuse0001

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Name : Aachal Patil

PRN : 2223000817

Roll No: B44

from sklearn import datasets

from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
import pandas as pd
iris = datasets.load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
iris_df['target'] = iris.target
iris_df.head()

sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) target

0 5.1 3.5 1.4 0.2 0

1 4.9 3.0 1.4 0.2 0

2 4.7 3.2 1.3 0.2 0

3 4.6 3.1 1.5 0.2 0

4 5.0 3.6 1.4 0.2 0

Next steps: Generate code with iris_df

toggle_off View recommended plots New interactive sheet

scaler = StandardScaler()
scaled_data = scaler.fit_transform(iris.data)

sse = []
for k in range(1, 11):
km = KMeans(n_clusters=k, random_state=2)
km.fit(scaled_data)
sse.append(km.inertia_)

import seaborn as sns

import matplotlib.pyplot as plt
sns.set_style("whitegrid")
g = sns.lineplot(x=range(1, 11), y=sse)
g.set(xlabel="Number of cluster (k)",
ylabel="Sum Squared Error",
title='Elbow Method')

plt.show()
kmeans = KMeans(n_clusters = 3, random_state = 2)
kmeans.fit(scaled_data)

▾ KMeans i ?

KMeans(n_clusters=3, random_state=2)

import seaborn as sns

import matplotlib.pyplot as plt
import pandas as pd

scaled_data_df = pd.DataFrame(scaled_data)

scaled_data_df['Cluster'] = kmeans.labels_

plt.figure(figsize=(8, 6))

sns.scatterplot(x=scaled_data_df.iloc[:, 0], y=scaled_data_df.iloc[:, 1], hue='Cluster', palette='deep', data=scaled_data_df, s=100, edgecolor='k', marker='o')

plt.title('Clusters Visualized (First Two Features)', fontsize=16)

plt.xlabel('Feature 1', fontsize=12)
plt.ylabel('Feature 2', fontsize=12)
plt.legend(title='Cluster')
plt.show()

from sklearn.metrics import silhouette_score

score = silhouette_score(scaled_data, kmeans.labels_ )
print(f"Silhouette Score: {score:.3f}")

Silhouette Score: 0.457

REPORT:

Silhouette Score is 0.457 for k=3

The score is in between 0.2 and 0.5 which indicates moderate clustering quality

Machine Learning Assignment Report - Cars
100% (4)
Machine Learning Assignment Report - Cars
42 pages
Fundamentals of Forecasting Using Excel: Dr. Kenneth D. Lawrence Dr. Ronald K. Klimberg Dr. Sheila M. Lawrence
No ratings yet
Fundamentals of Forecasting Using Excel: Dr. Kenneth D. Lawrence Dr. Ronald K. Klimberg Dr. Sheila M. Lawrence
7 pages
Objective: For One Dimensional Data Set (7,10,20,28,35), Perform Hierarchical Clustering
No ratings yet
Objective: For One Dimensional Data Set (7,10,20,28,35), Perform Hierarchical Clustering
13 pages
Analysis of Covariance
No ratings yet
Analysis of Covariance
4 pages
C1M5 Peer Reviewed Others
No ratings yet
C1M5 Peer Reviewed Others
27 pages
TSNotes 2
No ratings yet
TSNotes 2
28 pages
Chapter 11 Correlation Design
No ratings yet
Chapter 11 Correlation Design
55 pages
Case Study: Jane Smith (C) : Group Members
No ratings yet
Case Study: Jane Smith (C) : Group Members
23 pages
Arma Models and The Box Jenkins Methodology
No ratings yet
Arma Models and The Box Jenkins Methodology
25 pages
Arima Model
No ratings yet
Arima Model
19 pages
Langmuir Isotherm Development
No ratings yet
Langmuir Isotherm Development
16 pages
Unit 7 Correlation Analysis
100% (1)
Unit 7 Correlation Analysis
21 pages
MCA Microsoft Certified Associate Azure Security Engineer Study Guide: Exam AZ-500
From Everand
MCA Microsoft Certified Associate Azure Security Engineer Study Guide: Exam AZ-500
Shimon Brathwaite
No ratings yet
Part3. 实用教程 - Practical Regression and ANOVA using R
No ratings yet
Part3. 实用教程 - Practical Regression and ANOVA using R
102 pages
M.Tec Maths Quation Paper
No ratings yet
M.Tec Maths Quation Paper
2 pages
JCN 10 774 Wald Test
No ratings yet
JCN 10 774 Wald Test
1 page
Performance Analysis of Machine Learning Algorithms For Prediction of Liver Disease
No ratings yet
Performance Analysis of Machine Learning Algorithms For Prediction of Liver Disease
7 pages
2403res62 - CS564 - Assignment - 4 - K-Means-Iris - Intrinsic - CVIs
No ratings yet
2403res62 - CS564 - Assignment - 4 - K-Means-Iris - Intrinsic - CVIs
30 pages
Ds Paper
No ratings yet
Ds Paper
35 pages
ML Lab Programs
No ratings yet
ML Lab Programs
23 pages
K Means
No ratings yet
K Means
26 pages
CSC649 Lecture 3 Unsupervised ML - KMeansClustering
No ratings yet
CSC649 Lecture 3 Unsupervised ML - KMeansClustering
22 pages
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
No ratings yet
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
6 pages
Rlab SS
No ratings yet
Rlab SS
25 pages
LAB # 07 KNN - Iris Dataset - Ipynb - Colab
No ratings yet
LAB # 07 KNN - Iris Dataset - Ipynb - Colab
8 pages
Unsupervised ML
No ratings yet
Unsupervised ML
17 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
8 pages
Ass - 10.ipynb - Colab
No ratings yet
Ass - 10.ipynb - Colab
8 pages
Linear SVM: 'Target'
No ratings yet
Linear SVM: 'Target'
13 pages
ML L - Ab
No ratings yet
ML L - Ab
13 pages
Import As Import As Import As From Import Import As Import
No ratings yet
Import As Import As Import As From Import Import As Import
7 pages
Việt Cường
No ratings yet
Việt Cường
14 pages
Lab Manual
No ratings yet
Lab Manual
9 pages
K-Means Clustering Using PCA Analysis Lab Report
No ratings yet
K-Means Clustering Using PCA Analysis Lab Report
9 pages
Department Of: Computer Science & Engineering
No ratings yet
Department Of: Computer Science & Engineering
4 pages
CO3
No ratings yet
CO3
8 pages
Lab Report6 - B21CI014
No ratings yet
Lab Report6 - B21CI014
8 pages
SVM and Kmeans - Iris Dataset - Ipynb - Colab
No ratings yet
SVM and Kmeans - Iris Dataset - Ipynb - Colab
5 pages
Toc ch1
No ratings yet
Toc ch1
9 pages
085
No ratings yet
085
4 pages
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
No ratings yet
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
7 pages
K-Means Algoritham
No ratings yet
K-Means Algoritham
3 pages
L6 Tutorial - KNN - Jupyter Notebook
No ratings yet
L6 Tutorial - KNN - Jupyter Notebook
7 pages
Kmeansclustering Sales Dataset
No ratings yet
Kmeansclustering Sales Dataset
6 pages
TranMinhTu1 bt2 2
No ratings yet
TranMinhTu1 bt2 2
5 pages
L20 - Regression Analysis 1 PDF
No ratings yet
L20 - Regression Analysis 1 PDF
17 pages
Avinash Tiwari 9
No ratings yet
Avinash Tiwari 9
4 pages
Simple Linear Regression PDF
No ratings yet
Simple Linear Regression PDF
40 pages
E23CSEU2241 LAB9 Data Mining
No ratings yet
E23CSEU2241 LAB9 Data Mining
5 pages
ML 2.3 Prashant
No ratings yet
ML 2.3 Prashant
4 pages
9 Ds
No ratings yet
9 Ds
5 pages
AAM 7th Prac
No ratings yet
AAM 7th Prac
4 pages
KNN ALGORITHM - Ipynb - Colab
No ratings yet
KNN ALGORITHM - Ipynb - Colab
4 pages
Exercise For K Means Tutorial
No ratings yet
Exercise For K Means Tutorial
5 pages
EX7
No ratings yet
EX7
3 pages
EXP 07 (ML) - Ashu
No ratings yet
EXP 07 (ML) - Ashu
4 pages
EXP 07 (ML) - Darshu
No ratings yet
EXP 07 (ML) - Darshu
4 pages
EXP 07 (ML) - Sarthak
No ratings yet
EXP 07 (ML) - Sarthak
4 pages
Exp 07 (ML)
No ratings yet
Exp 07 (ML)
4 pages
Iris Unsupervised Cluster
No ratings yet
Iris Unsupervised Cluster
1 page
Exp 11 2
No ratings yet
Exp 11 2
3 pages
Yogesh Siddiq Edited
No ratings yet
Yogesh Siddiq Edited
6 pages
DS Prac 8
No ratings yet
DS Prac 8
4 pages
K-Means Algorithm - Colab
No ratings yet
K-Means Algorithm - Colab
3 pages
Correlation and Regression Analysis
No ratings yet
Correlation and Regression Analysis
29 pages
K Means
No ratings yet
K Means
2 pages
K Means Algorithm
No ratings yet
K Means Algorithm
1 page
K-Means Cluster
No ratings yet
K-Means Cluster
2 pages
Kmeans Steps
No ratings yet
Kmeans Steps
3 pages
PGM 7
No ratings yet
PGM 7
3 pages
Kmeans
No ratings yet
Kmeans
2 pages
Import As Import As From Import Import As Import As From Import From Import From Import
No ratings yet
Import As Import As From Import Import As Import As From Import From Import From Import
6 pages
Kmeans Clustering Code
No ratings yet
Kmeans Clustering Code
2 pages
KMeans
No ratings yet
KMeans
2 pages
Unsupervisd Learning Algorithm
No ratings yet
Unsupervisd Learning Algorithm
6 pages
Lab - Manual - Machine Learning Lab - VII Semester - A
No ratings yet
Lab - Manual - Machine Learning Lab - VII Semester - A
56 pages
K-Means Cluter Analysis For IRIS Data Frame in R
No ratings yet
K-Means Cluter Analysis For IRIS Data Frame in R
3 pages
Experiment 11ml
No ratings yet
Experiment 11ml
1 page
Assessing PS-Garrido Et Al 2014
No ratings yet
Assessing PS-Garrido Et Al 2014
10 pages
Homework 10.1
No ratings yet
Homework 10.1
4 pages
K Means Clustering
No ratings yet
K Means Clustering
1 page
PAS GTU Study Material E-Notes 3 13082020055612PM
No ratings yet
PAS GTU Study Material E-Notes 3 13082020055612PM
59 pages
Bsc-Iii Econometrics I (ECO 204) Quiz 3 Spring 2021 Azam Chaudhry Aimal Tanvir
No ratings yet
Bsc-Iii Econometrics I (ECO 204) Quiz 3 Spring 2021 Azam Chaudhry Aimal Tanvir
3 pages
03 - K Means Clustering On Iris Datasets
No ratings yet
03 - K Means Clustering On Iris Datasets
4 pages
Iogi2018,+8 3 +Charles+Willson +08 +OK
No ratings yet
Iogi2018,+8 3 +Charles+Willson +08 +OK
9 pages
At Tutorail 1 Merged
No ratings yet
At Tutorail 1 Merged
23 pages
Survival Analysis As A Classification Problem
No ratings yet
Survival Analysis As A Classification Problem
15 pages
DL Assi02
No ratings yet
DL Assi02
9 pages
Chys 3P15 Exam Review
No ratings yet
Chys 3P15 Exam Review
1 page
Advantages and Disadvantage of PCA
No ratings yet
Advantages and Disadvantage of PCA
2 pages
BISC 1112 - Lab Report 1 Data
No ratings yet
BISC 1112 - Lab Report 1 Data
8 pages
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
Mini Project V Sem
No ratings yet
Mini Project V Sem
8 pages
IEEE Conference Template 1
No ratings yet
IEEE Conference Template 1
4 pages
B58 - Coding Assignment 07
No ratings yet
B58 - Coding Assignment 07
4 pages
Untitled Document
No ratings yet
Untitled Document
3 pages
Codingassignment2 (B58)
No ratings yet
Codingassignment2 (B58)
2 pages
Ty Aiml Pe1 Uame0621 Immersive Technology Arvr
No ratings yet
Ty Aiml Pe1 Uame0621 Immersive Technology Arvr
2 pages
DS-SIMULATION B58 Completion Certificate
No ratings yet
DS-SIMULATION B58 Completion Certificate
1 page
505assignment 103106 96593 6746dbccc80d6
No ratings yet
505assignment 103106 96593 6746dbccc80d6
1 page
Prat Res
No ratings yet
Prat Res
1 page
Simplilearn Certificate
No ratings yet
Simplilearn Certificate
1 page
Assignment 114151 107139 67c922111f784
No ratings yet
Assignment 114151 107139 67c922111f784
1 page

K Means Clustering

Uploaded by

K Means Clustering

Uploaded by

Name : Aachal Patil

Roll No: B44

from sklearn import datasets

0 5.1 3.5 1.4 0.2 0

1 4.9 3.0 1.4 0.2 0

2 4.7 3.2 1.3 0.2 0

3 4.6 3.1 1.5 0.2 0

4 5.0 3.6 1.4 0.2 0

Next steps: Generate code with iris_df

import seaborn as sns

import seaborn as sns

plt.title('Clusters Visualized (First Two Features)', fontsize=16)

from sklearn.metrics import silhouette_score

Silhouette Score: 0.457

Silhouette Score is 0.457 for k=3

You might also like