0% found this document useful (0 votes)

15 views3 pages

Assignment 4 28855

The document discusses using k-means clustering to group customers based on annual income and spending score. It provides an example of applying the k-means algorithm over multiple iterations to assign customers to clusters. Evaluation metrics like within-cluster sum of squares and silhouette score are used to analyze the quality of the resulting clusters. The goal is to identify stable, well-defined clusters after several iterations as the clustering process converges.

Uploaded by

abbiha.mustafamalik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views3 pages

Assignment 4 28855

Uploaded by

abbiha.mustafamalik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Name Abbiha Mustafa

SAP 28855
Subject Artificial Intelligence
Assignment 4

Unsupervised Learning
1. Use k-means clustering algorithm to group/cluster items of your
choice.
I. K-Means Clustering Example:
Consider a simple example of clustering customers based on their purchase behavior. We'll use
two features: "Annual Income" and "Spending Score."

II. Distance Formula:

The Euclidean distance formula is commonly used for k-means clustering:

Distance=√(𝑋2 − 𝑋1 )2 + (𝑌2 − 𝑌1 )2

2. Iterations and Table:

Initial Data:

Customer Annual Income ($) Spending Score (1-100)

A 45,000 25
B 60,000 50
C 30,000 15
D 80,000 75
E 50,000 40
F 150,000 85
G 120,000 90

Iteration 1:
• Assume initial centroids (cluster centers).
• Assign each point to the nearest centroid.
• Recalculate centroids based on the assigned points.

Customer Distance to Cluster 1 Distance to Cluster 2

Assigned Cluster
A 10,000 50,000 1

B 5,000 45,000 1

C 20,000 30,000 2

D 70,000 20,000 2

E 20,000 30,000 2

F 105,000 50,000 2

G 75,000 5,000 1

Iteration 2:
• Use updated centroids from Iteration 1.
• Reassign points based on new centroids.
• Recalculate centroids.

Customer Distance to Cluster 1 Distance to Cluster 2 Assigned Cluster

A 5,000 70,000 1

B 0 65,000 1

C 25,000 10,000 2

D 75,000 30,000 2

E 25,000 10,000 2

F 120,000 55,000 2

G 90,000 0 1
3. Evaluation:
To evaluate the resulting clusters, we can use metrics like the within-cluster sum of squares
(WCSS) or silhouette score:
• WCSS: Measure the sum of squared distances within each cluster. A lower WCSS
indicates denser and more compact clusters.
• Silhouette Score: Measure how similar an object is to its cluster compared to other
clusters. The score ranges from -1 to 1, and higher values indicate better-defined
clusters.

4. Conclusion:
After a few iterations, if the WCSS stops decreasing significantly and the silhouette score
becomes stable or increases, it suggests that the clusters are becoming more stable and well-
defined.

BDA Unit 2
No ratings yet
BDA Unit 2
31 pages
L11 Cluster Analysis
No ratings yet
L11 Cluster Analysis
47 pages
5 - CH 5-K-Means Clustering
No ratings yet
5 - CH 5-K-Means Clustering
54 pages
K Means
No ratings yet
K Means
26 pages
NEUROLINGUISTIC PROGRAMMING Final
No ratings yet
NEUROLINGUISTIC PROGRAMMING Final
47 pages
Unsupervised Learning
No ratings yet
Unsupervised Learning
79 pages
UNIT 3-Clustering Metrics
No ratings yet
UNIT 3-Clustering Metrics
59 pages
Week6 Clustering Regression
No ratings yet
Week6 Clustering Regression
101 pages
Techniques of Cluster Analysis: A Seminar On
No ratings yet
Techniques of Cluster Analysis: A Seminar On
25 pages
Clustering
No ratings yet
Clustering
80 pages
09 Clustering
No ratings yet
09 Clustering
21 pages
Unit 5
No ratings yet
Unit 5
33 pages
4 Clustering1
No ratings yet
4 Clustering1
41 pages
BIS 541 Ch04 20-21 S
No ratings yet
BIS 541 Ch04 20-21 S
82 pages
Datamining-Lect5 - Clustering. The K-Means Algorithm. Hierarchical Clustering. The DBSCAN Algorithm. Clustering Evaluation
No ratings yet
Datamining-Lect5 - Clustering. The K-Means Algorithm. Hierarchical Clustering. The DBSCAN Algorithm. Clustering Evaluation
110 pages
CS8091 - Big Data Analytics - Unit 2
No ratings yet
CS8091 - Big Data Analytics - Unit 2
44 pages
Unit V
No ratings yet
Unit V
165 pages
Chapter 5 CLUSTERING
No ratings yet
Chapter 5 CLUSTERING
36 pages
K Means
No ratings yet
K Means
66 pages
Lecture 1 (UNIT 1)
No ratings yet
Lecture 1 (UNIT 1)
68 pages
Datamining Lect8
No ratings yet
Datamining Lect8
79 pages
Customer Segmentation Using Ensemble Clustering
No ratings yet
Customer Segmentation Using Ensemble Clustering
20 pages
Clustering TNP
No ratings yet
Clustering TNP
53 pages
4 Clustring
No ratings yet
4 Clustring
48 pages
K-Means Clustering Clearly Explained
No ratings yet
K-Means Clustering Clearly Explained
12 pages
Week 9 - Clustering
No ratings yet
Week 9 - Clustering
63 pages
K Means
No ratings yet
K Means
25 pages
Data Mining - Clustering
No ratings yet
Data Mining - Clustering
90 pages
K Means
No ratings yet
K Means
40 pages
Lecture 18 Clustering 19092024 091909am
No ratings yet
Lecture 18 Clustering 19092024 091909am
33 pages
DM Unit Iv
No ratings yet
DM Unit Iv
45 pages
20 - 1 - ML - Unsup - 01 - Partition Based - Kmeans
No ratings yet
20 - 1 - ML - Unsup - 01 - Partition Based - Kmeans
20 pages
K Mean Clustering
No ratings yet
K Mean Clustering
32 pages
Cluster Analysis
No ratings yet
Cluster Analysis
9 pages
Clustering
No ratings yet
Clustering
125 pages
OJT Sheet & Practical Test Paper
100% (1)
OJT Sheet & Practical Test Paper
2 pages
Mod 4 - CLustering
No ratings yet
Mod 4 - CLustering
55 pages
Objectives of Clustering
No ratings yet
Objectives of Clustering
3 pages
Module 5
No ratings yet
Module 5
98 pages
Clustering Solved Examples
No ratings yet
Clustering Solved Examples
13 pages
Unit - 4 DWDM
No ratings yet
Unit - 4 DWDM
27 pages
Clustering Part-1
No ratings yet
Clustering Part-1
48 pages
Python Machine Learning
No ratings yet
Python Machine Learning
19 pages
LP I Assignment A4 Clustering
No ratings yet
LP I Assignment A4 Clustering
13 pages
K-Means Clustering
No ratings yet
K-Means Clustering
38 pages
M5
No ratings yet
M5
40 pages
Chapter 5 Clustering
No ratings yet
Chapter 5 Clustering
40 pages
Detailed Lesson Plan - Fundamentals of Accounting 1
100% (3)
Detailed Lesson Plan - Fundamentals of Accounting 1
7 pages
Lecture - 10 Unsupervised Learning & K-Means Clustering
No ratings yet
Lecture - 10 Unsupervised Learning & K-Means Clustering
31 pages
Chapter 04 Clustering
No ratings yet
Chapter 04 Clustering
36 pages
Intro Data Science: Cluster Analysis
No ratings yet
Intro Data Science: Cluster Analysis
60 pages
Clustering Algorithm
No ratings yet
Clustering Algorithm
47 pages
Kmeansfinal
No ratings yet
Kmeansfinal
16 pages
20 - 1 - ML - Unsup - 01 - Partition Based - Kmeans
No ratings yet
20 - 1 - ML - Unsup - 01 - Partition Based - Kmeans
20 pages
AI Chapter 3 Part 5
No ratings yet
AI Chapter 3 Part 5
30 pages
ML Module 4 2022 1 PDF
No ratings yet
ML Module 4 2022 1 PDF
31 pages
CH-6 DM Clustering
No ratings yet
CH-6 DM Clustering
28 pages
ML Unit 4 Part A Material
No ratings yet
ML Unit 4 Part A Material
15 pages
Unit 4 Machine Learning
No ratings yet
Unit 4 Machine Learning
12 pages
Centre For Environmental Planning and Technology University (Cept University) Ahmedabad
No ratings yet
Centre For Environmental Planning and Technology University (Cept University) Ahmedabad
8 pages
K Means Alg, Example
No ratings yet
K Means Alg, Example
9 pages
K Mean Clustering1
No ratings yet
K Mean Clustering1
23 pages
Power EXCEL Award - Nomination Form: Ntpc-Sipat
No ratings yet
Power EXCEL Award - Nomination Form: Ntpc-Sipat
2 pages
Lesson Plan Rational Numbers Differentiated
No ratings yet
Lesson Plan Rational Numbers Differentiated
5 pages
Leadership Analysis
No ratings yet
Leadership Analysis
8 pages
Artifact2 Field Observation and Reflection
No ratings yet
Artifact2 Field Observation and Reflection
6 pages
School Calendar
No ratings yet
School Calendar
2 pages
Personal Data Form PDF
No ratings yet
Personal Data Form PDF
4 pages
Daily Routines - Present Simple
No ratings yet
Daily Routines - Present Simple
2 pages
Q1 Beowulf and Grendel 2
No ratings yet
Q1 Beowulf and Grendel 2
5 pages
Single Subject Design Critique: Article: Running Training After Stroke: A Single-Subject Report
No ratings yet
Single Subject Design Critique: Article: Running Training After Stroke: A Single-Subject Report
19 pages
Pre-Final Examination Grade 9-ENGLISH
No ratings yet
Pre-Final Examination Grade 9-ENGLISH
2 pages
Guía 4
No ratings yet
Guía 4
3 pages
PBL - Implementation - English
No ratings yet
PBL - Implementation - English
29 pages
Application Form Unilever Internship (ULIP) 2013 - tcm108-349706
No ratings yet
Application Form Unilever Internship (ULIP) 2013 - tcm108-349706
6 pages
The Structured Interview An Alternative To The Assessment Center?
No ratings yet
The Structured Interview An Alternative To The Assessment Center?
15 pages
Breaking Bad News - Protocols
No ratings yet
Breaking Bad News - Protocols
6 pages
AlecCouros CV Jan2009
No ratings yet
AlecCouros CV Jan2009
17 pages
Claude LeviStrauss
No ratings yet
Claude LeviStrauss
11 pages
SMART Postgraduate Course Scientific Program
No ratings yet
SMART Postgraduate Course Scientific Program
3 pages
CH 1 Intro To Parallel Architecture
No ratings yet
CH 1 Intro To Parallel Architecture
18 pages
Writing Applications Prewriting Handout
No ratings yet
Writing Applications Prewriting Handout
1 page
Devendra MIshra Resume
No ratings yet
Devendra MIshra Resume
1 page
From Noob To AI Developer
No ratings yet
From Noob To AI Developer
7 pages
Combining XGBoost With Particle Swarm Optimization To Improve Phishing Detection (JOURNAL (Revisi Note
No ratings yet
Combining XGBoost With Particle Swarm Optimization To Improve Phishing Detection (JOURNAL (Revisi Note
8 pages
@career Guidance Implementation Report
No ratings yet
@career Guidance Implementation Report
3 pages
BDL Fee Policy
No ratings yet
BDL Fee Policy
2 pages
Edem Name Meaning, Origin, Personality Traits and
No ratings yet
Edem Name Meaning, Origin, Personality Traits and
1 page
Solutions to Problems in Fluids and Turbomachinery
From Everand
Solutions to Problems in Fluids and Turbomachinery
Rahul Basu
No ratings yet
ISA Certified Control Systems Technician (CCST): Certification Exam Prep: 500 Practice Exam Questions and Explanations
From Everand
ISA Certified Control Systems Technician (CCST): Certification Exam Prep: 500 Practice Exam Questions and Explanations
Steve Brown
No ratings yet

Assignment 4 28855

Uploaded by

Assignment 4 28855

Uploaded by

Name Abbiha Mustafa

II. Distance Formula:

2. Iterations and Table:

Customer Annual Income ($) Spending Score (1-100)

Customer Distance to Cluster 1 Distance to Cluster 2

Customer Distance to Cluster 1 Distance to Cluster 2 Assigned Cluster

You might also like