BDM Tool - Weka: Example 6: K-Means Clustering

This document discusses using the K-Means clustering algorithm in WEKA to analyze the bank-data.csv dataset. It explains that WEKA's SimpleKMeans implementation can handle categorical and numerical attributes using Euclidean distance. The user is instructed to choose SimpleKMeans, evaluate the cluster assignments, and check the number of clusters and incorrectly clustered instances. The document also mentions another example that uses the Air Traffic Passenger Statistics.csv dataset.

Uploaded by

Janarthanan Siva Kumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

130 views13 pages

BDM Tool - Weka: Example 6: K-Means Clustering

Uploaded by

Janarthanan Siva Kumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 13

BDM Tool - WEKA

Example 6 : K-Means clustering

K-Means Introduction (1)
K-Means Introduction (2)
K-Means Introduction (3)
K-Means Introduction (4)
K-Means Introduction (5)
K-Means Introduction (6)
K-Means Introduction (7)
K-Means Introduction (8)
K-Means Introduction (9)
Example 6 : K-Means Clustering
• http://facweb.cs.depaul.edu/mobasher/classes/ect584/weka/k-means.htm
l

• WEKA SimpleKMeans algorithm automatically handles a mixture of

categorical and numerical attributes.

• SimpleKMeans algorithm uses Euclidean distance measure to compute

distances between instances and clusters.

• Dataset : bank-data.csv
• Cluster
– Choose : SimpleKMeans / EM / HierarchicalClusterer
– Classes to clusters evaluation : Variable selection (NOM)
– Check the number of clusters and Incorrectly clustered instances
Example 7 – Air Traffic Passenger Statistics
• TRY IT
• Data set - Air Traffic Passenger Statistics.csv

• Activity Period
• Operating Airline
• Operating Airline IATA Code
• Published Airline
• Published Airline IATA Code
• GEO Summary
• GEO Region
• Activity Type Code
• Price Category Code
• Terminal
• Boarding Area
• Passenger Count
• Adjusted Activity Type Code
• Adjusted Passenger Count
• Year
• Month

WEKA Lab Manual
100% (2)
WEKA Lab Manual
107 pages
Python
No ratings yet
Python
212 pages
Full (Ebook PDF) Research Methods For The Behavioral Sciences 3rd Edition PDF All Chapters
100% (3)
Full (Ebook PDF) Research Methods For The Behavioral Sciences 3rd Edition PDF All Chapters
45 pages
Data Mining Unit-Ii Notes
No ratings yet
Data Mining Unit-Ii Notes
24 pages
Chapter
100% (1)
Chapter
101 pages
Classification: Decision Tree Induction: Lecture #9
No ratings yet
Classification: Decision Tree Induction: Lecture #9
121 pages
Weka Tutorial
100% (2)
Weka Tutorial
60 pages
REPORT On DECISION TREE
No ratings yet
REPORT On DECISION TREE
40 pages
Module 3
No ratings yet
Module 3
83 pages
Aggregate Planning and MRP
No ratings yet
Aggregate Planning and MRP
68 pages
Semarchy XDM Ebook
No ratings yet
Semarchy XDM Ebook
46 pages
WEKA Classification Examples
No ratings yet
WEKA Classification Examples
14 pages
Data Mining: Concepts and Techniques: - Introduction
No ratings yet
Data Mining: Concepts and Techniques: - Introduction
44 pages
openSAP Sac3 Week 1 Exercise1
No ratings yet
openSAP Sac3 Week 1 Exercise1
30 pages
Data Mining
No ratings yet
Data Mining
33 pages
Facility Location and Layout
No ratings yet
Facility Location and Layout
106 pages
CH 6
No ratings yet
CH 6
72 pages
Fig 1: Circuit Diagram of Metal Detector Using TDA 0161 IC
No ratings yet
Fig 1: Circuit Diagram of Metal Detector Using TDA 0161 IC
2 pages
Unsupervised Learning 2024-PPG
No ratings yet
Unsupervised Learning 2024-PPG
85 pages
1.linear Regression PSP
No ratings yet
1.linear Regression PSP
92 pages
10.program K Means
No ratings yet
10.program K Means
16 pages
K-Means Clustering Algorithm
No ratings yet
K-Means Clustering Algorithm
40 pages
Lecture 3 Data Mining
No ratings yet
Lecture 3 Data Mining
30 pages
WEKA Examples Exercises (Autosaved)
No ratings yet
WEKA Examples Exercises (Autosaved)
5 pages
Matplotlib Fundamentals
No ratings yet
Matplotlib Fundamentals
31 pages
Deep Learning Using Python + Keras (Chapter 3) - ResNet - CodeProject
No ratings yet
Deep Learning Using Python + Keras (Chapter 3) - ResNet - CodeProject
24 pages
BDM Unit I Slides Part 1
No ratings yet
BDM Unit I Slides Part 1
27 pages
Lesson 6 - Unsupervised Learning
No ratings yet
Lesson 6 - Unsupervised Learning
63 pages
To Operations Management
No ratings yet
To Operations Management
59 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
52 pages
Data Preprocessing
No ratings yet
Data Preprocessing
38 pages
ET4248E - Chap9 - K-Means and GMM
No ratings yet
ET4248E - Chap9 - K-Means and GMM
27 pages
Decision Tree
No ratings yet
Decision Tree
57 pages
Machine Learning: Engr. Ejaz Ahmad
No ratings yet
Machine Learning: Engr. Ejaz Ahmad
54 pages
Overview of Parallel Coordinates, Visualizing Neural Network and Visualization of Trees
No ratings yet
Overview of Parallel Coordinates, Visualizing Neural Network and Visualization of Trees
9 pages
Association Rules FP Growth
No ratings yet
Association Rules FP Growth
32 pages
DBSCAN
No ratings yet
DBSCAN
42 pages
Agglomerative Hierarchical Clustering
No ratings yet
Agglomerative Hierarchical Clustering
21 pages
IS328 Final Exam
No ratings yet
IS328 Final Exam
12 pages
K Means Clustering Lecture
No ratings yet
K Means Clustering Lecture
32 pages
A LGB Ronker Bosh
No ratings yet
A LGB Ronker Bosh
18 pages
Anova: Sum of Squares DF Mean Square F Sig. Between Groups Within Groups Total
No ratings yet
Anova: Sum of Squares DF Mean Square F Sig. Between Groups Within Groups Total
2 pages
BDM Unit I Slides Part 2
No ratings yet
BDM Unit I Slides Part 2
21 pages
Expectation Maximization
No ratings yet
Expectation Maximization
23 pages
WEKA Association Rule Examples
No ratings yet
WEKA Association Rule Examples
13 pages
Unsupervised Learning
No ratings yet
Unsupervised Learning
24 pages
Machine Learning - Brief
No ratings yet
Machine Learning - Brief
12 pages
Data Mining Final Exam
No ratings yet
Data Mining Final Exam
1 page
Data Mining and Visualization
No ratings yet
Data Mining and Visualization
8 pages
Koho Financial INC.: Facing A NEW Banking ERA: Team 1
No ratings yet
Koho Financial INC.: Facing A NEW Banking ERA: Team 1
13 pages
Excel VBA - Objects
No ratings yet
Excel VBA - Objects
18 pages
Data Mining Cheat Sheet PDF
No ratings yet
Data Mining Cheat Sheet PDF
6 pages
Prasanta Chopdar
No ratings yet
Prasanta Chopdar
25 pages
Nearest Neighbour Algorithm
No ratings yet
Nearest Neighbour Algorithm
20 pages
Distributed Databases: Solutions To Practice Exercises
No ratings yet
Distributed Databases: Solutions To Practice Exercises
4 pages
Chapt 2 Entity Relationship Modeling
No ratings yet
Chapt 2 Entity Relationship Modeling
33 pages
DBSCAN
No ratings yet
DBSCAN
18 pages
Session 6 PDF
No ratings yet
Session 6 PDF
3 pages
Introduction To Tree Methods
No ratings yet
Introduction To Tree Methods
15 pages
Understanding DBSCAN Algorithm and Implementation From Scratch - by Andrewngai - Towards Data Science
No ratings yet
Understanding DBSCAN Algorithm and Implementation From Scratch - by Andrewngai - Towards Data Science
10 pages
K-Means Clustering Using Weka Interface
No ratings yet
K-Means Clustering Using Weka Interface
6 pages
Appendix Weka
No ratings yet
Appendix Weka
17 pages
Hierarchical Cluster Analysis
No ratings yet
Hierarchical Cluster Analysis
4 pages
03 - K Means Clustering On Iris Datasets
No ratings yet
03 - K Means Clustering On Iris Datasets
4 pages
Recor
No ratings yet
Recor
6 pages
Estimation of Causal Relationships I: Illustration 1
No ratings yet
Estimation of Causal Relationships I: Illustration 1
8 pages
Outline: Problem Statement Definitions & Examples Strategies
No ratings yet
Outline: Problem Statement Definitions & Examples Strategies
7 pages
KNN ALGORITHM IN MACHINELEARNING
No ratings yet
KNN ALGORITHM IN MACHINELEARNING
10 pages
Flex Et Bison Exercice Calculatrice
100% (1)
Flex Et Bison Exercice Calculatrice
2 pages
Experiment Clustering
No ratings yet
Experiment Clustering
4 pages
Assignment 2 Question
No ratings yet
Assignment 2 Question
8 pages
Performance Comparison Between Naïve Bayes, Decision Tree and K-Nearest Neighbor in Searching Alternative Design in An Energy Simulation Tool
No ratings yet
Performance Comparison Between Naïve Bayes, Decision Tree and K-Nearest Neighbor in Searching Alternative Design in An Energy Simulation Tool
7 pages
Metal Detector Using 555 Timer
No ratings yet
Metal Detector Using 555 Timer
4 pages
Introduction To Data Mining: Saeed Salem Department of Computer Science North Dakota State University Cs - Ndsu.edu/ Salem
No ratings yet
Introduction To Data Mining: Saeed Salem Department of Computer Science North Dakota State University Cs - Ndsu.edu/ Salem
30 pages
Data Analysis Management II: Contents
No ratings yet
Data Analysis Management II: Contents
2 pages
DM Assignments
No ratings yet
DM Assignments
4 pages
Metal Detector Using RC Circuit
No ratings yet
Metal Detector Using RC Circuit
1 page
Problem Identification
No ratings yet
Problem Identification
1 page
Weka Tutorial
No ratings yet
Weka Tutorial
2 pages