Clustering Example

This document describes a case study using data from Samsung Galaxy S3 smartphones to analyze and cluster human activity patterns based on accelerometer data. The study explores various techniques for clustering and visualizing the smartphone accelerometer data recorded during different activities like walking, sitting, and standing. These techniques include hierarchical clustering, k-means clustering, and principal component analysis. The goal is to determine how well different clustering methods can distinguish between the types of activities performed by individuals based solely on the accelerometer data.

Uploaded by

niti860

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

63 views18 pages

Clustering Example

Uploaded by

niti860

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 18

EDA Case Study - Understanding Human EDA Case Study - Understanding Human

Activity with Smart Phones Activity with Smart Phones

Roger D. Peng, Associate Professor of Biostatistics
Johns Hopkins Bloomberg School of Public Health
Samsung Galaxy S3 Samsung Galaxy S3
http://www.samsung.com/global/galaxys3/
2/18
Samsung Data Samsung Data
http://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones
3/18
Slightly processed data Slightly processed data
Samsung data le
load("data/samsungData.rda")
names(samsungData)[1:12]
## [1] "tBodyAcc-mean()-X" "tBodyAcc-mean()-Y" "tBodyAcc-mean()-Z"
## [4] "tBodyAcc-std()-X" "tBodyAcc-std()-Y" "tBodyAcc-std()-Z"
## [7] "tBodyAcc-mad()-X" "tBodyAcc-mad()-Y" "tBodyAcc-mad()-Z"
## [10] "tBodyAcc-max()-X" "tBodyAcc-max()-Y" "tBodyAcc-max()-Z"
table(samsungData$activity)
##
## laying sitting standing walk walkdown walkup
## 1407 1286 1374 1226 986 1073
4/18
Plotting average acceleration for first subject Plotting average acceleration for first subject
par(mfrow = c(1, 2), mar = c(5, 4, 1, 1))
samsungData <- transform(samsungData, activity = factor(activity))
sub1 <- subset(samsungData, subject == 1)
plot(sub1[, 1], col = sub1$activity, ylab = names(sub1)[1])
plot(sub1[, 2], col = sub1$activity, ylab = names(sub1)[2])
legend("bottomright", legend = unique(sub1$activity), col = unique(sub1$activity),
pch = 1)
5/18
Clustering based just on average acceleration Clustering based just on average acceleration
source("myplclust.R")
distanceMatrix <- dist(sub1[, 1:3])
hclustering <- hclust(distanceMatrix)
myplclust(hclustering, lab.col = unclass(sub1$activity))
6/18
Plotting max acceleration for the first subject Plotting max acceleration for the first subject
par(mfrow = c(1, 2))
plot(sub1[, 10], pch = 19, col = sub1$activity, ylab = names(sub1)[10])
plot(sub1[, 11], pch = 19, col = sub1$activity, ylab = names(sub1)[11])
7/18
Clustering based on maximum acceleration Clustering based on maximum acceleration
source("myplclust.R")
distanceMatrix <- dist(sub1[, 10:12])
hclustering <- hclust(distanceMatrix)
myplclust(hclustering, lab.col = unclass(sub1$activity))
8/18
Singular Value Decomposition Singular Value Decomposition
svd1 = svd(scale(sub1[, -c(562, 563)]))
par(mfrow = c(1, 2))
plot(svd1$u[, 1], col = sub1$activity, pch = 19)
plot(svd1$u[, 2], col = sub1$activity, pch = 19)
9/18
Find maximum contributor Find maximum contributor
plot(svd1$v[, 2], pch = 19)
10/18
New clustering with maximum contributer New clustering with maximum contributer
maxContrib <- which.max(svd1$v[, 2])
distanceMatrix <- dist(sub1[, c(10:12, maxContrib)])
hclustering <- hclust(distanceMatrix)
myplclust(hclustering, lab.col = unclass(sub1$activity))
11/18
New clustering with maximum contributer New clustering with maximum contributer
names(samsungData)[maxContrib]
## [1] "fBodyAcc.meanFreq...Z"
12/18
K-means clustering (nstart=1, first try) K-means clustering (nstart=1, first try)
kClust <- kmeans(sub1[, -c(562, 563)], centers = 6)
table(kClust$cluster, sub1$activity)
##
## laying sitting standing walk walkdown walkup
## 1 0 0 0 50 1 0
## 2 0 0 0 0 48 0
## 3 27 37 51 0 0 0
## 4 3 0 0 0 0 53
## 5 0 0 0 45 0 0
## 6 20 10 2 0 0 0
13/18
K-means clustering (nstart=1, second try) K-means clustering (nstart=1, second try)
kClust <- kmeans(sub1[, -c(562, 563)], centers = 6, nstart = 1)
table(kClust$cluster, sub1$activity)
##
## laying sitting standing walk walkdown walkup
## 1 0 0 0 0 49 0
## 2 18 10 2 0 0 0
## 3 0 0 0 95 0 0
## 4 29 0 0 0 0 0
## 5 0 37 51 0 0 0
## 6 3 0 0 0 0 53
14/18
K-means clustering (nstart=100, first try) K-means clustering (nstart=100, first try)
kClust <- kmeans(sub1[, -c(562, 563)], centers = 6, nstart = 100)
table(kClust$cluster, sub1$activity)
##
## laying sitting standing walk walkdown walkup
## 1 18 10 2 0 0 0
## 2 29 0 0 0 0 0
## 3 0 0 0 95 0 0
## 4 0 0 0 0 49 0
## 5 3 0 0 0 0 53
## 6 0 37 51 0 0 0
15/18
K-means clustering (nstart=100, second try) K-means clustering (nstart=100, second try)
kClust <- kmeans(sub1[, -c(562, 563)], centers = 6, nstart = 100)
table(kClust$cluster, sub1$activity)
##
## laying sitting standing walk walkdown walkup
## 1 29 0 0 0 0 0
## 2 3 0 0 0 0 53
## 3 0 0 0 0 49 0
## 4 0 0 0 95 0 0
## 5 0 37 51 0 0 0
## 6 18 10 2 0 0 0
16/18
Cluster 1 Variable Centers (Laying) Cluster 1 Variable Centers (Laying)
plot(kClust$center[1, 1:10], pch = 19, ylab = "Cluster Center", xlab = "")
17/18
Cluster 2 Variable Centers (Walking) Cluster 2 Variable Centers (Walking)
plot(kClust$center[4, 1:10], pch = 19, ylab = "Cluster Center", xlab = "")
18/18

Final Documentation
No ratings yet
Final Documentation
68 pages
Session11-Parts 21-22
No ratings yet
Session11-Parts 21-22
171 pages
Data Mining: Hierarchical Clustering, DBSCAN The EM Algorithm
No ratings yet
Data Mining: Hierarchical Clustering, DBSCAN The EM Algorithm
63 pages
Unsupervised Learning
No ratings yet
Unsupervised Learning
66 pages
Clustering
No ratings yet
Clustering
34 pages
Clustering
No ratings yet
Clustering
29 pages
401 Week7 Part 1 KMeans
No ratings yet
401 Week7 Part 1 KMeans
45 pages
Ml Module5 Clustering
No ratings yet
Ml Module5 Clustering
71 pages
4 Clustering1
No ratings yet
4 Clustering1
41 pages
K-Means Clustering-converted-merged
No ratings yet
K-Means Clustering-converted-merged
76 pages
Clustering
No ratings yet
Clustering
25 pages
07-Clustering
No ratings yet
07-Clustering
54 pages
Cluster Analysis Finalllll
No ratings yet
Cluster Analysis Finalllll
24 pages
Mod 4 - CLustering
No ratings yet
Mod 4 - CLustering
55 pages
Anova For Comparing Means Between More Than 2 Groups: Variance: Average of Squared Differences From Mean
No ratings yet
Anova For Comparing Means Between More Than 2 Groups: Variance: Average of Squared Differences From Mean
69 pages
W6 Clustering
No ratings yet
W6 Clustering
29 pages
K Mean Clustering
No ratings yet
K Mean Clustering
45 pages
Unit- 4 DMA
No ratings yet
Unit- 4 DMA
145 pages
Learn Lab3
No ratings yet
Learn Lab3
12 pages
Unit 3
No ratings yet
Unit 3
58 pages
Datamining Lab Record
No ratings yet
Datamining Lab Record
36 pages
w6 Clustering
No ratings yet
w6 Clustering
29 pages
Clustering and Association Rule
No ratings yet
Clustering and Association Rule
69 pages
Seminar Report Format
No ratings yet
Seminar Report Format
19 pages
CSE3506 - Essentials of Data Analytics: Facilitator: DR Sathiya Narayanan S
No ratings yet
CSE3506 - Essentials of Data Analytics: Facilitator: DR Sathiya Narayanan S
17 pages
Clustering and Visualisation of Data - 2020
No ratings yet
Clustering and Visualisation of Data - 2020
5 pages
What Is The Most Natural (Non-Autonomous, E.G. Breathing) Thing Done by Human Beings? How Often Does The Average Human Do It?
No ratings yet
What Is The Most Natural (Non-Autonomous, E.G. Breathing) Thing Done by Human Beings? How Often Does The Average Human Do It?
32 pages
AI-AG-Day-2-28th Feb 2023
No ratings yet
AI-AG-Day-2-28th Feb 2023
44 pages
Clustering
No ratings yet
Clustering
80 pages
Clustering: Analisis Big Data - Pertemuan 6
No ratings yet
Clustering: Analisis Big Data - Pertemuan 6
51 pages
SPSS Week7
No ratings yet
SPSS Week7
42 pages
SPSS Week7
No ratings yet
SPSS Week7
42 pages
Clustering
No ratings yet
Clustering
75 pages
02 K-Means
No ratings yet
02 K-Means
25 pages
Lect 10 DM
No ratings yet
Lect 10 DM
36 pages
Introduction To Data Science: Clustering
No ratings yet
Introduction To Data Science: Clustering
45 pages
K Means Clustering
No ratings yet
K Means Clustering
13 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
77 pages
Clustering-Part1.pptx
No ratings yet
Clustering-Part1.pptx
84 pages
Agenda: 1. Introduction To Clustering
No ratings yet
Agenda: 1. Introduction To Clustering
47 pages
Lect 4
No ratings yet
Lect 4
34 pages
In-Class Short Exercises For Tutorial 7 - Grouping
No ratings yet
In-Class Short Exercises For Tutorial 7 - Grouping
8 pages
CH-6 DM Clustering
No ratings yet
CH-6 DM Clustering
28 pages
DM 10,11 Clustering PDF
No ratings yet
DM 10,11 Clustering PDF
65 pages
Cluster Analysis: Talha Farooq Faizan Ali Muhammad Abdul Basit
No ratings yet
Cluster Analysis: Talha Farooq Faizan Ali Muhammad Abdul Basit
16 pages
K Mean Clustering
No ratings yet
K Mean Clustering
27 pages
K-Means Clustering
No ratings yet
K-Means Clustering
8 pages
Design and Implementation of High End Multiple Security Based ATM Monitoring System
No ratings yet
Design and Implementation of High End Multiple Security Based ATM Monitoring System
3 pages
Sensors: Unsupervised Human Activity Recognition Using The Clustering Approach: A Review
No ratings yet
Sensors: Unsupervised Human Activity Recognition Using The Clustering Approach: A Review
27 pages
Clustering - Jun 2022
No ratings yet
Clustering - Jun 2022
4 pages
Unit - 4 - Modified
No ratings yet
Unit - 4 - Modified
152 pages
Cluster Analysis
No ratings yet
Cluster Analysis
77 pages
1.supervised and Unsupervised
No ratings yet
1.supervised and Unsupervised
42 pages
Cluster Analysis: Cosmin Lazar Como Lab Vub
No ratings yet
Cluster Analysis: Cosmin Lazar Como Lab Vub
77 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
51 pages
K Mean Clustering
No ratings yet
K Mean Clustering
36 pages
Hierarchical Clustering: DSCI 5240 Data Mining and Machine Learning For Business
No ratings yet
Hierarchical Clustering: DSCI 5240 Data Mining and Machine Learning For Business
45 pages
Cluster Analysis: Prof. Vandith Pamuru
No ratings yet
Cluster Analysis: Prof. Vandith Pamuru
68 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
50 pages
HVAC Basic Notebook
No ratings yet
HVAC Basic Notebook
85 pages
Chapter 3: Cluster Analysis: 3.1 Basic Concepts of Clustering
No ratings yet
Chapter 3: Cluster Analysis: 3.1 Basic Concepts of Clustering
33 pages
Analisis Faktor Yang Mempengaruhi Penumpang Angkutan Umum Beralih Ke Transportasi Online Go-Jek Menggunakan Metode K-Means Clustering
No ratings yet
Analisis Faktor Yang Mempengaruhi Penumpang Angkutan Umum Beralih Ke Transportasi Online Go-Jek Menggunakan Metode K-Means Clustering
7 pages
Density-Based Methods: DBSCAN: Density-Based Clustering Based On Connected Regions With High Density
No ratings yet
Density-Based Methods: DBSCAN: Density-Based Clustering Based On Connected Regions With High Density
3 pages
19 Jurnal Erizal Respatti EDIT
No ratings yet
19 Jurnal Erizal Respatti EDIT
8 pages
Machine Learning
No ratings yet
Machine Learning
29 pages
Penentuan Jurusan Siswa Sekolah Menengah Atas Disesuaikan Dengan Minat Siswa Menggunakan Algoritma Fuzzy C-Means
No ratings yet
Penentuan Jurusan Siswa Sekolah Menengah Atas Disesuaikan Dengan Minat Siswa Menggunakan Algoritma Fuzzy C-Means
12 pages
Analisis Autokorelasi Spasialtitik Panas Di Kalimantan Timur Menggunakan Indeks Moran PDF
No ratings yet
Analisis Autokorelasi Spasialtitik Panas Di Kalimantan Timur Menggunakan Indeks Moran PDF
8 pages
Hierarchical Clustering and Experiment With Cutting The Dendrogram
No ratings yet
Hierarchical Clustering and Experiment With Cutting The Dendrogram
5 pages
K Means Clustering Algorithm - BECOC316
No ratings yet
K Means Clustering Algorithm - BECOC316
5 pages
A Comparative Study of K-Means, DBSCAN and OPTICS
No ratings yet
A Comparative Study of K-Means, DBSCAN and OPTICS
6 pages
On The Selection of M For Fuzzy C-Means
No ratings yet
On The Selection of M For Fuzzy C-Means
7 pages
07 Hierarchical Clustering
No ratings yet
07 Hierarchical Clustering
19 pages
ML Clustering
No ratings yet
ML Clustering
3 pages
Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)
No ratings yet
Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)
8 pages
Lecture Notes For Chapter 8: by Tan, Steinbach, Kumar
No ratings yet
Lecture Notes For Chapter 8: by Tan, Steinbach, Kumar
93 pages
Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia
No ratings yet
Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia
8 pages
Dbscan: Fast Density-Based Clustering With R: Michael Hahsler Matthew Piekenbrock
No ratings yet
Dbscan: Fast Density-Based Clustering With R: Michael Hahsler Matthew Piekenbrock
28 pages
Clustering Documentation Python Code
No ratings yet
Clustering Documentation Python Code
8 pages
CLUSTERING GRID-BASED METHODS Elsayed Hemayed Data Mining Course
No ratings yet
CLUSTERING GRID-BASED METHODS Elsayed Hemayed Data Mining Course
14 pages
EMT778
No ratings yet
EMT778
51 pages
EMT778
No ratings yet
EMT778
51 pages
Clustering - The Data Ensemble
No ratings yet
Clustering - The Data Ensemble
4 pages
A-Z in HVAC Design
100% (1)
A-Z in HVAC Design
94 pages
Axcel
No ratings yet
Axcel
2 pages
Fire Detection and Suppression: Special Extinguishing Systems
No ratings yet
Fire Detection and Suppression: Special Extinguishing Systems
20 pages
Agglomerative Hierarchical Clustering
No ratings yet
Agglomerative Hierarchical Clustering
22 pages
Syllabus
No ratings yet
Syllabus
16 pages
RIVOIRARD - Cours - 00312 (Introduction To Disjunctive Kriging and Non Geostatistics)
No ratings yet
RIVOIRARD - Cours - 00312 (Introduction To Disjunctive Kriging and Non Geostatistics)
98 pages
Fire Detection and Suppression
No ratings yet
Fire Detection and Suppression
33 pages
Daylight Sensor Design and App Guide SG
No ratings yet
Daylight Sensor Design and App Guide SG
24 pages
Create A PDF File: Exercise 1 and Exercise 2 Produce The Same Result. Choose The One That Works Best For You
No ratings yet
Create A PDF File: Exercise 1 and Exercise 2 Produce The Same Result. Choose The One That Works Best For You
6 pages
Chapter 1-Introduction To Green Buildings
No ratings yet
Chapter 1-Introduction To Green Buildings
40 pages
STAT 544.01 - Topics - Spatial Statistics
No ratings yet
STAT 544.01 - Topics - Spatial Statistics
4 pages
Create A PDF File: Exercise 1 and Exercise 2 Produce The Same Result. Choose The One That Works Best For You
No ratings yet
Create A PDF File: Exercise 1 and Exercise 2 Produce The Same Result. Choose The One That Works Best For You
6 pages
Wastematerials Densities Data
No ratings yet
Wastematerials Densities Data
1 page
Johnson Controls Hvac Equipments Controls Katalog 2010
No ratings yet
Johnson Controls Hvac Equipments Controls Katalog 2010
52 pages
A Hand Book For The Mechanical Designer Ventilation Duct Fan
100% (6)
A Hand Book For The Mechanical Designer Ventilation Duct Fan
107 pages
No Ph.D. Game Design With Three.js
From Everand
No Ph.D. Game Design With Three.js
Nikiforos Kontopoulos
No ratings yet
Solving Math Problems
From Everand
Solving Math Problems
George N. Frempong
No ratings yet
Hvac Basics
100% (3)
Hvac Basics
20 pages
Assignment 10: Introduction To Machine Learning Prof. B. Ravindran
100% (1)
Assignment 10: Introduction To Machine Learning Prof. B. Ravindran
4 pages
Fuzzy C Means (Overlapping Clustering)
No ratings yet
Fuzzy C Means (Overlapping Clustering)
13 pages
AHU Operational Control Spreadsheet Training
No ratings yet
AHU Operational Control Spreadsheet Training
17 pages
02 Data Mining-Partitioning Method
No ratings yet
02 Data Mining-Partitioning Method
8 pages
Inverse Trigonometric Functions (Trigonometry) Mathematics Question Bank
From Everand
Inverse Trigonometric Functions (Trigonometry) Mathematics Question Bank
Mohmmad Khaja Shareef
No ratings yet
De Moiver's Theorem (Trigonometry) Mathematics Question Bank
From Everand
De Moiver's Theorem (Trigonometry) Mathematics Question Bank
Mohmmad Khaja Shareef
No ratings yet

Clustering Example

Uploaded by

Clustering Example

Uploaded by

EDA Case Study - Understanding Human EDA Case Study - Understanding Human

Activity with Smart Phones Activity with Smart Phones

You might also like