0% found this document useful (0 votes)

2 views

Activity_Detection_Code

The document outlines a Python notebook for activity detection using sensor data, including data preprocessing, feature extraction, and model training with machine learning algorithms like Random Forest and Decision Trees. It processes sensor data from various activities, generates features, and visualizes the data before training classifiers to predict activities. The notebook also includes performance evaluation of the models and conversion of trained models to Python code.

Uploaded by

Sanjeev Achar

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

Activity_Detection_Code

Uploaded by

Sanjeev Achar

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 6

# -- coding: utf-8 --

"""Activity_Detection_Code.ipynb

Automatically generated by Colab.

Original file is located at

https://colab.research.google.com/drive/1aCkm53svUCwXaD1CK4h4u3DE1sgTrsJI
"""

import pandas as pd
import numpy as np
import math
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style='darkgrid')
!pip install m2cgen

def features(lst):
if len(lst) == 0:
return 0,0,0,0,0,0,0,0,0,0
l=len(lst)
#Computing various features
avg=sum(lst)/l #1
std_dev=(sum([((i - avg) ** 2) for i in lst]) / l)**0.5 #2
energy=sum([i**2 for i in lst])/l #3
skew=sum([((i - avg) ** 3) for i in lst]) * (1 / (l * ((std_dev+0.000001) ** 3)))
#4
return [avg, std_dev, energy, skew]

def process_data(activity_df):
# Convert all columns to numeric (ensuring data consistency)
for col in activity_df.columns:
activity_df[col] = pd.to_numeric(activity_df[col], errors='coerce')

#after doing EDA, it was found that only A and G features are sufficient for
training
activity_df.drop(columns=['Index', 'M_x', 'M_y', 'M_z'], errors='ignore',
inplace=True)

buffer_capacity = 100 # Buffer size for feature computation

sensor_buffers = [[] for _ in range(6)] # Allocate storage for 9 sensor
readings

computed_features = [] # Store processed feature values

# Iterate through dataset rows

for idx, row in activity_df.iterrows():
# Append data to respective sensor buffers
for sensor_idx, reading in enumerate(row):
sensor_buffers[sensor_idx].append(reading)

# Wait until buffer fills up before processing

if len(sensor_buffers[0]) < buffer_capacity:
continue

# Maintain buffer size (remove oldest entries when limit exceeds)

if len(sensor_buffers[0]) > buffer_capacity:
for buf in sensor_buffers:
buf.pop(0)

# Extract features from sensor data

feature_vector = []
for i, sensor_data in enumerate(sensor_buffers):
feature_vector.extend([sensor_data[-1]] + features(sensor_data))

computed_features.append(feature_vector)

# Define sensor types and feature names

sensor_types = ['A_x','A_y','A_z','G_x','G_y','G_z']
feature_names = ['mean', 'std_dev', 'energy', 'skew']

# Generate column names dynamically

column_headers = []
for sensor in sensor_types:
column_headers.append(sensor) # Include raw sensor values
for feat in feature_names:
column_headers.append(f"{sensor}_{feat}") # Add feature-specific
columns

print(column_headers) # Display generated column names

# Convert processed data into a structured DataFrame

processed_df = pd.DataFrame(computed_features, columns=column_headers)
return processed_df # Return final structured dataset

# Reading data from the sensors

idle_df = pd.read_csv('sensor_data_idle_sanjeev.csv',on_bad_lines='skip')
sweeping_df = pd.read_csv('sensor_data_sweeping_sanjeev.csv',on_bad_lines='skip')
vibration_df = pd.read_csv('sensor_data_vibrating_sanjeev.csv',on_bad_lines='skip')
walking_df= pd.read_csv('sensor_data_walking_sanjeev.csv',on_bad_lines='skip')
jumping_df = pd.read_csv('sensor_data_jumping_sanjeev.csv',on_bad_lines='skip')

# Define sensor groups and their respective columns

sensor_groups = {
'Accelerometer': ['A_x', 'A_y', 'A_z'],
'Gyroscope': ['G_x', 'G_y', 'G_z'],
'Magnetometer': ['M_x', 'M_y', 'M_z']
}

# Define activities and their respective dataframes

activities = {
'Idle': idle_df,
'Jumping': jumping_df,
'Sweeping': sweeping_df,
'Vibration': vibration_df,
'Walking': walking_df
}

# Loop through each sensor type to create separate figures

for sensor_type, sensor_cols in sensor_groups.items():
for axis in sensor_cols: # Iterate over individual axes (x, y, z)
fig, ax = plt.subplots(1, 5, figsize=(20, 5), sharey=True)

# Loop through each activity and plot the corresponding sensor data
for i, (activity, df) in enumerate(activities.items()):
df[axis].plot(ax=ax[i], legend=False)
ax[i].set_title(f'{activity} - {axis} ({sensor_type})', fontsize=12)
ax[i].set_xlabel("Time")

plt.suptitle(f'{axis} ({sensor_type}) Data Across Activities', fontsize=16)

plt.show()
# The plots below show the raw data acquired through the sensors. We can see
multiple unwanted outliers
# which we shall remove during pre-processing

'''Pre-processing of data to eliminate unwanted outliers'''

import numpy as np
import matplotlib.pyplot as plt

# Remove only A_x outliers based on activity-specific thresholds

cleaned_activities = {}

for activity, df in activities.items():

df_cleaned = df.copy() # Create a copy to preserve the original data

if activity == 'Idle':
df_cleaned.loc[(df_cleaned['A_x'] > 1) | (df_cleaned['A_x'] < -1), 'A_x'] =
np.nan
print(f"Marked {sum((df['A_x'] > 1) | (df['A_x'] < -1))} outliers in A_x as
NaN in {activity} dataset.")

else:
df_cleaned.loc[(df_cleaned['A_x'] > 1000) | (df_cleaned['A_x'] < -1000),
'A_x'] = np.nan
print(f"Marked {sum((df['A_x'] > 1000) | (df['A_x'] < -1000))} outliers in
A_x as NaN in {activity} dataset.")

cleaned_activities[activity] = df_cleaned

sensor_groups = {
'Accelerometer': ['A_x', 'A_y', 'A_z'],
'Gyroscope': ['G_x', 'G_y', 'G_z'],
'Magnetometer': ['M_x', 'M_y', 'M_z']
}

# Plot Accelerometer, Gyroscope, and Magnetometer Data for Each Activity

for sensor_type, sensor_cols in sensor_groups.items():
fig, axes = plt.subplots(len(sensor_cols), 5, figsize=(20, 15), sharex=True,
sharey=True)

# Loop through each axis (x, y, z)

for row_idx, axis in enumerate(sensor_cols):
# Loop through each activity and plot its sensor data
for col_idx, (activity, df) in enumerate(cleaned_activities.items()):
df[axis].plot(ax=axes[row_idx, col_idx], legend=False)
axes[row_idx, col_idx].set_title(f'{activity} - {axis}
({sensor_type})', fontsize=10)
axes[row_idx, col_idx].set_xlabel("Time")

# Set y-axis limits to zoom in

axes[row_idx, col_idx].set_ylim(-3, 3) # Adjusting the scale
axes[row_idx,col_idx].set_xlabel("Time")

plt.suptitle(f'{sensor_type} Data Across Activities (Y-Axis Zoomed)',

fontsize=16)
plt.show()

# Assign labels for activities

idle_df['Target'] = 'I'
vibration_df['Target'] = 'V'
sweeping_df['Target'] = 'S'
walking_df['Target'] = 'W'
jumping_df['Target'] = 'J'

idle_df = idle_df.drop(columns=['Target'], errors='ignore')

jumping_df = jumping_df.drop(columns=['Target'], errors='ignore')
sweeping_df = sweeping_df.drop(columns=['Target'], errors='ignore')
vibration_df = vibration_df.drop(columns=['Target'], errors='ignore')
walking_df = walking_df.drop(columns=['Target'], errors='ignore')

idle = process_data(idle_df)
idle['Target'] = 'Idle'
jumping = process_data(jumping_df)
jumping['Target'] = 'Jumping'
sweeping = process_data(sweeping_df)
sweeping['Target'] = 'Sweeping'
vibration = process_data(vibration_df)
vibration['Target'] = 'Vibration'
walking = process_data(walking_df)
walking['Target'] = 'Walking'

df = pd.concat([idle, jumping, sweeping, vibration, walking])

cols = df.columns.drop('Target')
X, y = df[cols], df['Target']
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1,
random_state=42)

# X_train
from sklearn.ensemble import RandomForestClassifier
from sklearn import metrics
model_rf=RandomForestClassifier(max_depth=5, n_estimators=5, random_state=0)

model_rf.fit(X_train, y_train)
print("Training")
training_predict_rf = model_rf.predict(X_train)
print (metrics.classification_report(y_train, training_predict_rf, digits = 3 ))
print (metrics.confusion_matrix(y_train, training_predict_rf))

test_predict_rf = model_rf.predict(X_test)
print ("Test")
print (metrics.classification_report(y_test, test_predict_rf, digits = 3 ))
print (metrics.confusion_matrix(y_test, test_predict_rf))

import m2cgen as m2c

model_to_python_rf = m2c.export_to_python(model_rf)
# model_to_python_dt

print(model_to_python_rf)

from sklearn.tree import DecisionTreeClassifier

from sklearn import metrics
import m2cgen as m2c

# Initialize Decision Tree Classifier

model_dt = DecisionTreeClassifier(max_depth=5, random_state=0)

# Train the Decision Tree model

model_dt.fit(X_train, y_train)

# Training Evaluation
print("Training Performance")
training_predict_dt = model_dt.predict(X_train)
print(metrics.classification_report(y_train, training_predict_dt, digits=3))
print(metrics.confusion_matrix(y_train, training_predict_dt))

# Testing Evaluation
print("\nTesting Performance")
test_predict_dt = model_dt.predict(X_test)
print(metrics.classification_report(y_test, test_predict_dt, digits=3))
print(metrics.confusion_matrix(y_test, test_predict_dt))

# Convert Decision Tree model to Python code using m2cgen

model_to_python_dt = m2c.export_to_python(model_dt)

# Print the converted Python code

print(model_to_python_dt)

# Verify classifier type

print(model_dt.__class__)
print(model_dt.classes_)

from sklearn.ensemble import ExtraTreesClassifier

from sklearn import metrics
import m2cgen as m2c

# Train Extra Trees Classifier

model_extra_trees = ExtraTreesClassifier(n_estimators=5, max_depth=5,
random_state=0)
model_extra_trees.fit(X_train, y_train_encoded)

# Training Performance
print("Training Performance")
training_predict_et = model_extra_trees.predict(X_train)
print(metrics.classification_report(y_train_encoded, training_predict_et,
digits=3))
print(metrics.confusion_matrix(y_train_encoded, training_predict_et))

# Testing Performance
print("\nTesting Performance")
test_predict_et = model_extra_trees.predict(X_test)
print(metrics.classification_report(y_test_encoded, test_predict_et, digits=3))
print(metrics.confusion_matrix(y_test_encoded, test_predict_et))

# Convert Extra Trees model to Python using m2cgen

model_to_python_et = m2c.export_to_python(model_extra_trees)
print(model_to_python_et)
# Verify classifier type and classes
print(model_extra_trees.__class__)
print("Encoded Classes: ", label_encoder.classes_) # Shows mapping of labels to
numbers

print(model_rf.__class__)
model_rf.classes_

Image Processing
No ratings yet
Image Processing
5 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
PowerChart Basics PDF
100% (1)
PowerChart Basics PDF
14 pages
Manufacturing Machine Learning Tool Mechanical
No ratings yet
Manufacturing Machine Learning Tool Mechanical
13 pages
PHASE 2.1
No ratings yet
PHASE 2.1
9 pages
PHASE 2.3
No ratings yet
PHASE 2.3
8 pages
Human Activities Classifier Using SVM
No ratings yet
Human Activities Classifier Using SVM
19 pages
Human Activity Recognition
No ratings yet
Human Activity Recognition
8 pages
UNITIV.BtechIot
No ratings yet
UNITIV.BtechIot
43 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Lagu Rohani
No ratings yet
Lagu Rohani
2 pages
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
IDM Assignment
No ratings yet
IDM Assignment
15 pages
Numpy Cheatsheet
No ratings yet
Numpy Cheatsheet
11 pages
Shiva Teja
No ratings yet
Shiva Teja
19 pages
4.3.2.4 Lab - Internet Meter Anomaly Detection
No ratings yet
4.3.2.4 Lab - Internet Meter Anomaly Detection
8 pages
Human Activity Recognition Using Smartphone Data
No ratings yet
Human Activity Recognition Using Smartphone Data
18 pages
Main.py Text File
No ratings yet
Main.py Text File
5 pages
Practical 5
No ratings yet
Practical 5
6 pages
19-20DecTestPICMIC
No ratings yet
19-20DecTestPICMIC
28 pages
Ap Python
No ratings yet
Ap Python
12 pages
Exploratory Sensor Data Analysis in Python - by Mabel González Castellanos - Towards Data Science
No ratings yet
Exploratory Sensor Data Analysis in Python - by Mabel González Castellanos - Towards Data Science
19 pages
Advance Python
No ratings yet
Advance Python
5 pages
Project
No ratings yet
Project
18 pages
MalenoV Code 5 Layer CNN 65x65x65 Voxels
No ratings yet
MalenoV Code 5 Layer CNN 65x65x65 Voxels
30 pages
ROBV101_PNote Activities
No ratings yet
ROBV101_PNote Activities
10 pages
assignment
No ratings yet
assignment
4 pages
Mini Project With Output
No ratings yet
Mini Project With Output
8 pages
codeppsjf
No ratings yet
codeppsjf
16 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
HIV Regression Source Code
No ratings yet
HIV Regression Source Code
26 pages
indexdw (1)
No ratings yet
indexdw (1)
34 pages
Ex7 HTML
No ratings yet
Ex7 HTML
3 pages
Part-III
No ratings yet
Part-III
15 pages
Introduction To Numpy - Ipynb - Colaboratory
No ratings yet
Introduction To Numpy - Ipynb - Colaboratory
11 pages
SVM (Support Vector Machine) For Classification - by Aditya Kumar - Towards Data Science
100% (1)
SVM (Support Vector Machine) For Classification - by Aditya Kumar - Towards Data Science
28 pages
machinelearning
No ratings yet
machinelearning
26 pages
Sensor Data Acquisition Testing
No ratings yet
Sensor Data Acquisition Testing
12 pages
To Study About Numpy, Pandas and Matplotlib Libraries in Python
No ratings yet
To Study About Numpy, Pandas and Matplotlib Libraries in Python
21 pages
EXP-2 ML
No ratings yet
EXP-2 ML
6 pages
Lecture 3
No ratings yet
Lecture 3
29 pages
DWM Practical
No ratings yet
DWM Practical
12 pages
AbidAdhikari26840-DWDM
No ratings yet
AbidAdhikari26840-DWDM
43 pages
DataEnggineering
No ratings yet
DataEnggineering
16 pages
41b Data Wrangling, Grouping and Aggregation
No ratings yet
41b Data Wrangling, Grouping and Aggregation
31 pages
ml short
No ratings yet
ml short
2 pages
Practical 3
No ratings yet
Practical 3
3 pages
Sklearn Tutorial: DNN On Boston Data
No ratings yet
Sklearn Tutorial: DNN On Boston Data
9 pages
MLP - Week 5 - MNIST - Perceptron - Ipynb - Colaboratory
No ratings yet
MLP - Week 5 - MNIST - Perceptron - Ipynb - Colaboratory
31 pages
Casos de ML Unsupervised Daniel Ames Camayo
No ratings yet
Casos de ML Unsupervised Daniel Ames Camayo
20 pages
Lecture_5
No ratings yet
Lecture_5
38 pages
Lab 3 ml
No ratings yet
Lab 3 ml
3 pages
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
No ratings yet
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
28 pages
MLLabManual
No ratings yet
MLLabManual
24 pages
Lab
No ratings yet
Lab
13 pages
L_AND_T_project_Naveen 24cs002895
No ratings yet
L_AND_T_project_Naveen 24cs002895
7 pages
Construction of NN
No ratings yet
Construction of NN
14 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
33 pages
Failure Document Python File
No ratings yet
Failure Document Python File
21 pages
ml_labmanual (3)
No ratings yet
ml_labmanual (3)
33 pages
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Assignment-4-2024
No ratings yet
Assignment-4-2024
2 pages
9307-Article Text-16619-1-10-20210624
No ratings yet
9307-Article Text-16619-1-10-20210624
9 pages
RC_LPF_table (1)
No ratings yet
RC_LPF_table (1)
2 pages
micropython-docs
No ratings yet
micropython-docs
632 pages
C28x Tech Ref manual-1901-2153
No ratings yet
C28x Tech Ref manual-1901-2153
253 pages
Mock 5
No ratings yet
Mock 5
24 pages
Automated Selection of Hyper-Parameters in Diffuse Optical Tomographic Image Reconstruction
No ratings yet
Automated Selection of Hyper-Parameters in Diffuse Optical Tomographic Image Reconstruction
96 pages
Advacned ITT Question Bank
No ratings yet
Advacned ITT Question Bank
76 pages
GE - Living in The IT Era Syllabus
No ratings yet
GE - Living in The IT Era Syllabus
6 pages
REF-620 Tech Manual PDF
100% (1)
REF-620 Tech Manual PDF
1,224 pages
Design, Simulation and Analysis of Antenna Using CST Studio Suite
No ratings yet
Design, Simulation and Analysis of Antenna Using CST Studio Suite
2 pages
1Z0-809 Dumps Java SE 8 Programmer II: 100% Valid and Newest Version 1Z0-809 Questions & Answers Shared by Certleader
No ratings yet
1Z0-809 Dumps Java SE 8 Programmer II: 100% Valid and Newest Version 1Z0-809 Questions & Answers Shared by Certleader
18 pages
Server API v2
No ratings yet
Server API v2
23 pages
Bizhub 283 - All Active Solutions: February 2013
No ratings yet
Bizhub 283 - All Active Solutions: February 2013
149 pages
Exam Viewer - Module 11 Exam - CCNA 1 French (Version 3.1)
No ratings yet
Exam Viewer - Module 11 Exam - CCNA 1 French (Version 3.1)
10 pages
RTC Interfacing With 8051 Microcontroller and Programming
No ratings yet
RTC Interfacing With 8051 Microcontroller and Programming
16 pages
Next Bus
No ratings yet
Next Bus
36 pages
Ia MCQ 1
No ratings yet
Ia MCQ 1
6 pages
5 Letters For Better User Story Splitting
No ratings yet
5 Letters For Better User Story Splitting
8 pages
Backus Forma PDF
No ratings yet
Backus Forma PDF
20 pages
DSCS RL 1.1
No ratings yet
DSCS RL 1.1
14 pages
Cloudera Kafka
No ratings yet
Cloudera Kafka
175 pages
Library Database Management System: Dheeraj Singh Negi
No ratings yet
Library Database Management System: Dheeraj Singh Negi
29 pages
SAP HANA EIM Administration Guide en
100% (1)
SAP HANA EIM Administration Guide en
336 pages
Rachelmonteleone Aed
No ratings yet
Rachelmonteleone Aed
1 page
Las Ict Csa 9 q3 Week 4
No ratings yet
Las Ict Csa 9 q3 Week 4
11 pages
Analyze Channel Data To Send Email Notification From IFTTT
No ratings yet
Analyze Channel Data To Send Email Notification From IFTTT
5 pages
Introduction To Flexvpn: Configuring Internet Key Exchange Version 2 (Ikev2) and Flexvpn Remote Access
No ratings yet
Introduction To Flexvpn: Configuring Internet Key Exchange Version 2 (Ikev2) and Flexvpn Remote Access
4 pages
Unit 7 Pointers
No ratings yet
Unit 7 Pointers
12 pages
SPN Ztr-Ptm-Man v01 5774
No ratings yet
SPN Ztr-Ptm-Man v01 5774
2 pages
Al Rashed Naji Resume
No ratings yet
Al Rashed Naji Resume
2 pages
CT NZ Solutions 2010
No ratings yet
CT NZ Solutions 2010
16 pages
NEC IEBUS Chipset
No ratings yet
NEC IEBUS Chipset
91 pages
IDOC Processing:: Sensitivity: Internal & Restricted
No ratings yet
IDOC Processing:: Sensitivity: Internal & Restricted
29 pages
Utm - Source Reviveoldpost&Utm - Medium Social&Utm - Campaign Reviveoldpost Time
No ratings yet
Utm - Source Reviveoldpost&Utm - Medium Social&Utm - Campaign Reviveoldpost Time
5 pages
Privacy-Preserving Data Analysis - A Survey
No ratings yet
Privacy-Preserving Data Analysis - A Survey
3 pages

Activity_Detection_Code

Uploaded by

Activity_Detection_Code

Uploaded by

# -*- coding: utf-8 -*-

Automatically generated by Colab.

Original file is located at

buffer_capacity = 100 # Buffer size for feature computation

computed_features = [] # Store processed feature values

# Iterate through dataset rows

# Wait until buffer fills up before processing

# Maintain buffer size (remove oldest entries when limit exceeds)

# Extract features from sensor data

# Define sensor types and feature names

# Generate column names dynamically

print(column_headers) # Display generated column names

# Convert processed data into a structured DataFrame

# Reading data from the sensors

# Define sensor groups and their respective columns

# Define activities and their respective dataframes

# Loop through each sensor type to create separate figures

plt.suptitle(f'{axis} ({sensor_type}) Data Across Activities', fontsize=16)

'''Pre-processing of data to eliminate unwanted outliers'''

# Remove only A_x outliers based on activity-specific thresholds

for activity, df in activities.items():

# Plot Accelerometer, Gyroscope, and Magnetometer Data for Each Activity

# Loop through each axis (x, y, z)

# Set y-axis limits to zoom in

plt.suptitle(f'{sensor_type} Data Across Activities (Y-Axis Zoomed)',

# Assign labels for activities

idle_df = idle_df.drop(columns=['Target'], errors='ignore')

df = pd.concat([idle, jumping, sweeping, vibration, walking])

import m2cgen as m2c

from sklearn.tree import DecisionTreeClassifier

# Initialize Decision Tree Classifier

# Train the Decision Tree model

# Convert Decision Tree model to Python code using m2cgen

# Print the converted Python code

# Verify classifier type

from sklearn.ensemble import ExtraTreesClassifier

# Train Extra Trees Classifier

# Convert Extra Trees model to Python using m2cgen

You might also like

# -- coding: utf-8 --