BSC (H) Computer Science Discipline Specific Elective-Data Mining-Ii (Guidelines) Sem V (July 2024 Onwards)

Uploaded by

himanshu.22523

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

39 views2 pages

BSC (H) Computer Science Discipline Specific Elective-Data Mining-Ii (Guidelines) Sem V (July 2024 Onwards)

Uploaded by

himanshu.22523

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

BSc(H) Computer Science

DISCIPLINE SPECIFIC Elective- Data Mining-II (Guidelines)

Sem V (July 2024 Onwards)

Sr. Units Chapter Reference No. of

No. Hours
1 5.2.1, 5.2.5, 5.3 (5.3.1, 5.3.2, [1] 9
Unit 1: Clustering: Partitioning methods, 5.3.4, 5.3.5, 5.3.6), 5.4,5.5.7
hierarchical methods, density-based methods,
comparison of different methods

2 6.10, 6.11 (introduction, [1] 8

Unit 2: Ensemble Methods: Need of 6.11.2)
ensemble, random forests, bagging and
boosting
.
3 9.1, 9.2, 9.3 (9.3.1, 9.3.2, [1] 10
Unit 3: Anomaly Detection: Outliers and 9.3.5), 9.4, 9.5
outlier analysis, outlier detection methods,
statistical approaches, proximity-based and
density-based outlier detection, clustering-
based approaches

4 8
Unit 4: Mining Text Data: Document 13.1, 13.2, 13.2.1, 13.3, 13.3.1 [2]
preparation and similarity, clustering methods (excluding its subsection),
for text, topic modeling 13.3.3, 13.4 (Upto Page 441)

5 11.1, 11.2, 11.3,11.6,11.7 [3] 10

Unit 5: Stream Mining: Time series basics,
date ranges, frequencies, shifting, resampling 2.2.2.4, 2.2.2.5, 2.4.1.1,
and moving windows functions, decay 12.4.1-12.4.2 [2]
function, clustering stamped data: STREAM
and CluStream
Text Book:
1. Tan P.N., Steinbach M, Karpatne A. and Kumar V. Introduction to Data Mining,
Second edition, Sixth Impression, Pearson, 2023.
2. Aggarwal C. C. Data Mining: The Textbook, Springer, 2015
3. McKinney W. Python for Data Analysis: Data Wrangling with Pandas, NumPy and
IPython. 2nd edition. O’Reilly Media, 2018.

Additional References:
1. Han J., Kamber M. and Pei J. Data Mining: Concepts and Techniques, 3 edition,
rd

2011, Morgan Kaufmann Publishers.

2. Zaki M. J. and Meira J. Jr. Data Mining and Machine Learning: Fundamental Concepts
and Algorithms, 2 edition, Cambridge University Press, 2020.
nd

3. Insight into Data mining: Theory and Practice, Soman K. P., Diwakar Shyam, Ajay V.,
PHI 2006

For practicals, datasets may be downloaded from :

1. https://archive.ics.uci.edu/datasets
2. https://www.kaggle.com/datasets?fileType=csv
3. https://data.gov.in/
4. https://ieee-dataport.org/datasets
5. Time Series Datasets (kaggle.com)
Suggested Practical Exercises
1. Perform partitioning, hierarchical, and density-based clustering algorithms on a
downloaded dataset and evaluate the cluster quality by changing the algorithm's
parameters.
2. Perform the following text mining preprocessing steps on a text document:
a. Stop Word Removal
b. Stemming
c. Removal of punctuation marks
d. Compute the inverse document frequency of the words in the document
3. Use the Decision Tree classification algorithm to construct a classifier on two
datasets. Evaluate the classifier's performance by dividing the dataset into a training
set (75%) and a test set (25%). Compare the performance with that of:
a. Bagging ensemble consisting of 3,5,7,9 Decision tree classifiers
b. Adaboost ensemble consisting of 3,5,7,9 Decision tree classifiers
4. Download a dataset and check whether outliers are present in the dataset. Use
different methods of outlier detection and compare their performance.
5. Perform CluStream algorithm on any time series data from Kaggle and compare its
output with that of K-means clustering. Evaluate the cluster quality by changing the
algorithm's parameters.

Project: Students should be promoted to take up one project on a dataset downloaded from
any of the websites given above and the dataset verified by the teacher. Apply at least two
data mining concepts on the selected dataset.

Prepared by:

1. Dr Anamika Gupta (Shaheed Sukhdev College of Business Studies)

2. Dr Manju Bhardwaj (Maitreyi College)

3. Dr Sarabjeet Kaur (Indraprastha College For Women)

4. Prof. Sharanjit Kaur (Acharya Narendra Dev College)

Future of Generative Adversarial Networks (GAN) For Anomaly Detection in
No ratings yet
Future of Generative Adversarial Networks (GAN) For Anomaly Detection in
22 pages
DWM NOTES
No ratings yet
DWM NOTES
118 pages
Abdulsalam Abdulrahman - Project Report
No ratings yet
Abdulsalam Abdulrahman - Project Report
119 pages
A Comprehensive Survey of Anomaly Detect
No ratings yet
A Comprehensive Survey of Anomaly Detect
30 pages
Revolutionizing Auto Insurance With NVIDIA AI
No ratings yet
Revolutionizing Auto Insurance With NVIDIA AI
16 pages
R23-DWDM Syllabus
No ratings yet
R23-DWDM Syllabus
5 pages
Lecture 1 Notes
No ratings yet
Lecture 1 Notes
99 pages
DM-Unit-I Introduction To Association-1
No ratings yet
DM-Unit-I Introduction To Association-1
97 pages
Ai in Traffic Management
No ratings yet
Ai in Traffic Management
17 pages
Datawarehouse&Data Mining - ALL
No ratings yet
Datawarehouse&Data Mining - ALL
46 pages
Ghousia Technical Seminar Report
No ratings yet
Ghousia Technical Seminar Report
25 pages
R23!3!1 DWDM Final Syllabus On 21-06-2025
No ratings yet
R23!3!1 DWDM Final Syllabus On 21-06-2025
5 pages
1676457507
No ratings yet
1676457507
113 pages
Skill Enhancement Course (SEC) Artificial Intelligence
No ratings yet
Skill Enhancement Course (SEC) Artificial Intelligence
54 pages
Document
No ratings yet
Document
44 pages
CS-DM Module - 1
No ratings yet
CS-DM Module - 1
27 pages
Data Mining
No ratings yet
Data Mining
20 pages
Cloud Env
No ratings yet
Cloud Env
15 pages
Ai-102 3
No ratings yet
Ai-102 3
45 pages
19 - AIOps Configuration Guide
No ratings yet
19 - AIOps Configuration Guide
14 pages
Recommender System - Module 2 - Data Mining Techniques in Recommender System
No ratings yet
Recommender System - Module 2 - Data Mining Techniques in Recommender System
58 pages
FCH Ime672a Jan 2018
No ratings yet
FCH Ime672a Jan 2018
2 pages
Advanced Data Mining
No ratings yet
Advanced Data Mining
6 pages
IntegratingZeroTrustPrinciples FormattedPaper
No ratings yet
IntegratingZeroTrustPrinciples FormattedPaper
16 pages
Unit 3 DW
No ratings yet
Unit 3 DW
19 pages
Ai-Augmented Security Models For Software Development: Leveraging Machine Learning For Threat Detection and Mitigation
No ratings yet
Ai-Augmented Security Models For Software Development: Leveraging Machine Learning For Threat Detection and Mitigation
11 pages
1 s2.0 S1566253520303201 Main
No ratings yet
1 s2.0 S1566253520303201 Main
18 pages
DM-Course File
No ratings yet
DM-Course File
14 pages
Sp24 DM Teaching Plan 02042024 114322am
No ratings yet
Sp24 DM Teaching Plan 02042024 114322am
7 pages
Data Mining & Machine Learning Courseoutline
No ratings yet
Data Mining & Machine Learning Courseoutline
7 pages
Financial Fraud Detection
No ratings yet
Financial Fraud Detection
11 pages
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
No ratings yet
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
6 pages
Pattern Recognition and Anomaly Detection
No ratings yet
Pattern Recognition and Anomaly Detection
2 pages
DWDM-JNTUK SyllabousPre
No ratings yet
DWDM-JNTUK SyllabousPre
2 pages
Cybersecurity in Network Traffic: Integrating Statistical Techniques With AI
No ratings yet
Cybersecurity in Network Traffic: Integrating Statistical Techniques With AI
11 pages
CAS CS 565, Data Mining
No ratings yet
CAS CS 565, Data Mining
30 pages
Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan2024
No ratings yet
Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan2024
3 pages
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
No ratings yet
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
3 pages
Cybersecurity Research Proposal 1
No ratings yet
Cybersecurity Research Proposal 1
5 pages
Data Mining Question Bank 3,4,5
No ratings yet
Data Mining Question Bank 3,4,5
7 pages
Handout
No ratings yet
Handout
4 pages
Review Sheet 1 Question I: MCQ
No ratings yet
Review Sheet 1 Question I: MCQ
10 pages
Course Outline
No ratings yet
Course Outline
2 pages
CS F415 Data Mining L1
No ratings yet
CS F415 Data Mining L1
4 pages
Unit 1
No ratings yet
Unit 1
7 pages
Stacked Ensemble Learning Based Approach For Anomaly Detection in IoT Environment
No ratings yet
Stacked Ensemble Learning Based Approach For Anomaly Detection in IoT Environment
6 pages
DMBI Questions
No ratings yet
DMBI Questions
8 pages
Clustering Based Method Anomaly Definition in EV Charging Curves
No ratings yet
Clustering Based Method Anomaly Definition in EV Charging Curves
6 pages
IJIRSET Paper Sample
No ratings yet
IJIRSET Paper Sample
4 pages
Cse2021 - Data Mining CH
No ratings yet
Cse2021 - Data Mining CH
13 pages
Sample Question DMW
No ratings yet
Sample Question DMW
4 pages
DMDW Lesson Plan
No ratings yet
DMDW Lesson Plan
8 pages
Data Mining (Gtu Sem-6) 002
No ratings yet
Data Mining (Gtu Sem-6) 002
5 pages
1 s2.0 S2665917422000411 Main
No ratings yet
1 s2.0 S2665917422000411 Main
6 pages
Intelligent eCRF Design Improving Data Quality With AI
No ratings yet
Intelligent eCRF Design Improving Data Quality With AI
5 pages
DM Guidelines 14jan2022
No ratings yet
DM Guidelines 14jan2022
5 pages
Ljku Sem 1 049010105 Data Mining and Analysis
No ratings yet
Ljku Sem 1 049010105 Data Mining and Analysis
3 pages
Fire Alarm System Through Smoke Detectio
No ratings yet
Fire Alarm System Through Smoke Detectio
4 pages
Guidelines Datamining I
No ratings yet
Guidelines Datamining I
3 pages
Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24
No ratings yet
Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24
3 pages
Data Mining - Lecture 1
No ratings yet
Data Mining - Lecture 1
23 pages
ms160400843 - Synopsis v2
No ratings yet
ms160400843 - Synopsis v2
11 pages
M S Ramaiah Institute of Technology Department of Information Science & Engg
No ratings yet
M S Ramaiah Institute of Technology Department of Information Science & Engg
11 pages
Guidelines Data mining-II BA Major Sem 4 NEP
No ratings yet
Guidelines Data mining-II BA Major Sem 4 NEP
2 pages
Data Mining Unitwise Imp Questions
No ratings yet
Data Mining Unitwise Imp Questions
3 pages
DMKD Guide
No ratings yet
DMKD Guide
3 pages
Dmsyll
No ratings yet
Dmsyll
2 pages
A4629ac494 Syllabus
No ratings yet
A4629ac494 Syllabus
3 pages
Data Mining and Business Intelligence
No ratings yet
Data Mining and Business Intelligence
4 pages
B.Tech Jntuh DWDM Course Description
No ratings yet
B.Tech Jntuh DWDM Course Description
6 pages
CS F415 1322 Data Mining
No ratings yet
CS F415 1322 Data Mining
3 pages
Guidelines Datamining II
No ratings yet
Guidelines Datamining II
2 pages
Data Mining Syllabus and Question
No ratings yet
Data Mining Syllabus and Question
6 pages
6 DM
No ratings yet
6 DM
2 pages
New Syllabus - COMP 482 Data Mining1674216496
No ratings yet
New Syllabus - COMP 482 Data Mining1674216496
3 pages
Assignment DMW
No ratings yet
Assignment DMW
2 pages
An Analysis of Outlier Detection Through Clustering Method
No ratings yet
An Analysis of Outlier Detection Through Clustering Method
6 pages
Course Plan - Data Mining
No ratings yet
Course Plan - Data Mining
3 pages
Credit Card Fraud Detection by Data Analytics Using Python: Malay Joshi, Yudhishthir Bhunwal and Dr. Smita Agarwal
No ratings yet
Credit Card Fraud Detection by Data Analytics Using Python: Malay Joshi, Yudhishthir Bhunwal and Dr. Smita Agarwal
4 pages
Cse3054 - Data-Mining - Concepts-And-Techniques - Eth - 1.0 - 66 - Cse3054 - 61 Acp
No ratings yet
Cse3054 - Data-Mining - Concepts-And-Techniques - Eth - 1.0 - 66 - Cse3054 - 61 Acp
2 pages
CCS415-CCT416 Course Outline
No ratings yet
CCS415-CCT416 Course Outline
3 pages
Data Mining Handout
No ratings yet
Data Mining Handout
4 pages
Syllabus
No ratings yet
Syllabus
4 pages
Data Analytics 02: Drag Connect It Change Remove Cabin, Life Boat, Name, and Ticket Number
No ratings yet
Data Analytics 02: Drag Connect It Change Remove Cabin, Life Boat, Name, and Ticket Number
2 pages
Gujarat Technological University: Page 1 of 2
No ratings yet
Gujarat Technological University: Page 1 of 2
2 pages
Btech Sem6 Cs1141 Data Mining
No ratings yet
Btech Sem6 Cs1141 Data Mining
5 pages
R18B Tech CSESyllabus
No ratings yet
R18B Tech CSESyllabus
1 page
Data Mining Lesson Plan-Revised Syllabus
No ratings yet
Data Mining Lesson Plan-Revised Syllabus
4 pages
Detection of Cyber Physical Attacks On Water Distribution Systems Via Principal Component Analysis and Artificial Neural Networks
No ratings yet
Detection of Cyber Physical Attacks On Water Distribution Systems Via Principal Component Analysis and Artificial Neural Networks
16 pages

BSC (H) Computer Science Discipline Specific Elective-Data Mining-Ii (Guidelines) Sem V (July 2024 Onwards)

Uploaded by

BSC (H) Computer Science Discipline Specific Elective-Data Mining-Ii (Guidelines) Sem V (July 2024 Onwards)

Uploaded by

BSc(H) Computer Science

DISCIPLINE SPECIFIC Elective- Data Mining-II (Guidelines)

Sr. Units Chapter Reference No. of

2 6.10, 6.11 (introduction, [1] 8

5 11.1, 11.2, 11.3,11.6,11.7 [3] 10

2011, Morgan Kaufmann Publishers.

For practicals, datasets may be downloaded from :

1. Dr Anamika Gupta (Shaheed Sukhdev College of Business Studies)

2. Dr Manju Bhardwaj (Maitreyi College)

3. Dr Sarabjeet Kaur (Indraprastha College For Women)

4. Prof. Sharanjit Kaur (Acharya Narendra Dev College)

You might also like