Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24

nil

Uploaded by

rcg.2552

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

49 views3 pages

Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24

nil

Uploaded by

rcg.2552

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

B.A.

with Computer Science as Major discipline

Undergraduate Programme of study with Computer Science discipline as one of the two Core Disciplines

DISCIPLINE SPECIFIC CORE COURSE- Data Mining-I (Guidelines)

Sem III (July 2024 Onwards)

Sr. Units Chapter No. of

No. Hours
1 Unit 1: Introduction to Data Mining: 1.1-1.4, 2.1-2.2 8
Motivation and Challenges for data
mining, Types of data mining tasks,
Applications of data mining, Data
measurements, Data quality, Supervised
vs. unsupervised techniques
2 Unit 2: Data Pre-Processing: Data 2.3.1, 2.3.2, 2.3.3 (introduction), 2.3.4 9
aggregation, sampling, dimensionality (introduction), 2.3.5 (introduction),
reduction, feature subset selection, 2.3.6 (Binarization and Discretization
feature creation, variable transformation. of Continuous attributes), 2.3.7, 2.4.2,
2.4.3 (excluding properties)
3 Unit 3: Cluster Analysis: Basic 5.1.1, 5.1.2, 5.1.3 (well-separated and 11
concepts of clustering, measure of Density-based) 5.2 (upto Data in
similarity, types of clusters and Euclidean Space), 5.5.1, 5.5.5
clustering methods, K-means algorithm,
measures for cluster validation,
determine optimal number of clusters
4 Unit 4: Association Rule Mining: 4 (up to 4.2.2), 4.3 (introduction, 4.3.1) 8
Transaction data-set, frequent itemset,
support measure, rule generation,
confidence of association rule, Apriori
algorithm, Apriori principle
5 Unit 5: Classification: Naive Bayes 3 (up to 3.3.3), 3.4 (introduction) 3.6, 9
classifier, Nearest Neighbour classifier, 6.3, 6.4, 6.11 (introduction, 6.11.2)
decision tree, overfitting, confusion
matrix, evaluation metrics and model
evaluation.

Text Book:
1. Tan P.N., Steinbach M, Karpatne A. and Kumar V. Introduction to Data Mining, Second
edition, Sixth Impression, Pearson, 2023.

Additional References:
1. Han J., Kamber M. and Pei J. Data Mining: Concepts and Techniques, 3 edition, 2011,
rd

Morgan Kaufmann Publishers.

2. Zaki M. J. and Meira J. Jr. Data Mining and Machine Learning: Fundamental Concepts
and Algorithms, 2 edition, Cambridge University Press, 2020.
nd

3. Aggarwal C. C. Data Mining: The Textbook, Springer, 2015

4. Insight into Data mining: Theory and Practice, Soman K. P., Diwakar Shyam, Ajay V.,
PHI 2006
Datasets may be downloaded from :
1. https://archive.ics.uci.edu/datasets
2. https://www.kaggle.com/datasets?fileType=csv
3. https://data.gov.in/
4. https://ieee-dataport.org/datasets
Suggested Practical Exercises
1. Apply data cleaning techniques on any dataset (e,g, Paper Reviews dataset in UCI repository).
Techniques may include handling missing values, outliers and inconsistent values. A set of validation
rules can be prepared based on the dataset and validations can be performed.
2. Apply data pre-processing techniques such as standardization/normalization, transformation,
aggregation, discretization/binarization, sampling etc. on any dataset
3. Run Apriori algorithm to find frequent item sets and association rules on 2 real datasets and use
appropriate evaluation measures to compute correctness of obtained patterns
a) Use minimum support as 50% and minimum confidence as 75%
b) Use minimum support as 60% and minimum confidence as 60 %
4. Use Naive bayes, K-nearest, and Decision tree classification algorithms to build classifiers on
any two datasets. Pre-process the datasets using techniques specified in Q2. Compare the
Accuracy, Precision, Recall and F1 measure reported for each dataset using the abovementioned
classifiers under the following situations:
i. Using Holdout method (Random sampling):
a) Training set = 80% Test set = 20%
b) Training set = 66.6% (2/3rd of total), Test set = 33.3%
ii. Using Cross-Validation:
a) 10-fold
b) 5-fold
5. Apply simple K-means algorithm for clustering any dataset. Compare the performance of
clusters by varying the algorithm parameters. For a given set of parameters, plot a line graph
depicting MSE obtained after each iteration.
Project: Students should be promoted to take up one project on using dataset downloaded from
any of the websites given above and the dataset verified by the teacher. Preprocessing steps and
at least one data mining technique should be shown on the selected dataset. This will allow the
students to have a practical knowledge of how to apply the various skills learnt in the subject for
a single problem/project.

Prepared by:
1. Dr Anamika Gupta (Shaheed Sukhdev College of Business Studies)
2. Dr Manju Bhardwaj (Maitreyi College)
3. Dr Sarabjeet Kaur (Indraprastha College For Women)
4. Prof. Sharanjit Kaur (Acharya Narendra Dev College)

ME F321 - Data Minining in Mechanical Sciences - Handout - Jan 2023
No ratings yet
ME F321 - Data Minining in Mechanical Sciences - Handout - Jan 2023
4 pages
Data Science and Machine Learning Syllabus V1.0
No ratings yet
Data Science and Machine Learning Syllabus V1.0
6 pages
DWM NOTES
No ratings yet
DWM NOTES
118 pages
R23-DWDM Syllabus
No ratings yet
R23-DWDM Syllabus
5 pages
GJFSTH BCa
No ratings yet
GJFSTH BCa
1 page
ML Passing Package - 1
No ratings yet
ML Passing Package - 1
43 pages
DM - Unit-1 - Fundamentals of Data Mining
No ratings yet
DM - Unit-1 - Fundamentals of Data Mining
43 pages
Lecture 3.1.3 3.1.4
No ratings yet
Lecture 3.1.3 3.1.4
24 pages
Guidelines Datamining I
No ratings yet
Guidelines Datamining I
3 pages
Dmbda 2no.
No ratings yet
Dmbda 2no.
13 pages
DMBI Questions
No ratings yet
DMBI Questions
8 pages
DWDM Unit Wise Question Bank
No ratings yet
DWDM Unit Wise Question Bank
8 pages
Guidelines Datamining II
No ratings yet
Guidelines Datamining II
2 pages
DMBI All Pyqs
No ratings yet
DMBI All Pyqs
4 pages
DMKD Guide
No ratings yet
DMKD Guide
3 pages
Guidelines Data mining-II BA Major Sem 4 NEP
No ratings yet
Guidelines Data mining-II BA Major Sem 4 NEP
2 pages
Document
No ratings yet
Document
44 pages
BSC (H) Computer Science Discipline Specific Elective-Data Mining-Ii (Guidelines) Sem V (July 2024 Onwards)
No ratings yet
BSC (H) Computer Science Discipline Specific Elective-Data Mining-Ii (Guidelines) Sem V (July 2024 Onwards)
2 pages
Program Name BCA Title of The Course Data Mining Course Code CA-E1 Credits 03 Total No. of Teaching Hours 48
No ratings yet
Program Name BCA Title of The Course Data Mining Course Code CA-E1 Credits 03 Total No. of Teaching Hours 48
2 pages
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
No ratings yet
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
3 pages
Assignment DMW
No ratings yet
Assignment DMW
2 pages
R23!3!1 DWDM Final Syllabus On 21-06-2025
No ratings yet
R23!3!1 DWDM Final Syllabus On 21-06-2025
5 pages
Data Mining Question Bank 3,4,5
No ratings yet
Data Mining Question Bank 3,4,5
7 pages
Unit 01 DWDM
No ratings yet
Unit 01 DWDM
105 pages
Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan2024
No ratings yet
Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan2024
3 pages
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
No ratings yet
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
6 pages
16CS63: Machine Learning
No ratings yet
16CS63: Machine Learning
93 pages
Dmsyll
No ratings yet
Dmsyll
2 pages
New Syllabus - COMP 482 Data Mining1674216496
No ratings yet
New Syllabus - COMP 482 Data Mining1674216496
3 pages
Data Mining Notes: 7 Semester. CS 1435: Syllabus
No ratings yet
Data Mining Notes: 7 Semester. CS 1435: Syllabus
4 pages
Course Outline
No ratings yet
Course Outline
2 pages
COURSEFILE
No ratings yet
COURSEFILE
45 pages
A4629ac494 Syllabus
No ratings yet
A4629ac494 Syllabus
3 pages
Inft
No ratings yet
Inft
22 pages
Course Plan - Data Mining
No ratings yet
Course Plan - Data Mining
3 pages
Data Mining List of Important Question
No ratings yet
Data Mining List of Important Question
4 pages
DM Guidelines 14jan2022
No ratings yet
DM Guidelines 14jan2022
5 pages
Data Mining & Machine Learning Courseoutline
No ratings yet
Data Mining & Machine Learning Courseoutline
7 pages
B.Tech Jntuh DWDM Course Description
No ratings yet
B.Tech Jntuh DWDM Course Description
6 pages
CS F415 Data Mining L1
No ratings yet
CS F415 Data Mining L1
4 pages
Handout
No ratings yet
Handout
4 pages
CS-DM Module - 1
No ratings yet
CS-DM Module - 1
27 pages
Data Mining Lesson Plan-Revised Syllabus
No ratings yet
Data Mining Lesson Plan-Revised Syllabus
4 pages
DWDM-JNTUK SyllabousPre
No ratings yet
DWDM-JNTUK SyllabousPre
2 pages
R18B Tech CSESyllabus
No ratings yet
R18B Tech CSESyllabus
1 page
Cse2021 - Data Mining CH
No ratings yet
Cse2021 - Data Mining CH
13 pages
Data Mining Syllabus and Question
No ratings yet
Data Mining Syllabus and Question
6 pages
CCS415-CCT416 Course Outline
No ratings yet
CCS415-CCT416 Course Outline
3 pages
DMDW Lesson Plan
No ratings yet
DMDW Lesson Plan
8 pages
Gujarat Technological University: Subject Name: Elective I - Data Warehousing & Data Mining (DWDM) Subject Code: 640005
No ratings yet
Gujarat Technological University: Subject Name: Elective I - Data Warehousing & Data Mining (DWDM) Subject Code: 640005
5 pages
MLT Syllabus
No ratings yet
MLT Syllabus
3 pages
Btech Sem6 Cs1141 Data Mining
No ratings yet
Btech Sem6 Cs1141 Data Mining
5 pages
QSR Process Validation
No ratings yet
QSR Process Validation
36 pages
Data Mining
No ratings yet
Data Mining
2 pages
Parks McClellan
No ratings yet
Parks McClellan
25 pages
Cse3054 - Data-Mining - Concepts-And-Techniques - Eth - 1.0 - 66 - Cse3054 - 61 Acp
No ratings yet
Cse3054 - Data-Mining - Concepts-And-Techniques - Eth - 1.0 - 66 - Cse3054 - 61 Acp
2 pages
Seismic Data Processing With Seismic Unix Seg PDF
0% (3)
Seismic Data Processing With Seismic Unix Seg PDF
14 pages
Important Questions From All Units
No ratings yet
Important Questions From All Units
3 pages
Data Mining and Business Intelligence
No ratings yet
Data Mining and Business Intelligence
4 pages
Ba 404
No ratings yet
Ba 404
2 pages
Gujarat Technological University: Page 1 of 2
No ratings yet
Gujarat Technological University: Page 1 of 2
2 pages
Data Mining Handout
No ratings yet
Data Mining Handout
4 pages
Alibaba Business
No ratings yet
Alibaba Business
10 pages
PSG010
No ratings yet
PSG010
1 page
Useful Info On Wage Type Characteristics
No ratings yet
Useful Info On Wage Type Characteristics
6 pages
Abstract - For - Supermarket Billing System
67% (3)
Abstract - For - Supermarket Billing System
3 pages
Chapter 4 The Enhanced Entity-Relationship (EER) Model: Dr. Bernard Chen PH.D
No ratings yet
Chapter 4 The Enhanced Entity-Relationship (EER) Model: Dr. Bernard Chen PH.D
42 pages
Professional Planner On Primavera
No ratings yet
Professional Planner On Primavera
50 pages
CS 677-Internet of Things-Hamad Alizai PDF
No ratings yet
CS 677-Internet of Things-Hamad Alizai PDF
3 pages
Exam #5 Sequences and Series: College of The Redwoods Mathematics Department Math 30-College Algebra
No ratings yet
Exam #5 Sequences and Series: College of The Redwoods Mathematics Department Math 30-College Algebra
9 pages
PDF TNPM Installguide
No ratings yet
PDF TNPM Installguide
334 pages
Gradute Prospectus of AIOU
No ratings yet
Gradute Prospectus of AIOU
41 pages
Arista Cloudvision®: Cloud Automation For Everyone: White Paper
No ratings yet
Arista Cloudvision®: Cloud Automation For Everyone: White Paper
15 pages
LoadTracer - A Load Testing Tool
No ratings yet
LoadTracer - A Load Testing Tool
9 pages
Sheet Metal Nesting Report For Plasma and Laser Cutting
No ratings yet
Sheet Metal Nesting Report For Plasma and Laser Cutting
1 page
Cover Letters From MIT
50% (2)
Cover Letters From MIT
2 pages
Detailed Syllabus 2D and 3D Animation
No ratings yet
Detailed Syllabus 2D and 3D Animation
4 pages
Project Plan Template in Excel Free
No ratings yet
Project Plan Template in Excel Free
2 pages
Run Ssis From Vb6
No ratings yet
Run Ssis From Vb6
11 pages
Java MST Lab Viva Questions
No ratings yet
Java MST Lab Viva Questions
9 pages
Simple Linear Regression PDF
No ratings yet
Simple Linear Regression PDF
40 pages
FM Read - Text
No ratings yet
FM Read - Text
3 pages
Agenda - Oracle OpenWorld Asia - Singapore 2019 - Oracle Singapore
No ratings yet
Agenda - Oracle OpenWorld Asia - Singapore 2019 - Oracle Singapore
26 pages
Configuring Drilldown On A Form Applet
No ratings yet
Configuring Drilldown On A Form Applet
2 pages
Case Study On CPWD
No ratings yet
Case Study On CPWD
2 pages
Human Resource Management System (HRMS) : Department of Personnel
No ratings yet
Human Resource Management System (HRMS) : Department of Personnel
19 pages
Grade Staking Brochure PDF
No ratings yet
Grade Staking Brochure PDF
3 pages
Director Program Management IT in Philadelphia PA Resume Edward Mayer
No ratings yet
Director Program Management IT in Philadelphia PA Resume Edward Mayer
2 pages
Management Review Agenda TS 16949
No ratings yet
Management Review Agenda TS 16949
2 pages
Data Science through R. Unsupervised Learning. Dimension Reduction Techniques: Principal Components, Factor Analysis and Correspondence Analysis
From Everand
Data Science through R. Unsupervised Learning. Dimension Reduction Techniques: Principal Components, Factor Analysis and Correspondence Analysis
César Pérez López
No ratings yet

Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24

Uploaded by

Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24

Uploaded by

B.A.

with Computer Science as Major discipline

DISCIPLINE SPECIFIC CORE COURSE- Data Mining-I (Guidelines)

Sr. Units Chapter No. of

Morgan Kaufmann Publishers.

3. Aggarwal C. C. Data Mining: The Textbook, Springer, 2015

You might also like