Larose, D. T. (2006) Data Mining Methods and Models, Hoboken: John Wiley & Sons, Inc. Morgan Kaufmann

The document summarizes the process of analyzing data from the 2011 Ethiopian Demographic and Health Survey. It extracted data from 01.01.2012 to 31.12.2012 on 11,654 records meeting the criteria. The data was cleaned, coded, transformed, and analyzed in WEKA software to identify factors associated with children being alive or dead, as the dataset was stratified on this outcome. Synthetic Minority Oversampling Technique was used to balance the subgroups. The document also notes the importance of data preprocessing when using pre-existing datasets for mining, as the data may contain errors or be unbalanced.

Uploaded by

Anonymous dS2muU

We take content rights seriously. If you suspect this is your content, claim it here.

0% found this document useful (0 votes)

50 views1 page

Larose, D. T. (2006) Data Mining Methods and Models, Hoboken: John Wiley & Sons, Inc. Morgan Kaufmann

Uploaded by

Anonymous dS2muU

We take content rights seriously. If you suspect this is your content, claim it here.

You are on page 1/ 1

1. The extracted data cover the period from 01.01.2012 to 31.12.2012.

2. EDHS 2011 dataset was utilized. The data were originally collected by Macro International United States of America (USA) and
CSA Ethiopia
3. A total of 11,654 records that met inclusion criteria were retrieved. Data was extracted from EDHS 2011 children’s dataset.
Extracted data were cleaned, coded, transformed and entered into
Waikato Environment for Knowledge Analysis (WEKA) 3.6.4 software. The extracted dataset was stratified into “Alive” and
“Dead”
groups. The “Alive” group comprised mothers whose child was
alive during the survey. The “Dead” group comprised mothers who
had one or more dead child. Since sample sizes of ‘Alive’ and
‘Dead’ subgroups is not balanced we have applied Synthetic Minority Oversampling Technique (SMOTE) was applied to
balance the
dataset and minimize sampling errors. Pruning techniques were
used to clean rules that were insignificant. The 10 fold cross validation and 95% split was done to oversee the strength of the
association of determinants with the outcome variable.
4. Most of the data sets used in data mining were not
necessarily gathered with a specific goal in mind. Some of
them may contain errors, outliers or missing values. In order
to use those data sets in the data mining process, the data
needs to undergo preprocessing, using data cleaning,
discretization and data transformation [9]. It has been
estimated that data preparation alone accounts for 60% of all
the time and effort expanded in the entire data mining process
[10].
5. Larose, D. T. (2006) Data Mining Methods and Models, Hoboken: John Wiley & Sons, Inc.
6.
[10] Pyle, D. (1999) Data Preparation for Data Mining, San Francisco: Morgan Kaufmann

IT Key Metrics Data 752522 NDX
No ratings yet
IT Key Metrics Data 752522 NDX
28 pages
Study Guide: Exam PL-300: Microsoft Power BI Data Analyst
0% (2)
Study Guide: Exam PL-300: Microsoft Power BI Data Analyst
8 pages
Preprocessing in Data Mining: Edgar Acu Na
No ratings yet
Preprocessing in Data Mining: Edgar Acu Na
5 pages
1 To 10 DSBDA Case Study
No ratings yet
1 To 10 DSBDA Case Study
17 pages
Data Preprocessing
No ratings yet
Data Preprocessing
0 pages
R Programming Unit-2
No ratings yet
R Programming Unit-2
29 pages
Data Mining
No ratings yet
Data Mining
5 pages
Data and DW Lab Manual Updated
No ratings yet
Data and DW Lab Manual Updated
44 pages
Data Cleaning Data Transformation Data Reduction Discretization and Generating Concept Hierarchies
No ratings yet
Data Cleaning Data Transformation Data Reduction Discretization and Generating Concept Hierarchies
25 pages
DW & DM Lab (Exp 5 To 12) Kcs 751 A
No ratings yet
DW & DM Lab (Exp 5 To 12) Kcs 751 A
19 pages
Iare Data Preparation and Analysis Lab Manual
No ratings yet
Iare Data Preparation and Analysis Lab Manual
55 pages
Unit 3 Data Warehousing and Data Mining
No ratings yet
Unit 3 Data Warehousing and Data Mining
7 pages
Data Preprocessing
No ratings yet
Data Preprocessing
8 pages
Weka: A Tool For Data Preprocessing, Classification, Ensemble, Clustering and Association Rule Mining
No ratings yet
Weka: A Tool For Data Preprocessing, Classification, Ensemble, Clustering and Association Rule Mining
4 pages
18mca52c U2
No ratings yet
18mca52c U2
23 pages
Data Mining UNIT II
No ratings yet
Data Mining UNIT II
19 pages
Data Preprocessing 013333
No ratings yet
Data Preprocessing 013333
8 pages
Data Binning
No ratings yet
Data Binning
9 pages
Data Mining - Preprocessing
No ratings yet
Data Mining - Preprocessing
77 pages
Assignment 2
No ratings yet
Assignment 2
5 pages
Data Mining Module 2
No ratings yet
Data Mining Module 2
23 pages
Screenshot 2025-04-09 at 10.35.12 AM
No ratings yet
Screenshot 2025-04-09 at 10.35.12 AM
31 pages
LECTURE 3-BDM 411 Data Analytics and BIG Data
No ratings yet
LECTURE 3-BDM 411 Data Analytics and BIG Data
49 pages
Experiment 1: Installation of WEKA Tool Aim
No ratings yet
Experiment 1: Installation of WEKA Tool Aim
19 pages
Data Warehouse and Data Mining - Definition and Concepts
No ratings yet
Data Warehouse and Data Mining - Definition and Concepts
20 pages
Template-Data Mining
No ratings yet
Template-Data Mining
3 pages
Unit 2 Data Mining
No ratings yet
Unit 2 Data Mining
69 pages
CE0716-Data Warehouse and Mining - Compulsory
No ratings yet
CE0716-Data Warehouse and Mining - Compulsory
5 pages
Data Mining
No ratings yet
Data Mining
15 pages
BI - Experiment - No - 1
No ratings yet
BI - Experiment - No - 1
7 pages
Teit Cbgs Dmbi Lab Manual FH 2015
No ratings yet
Teit Cbgs Dmbi Lab Manual FH 2015
60 pages
Chap.3 Data Preprocessing
No ratings yet
Chap.3 Data Preprocessing
6 pages
Cosf 221 Inte 421 Bmis 313 Data Mining - Kabarak University
No ratings yet
Cosf 221 Inte 421 Bmis 313 Data Mining - Kabarak University
11 pages
Comparison of Applications For Educational Data Mining in Engineering Education Buenaño-Fernandez Diego
No ratings yet
Comparison of Applications For Educational Data Mining in Engineering Education Buenaño-Fernandez Diego
5 pages
Unit 2
No ratings yet
Unit 2
144 pages
13 - Chapter 4 PDF
No ratings yet
13 - Chapter 4 PDF
46 pages
4-Data Preprocessing (Cleaning) and Exploration
No ratings yet
4-Data Preprocessing (Cleaning) and Exploration
54 pages
Chapter 3
No ratings yet
Chapter 3
9 pages
OJCST Vol13 N2-3 P 78-81
No ratings yet
OJCST Vol13 N2-3 P 78-81
4 pages
Mining Weather Data Using Rattle
No ratings yet
Mining Weather Data Using Rattle
6 pages
Unit - 2
No ratings yet
Unit - 2
17 pages
Preprocessing (Review)
No ratings yet
Preprocessing (Review)
11 pages
Data Collection:-Is The Process of Gathering and Measuring Information On
No ratings yet
Data Collection:-Is The Process of Gathering and Measuring Information On
1 page
Big Data Lecture # 03
No ratings yet
Big Data Lecture # 03
14 pages
Census Data Mining and Data Analysis Using WEKA: Abstract
No ratings yet
Census Data Mining and Data Analysis Using WEKA: Abstract
6 pages
Result Mining For Performance Enhancement
No ratings yet
Result Mining For Performance Enhancement
1 page
Datawarehouse Assignment
No ratings yet
Datawarehouse Assignment
11 pages
What Is Data Preprocessing
No ratings yet
What Is Data Preprocessing
4 pages
Data Mining Notes
No ratings yet
Data Mining Notes
25 pages
Analisis Data 2
No ratings yet
Analisis Data 2
40 pages
1.data Mining Functionalities
No ratings yet
1.data Mining Functionalities
14 pages
Datawarehouse Lab Manunaul Edited
No ratings yet
Datawarehouse Lab Manunaul Edited
34 pages
Lecture 6 Data Preprocessing
No ratings yet
Lecture 6 Data Preprocessing
59 pages
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
No ratings yet
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
7 pages
Unit-I Data Mining
No ratings yet
Unit-I Data Mining
28 pages
Unit 3 DWDM
No ratings yet
Unit 3 DWDM
25 pages
Data Mining
No ratings yet
Data Mining
44 pages
Educational Data Mining The Case of Department of Mathematics and Computing in The Period 2009 2018
No ratings yet
Educational Data Mining The Case of Department of Mathematics and Computing in The Period 2009 2018
5 pages
Weka Tutorial
100% (2)
Weka Tutorial
60 pages
Data Preparation and Exploration: Applied to Healthcare Data
From Everand
Data Preparation and Exploration: Applied to Healthcare Data
Robert Hoyt
No ratings yet
Data Mining: Fundamentals and Applications
From Everand
Data Mining: Fundamentals and Applications
Fouad Sabry
No ratings yet
Principles of Data Mining
From Everand
Principles of Data Mining
Subodh Keshari
No ratings yet
Saint Francis of Assisi College: 96 Bayanan, Bacoor City, Cavite
No ratings yet
Saint Francis of Assisi College: 96 Bayanan, Bacoor City, Cavite
18 pages
IS328 Data Mining-Tutorial 1 Solution
No ratings yet
IS328 Data Mining-Tutorial 1 Solution
5 pages
Check Material Has Exploded
No ratings yet
Check Material Has Exploded
3 pages
Database Management System Answer Key - Activity 1
No ratings yet
Database Management System Answer Key - Activity 1
10 pages
Arquitectura
No ratings yet
Arquitectura
8 pages
Data Mining Question Bank Chapter-1 (Introduction To Data Warehouse and Data Mining) Expected Questions 1 Mark Questions
No ratings yet
Data Mining Question Bank Chapter-1 (Introduction To Data Warehouse and Data Mining) Expected Questions 1 Mark Questions
6 pages
Research Paper 22ECE1040
No ratings yet
Research Paper 22ECE1040
7 pages
Practical Research 1
100% (2)
Practical Research 1
20 pages
Teradata Performance Optimization
No ratings yet
Teradata Performance Optimization
7 pages
Basic Terms in Statistics
No ratings yet
Basic Terms in Statistics
7 pages
MD060 AP Supplier Site Update API v1.0
No ratings yet
MD060 AP Supplier Site Update API v1.0
9 pages
Course Module of Advanced Excel
No ratings yet
Course Module of Advanced Excel
2 pages
Mcqs
No ratings yet
Mcqs
14 pages
Retail Operations Analysis Report
No ratings yet
Retail Operations Analysis Report
11 pages
2210 s15 QP 21
No ratings yet
2210 s15 QP 21
2 pages
Health Assessment
No ratings yet
Health Assessment
3 pages
Implementer Catalogue EN
No ratings yet
Implementer Catalogue EN
22 pages
Shaping Tomorrow
No ratings yet
Shaping Tomorrow
5 pages
Tal End Metadata Bridge
No ratings yet
Tal End Metadata Bridge
15 pages
Hamza Nazir (2872) DB LAB 11-Bscs EVE
No ratings yet
Hamza Nazir (2872) DB LAB 11-Bscs EVE
9 pages
GROUP 5 Research - PR 1
No ratings yet
GROUP 5 Research - PR 1
8 pages
CS8651 - IP - UNIT - IV - 6 - File Handling
No ratings yet
CS8651 - IP - UNIT - IV - 6 - File Handling
7 pages
PDF
No ratings yet
PDF
14 pages
Fusion Technical
100% (1)
Fusion Technical
544 pages
IS07
No ratings yet
IS07
2 pages
Data Analytics Roadmap @CodeBasics
No ratings yet
Data Analytics Roadmap @CodeBasics
13 pages
Unit I Normalization
No ratings yet
Unit I Normalization
51 pages
ADC Updates January 31 2024
No ratings yet
ADC Updates January 31 2024
7 pages

Larose, D. T. (2006) Data Mining Methods and Models, Hoboken: John Wiley & Sons, Inc. Morgan Kaufmann

Uploaded by

Larose, D. T. (2006) Data Mining Methods and Models, Hoboken: John Wiley & Sons, Inc. Morgan Kaufmann

Uploaded by

1. The extracted data cover the period from 01.01.2012 to 31.12.2012.

You might also like