0% found this document useful (0 votes)

13 views2 pages

FDS CH 3

Uploaded by

sonuchaure548

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views2 pages

FDS CH 3

Uploaded by

sonuchaure548

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

FDS_CH_3 : Data Preprocessing

• Data preprocessing is the method of collecting raw data and translating it into usable/meaningful information.
• The data preprocessing is required to improve the quality of data.
DATA OBJECTS :
• Data is a collection of data objects and their attributes.
• A collection of attributes describe an object.
• Data objects can also be referred to as samples, examples, instances, case, entity, data points or objects.
Data Attributes :
• A data attribute is a singlevalue descriptor for a data object.
• An attribute is a property or characteristic of an object.
• There are broadly four types of attributes namely, Nominal attribute, Binary attribute, Ordinal attribute and
Numeric attributes.
DATA QUALITY :
• Data quality can be defined as, “the ability of a given data set to serve an intended purpose”.
• Data preprocessing is responsible for maintain the quality of data.
• There are many factors comprising data quality, including accuracy, completeness, consistency, timeliness,
M
believability, and interpretability.
• There are many reasons for inaccurate, incomplete, and inconsistent in real-world databases and data
warehouses.
Inaccuracy: • Inaccurate data means having incorrect attribute values.
Data Cleaning :
• Data cleaning is used to handle missing data.
r.
• Data cleaning also known as data scrubbing.
• Data cleaning is the process of correcting or removing incorrect, incomplete or duplicate data within a dataset.
Missing Values :
• Some values in the data may not be filled up for various reasons and hence are considered missing.
• there can be three cases of missing data:
Missing Completely At Random (MCAR), Missing At Random Data (MAR) , Missing Not At Random (MNAR).
R
**Data Transformation :
• Data transformation is the process of converting raw data into a structure data.
• Data transformation is a data preprocessing technique that transforms the data into alternate forms.
• Data transformation is a process of converting raw data into a single and easy-to-read format.
• Data transformation is the process of changing the format, structure, or values of data.
oh
Rescaling:
• Rescaling means transforming the data so that it fits within a specific scale, like 0-100 or 0-1.
• Rescaling of data allows scaling all data values to lie between a specified minimum and maximum value.
Normalizing:
• To avoid dependence on the choice of measurement units, the data should be normalized.
• Normalization scaled data is fall within a smaller range, such as 0.0 to 1.0 or -1.0 to 1.0
it
• Normalizing the data attempts to give all attributes an equal weight.
Binarizing:
• It is the process of converting data to either 0 or 1 based on a threshold value.
• All the data values above the threshold value are marked 1 whereas all the data values equal to or below
the threshold value are marked as 0.
Standarizing
• Standardization also called mean removal.
• In other words, Standardization is another scaling technique where the values are centered around the
mean with a unit standard deviation.
Data Discretization :
• Data discretization is method of translating attribute values of continuous data into a finite set of intervals with
minimal information loss.
• The data discretization technique is used to divide the attributes of the continuous nature into data with
intervals.
it
oh
R
r.
M

Womanist Research PDF
100% (1)
Womanist Research PDF
11 pages
OJCST Vol13 N2-3 P 78-81
No ratings yet
OJCST Vol13 N2-3 P 78-81
4 pages
Data Preprocessing Unit 2
No ratings yet
Data Preprocessing Unit 2
3 pages
7.data Preprocessing
No ratings yet
7.data Preprocessing
12 pages
DWDM 3
No ratings yet
DWDM 3
12 pages
DWM Module 2
No ratings yet
DWM Module 2
9 pages
CH1-data Preprocessing
No ratings yet
CH1-data Preprocessing
49 pages
Normalization
No ratings yet
Normalization
35 pages
Mod1 DM Part2
No ratings yet
Mod1 DM Part2
34 pages
DWDM Unit 3
No ratings yet
DWDM Unit 3
16 pages
UNIT 3 Data Preprocessing
No ratings yet
UNIT 3 Data Preprocessing
22 pages
Chap.3 Data Preprocessing
No ratings yet
Chap.3 Data Preprocessing
6 pages
Data Mining UNIT II
No ratings yet
Data Mining UNIT II
19 pages
Data Mining
No ratings yet
Data Mining
5 pages
COS10022 - Lecture 03 - Data Preparation PDF
No ratings yet
COS10022 - Lecture 03 - Data Preparation PDF
61 pages
Data Preprocessing
No ratings yet
Data Preprocessing
8 pages
Unit - 1 Data Preprocessing
No ratings yet
Unit - 1 Data Preprocessing
66 pages
DEC - Unit II Data Pre-Processing
No ratings yet
DEC - Unit II Data Pre-Processing
96 pages
Unit - 2
No ratings yet
Unit - 2
17 pages
Data Preprocessing in Data Mining
No ratings yet
Data Preprocessing in Data Mining
3 pages
Unit-Ii Data Preprocessing
No ratings yet
Unit-Ii Data Preprocessing
94 pages
Pre Processing
No ratings yet
Pre Processing
68 pages
DAI101 4 Data Preparation
No ratings yet
DAI101 4 Data Preparation
45 pages
16-Data Preprocessing
No ratings yet
16-Data Preprocessing
27 pages
Lecture 3 Unit 1
No ratings yet
Lecture 3 Unit 1
61 pages
CS-DM Module-2
No ratings yet
CS-DM Module-2
29 pages
ML 4
No ratings yet
ML 4
17 pages
JAVA Advanced 3
No ratings yet
JAVA Advanced 3
19 pages
Data Cleaning: Missing Values: - For Example in Attribute Income If
No ratings yet
Data Cleaning: Missing Values: - For Example in Attribute Income If
30 pages
Unit-2 Data Warehouse Notes
No ratings yet
Unit-2 Data Warehouse Notes
11 pages
Data Preprocessing
No ratings yet
Data Preprocessing
77 pages
Preprocessing
No ratings yet
Preprocessing
50 pages
M2 PPT
No ratings yet
M2 PPT
60 pages
Unit 3 DW&DM Notes Mr. Rohit Pratap Singh
No ratings yet
Unit 3 DW&DM Notes Mr. Rohit Pratap Singh
22 pages
Lecture 09 DM
No ratings yet
Lecture 09 DM
14 pages
Data Transformation and Standardization
No ratings yet
Data Transformation and Standardization
5 pages
Data Handling and Visualization 3rd Unit
No ratings yet
Data Handling and Visualization 3rd Unit
4 pages
Dmi Unit 3
No ratings yet
Dmi Unit 3
12 pages
Study+Material+Unit 4+Data+Preprocessing+
No ratings yet
Study+Material+Unit 4+Data+Preprocessing+
8 pages
2 Data Pre-Processing
No ratings yet
2 Data Pre-Processing
50 pages
DMDW Chapter 3
No ratings yet
DMDW Chapter 3
13 pages
Data Preprocessing
No ratings yet
Data Preprocessing
22 pages
DWM
No ratings yet
DWM
14 pages
Week 3
No ratings yet
Week 3
23 pages
Notes - Unit01 - Data Science and Big Data Analytics
No ratings yet
Notes - Unit01 - Data Science and Big Data Analytics
7 pages
Data Preprocessing Techniques
No ratings yet
Data Preprocessing Techniques
11 pages
ICS 2408 - Lecture 2 - Data Preprocessing
No ratings yet
ICS 2408 - Lecture 2 - Data Preprocessing
29 pages
Data Science - Module 1.3
No ratings yet
Data Science - Module 1.3
34 pages
633777800398832500ata Minig Presentation
No ratings yet
633777800398832500ata Minig Presentation
20 pages
Data Preprocessing Techniques Cleaning Transformation and Integration
No ratings yet
Data Preprocessing Techniques Cleaning Transformation and Integration
6 pages
Data Binning
No ratings yet
Data Binning
9 pages
3 Data Preprocessing
No ratings yet
3 Data Preprocessing
33 pages
CS-DM Module-2
No ratings yet
CS-DM Module-2
30 pages
Data Sciences Unit-I
No ratings yet
Data Sciences Unit-I
83 pages
Data Transformation in Data Mining
No ratings yet
Data Transformation in Data Mining
6 pages
Chap 3
No ratings yet
Chap 3
26 pages
3 Preprocessing
No ratings yet
3 Preprocessing
27 pages
DSR Unit III
No ratings yet
DSR Unit III
11 pages
Unit 2
No ratings yet
Unit 2
37 pages
Basic Concepts in Data Structures
From Everand
Basic Concepts in Data Structures
K.Meenendranath Reddy
No ratings yet
Database And Computer Management: SERIES 1, #3
From Everand
Database And Computer Management: SERIES 1, #3
Elias Mutegi
No ratings yet
Salon Mangement System 605
No ratings yet
Salon Mangement System 605
8 pages
Client
No ratings yet
Client
7 pages
BSC Computer Science Cs Semester 5 2022 November Computer Networks II 2019 Pattern
No ratings yet
BSC Computer Science Cs Semester 5 2022 November Computer Networks II 2019 Pattern
2 pages
BSC Computer Science Cs Semester 5 2022 November Operating Systems I 2019 Pattern
No ratings yet
BSC Computer Science Cs Semester 5 2022 November Operating Systems I 2019 Pattern
2 pages
Migration Training v2
100% (2)
Migration Training v2
52 pages
If Q Nitrosamines Risk Evaluation v1 1679336062
100% (1)
If Q Nitrosamines Risk Evaluation v1 1679336062
9 pages
Mobile Robot Position Determination Using Data Integration of Odometry and Gyroscope
No ratings yet
Mobile Robot Position Determination Using Data Integration of Odometry and Gyroscope
9 pages
People V Gregorio Villalon
No ratings yet
People V Gregorio Villalon
5 pages
Rubber Industry - Rsal-2
No ratings yet
Rubber Industry - Rsal-2
33 pages
The Shape of Water Film Analysis
0% (1)
The Shape of Water Film Analysis
10 pages
Sunlife E-Learning User Manual
No ratings yet
Sunlife E-Learning User Manual
16 pages
Communication Systems Lab Manual
67% (6)
Communication Systems Lab Manual
83 pages
Philippine Modern Dances
No ratings yet
Philippine Modern Dances
5 pages
CURRENT OPINION Delirium Diagnosis, Screening and Management
No ratings yet
CURRENT OPINION Delirium Diagnosis, Screening and Management
10 pages
Assembly Tables Project Plan
No ratings yet
Assembly Tables Project Plan
8 pages
Vrio Value Chain BCG Matrix: Internal
0% (1)
Vrio Value Chain BCG Matrix: Internal
2 pages
Trigonometric Identities & Equations - Solutions
No ratings yet
Trigonometric Identities & Equations - Solutions
4 pages
GramaSabheWorkshop PDF
No ratings yet
GramaSabheWorkshop PDF
243 pages
Ss Lesson 1
No ratings yet
Ss Lesson 1
7 pages
I-R:he: Detective The The The
No ratings yet
I-R:he: Detective The The The
42 pages
Artificial Intelligence and Machine Learning Techniques in The Diagnosis of Type I Diabetes Case Studies
No ratings yet
Artificial Intelligence and Machine Learning Techniques in The Diagnosis of Type I Diabetes Case Studies
335 pages
Fintech Final Paper
No ratings yet
Fintech Final Paper
5 pages
Solution Manual To Accompany: Contemporary Issues in Accounting 2e by Rankin Et Al
No ratings yet
Solution Manual To Accompany: Contemporary Issues in Accounting 2e by Rankin Et Al
8 pages
UTS Long Quiz-Finals - Google Forms
No ratings yet
UTS Long Quiz-Finals - Google Forms
17 pages
Opencv Crash Course Waldo
No ratings yet
Opencv Crash Course Waldo
8 pages
CPW Fed Slot Antenna For UWB
No ratings yet
CPW Fed Slot Antenna For UWB
4 pages
SSC Algebra Board Questions 2013
No ratings yet
SSC Algebra Board Questions 2013
3 pages
Masterbrace Fib: Description
No ratings yet
Masterbrace Fib: Description
2 pages
Eaton Fs-4205a
No ratings yet
Eaton Fs-4205a
18 pages
System Software Lab Manual
85% (20)
System Software Lab Manual
42 pages
DSE212 4 Statement
No ratings yet
DSE212 4 Statement
2 pages
Granulation Collette Mixer
No ratings yet
Granulation Collette Mixer
16 pages
DX Diag
No ratings yet
DX Diag
39 pages

FDS CH 3

Uploaded by

FDS CH 3

Uploaded by

FDS_CH_3 : Data Preprocessing

You might also like