6-Deep Networks Basics - Shallow Neural Networks-29-07-2024

Uploaded by

gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views8 pages

6-Deep Networks Basics - Shallow Neural Networks-29-07-2024

Uploaded by

gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 8

Data Preprocessing in Machine

Learning
Key Steps and Techniques
Data Cleaning
1.Data Cleaning:
1.Handling Missing Values: Techniques
include removing records with missing values,
imputing missing values, or using algorithms that
support missing values.
2.Handling Outliers: Identifying and
removing or transforming outliers to prevent them
from skewing the results.
Data Transformation
2. Data Transformation:
1.Normalization/Standardization:
Scaling features to a similar range to ensure that
no single feature dominates the model's
performance.
2.Encoding Categorical Data: Converting
categorical data into numerical format using
techniques like one-hot encoding, label encoding,
or binary encoding.
Feature Engineering
3. Feature Engineering:
1.Feature Creation: Creating new features
from existing data to enhance the predictive
power of the model.
2.Feature Selection: Selecting the most
relevant features to reduce dimensionality and
improve model performance.
4. Data Splitting:
1.Training and Testing Sets: Splitting the
dataset into training and testing sets to evaluate
the model's performance on unseen data.
2.Cross-Validation: Using techniques like k-
fold cross-validation to further assess the model's
generalizability.
Data Integration
• Combining data from different sources to
provide a more comprehensive dataset.
Common Techniques and Tools
Common Techniques and Tools
1.Imputation:
1. Using mean, median, or mode to fill missing values.
2. Advanced imputation techniques like K-Nearest
Neighbors (KNN) imputation.
2.Scaling:
1. Min-Max Scaling: Scaling features to a range between 0
and 1.
2. Standardization: Scaling features to have a mean of 0
and a standard deviation of 1.
3. Encoding Categorical Data:
1. One-Hot Encoding: Creating binary columns for each
category.
2. Label Encoding: Assigning a unique integer to each
category.
4. Handling Outliers:
3. Z-score: Removing data points that are more than a
certain number of standard deviations away from the
mean.
4. IQR Method: Removing data points that fall outside the
interquartile range.

Data Preprocessing Techniques Cleaning Transformation and Integration
No ratings yet
Data Preprocessing Techniques Cleaning Transformation and Integration
6 pages
MSDSModule 2
No ratings yet
MSDSModule 2
35 pages
Module 3 Notes
No ratings yet
Module 3 Notes
5 pages
3-Data Preprocessing
No ratings yet
3-Data Preprocessing
32 pages
Dsur Ea2352001010391 W7
No ratings yet
Dsur Ea2352001010391 W7
3 pages
DS Unit 2
No ratings yet
DS Unit 2
23 pages
Session-2-CO3-Introduction To Data Preprocessing
No ratings yet
Session-2-CO3-Introduction To Data Preprocessing
39 pages
Aml Midsem
No ratings yet
Aml Midsem
59 pages
Data Mining Basics
No ratings yet
Data Mining Basics
52 pages
Data Mining
No ratings yet
Data Mining
22 pages
Unit 2 Data Preprocessing
No ratings yet
Unit 2 Data Preprocessing
3 pages
Data Preprocessing
No ratings yet
Data Preprocessing
49 pages
Unit - II
No ratings yet
Unit - II
56 pages
Data Mining Basics
No ratings yet
Data Mining Basics
38 pages
REVIEWER
No ratings yet
REVIEWER
9 pages
ML Unit 2
No ratings yet
ML Unit 2
52 pages
Chương
No ratings yet
Chương
12 pages
4 - Data Pre-Processing I
No ratings yet
4 - Data Pre-Processing I
37 pages
COMPAPPABCA50150rDatrAP Data Preprocessing2 (DataMining)
No ratings yet
COMPAPPABCA50150rDatrAP Data Preprocessing2 (DataMining)
13 pages
SML Updated UNIT-2
No ratings yet
SML Updated UNIT-2
43 pages
Data Preprocessing
No ratings yet
Data Preprocessing
9 pages
Week 3
No ratings yet
Week 3
23 pages
Lecture 3 Unit 1
No ratings yet
Lecture 3 Unit 1
61 pages
3 Preprocessing
No ratings yet
3 Preprocessing
27 pages
Data Preprocessing in Python Pandas (With Code)
No ratings yet
Data Preprocessing in Python Pandas (With Code)
11 pages
DAI101 4 Data Preparation
No ratings yet
DAI101 4 Data Preparation
45 pages
Chap 3
No ratings yet
Chap 3
26 pages
DWDM Unit 3
No ratings yet
DWDM Unit 3
16 pages
AI351 Lecture 1
No ratings yet
AI351 Lecture 1
32 pages
Module 2 - Data Preprocessing
No ratings yet
Module 2 - Data Preprocessing
16 pages
Unit 2
No ratings yet
Unit 2
18 pages
Ch8 Data and Its Processing
No ratings yet
Ch8 Data and Its Processing
32 pages
Unit 7 ML
No ratings yet
Unit 7 ML
33 pages
Data Mining UNIT II
No ratings yet
Data Mining UNIT II
19 pages
Preprocessing 935
No ratings yet
Preprocessing 935
68 pages
Data Mining: Concepts and Techniques: - Chapter 3
No ratings yet
Data Mining: Concepts and Techniques: - Chapter 3
52 pages
Data Mining: Concepts and Techniques
No ratings yet
Data Mining: Concepts and Techniques
50 pages
Data Pre Processing - NG
No ratings yet
Data Pre Processing - NG
43 pages
Data Pre Processing
No ratings yet
Data Pre Processing
48 pages
6 Data Preprocessing
No ratings yet
6 Data Preprocessing
37 pages
Data Cleaning and Preprocessing
No ratings yet
Data Cleaning and Preprocessing
4 pages
DSR Unit III
No ratings yet
DSR Unit III
11 pages
DS Module2 L3 L13
No ratings yet
DS Module2 L3 L13
43 pages
Business Analytics
No ratings yet
Business Analytics
14 pages
Disruptive Technologies DA Lecture 8
No ratings yet
Disruptive Technologies DA Lecture 8
17 pages
Week 2
No ratings yet
Week 2
3 pages
Unit - II MLT
No ratings yet
Unit - II MLT
75 pages
Unit 2
No ratings yet
Unit 2
9 pages
Experiment-3 31
No ratings yet
Experiment-3 31
9 pages
Unit - 1 Data Preprocessing
No ratings yet
Unit - 1 Data Preprocessing
66 pages
Machine Learning Chapter 2
No ratings yet
Machine Learning Chapter 2
37 pages
Data Preprocessing
No ratings yet
Data Preprocessing
22 pages
DWM Module 2
No ratings yet
DWM Module 2
9 pages
Predictive Analytics Modelling (21CSH-440) : Apex Institute of Technology
No ratings yet
Predictive Analytics Modelling (21CSH-440) : Apex Institute of Technology
20 pages
Pre Processing
No ratings yet
Pre Processing
68 pages
Module1.5 Preprocessing
No ratings yet
Module1.5 Preprocessing
40 pages
ML 4
No ratings yet
ML 4
17 pages
The Secret Of Machine Learning
From Everand
The Secret Of Machine Learning
Mhd Arjunanta
No ratings yet
Machine Learning with Python: Foundations and Applications: ML, #1
From Everand
Machine Learning with Python: Foundations and Applications: ML, #1
Mohammed Nurudeen
No ratings yet
DATA MINING and MACHINE LEARNING. PREDICTIVE TECHNIQUES: ENSEMBLE METHODS, BOOSTING, BAGGING, RANDOM FOREST, DECISION TREES and REGRESSION TREES.: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. PREDICTIVE TECHNIQUES: ENSEMBLE METHODS, BOOSTING, BAGGING, RANDOM FOREST, DECISION TREES and REGRESSION TREES.: Examples with MATLAB
César Pérez López
No ratings yet
9-Deep Neural Networks - Forward and Back Propagation-01-08-2024
No ratings yet
9-Deep Neural Networks - Forward and Back Propagation-01-08-2024
10 pages
7-Activation Functions - Gradient Descent - Back Propagation-31-07-2024
No ratings yet
7-Activation Functions - Gradient Descent - Back Propagation-31-07-2024
16 pages
12-Mini-Batch Gradient Descent - Exponential Weighted Averages-07-08-2024
No ratings yet
12-Mini-Batch Gradient Descent - Exponential Weighted Averages-07-08-2024
2 pages
8-Activation Functions - Gradient Descent - Back Propagation-31-07-2024
No ratings yet
8-Activation Functions - Gradient Descent - Back Propagation-31-07-2024
9 pages

6-Deep Networks Basics - Shallow Neural Networks-29-07-2024

Uploaded by

6-Deep Networks Basics - Shallow Neural Networks-29-07-2024

Uploaded by

Data Preprocessing in Machine

You might also like