Week 4

Uploaded by

bamek59014

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views2 pages

Week 4

Uploaded by

bamek59014

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 2

DATAPREPROCESSING–CATEGORICAL DATA

For a given set of training data examples stored

ina.CSVfile,demonstrateDataPreprocessinginMachinelearningwiththefollo
wingsteps
A) Getting the dataset.
B) Importing libraries.
C) Importing datasets.
D) Finding Missing Data.
E) Encoding Categorical Data.
F) Splitting dataset into training and test set.
G) Feature scaling.

# importing libraries
import numpy as nm
import matplotlib.pyplot as mtp
import pandas as pd
#importing datasets
data_set= pd.read_csv('Dataset.csv')
#Extracting Independent Variable
x= data_set.iloc[:, :-1].values
#Extracting Dependent variable
y= data_set.iloc[:, 3].values
#handling missing data(Replacing missing data with the mean value)
from sklearn.preprocessing import Imputer
imputer= Imputer(missing_values ='NaN', strategy='mean', axis = 0)
#Fitting imputer object to the independent varibles x.
imputerimputer= imputer.fit(x[:, 1:3])
#Replacing missing data with the calculated mean value
x[:, 1:3]= imputer.transform(x[:, 1:3])
#for Country Variable
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
label_encoder_x= LabelEncoder()
x[:, 0]= label_encoder_x.fit_transform(x[:, 0])
#Encoding for dummy variables
onehot_encoder= OneHotEncoder(categorical_features= [0])
x= onehot_encoder.fit_transform(x).toarray()
#encoding for purchased variable
labelencoder_y= LabelEncoder()
y= labelencoder_y.fit_transform(y)
# Splitting the dataset into training and test set.
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test= train_test_split(x, y, test_size= 0.2, random_state=0)
#Feature Scaling of datasets
from sklearn.preprocessing import StandardScaler
st_x= StandardScaler()
x_train= st_x.fit_transform(x_train)
x_test= st_x.transform(x_test)

Encoding Categorical Data

Categorical data is data which has some categories such as, in our dataset; there are
two categorical variable, Country, and Purchased. machine learning model
completely works on mathematics and numbers, but if our dataset would have a
categorical variable, then it may create trouble while building the model. So it is
necessary to encode these categorical variables into numbers.

Feature scaling is the final step of data preprocessing in machine learning. It is a

technique to standardize the independent variables of the dataset in a specific range.
In feature scaling, we put our variables in the same range and in the same scale so that
no any variable dominate the other variable.

Data Wrangling and Preprocessing
100% (1)
Data Wrangling and Preprocessing
41 pages
Unit - II MLT
No ratings yet
Unit - II MLT
75 pages
Data Mining Using Python Lab
100% (1)
Data Mining Using Python Lab
63 pages
ML Lab File
No ratings yet
ML Lab File
48 pages
The Complete Guide To Data Preprocessing
No ratings yet
The Complete Guide To Data Preprocessing
50 pages
Machine Learning Algorithms PDF
100% (1)
Machine Learning Algorithms PDF
148 pages
Data Preprocessing in Machine Learning
No ratings yet
Data Preprocessing in Machine Learning
27 pages
Data Preprocessing For Machine Learning in Python
No ratings yet
Data Preprocessing For Machine Learning in Python
27 pages
Data Mining Lab Manual 2 2
No ratings yet
Data Mining Lab Manual 2 2
63 pages
Building Good Training Sets UNIT 1 PART2
No ratings yet
Building Good Training Sets UNIT 1 PART2
46 pages
How To Prepare Your Dataset For Machine Learning in Python
No ratings yet
How To Prepare Your Dataset For Machine Learning in Python
14 pages
Python Scikit-Learn Cheat Sheet For Machine Learning
No ratings yet
Python Scikit-Learn Cheat Sheet For Machine Learning
3 pages
Data Mining Lab Manual CSE VII Sem
No ratings yet
Data Mining Lab Manual CSE VII Sem
63 pages
Lecture 2 20022025 092902am
No ratings yet
Lecture 2 20022025 092902am
87 pages
Lab Mannual of ML
No ratings yet
Lab Mannual of ML
43 pages
Data Pre-Processing Steps
No ratings yet
Data Pre-Processing Steps
32 pages
ML Journal
No ratings yet
ML Journal
53 pages
Day11 Machine Learning
No ratings yet
Day11 Machine Learning
37 pages
Data Preprocesing JavaPoint
No ratings yet
Data Preprocesing JavaPoint
19 pages
4 Data Preprocessing
No ratings yet
4 Data Preprocessing
27 pages
CSL0777 L09
No ratings yet
CSL0777 L09
29 pages
CSE445 T2b Data Preprocessing
No ratings yet
CSE445 T2b Data Preprocessing
42 pages
Machine Learning Laboratory (BTCS619-18) B.Tech Cse 6Th 2024 EVEN
No ratings yet
Machine Learning Laboratory (BTCS619-18) B.Tech Cse 6Th 2024 EVEN
29 pages
Data Preprocessing Implementation 13112023 061217pm
No ratings yet
Data Preprocessing Implementation 13112023 061217pm
31 pages
Dwdm-Lab Manual
No ratings yet
Dwdm-Lab Manual
39 pages
Import Pandas As PD
No ratings yet
Import Pandas As PD
21 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
Data Pre-Processing With Sklearn Using Standard and Minmax
No ratings yet
Data Pre-Processing With Sklearn Using Standard and Minmax
21 pages
Mini 4
No ratings yet
Mini 4
9 pages
Subject - Machine Learning Group - E27-24 Name
No ratings yet
Subject - Machine Learning Group - E27-24 Name
18 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
ML (Prac1)
No ratings yet
ML (Prac1)
12 pages
Data Preprocessing in Machine Learning
No ratings yet
Data Preprocessing in Machine Learning
24 pages
Dsbda Lab - 1 - 1736243987425
No ratings yet
Dsbda Lab - 1 - 1736243987425
10 pages
Pratique Work 3:data Preprocessing
No ratings yet
Pratique Work 3:data Preprocessing
7 pages
Scikit Hca
No ratings yet
Scikit Hca
8 pages
Data Preprocessing Example Programs1
No ratings yet
Data Preprocessing Example Programs1
9 pages
ML-Lab05-Data Preprocessing Techniques in Python
No ratings yet
ML-Lab05-Data Preprocessing Techniques in Python
7 pages
Kabir Data Preprocessing Python
No ratings yet
Kabir Data Preprocessing Python
14 pages
Data Pre Process I
No ratings yet
Data Pre Process I
6 pages
Lab 08 - Data Preprocessing
No ratings yet
Lab 08 - Data Preprocessing
9 pages
HW2A - Jiarui Han
No ratings yet
HW2A - Jiarui Han
6 pages
Advance Python
No ratings yet
Advance Python
5 pages
Data Preprocessing in Machine Learning
No ratings yet
Data Preprocessing in Machine Learning
4 pages
Data - Preprocessing - Jupyter Notebook
No ratings yet
Data - Preprocessing - Jupyter Notebook
5 pages
Enda Practical 3 Explanation One
No ratings yet
Enda Practical 3 Explanation One
7 pages
Handling Missing Values in A Real-Time Dataset During
No ratings yet
Handling Missing Values in A Real-Time Dataset During
5 pages
Day 4 S3
No ratings yet
Day 4 S3
1 page
1
No ratings yet
1
3 pages
Data Preprocessing in Python
No ratings yet
Data Preprocessing in Python
3 pages
Code Preprocessing
No ratings yet
Code Preprocessing
2 pages
Exp. 1
No ratings yet
Exp. 1
4 pages
Data Pre Processing
No ratings yet
Data Pre Processing
2 pages
Data - Preprocessing - Tools - Ipynb - Colaboratory
No ratings yet
Data - Preprocessing - Tools - Ipynb - Colaboratory
4 pages
Untitled Document
No ratings yet
Untitled Document
2 pages
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
No ratings yet
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
24 pages
Feature Scaling Codes
No ratings yet
Feature Scaling Codes
1 page
Python Machine Learning: Learn how to build powerful Python machine learning algorithms to generate useful data insights with this data analysis tutorial
From Everand
Python Machine Learning: Learn how to build powerful Python machine learning algorithms to generate useful data insights with this data analysis tutorial
Sebastian Raschka
4/5 (20)
Scala Data Analysis Cookbook (new): Navigate the world of data analysis, visualization, and machine learning with over 100 hands-on Scala recipes
From Everand
Scala Data Analysis Cookbook (new): Navigate the world of data analysis, visualization, and machine learning with over 100 hands-on Scala recipes
Arun Manivannan
No ratings yet
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)