0% found this document useful (0 votes)

53 views4 pages

20MIS1025 - DecisionTree - Ipynb - Colaboratory

The document discusses building and visualizing a decision tree model for classification. It loads and preprocesses a dataset, splits it into training and test sets, builds a decision tree classifier, plots the decision regions and tree structure, and exports the tree to a graphic file. Standardization, stratification, and limiting the maximum depth are used in building the model.

Uploaded by

Sandip Das

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

53 views4 pages

20MIS1025 - DecisionTree - Ipynb - Colaboratory

Uploaded by

Sandip Das

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

8/23/23, 11:40 PM 20MIS1025_DecisionTree.

ipynb - Colaboratory

Importing the libraries

from IPython.display import Image
%matplotlib inline

import os
from pathlib import Path
import pandas as pd
df = pd.read_csv("KDD_Train.csv")
df.replace(('normal','anomaly'), (0,1), inplace=True)

import warnings
warnings.filterwarnings('ignore')
import numpy as np

X = df.iloc[:,[4,9]].values
y=df.iloc[:, -1].values

print('Class labels:',np.unique(y))

Class labels: [0 1]

df.isnull().sum().sort_values(ascending=False).head()

duration 0
dst_host_count 0
srv_count 0
serror_rate 0
srv_serror_rate 0
dtype: int64

70% & 30% Splitting into Training & Testing Data

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_state = 1, stratify = y)

print('Labels count in y', np.bincount(y))
print('Labels count in y_train', np.bincount(y_train))
print('Labels count in y_test', np.bincount(y_test))

Labels count in y [67343 58630]

Labels count in y_train [47140 41041]
Labels count in y_test [20203 17589]

Standardizing the features:

from sklearn.preprocessing import StandardScaler                                        #normalisation - converting values in the range 0
                                                                                        #all values are normalised
sc = StandardScaler()                                                                   #mean and standard deviation
sc.fit(X_train)                                                                         #fit against standard scalar                  con
X_train_std = sc.transform(X_train)                                                     #transformation of both training and test data is
X_test_std = sc.transform(X_test)

from matplotlib.colors import ListedColormap
import matplotlib.pyplot as plt

def plot_decision_regions(X, y, classifier, test_idx=None, resolution=0.02):

    # setup marker generator and color map
    markers = ('s', 'x', 'o', '^', 'v')
    colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')
    cmap = ListedColormap(colors[:len(np.unique(y))])

    # plot the decision surface
    x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, resolution),
                           np.arange(x2_min, x2_max, resolution))
    Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T)
    Z = Z.reshape(xx1.shape)
    plt.contourf(xx1, xx2, Z, alpha=0.3, cmap=cmap)
    plt.xlim(xx1.min(), xx1.max())
    plt.ylim(xx2.min(), xx2.max())

https://colab.research.google.com/drive/1FB1tRB0tXqyCLvBpmguU9gQbm0Ki-Plo#scrollTo=paC5OhBLFmoJ&printMode=true 1/4
8/23/23, 11:40 PM 20MIS1025_DecisionTree.ipynb - Colaboratory

    for idx, cl in enumerate(np.unique(y)):
        plt.scatter(x=X[y == cl, 0],
                    y=X[y == cl, 1],
                    alpha=0.8,
                    c=colors[idx],
                    marker=markers[idx],
                    label=cl,
                    edgecolor='black')

    # highlight test examples
    if test_idx:
        # plot all examples
        X_test, y_test = X[test_idx, :], y[test_idx]

        plt.scatter(X_test[:, 0],
                    X_test[:, 1],
                    c='',
                    edgecolor='black',
                    alpha=1.0,
                    linewidth=1,
                    marker='o',
                    s=100,
                    label='test set')

Decision tree learning

Building a decision tree

from sklearn.tree import DecisionTreeClassifier

tree_model = DecisionTreeClassifier(criterion='gini',max_depth=2,random_state=1)
tree_model.fit(X_train, y_train)

X_combined = np.vstack((X_train, X_test))
y_combined = np.hstack((y_train, y_test))
#plot_decision_regions(X_combined, y_combined,classifier=tree_model,test_idx=range(105, 150))

plt.xlabel('petal length [cm]')
plt.ylabel('petal width [cm]')
plt.legend(loc='upper left')
plt.tight_layout()
#plt.savefig('images/03_20.png', dpi=300)
plt.show()

WARNING:matplotlib.legend:No artists with labels found to put in legend. Note that a

https://colab.research.google.com/drive/1FB1tRB0tXqyCLvBpmguU9gQbm0Ki-Plo#scrollTo=paC5OhBLFmoJ&printMode=true 2/4
8/23/23, 11:40 PM 20MIS1025_DecisionTree.ipynb - Colaboratory
from sklearn import tree

tree.plot_tree(tree_model)
#plt.savefig('images/03_21_1.pdf')
plt.show()

!pip3 install pydotplus

Requirement already satisfied: pydotplus in /usr/local/lib/python3.10/dist-packages (2.0.2)

Requirement already satisfied: pyparsing>=2.0.1 in /usr/local/lib/python3.10/dist-packages (from pydotplus) (3.1.1)

!conda install python-graphviz

/bin/bash: line 1: conda: command not found

!pip install graphviz

Requirement already satisfied: graphviz in /usr/local/lib/python3.10/dist-packages (0.20.1)

!pip3 install pydotplus

Requirement already satisfied: pydotplus in /usr/local/lib/python3.10/dist-packages (2.0.2)

Requirement already satisfied: pyparsing>=2.0.1 in /usr/local/lib/python3.10/dist-packages (from pydotplus) (3.1.1)

from pydotplus import graph_from_dot_data
from sklearn.tree import export_graphviz

dot_data = export_graphviz(tree_model,
                           filled=True,
                           rounded=True,
                           class_names=['Setosa',
                                        'Versicolor',
                                        'Virginica'],
                           feature_names=['petal length',
                                          'petal width'],
                           out_file=None)
graph = graph_from_dot_data(dot_data)
graph.write_png('tree.png')

True

https://colab.research.google.com/drive/1FB1tRB0tXqyCLvBpmguU9gQbm0Ki-Plo#scrollTo=paC5OhBLFmoJ&printMode=true 3/4
8/23/23, 11:40 PM 20MIS1025_DecisionTree.ipynb - Colaboratory

check 0s completed at 11:36 PM

https://colab.research.google.com/drive/1FB1tRB0tXqyCLvBpmguU9gQbm0Ki-Plo#scrollTo=paC5OhBLFmoJ&printMode=true 4/4

Grade 07 Second Language Tamil 2nd Term Test Paper 2019 North Western Province
70% (10)
Grade 07 Second Language Tamil 2nd Term Test Paper 2019 North Western Province
4 pages
Mercedes-Benz Greener Manufacturing Ai
0% (1)
Mercedes-Benz Greener Manufacturing Ai
16 pages
PSApp Deployment Toolkit Admin Guide
No ratings yet
PSApp Deployment Toolkit Admin Guide
114 pages
A Project Proposal ON Agriculture Farm Management System: Enrollment No: 19stucmtd01023 Vi Semester, Class of 2019-2022
No ratings yet
A Project Proposal ON Agriculture Farm Management System: Enrollment No: 19stucmtd01023 Vi Semester, Class of 2019-2022
13 pages
ML Assignment 5
No ratings yet
ML Assignment 5
8 pages
Desicion Tree Ipynb
No ratings yet
Desicion Tree Ipynb
6 pages
Code and Output of Cancer Detection Model
No ratings yet
Code and Output of Cancer Detection Model
13 pages
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
Assignment 3
No ratings yet
Assignment 3
3 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
AIML - ECE304 - Assign-2 - Kartikeya - Kandpal - Ajitesh - S.ipynb - Colab
No ratings yet
AIML - ECE304 - Assign-2 - Kartikeya - Kandpal - Ajitesh - S.ipynb - Colab
4 pages
5b Python Implementation of Decision Tree
No ratings yet
5b Python Implementation of Decision Tree
7 pages
5) Randomforest - Ipynb - Colaboratory
No ratings yet
5) Randomforest - Ipynb - Colaboratory
12 pages
Experiment 8
No ratings yet
Experiment 8
14 pages
AIML - ECE304 - Assign-2 - Kartikeya - Kandpal - Ajitesh - S.ipynb - Colab
No ratings yet
AIML - ECE304 - Assign-2 - Kartikeya - Kandpal - Ajitesh - S.ipynb - Colab
3 pages
X y Train - Test - Split Test - Size
No ratings yet
X y Train - Test - Split Test - Size
1 page
Reast Cancer Prediction Using Debt
No ratings yet
Reast Cancer Prediction Using Debt
18 pages
NF Assighment4
No ratings yet
NF Assighment4
5 pages
Assignment 10
No ratings yet
Assignment 10
14 pages
Decision Tree
No ratings yet
Decision Tree
9 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Is Lab Aman Agarwal PDF
No ratings yet
Is Lab Aman Agarwal PDF
8 pages
6 Binary Classifier
No ratings yet
6 Binary Classifier
4 pages
Personalized Cancer Diagnosis
No ratings yet
Personalized Cancer Diagnosis
100 pages
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
100% (1)
Heart: Our "Goal" Predict The Presence of Heart Disease in The Patient
73 pages
Breast Cancer Classification Using DTC
No ratings yet
Breast Cancer Classification Using DTC
1 page
MANUAL
No ratings yet
MANUAL
33 pages
1 KNN - Jupyter Notebook
No ratings yet
1 KNN - Jupyter Notebook
3 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
MLA Lab 6:-Implementation of Decision Tree
No ratings yet
MLA Lab 6:-Implementation of Decision Tree
16 pages
Name: Suprit Darshan Shrestha Reg - no:19BCE2584: Lab DA1 Machine Learning Lab
No ratings yet
Name: Suprit Darshan Shrestha Reg - no:19BCE2584: Lab DA1 Machine Learning Lab
9 pages
Lecture 7.2 - DTC Algorithm Implementation
No ratings yet
Lecture 7.2 - DTC Algorithm Implementation
7 pages
Pca2 1
No ratings yet
Pca2 1
26 pages
Q3-Copy1: Pandas PD Numpy NP CSV
No ratings yet
Q3-Copy1: Pandas PD Numpy NP CSV
7 pages
Experiment 8 ML Vtu
No ratings yet
Experiment 8 ML Vtu
4 pages
AIH Lab2
No ratings yet
AIH Lab2
10 pages
Expt7 ML2025 250306 143857
No ratings yet
Expt7 ML2025 250306 143857
5 pages
Decision Tree Classifier
No ratings yet
Decision Tree Classifier
3 pages
PYHTONPRACT
No ratings yet
PYHTONPRACT
4 pages
Session 2 Machine Learning Execution
No ratings yet
Session 2 Machine Learning Execution
12 pages
Day 39
No ratings yet
Day 39
6 pages
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
No ratings yet
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
25 pages
Cancer Disease Classification
No ratings yet
Cancer Disease Classification
6 pages
Practical 15 Python
No ratings yet
Practical 15 Python
6 pages
17 Ensemble Techniques Problem Statement
No ratings yet
17 Ensemble Techniques Problem Statement
28 pages
MANUAL
No ratings yet
MANUAL
34 pages
What Is Decision Tree?: ISM Implementation of Decision Tree Submitted By: Sagiruddin Akthar 19mcmc28
No ratings yet
What Is Decision Tree?: ISM Implementation of Decision Tree Submitted By: Sagiruddin Akthar 19mcmc28
4 pages
Tensor Flow and Keras Sample Programs
No ratings yet
Tensor Flow and Keras Sample Programs
22 pages
1 10
No ratings yet
1 10
4 pages
ML Batch
No ratings yet
ML Batch
36 pages
Lab - 5 (CB - En.u4ece22115)
No ratings yet
Lab - 5 (CB - En.u4ece22115)
5 pages
Aiml 5-8
No ratings yet
Aiml 5-8
19 pages
Decision Tree Exp 5 DWM
No ratings yet
Decision Tree Exp 5 DWM
2 pages
Ass3 v1
No ratings yet
Ass3 v1
4 pages
ML Codes
No ratings yet
ML Codes
9 pages
LAB-4 Report
No ratings yet
LAB-4 Report
21 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
Exp 3 121a1047 Lavanya Kurup ML
No ratings yet
Exp 3 121a1047 Lavanya Kurup ML
4 pages
ML0101EN Clas SVM Cancer Py v1
No ratings yet
ML0101EN Clas SVM Cancer Py v1
10 pages
Heart Disease Prediction - Colab
No ratings yet
Heart Disease Prediction - Colab
18 pages
Decision - Tree - Regression - Ipynb - Colab
No ratings yet
Decision - Tree - Regression - Ipynb - Colab
3 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Module1 1
No ratings yet
Module1 1
15 pages
Module2 2
No ratings yet
Module2 2
15 pages
Iterative Methods - Unconstrained Optimization
No ratings yet
Iterative Methods - Unconstrained Optimization
6 pages
Cauchy's Steepest Descent Method
No ratings yet
Cauchy's Steepest Descent Method
3 pages
Fletcher Reeves Method
No ratings yet
Fletcher Reeves Method
3 pages
20mis1025 Lab1
No ratings yet
20mis1025 Lab1
3 pages
Hashing
No ratings yet
Hashing
24 pages
Lab Report 3
No ratings yet
Lab Report 3
4 pages
Bigdata-Bigdata (Set 1)
No ratings yet
Bigdata-Bigdata (Set 1)
11 pages
IP Office 9.0.3 Installation and Maintenance
No ratings yet
IP Office 9.0.3 Installation and Maintenance
114 pages
Juniper - SRX5400, SRX5600, SRX5800 Services Gateways Firewalls
No ratings yet
Juniper - SRX5400, SRX5600, SRX5800 Services Gateways Firewalls
14 pages
F XH P2 QN
No ratings yet
F XH P2 QN
9 pages
RPA With UiPath Q&A
No ratings yet
RPA With UiPath Q&A
3 pages
Online Railway Ticket Booking
No ratings yet
Online Railway Ticket Booking
36 pages
AmpliTube 3 User Manual
No ratings yet
AmpliTube 3 User Manual
300 pages
Gsscdeaada Groupshield Security Suite PDF
No ratings yet
Gsscdeaada Groupshield Security Suite PDF
180 pages
An B.tech Iii - I r22-2
No ratings yet
An B.tech Iii - I r22-2
8 pages
VME Fundementals
No ratings yet
VME Fundementals
48 pages
Stack ADT Java
No ratings yet
Stack ADT Java
10 pages
Future of Work Ebook
No ratings yet
Future of Work Ebook
19 pages
Mass Transit
No ratings yet
Mass Transit
12 pages
5.4 CCN2 Conformance Testing
No ratings yet
5.4 CCN2 Conformance Testing
49 pages
Multimedia Databases
100% (1)
Multimedia Databases
14 pages
Primetest Pro Elite Aunz Manual v3
No ratings yet
Primetest Pro Elite Aunz Manual v3
77 pages
Azgaar's Fantasy Map Generator v1.89.04
No ratings yet
Azgaar's Fantasy Map Generator v1.89.04
1 page
02 Performing Calculation On Data
No ratings yet
02 Performing Calculation On Data
5 pages
Model Driven Engineering (MDE) : ITC-708 by Dr. Mir Sajjad Hussain Talpur Dated: 08-2-2021
50% (2)
Model Driven Engineering (MDE) : ITC-708 by Dr. Mir Sajjad Hussain Talpur Dated: 08-2-2021
17 pages
NoSQL Databases Critical Analysis and Comparison
No ratings yet
NoSQL Databases Critical Analysis and Comparison
7 pages
8 - Pantum5103MFP Series Service Manual-20171205
No ratings yet
8 - Pantum5103MFP Series Service Manual-20171205
88 pages
New PT Study Finds That Dell EMC PowerStore 7000 Series Arrays Outperformed The HPE Primera A670 in Data Reduction, Performance, Out Of-The-Box VM Deployment and More
No ratings yet
New PT Study Finds That Dell EMC PowerStore 7000 Series Arrays Outperformed The HPE Primera A670 in Data Reduction, Performance, Out Of-The-Box VM Deployment and More
2 pages
ExoneratingMorocco DisprovingTheSpyware
No ratings yet
ExoneratingMorocco DisprovingTheSpyware
27 pages
UiPath RPAv1
No ratings yet
UiPath RPAv1
4 pages
Chap 2 Cloud Architecture
No ratings yet
Chap 2 Cloud Architecture
17 pages

20MIS1025 - DecisionTree - Ipynb - Colaboratory

Uploaded by

20MIS1025 - DecisionTree - Ipynb - Colaboratory

Uploaded by

8/23/23, 11:40 PM 20MIS1025_DecisionTree.

Importing the libraries

70% & 30% Splitting into Training & Testing Data

Labels count in y [67343 58630]

Standardizing the features:

Decision tree learning

Building a decision tree

WARNING:matplotlib.legend:No artists with labels found to put in legend. Note that a

Requirement already satisfied: pydotplus in /usr/local/lib/python3.10/dist-packages (2.0.2)

/bin/bash: line 1: conda: command not found

Requirement already satisfied: graphviz in /usr/local/lib/python3.10/dist-packages (0.20.1)

Requirement already satisfied: pydotplus in /usr/local/lib/python3.10/dist-packages (2.0.2)

check 0s completed at 11:36 PM

You might also like

check 0s completed at 11:36 PM