0% found this document useful (0 votes)

3 views

Program 7

The document outlines a Python script that uses a Decision Tree Classifier to analyze the Titanic dataset. It includes data preprocessing steps, model training, and evaluation metrics such as accuracy, precision, recall, and F1 score. The model achieved an accuracy of approximately 70.63% on the test data.

Uploaded by

prathibhard3

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views

Program 7

Uploaded by

prathibhard3

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

5/21/25, 8:25 AM Untitled3.

ipynb - Colab

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, export_graphviz
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, classification_report
from sklearn.preprocessing import LabelEncoder
import matplotlib.pyplot as plt
import seaborn as sns
import graphviz
from sklearn import tree

# 1. Load the Titanic dataset

titanic = sns.load_dataset('titanic') # Using seaborn's built-in Titanic dataset

# 2. Data Preprocessing
# Drop rows with missing 'embarked' and 'age'
titanic.dropna(subset=['embarked', 'age'], inplace=True)

# Select features and target

features = ['pclass', 'sex', 'age', 'sibsp', 'parch', 'fare', 'embarked']
target = 'survived'

# Convert categorical features to numeric

titanic_encoded = titanic[features + [target]].copy()
label_encoders = {}
for col in ['sex', 'embarked']:
le = LabelEncoder()
titanic_encoded[col] = le.fit_transform(titanic_encoded[col])
label_encoders[col] = le

# 3. Split data
X = titanic_encoded[features]
y = titanic_encoded[target]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 4. Train Decision Tree Classifier

clf = DecisionTreeClassifier(max_depth=4, random_state=42)
clf.fit(X_train, y_train)

# 5. Visualize the tree

plt.figure(figsize=(20,10))
tree.plot_tree(clf, feature_names=features, class_names=['Not Survived', 'Survived'], filled=True)
plt.title("Decision Tree - Titanic")
plt.show()

# 6. Evaluate Model
y_pred = clf.predict(X_test)

print("Accuracy:", accuracy_score(y_test, y_pred))

print("Precision:", precision_score(y_test, y_pred))
print("Recall:", recall_score(y_test, y_pred))
print("F1 Score:", f1_score(y_test, y_pred))

# Optional: Full classification report

print("\nClassification Report:\n", classification_report(y_test, y_pred))

https://colab.research.google.com/drive/11aop6X8rTQXtPe51CPHghl8h9p9KWWKE#printMode=true 1/2
5/21/25, 8:25 AM Untitled3.ipynb - Colab

Accuracy: 0.7062937062937062
Precision: 0.723404255319149
Recall: 0.5396825396825397
F1 Score: 0.6181818181818182

Classification Report:
precision recall f1-score support

0 0.70 0.84 0.76 80

1 0.72 0.54 0.62 63

accuracy 0.71 143

macro avg 0.71 0.69 0.69 143
weighted avg 0.71 0.71 0.70 143

https://colab.research.google.com/drive/11aop6X8rTQXtPe51CPHghl8h9p9KWWKE#printMode=true 2/2

DFo Section 1 Quiz
No ratings yet
DFo Section 1 Quiz
11 pages
Bugs in HFM 11
No ratings yet
Bugs in HFM 11
30 pages
Program 8
No ratings yet
Program 8
2 pages
ML 12 RandomForest
No ratings yet
ML 12 RandomForest
1 page
assignment2
No ratings yet
assignment2
2 pages
LOGISTIC REGRESSION (Using Python)
No ratings yet
LOGISTIC REGRESSION (Using Python)
1 page
decision tree
No ratings yet
decision tree
2 pages
4.1.3.5 Lab - Decision Tree Classification
No ratings yet
4.1.3.5 Lab - Decision Tree Classification
11 pages
Naive Baye
No ratings yet
Naive Baye
1 page
assignment ml
No ratings yet
assignment ml
4 pages
SVM (Using Python)
No ratings yet
SVM (Using Python)
1 page
Maneesha Nidigonda Minor Project .Ipynb
No ratings yet
Maneesha Nidigonda Minor Project .Ipynb
35 pages
iml project (1) (1)
No ratings yet
iml project (1) (1)
13 pages
Titanic ML Kaggle
No ratings yet
Titanic ML Kaggle
3 pages
01-Logistic Regression With Python
No ratings yet
01-Logistic Regression With Python
12 pages
1-10
No ratings yet
1-10
4 pages
LogisticRegresion
No ratings yet
LogisticRegresion
1 page
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
ds9
No ratings yet
ds9
12 pages
TITANIC EJERCICIO - Ipynb - Colab
No ratings yet
TITANIC EJERCICIO - Ipynb - Colab
3 pages
ex 6b
No ratings yet
ex 6b
3 pages
Titanic (4)
No ratings yet
Titanic (4)
3 pages
Titanic (5)
No ratings yet
Titanic (5)
3 pages
Home Work
No ratings yet
Home Work
12 pages
ML 3
No ratings yet
ML 3
9 pages
Titanic Survival Prediction
No ratings yet
Titanic Survival Prediction
14 pages
Logistic Regression On Titanic Dataset
No ratings yet
Logistic Regression On Titanic Dataset
6 pages
23BCE7092_ML_Lab_Assignment[1]
No ratings yet
23BCE7092_ML_Lab_Assignment[1]
14 pages
23BCE7199 ML Lab Assignment[1]
No ratings yet
23BCE7199 ML Lab Assignment[1]
15 pages
Pandas Day 4
No ratings yet
Pandas Day 4
7 pages
Data Pre Processing
No ratings yet
Data Pre Processing
2 pages
AAM 6th Prac
No ratings yet
AAM 6th Prac
3 pages
project
No ratings yet
project
7 pages
Laporan Titanic Survival Prediction - 132021012
No ratings yet
Laporan Titanic Survival Prediction - 132021012
6 pages
The Titanic dataset
No ratings yet
The Titanic dataset
6 pages
Titanic EDA
No ratings yet
Titanic EDA
6 pages
Titanic Data Analysis
No ratings yet
Titanic Data Analysis
14 pages
Thesis Slide
No ratings yet
Thesis Slide
24 pages
DSBDA9
No ratings yet
DSBDA9
7 pages
Titanic Prediction
No ratings yet
Titanic Prediction
53 pages
Titanic Dataset Model Prediction
No ratings yet
Titanic Dataset Model Prediction
11 pages
LamTang TitanicMachineLearningFromDisaster
No ratings yet
LamTang TitanicMachineLearningFromDisaster
5 pages
Titanic Survival
No ratings yet
Titanic Survival
13 pages
Assignment 2
No ratings yet
Assignment 2
10 pages
Rouse Final
No ratings yet
Rouse Final
8 pages
Ahamed 123
100% (1)
Ahamed 123
7 pages
Random Forest/Roc&Auc - Hyperparamer Tuning With For Loop - TITANIC DB
No ratings yet
Random Forest/Roc&Auc - Hyperparamer Tuning With For Loop - TITANIC DB
17 pages
Random Forest Algorithm - Titanic Dataset
No ratings yet
Random Forest Algorithm - Titanic Dataset
12 pages
1
No ratings yet
1
13 pages
ML Assignment
No ratings yet
ML Assignment
34 pages
dsbda-9
No ratings yet
dsbda-9
7 pages
Titanic Survival Prediction Using Machine Learning
No ratings yet
Titanic Survival Prediction Using Machine Learning
7 pages
assignment
No ratings yet
assignment
14 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Lab 5.Ipynb - Colab
No ratings yet
Lab 5.Ipynb - Colab
6 pages
Machine Learning Notebook
No ratings yet
Machine Learning Notebook
19 pages
DSBDA_LA_8
No ratings yet
DSBDA_LA_8
8 pages
Practical No 01
No ratings yet
Practical No 01
9 pages
Titanic
100% (2)
Titanic
13 pages
ML File 211173
No ratings yet
ML File 211173
19 pages
Titanic Survival Prediction Ml
No ratings yet
Titanic Survival Prediction Ml
36 pages
Advanced Multiplayer Game Development with Ureal Engine 5: A Comprehensive Guide to C++ Scripting
From Everand
Advanced Multiplayer Game Development with Ureal Engine 5: A Comprehensive Guide to C++ Scripting
Vladimir Kiselev
No ratings yet
Voting Management System: 1.0 Brief Introduction
No ratings yet
Voting Management System: 1.0 Brief Introduction
19 pages
BDA Unlocked
100% (1)
BDA Unlocked
69 pages
HZ Table Details
No ratings yet
HZ Table Details
126 pages
DSA - Quiz (Additional) (Page 3 of 4)
No ratings yet
DSA - Quiz (Additional) (Page 3 of 4)
5 pages
8350 A3 Data Cube 012611
No ratings yet
8350 A3 Data Cube 012611
2 pages
ISM Normalization Topic
No ratings yet
ISM Normalization Topic
5 pages
Introduction To Data Driven Decision Making
No ratings yet
Introduction To Data Driven Decision Making
31 pages
Entity-Relationship Modelling (IEEE)
No ratings yet
Entity-Relationship Modelling (IEEE)
6 pages
VCDATABASE
No ratings yet
VCDATABASE
1,023 pages
AIX - LVM Cheatsheet
No ratings yet
AIX - LVM Cheatsheet
4 pages
sqf6 Clickhouse Guide Sample
No ratings yet
sqf6 Clickhouse Guide Sample
14 pages
Big Data: Data Science & Advanced Analytics
No ratings yet
Big Data: Data Science & Advanced Analytics
42 pages
Ms SQL Server Always On Io Reliability Storage System On Hitachi VSP
No ratings yet
Ms SQL Server Always On Io Reliability Storage System On Hitachi VSP
25 pages
PHD CSE Seminar in Course Work
0% (1)
PHD CSE Seminar in Course Work
17 pages
RDBMS PR 15
No ratings yet
RDBMS PR 15
5 pages
Power BI For Finance - The Crash - Bisette, Vincent
100% (1)
Power BI For Finance - The Crash - Bisette, Vincent
224 pages
12 Tries
No ratings yet
12 Tries
10 pages
01 ETL Concepts
No ratings yet
01 ETL Concepts
10 pages
Unapplied Reciepts
No ratings yet
Unapplied Reciepts
2 pages
RHCSA
50% (2)
RHCSA
10 pages
Data Mining and Data Warehouse: Qis College of Engineering & Technology Ongole
No ratings yet
Data Mining and Data Warehouse: Qis College of Engineering & Technology Ongole
10 pages
DBMS Syllabus R23
No ratings yet
DBMS Syllabus R23
2 pages
How To Use Parameterized Query in Excel Using Column As Parameter - Stack Overflow
No ratings yet
How To Use Parameterized Query in Excel Using Column As Parameter - Stack Overflow
5 pages
Agent Mining
No ratings yet
Agent Mining
2 pages
Data Base Management System Lab Manual
No ratings yet
Data Base Management System Lab Manual
34 pages
LeetCode SQL Problems
No ratings yet
LeetCode SQL Problems
10 pages
Dbms Ques & Ans-7
No ratings yet
Dbms Ques & Ans-7
17 pages
Ugi Eam MDG Masterupgradeguide 730-Sp01 s4 Hana
No ratings yet
Ugi Eam MDG Masterupgradeguide 730-Sp01 s4 Hana
12 pages

Program 7

Uploaded by

Program 7

Uploaded by

5/21/25, 8:25 AM Untitled3.

# 1. Load the Titanic dataset

# Select features and target

# Convert categorical features to numeric

# 4. Train Decision Tree Classifier

# 5. Visualize the tree

print("Accuracy:", accuracy_score(y_test, y_pred))

# Optional: Full classification report

0 0.70 0.84 0.76 80

accuracy 0.71 143

You might also like