0% found this document useful (0 votes)

9 views3 pages

Python Experiment

The document outlines a Python script for analyzing the Titanic dataset using machine learning techniques. It includes data preprocessing steps such as handling missing values and encoding categorical features, followed by training and evaluating three models: Naive Bayes, Decision Tree, and K-Nearest Neighbors. The accuracies of the models are reported, with Decision Tree achieving the highest accuracy of 0.804.

Uploaded by

Shubham Maurya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views3 pages

Python Experiment

Uploaded by

Shubham Maurya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

pip install pandas numpy scikit-learn matplotlib seaborn

import pandas as pd

import seaborn as sns

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import LabelEncoder

# Load Titanic dataset from seaborn

df = sns.load_dataset('titanic')

# Drop columns with too many missing values or irrelevant

df.drop(['deck', 'embark_town', 'alive', 'class', 'who', 'adult_male'], axis=1, inplace=True)

# Fill missing values

df['age'].fillna(df['age'].median(), inplace=True)

df['embarked'].fillna(df['embarked'].mode()[0], inplace=True)

# Encode categorical features

label_enc = LabelEncoder()

df['sex'] = label_enc.fit_transform(df['sex'])

df['embarked'] = label_enc.fit_transform(df['embarked'])

# Define features and target

X = df.drop('survived', axis=1)

y = df['survived']

# Train-test split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

from sklearn.naive_bayes import GaussianNB

from sklearn.metrics import accuracy_score, classification_report

# Naive Bayes

nb_model = GaussianNB()

nb_model.fit(X_train, y_train)

nb_preds = nb_model.predict(X_test)

print("Naive Bayes Accuracy:", accuracy_score(y_test, nb_preds))

print("Naive Bayes Report:\n", classification_report(y_test, nb_preds))

from sklearn.tree import DecisionTreeClassifier

# J48 equivalent - Decision Tree

j48_model = DecisionTreeClassifier(random_state=42)

j48_model.fit(X_train, y_train)

j48_preds = j48_model.predict(X_test)

print("J48 Accuracy:", accuracy_score(y_test, j48_preds))

print("J48 Report:\n", classification_report(y_test, j48_preds))

from sklearn.neighbors import KNeighborsClassifier

# KNN Classifier

knn_model = KNeighborsClassifier(n_neighbors=5)
knn_model.fit(X_train, y_train)

knn_preds = knn_model.predict(X_test)

print("KNN Accuracy:", accuracy_score(y_test, knn_preds))

print("KNN Report:\n", classification_report(y_test, knn_preds))

print("Summary of Accuracies:")

print("Naive Bayes:", accuracy_score(y_test, nb_preds))

print("J48 Decision Tree:", accuracy_score(y_test, j48_preds))

print("KNN:", accuracy_score(y_test, knn_preds))

Naive Bayes Accuracy: 0.765

J48 Accuracy: 0.804

KNN Accuracy: 0.787

Program 7
No ratings yet
Program 7
2 pages
Naive Baye
No ratings yet
Naive Baye
1 page
LOGISTIC REGRESSION (Using Python)
No ratings yet
LOGISTIC REGRESSION (Using Python)
1 page
ML 12 RandomForest
No ratings yet
ML 12 RandomForest
1 page
Assignment 2
No ratings yet
Assignment 2
2 pages
SVM (Using Python)
No ratings yet
SVM (Using Python)
1 page
Titanic PuneethRegonda
No ratings yet
Titanic PuneethRegonda
8 pages
ML - Other Pracs
No ratings yet
ML - Other Pracs
7 pages
Maneesha Nidigonda Minor Project .Ipynb
No ratings yet
Maneesha Nidigonda Minor Project .Ipynb
35 pages
Titanic ML Kaggle
No ratings yet
Titanic ML Kaggle
3 pages
Assignment ML
No ratings yet
Assignment ML
4 pages
Program 8
No ratings yet
Program 8
2 pages
Assignment 2
No ratings yet
Assignment 2
10 pages
Iml Project
No ratings yet
Iml Project
13 pages
01-Logistic Regression With Python
No ratings yet
01-Logistic Regression With Python
12 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
Ds 9
No ratings yet
Ds 9
12 pages
Lab 3
No ratings yet
Lab 3
7 pages
TITANIC EJERCICIO - Ipynb - Colab
No ratings yet
TITANIC EJERCICIO - Ipynb - Colab
3 pages
Assaignment-2-2
No ratings yet
Assaignment-2-2
7 pages
Titanic Survival Prediction
No ratings yet
Titanic Survival Prediction
5 pages
Titanic
No ratings yet
Titanic
6 pages
Titanic Survival Prediction
No ratings yet
Titanic Survival Prediction
14 pages
Logistic Regresion
No ratings yet
Logistic Regresion
1 page
Data Pre Processing
No ratings yet
Data Pre Processing
2 pages
Titanic Survival
No ratings yet
Titanic Survival
13 pages
Titanic Survival Prediction Using Machine Learning
No ratings yet
Titanic Survival Prediction Using Machine Learning
7 pages
Titanic Survival Prediction Report
No ratings yet
Titanic Survival Prediction Report
4 pages
9914_ML_Lab3
No ratings yet
9914_ML_Lab3
6 pages
Data Acquisition and Cleansing Program - Colab
No ratings yet
Data Acquisition and Cleansing Program - Colab
5 pages
Home Work
No ratings yet
Home Work
12 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Titanic Dataset Model Prediction
No ratings yet
Titanic Dataset Model Prediction
11 pages
Pandas Day 4
No ratings yet
Pandas Day 4
7 pages
Logistic Regression On Titanic Dataset
No ratings yet
Logistic Regression On Titanic Dataset
6 pages
Naive Bayes Classification
No ratings yet
Naive Bayes Classification
8 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
Titanic Survival Prediction Using Machine Learning
No ratings yet
Titanic Survival Prediction Using Machine Learning
34 pages
Titanic
No ratings yet
Titanic
3 pages
Titanic
No ratings yet
Titanic
3 pages
Project
No ratings yet
Project
7 pages
Ansh JD - W6
No ratings yet
Ansh JD - W6
6 pages
4.1.3.5 Lab - Decision Tree Classification
No ratings yet
4.1.3.5 Lab - Decision Tree Classification
11 pages
The Titanic Dataset
No ratings yet
The Titanic Dataset
6 pages
P 7
No ratings yet
P 7
5 pages
LP3 - ML Mini-Project Report Format Shreeyas
No ratings yet
LP3 - ML Mini-Project Report Format Shreeyas
13 pages
20BCE1779 - Web Mining - Lab-5
No ratings yet
20BCE1779 - Web Mining - Lab-5
8 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Project Report
No ratings yet
Project Report
7 pages
untitled26-1
No ratings yet
untitled26-1
15 pages
ML 3
No ratings yet
ML 3
9 pages
LamTang TitanicMachineLearningFromDisaster
No ratings yet
LamTang TitanicMachineLearningFromDisaster
5 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
Machine Learning Lab Assignment 1
No ratings yet
Machine Learning Lab Assignment 1
23 pages
M1 - 4Mlsp - Machine Learning: Project: Binary Classification Webapp
No ratings yet
M1 - 4Mlsp - Machine Learning: Project: Binary Classification Webapp
2 pages
Ahamed 123
100% (1)
Ahamed 123
7 pages
Machine Learning With Titanic Dataset Tutorial
No ratings yet
Machine Learning With Titanic Dataset Tutorial
7 pages
Machine Learning With Python (Vasavi)
No ratings yet
Machine Learning With Python (Vasavi)
20 pages
Thesis Slide
No ratings yet
Thesis Slide
24 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

Python Experiment

Uploaded by

Python Experiment

Uploaded by

pip install pandas numpy scikit-learn matplotlib seaborn

import seaborn as sns

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import LabelEncoder

# Load Titanic dataset from seaborn

# Drop columns with too many missing values or irrelevant

df.drop(['deck', 'embark_town', 'alive', 'class', 'who', 'adult_male'], axis=1, inplace=True)

# Fill missing values

# Encode categorical features

# Define features and target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

from sklearn.metrics import accuracy_score, classification_report

print("Naive Bayes Accuracy:", accuracy_score(y_test, nb_preds))

print("Naive Bayes Report:\n", classification_report(y_test, nb_preds))

from sklearn.tree import DecisionTreeClassifier

# J48 equivalent - Decision Tree

print("J48 Accuracy:", accuracy_score(y_test, j48_preds))

print("J48 Report:\n", classification_report(y_test, j48_preds))

from sklearn.neighbors import KNeighborsClassifier

print("KNN Accuracy:", accuracy_score(y_test, knn_preds))

print("KNN Report:\n", classification_report(y_test, knn_preds))

print("Naive Bayes:", accuracy_score(y_test, nb_preds))

print("J48 Decision Tree:", accuracy_score(y_test, j48_preds))

print("KNN:", accuracy_score(y_test, knn_preds))

Naive Bayes Accuracy: 0.765

J48 Accuracy: 0.804

KNN Accuracy: 0.787

You might also like