0% found this document useful (0 votes)

8 views7 pages

Lab 3

This document uses a Naive Bayes classifier model to predict survival on the Titanic using passenger data. It loads and cleans a dataset, explores the data, encodes categorical variables, splits data into training and test sets, and fits a Gaussian Naive Bayes model to make predictions.

Uploaded by

alishacalista238

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views7 pages

Lab 3

Uploaded by

alishacalista238

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

titanic-naive-bayes-1

April 21, 2024

[ ]: import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split

[ ]: df = pd.read_csv('/content/train.csv')
df

[ ]: PassengerId Survived Pclass \

0 1 0 3
1 2 1 1
2 3 1 3
3 4 1 1
4 5 0 3
.. … … …
886 887 0 2
887 888 1 1
888 889 0 3
889 890 1 1
890 891 0 3

Name Sex Age SibSp \

0 Braund, Mr. Owen Harris male 22.0 1
1 Cumings, Mrs. John Bradley (Florence Briggs Th… female 38.0 1
2 Heikkinen, Miss. Laina female 26.0 0
3 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1
4 Allen, Mr. William Henry male 35.0 0
.. … … … …
886 Montvila, Rev. Juozas male 27.0 0
887 Graham, Miss. Margaret Edith female 19.0 0
888 Johnston, Miss. Catherine Helen "Carrie" female NaN 1
889 Behr, Mr. Karl Howell male 26.0 0
890 Dooley, Mr. Patrick male 32.0 0

Parch Ticket Fare Cabin Embarked

1
0 0 A/5 21171 7.2500 NaN S
1 0 PC 17599 71.2833 C85 C
2 0 STON/O2. 3101282 7.9250 NaN S
3 0 113803 53.1000 C123 S
4 0 373450 8.0500 NaN S
.. … … … … …
886 0 211536 13.0000 NaN S
887 0 112053 30.0000 B42 S
888 2 W./C. 6607 23.4500 NaN S
889 0 111369 30.0000 C148 C
890 0 370376 7.7500 NaN Q

[891 rows x 12 columns]

[ ]: df.shape

[ ]: (891, 12)

[ ]: df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 PassengerId 891 non-null int64
1 Survived 891 non-null int64
2 Pclass 891 non-null int64
3 Name 891 non-null object
4 Sex 891 non-null object
5 Age 714 non-null float64
6 SibSp 891 non-null int64
7 Parch 891 non-null int64
8 Ticket 891 non-null object
9 Fare 891 non-null float64
10 Cabin 204 non-null object
11 Embarked 889 non-null object
dtypes: float64(2), int64(5), object(5)
memory usage: 83.7+ KB

[ ]: df.describe(include='all')

[ ]: PassengerId Survived Pclass Name Sex \

count 891.000000 891.000000 891.000000 891 891
unique NaN NaN NaN 891 2
top NaN NaN NaN Braund, Mr. Owen Harris male
freq NaN NaN NaN 1 577

2
mean 446.000000 0.383838 2.308642 NaN NaN
std 257.353842 0.486592 0.836071 NaN NaN
min 1.000000 0.000000 1.000000 NaN NaN
25% 223.500000 0.000000 2.000000 NaN NaN
50% 446.000000 0.000000 3.000000 NaN NaN
75% 668.500000 1.000000 3.000000 NaN NaN
max 891.000000 1.000000 3.000000 NaN NaN

Age SibSp Parch Ticket Fare Cabin \

count 714.000000 891.000000 891.000000 891 891.000000 204
unique NaN NaN NaN 681 NaN 147
top NaN NaN NaN 347082 NaN B96 B98
freq NaN NaN NaN 7 NaN 4
mean 29.699118 0.523008 0.381594 NaN 32.204208 NaN
std 14.526497 1.102743 0.806057 NaN 49.693429 NaN
min 0.420000 0.000000 0.000000 NaN 0.000000 NaN
25% 20.125000 0.000000 0.000000 NaN 7.910400 NaN
50% 28.000000 0.000000 0.000000 NaN 14.454200 NaN
75% 38.000000 1.000000 0.000000 NaN 31.000000 NaN
max 80.000000 8.000000 6.000000 NaN 512.329200 NaN

Embarked
count 889
unique 3
top S
freq 644
mean NaN
std NaN
min NaN
25% NaN
50% NaN
75% NaN
max NaN

[ ]: df.dtypes

[ ]: PassengerId int64
Survived int64
Pclass int64
Name object
Sex object
Age float64
SibSp int64
Parch int64
Ticket object
Fare float64
Cabin object

3
Embarked object
dtype: object

[ ]: df.duplicated().sum()

[ ]: 0

[ ]: df.drop(["Sex","Name","Ticket","Cabin"], axis=1, inplace=True)

[ ]: PassengerId Survived Pclass Age SibSp Parch Fare Embarked

0 1 0 3 22.0 1 0 7.2500 S
1 2 1 1 38.0 1 0 71.2833 C
2 3 1 3 26.0 0 0 7.9250 S
3 4 1 1 35.0 1 0 53.1000 S
4 5 0 3 35.0 0 0 8.0500 S
.. … … … … … … … …
886 887 0 2 27.0 0 0 13.0000 S
887 888 1 1 19.0 0 0 30.0000 S
888 889 0 3 NaN 1 2 23.4500 S
889 890 1 1 26.0 0 0 30.0000 C
890 891 0 3 32.0 0 0 7.7500 Q

[891 rows x 8 columns]

[ ]: df.isnull().sum()

[ ]: PassengerId 0
Survived 0
Pclass 0
Age 177
SibSp 0
Parch 0
Fare 0
Embarked 2
dtype: int64

[ ]: df['Age'].fillna(df['Age'].mean(), inplace=True)

[ ]: df.dropna(inplace=True)

[ ]: df.isnull().sum()

[ ]: PassengerId 0
Survived 0
Pclass 0
Age 0

4
SibSp 0
Parch 0
Fare 0
Embarked 0
dtype: int64

[ ]: Q1=np.percentile(df['Age'], 25)
Q2=np.percentile(df['Age'], 50)
Q3=np.percentile(df['Age'], 75)

[ ]: IQR=Q3-Q1

[ ]: min=Q1-1.5*IQR
max=Q3+1.5*IQR

[ ]: df['Age'] = df['Age'].clip(min,max)
sns.boxplot(x=df['Age'])
plt.show()

[ ]: df=pd.get_dummies(df,columns=['Embarked'],dtype=int)

5
[ ]: x=df.drop(columns=['Survived'])
x

[ ]: PassengerId Pclass Age SibSp Parch Fare Embarked_C \

0 1 3 22.000000 1 0 7.2500 0
1 2 1 38.000000 1 0 71.2833 1
2 3 3 26.000000 0 0 7.9250 0
3 4 1 35.000000 1 0 53.1000 0
4 5 3 35.000000 0 0 8.0500 0
.. … … … … … … …
886 887 2 27.000000 0 0 13.0000 0
887 888 1 19.000000 0 0 30.0000 0
888 889 3 29.699118 1 2 23.4500 0
889 890 1 26.000000 0 0 30.0000 1
890 891 3 32.000000 0 0 7.7500 0

Embarked_Q Embarked_S
0 0 1
1 0 0
2 0 1
3 0 1
4 0 1
.. … …
886 0 1
887 0 1
888 0 1
889 0 0
890 1 0

[889 rows x 9 columns]

[ ]: y=df['Survived']
y

[ ]: 0 0
1 1
2 1
3 1
4 0
..
886 0
887 1
888 0
889 1
890 0
Name: Survived, Length: 889, dtype: int64

6
[ ]: x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.
↪2,random_state=42)

[ ]: print("Training set shape:", x_train.shape, y_train.shape)

Training set shape: (711, 9) (711,)

[ ]: print("Testing set shape:", x_test.shape, y_test.shape)

Testing set shape: (178, 9) (178,)

[ ]: model=GaussianNB()

[ ]: model.fit(x_train,y_train)

[ ]: GaussianNB()

[ ]: y_pred=model.predict(x_test)
y_pred

[ ]: array([0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1,
0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0,
0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0,
0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0,
0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0,
0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 0,
1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0,
0, 0])

[ ]: from sklearn.metrics import accuracy_score

accuracy = accuracy_score(y_test, y_pred)

print("Accuracy:", accuracy)

Accuracy: 0.6348314606741573

[ ]:

Strategic Management - Gucci Case Analysis 1
83% (6)
Strategic Management - Gucci Case Analysis 1
18 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
Naive Baye
No ratings yet
Naive Baye
1 page
9.program Naive Bayes
No ratings yet
9.program Naive Bayes
9 pages
Naive Bayes Classifier Csv
No ratings yet
Naive Bayes Classifier Csv
2 pages
Naive Bayes Classification
No ratings yet
Naive Bayes Classification
8 pages
Purva Rawale - BDA Practical No 2
No ratings yet
Purva Rawale - BDA Practical No 2
9 pages
Example - 1
No ratings yet
Example - 1
5 pages
Name: Mussab Bin Shahid Sap-Id: 2024 Assignment: Machine-Learning
No ratings yet
Name: Mussab Bin Shahid Sap-Id: 2024 Assignment: Machine-Learning
5 pages
Assignment 2
No ratings yet
Assignment 2
10 pages
ML Lab PT
No ratings yet
ML Lab PT
25 pages
Naïve Bayes Classifier Algorithm
No ratings yet
Naïve Bayes Classifier Algorithm
11 pages
Exp 3 Bi 30
No ratings yet
Exp 3 Bi 30
7 pages
P03 BayesianLearning SolutionNotes
No ratings yet
P03 BayesianLearning SolutionNotes
4 pages
Practical No 01
No ratings yet
Practical No 01
9 pages
Naive Bayes Algorithm With Classification Example 1697128543
No ratings yet
Naive Bayes Algorithm With Classification Example 1697128543
16 pages
Titanic Survival Prediction
No ratings yet
Titanic Survival Prediction
5 pages
Titanic
No ratings yet
Titanic
6 pages
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
1
No ratings yet
1
13 pages
Assignment - 01
No ratings yet
Assignment - 01
4 pages
Practical 3
No ratings yet
Practical 3
11 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
33NaiveBayesOn Iris
No ratings yet
33NaiveBayesOn Iris
1 page
Prog 6
No ratings yet
Prog 6
3 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Unit 2 AAM
No ratings yet
Unit 2 AAM
32 pages
Naive Bayes
No ratings yet
Naive Bayes
11 pages
Home Work
No ratings yet
Home Work
12 pages
All in One
No ratings yet
All in One
13 pages
ML - Other Pracs
No ratings yet
ML - Other Pracs
7 pages
Titanic Survival
No ratings yet
Titanic Survival
13 pages
Logistic Regression On Titanic Dataset
No ratings yet
Logistic Regression On Titanic Dataset
6 pages
Python Experiment
No ratings yet
Python Experiment
3 pages
07 - Bayesian Learning
No ratings yet
07 - Bayesian Learning
55 pages
9914_ML_Lab3
No ratings yet
9914_ML_Lab3
6 pages
Naive Bayes Project
No ratings yet
Naive Bayes Project
5 pages
ML Practical Lovepreet 6-10
No ratings yet
ML Practical Lovepreet 6-10
10 pages
ML Practical Kiranjot 6-10
No ratings yet
ML Practical Kiranjot 6-10
10 pages
Exp 3 Bi
No ratings yet
Exp 3 Bi
12 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
07 Naive - Bayes
No ratings yet
07 Naive - Bayes
7 pages
ML File 211173
No ratings yet
ML File 211173
19 pages
Naive Bayes Numericals
No ratings yet
Naive Bayes Numericals
9 pages
Mnbnmnbnnmbbhhuyrgh
No ratings yet
Mnbnmnbnnmbbhhuyrgh
3 pages
ML Lab Mannual
No ratings yet
ML Lab Mannual
29 pages
Ame: Waqar Ali
No ratings yet
Ame: Waqar Ali
22 pages
Naive Bayes Classifier in Machine Learning
No ratings yet
Naive Bayes Classifier in Machine Learning
16 pages
P03 BayesianLearning
No ratings yet
P03 BayesianLearning
2 pages
Bacdeaf 23032025 115708 Split 1
No ratings yet
Bacdeaf 23032025 115708 Split 1
37 pages
ML Lab
No ratings yet
ML Lab
7 pages
Machine Learning Notebook
No ratings yet
Machine Learning Notebook
19 pages
KNN Practical Debasmita Datta
No ratings yet
KNN Practical Debasmita Datta
6 pages
Naive Bayes Classifier in Machine Learning - Javatpoint
No ratings yet
Naive Bayes Classifier in Machine Learning - Javatpoint
19 pages
8&9 Assignment ADS
No ratings yet
8&9 Assignment ADS
20 pages
ML Practical Kunal 6-10
No ratings yet
ML Practical Kunal 6-10
10 pages
Perform the Data Classification Using SVM Classifier_BI Prac 1
No ratings yet
Perform the Data Classification Using SVM Classifier_BI Prac 1
8 pages
Machine Learning With Titanic Dataset Tutorial
No ratings yet
Machine Learning With Titanic Dataset Tutorial
7 pages
Titanic Survival Prediction Using Machine Learning
No ratings yet
Titanic Survival Prediction Using Machine Learning
7 pages
Titanic Dataset Model Prediction
No ratings yet
Titanic Dataset Model Prediction
11 pages
150 Favorite Crochet Designs
From Everand
150 Favorite Crochet Designs
Mary Carolyn Waldrep
3.5/5 (10)
Fps Monitor
No ratings yet
Fps Monitor
3 pages
Color Organs
No ratings yet
Color Organs
10 pages
نشاط انجليزي
No ratings yet
نشاط انجليزي
18 pages
FT4 Rapid Quantitative Test COA - F25916401AD
No ratings yet
FT4 Rapid Quantitative Test COA - F25916401AD
1 page
Well Partie 1
No ratings yet
Well Partie 1
7 pages
Orange Green Corporate Geometric Business Case Study and Report Business Presentation
No ratings yet
Orange Green Corporate Geometric Business Case Study and Report Business Presentation
11 pages
Comparative Adjectives A) Complete With The Comparative Form
No ratings yet
Comparative Adjectives A) Complete With The Comparative Form
2 pages
Elective IV-flexible Ac Transmission System
0% (1)
Elective IV-flexible Ac Transmission System
10 pages
The MINI Countryman - Specifications - Feb 2024
No ratings yet
The MINI Countryman - Specifications - Feb 2024
2 pages
Treasurers Affidavit - Subscribed Capital
No ratings yet
Treasurers Affidavit - Subscribed Capital
2 pages
Finaltestkitmanualii16 08 2012 130903145649
No ratings yet
Finaltestkitmanualii16 08 2012 130903145649
29 pages
English Bussines
No ratings yet
English Bussines
4 pages
WB08P7113 Car Health Report
No ratings yet
WB08P7113 Car Health Report
17 pages
Section 14.3 Partial Derivatives
No ratings yet
Section 14.3 Partial Derivatives
3 pages
Caveat Emptor
No ratings yet
Caveat Emptor
14 pages
Bad Company by Richard MacAndrew
No ratings yet
Bad Company by Richard MacAndrew
16 pages
Britannia Proforma Invoice - 234175
No ratings yet
Britannia Proforma Invoice - 234175
1 page
History of Architecture Iii: (Written Report)
No ratings yet
History of Architecture Iii: (Written Report)
16 pages
Interview Transcript - Crosspointe Leardership Team Member
No ratings yet
Interview Transcript - Crosspointe Leardership Team Member
8 pages
To Be Used For Pars Service Option Only in Bond: Express
No ratings yet
To Be Used For Pars Service Option Only in Bond: Express
4 pages
Manual Partes Palomera
No ratings yet
Manual Partes Palomera
29 pages
EL EAM Brochure
No ratings yet
EL EAM Brochure
10 pages
Formato de Excel Modelo para Revision de Literatura
No ratings yet
Formato de Excel Modelo para Revision de Literatura
11 pages
Stilwell
No ratings yet
Stilwell
8 pages
Chadabe - 1996 - The History of Electronic Music As A Reflection of Structural Paradigms
No ratings yet
Chadabe - 1996 - The History of Electronic Music As A Reflection of Structural Paradigms
5 pages
BCS 403
No ratings yet
BCS 403
16 pages
LS1 Eng. DLL (Informative, Journalistic, Literary Writing)
No ratings yet
LS1 Eng. DLL (Informative, Journalistic, Literary Writing)
7 pages
Instant Download Etextbook PDF For Intelligence The Secret World of Spies An Anthology 5th Edition PDF FREE
100% (59)
Instant Download Etextbook PDF For Intelligence The Secret World of Spies An Anthology 5th Edition PDF FREE
32 pages
Qualified Persons and G Forms
No ratings yet
Qualified Persons and G Forms
1 page

Lab 3

Uploaded by

Lab 3

Uploaded by

titanic-naive-bayes-1

April 21, 2024

[ ]: PassengerId Survived Pclass \

Name Sex Age SibSp \

Parch Ticket Fare Cabin Embarked

[891 rows x 12 columns]

[ ]: PassengerId Survived Pclass Name Sex \

Age SibSp Parch Ticket Fare Cabin \

[ ]: df.drop(["Sex","Name","Ticket","Cabin"], axis=1, inplace=True)

[ ]: PassengerId Survived Pclass Age SibSp Parch Fare Embarked

[891 rows x 8 columns]

[ ]: PassengerId Pclass Age SibSp Parch Fare Embarked_C \

[889 rows x 9 columns]

[ ]: print("Training set shape:", x_train.shape, y_train.shape)

Training set shape: (711, 9) (711,)

[ ]: print("Testing set shape:", x_test.shape, y_test.shape)

Testing set shape: (178, 9) (178,)

[ ]: from sklearn.metrics import accuracy_score

accuracy = accuracy_score(y_test, y_pred)

You might also like