0% found this document useful (0 votes)

15 views5 pages

Making - End - To - End - Project - Without - Pipeline - Jupyter Notebook

The document shows the steps taken to build a machine learning model to predict Titanic passengers' chances of survival without using pipelines. It loads and cleans the Titanic dataset, applies feature engineering techniques like imputation and one-hot encoding, trains a decision tree classifier on the preprocessed data, and evaluates its performance on the test set.

Uploaded by

satyamk86770

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views5 pages

Making - End - To - End - Project - Without - Pipeline - Jupyter Notebook

Uploaded by

satyamk86770

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

3/18/24, 12:17 AM Making_end_to_end_project_without_pipeline - Jupyter Notebook

In [26]: import numpy as np

import pandas as pd

from sklearn.model_selection import train_test_split
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import MinMaxScaler
from sklearn.tree import DecisionTreeClassifier

In [27]: df=pd.read_csv("titanic.csv")

In [28]: df.head()

Out[28]:
PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked

0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S

Cumings, Mrs. John Bradley (Florence Briggs

1 2 1 1 female 38.0 1 0 PC 17599 71.2833 C85 C
Th...

STON/O2.
2 3 1 3 Heikkinen, Miss. Laina female 26.0 0 0 7.9250 NaN S
3101282

3 4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 0 113803 53.1000 C123 S

4 5 0 3 Allen, Mr. William Henry male 35.0 0 0 373450 8.0500 NaN S

In [29]: df.drop(columns=['PassengerId','Name','Ticket','Cabin'], inplace=True)

localhost:8888/notebooks/100DaysMLCourse/Making_end_to_end_project_without_pipeline.ipynb 1/5
3/18/24, 12:17 AM Making_end_to_end_project_without_pipeline - Jupyter Notebook

In [30]: df.head()

Out[30]:
Survived Pclass Sex Age SibSp Parch Fare Embarked

0 0 3 male 22.0 1 0 7.2500 S

1 1 1 female 38.0 1 0 71.2833 C

2 1 3 female 26.0 0 0 7.9250 S

3 1 1 female 35.0 1 0 53.1000 S

4 0 3 male 35.0 0 0 8.0500 S

In [31]: x_train,x_test,y_train,y_test = train_test_split(df.drop(columns=['Survived']),df['Survived'],test_size=0.2,random_state=42

In [32]: df.isnull().sum()

Out[32]: Survived 0
Pclass 0
Sex 0
Age 177
SibSp 0
Parch 0
Fare 0
Embarked 2
dtype: int64

localhost:8888/notebooks/100DaysMLCourse/Making_end_to_end_project_without_pipeline.ipynb 2/5
3/18/24, 12:17 AM Making_end_to_end_project_without_pipeline - Jupyter Notebook

In [85]: si_age = SimpleImputer()

si_embarked = SimpleImputer(strategy='most_frequent')

x_train_age= si_age.fit_transform(x_train[['Age']])
x_train_embarked = si_embarked.fit_transform(x_train[['Embarked']])

x_test_age= si_age.fit_transform(x_test[['Age']])
x_test_embarked = si_embarked.fit_transform(x_test[['Embarked']])

In [86]: # applying the one hot encoding on sex and embarked because they are catogrical data

ohe_sex= OneHotEncoder(sparse=False, handle_unknown='ignore')
ohe_embarked= OneHotEncoder(sparse=False, handle_unknown='ignore')

x_train_sex = ohe_sex.fit_transform(x_train[['Sex']])
x_train_embarked = ohe_embarked.fit_transform(x_train_embarked)

x_test_sex = ohe_sex.fit_transform(x_test[['Sex']])
x_test_embarked = ohe_embarked.fit_transform(x_test_embarked)

C:\ProgramData\anaconda3\lib\site-packages\sklearn\preprocessing\_encoders.py:828: FutureWarning: `sparse` was renamed to

`sparse_output` in version 1.2 and will be removed in 1.4. `sparse_output` is ignored unless you leave `sparse` to its def
ault value.
warnings.warn(
C:\ProgramData\anaconda3\lib\site-packages\sklearn\preprocessing\_encoders.py:828: FutureWarning: `sparse` was renamed to
`sparse_output` in version 1.2 and will be removed in 1.4. `sparse_output` is ignored unless you leave `sparse` to its def
ault value.
warnings.warn(
C:\ProgramData\anaconda3\lib\site-packages\sklearn\preprocessing\_encoders.py:828: FutureWarning: `sparse` was renamed to
`sparse_output` in version 1.2 and will be removed in 1.4. `sparse_output` is ignored unless you leave `sparse` to its def
ault value.
warnings.warn(
C:\ProgramData\anaconda3\lib\site-packages\sklearn\preprocessing\_encoders.py:828: FutureWarning: `sparse` was renamed to
`sparse_output` in version 1.2 and will be removed in 1.4. `sparse_output` is ignored unless you leave `sparse` to its def
ault value.
warnings.warn(

localhost:8888/notebooks/100DaysMLCourse/Making_end_to_end_project_without_pipeline.ipynb 3/5
3/18/24, 12:17 AM Making_end_to_end_project_without_pipeline - Jupyter Notebook

In [113]: x_train_sex

Out[113]: array([[0., 1.],

[0., 1.],
[0., 1.],
...,
[0., 1.],
[1., 0.],
[0., 1.]])

In [88]: x_train_rem = x_train.drop(columns=['Sex','Age','Embarked'])

x_test_rem = x_test.drop(columns=['Sex','Age','Embarked'])

In [95]: x_train_transformed=np.concatenate((x_train_rem,x_train_age,x_train_sex,x_train_embarked),axis=1)
x_test_transformed=np.concatenate((x_test_rem,x_test_age,x_test_sex,x_test_embarked),axis=1)

In [98]: x_test_transformed.shape

Out[98]: (179, 10)

In [102]: clf=DecisionTreeClassifier()
clf.fit(x_train_transformed,y_train)

Out[102]: ▾ DecisionTreeClassifier
DecisionTreeClassifier()

In [103]: y_pred = clf.predict(x_test_transformed)

localhost:8888/notebooks/100DaysMLCourse/Making_end_to_end_project_without_pipeline.ipynb 4/5
3/18/24, 12:17 AM Making_end_to_end_project_without_pipeline - Jupyter Notebook

In [109]: from sklearn.metrics import accuracy_score

accuracy_score(y_test,y_pred)*100

Out[109]: 74.86033519553072

In [110]: import pickle

In [112]: pickle.dump(ohe_sex,open('models/ohe_sex.pkl','wb'))
pickle.dump(ohe_embarked,open('models/ohe_embarked.pkl','wb'))
pickle.dump(clf,open('models/clf.pkl','wb'))

In [ ]:

localhost:8888/notebooks/100DaysMLCourse/Making_end_to_end_project_without_pipeline.ipynb 5/5

The Art of Photoshop for Digital Photographers From Image Capture to Art 1st edition by Daniel Giordan 0672327139 9780672327131 - The full ebook with all chapters is available for download
100% (7)
The Art of Photoshop for Digital Photographers From Image Capture to Art 1st edition by Daniel Giordan 0672327139 9780672327131 - The full ebook with all chapters is available for download
35 pages
Ebook A334 Book1 E1i1 n9781780079868 l3 2
No ratings yet
Ebook A334 Book1 E1i1 n9781780079868 l3 2
472 pages
The Knight's Tale Summary
No ratings yet
The Knight's Tale Summary
1 page
Titanic Dataset Model Prediction
No ratings yet
Titanic Dataset Model Prediction
11 pages
Titanic Survival
No ratings yet
Titanic Survival
13 pages
Log Book Forensic
No ratings yet
Log Book Forensic
17 pages
Ministry Same-Sex Unions-Archbishop Makgoba April 2024
No ratings yet
Ministry Same-Sex Unions-Archbishop Makgoba April 2024
8 pages
Assignment Data Science
No ratings yet
Assignment Data Science
2 pages
Onkar exp 3 - Jupyter Notebook
No ratings yet
Onkar exp 3 - Jupyter Notebook
2 pages
Sworn Affidavit in Support of Charles Paclik by Ronald Pierce Re: Contra Costa Superior Court
No ratings yet
Sworn Affidavit in Support of Charles Paclik by Ronald Pierce Re: Contra Costa Superior Court
5 pages
pipeline test pickle
No ratings yet
pipeline test pickle
2 pages
Home Work
No ratings yet
Home Work
12 pages
Citizen's Guide to U.S. Federal Law on Child Pornography
No ratings yet
Citizen's Guide to U.S. Federal Law on Child Pornography
1 page
Soviet Russia and it's involvement in second world war
No ratings yet
Soviet Russia and it's involvement in second world war
3 pages
Assign9.Ipynb - Colab
No ratings yet
Assign9.Ipynb - Colab
4 pages
DL Assignment 1
No ratings yet
DL Assignment 1
7 pages
ENglish Baru
No ratings yet
ENglish Baru
3 pages
Barangay Clearance
100% (1)
Barangay Clearance
1 page
Lab 3
No ratings yet
Lab 3
7 pages
dspracticalexternak23aug
No ratings yet
dspracticalexternak23aug
8 pages
01-Logistic Regression With Python
No ratings yet
01-Logistic Regression With Python
12 pages
Solution
No ratings yet
Solution
41 pages
Strait of Gibraltar
No ratings yet
Strait of Gibraltar
2 pages
Data Pre Processing
No ratings yet
Data Pre Processing
2 pages
PRAC3_23BME053
No ratings yet
PRAC3_23BME053
5 pages
ML 3
No ratings yet
ML 3
9 pages
Titanic eda
No ratings yet
Titanic eda
17 pages
Media_Law_Important_Topics
No ratings yet
Media_Law_Important_Topics
2 pages
International Relations Short Notes
No ratings yet
International Relations Short Notes
15 pages
LOGISTIC_REGRESSION - Jupyter Notebook
No ratings yet
LOGISTIC_REGRESSION - Jupyter Notebook
18 pages
assignment2
No ratings yet
assignment2
2 pages
Assign8.ipynb - Colab
No ratings yet
Assign8.ipynb - Colab
14 pages
Automatically Select Imputer Parameters
No ratings yet
Automatically Select Imputer Parameters
5 pages
Learneverythingai 1695069129
No ratings yet
Learneverythingai 1695069129
56 pages
Victoria v. COMELEC - 1994
No ratings yet
Victoria v. COMELEC - 1994
3 pages
Draft Tenancy Agreement
No ratings yet
Draft Tenancy Agreement
11 pages
The Tortoise and The Hare Story
No ratings yet
The Tortoise and The Hare Story
3 pages
Titanic
100% (2)
Titanic
13 pages
Instructions:: Mltest2question - Jupyter Notebook
No ratings yet
Instructions:: Mltest2question - Jupyter Notebook
6 pages
Logistic Regression On Titanic Dataset
No ratings yet
Logistic Regression On Titanic Dataset
6 pages
The Siege of The Walled City of Jerusalem 14 May 15 December 1948
No ratings yet
The Siege of The Walled City of Jerusalem 14 May 15 December 1948
8 pages
7 8 - Missing Value Handling
No ratings yet
7 8 - Missing Value Handling
4 pages
Accuracy With Comments
No ratings yet
Accuracy With Comments
3 pages
12212221 (1) copy
No ratings yet
12212221 (1) copy
9 pages
DataWare Housing Asg01 Shaheer Zia Qazi-47-2
No ratings yet
DataWare Housing Asg01 Shaheer Zia Qazi-47-2
9 pages
Dataset Visualization Basic Ml-1
No ratings yet
Dataset Visualization Basic Ml-1
12 pages
Titanic Data Analysis
No ratings yet
Titanic Data Analysis
14 pages
Practical No 01
No ratings yet
Practical No 01
9 pages
decision tree
No ratings yet
decision tree
2 pages
Assignment 2
No ratings yet
Assignment 2
5 pages
A Sourcebook On Solitary Confinement
No ratings yet
A Sourcebook On Solitary Confinement
98 pages
Machine Learning Notebook
No ratings yet
Machine Learning Notebook
19 pages
LogisticRegressionMLModel - Jupyter Notebook
No ratings yet
LogisticRegressionMLModel - Jupyter Notebook
14 pages
ML File 211173
No ratings yet
ML File 211173
19 pages
Comm PPT 1
No ratings yet
Comm PPT 1
7 pages
Passengerid Survived Pclass Name Sex Age Sibsp Parch Ticket
No ratings yet
Passengerid Survived Pclass Name Sex Age Sibsp Parch Ticket
16 pages
Titanic Survival Prediction Ml
No ratings yet
Titanic Survival Prediction Ml
36 pages
Titanic Survival Prediction 1692609491
No ratings yet
Titanic Survival Prediction 1692609491
15 pages
Data Cleaning and Manipulation in Python
No ratings yet
Data Cleaning and Manipulation in Python
33 pages
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
No ratings yet
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
25 pages
Pandas Profiling Library For EDA
No ratings yet
Pandas Profiling Library For EDA
1 page
Titanic Survival Prediction Using Machine Learning
No ratings yet
Titanic Survival Prediction Using Machine Learning
7 pages
References: Indictment Against Sarah Good 1692
No ratings yet
References: Indictment Against Sarah Good 1692
2 pages
4.1.3.5 Lab - Decision Tree Classification
No ratings yet
4.1.3.5 Lab - Decision Tree Classification
11 pages
Assistant S&gad and Puujab Police Full Solved Paper
No ratings yet
Assistant S&gad and Puujab Police Full Solved Paper
76 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
28 pages
Homework2
No ratings yet
Homework2
12 pages
Lab 6
No ratings yet
Lab 6
7 pages
Titanic Report ml report
No ratings yet
Titanic Report ml report
14 pages
Maneesha Nidigonda Minor Project .Ipynb
No ratings yet
Maneesha Nidigonda Minor Project .Ipynb
35 pages
Random Forest/Roc&Auc - Hyperparamer Tuning With For Loop - TITANIC DB
No ratings yet
Random Forest/Roc&Auc - Hyperparamer Tuning With For Loop - TITANIC DB
17 pages
Loading The Dataset: ## The Matplotlib and Seaborn Library For Result Visualization and Analysis
No ratings yet
Loading The Dataset: ## The Matplotlib and Seaborn Library For Result Visualization and Analysis
13 pages
Titanic
No ratings yet
Titanic
1 page
Form X Abstract Under Minimum Wages Act, 1948
No ratings yet
Form X Abstract Under Minimum Wages Act, 1948
2 pages
Random Forest: Random Forest Has Classifier For Classification and Regressor For Regression
No ratings yet
Random Forest: Random Forest Has Classifier For Classification and Regressor For Regression
9 pages
Titanic Data
No ratings yet
Titanic Data
5 pages
Logistic Regression Implementation in R: The Dataset
No ratings yet
Logistic Regression Implementation in R: The Dataset
8 pages
Aim: Predicting The Survival of Titanic Passengers
No ratings yet
Aim: Predicting The Survival of Titanic Passengers
20 pages
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
Mother's Day History and Traditions.
No ratings yet
Mother's Day History and Traditions.
2 pages
Andrew Ashworth, Jeremy Horder Principles of Criminal Law
No ratings yet
Andrew Ashworth, Jeremy Horder Principles of Criminal Law
20 pages
A Timeline of English History
No ratings yet
A Timeline of English History
12 pages
Constitutional Law 1 - Consolidated Cases 8.10.18
No ratings yet
Constitutional Law 1 - Consolidated Cases 8.10.18
44 pages
Sulamerica CIA Nacional de Seguros SA & Ors V Enesa Engenharia SA & Ors (2012) EWCA Civ 638 (16 May
No ratings yet
Sulamerica CIA Nacional de Seguros SA & Ors V Enesa Engenharia SA & Ors (2012) EWCA Civ 638 (16 May
16 pages
Coospace 15
No ratings yet
Coospace 15
3 pages
LP3 - ML Mini-Project Report Format Shreeyas
No ratings yet
LP3 - ML Mini-Project Report Format Shreeyas
13 pages
Glocal Law School: Project Work OF Code of Civil Procedure Topic
No ratings yet
Glocal Law School: Project Work OF Code of Civil Procedure Topic
8 pages
AMLAC
No ratings yet
AMLAC
14 pages
Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

Making - End - To - End - Project - Without - Pipeline - Jupyter Notebook

Uploaded by

Making - End - To - End - Project - Without - Pipeline - Jupyter Notebook

Uploaded by

3/18/24, 12:17 AM Making_end_to_end_project_without_pipeline - Jupyter Notebook

In [26]: import numpy as np

Cumings, Mrs. John Bradley (Florence Briggs

4 5 0 3 Allen, Mr. William Henry male 35.0 0 0 373450 8.0500 NaN S

In [29]: df.drop(columns=['PassengerId','Name','Ticket','Cabin'], inplace=True)

0 0 3 male 22.0 1 0 7.2500 S

1 1 1 female 38.0 1 0 71.2833 C

2 1 3 female 26.0 0 0 7.9250 S

3 1 1 female 35.0 1 0 53.1000 S

4 0 3 male 35.0 0 0 8.0500 S

In [31]: x_train,x_test,y_train,y_test = train_test_split(df.drop(columns=['Survived']),df['Survived'],test_size=0.2,random_state=42

In [85]: si_age = SimpleImputer()

C:\ProgramData\anaconda3\lib\site-packages\sklearn\preprocessing\_encoders.py:828: FutureWarning: `sparse` was renamed to

Out[113]: array([[0., 1.],

In [88]: x_train_rem = x_train.drop(columns=['Sex','Age','Embarked'])

Out[98]: (179, 10)

In [103]: y_pred = clf.predict(x_test_transformed)

In [109]: from sklearn.metrics import accuracy_score

In [110]: import pickle

You might also like