0% found this document useful (0 votes)

10 views4 pages

Notebook - Main Code

Uploaded by

golgothgolgoth039

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views4 pages

Notebook - Main Code

Uploaded by

golgothgolgoth039

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

import os

import argparse
import numpy as np
import pandas as pd
import mlflow
import mlflow.sklearn
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix,classification_report
from sklearn.metrics import accuracy_score
from sklearn import preprocessing

def main():
"""Main function of the script."""

# input and output arguments

parser = argparse.ArgumentParser()
parser.add_argument("--data", type=str, help="path to input data")
parser.add_argument("--test_train_ratio", type=float, default=0.25)
parser.add_argument("--criterion", default="gini", type=str)
parser.add_argument("--random_state", type=int)
parser.add_argument("--
registered_model_name", type=str, help="model name")
args = parser.parse_args()

# Start Logging
mlflow.start_run()

# enable autologging
mlflow.sklearn.autolog()

###################
#<prepare the data>
###################
print(" ".join(f"{k}={v}" for k, v in vars(args).items()))

print("input data:", args.data)

#kidney_df = pd.read_csv(args.data, header=1, index_col=0)
dataset = pd.read_csv(args.data)

mlflow.log_metric("num_samples", dataset.shape[0])
mlflow.log_metric("num_features", dataset.shape[1] - 1)

#----#
# removing extra '\t' from data
for ij in range (0,25):
if dataset.dtypes[ij]!='int64':
dataset.iloc[:,ij]=dataset.iloc[:,ij].astype('str').map(lambda x:
x.lstrip('\t').rstrip('\t'))

# Some additional data cleaning

dataset.replace(' yes','yes',inplace=True)
dataset['class'].replace('no','notckd',inplace=True)
dataset.replace('?',np.nan,inplace=True)

#For loop to do soft conversion of columns wherever possible leaving non-

object and unconvertible column unchanged.
cols = dataset.columns
for c in cols:
try:
dataset[c] = pd.to_numeric(dataset[c])
except:
pass

array=dataset.copy()

inputs=array.drop('class',axis='columns')
target=array['class']

#LabelEncoding
labelencoder=preprocessing.LabelEncoder()

X=inputs.values
#y=inputs.values
y=target

for ij in range(0,24):
X[:,ij]=labelencoder.fit_transform(X[:,ij])
#----#

#Split train and test datasets

#train_df, test_df = train_test_split(

X_train,X_test,y_train,y_test= train_test_split(
X,
y,
test_size=args.test_train_ratio,
random_state=args.random_state,
)
####################
#</prepare the data>
####################

##################
#<train the model>
##################
# Extracting the label column
#y_train = train_df.pop("24")

# convert the dataframe values to array

#X_train = train_df.values

# Extracting the label column

#y_test = test_df.pop("24")

# convert the dataframe values to array

#X_test = test_df.values

print(f"Training with data of shape {X_train.shape}")

decision_tree = DecisionTreeClassifier(
criterion=args.criterion,random_state = args.random_state
)
decision_tree.fit(X_train,y_train)

y_pred = decision_tree.predict(X_test)

print(classification_report(y_test, y_pred))
###################
#</train the model>
###################

##########################
#<save and register model>
##########################
# Registering the model to the workspace
print("Registering the model via MLFlow")
mlflow.sklearn.log_model(
sk_model=decision_tree,
registered_model_name=args.registered_model_name,
artifact_path=args.registered_model_name,
)

# Saving the model to a file

mlflow.sklearn.save_model(
sk_model=decision_tree,
path=os.path.join(args.registered_model_name, "trained_model"),
)
###########################
#</save and register model>
###########################

# Stop Logging
mlflow.end_run()

if __name__ == "__main__":
main()

IBM Power Systems Virtual Server Level 2 Quiz - Attempt Review
100% (8)
IBM Power Systems Virtual Server Level 2 Quiz - Attempt Review
16 pages
Canada NOC Code List PDF 2024 - In-Demand Jobs in Canada
No ratings yet
Canada NOC Code List PDF 2024 - In-Demand Jobs in Canada
363 pages
1 CPE 413 Overview of x86 Architecture-1
No ratings yet
1 CPE 413 Overview of x86 Architecture-1
60 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
Tensor Flow and Keras Sample Programs
No ratings yet
Tensor Flow and Keras Sample Programs
22 pages
Code and Output of Cancer Detection Model
No ratings yet
Code and Output of Cancer Detection Model
13 pages
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
No ratings yet
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
25 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
DLL 4
No ratings yet
DLL 4
26 pages
ML Codes
No ratings yet
ML Codes
9 pages
Nibedita Dehury, 123CE0079, ASSIGNMENT 9
No ratings yet
Nibedita Dehury, 123CE0079, ASSIGNMENT 9
18 pages
Data Preprocessing
No ratings yet
Data Preprocessing
9 pages
Appix
No ratings yet
Appix
15 pages
Raw Nitex
No ratings yet
Raw Nitex
5 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
AI
No ratings yet
AI
16 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Chapter07 Working-With-Keras
No ratings yet
Chapter07 Working-With-Keras
12 pages
AI ML - Cycle 2 Programs
No ratings yet
AI ML - Cycle 2 Programs
15 pages
5) Randomforest - Ipynb - Colaboratory
No ratings yet
5) Randomforest - Ipynb - Colaboratory
12 pages
ML Functions
No ratings yet
ML Functions
12 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Keras Cheat Sheet Python
No ratings yet
Keras Cheat Sheet Python
1 page
Train Edu Bert
No ratings yet
Train Edu Bert
3 pages
Document 4
No ratings yet
Document 4
3 pages
Skin Disease Detection Using Transformers
No ratings yet
Skin Disease Detection Using Transformers
35 pages
Deep Learning Perceptron
No ratings yet
Deep Learning Perceptron
10 pages
PYHTONPRACT
No ratings yet
PYHTONPRACT
4 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
ML NEW Final Format
No ratings yet
ML NEW Final Format
37 pages
Reast Cancer Prediction Using Debt
No ratings yet
Reast Cancer Prediction Using Debt
18 pages
Assignment 2.4.1 Multiclass Classification
No ratings yet
Assignment 2.4.1 Multiclass Classification
5 pages
A3 Classification and Feature Engineering
No ratings yet
A3 Classification and Feature Engineering
2 pages
AI Assignment-6
No ratings yet
AI Assignment-6
7 pages
ML Lab 01999676272
No ratings yet
ML Lab 01999676272
12 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
TP - Ipynb - Colab
No ratings yet
TP - Ipynb - Colab
6 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
Brain Tumor Multi-Classification With PSO: Import As Import As Import
No ratings yet
Brain Tumor Multi-Classification With PSO: Import As Import As Import
18 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
Program
No ratings yet
Program
10 pages
Python Essential Methods in Machine Learning
No ratings yet
Python Essential Methods in Machine Learning
6 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
ML Fat
No ratings yet
ML Fat
9 pages
Ann Experiential Learning
No ratings yet
Ann Experiential Learning
43 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
MLA Lab 6:-Implementation of Decision Tree
No ratings yet
MLA Lab 6:-Implementation of Decision Tree
16 pages
ML Manual With Outputs
No ratings yet
ML Manual With Outputs
30 pages
Deep Learning Practical Assignment:: Q-1) Code
No ratings yet
Deep Learning Practical Assignment:: Q-1) Code
59 pages
Progress of GRADIENT BOOSTING ALGORITHM FOR ELECTRICITY THEFT DETECTION IN POWER UTILITIES
No ratings yet
Progress of GRADIENT BOOSTING ALGORITHM FOR ELECTRICITY THEFT DETECTION IN POWER UTILITIES
10 pages
Training Code
No ratings yet
Training Code
4 pages
20AI16 - ML Record
No ratings yet
20AI16 - ML Record
24 pages
Scikit Learn What Were Covering
No ratings yet
Scikit Learn What Were Covering
15 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
RAGE Against The Machine - Retrieval-Augmented LLM Explanations
No ratings yet
RAGE Against The Machine - Retrieval-Augmented LLM Explanations
4 pages
Time Series Analysis 1718649022
No ratings yet
Time Series Analysis 1718649022
5 pages
Programming With Python and GUI Development... 2024
No ratings yet
Programming With Python and GUI Development... 2024
145 pages
Notebook - Deep Neural Networks
No ratings yet
Notebook - Deep Neural Networks
28 pages
Building A Tanh Activation Function
No ratings yet
Building A Tanh Activation Function
9 pages
Notebook - Music Recommendation System Reference
No ratings yet
Notebook - Music Recommendation System Reference
22 pages
Stock Market Dashboard in Python
No ratings yet
Stock Market Dashboard in Python
4 pages
5 3-2 Spatial Environmental Data Model Selection Long-Range Dependencies
No ratings yet
5 3-2 Spatial Environmental Data Model Selection Long-Range Dependencies
3 pages
Boston Dataset
No ratings yet
Boston Dataset
6 pages
Notebook - Geospatial
No ratings yet
Notebook - Geospatial
11 pages
Notebook - Text Classification
No ratings yet
Notebook - Text Classification
7 pages
Notebook - Agave Plant Maturation Model Inference and Testing
No ratings yet
Notebook - Agave Plant Maturation Model Inference and Testing
7 pages
New System To Harness 40% of The Sun's Heat To Produce Clean Hydrogen Fuel
No ratings yet
New System To Harness 40% of The Sun's Heat To Produce Clean Hydrogen Fuel
6 pages
Data Pipeline in ML
No ratings yet
Data Pipeline in ML
3 pages
MLS 1 - Presentation
No ratings yet
MLS 1 - Presentation
11 pages
1 3 Multiple Hypothesis Testing
No ratings yet
1 3 Multiple Hypothesis Testing
14 pages
5 2-6 Spatial Environmental Data Gaussian Processes
No ratings yet
5 2-6 Spatial Environmental Data Gaussian Processes
4 pages
5 2-4 Spatial Environmental Data Gaussian Processes
No ratings yet
5 2-4 Spatial Environmental Data Gaussian Processes
3 pages
ML LVC 3 Glossary
No ratings yet
ML LVC 3 Glossary
1 page
ML LVC 2 Post-Session Summary
No ratings yet
ML LVC 2 Post-Session Summary
12 pages
The CNN Architecture
No ratings yet
The CNN Architecture
15 pages
MLS 1 - Regression
No ratings yet
MLS 1 - Regression
20 pages
Glossary of Notations - Recommender Systems Part 3
No ratings yet
Glossary of Notations - Recommender Systems Part 3
4 pages
ML LVC 3 Post-Session Summary
No ratings yet
ML LVC 3 Post-Session Summary
16 pages
Week5 InheritancePolymorphismAbstraction PDF
No ratings yet
Week5 InheritancePolymorphismAbstraction PDF
18 pages
ZSD I Delivery Final Check
No ratings yet
ZSD I Delivery Final Check
2 pages
Manual Testing Overall - Notes
No ratings yet
Manual Testing Overall - Notes
51 pages
Safety-Critical Advanced Robots
No ratings yet
Safety-Critical Advanced Robots
10 pages
SEN Experiment 2 (21202C0031, 21202C0025)
No ratings yet
SEN Experiment 2 (21202C0031, 21202C0025)
3 pages
Cloud Enabling Technology
No ratings yet
Cloud Enabling Technology
103 pages
Topic: Unit Testing and Integration Testing
No ratings yet
Topic: Unit Testing and Integration Testing
4 pages
REPORT
No ratings yet
REPORT
13 pages
Chapter 3 Processes
No ratings yet
Chapter 3 Processes
42 pages
SqlServer - Parameterized Query With in Clause C# - CodeProject
No ratings yet
SqlServer - Parameterized Query With in Clause C# - CodeProject
5 pages
Assignment 1 & 2
No ratings yet
Assignment 1 & 2
3 pages
Cs-4. Object-Oriented Programming Fourth Quarter Final Project
No ratings yet
Cs-4. Object-Oriented Programming Fourth Quarter Final Project
2 pages
Chapter 1 School Management Profile
No ratings yet
Chapter 1 School Management Profile
38 pages
Itmd
No ratings yet
Itmd
7 pages
Web Technology Sppu
No ratings yet
Web Technology Sppu
5 pages
《Computer culture》 Homework: 1. Decribe the process of converting Office 97-2010 files to 2013 in detail
No ratings yet
《Computer culture》 Homework: 1. Decribe the process of converting Office 97-2010 files to 2013 in detail
2 pages
MANE-4280U Lab 1
No ratings yet
MANE-4280U Lab 1
12 pages
Medicine Reminder: Based On Android Studio
No ratings yet
Medicine Reminder: Based On Android Studio
3 pages
Atul Final
No ratings yet
Atul Final
64 pages
Introducing Snowflake Role Based Access Control
No ratings yet
Introducing Snowflake Role Based Access Control
11 pages
Virtuoso 101 Best Practices
No ratings yet
Virtuoso 101 Best Practices
8 pages
2-2 JP (22-26-A Batch) MID-1 YouTube Assignment-1
No ratings yet
2-2 JP (22-26-A Batch) MID-1 YouTube Assignment-1
8 pages
Spirit Flow-Xpert: Flow Measurement Calculation Software
No ratings yet
Spirit Flow-Xpert: Flow Measurement Calculation Software
12 pages
Bisnis Global
No ratings yet
Bisnis Global
96 pages
Data Structures Implementation Using C++
No ratings yet
Data Structures Implementation Using C++
54 pages
PDSMAN - Introduction
No ratings yet
PDSMAN - Introduction
55 pages
Implementation of Web Application For Disease Prediction Using AI
No ratings yet
Implementation of Web Application For Disease Prediction Using AI
5 pages

Notebook - Main Code

Uploaded by

Notebook - Main Code

Uploaded by

import os

# input and output arguments

print("input data:", args.data)

# Some additional data cleaning

#For loop to do soft conversion of columns wherever possible leaving non-

#Split train and test datasets

#train_df, test_df = train_test_split(

# convert the dataframe values to array

# Extracting the label column

# convert the dataframe values to array

print(f"Training with data of shape {X_train.shape}")

# Saving the model to a file

You might also like