0% found this document useful (0 votes)

18 views

TT - Ipynb - Colaboratory

The document discusses importing a pandas dataframe from an Excel file, cleaning the data, and performing machine learning with a k-nearest neighbors classifier. Specifically, it extracts numeric values from strings in the dataframe, encodes categorical variables, splits the data into training and test sets, trains a kNN model on the training set and evaluates it on the test set, achieving 83% accuracy. It also prints the resulting confusion matrix.

Uploaded by

hos1999moh78

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views

TT - Ipynb - Colaboratory

Uploaded by

hos1999moh78

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

10/24/23, 8:50 PM tt.

ipynb - Colaboratory

import pandas as pd
df = pd.read_excel('Out_20.xlsx')

data = [
"2646", "2650", "2652", "2656", "2660", "2670", "2671",
"2630", "2631", "2632", "2633", "2634", "2635",
"2901", "2902A", "2903A", "2904A", "2905A", "2906A", "2907A", "2908A", "2909A",
"2910", "2911A", "2912A", "2913A", "2914A", "2915", "2916A",
"2921",
"2941", "2942", "2943", "2944",
"3101", "3102", "3174", "3103", "3104A", "3105", "3109",
"3170", "3171", "3172", "3173", "3110", "3111", "3112", "3113", "3114", "3115",
"3120", "3121", "3122", "3123", "3124", "3125", "3130", "3131", "3132", "3133", "3134", "3135",
"3140", "3141", "3147", "3148", "3149", "3150", "3140", "3141", "3143", "3147", "3148", "3149", "3150", "3151", "3140", "3
"3160", "3162A", "3163A", "3164", "3166", "3167", "3168", "3169", "3186A", "3187A",
"3201", "3202", "3203A", "3209A", "3210A", "3212A",
"3701", "3702", "3703", "3704", "3705", "3709A",
"3711", "3712", "3713", "3714", "3715", "3719A",
"3721", "3722", "3723", "3724", "3725", "3728A", "3729A",
"3731", "3732", "3733", "3734", "3735", "3739A",
"3741", "3742", "3743", "3744", "3745", "3749A",
"3751", "3752", "3753", "3754", "3755", "3758",
"3759A", "3761", "3762", "3763", "3764", "3765", "3768",
"3769A", "3771", "3772", "3773", "3774", "3775", "3778", "3779A"
]
lil = [x if x in data else None for x in df.columns]
new_list = [x for x in lil if x is not None]
a = df[new_list]
Y = df['Labels']

# Define the string to replace 'None' values

replacement_string = "Missing"

# Use .fillna() to replace 'None' values with the string

a = a.fillna(replacement_string)

import re
def extract_numbers_from_string(s):
numbers = re.findall(r'(\d+\.\d+|\d+)', s)
if [float(num) for num in numbers] != []:
a = [float(num) for num in numbers]
return a[0] # Convert to float
else:
return s

b = a.copy()
res = b.applymap(extract_numbers_from_string)

/tmp/ipykernel_7631/3268899633.py:2: FutureWarning: DataFrame.applymap has been deprecated. Use DataFrame.map instead.

res = b.applymap(extract_numbers_from_string)

from sklearn.preprocessing import LabelEncoder

label_encoder = LabelEncoder()

def str_to_num(value):
if type(value) != str:
return value
else:
return label_encoder.fit_transform([value])[0]

res = res.applymap(str_to_num)

/tmp/ipykernel_7631/1121957528.py:10: FutureWarning: DataFrame.applymap has been deprecated. Use DataFrame.map instead.

res = res.applymap(str_to_num)

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix
import matplotlib.pyplot as plt

X_train, X_test, y_train, y_test = train_test_split(res, Y, test_size=0.3, random_state=42)

https://colab.research.google.com/drive/15ii9g4Kt64khxXRvelS0PlqLUkyRxHMG?authuser=1 1/3
10/24/23, 8:50 PM tt.ipynb - Colaboratory
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)

/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:767: Future
if not hasattr(array, "sparse") and array.dtypes.apply(is_sparse).any():
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
▾ KNeighborsClassifier
KNeighborsClassifier()

y_pred = knn.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)

print('Accuracy:', accuracy)

Accuracy: 0.8333333333333334
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):

# Create a confusion matrix

conf_matrix = confusion_matrix(y_test, y_pred)
print('Confusion Matrix:')
print(conf_matrix)

Confusion Matrix:
[[7 0]
[2 3]]
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:605: Future
if is_sparse(pd_dtype):
/mnt/Hossein-HDD/Files/anaconda3/envs/mr.davoodabadi/lib/python3.11/site-packages/sklearn/utils/validation.py:614: Future
if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):

https://colab.research.google.com/drive/15ii9g4Kt64khxXRvelS0PlqLUkyRxHMG?authuser=1 2/3
10/24/23, 8:50 PM tt.ipynb - Colaboratory

https://colab.research.google.com/drive/15ii9g4Kt64khxXRvelS0PlqLUkyRxHMG?authuser=1 3/3

Store.ipynb - Colab
No ratings yet
Store.ipynb - Colab
3 pages
Apr 2023
No ratings yet
Apr 2023
32 pages
Code With Dates HARDCODED
No ratings yet
Code With Dates HARDCODED
2 pages
pandas_readExcel_merge_cleaning_class2-3
No ratings yet
pandas_readExcel_merge_cleaning_class2-3
1 page
Excel Automation Using Python Cheatsheet 1731972946
No ratings yet
Excel Automation Using Python Cheatsheet 1731972946
10 pages
Program 7
No ratings yet
Program 7
6 pages
Wa0012.
No ratings yet
Wa0012.
30 pages
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
No ratings yet
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
10 pages
Python Amit
No ratings yet
Python Amit
11 pages
Customer Data Outliers Pyspark
No ratings yet
Customer Data Outliers Pyspark
1 page
Formula Sheet
No ratings yet
Formula Sheet
4 pages
Ip Project Work 2
No ratings yet
Ip Project Work 2
52 pages
BA - npf1 PDF
No ratings yet
BA - npf1 PDF
6 pages
Code
No ratings yet
Code
2 pages
How to a Developers Guide to 4k: Developer edition, #3
From Everand
How to a Developers Guide to 4k: Developer edition, #3
Xinc Cyberwizard
No ratings yet
ML Lab Manual Final
No ratings yet
ML Lab Manual Final
36 pages
hello
No ratings yet
hello
3 pages
Project_Prog
No ratings yet
Project_Prog
6 pages
Lab 2 Solved
No ratings yet
Lab 2 Solved
3 pages
Session 11 Lecture 1
No ratings yet
Session 11 Lecture 1
6 pages
Series4 - Renata Putri Henessa
No ratings yet
Series4 - Renata Putri Henessa
12 pages
9 (A&b)
No ratings yet
9 (A&b)
8 pages
Practice Questions (Unsolved)
No ratings yet
Practice Questions (Unsolved)
8 pages
Project On World University Rankings
No ratings yet
Project On World University Rankings
21 pages
SET 1
No ratings yet
SET 1
16 pages
Assignment 7
No ratings yet
Assignment 7
1 page
Business Analytics Lab Record
No ratings yet
Business Analytics Lab Record
36 pages
Concatenate Range
No ratings yet
Concatenate Range
216 pages
Content
No ratings yet
Content
12 pages
Harjot 19 - 34 Python
No ratings yet
Harjot 19 - 34 Python
20 pages
QP - Info - Gr.12 - June MT - 2022 - MS
No ratings yet
QP - Info - Gr.12 - June MT - 2022 - MS
15 pages
AP19110010030 Assignment-4 Lab
No ratings yet
AP19110010030 Assignment-4 Lab
9 pages
2.3 - Jupyter Notebook
No ratings yet
2.3 - Jupyter Notebook
24 pages
Assignment 2 - Jupyter Notebook
No ratings yet
Assignment 2 - Jupyter Notebook
8 pages
IP Practical File Project
No ratings yet
IP Practical File Project
60 pages
Coca Cola Stock Analysis.ipynb (1)
No ratings yet
Coca Cola Stock Analysis.ipynb (1)
197 pages
Rekap Klaim-64067a8a79e32
No ratings yet
Rekap Klaim-64067a8a79e32
765 pages
Dataframe in Pandas
No ratings yet
Dataframe in Pandas
23 pages
Excel With Python Performing Advanced Operations
No ratings yet
Excel With Python Performing Advanced Operations
57 pages
DAV Previous Year
No ratings yet
DAV Previous Year
7 pages
Lab6- S1,S2
No ratings yet
Lab6- S1,S2
6 pages
Python code for Data Analysis Tool in excel
No ratings yet
Python code for Data Analysis Tool in excel
11 pages
Import Import As Import As: #Default To CSV
No ratings yet
Import Import As Import As: #Default To CSV
6 pages
XII - Informatics Practices (LAB MANUAL)
100% (1)
XII - Informatics Practices (LAB MANUAL)
42 pages
Lab Exercise 2-CS0017
No ratings yet
Lab Exercise 2-CS0017
17 pages
Book 2
No ratings yet
Book 2
5 pages
Data Cleaning and Fill Missing Values
No ratings yet
Data Cleaning and Fill Missing Values
15 pages
Dav Pyq 2023
No ratings yet
Dav Pyq 2023
15 pages
Part 4
No ratings yet
Part 4
1 page
Lannet
No ratings yet
Lannet
3 pages
PRACTICALS
No ratings yet
PRACTICALS
52 pages
Assignment 2
No ratings yet
Assignment 2
2 pages
Azure For Starters
From Everand
Azure For Starters
Chinmoy Mukherjee
No ratings yet
11,12, 13, 14operations On DF
No ratings yet
11,12, 13, 14operations On DF
5 pages
Group 10A - GA2
No ratings yet
Group 10A - GA2
10 pages
Python and Excel
No ratings yet
Python and Excel
11 pages
Rca Rehorm
No ratings yet
Rca Rehorm
25 pages
Document (4)-1
No ratings yet
Document (4)-1
15 pages
DS Practical
No ratings yet
DS Practical
30 pages
2. DATA WRANGLING 2
No ratings yet
2. DATA WRANGLING 2
4 pages
Math408 Lecture 20 21
No ratings yet
Math408 Lecture 20 21
9 pages
CG 5
No ratings yet
CG 5
9 pages
Q9) Write A Program in C++ For Stack and Its Applications
No ratings yet
Q9) Write A Program in C++ For Stack and Its Applications
5 pages
CH 05
No ratings yet
CH 05
102 pages
MANSCI Problem Solving - Question and Answers With Solution
No ratings yet
MANSCI Problem Solving - Question and Answers With Solution
3 pages
Question Paper Unit 4776 Numerical Methods
No ratings yet
Question Paper Unit 4776 Numerical Methods
4 pages
Name of The Experiment Understanding The Effect of AWGN in A Message Signal
No ratings yet
Name of The Experiment Understanding The Effect of AWGN in A Message Signal
6 pages
Data Structures Unit 5
No ratings yet
Data Structures Unit 5
20 pages
Stochastic Processes Course Fall 1399: Instructor: TA: Office/Email: Office Hours: Class Time: Class Location: Textbooks
No ratings yet
Stochastic Processes Course Fall 1399: Instructor: TA: Office/Email: Office Hours: Class Time: Class Location: Textbooks
2 pages
Principles of Automatic Control
No ratings yet
Principles of Automatic Control
26 pages
Supersymmetry for Mathematicians An Introduction V. S. Varadarajan download
100% (1)
Supersymmetry for Mathematicians An Introduction V. S. Varadarajan download
66 pages
BTP Sixth Sem Report
No ratings yet
BTP Sixth Sem Report
31 pages
Stochastic Signals and Systems - Assignment
No ratings yet
Stochastic Signals and Systems - Assignment
2 pages
Monte Carlo Methods: Jonathan Pengelly February 26, 2002
No ratings yet
Monte Carlo Methods: Jonathan Pengelly February 26, 2002
18 pages
Digital Image Processing QB 2017 - 18
No ratings yet
Digital Image Processing QB 2017 - 18
9 pages
Von Neumann Entropy
No ratings yet
Von Neumann Entropy
3 pages
Cie2 Question Bank
No ratings yet
Cie2 Question Bank
3 pages
Graph Sheet V.2
No ratings yet
Graph Sheet V.2
13 pages
HP 1
No ratings yet
HP 1
1 page
Oral Care
No ratings yet
Oral Care
6 pages
CN Hamming Code and CRC
No ratings yet
CN Hamming Code and CRC
8 pages
Alignment Algorithm
No ratings yet
Alignment Algorithm
58 pages
Harmonic Oscillator
No ratings yet
Harmonic Oscillator
28 pages
Problems 2
100% (2)
Problems 2
8 pages
Homework 3 Solutions PDF
No ratings yet
Homework 3 Solutions PDF
7 pages
Comparison of Classification Algorithms
No ratings yet
Comparison of Classification Algorithms
11 pages
(Ebook) Automatic Control Systems, 8th ed. (Solutions Manual) by Benjamin C. Kuo, Farid Golnaraghi ISBN 9780471134763 all chapter instant download
100% (2)
(Ebook) Automatic Control Systems, 8th ed. (Solutions Manual) by Benjamin C. Kuo, Farid Golnaraghi ISBN 9780471134763 all chapter instant download
81 pages
Entropy Change in Reversible and Irreversible Processes
100% (1)
Entropy Change in Reversible and Irreversible Processes
8 pages
Maths X Assertion Reasoning Chapter 03
No ratings yet
Maths X Assertion Reasoning Chapter 03
14 pages
Lecture 6,7
No ratings yet
Lecture 6,7
68 pages

TT - Ipynb - Colaboratory

Uploaded by

TT - Ipynb - Colaboratory

Uploaded by

10/24/23, 8:50 PM tt.

# Define the string to replace 'None' values

# Use .fillna() to replace 'None' values with the string

/tmp/ipykernel_7631/3268899633.py:2: FutureWarning: DataFrame.applymap has been deprecated. Use DataFrame.map instead.

from sklearn.preprocessing import LabelEncoder

/tmp/ipykernel_7631/1121957528.py:10: FutureWarning: DataFrame.applymap has been deprecated. Use DataFrame.map instead.

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(res, Y, test_size=0.3, random_state=42)

accuracy = accuracy_score(y_test, y_pred)

# Create a confusion matrix

You might also like