0% found this document useful (0 votes)

3 views4 pages

Anoosha ML Lab01

The document outlines a lab assignment for a Machine Learning course focused on loading CSV files and handling data conversions. It includes code examples for detecting and handling missing values, removing empty lines, and supporting different delimiters. Additional suggestions for improving data handling efficiency are also provided.

Uploaded by

21b-200-se

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views4 pages

Anoosha ML Lab01

Uploaded by

21b-200-se

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

ANOOSHA MEHAK 21B-200-SE SEC “C”

CS334 - Machine Learning

Lab 01
You learned how to load CSV files and perform basic data conversions. Data loading can be a difficult
task given the variety of data cleaning and conversion that may be required from problem to
problem. There are many extensions that you could make to make these examples more robust to
new and different data files. Below are just a few ideas That you to implement yourself and submit
as homework file on MS Teams:

 Detect and handle missing values in a column.

 Detect and remove empty lines at the top or bottom of the file

CODE:
from csv import reader

# Load a CSV file and handle missing values

def load_csv(filename, default_value=None):

dataset = list()

with open(filename, 'r') as file:

lines = file.readlines()

# Remove empty lines from the beginning and end

while lines and lines[0].strip() == '':

lines.pop(0)

while lines and lines[-1].strip() == '':

lines.pop()

csv_reader = reader(lines)

for row in csv_reader:

if not row:

continue

for i in range(len(row)):

if row[i] == '':

# Replace missing value with default value

row[i] = default_value

dataset.append(row)

return dataset
ANOOSHA MEHAK 21B-200-SE SEC “C”

# Example usage:

filename = 'iris.csv'

default_value = 'missing value' # Specify the default value for missing values

dataset = load_csv(filename, default_value)

# Check if replacement worked by printing some rows

print("First 5 rows after handling missing values and removing empty lines from top and bottom:")

for row in dataset[:5]:

print(row)

OUTPUT:

 Support for other delimiters such as pipe (|) or white space.

# Define a function to read the file with a specified delimiter

def read_file_with_delimiter(file_path, delimiter='\t'):

data = []

with open(file_path, 'r') as file:

# Read the header

header = file.readline().strip().split(delimiter)

# Read the remaining lines

for line in file:

# Split each line based on the delimiter

row = line.strip().split(delimiter)

# Convert numeric data to appropriate types if needed

for i in range(1, len(row)): # Convert columns 1 to end to floats

row[i] = float(row[i])

data.append(row)

return header, data

# Example usage with pipe delimiter

header, data = read_file_with_delimiter('iris.csv', delimiter='|')

ANOOSHA MEHAK 21B-200-SE SEC “C”

# Displaying the header and the first few rows of data

print("Header:", header)

print("Data:")

for row in data[:5]: # Displaying first 5 rows

print(row)

OUTPUT

 Support more efficient data structures such as arrays.

def read_file_with_delimiter(file_path, delimiter='\t'):

header = []

data = []

with open(file_path, 'r') as file:

# Read the header

header = file.readline().strip().split(delimiter)

# Read the remaining lines

for line in file:

# Split each line based on the delimiter

row = line.strip().split(delimiter)

# Convert numeric data to appropriate types if needed

for i in range(1, len(row)): # Convert columns 1 to end to floats

row[i] = float(row[i])

data.append(row)

return header, data

# Example usage with pipe delimiter

header, data = read_file_with_delimiter("Iris.csv", delimiter='|')

# Displaying the header and the first few rows of data

ANOOSHA MEHAK 21B-200-SE SEC “C”

print("Header:", header)

print("Data:")

for row in data[:5]: # Displaying first 5 rows

print(row)

OUTPUT

12 Information Practices Text Book Preeti Arora
No ratings yet
12 Information Practices Text Book Preeti Arora
45 pages
Hand-Held Terminal: (Catalog Number 1747-PT1)
No ratings yet
Hand-Held Terminal: (Catalog Number 1747-PT1)
465 pages
Data File Handling - Worksheet 1 - 5 Marks
No ratings yet
Data File Handling - Worksheet 1 - 5 Marks
9 pages
Advanced Microprocessor Assembly Programs 8086
33% (3)
Advanced Microprocessor Assembly Programs 8086
69 pages
Programming Fundamentals: LAB Task # 1
No ratings yet
Programming Fundamentals: LAB Task # 1
20 pages
GR 12 CS Practical Programs (11-15)
No ratings yet
GR 12 CS Practical Programs (11-15)
12 pages
CH 5 File Handling CSV Files
No ratings yet
CH 5 File Handling CSV Files
20 pages
Worksheet 2 File Handling
No ratings yet
Worksheet 2 File Handling
7 pages
1 Chapter 6 Architectural Design
No ratings yet
1 Chapter 6 Architectural Design
88 pages
CSV - Practice Paper
No ratings yet
CSV - Practice Paper
7 pages
Python Projects List
No ratings yet
Python Projects List
15 pages
Itil Cartoon
100% (1)
Itil Cartoon
43 pages
Employee Data Analysis System (Ip Class Xii)
No ratings yet
Employee Data Analysis System (Ip Class Xii)
26 pages
Case Based Q. File Handling
No ratings yet
Case Based Q. File Handling
5 pages
CSV Files Worksheet2
No ratings yet
CSV Files Worksheet2
7 pages
Install Hackintosh High Sierra On PC Laptop - Hackintosh Shop
No ratings yet
Install Hackintosh High Sierra On PC Laptop - Hackintosh Shop
35 pages
Adb Shell Settings List System
No ratings yet
Adb Shell Settings List System
5 pages
## Parsing A Data File (Python For Beginner) Somet...
No ratings yet
## Parsing A Data File (Python For Beginner) Somet...
3 pages
Fds Unit - III
No ratings yet
Fds Unit - III
58 pages
Product Data Sheet Deltav Sis Electronic Marshalling Deltav Sis en 57292
No ratings yet
Product Data Sheet Deltav Sis Electronic Marshalling Deltav Sis en 57292
52 pages
Working With CSV Files in Python
No ratings yet
Working With CSV Files in Python
4 pages
005.2 CSV
No ratings yet
005.2 CSV
11 pages
List de Scripts - Barra de Acesso Rápido
No ratings yet
List de Scripts - Barra de Acesso Rápido
6 pages
File Handling 2 1
No ratings yet
File Handling 2 1
66 pages
Python CSV Files
No ratings yet
Python CSV Files
9 pages
Data File Handling Worksheet
No ratings yet
Data File Handling Worksheet
10 pages
Experiment No 3 Importing and Exporting Data in Python Using Pandas Student
No ratings yet
Experiment No 3 Importing and Exporting Data in Python Using Pandas Student
6 pages
Worksheet BFH - Solution
No ratings yet
Worksheet BFH - Solution
7 pages
p4 d2 2017 p4 16 Tutorial
No ratings yet
p4 d2 2017 p4 16 Tutorial
94 pages
CS-12-File Handling (CSV File)
No ratings yet
CS-12-File Handling (CSV File)
3 pages
CSV FILES Online
No ratings yet
CSV FILES Online
84 pages
Web Application Development Using Open Source and Java Technologies
No ratings yet
Web Application Development Using Open Source and Java Technologies
99 pages
MCQS For Practice
No ratings yet
MCQS For Practice
16 pages
INFORMATIC Complete Project
No ratings yet
INFORMATIC Complete Project
27 pages
Computer Science
No ratings yet
Computer Science
35 pages
05 Data Loading, Storage and Wrangling-1
No ratings yet
05 Data Loading, Storage and Wrangling-1
22 pages
Unit-4 Python
No ratings yet
Unit-4 Python
21 pages
3.3. CSV Files
No ratings yet
3.3. CSV Files
28 pages
III Unit Fds
No ratings yet
III Unit Fds
24 pages
CSV File
No ratings yet
CSV File
30 pages
L20 Cassandra - Fa12
No ratings yet
L20 Cassandra - Fa12
27 pages
Python For Data Analysis (1) - 171-192
No ratings yet
Python For Data Analysis (1) - 171-192
24 pages
Introduction To Python
No ratings yet
Introduction To Python
14 pages
CSV
No ratings yet
CSV
9 pages
Employee Data Analysis System (Ip Class 12) (2024-25)
No ratings yet
Employee Data Analysis System (Ip Class 12) (2024-25)
30 pages
Bca1mpcl 2021 Oct Methodology of Programing in C Language
No ratings yet
Bca1mpcl 2021 Oct Methodology of Programing in C Language
2 pages
Revision Questions
No ratings yet
Revision Questions
22 pages
Comprehensive Examination
No ratings yet
Comprehensive Examination
25 pages
Assgn CSV Files
No ratings yet
Assgn CSV Files
13 pages
CONLIB Csvworksheet 20250214163814
No ratings yet
CONLIB Csvworksheet 20250214163814
15 pages
CSV File: Python With CSV Files
No ratings yet
CSV File: Python With CSV Files
19 pages
CS-12-File Handling (CSV File)
No ratings yet
CS-12-File Handling (CSV File)
3 pages
MS Class Xii CS PB 2022 Set 1
No ratings yet
MS Class Xii CS PB 2022 Set 1
5 pages
Software Requirement Specification
No ratings yet
Software Requirement Specification
6 pages
Unit5 CS
No ratings yet
Unit5 CS
15 pages
Practical 6C
No ratings yet
Practical 6C
4 pages
"Rewrite It in Rust" Considered Harmful?
No ratings yet
"Rewrite It in Rust" Considered Harmful?
7 pages
CSV Files Worksheet Ans
No ratings yet
CSV Files Worksheet Ans
9 pages
Ascii Unicode: Chapter - 4 CSV Files 1. What Is A CSV File?
No ratings yet
Ascii Unicode: Chapter - 4 CSV Files 1. What Is A CSV File?
9 pages
CSV Files Worksheet
No ratings yet
CSV Files Worksheet
7 pages
CSV File Handling
No ratings yet
CSV File Handling
8 pages
Chapter5 3CSVFile
No ratings yet
Chapter5 3CSVFile
7 pages
Chapter 5.3 CSV File Handling
No ratings yet
Chapter 5.3 CSV File Handling
9 pages
SET-2 Python Practical (3-5
No ratings yet
SET-2 Python Practical (3-5
4 pages
Section A: 13-12-2021/PREPARED BY:Mr - Jagdish S Patil
No ratings yet
Section A: 13-12-2021/PREPARED BY:Mr - Jagdish S Patil
7 pages
CSV Files
No ratings yet
CSV Files
8 pages
CSV File
No ratings yet
CSV File
5 pages
File Handling
No ratings yet
File Handling
6 pages
Record: True/False - CSV in Python Class 12
No ratings yet
Record: True/False - CSV in Python Class 12
5 pages
CSV File Handling Assignment (2024-25)
No ratings yet
CSV File Handling Assignment (2024-25)
4 pages
CSV File Handling
No ratings yet
CSV File Handling
2 pages
G12 CS Worksheet
No ratings yet
G12 CS Worksheet
3 pages
CSV New
No ratings yet
CSV New
4 pages
COMP 527 - 2019 - CA1 Re-Sit Assignment Data Classification Implementing K-NN Classifier
No ratings yet
COMP 527 - 2019 - CA1 Re-Sit Assignment Data Classification Implementing K-NN Classifier
3 pages
Practical 3
No ratings yet
Practical 3
2 pages
CSV Files
No ratings yet
CSV Files
3 pages
Half Yearly Xii Practical Examination 2024-25
No ratings yet
Half Yearly Xii Practical Examination 2024-25
2 pages
Deleting in A CSV File
No ratings yet
Deleting in A CSV File
2 pages
Introduction To Computers Test
No ratings yet
Introduction To Computers Test
2 pages
Workshet - 3
No ratings yet
Workshet - 3
2 pages
Syllabus and Course Information
No ratings yet
Syllabus and Course Information
1 page
Xi-Cs-Sqp-Set 1
No ratings yet
Xi-Cs-Sqp-Set 1
4 pages
Prctical BC
No ratings yet
Prctical BC
2 pages
Arjun Resume
No ratings yet
Arjun Resume
3 pages
Restaurant Brochure
No ratings yet
Restaurant Brochure
3 pages
3 PDF
No ratings yet
3 PDF
3 pages
Problem 1: Sort Integers Saved in A File: Do Not Distribute Without Written Permission From Prof. Xiaoning Ding
No ratings yet
Problem 1: Sort Integers Saved in A File: Do Not Distribute Without Written Permission From Prof. Xiaoning Ding
2 pages
Advance Excel Course Applicaiton 210721
No ratings yet
Advance Excel Course Applicaiton 210721
1 page
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet

Anoosha ML Lab01

Uploaded by

Anoosha ML Lab01

Uploaded by

ANOOSHA MEHAK 21B-200-SE SEC “C”

CS334 - Machine Learning

 Detect and handle missing values in a column.

# Load a CSV file and handle missing values

def load_csv(filename, default_value=None):

with open(filename, 'r') as file:

# Remove empty lines from the beginning and end

while lines and lines[0].strip() == '':

while lines and lines[-1].strip() == '':

for row in csv_reader:

# Replace missing value with default value

dataset = load_csv(filename, default_value)

# Check if replacement worked by printing some rows

for row in dataset[:5]:

 Support for other delimiters such as pipe (|) or white space.

# Define a function to read the file with a specified delimiter

def read_file_with_delimiter(file_path, delimiter='\t'):

with open(file_path, 'r') as file:

# Read the header

# Read the remaining lines

for line in file:

# Split each line based on the delimiter

# Convert numeric data to appropriate types if needed

for i in range(1, len(row)): # Convert columns 1 to end to floats

return header, data

# Example usage with pipe delimiter

header, data = read_file_with_delimiter('iris.csv', delimiter='|')

# Displaying the header and the first few rows of data

for row in data[:5]: # Displaying first 5 rows

 Support more efficient data structures such as arrays.

def read_file_with_delimiter(file_path, delimiter='\t'):

with open(file_path, 'r') as file:

# Read the header

# Read the remaining lines

for line in file:

# Split each line based on the delimiter

# Convert numeric data to appropriate types if needed

for i in range(1, len(row)): # Convert columns 1 to end to floats

return header, data

# Example usage with pipe delimiter

header, data = read_file_with_delimiter("Iris.csv", delimiter='|')

# Displaying the header and the first few rows of data

for row in data[:5]: # Displaying first 5 rows

You might also like