0% found this document useful (0 votes)

25 views5 pages

Code

Uploaded by

xahage9739

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

25 views5 pages

Code

Uploaded by

xahage9739

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

Assignment 1

Name: SAIKAT MOI

Roll Number: 20CS10050
# import all the necessary libraries here
import pandas as pd
import numpy as np
import random
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

data = pd.read_csv('../../dataset/linear-regression.csv')
print(data)

fixed acidity volatile acidity citric acid residual sugar

chlorides \
0 7.4 0.700 0.00 1.9
0.076
1 7.8 0.880 0.00 2.6
0.098
2 7.8 0.760 0.04 2.3
0.092
3 11.2 0.280 0.56 1.9
0.075
4 7.4 0.700 0.00 1.9
0.076
... ... ... ... ...
...
1594 6.2 0.600 0.08 2.0
0.090
1595 5.9 0.550 0.10 2.2
0.062
1596 6.3 0.510 0.13 2.3
0.076
1597 5.9 0.645 0.12 2.0
0.075
1598 6.0 0.310 0.47 3.6
0.067

free sulfur dioxide total sulfur dioxide density pH

sulphates \
0 11.0 34.0 0.99780 3.51
0.56
1 25.0 67.0 0.99680 3.20
0.68
2 15.0 54.0 0.99700 3.26
0.65
3 17.0 60.0 0.99800 3.16
0.58
4 11.0 34.0 0.99780 3.51
0.56
... ... ... ... ...
...
1594 32.0 44.0 0.99490 3.45
0.58
1595 39.0 51.0 0.99512 3.52
0.76
1596 29.0 40.0 0.99574 3.42
0.75
1597 32.0 44.0 0.99547 3.57
0.71
1598 18.0 42.0 0.99549 3.39
0.66

alcohol quality
0 9.4 5
1 9.8 5
2 9.8 5
3 9.8 6
4 9.4 5
... ... ...
1594 10.5 5
1595 11.2 6
1596 11.0 6
1597 10.2 5
1598 11.0 6

[1599 rows x 12 columns]

X = data.drop(columns=['quality'])
y = data['quality']

# Feature scaling is a common preprocessing step in machine learning

that helps improve the performance and convergence
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_train, X_temp, y_train, y_temp = train_test_split(X_scaled, y,

test_size=0.5, random_state=42)
X_val, X_test, y_val, y_test = train_test_split(X_temp, y_temp,
test_size=0.4, random_state=42)

print("Train set shapes - X:", X_train.shape, "y:", y_train.shape)

print("Validation set shapes - X:", X_val.shape, "y:", y_val.shape)
print("Test set shapes - X:", X_test.shape, "y:", y_test.shape)
Train set shapes - X: (799, 11) y: (799,)
Validation set shapes - X: (480, 11) y: (480,)
Test set shapes - X: (320, 11) y: (320,)

# concatenating the column vector of ones with the X_train matrix,

effectively adding a new column to the beginning of X_train
# bias term allows the model to learn an offset from the origin.

X_train_with_bias = np.c_[np.ones((X_train.shape[0], 1)), X_train]

# Normal Equation θ = (X^T X)^(-1) X^T y

theta = np.linalg.inv(X_train_with_bias.T @ X_train_with_bias) @
X_train_with_bias.T @ y_train

# Predict on the test set

X_test_with_bias = np.c_[np.ones((X_test.shape[0], 1)), X_test]
y_test_pred = X_test_with_bias @ theta

# Calculate R-squared on the test set

ssr = np.sum(( y_test-y_test_pred ) ** 2)

sst = np.sum((y_test - np.mean(y_test)) ** 2)
r2 = 1 - (ssr / sst)

# RMSE = sqrt((1 / n) * Σ(y_pred - y_actual)^2)

# Calculate RMSE on the test set

rmse = np.sqrt(np.mean((y_test - y_test_pred) ** 2))

print("Test Set - R-squared:", r2)

print("Test Set - Root Mean Squared Error (RMSE):", rmse)

Test Set - R-squared: 0.3967805084557149

Test Set - Root Mean Squared Error (RMSE): 0.6657115962476505

# the mean squared error loss between the predicted values and the
actual target values.
def compute_loss(X, y, theta):
y_pred = X @ theta
loss = np.mean((y_pred - y) ** 2)
return loss

# ∇(MSE) = -2 * (X^T @ (y - Xθ)) / N

def gradient_ascent(X, y, theta, learning_rate, num_iterations):

losses = []
for _ in range(num_iterations):
y_pred = X @ theta
gradient = -2 * (X.T @ (y - y_pred)) / len(y)
theta -= learning_rate * gradient
loss = compute_loss(X, y, theta)
losses.append(loss)
return theta, losses

learning_rates = [0.01, 0.001, 0.0001]

num_iterations = 50000

for lr in learning_rates:
theta_initial = np.zeros(X_train.shape[1] + 1) # +1 for the bias
term
X_train_with_bias = np.c_[np.ones((X_train.shape[0], 1)), X_train]
theta_optimized, losses = gradient_ascent(X_train_with_bias,
y_train, theta_initial, lr, num_iterations)

plt.plot(range(num_iterations), losses, label=f'lr = {lr}')

X_test_with_bias = np.c_[np.ones((X_test.shape[0], 1)), X_test]

y_test_pred = X_test_with_bias @ theta_optimized

# Calculate R-squared on the test set

ssr = np.sum(( y_test-y_test_pred ) ** 2)
sst = np.sum((y_test - np.mean(y_test)) ** 2)

r2 = 1-(ssr / sst)

# Calculate RMSE on the test set

rmse = np.sqrt(np.mean((y_test - y_test_pred) ** 2))

print(f"Learning Rate: {lr}")

print("Test Set - R-squared:", r2)
print("Test Set - Root Mean Squared Error (RMSE):", rmse)
print()

plt.xlabel('Iteration')
plt.ylabel('Loss')
plt.title('Loss Function vs. Iteration for Different Learning Rates')
plt.legend()
plt.show()

Learning Rate: 0.01

Test Set - R-squared: 0.3967805084557158
Test Set - Root Mean Squared Error (RMSE): 0.6657115962476501

Learning Rate: 0.001

Test Set - R-squared: 0.3967803979339991
Test Set - Root Mean Squared Error (RMSE): 0.6657116572333991

Learning Rate: 0.0001

Test Set - R-squared: 0.39639733535434873
Test Set - Root Mean Squared Error (RMSE): 0.6659229971434986

Quality Prediction Checkpoint
No ratings yet
Quality Prediction Checkpoint
14 pages
Big-O Algorithm Complexity Cheat Sheet PDF
100% (1)
Big-O Algorithm Complexity Cheat Sheet PDF
4 pages
MLP Reg Improved PDF
No ratings yet
MLP Reg Improved PDF
38 pages
Regresi A
No ratings yet
Regresi A
11 pages
PDF 08 0247
No ratings yet
PDF 08 0247
2 pages
Planilha Sem Título
No ratings yet
Planilha Sem Título
56 pages
Data Mining 1 Practical File-1
No ratings yet
Data Mining 1 Practical File-1
24 pages
USL - 21070126112 - Colaboratory
No ratings yet
USL - 21070126112 - Colaboratory
3 pages
Indi - Colab
No ratings yet
Indi - Colab
11 pages
K Fold
No ratings yet
K Fold
6 pages
Submission of Term Work': Subject - Cpms
No ratings yet
Submission of Term Work': Subject - Cpms
25 pages
Assignment 03
No ratings yet
Assignment 03
6 pages
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
100% (1)
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
10 pages
%trabajamos Con Los Componentes Metanol y 1-Hepteno %componente Metanol
No ratings yet
%trabajamos Con Los Componentes Metanol y 1-Hepteno %componente Metanol
3 pages
Digital Signal Processing PDF
No ratings yet
Digital Signal Processing PDF
3 pages
Karisma 23011101119 Eda Rec
No ratings yet
Karisma 23011101119 Eda Rec
88 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
7 pages
22BBS0224
No ratings yet
22BBS0224
5 pages
Random Forest
No ratings yet
Random Forest
5 pages
Appendix
No ratings yet
Appendix
12 pages
Tabla Poisson 022021 Final
No ratings yet
Tabla Poisson 022021 Final
5 pages
Haz Plot Fail Modes For Moodle
No ratings yet
Haz Plot Fail Modes For Moodle
16 pages
Student - Linear Regression Example - Colaboratory
No ratings yet
Student - Linear Regression Example - Colaboratory
6 pages
Lampiran: 1. Backpropogation
No ratings yet
Lampiran: 1. Backpropogation
12 pages
Week 4 Naive Bayes Classifier
No ratings yet
Week 4 Naive Bayes Classifier
2 pages
ML Program 7, 8,9 And10
No ratings yet
ML Program 7, 8,9 And10
12 pages
Supervised Learning With Scikit-Learn: Preprocessing Data
No ratings yet
Supervised Learning With Scikit-Learn: Preprocessing Data
32 pages
Tabele Pentru Calcularea Entropiilor Informationale: 1. Tabel Pentru Calculul Valorilor - Log (X), 0.01 X 0.99
No ratings yet
Tabele Pentru Calcularea Entropiilor Informationale: 1. Tabel Pentru Calculul Valorilor - Log (X), 0.01 X 0.99
8 pages
4.4. Data Standardization - Ipynb - Colaboratory
No ratings yet
4.4. Data Standardization - Ipynb - Colaboratory
1 page
Garishav Basra 102103129 2CO5
No ratings yet
Garishav Basra 102103129 2CO5
8 pages
Quality Prediction
No ratings yet
Quality Prediction
20 pages
F Error
No ratings yet
F Error
27 pages
Regression Statistics
No ratings yet
Regression Statistics
17 pages
Project 3 - Diabetes Prediction - Ipynb - Colab
No ratings yet
Project 3 - Diabetes Prediction - Ipynb - Colab
4 pages
EXP - 7 - Prasham Doshi - 22bec097
No ratings yet
EXP - 7 - Prasham Doshi - 22bec097
7 pages
Silicon Parameter File
No ratings yet
Silicon Parameter File
49 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
7 pages
ML LAB 12 - Jupyter Notebook
No ratings yet
ML LAB 12 - Jupyter Notebook
11 pages
Tables Perf
No ratings yet
Tables Perf
3 pages
Model Training
No ratings yet
Model Training
6 pages
Data Structure QB
No ratings yet
Data Structure QB
17 pages
Practical04.ipynb - Colab
No ratings yet
Practical04.ipynb - Colab
2 pages
Labpg3.ipynb - Colab
No ratings yet
Labpg3.ipynb - Colab
2 pages
Assignment4 VidulGarg
No ratings yet
Assignment4 VidulGarg
14 pages
Wine Quality Prediction
No ratings yet
Wine Quality Prediction
6 pages
Classeur 1
No ratings yet
Classeur 1
21 pages
Como PDF
No ratings yet
Como PDF
2 pages
Estas PDF
No ratings yet
Estas PDF
2 pages
Aprende Estadi PDF
No ratings yet
Aprende Estadi PDF
2 pages
Descarg PDF
No ratings yet
Descarg PDF
2 pages
Memoriza Estadisticas PDF
No ratings yet
Memoriza Estadisticas PDF
2 pages
Intento PDF
No ratings yet
Intento PDF
2 pages
Hola PDF
No ratings yet
Hola PDF
2 pages
Tablas Estadisticas PDF
No ratings yet
Tablas Estadisticas PDF
2 pages
Ams 427 Statistical Model Building
No ratings yet
Ams 427 Statistical Model Building
5 pages
Criterio de Ross: Datos E.C. NV MULA: FD (1 - (E/VUT) 1.4) F E.C. R E.C.RE E.C.Rep E.C.D
No ratings yet
Criterio de Ross: Datos E.C. NV MULA: FD (1 - (E/VUT) 1.4) F E.C. R E.C.RE E.C.Rep E.C.D
6 pages
Maths PDF
No ratings yet
Maths PDF
4 pages
Mcq's On Unit V
100% (1)
Mcq's On Unit V
6 pages
Class 10 Holiday Homework
100% (1)
Class 10 Holiday Homework
3 pages
DATA SCIENCE IDC 302 End Sem Project
No ratings yet
DATA SCIENCE IDC 302 End Sem Project
1 page
Final Code-30 Bus Gauss Siedel
No ratings yet
Final Code-30 Bus Gauss Siedel
6 pages
Test1 2018 Fall Solved
No ratings yet
Test1 2018 Fall Solved
6 pages
Unit 4
No ratings yet
Unit 4
215 pages
Tabla Z
No ratings yet
Tabla Z
2 pages
Anexo Estadístico Tabla de Distribución Normal: Escuela de Ingeniería Industrial
No ratings yet
Anexo Estadístico Tabla de Distribución Normal: Escuela de Ingeniería Industrial
2 pages
Standard Normal Probabilities
No ratings yet
Standard Normal Probabilities
3 pages
Numerical Differentiation and Integration
100% (1)
Numerical Differentiation and Integration
84 pages
11.numerical Differentiation
No ratings yet
11.numerical Differentiation
20 pages
Filters
No ratings yet
Filters
20 pages
Signals and Systems
No ratings yet
Signals and Systems
3 pages
AI OneShot
No ratings yet
AI OneShot
38 pages
Lec9 - Transform Coding-Jpeg2000
No ratings yet
Lec9 - Transform Coding-Jpeg2000
44 pages
Interpolation: Dr. Sukanta Deb
No ratings yet
Interpolation: Dr. Sukanta Deb
32 pages
PW Maths Princi
No ratings yet
PW Maths Princi
30 pages
Simplifying Graph Convolutional Networks
No ratings yet
Simplifying Graph Convolutional Networks
14 pages
Selected Topics of VLSI Design: Part 3: Multiplication
No ratings yet
Selected Topics of VLSI Design: Part 3: Multiplication
14 pages
Least Square Method
No ratings yet
Least Square Method
5 pages
CS Class Lecture 1
No ratings yet
CS Class Lecture 1
4 pages
Stata
No ratings yet
Stata
5 pages
Es 204 MP2
No ratings yet
Es 204 MP2
2 pages
A Firefly Algorithm For The Heterogeneous Fixed Fleet Vehicle Routing Problem
No ratings yet
A Firefly Algorithm For The Heterogeneous Fixed Fleet Vehicle Routing Problem
21 pages
6 Complexity of Algorithm
No ratings yet
6 Complexity of Algorithm
15 pages
CS 3303 - Graded Quiz Unit 5 100%
No ratings yet
CS 3303 - Graded Quiz Unit 5 100%
12 pages
Assignment Solution
No ratings yet
Assignment Solution
6 pages
Taha Science Academy: Subjective Type
No ratings yet
Taha Science Academy: Subjective Type
1 page
Lesson 5 - Unsupervised Learning
No ratings yet
Lesson 5 - Unsupervised Learning
11 pages
Algorithms Worksheet 3 Iteration
No ratings yet
Algorithms Worksheet 3 Iteration
4 pages
What Is Linear Data Structure
No ratings yet
What Is Linear Data Structure
2 pages
Core Concepts in Real Analysis
From Everand
Core Concepts in Real Analysis
Roshan Trivedi
No ratings yet
Laboratory Exercises in Astronomy: Solutions and Answers
From Everand
Laboratory Exercises in Astronomy: Solutions and Answers
Dr. Adrian Kaminski
No ratings yet