Open navigation menu

Scribd

0% found this document useful (0 votes)

11 views8 pages

Lasso Regression Aim: Roll Number: 160122733094 Date

The document outlines the implementation and evaluation of Lasso and Ridge regression models on the California Housing dataset, analyzing performance metrics such as MSE, RMSE, R², and MAE, and visualizing results through scatter plots and heatmaps. Additionally, it describes the application of a Bernoulli Naive Bayes classifier for text classification, including the creation of a binary term-document matrix and evaluation of model metrics like accuracy and F1 score. A comparison table of regression metrics for Lasso, Ridge, and Linear regression is also included.

Uploaded by

vatticharlamonica

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views8 pages

Lasso Regression Aim: Roll Number: 160122733094 Date

The document outlines the implementation and evaluation of Lasso and Ridge regression models on the California Housing dataset, analyzing performance metrics such as MSE, RMSE, R², and MAE, and visualizing results through scatter plots and heatmaps. Additionally, it describes the application of a Bernoulli Naive Bayes classifier for text classification, including the creation of a binary term-document matrix and evaluation of model metrics like accuracy and F1 score. A comparison table of regression metrics for Lasso, Ridge, and Linear regression is also included.

Uploaded by

vatticharlamonica

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Roll Number: 160122733094 Date:

LASSO REGRESSION
Aim: To implement and evaluate a Lasso regression model on the California Housing dataset.
To analyze model performance using MSE, RMSE, R², and MAE metrics.
To visualize feature correlations, predicted vs. actual values, and residuals using heatmaps and
scatter plots.
Code:
# Import necessary libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Lasso
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error
from math import sqrt

# Load the California Housing dataset

california_housing = fetch_california_housing()
X = california_housing.data
y = california_housing.target

# Split the data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Feature scaling (important for Lasso)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

Page Number: Signature: ……………………

Roll Number: 160122733094 Date:

lasso = Lasso(alpha=0.1)
lasso.fit(X_train_scaled, y_train)
y_pred = lasso.predict(X_test_scaled)
mse = mean_squared_error(y_test, y_pred)
rmse = sqrt(mse)
r2 = r2_score(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
print(f"Mean Squared Error (MSE): {mse:.4f}")
print(f"Root Mean Squared Error (RMSE): {rmse:.4f}")
print(f"R-squared (R²): {r2:.4f}")
print(f"Mean Absolute Error (MAE): {mae:.4f}")
plt.figure(figsize=(8, 6))
plt.scatter(y_test, y_pred, alpha=0.6)
plt.plot([y.min(), y.max()], [y.min(), y.max()], color='red', linestyle='--')
plt.title('Predicted vs Actual Values')
plt.xlabel('Actual Values')
plt.ylabel('Predicted Values')
plt.show()
df_features = pd.DataFrame(X, columns=california_housing.feature_names)
correlation_matrix = df_features.corr()
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, fmt='.2f', cmap='coolwarm', linewidths=0.5)
plt.title("Feature Correlation Heatmap")
plt.show()
# Calculate residuals (difference between actual and predicted values)
residuals = y_test - y_pred
residuals_df = pd.DataFrame(residuals, columns=['Residuals'])
plt.figure(figsize=(8, 6))
sns.heatmap(residuals_df.T, annot=True, cmap='coolwarm', linewidths=0.5)

Page Number: Signature: ……………………

Roll Number: 160122733094 Date:

plt.title("Residual Heatmap")
plt.show()
Output:

Page Number: Signature: ……………………

Roll Number: 160122733094 Date:

RIDGE REGRESSION
Aim: To implement and evaluate a Ridge regression model on the California Housing dataset.
To analyze model performance using MSE, RMSE, R², and MAE metrics.
To visualize the predicted vs. actual values to assess the model’s accuracy.
Code:
# Import necessary libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error
from math import sqrt
california_housing = fetch_california_housing()

Page Number: Signature: ……………………

Roll Number: 160122733094 Date:

X = california_housing.data
y = california_housing.target
print("\nChecking for missing values in the features (X):")
print(pd.DataFrame(X).isnull().sum()) # No missing values expected
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
ridge = Ridge(alpha=1.0)
ridge.fit(X_train, y_train)
y_pred = ridge.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
rmse = sqrt(mse)
r2 = r2_score(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
print(f"\nMean Squared Error (MSE): {mse:.4f}")
print(f"Root Mean Squared Error (RMSE): {rmse:.4f}")
print(f"R-squared (R²): {r2:.4f}")
print(f"Mean Absolute Error (MAE): {mae:.4f}")
plt.figure(figsize=(8, 6))
plt.scatter(y_test, y_pred, alpha=0.6)
plt.plot([y.min(), y.max()], [y.min(), y.max()], color='red', linestyle='--')
plt.title('Predicted vs Actual Values (Ridge Regression)')
plt.xlabel('Actual Values')
plt.ylabel('Predicted Values')
plt.show()
Output:

Page Number: Signature: ……………………

Roll Number: 160122733094 Date:

COMPARISON TABLE

Metric Lasso Ridge Linear

Regression Regression Regression
Mean Square Error (MSE) 0.6796 0.5559 0.559
Root Mean Squared Error (RMSE) 0.8244 0.7456 0.7456
R-Squared(R2) 0.4814 0.5758 0.5758
Mean Absolute Error (MAE) 0.6222 0.5332 0.5332

Page Number: Signature: ……………………

Roll Number: 160122733094 Date:

Bernoulli Naive Bayes Algorithm

Aim: To implement a Bernoulli Naïve Bayes classifier for text classification using a binary term-
document matrix and predict the class of a new test document based on the trained model.
Code:
import numpy as np
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import BernoulliNB
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
documents = ["The rooms were good and I liked the location since it was good",
"The hotel was very bad and the stay was unpleasant",
"Liked the huge play area and the food was nice",
"The stay was good and pleasant",
"The location was good but was bad overall because the staff were rude"
]
labels = ['+', '-', '+', '+', '-']
features = ['good', 'liked', 'bad', 'unpleasant', 'nice', 'pleasant', 'rude']
vectorizer = CountVectorizer(binary=True, vocabulary=features)
X = vectorizer.fit_transform(documents)
tdm_df = pd.DataFrame(X.toarray(), columns=features)
tdm_df.index = [f"Doc {i+1}" for i in range(len(documents))]
print("\nBinary Term-Document Matrix:")
print(tdm_df)
X_train, X_test, y_train, y_test = train_test_split(X, labels, test_size=0.6, stratify=labels,
random_state=42)
model = BernoulliNB(alpha=1.0)

model.fit(X_train, y_train)
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, pos_label='+', zero_division=1)
recall = recall_score(y_test, y_pred, pos_label='+', zero_division=1)

Page Number: Signature: ……………………

Roll Number: 160122733094 Date:

f1 = f1_score(y_test, y_pred, pos_label='+', zero_division=1)

print("\nModel Evaluation Metrics:")

print(f"Accuracy: {accuracy:.2f}")
print(f"Precision: {precision:.2f}")
print(f"Recall: {recall:.2f}")
print(f"F1 Score: {f1:.2f}")

# Predicting on a new sample

test_doc = ["I'm bad"]
test_X = vectorizer.transform(test_doc)
predicted_class = model.predict(test_X)

print("\nPredicted class for test document:", predicted_class[0])

Output:

Page Number: Signature: ……………………

You might also like

Exercises Lesson Portfolio Moodle 1
No ratings yet
Exercises Lesson Portfolio Moodle 1
3 pages
Ridge Regression
No ratings yet
Ridge Regression
3 pages
LAB5 Regularization
No ratings yet
LAB5 Regularization
6 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
Regression Analysis On The Boston House Price Dataset For House Price Prediction
No ratings yet
Regression Analysis On The Boston House Price Dataset For House Price Prediction
2 pages
Data Science Record - 05
No ratings yet
Data Science Record - 05
20 pages
7 A
No ratings yet
7 A
2 pages
ML Manual
No ratings yet
ML Manual
24 pages
DA Lab2
No ratings yet
DA Lab2
5 pages
Message
No ratings yet
Message
5 pages
Unit 3 5
No ratings yet
Unit 3 5
4 pages
SNT 7
No ratings yet
SNT 7
13 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
22 pages
DL Assignment 1ms24rai03
No ratings yet
DL Assignment 1ms24rai03
10 pages
ML Manual
No ratings yet
ML Manual
30 pages
ML Assignment 1ipynb
No ratings yet
ML Assignment 1ipynb
10 pages
Experiment Number: 3: Aim:-Study of The Linear Regression in The Machine Learning Using The Boston Housing Dataset. 1)
No ratings yet
Experiment Number: 3: Aim:-Study of The Linear Regression in The Machine Learning Using The Boston Housing Dataset. 1)
14 pages
ML Lap
No ratings yet
ML Lap
23 pages
ML Full For Print New 1
No ratings yet
ML Full For Print New 1
38 pages
Boston Housing Kaggle Challenge With Linear Regression
No ratings yet
Boston Housing Kaggle Challenge With Linear Regression
3 pages
Pa Da1
No ratings yet
Pa Da1
17 pages
IoT Task4 21BEC0384
No ratings yet
IoT Task4 21BEC0384
9 pages
Dflyw9x3wm16 ML B1
No ratings yet
Dflyw9x3wm16 ML B1
9 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
AD-22053227 Lab 401, 402
No ratings yet
AD-22053227 Lab 401, 402
4 pages
Python File
No ratings yet
Python File
5 pages
ML Record
No ratings yet
ML Record
19 pages
CP4252 Machine Learning Lab Manual
No ratings yet
CP4252 Machine Learning Lab Manual
26 pages
Exp 2 (Multiple Linear Regression)
No ratings yet
Exp 2 (Multiple Linear Regression)
6 pages
T2 Summary VHA
No ratings yet
T2 Summary VHA
14 pages
Train
No ratings yet
Train
17 pages
ML Manual
No ratings yet
ML Manual
9 pages
Message
No ratings yet
Message
2 pages
Machine Learning Project: TITLE: Predicting The Sale Price of A House Using Linear Regression
No ratings yet
Machine Learning Project: TITLE: Predicting The Sale Price of A House Using Linear Regression
20 pages
Machine Learning - SEAIML-242 (PR) b2
No ratings yet
Machine Learning - SEAIML-242 (PR) b2
39 pages
Regression Analysis Lasso and Ridge Regression 1678810035
No ratings yet
Regression Analysis Lasso and Ridge Regression 1678810035
18 pages
SML - Week 3
No ratings yet
SML - Week 3
5 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
23 pages
Unit 5
No ratings yet
Unit 5
171 pages
Kritika Sejwal - 24MCI10023 - ML Lab - Worksheet 1
No ratings yet
Kritika Sejwal - 24MCI10023 - ML Lab - Worksheet 1
6 pages
Linear Regression Analysis - Polynomial Regression
No ratings yet
Linear Regression Analysis - Polynomial Regression
25 pages
Data Mining Final Assignment
No ratings yet
Data Mining Final Assignment
4 pages
ML Lab File Final
No ratings yet
ML Lab File Final
17 pages
Machinelearning
No ratings yet
Machinelearning
26 pages
Ex No.: Date: Problem Statement
No ratings yet
Ex No.: Date: Problem Statement
3 pages
Document From Jahnavi
No ratings yet
Document From Jahnavi
20 pages
Machine Learning-SEAIML-241P (PR) Bharat
No ratings yet
Machine Learning-SEAIML-241P (PR) Bharat
42 pages
Machine Learnin
100% (2)
Machine Learnin
23 pages
Regression Analysis - Lasso and Ridge Regularization
No ratings yet
Regression Analysis - Lasso and Ridge Regularization
17 pages
ML - Assignment 1ipynb - Colab
No ratings yet
ML - Assignment 1ipynb - Colab
5 pages
I Implementation of Regression
No ratings yet
I Implementation of Regression
6 pages
Capstone Project Report 2
No ratings yet
Capstone Project Report 2
178 pages
Ads Exp 4
No ratings yet
Ads Exp 4
4 pages
Assignment 1
No ratings yet
Assignment 1
4 pages
P05 The Regression Pipeline - Training and Testing Ans
No ratings yet
P05 The Regression Pipeline - Training and Testing Ans
13 pages
Experiment No.:1: Program
No ratings yet
Experiment No.:1: Program
7 pages
Assignment 2 - LP1
No ratings yet
Assignment 2 - LP1
7 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
Ayush File 1
No ratings yet
Ayush File 1
37 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet
12795/lpi Intercity Second Sitting (2S) : WL WL
No ratings yet
12795/lpi Intercity Second Sitting (2S) : WL WL
3 pages
IEEE ICoEIT 2025
100% (1)
IEEE ICoEIT 2025
2 pages
Assignment II 4
No ratings yet
Assignment II 4
2 pages
Eea CH - 3
No ratings yet
Eea CH - 3
69 pages
GRU-based Digital Twin Framework For Data Allocation (1) - Read-Only
No ratings yet
GRU-based Digital Twin Framework For Data Allocation (1) - Read-Only
8 pages
Siguranta Elastica SEEGER Arbore As DIN 471
No ratings yet
Siguranta Elastica SEEGER Arbore As DIN 471
1 page
BRM File Krrish Girotra
No ratings yet
BRM File Krrish Girotra
41 pages
ETech Business Card
No ratings yet
ETech Business Card
2 pages
STT WK 11 Lec 21 22
No ratings yet
STT WK 11 Lec 21 22
11 pages
Assign 1
No ratings yet
Assign 1
1 page
Univariate, Bivariate & Multivariate Analysis
No ratings yet
Univariate, Bivariate & Multivariate Analysis
6 pages
Statistics
No ratings yet
Statistics
99 pages
Assignment II Stat I
No ratings yet
Assignment II Stat I
1 page
Stats
No ratings yet
Stats
5 pages
Exerc Icio Computacional - Regress Ao Linear: Universidade Federal de Minas Gerais
No ratings yet
Exerc Icio Computacional - Regress Ao Linear: Universidade Federal de Minas Gerais
15 pages
Anderson Et Al. 2020 - Chap 3 Descriptive Statistics
No ratings yet
Anderson Et Al. 2020 - Chap 3 Descriptive Statistics
70 pages
Biostatistik: (Uji Statistik Chi Square, Mann Whitney Dan Wilcoxon)
No ratings yet
Biostatistik: (Uji Statistik Chi Square, Mann Whitney Dan Wilcoxon)
8 pages
Lecture 11 Correlation Edited
No ratings yet
Lecture 11 Correlation Edited
32 pages
Levels of Quantitative Description
No ratings yet
Levels of Quantitative Description
2 pages
Worksheet No. 4: NAME: - COURSE
No ratings yet
Worksheet No. 4: NAME: - COURSE
15 pages
Output Uji Validitas Dan Reliabilitas
No ratings yet
Output Uji Validitas Dan Reliabilitas
2 pages
STA408 Appendix
No ratings yet
STA408 Appendix
2 pages
Ans Data Analysis SAC 2019
No ratings yet
Ans Data Analysis SAC 2019
16 pages
2 Pearson Correlation
No ratings yet
2 Pearson Correlation
7 pages
Meta Analysis Jamovi Author Year
No ratings yet
Meta Analysis Jamovi Author Year
2 pages
Lecture Guide in Math009: Probability and Statistics
0% (1)
Lecture Guide in Math009: Probability and Statistics
44 pages
Basic Business Statistics Concepts and Applications 12th Edition Berenson Solutions Manualpdf Download
100% (6)
Basic Business Statistics Concepts and Applications 12th Edition Berenson Solutions Manualpdf Download
51 pages
Unified DLL - Q3 - W8
No ratings yet
Unified DLL - Q3 - W8
13 pages
Pengunaan Aplikasi Merdeka Mengajar Dalam Meningkatkan Hasil Belajar Siswa Pada Sekolah Penggerak
No ratings yet
Pengunaan Aplikasi Merdeka Mengajar Dalam Meningkatkan Hasil Belajar Siswa Pada Sekolah Penggerak
12 pages
Anderson and Hsiao (1981)
No ratings yet
Anderson and Hsiao (1981)
10 pages
Correlation Analysis
No ratings yet
Correlation Analysis
54 pages
Mean Median and Mode For Grouped Data
No ratings yet
Mean Median and Mode For Grouped Data
4 pages
Measures of Position
No ratings yet
Measures of Position
17 pages
Estimating Risk and Return On Assets
No ratings yet
Estimating Risk and Return On Assets
28 pages