least square method

The document outlines a Python script for analyzing the California Housing dataset using libraries such as pandas, numpy, and scikit-learn. It includes steps for exploratory data analysis, data visualization, and the implementation of a linear regression model to predict median house values. The script also evaluates the model's performance using mean squared error and R-squared metrics.

Uploaded by

Dhivya Venkatesan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views2 pages

least square method

Uploaded by

Dhivya Venkatesan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

# Import necessary libraries

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Load the California Housing dataset

housing_data = fetch_california_housing()
X = housing_data.data # Features
y = housing_data.target # Target variable (median house value)
feature_names = housing_data.feature_names

# Create a DataFrame from the data and feature names

df = pd.DataFrame(X, columns=feature_names)
df['Target'] = y

# Perform Basic EDA(Exploratory Data Analysis)

# Display the first few rows
print("First few rows of the dataset:")
print(df.head())

# Display summary statistics

print("\nSummary statistics:")
print(df.describe())

# Check for missing values

print("\nMissing values:")
print(df.isnull().sum())

# Data types of each column

print("\nData types:")
print(df.dtypes)

# Histograms of features
df.hist(figsize=(12, 10), bins=20)
plt.suptitle('Histogram of Features')
plt.show()

# Scatter plot of a feature vs. target

feature = 'MedInc' # Choose 'MedInc' (Median Income) as an example feature
32
B.Tech / M.Tech (Integrated) Programmes-Regulations 2021-Volume-11-CSE-Higher Semester Syllabi-Control Copy
plt.figure(figsize=(8, 6))
plt.scatter(df[feature], df['Target'], alpha=0.5)
plt.title(f'Scatter Plot: {feature} vs. Target')
plt.xlabel(feature)
plt.ylabel('Target (Median House Value)')
plt.grid(True)
plt.show()

# Split the data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Create a Linear Regression model

model = LinearRegression()

# Train the model on the training data

model.fit(X_train, y_train)

# Make predictions on the test data

y_pred = model.predict(X_test)

# Evaluate the model

mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

# Print the results

print(f"\nMean Squared Error: {mse}")
print(f"R-squared: {r2}")

# Plot the regression line

plt.figure(figsize=(8, 6))
plt.scatter(X_test[:, 0], y_test, color='blue', label='Actual')
plt.plot(X_test[:, 0], y_pred, color='red', linewidth=2, label='Predicted')
plt.title('Regression Line (Feature: MedInc)')
plt.xlabel('MedInc')
plt.ylabel('Target (Median House Value)')
plt.legend()
plt.grid(True)
plt.show()

32
B.Tech / M.Tech (Integrated) Programmes-Regulations 2021-Volume-11-CSE-Higher Semester Syllabi-Control Copy

Machine Learning(BCSL606) Lab Manual
No ratings yet
Machine Learning(BCSL606) Lab Manual
117 pages
ayush file 1
No ratings yet
ayush file 1
37 pages
Dav practicals
No ratings yet
Dav practicals
33 pages
Dsbdal Lab Manual
No ratings yet
Dsbdal Lab Manual
107 pages
Data Science Record_05
No ratings yet
Data Science Record_05
20 pages
Machine Learning Labnem (1) (1)
No ratings yet
Machine Learning Labnem (1) (1)
5 pages
ml manual
No ratings yet
ml manual
9 pages
22CS11D1
No ratings yet
22CS11D1
3 pages
ML Lab Manual
No ratings yet
ML Lab Manual
36 pages
DLWP Assignment 2
No ratings yet
DLWP Assignment 2
2 pages
ML LAB_EXP1-10
No ratings yet
ML LAB_EXP1-10
4 pages
Week 1 Get familier with Jupyter Notebook
No ratings yet
Week 1 Get familier with Jupyter Notebook
4 pages
DSBDAL Lab Manual
No ratings yet
DSBDAL Lab Manual
26 pages
Machine Learning(BCSL606) Lab Manual (2) (1)
No ratings yet
Machine Learning(BCSL606) Lab Manual (2) (1)
117 pages
Week 2
No ratings yet
Week 2
2 pages
Machine Learning Lab Manual (1)
No ratings yet
Machine Learning Lab Manual (1)
33 pages
Exercise2_Problem
No ratings yet
Exercise2_Problem
1 page
Data Science Manual
No ratings yet
Data Science Manual
155 pages
List of Experiment - Data Analysis Lab
No ratings yet
List of Experiment - Data Analysis Lab
2 pages
Ml Manual
No ratings yet
Ml Manual
30 pages
Ankit Python
No ratings yet
Ankit Python
26 pages
data analytics lab manual
No ratings yet
data analytics lab manual
26 pages
ml observation
No ratings yet
ml observation
29 pages
lab manual ML.docx
No ratings yet
lab manual ML.docx
26 pages
A1 Exploratory and Descriptive Data Analysis
No ratings yet
A1 Exploratory and Descriptive Data Analysis
1 page
L03 The Regression Pipeline
No ratings yet
L03 The Regression Pipeline
94 pages
20MIS1025 - Regression - Ipynb - Colaboratory
No ratings yet
20MIS1025 - Regression - Ipynb - Colaboratory
5 pages
California Housing Dataset
No ratings yet
California Housing Dataset
3 pages
Machine Learning Laboratory
No ratings yet
Machine Learning Laboratory
23 pages
Machinelearninglabmanual
No ratings yet
Machinelearninglabmanual
47 pages
ML Lab program 1& 2
No ratings yet
ML Lab program 1& 2
6 pages
ML LAB - BCSL606
No ratings yet
ML LAB - BCSL606
67 pages
Continuous Assessment
No ratings yet
Continuous Assessment
4 pages
External
No ratings yet
External
11 pages
ds
No ratings yet
ds
28 pages
SL-III Lab Manual
No ratings yet
SL-III Lab Manual
74 pages
23bet10114 Naman Gupta Assignment-1
No ratings yet
23bet10114 Naman Gupta Assignment-1
17 pages
Lab_questionbank
No ratings yet
Lab_questionbank
3 pages
Ml Lab Manual
No ratings yet
Ml Lab Manual
60 pages
Boston House Prediction - Colab1
No ratings yet
Boston House Prediction - Colab1
10 pages
ML Final Prac
No ratings yet
ML Final Prac
47 pages
ML lab manual
No ratings yet
ML lab manual
25 pages
Assignment Mini Project_5_6_920241107180304
No ratings yet
Assignment Mini Project_5_6_920241107180304
1 page
Set 2
No ratings yet
Set 2
3 pages
DATASCIENCE (1)
No ratings yet
DATASCIENCE (1)
3 pages
PR LIST DSBDA
No ratings yet
PR LIST DSBDA
2 pages
Week 11 Regression Analysis
No ratings yet
Week 11 Regression Analysis
23 pages
California Housing Project
No ratings yet
California Housing Project
5 pages
DSBDA Lab Plan
No ratings yet
DSBDA Lab Plan
5 pages
Report
No ratings yet
Report
40 pages
P04 The Regression Pipeline - Preprocessing Ans
No ratings yet
P04 The Regression Pipeline - Preprocessing Ans
19 pages
CS 3362 FDS
No ratings yet
CS 3362 FDS
53 pages
ML 1-11
No ratings yet
ML 1-11
27 pages
Linear Reg
No ratings yet
Linear Reg
25 pages
Data Science
No ratings yet
Data Science
18 pages
DSBDA LAB - MANUAL (Autosaved) - Sd1-Converted-1-2
100% (1)
DSBDA LAB - MANUAL (Autosaved) - Sd1-Converted-1-2
256 pages
Syllabus AIML
No ratings yet
Syllabus AIML
14 pages
Some Exercises
No ratings yet
Some Exercises
9 pages
Applied economic forecasting using time series methods Ghysels All Chapters Instant Download
100% (2)
Applied economic forecasting using time series methods Ghysels All Chapters Instant Download
66 pages
House Price Prediction: Project Description
No ratings yet
House Price Prediction: Project Description
11 pages
Lesson 4 TEST OF DIFFERENCE
No ratings yet
Lesson 4 TEST OF DIFFERENCE
26 pages
LESSON 4 - MEASURES OF CENTRAL TENDENCY
No ratings yet
LESSON 4 - MEASURES OF CENTRAL TENDENCY
53 pages
Ridge Regression: Ryota Tomioka Department of Mathema6cal Informa6cs The University of Tokyo
No ratings yet
Ridge Regression: Ryota Tomioka Department of Mathema6cal Informa6cs The University of Tokyo
53 pages
MCQ of Statistics & Probability: Measures of Central Tendencies and Dispersion
No ratings yet
MCQ of Statistics & Probability: Measures of Central Tendencies and Dispersion
60 pages
Contractor Loyalty
No ratings yet
Contractor Loyalty
22 pages
[Cotton] sildes
No ratings yet
[Cotton] sildes
39 pages
Data Mining
60% (10)
Data Mining
25 pages
Psy 234 Week 13
No ratings yet
Psy 234 Week 13
27 pages
Immediate Download Behavioral Sciences STAT (New, Engaging Titles From 4LTR Press) 2nd Edition, (Ebook PDF) Ebooks 2024
100% (1)
Immediate Download Behavioral Sciences STAT (New, Engaging Titles From 4LTR Press) 2nd Edition, (Ebook PDF) Ebooks 2024
25 pages
DBDAL LAB - MANUAL - Final
No ratings yet
DBDAL LAB - MANUAL - Final
93 pages
Introduction To Biostatistics Syllabus
No ratings yet
Introduction To Biostatistics Syllabus
8 pages
23542-Article Text-77325-84430-10-20230131
No ratings yet
23542-Article Text-77325-84430-10-20230131
7 pages
Cbsnews 20241030 PA Senate
No ratings yet
Cbsnews 20241030 PA Senate
7 pages
A Study On The Customer Awareness of E-Banking Services in Madurai City
No ratings yet
A Study On The Customer Awareness of E-Banking Services in Madurai City
16 pages
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
From Everand
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
Manish Soni
No ratings yet
Two-Sample T-Tests Assuming Equal Variance
No ratings yet
Two-Sample T-Tests Assuming Equal Variance
19 pages
Final Exam QM1102 2020
No ratings yet
Final Exam QM1102 2020
11 pages
401 - Dhruv Agarwal - Assignment 2 - Dhruv Agarwal
No ratings yet
401 - Dhruv Agarwal - Assignment 2 - Dhruv Agarwal
7 pages
12 - Discrete Probability Distributions
No ratings yet
12 - Discrete Probability Distributions
7 pages
Drukker XTDPD
No ratings yet
Drukker XTDPD
34 pages
Assessment in Learning 1 - Measures of Central Tendency and Variation
No ratings yet
Assessment in Learning 1 - Measures of Central Tendency and Variation
1 page
Variable Names:: IV Moderator
No ratings yet
Variable Names:: IV Moderator
3 pages
Mat202 B
No ratings yet
Mat202 B
3 pages
1.pocket Money (Lesson Plan)
No ratings yet
1.pocket Money (Lesson Plan)
3 pages
Mathematics: Answer Key
No ratings yet
Mathematics: Answer Key
3 pages
I PUC Statistics Mock Paper I
No ratings yet
I PUC Statistics Mock Paper I
3 pages
Course Outline in StatisticsProbability
No ratings yet
Course Outline in StatisticsProbability
4 pages
LEC 9 - Measures of Variability
No ratings yet
LEC 9 - Measures of Variability
16 pages
2019 3 Me Smkma A
No ratings yet
2019 3 Me Smkma A
5 pages
Noc20-Cs28 Week 07 Assignment 02
No ratings yet
Noc20-Cs28 Week 07 Assignment 02
6 pages