0% found this document useful (0 votes)

173 views3 pages

California Housing Dataset

The document loads and explores housing data from California. It imports necessary libraries, loads and summarizes the data, creates various visualizations of the data including histograms, scatter plots, and heatmaps. It then performs machine learning by splitting the data, fitting a linear regression model, and evaluating the model performance.

Uploaded by

Anas Ishaq

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

173 views3 pages

California Housing Dataset

Uploaded by

Anas Ishaq

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Importing Libraries

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px
from sklearn.datasets import fetch_california_housing
sns.set()
%matplotlib inline

A:\Anaconda\lib\site-packages\scipy\__init__.py:155: UserWarning: A
NumPy version >=1.18.5 and <1.25.0 is required for this version of
SciPy (detected version 1.26.3
warnings.warn(f"A NumPy version >={np_minversion} and
<{np_maxversion}"

Loading Data
house = fetch_california_housing(data_home=None,
download_if_missing=True, return_X_y=False, as_frame=True)
df = house.data
df['MedHouseValue'] = house.target
df.head()

Summary Statistics
df.describe()

Visualizations for complete DataFrame

Histogram for all columns
df.hist(bins=50, figsize=(12,8))
plt.show()

MedInc VS MedHouseValue
px.scatter(df,x='MedInc',y='MedHouseValue')
Housing Value based on Location
px.scatter(df, x="Longitude",y="Latitude",
color='MedHouseValue',size='Population')

import folium
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors
import numpy as np
import branca.colormap as cm

# Assuming df is your DataFrame

# Normalize 'MedHouseValue' column for color mapping
medhv_norm = (df['MedHouseValue'] - df['MedHouseValue'].min()) /
(df['MedHouseValue'].max() - df['MedHouseValue'].min())

# Create a colormap
colormap = plt.cm.viridis

# Create a LinearColormap for the legend

min_medhv = df['MedHouseValue'].min()
max_medhv = df['MedHouseValue'].max()
linear = cm.LinearColormap([mcolors.rgb2hex(colormap(i)) for i in
np.linspace(0, 1, colormap.N)],
vmin=min_medhv, vmax=max_medhv,
caption='Median House Value') # Caption
for the legend

# Create a map centered around California

map_california = folium.Map(location=[36.7783, -119.4179],
zoom_start=6)

# Add points to the map with colors based on 'MedHouseValue'

for index, row in df.iterrows():
# Get normalized 'MedHouseValue' value for the current row
norm_value = medhv_norm.iloc[index]
# Get color from colormap
color = mcolors.rgb2hex(colormap(norm_value))

folium.CircleMarker([row['Latitude'], row['Longitude']],
radius=5, # Size of the marker
fill=True,
fill_color=color,
color=None,
fill_opacity=0.7).add_to(map_california)

# Add the colormap to the map as a legend

map_california.add_child(linear)
# Display the map
map_california

Visualizations for a random chunk of DataFrame

chunk = df[2000:3000]
chunk.describe()

MedInc VS MedHouseValue
px.scatter(chunk,x='MedInc',y='MedHouseValue')

AveRooms VS MedHouseValue
px.scatter(chunk,x='AveRooms',y='MedHouseValue')

Heatmap
cor = df.corr()
sns.heatmap(cor, annot=True,fmt='.2f')

Machine Learning
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

X =
df.drop(['MedHouseValue','Population','AveOccup','AveBedrms'],axis=1)
Y = df[['MedHouseValue']]
xtrain, xtest, ytrain, ytest = train_test_split(X, Y, test_size=0.4,
random_state=42)

model = LinearRegression().fit(xtrain,ytrain)
pred = model.predict(xtest)

from sklearn.metrics import mean_squared_error, r2_score

r2 = r2_score(ytest, pred)
print("R-squared:", r2)

Untitled6.Ipynb - Colab
No ratings yet
Untitled6.Ipynb - Colab
6 pages
House Price Prediction: # Importing Necessary Libraries
No ratings yet
House Price Prediction: # Importing Necessary Libraries
18 pages
Linear Regression Analysis - Polynomial Regression
No ratings yet
Linear Regression Analysis - Polynomial Regression
25 pages
Example Project California Data Anaylsis Jupyter Notebook
No ratings yet
Example Project California Data Anaylsis Jupyter Notebook
28 pages
Unit 1: Shobana T S Assistant Professor Dept. of ISE, BMSCE
No ratings yet
Unit 1: Shobana T S Assistant Professor Dept. of ISE, BMSCE
127 pages
Machine Learning (BCSL606) Lab Manual
No ratings yet
Machine Learning (BCSL606) Lab Manual
117 pages
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
No ratings yet
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
12 pages
Injecttive Blockchain
No ratings yet
Injecttive Blockchain
14 pages
Machine Learning (BCSL606) Lab Manual
No ratings yet
Machine Learning (BCSL606) Lab Manual
117 pages
House Pricing
No ratings yet
House Pricing
15 pages
USA Real Estate Price Prediction Using Decision Tree Regressor, and AdaBoost Regressor
No ratings yet
USA Real Estate Price Prediction Using Decision Tree Regressor, and AdaBoost Regressor
14 pages
Week 6 LAB
No ratings yet
Week 6 LAB
13 pages
Unit 2
No ratings yet
Unit 2
78 pages
Faseeh Chap 2 Report
No ratings yet
Faseeh Chap 2 Report
30 pages
ABHAYMLFILE
No ratings yet
ABHAYMLFILE
16 pages
P04 The Regression Pipeline - Preprocessing Ans
No ratings yet
P04 The Regression Pipeline - Preprocessing Ans
19 pages
Machine Learning Laboratory
No ratings yet
Machine Learning Laboratory
23 pages
Assignment 2
No ratings yet
Assignment 2
12 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
33 pages
FALLSEM2021-22 MDI4001 ETH VL2021220104135 Reference Material I 09-Aug-2021 Data2 1
No ratings yet
FALLSEM2021-22 MDI4001 ETH VL2021220104135 Reference Material I 09-Aug-2021 Data2 1
9 pages
ISMLA Module5
No ratings yet
ISMLA Module5
25 pages
ML Lab Manual
No ratings yet
ML Lab Manual
60 pages
Emllab
No ratings yet
Emllab
6 pages
Boston House Prediction - Colab1
No ratings yet
Boston House Prediction - Colab1
10 pages
ML 3
No ratings yet
ML 3
24 pages
02 End To End Machine Learning Project
No ratings yet
02 End To End Machine Learning Project
26 pages
1684918425867
No ratings yet
1684918425867
14 pages
California Housing Project
No ratings yet
California Housing Project
5 pages
Python
No ratings yet
Python
4 pages
ML Lab Program 1& 2
No ratings yet
ML Lab Program 1& 2
6 pages
House Price Prediction: Project Description
No ratings yet
House Price Prediction: Project Description
11 pages
ML Assignment1
No ratings yet
ML Assignment1
4 pages
Tarea - Prediccion de Casas en California
No ratings yet
Tarea - Prediccion de Casas en California
5 pages
ML Observation
No ratings yet
ML Observation
29 pages
End To End Machine Learning Project-2
No ratings yet
End To End Machine Learning Project-2
10 pages
House Price Prediction Models
No ratings yet
House Price Prediction Models
16 pages
Report
No ratings yet
Report
40 pages
CatBoost - An In-Depth Guide Python
No ratings yet
CatBoost - An In-Depth Guide Python
33 pages
Exp 3 ML
No ratings yet
Exp 3 ML
3 pages
Normialization Dataset
No ratings yet
Normialization Dataset
7 pages
ML Manual
No ratings yet
ML Manual
9 pages
Machine Learning Life Cycle Report
No ratings yet
Machine Learning Life Cycle Report
2 pages
List of Union
No ratings yet
List of Union
113 pages
Setup: Chapter 2 - End-To-End Machine Learning Project
No ratings yet
Setup: Chapter 2 - End-To-End Machine Learning Project
31 pages
Week 1 Get Familier With Jupyter Notebook
No ratings yet
Week 1 Get Familier With Jupyter Notebook
4 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
20 pages
DAVL PR1.2 Mit
No ratings yet
DAVL PR1.2 Mit
10 pages
Least Square Method
No ratings yet
Least Square Method
2 pages
Project 4 - House Price Prediction - Ipynb - Colab
No ratings yet
Project 4 - House Price Prediction - Ipynb - Colab
5 pages
2 Program
No ratings yet
2 Program
8 pages
Regression Analysis - Lasso and Ridge Regularization
No ratings yet
Regression Analysis - Lasso and Ridge Regularization
17 pages
ML Lab - Exp1-10
No ratings yet
ML Lab - Exp1-10
4 pages
Machine Learning Labnem
No ratings yet
Machine Learning Labnem
5 pages
7 A
No ratings yet
7 A
2 pages
Import As Import As From Import: "Mean Squared Errors: "
No ratings yet
Import As Import As From Import: "Mean Squared Errors: "
1 page
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
Updated 1,2,3, Programs
No ratings yet
Updated 1,2,3, Programs
3 pages
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
Mexico City Price Prediction
No ratings yet
Mexico City Price Prediction
5 pages
DSBDA Prac4 2
No ratings yet
DSBDA Prac4 2
1 page
Programa Analisis de Armaduras en 2D Con Python - Edwin Alarcon
No ratings yet
Programa Analisis de Armaduras en 2D Con Python - Edwin Alarcon
15 pages
Matlab 6
No ratings yet
Matlab 6
296 pages
Advance Mathematics: Dosen Pengampu: Indrazno Siradjuddin, ST., MT., PH.D
No ratings yet
Advance Mathematics: Dosen Pengampu: Indrazno Siradjuddin, ST., MT., PH.D
6 pages
Labview Core 2 Course Manual - Instruments Not For Distribution - PDF - Control Flow - Subroutine
No ratings yet
Labview Core 2 Course Manual - Instruments Not For Distribution - PDF - Control Flow - Subroutine
270 pages
Three-Dimensional Plotting in Python Using Matplotlib
No ratings yet
Three-Dimensional Plotting in Python Using Matplotlib
5 pages
Lab de Control Analogo - PDF Tarea 5 FLOWER ARIAS
No ratings yet
Lab de Control Analogo - PDF Tarea 5 FLOWER ARIAS
17 pages
CN - W04 - Transmission Impairments and Data Rate Limitations
No ratings yet
CN - W04 - Transmission Impairments and Data Rate Limitations
46 pages
CN - W02 - Network Fundamentals
No ratings yet
CN - W02 - Network Fundamentals
44 pages
CN - W07 - Error Detection and Correction (Block Codes)
No ratings yet
CN - W07 - Error Detection and Correction (Block Codes)
57 pages
CN - W01 - Introdcution
No ratings yet
CN - W01 - Introdcution
25 pages
CN - W05 - Digital Transmission
No ratings yet
CN - W05 - Digital Transmission
40 pages
Hands On NumPy?-1
No ratings yet
Hands On NumPy?-1
27 pages
CN - W03 - Transmission Media
No ratings yet
CN - W03 - Transmission Media
33 pages
2) Basic Chart Reading
No ratings yet
2) Basic Chart Reading
39 pages
Ploting Bessel Function
No ratings yet
Ploting Bessel Function
3 pages
DSP Assignment
No ratings yet
DSP Assignment
19 pages
Lab1.ipynb - Colab
No ratings yet
Lab1.ipynb - Colab
5 pages
CN - W06 - PCM For Analog To Digital Conversion
No ratings yet
CN - W06 - PCM For Analog To Digital Conversion
18 pages
Stat - Lab 1
No ratings yet
Stat - Lab 1
6 pages
Finding Partial Derivatives and Jacobians .Ipynb - Colab
No ratings yet
Finding Partial Derivatives and Jacobians .Ipynb - Colab
7 pages
Numpy Mathlib
No ratings yet
Numpy Mathlib
9 pages
Warn Project1
No ratings yet
Warn Project1
17 pages
Computer Networks - Course Guide (BSDS-AI-IV, Spring 2024)
No ratings yet
Computer Networks - Course Guide (BSDS-AI-IV, Spring 2024)
6 pages
Dicky Pramana Agung
No ratings yet
Dicky Pramana Agung
31 pages
Import Numpy As NP
No ratings yet
Import Numpy As NP
7 pages
Matrices Parte 2 - Jupyter Notebook
No ratings yet
Matrices Parte 2 - Jupyter Notebook
20 pages
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
No ratings yet
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
5 pages
Array-Numpy-Quiz - Attempt Review
No ratings yet
Array-Numpy-Quiz - Attempt Review
10 pages
Class 12 IP Practice Assignment Series 9
No ratings yet
Class 12 IP Practice Assignment Series 9
3 pages
TP Vision 3
No ratings yet
TP Vision 3
9 pages
Q1.ipynb - Colab
No ratings yet
Q1.ipynb - Colab
3 pages
California Housing Dataset
No ratings yet
California Housing Dataset
3 pages
Application Qui Permet de Visionner La Résolution D'un Programme Linéaire
No ratings yet
Application Qui Permet de Visionner La Résolution D'un Programme Linéaire
3 pages
Untitled10 - Jupyter Notebook
No ratings yet
Untitled10 - Jupyter Notebook
9 pages
Upyter Notebook1
No ratings yet
Upyter Notebook1
5 pages
Buổi 10 - Bài tập 1 (Python)
No ratings yet
Buổi 10 - Bài tập 1 (Python)
3 pages
Matplotlib - Pyplot PLT Numpy NP Scipy Seaborn Sns Scipy Random
No ratings yet
Matplotlib - Pyplot PLT Numpy NP Scipy Seaborn Sns Scipy Random
4 pages
Aaa3 Manifes
No ratings yet
Aaa3 Manifes
5 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

California Housing Dataset

Uploaded by

California Housing Dataset

Uploaded by

Importing Libraries

Visualizations for complete DataFrame

# Assuming df is your DataFrame

# Create a LinearColormap for the legend

# Create a map centered around California

# Add points to the map with colors based on 'MedHouseValue'

# Add the colormap to the map as a legend

Visualizations for a random chunk of DataFrame

from sklearn.metrics import mean_squared_error, r2_score

You might also like