0% found this document useful (0 votes)

8 views6 pages

ML Assignment 3

The document contains a Jupyter notebook that analyzes temperature data from a CSV file using Python libraries such as pandas, numpy, seaborn, and sklearn. It includes data loading, exploration, and a linear regression model to predict annual temperatures based on the year. The notebook also visualizes the data and results using scatter plots and line plots.

Uploaded by

lucifer267302

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views6 pages

ML Assignment 3

Uploaded by

lucifer267302

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

9/19/24, 1:25 AM Assign3.

ipynb - Colab

import numpy as np;

import pandas as pd;
import seaborn as sns;

df = pd.read_csv('temperatures.csv');

JAN- MAR- JUN- OCT-

YEAR JAN FEB MAR APR MAY JUN JUL AUG SEP OCT NOV DEC ANNUAL
FEB MAY SEP DEC

0 1901 22.40 24.14 29.07 31.91 33.41 33.18 31.21 30.39 30.47 29.97 27.31 24.49 28.96 23.27 31.46 31.27 27.25

1 1902 24.93 26.58 29.77 31.78 33.73 32.91 30.92 30.73 29.80 29.12 26.31 24.04 29.22 25.75 31.76 31.09 26.49

2 1903 23.44 25.03 27.83 31.39 32.91 33.00 31.34 29.98 29.85 29.04 26.08 23.65 28.47 24.24 30.71 30.92 26.26

3 1904 22.50 24.73 28.21 32.02 32.64 32.07 30.36 30.09 30.04 29.20 26.36 23.63 28.49 23.62 30.95 30.66 26.40

4 1905 22.00 22.83 26.68 30.01 33.32 33.25 31.44 30.68 30.12 30.67 27.52 23.82 28.30 22.25 30.00 31.33 26.57

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

112 2013 24.56 26.59 30.62 32.66 34.46 32.44 31.07 30.76 31.04 30.27 27.83 25.37 29.81 25.58 32.58 31.33 27.83

113 2014 23.83 25.97 28.95 32.74 33.77 34.15 31.85 31.32 30.68 30.29 28.05 25.08 29.72 24.90 31.82 32.00 27.81

114 2015 24.58 26.89 29.07 31.87 34.09 32.48 31.88 31.52 31.55 31.04 28.10 25.67 29.90 25.74 31.68 31.87 28.27

115 2016 26.94 29.72 32.62 35.38 35.72 34.03 31.64 31.79 31.66 31.98 30.11 28.01 31.63 28.33 34.57 32.28 30.03

116 2017 26.45 29.46 31.60 34.95 35.84 33.82 31.88 31.72 32.22 32.29 29.60 27.18 31.42 27.95 34.13 32.41 29.69

Next steps: Generate code with df

toggle_off View recommended plots New interactive sheet

df.head()

JAN- MAR- JUN- OCT-

YEAR JAN FEB MAR APR MAY JUN JUL AUG SEP OCT NOV DEC ANNUAL
FEB MAY SEP DEC

0 1901 22.40 24.14 29.07 31.91 33.41 33.18 31.21 30.39 30.47 29.97 27.31 24.49 28.96 23.27 31.46 31.27 27.25

1 1902 24.93 26.58 29.77 31.78 33.73 32.91 30.92 30.73 29.80 29.12 26.31 24.04 29.22 25.75 31.76 31.09 26.49

2 1903 23.44 25.03 27.83 31.39 32.91 33.00 31.34 29.98 29.85 29.04 26.08 23.65 28.47 24.24 30.71 30.92 26.26

3 1904 22.50 24.73 28.21 32.02 32.64 32.07 30.36 30.09 30.04 29.20 26.36 23.63 28.49 23.62 30.95 30.66 26.40

Next steps: Generate code with df

toggle_off View recommended plots New interactive sheet

df.describe()

YEAR JAN FEB MAR APR MAY JUN JUL AUG SEP

count 117.000000 117.000000 117.000000 117.000000 117.000000 117.000000 117.000000 117.000000 117.000000 117.000000 11

mean 1959.000000 23.687436 25.597863 29.085983 31.975812 33.565299 32.774274 31.035897 30.507692 30.486752 2

std 33.919021 0.834588 1.150757 1.068451 0.889478 0.724905 0.633132 0.468818 0.476312 0.544295

min 1901.000000 22.000000 22.830000 26.680000 30.010000 31.930000 31.100000 29.760000 29.310000 29.070000 2

25% 1930.000000 23.100000 24.780000 28.370000 31.460000 33.110000 32.340000 30.740000 30.180000 30.120000 2

50% 1959.000000 23.680000 25.480000 29.040000 31.950000 33.510000 32.730000 31.000000 30.540000 30.520000 2

75% 1988.000000 24.180000 26.310000 29.610000 32.420000 34.030000 33.180000 31.330000 30.760000 30.810000 3

max 2017.000000 26.940000 29.720000 32.620000 35.380000 35.840000 34.480000 32.760000 31.840000 32.220000 3

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

https://colab.research.google.com/drive/1L9zJu37fpdH7-NNEF-eDo8yJhKRP_GR9?authuser=0#scrollTo=jAOEaTids7wx&printMode=true 1/6
9/19/24, 1:25 AM Assign3.ipynb - Colab

df.tail()

JAN- MAR- JUN- OCT-

YEAR JAN FEB MAR APR MAY JUN JUL AUG SEP OCT NOV DEC ANNUAL
FEB MAY SEP DEC

112 2013 24.56 26.59 30.62 32.66 34.46 32.44 31.07 30.76 31.04 30.27 27.83 25.37 29.81 25.58 32.58 31.33 27.83

113 2014 23.83 25.97 28.95 32.74 33.77 34.15 31.85 31.32 30.68 30.29 28.05 25.08 29.72 24.90 31.82 32.00 27.81

114 2015 24.58 26.89 29.07 31.87 34.09 32.48 31.88 31.52 31.55 31.04 28.10 25.67 29.90 25.74 31.68 31.87 28.27

115 2016 26.94 29.72 32.62 35.38 35.72 34.03 31.64 31.79 31.66 31.98 30.11 28.01 31.63 28.33 34.57 32.28 30.03

df.shape

(117, 18)

df.sum().isnull()

YEAR False

JAN False

FEB False

MAR False

APR False

MAY False

JUN False

JUL False

AUG False

SEP False

OCT False

NOV False

DEC False

ANNUAL False

JAN-FEB False

MAR-MAY False

JUN-SEP False

OCT-DEC False

df.isnull().sum()

https://colab.research.google.com/drive/1L9zJu37fpdH7-NNEF-eDo8yJhKRP_GR9?authuser=0#scrollTo=jAOEaTids7wx&printMode=true 2/6
9/19/24, 1:25 AM Assign3.ipynb - Colab

YEAR 0

JAN 0

FEB 0

MAR 0

APR 0

MAY 0

JUN 0

JUL 0

AUG 0

SEP 0

OCT 0

NOV 0

DEC 0

ANNUAL 0

JAN-FEB 0

MAR-MAY 0

JUN-SEP 0

OCT-DEC 0

x = df["YEAR"]
y = df["ANNUAL"]

plt.plot(x,y,'o')

[<matplotlib.lines.Line2D at 0x7b7259bea350>]

sns.scatterplot(x=x,y=y,data=df)

https://colab.research.google.com/drive/1L9zJu37fpdH7-NNEF-eDo8yJhKRP_GR9?authuser=0#scrollTo=jAOEaTids7wx&printMode=true 3/6
9/19/24, 1:25 AM Assign3.ipynb - Colab

<Axes: xlabel='YEAR', ylabel='ANNUAL'>

x_train, x_test, y_train, y_test = train_test_split(x, y,test_size=0.25)

print(f"x Training dataset: {x_train.shape}")

print(f"y Training dataset: {y_train.shape}")
print(f"x test dataset: {x_test.shape}")
print(f"y test dataset: {y_test.shape}")

x Training dataset: (87,)

y Training dataset: (87,)
x test dataset: (30,)
y test dataset: (30,)

model = LinearRegression()

type(x)

pandas.core.series.Series
def __init__(data=None, index=None, dtype: Dtype | None=None, name=None, copy: bool | None=None,
fastpath: bool=False) -> None

/usr/local/lib/python3.10/dist-packages/pandas/core/series.py
One-dimensional ndarray with axis labels (including time series).

Labels need not be unique but must be a hashable type. The object
supports both integer- and label-based indexing and provides a host of

x.shape

(117,)

x = x.values

x = x.reshape(117,1)

x.shape

(117, 1)

type(x)

numpy.ndarray

x_train, x_test, y_train, y_test = train_test_split(x, y,test_size=0.25)

print(f"x Training dataset: {x_train.shape}")

print(f"y Training dataset: {y_train.shape}")

https://colab.research.google.com/drive/1L9zJu37fpdH7-NNEF-eDo8yJhKRP_GR9?authuser=0#scrollTo=jAOEaTids7wx&printMode=true 4/6
9/19/24, 1:25 AM Assign3.ipynb - Colab
print(f"x test dataset: {x_test.shape}")
print(f"y test dataset: {y_test.shape}")

x Training dataset: (87, 1)

y Training dataset: (87,)
x test dataset: (30, 1)
y test dataset: (30,)

model = LinearRegression()

model.fit(x_train,y_train)

▾ LinearRegression
LinearRegression()

model.coef_ #w

array([0.01279507])

model.intercept_ #b

4.1011851987150685

y_pred = model.predict(x_test)

y_pred.shape

(30,)

plt.scatter(x_train, y_train, color='blue')

plt.plot(x_test, y_pred, color='red', linewidth=3)
plt.title("Temperature vs Year")
plt.xlabel("Year")
plt.ylabel("Temperature")
plt.show()

sns.regplot(data=df,x=x_train,y=y_train,)

https://colab.research.google.com/drive/1L9zJu37fpdH7-NNEF-eDo8yJhKRP_GR9?authuser=0#scrollTo=jAOEaTids7wx&printMode=true 5/6
9/19/24, 1:25 AM Assign3.ipynb - Colab

<Axes: ylabel='ANNUAL'>

from sklearn.metrics import mean_absolute_error,mean_squared_error,r2_score

print(f"MSE: {mean_squared_error(y_test,y_pred)}")
print(f"MAE: {mean_absolute_error(y_test,y_pred)}")
print(f"R-Sqaure : {r2_score(y_test,y_pred)}")

MSE: 0.1972410753986664
MAE: 0.30463888560251223
R-Sqaure : 0.48700463368609614

https://colab.research.google.com/drive/1L9zJu37fpdH7-NNEF-eDo8yJhKRP_GR9?authuser=0#scrollTo=jAOEaTids7wx&printMode=true 6/6

AQI Project
No ratings yet
AQI Project
25 pages
Grade 10 Official Book
No ratings yet
Grade 10 Official Book
99 pages
Worksheet on Pandas Dataframe
No ratings yet
Worksheet on Pandas Dataframe
5 pages
SMDM - Cold Storage Project
100% (1)
SMDM - Cold Storage Project
15 pages
Clmmaxt Sha Copy 2
No ratings yet
Clmmaxt Sha Copy 2
317 pages
pandas
No ratings yet
pandas
24 pages
Data Science Complete Theory PPT
No ratings yet
Data Science Complete Theory PPT
884 pages
Class 10 Ai Practical
No ratings yet
Class 10 Ai Practical
7 pages
Python Data Cleaning
100% (1)
Python Data Cleaning
20 pages
Project Report PDF
100% (1)
Project Report PDF
37 pages
Family Nursing Care Plan
100% (1)
Family Nursing Care Plan
2 pages
Months
No ratings yet
Months
63 pages
Months Changed
No ratings yet
Months Changed
60 pages
CSV File
No ratings yet
CSV File
28 pages
05_00_presentación_pandas
No ratings yet
05_00_presentación_pandas
60 pages
Pandas Library
No ratings yet
Pandas Library
5 pages
Pandas Notes: """ Useful Data Analysis Tool """
No ratings yet
Pandas Notes: """ Useful Data Analysis Tool """
11 pages
CSV File Changed
No ratings yet
CSV File Changed
21 pages
41b Data Wrangling, Grouping and Aggregation
No ratings yet
41b Data Wrangling, Grouping and Aggregation
31 pages
Week 10 Intro Time Series
No ratings yet
Week 10 Intro Time Series
34 pages
MLRecord
No ratings yet
MLRecord
24 pages
Notes_241212_120506
No ratings yet
Notes_241212_120506
15 pages
DS (Pandas)
No ratings yet
DS (Pandas)
17 pages
Forecasting with Machine Learning
No ratings yet
Forecasting with Machine Learning
20 pages
Rainfall
No ratings yet
Rainfall
31 pages
ARIMA
No ratings yet
ARIMA
11 pages
Average Changed
No ratings yet
Average Changed
7 pages
C ML2
No ratings yet
C ML2
6 pages
Programming With Python: Contents
No ratings yet
Programming With Python: Contents
28 pages
10 Minutes To Pandas - Pandas 0.21
No ratings yet
10 Minutes To Pandas - Pandas 0.21
23 pages
195-student - Jupyter Notebook
No ratings yet
195-student - Jupyter Notebook
9 pages
02- Reach Higher gka Unit1 L2_Look
No ratings yet
02- Reach Higher gka Unit1 L2_Look
17 pages
Importing Files Through Pandas
No ratings yet
Importing Files Through Pandas
16 pages
10 Minutes to Pandas — Pandas 2.1.1 Documentation
No ratings yet
10 Minutes to Pandas — Pandas 2.1.1 Documentation
24 pages
Recurrent Neural Network-Programs
No ratings yet
Recurrent Neural Network-Programs
9 pages
Time Series Project
No ratings yet
Time Series Project
19 pages
Explore Weather Trends
No ratings yet
Explore Weather Trends
6 pages
Tcs EDA Question
0% (1)
Tcs EDA Question
5 pages
Untitled5
No ratings yet
Untitled5
10 pages
Python
No ratings yet
Python
3 pages
70f626ef676e457578caba2d7bae2f6e
No ratings yet
70f626ef676e457578caba2d7bae2f6e
6 pages
Max Weber - Law in Economy and Society-Harvard University Press (1954)
No ratings yet
Max Weber - Law in Economy and Society-Harvard University Press (1954)
448 pages
Lesson - 3 - 1 Data Wrangling
No ratings yet
Lesson - 3 - 1 Data Wrangling
29 pages
forage1
No ratings yet
forage1
9 pages
Prac 2
No ratings yet
Prac 2
3 pages
10 Minutes To Pandas
No ratings yet
10 Minutes To Pandas
26 pages
10 Minutes To Pandas - Pandas 1.2.4 Documentation
No ratings yet
10 Minutes To Pandas - Pandas 1.2.4 Documentation
18 pages
2.Data_Frame_Selection_and_Indexing
No ratings yet
2.Data_Frame_Selection_and_Indexing
4 pages
pandas_workshop - Jupyter Notebook
No ratings yet
pandas_workshop - Jupyter Notebook
5 pages
lab8
No ratings yet
lab8
3 pages
Performing Analysis of Meteorological Data: Punam Seal
No ratings yet
Performing Analysis of Meteorological Data: Punam Seal
21 pages
Assignment 2
No ratings yet
Assignment 2
4 pages
Adjuster ZTF
No ratings yet
Adjuster ZTF
1 page
Practical-Data Science: Delhi Public School Bangalore - East Artificial Intelligence Advance Python
No ratings yet
Practical-Data Science: Delhi Public School Bangalore - East Artificial Intelligence Advance Python
4 pages
Part 2
No ratings yet
Part 2
2 pages
Speaking Assessment Criteria For Virtual Education
No ratings yet
Speaking Assessment Criteria For Virtual Education
7 pages
데이터 과제
No ratings yet
데이터 과제
2 pages
Code Python
No ratings yet
Code Python
2 pages
Pandas
No ratings yet
Pandas
1 page
Practical No. 09.ipynb - Colab
No ratings yet
Practical No. 09.ipynb - Colab
4 pages
61-Andhra Muslim College
No ratings yet
61-Andhra Muslim College
18 pages
Practical 2.ipynb - Colaboratory
No ratings yet
Practical 2.ipynb - Colaboratory
2 pages
2024 TECHNOLYMPICS Invitation Card Making Guidelines
100% (2)
2024 TECHNOLYMPICS Invitation Card Making Guidelines
2 pages
B.E - B.Tech Academic Regulations 2023 (Revision 1, 2024)
No ratings yet
B.E - B.Tech Academic Regulations 2023 (Revision 1, 2024)
51 pages
Week 2 PPT - Approaches Methods and Techniques
No ratings yet
Week 2 PPT - Approaches Methods and Techniques
15 pages
Inke Malahayati Prodi Kebidanan Pematangsiantar
100% (1)
Inke Malahayati Prodi Kebidanan Pematangsiantar
34 pages
Elt3 Mangaron Final
No ratings yet
Elt3 Mangaron Final
12 pages
ECAR Student/Faculty IT Survey Presentation
No ratings yet
ECAR Student/Faculty IT Survey Presentation
48 pages
Theories Settings of CHN
No ratings yet
Theories Settings of CHN
73 pages
Insem September 2023
No ratings yet
Insem September 2023
2 pages
1 Introduction To Linguistics
No ratings yet
1 Introduction To Linguistics
4 pages
Unit 5 INVENTIONS
No ratings yet
Unit 5 INVENTIONS
5 pages
Solution To Problem 1: Importing The Libraries
No ratings yet
Solution To Problem 1: Importing The Libraries
6 pages
Mathematical Habits of Mind
No ratings yet
Mathematical Habits of Mind
16 pages
Exam Questions Mcd-Level-1: Mulesoft Certified Developer - Level 1 (Mule 4)
No ratings yet
Exam Questions Mcd-Level-1: Mulesoft Certified Developer - Level 1 (Mule 4)
5 pages
Program Specification Requirements
No ratings yet
Program Specification Requirements
4 pages
PJT Explanation of Code Line by Line
No ratings yet
PJT Explanation of Code Line by Line
2 pages
Micro Teaching Assignment and Rubric
No ratings yet
Micro Teaching Assignment and Rubric
2 pages
ML Endsem
No ratings yet
ML Endsem
3 pages
Membangun Kembali Organisasi Berbasis Gerakan: Ippa As A Movement Based Organization
No ratings yet
Membangun Kembali Organisasi Berbasis Gerakan: Ippa As A Movement Based Organization
27 pages
Algebra Homework Help
No ratings yet
Algebra Homework Help
6 pages
Sppu TEIT OS - Endsem
No ratings yet
Sppu TEIT OS - Endsem
2 pages
Playgroups in Dunedin June 2016
No ratings yet
Playgroups in Dunedin June 2016
7 pages
Education Legislation Final Examination - Villarin2022
No ratings yet
Education Legislation Final Examination - Villarin2022
2 pages
Narrative Report 1123
No ratings yet
Narrative Report 1123
7 pages
Annotated Bibliography: Applied Psychology, 88 (2) : 207-218
No ratings yet
Annotated Bibliography: Applied Psychology, 88 (2) : 207-218
3 pages
Okonomiyaki and Kagoshima's Famous Black Pig, The Eruption of Mount Sakurajima
No ratings yet
Okonomiyaki and Kagoshima's Famous Black Pig, The Eruption of Mount Sakurajima
2 pages
Ethics 75 Days Revision Plan 2021
No ratings yet
Ethics 75 Days Revision Plan 2021
4 pages
Synthesis Paper: Reading Difficulties, Disabilities, or Problems
No ratings yet
Synthesis Paper: Reading Difficulties, Disabilities, or Problems
5 pages
MV 262
No ratings yet
MV 262
1 page
Smep Report
No ratings yet
Smep Report
1 page
University of Mindanao
No ratings yet
University of Mindanao
3 pages
Come To Condom!
From Everand
Come To Condom!
Theobaldo Vieira Monteiro
No ratings yet
The Pole Dancer's Pun
From Everand
The Pole Dancer's Pun
Theobaldo Vieira Monteiro
No ratings yet

ML Assignment 3

Uploaded by

ML Assignment 3

Uploaded by

9/19/24, 1:25 AM Assign3.

import numpy as np;

JAN- MAR- JUN- OCT-

Next steps: Generate code with df

JAN- MAR- JUN- OCT-

Next steps: Generate code with df

from sklearn.model_selection import train_test_split

JAN- MAR- JUN- OCT-

<Axes: xlabel='YEAR', ylabel='ANNUAL'>

x_train, x_test, y_train, y_test = train_test_split(x, y,test_size=0.25)

print(f"x Training dataset: {x_train.shape}")

x Training dataset: (87,)

x_train, x_test, y_train, y_test = train_test_split(x, y,test_size=0.25)

print(f"x Training dataset: {x_train.shape}")

x Training dataset: (87, 1)

plt.scatter(x_train, y_train, color='blue')

from sklearn.metrics import mean_absolute_error,mean_squared_error,r2_score

You might also like