0% found this document useful (0 votes)

5 views

Predict Inflation Using Randomforest Regression

This document cleans and preprocesses inflation data from a CSV file. It handles missing values, encodes categorical data, splits the data into training and test sets, and uses random forest and linear regression models to predict inflation values.

Uploaded by

ahmed salem

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

Predict Inflation Using Randomforest Regression

Uploaded by

ahmed salem

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

import pandas as pd

import numpy as np

#read data
dset = pd.read_csv("/content/Data_Inflation.csv",sep=",", encoding='latin-1')

#View the data

dset.head(10)

dset.dtypes.value_counts()

#Types into object

dset.dtypes == 'object'

#Drop columns Unit of Measurement

dset = dset.drop(columns=['Unit of Measurement'])

print(dset.columns.tolist())

#rename the columns

dset.rename(columns={' Country Code': 'CountryCode', ' Subregion': 'Subregion'},
inplace=True)

#Inflation box plot

import seaborn as sns
# Box plot
sns.boxplot(dset.Inflation)

dset['Subregion'].value_counts()

dset["Inflation"].describe() #Inflation Description

#total Empty in dataset

dset.isna().sum().sum()

#View Missing values in all columns

cc = dset['CountryCode'].isna().sum()
sr = dset['Subregion'].isna().sum()
rm = dset['RegionalMember'].isna().sum()
ifn = dset['Inflation'].isna().sum()
print("Countrycode",cc)
print("Subregion",sr)
print("Regional Membr",rm)
print("Inflation",ifn)

dset.info()

#Replace Inflation missing values with mode

dset["Inflation"] = dset["Inflation"].fillna("not available")

#Number of missing values per column

dset.isnull().sum()

dset = dset.dropna(axis=0)

dset.isnull().sum()

dset.info()
#Again now replace not availble with nan
dset['Inflation']= dset['Inflation'].replace('not available', np.nan)

dset.head(10)

#Sort values according to nan of inflation

dset = dset.sort_values(by="Inflation", ascending=False, na_position='first')

#One hot encoding to whole data

dset_one_hot_encoding = pd.get_dummies(dset)

print("Dataset dimension",dset_one_hot_encoding.shape)

print(dset_one_hot_encoding)

dset.isnull().sum()

#Dividing data into two groups having missing values and non missing values
column_with_nan = "Inflation"
data_with_nan =
dset_one_hot_encoding[dset_one_hot_encoding[column_with_nan].isnull()]
data_without_nan =
dset_one_hot_encoding[dset_one_hot_encoding[column_with_nan].notnull()]

print("Dset without nan dimension",data_without_nan.shape)

print("Dset with nan dimension",data_with_nan.shape)

#Create train from non_missing values

X_train = data_without_nan.drop('Inflation',axis=1)
y_train = data_without_nan["Inflation"]

xx_train = X_train.iloc[1:6]
yy_train = y_train.iloc[1:6]

xx_train

X_train = X_train.values
y_train = y_train.values
xx_train = xx_train.values
yy_train = yy_train.values

X_train

from sklearn.ensemble import RandomForestRegressor

rf = RandomForestRegressor()
rf.fit(X_train, y_train)

#Create test from missing values

x_test = data_with_nan.drop('Inflation',axis=1)
# x_test.values

Train_x = X_train.shape
Train_y = y_train.shape
print("X_train",Train_x)
print("y_train",Train_y)
test_x = x_test.shape
print("X_test",test_x)
predicted_values = rf.predict(xx_train)

print("Predicted Values from RandomForest",predicted_values)

print(predicted_values)
print(yy_train)

type(yy_train)

#Difference in original and predicted

import sklearn.metrics as metrics

import matplotlib.pyplot as plt
y = np.array(predicted_values)
yhat = np.array(yy_train)
x = list(range(len(y)))

plt.plot(x, y, color="blue", label="original")

plt.plot(x, yhat, color="red", label="predicted")
plt.legend()
plt.show()

from sklearn.metrics import mean_absolute_error

from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_percentage_error
mape = mean_absolute_percentage_error(yhat,y)
rmse = mean_squared_error(yhat,y, squared=False)
print("Mean Square Error",rmse)
print("Mean absolute percentage error",mape)
print("Mean Absolute Error",mean_absolute_error(yy_train,predicted_values))

from sklearn.linear_model import LinearRegression

lr = LinearRegression()

lr.fit(X_train,y_train)

#Predict for Inflation

y_pred_lr = lr.predict(x_test)

print("Predicted Values from LinearRegression",y_pred_lr)

print("Original",yy_train)

CovidData - Ipynb - Colaboratory
No ratings yet
CovidData - Ipynb - Colaboratory
4 pages
Assignment 2
No ratings yet
Assignment 2
6 pages
Extended - Case - 2 - Fellow: 1 The Adverse Health Effects of Air Pollution - Are We Making Any Progress?
No ratings yet
Extended - Case - 2 - Fellow: 1 The Adverse Health Effects of Air Pollution - Are We Making Any Progress?
61 pages
Day 18-9-2023 - Jupyter Notebook
No ratings yet
Day 18-9-2023 - Jupyter Notebook
8 pages
EXP 5 DE lab
No ratings yet
EXP 5 DE lab
5 pages
13-9-23 Data Pre-Processing - Jupyter Notebook
No ratings yet
13-9-23 Data Pre-Processing - Jupyter Notebook
6 pages
Vineet Dataanalyst
No ratings yet
Vineet Dataanalyst
5 pages
Lab File
No ratings yet
Lab File
96 pages
EDA (2)
No ratings yet
EDA (2)
7 pages
Python Lab
No ratings yet
Python Lab
8 pages
DataCleaning Techniques
No ratings yet
DataCleaning Techniques
20 pages
Interactive Visualization - Jupyter Notebook
No ratings yet
Interactive Visualization - Jupyter Notebook
4 pages
Hands On Data Cleaning With Pandas and NumPy
No ratings yet
Hands On Data Cleaning With Pandas and NumPy
20 pages
2777959-Day 8 - Data Wrangling
No ratings yet
2777959-Day 8 - Data Wrangling
2 pages
Data_Analyzer
No ratings yet
Data_Analyzer
10 pages
WEBINTEL GUIDED LAB ACTIVITY Introduction To Pandas
No ratings yet
WEBINTEL GUIDED LAB ACTIVITY Introduction To Pandas
1 page
Pandaspythonfordatascience
No ratings yet
Pandaspythonfordatascience
1 page
Pandas Python For Data Science
No ratings yet
Pandas Python For Data Science
1 page
Pandas Python For Data Science
100% (1)
Pandas Python For Data Science
1 page
Python Cheatsy
No ratings yet
Python Cheatsy
1 page
Ip_project_new
No ratings yet
Ip_project_new
13 pages
22 Dim Reduction Part-1
No ratings yet
22 Dim Reduction Part-1
9 pages
Five Year Dataset
No ratings yet
Five Year Dataset
15 pages
Data Analysis Advance House Price Prediction 1682585529
No ratings yet
Data Analysis Advance House Price Prediction 1682585529
73 pages
Data Analysis With PANDAS: Cheat Sheet
83% (6)
Data Analysis With PANDAS: Cheat Sheet
4 pages
Nota
No ratings yet
Nota
8 pages
Pandas
No ratings yet
Pandas
44 pages
report
No ratings yet
report
25 pages
Code explanation for date types
No ratings yet
Code explanation for date types
8 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
Cheat Python
No ratings yet
Cheat Python
8 pages
Cleaning Data in Python
No ratings yet
Cleaning Data in Python
8 pages
Attribute Types
No ratings yet
Attribute Types
11 pages
2-Introduction to data cleaning P02
No ratings yet
2-Introduction to data cleaning P02
7 pages
hello
No ratings yet
hello
3 pages
justenoughpython_pandas_220915_175329
No ratings yet
justenoughpython_pandas_220915_175329
64 pages
Unit3_3) Pandas.ipynb - Colab
No ratings yet
Unit3_3) Pandas.ipynb - Colab
11 pages
Regression and Eda
No ratings yet
Regression and Eda
47 pages
Panda 2
No ratings yet
Panda 2
2 pages
FDA EXP2 E0323040
No ratings yet
FDA EXP2 E0323040
3 pages
EXP-12_IAIML
No ratings yet
EXP-12_IAIML
13 pages
python pandas
No ratings yet
python pandas
13 pages
Data Cleaning and Pre Processing 2
No ratings yet
Data Cleaning and Pre Processing 2
27 pages
EDA Zomato 1681401606
No ratings yet
EDA Zomato 1681401606
15 pages
EDP-3[2]
No ratings yet
EDP-3[2]
16 pages
week2
No ratings yet
week2
6 pages
Python Amit
No ratings yet
Python Amit
11 pages
Real Estate
No ratings yet
Real Estate
10 pages
Different Methods of Plotting
No ratings yet
Different Methods of Plotting
4 pages
project
No ratings yet
project
10 pages
THO11
No ratings yet
THO11
2 pages
dsbda_exp4_part1
No ratings yet
dsbda_exp4_part1
39 pages
THO11
No ratings yet
THO11
1 page
Python With Pandas
No ratings yet
Python With Pandas
17 pages
Answers Practical File
No ratings yet
Answers Practical File
19 pages
Python Machine Learning Linear Regression
No ratings yet
Python Machine Learning Linear Regression
1 page
Logistic Distribution
No ratings yet
Logistic Distribution
1 page
Python - Copy Dictionaries
No ratings yet
Python - Copy Dictionaries
1 page
Python Lists
No ratings yet
Python Lists
1 page
Pandas - Cleaning Empty Cells
No ratings yet
Pandas - Cleaning Empty Cells
1 page
Matplotlib Plotting
No ratings yet
Matplotlib Plotting
1 page
Python Machine Learning Scatter Plot
No ratings yet
Python Machine Learning Scatter Plot
1 page
Pandas - Removing Duplicates
No ratings yet
Pandas - Removing Duplicates
1 page
Python - Join Tuples
No ratings yet
Python - Join Tuples
1 page
Pandas Series
No ratings yet
Pandas Series
1 page
NumPy Data Types
No ratings yet
NumPy Data Types
1 page
Pandas Tutorial
No ratings yet
Pandas Tutorial
1 page
Python Numbers
No ratings yet
Python Numbers
1 page
Python - Update Tuples
No ratings yet
Python - Update Tuples
1 page
Python Iterators
No ratings yet
Python Iterators
1 page
Python Inheritance
No ratings yet
Python Inheritance
1 page
Python JSON
No ratings yet
Python JSON
1 page
Python Booleans
No ratings yet
Python Booleans
1 page
Pandas Read JSON
No ratings yet
Pandas Read JSON
1 page
Python - Change List Items
No ratings yet
Python - Change List Items
1 page
NumPy Ufuncs - Summations
No ratings yet
NumPy Ufuncs - Summations
1 page
Pareto Distribution
No ratings yet
Pareto Distribution
1 page
Pandas - Cleaning Data of Wrong Format
No ratings yet
Pandas - Cleaning Data of Wrong Format
1 page
Matplotlib Histograms
No ratings yet
Matplotlib Histograms
1 page
NumPy Array Copy Vs View
No ratings yet
NumPy Array Copy Vs View
1 page
NumPy Creating Arrays
No ratings yet
NumPy Creating Arrays
1 page
Python While Loops
No ratings yet
Python While Loops
1 page
Python Variables - Assign Multiple Values
No ratings yet
Python Variables - Assign Multiple Values
1 page
Python Math
No ratings yet
Python Math
1 page
Python Machine Learning - Logistic Regression
No ratings yet
Python Machine Learning - Logistic Regression
1 page

Predict Inflation Using Randomforest Regression

Uploaded by

Predict Inflation Using Randomforest Regression

Uploaded by

import pandas as pd

#View the data

#Types into object

#Drop columns Unit of Measurement

#rename the columns

#Inflation box plot

dset["Inflation"].describe() #Inflation Description

#total Empty in dataset

#View Missing values in all columns

#Replace Inflation missing values with mode

#Number of missing values per column

#Sort values according to nan of inflation

#One hot encoding to whole data

print("Dset without nan dimension",data_without_nan.shape)

#Create train from non_missing values

from sklearn.ensemble import RandomForestRegressor

#Create test from missing values

print("Predicted Values from RandomForest",predicted_values)

#Difference in original and predicted

import sklearn.metrics as metrics

plt.plot(x, y, color="blue", label="original")

from sklearn.metrics import mean_absolute_error

from sklearn.linear_model import LinearRegression

#Predict for Inflation

print("Predicted Values from LinearRegression",y_pred_lr)

You might also like