Random Forest

The document discusses using random forest modeling on fraud data to classify individuals as either "Risky" or "Good" based on their taxable income. It installs relevant packages, loads the fraud data, builds a random forest model with 600 trees using taxable income as the target variable and other columns as predictors, and evaluates the results by checking variable importance and the risk classification breakdown.

Uploaded by

santhi s

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (1 vote)

348 views2 pages

Random Forest

Uploaded by

santhi s

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 2

Use Random Forest to prepare a model on fraud data

treating those who have taxable_income <= 30000 as "Risky" and others are
"Good"

install.packages("caret", dependencies = TRUE)

install.packages("randomForest")
library(randomForest)
library(caret)
View(Fraud_check_)
hist(Fraud_check_$Taxable.Income)

model<-
randomForest(Fraud_check_$Taxable.Income~.,data=Fraud_check_,ntree=600
)
# View the forest results.
print(model)
Risk = ifelse(Fraud_check_$Taxable.Income<= 30000, "Risky", "Good")
Fraud= data.frame(Fraud_check_,Risk)
Fraud1 = Fraud[,c(1:6)]
str(Fraud)#Imoporantce of the variable - Lower Gini
table(FC$Risk)
Call:
randomForest(formula = Fraud_check_$Taxable.Income ~ ., data =
Fraud_check_, ntree = 600)
Type of random forest: regression
Number of trees: 600
No. of variables tried at each split: 1

Mean of squared residuals: 693268098

% Var explained: -1.13
str(Fraud)#Imoporantce of the variable - Lower Gini
'data.frame': 600 obs. of 7 variables:
$ Undergrad : chr "NO" "YES" "NO" "YES" ...
$ Marital.Status : chr "Single" "Divorced" "Married" "Single" ...
$ Taxable.Income : num 68833 33700 36925 50190 81002 ...
$ City.Population: num 50047 134075 160205 193264 27533 ...
$ Work.Experience: num 10 18 30 15 28 0 8 3 12 4 ...
$ Urban : chr "YES" "YES" "YES" "YES" ...
$ Risk : chr "Good" "Good" "Good" "Good" ...
> table(Fraud$Risk)

Good Risky
476 124

A Note On R
No ratings yet
A Note On R
90 pages
Answers To Problems For Data Mining and Predictive Analytics (2nd Edition) by Larose
No ratings yet
Answers To Problems For Data Mining and Predictive Analytics (2nd Edition) by Larose
12 pages
Fraud in Insurance: Applications of Predictive Modeling
No ratings yet
Fraud in Insurance: Applications of Predictive Modeling
16 pages
Output
No ratings yet
Output
8 pages
Project On Data Mining-Raveendra Babu Gaddam
No ratings yet
Project On Data Mining-Raveendra Babu Gaddam
29 pages
Data Analysis With Python by IBM: - (On Coursera)
No ratings yet
Data Analysis With Python by IBM: - (On Coursera)
3 pages
Data Visualization R Programming Power Bi Lab Record
No ratings yet
Data Visualization R Programming Power Bi Lab Record
29 pages
Predictive Modeling Project Report
100% (2)
Predictive Modeling Project Report
31 pages
Practical - 1 - Data Exploration and Data Preparation - DAL - Lab
100% (1)
Practical - 1 - Data Exploration and Data Preparation - DAL - Lab
8 pages
Project 5 - Cars
100% (1)
Project 5 - Cars
22 pages
Data Mining Cluster
50% (2)
Data Mining Cluster
4 pages
Gate 2024 Da Sample Question Paper Final
No ratings yet
Gate 2024 Da Sample Question Paper Final
29 pages
Business Report Advance Statistics
No ratings yet
Business Report Advance Statistics
39 pages
Nishant Agarwal Resume
No ratings yet
Nishant Agarwal Resume
2 pages
Data Preprocessing
No ratings yet
Data Preprocessing
77 pages
Australian Gas Production - Project On Time Series Forecasting
100% (19)
Australian Gas Production - Project On Time Series Forecasting
29 pages
Brittany King Data Scientist Resume
No ratings yet
Brittany King Data Scientist Resume
1 page
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
No ratings yet
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
10 pages
Machine Learning: Bilal Khan
100% (2)
Machine Learning: Bilal Khan
20 pages
Chapter 1 Data Analysis
No ratings yet
Chapter 1 Data Analysis
18 pages
Interview Preparations - NielsenIQ
No ratings yet
Interview Preparations - NielsenIQ
1 page
Machine Learning GL
No ratings yet
Machine Learning GL
25 pages
Decision Tree Classifier Project
100% (1)
Decision Tree Classifier Project
20 pages
ALX Data Analytics Program Description
No ratings yet
ALX Data Analytics Program Description
6 pages
Association Rule Mining Lesson PDF
No ratings yet
Association Rule Mining Lesson PDF
9 pages
Thera Bank - Project
100% (4)
Thera Bank - Project
34 pages
R Programming in Data Science
No ratings yet
R Programming in Data Science
23 pages
Machine Learning Notes
No ratings yet
Machine Learning Notes
15 pages
CV Data Analyst
No ratings yet
CV Data Analyst
3 pages
Statistics Probability
No ratings yet
Statistics Probability
66 pages
SE 7204 BIG Data Analysis Unit I Final
No ratings yet
SE 7204 BIG Data Analysis Unit I Final
66 pages
Covid 19 Prediction in India Using Machine Learning
No ratings yet
Covid 19 Prediction in India Using Machine Learning
5 pages
Examples of Performance Appraisal
No ratings yet
Examples of Performance Appraisal
6 pages
LDA 01 Linear Discriminant Analysis
No ratings yet
LDA 01 Linear Discriminant Analysis
65 pages
Data Analyst Udemy Report Writing PDF
No ratings yet
Data Analyst Udemy Report Writing PDF
15 pages
Vignesh R 22071471559 Jan 2024: Tcs NQT - It
No ratings yet
Vignesh R 22071471559 Jan 2024: Tcs NQT - It
1 page
Machine Learning - Exploring The Model - Resp
No ratings yet
Machine Learning - Exploring The Model - Resp
18 pages
Rayleigh Model
No ratings yet
Rayleigh Model
9 pages
Report On Linear Regression Using R
No ratings yet
Report On Linear Regression Using R
15 pages
House Price Prediction Using Machine Learning in Python
No ratings yet
House Price Prediction Using Machine Learning in Python
13 pages
House Price Prediction Using Machine Learning: Bachelor of Technology
No ratings yet
House Price Prediction Using Machine Learning: Bachelor of Technology
20 pages
Image Segmentation Digital Image Processing
100% (1)
Image Segmentation Digital Image Processing
44 pages
Chapter 5 - Data Exploration and Visualization With
No ratings yet
Chapter 5 - Data Exploration and Visualization With
39 pages
Education Loan Prediction Analysis
No ratings yet
Education Loan Prediction Analysis
5 pages
Assignment 02
No ratings yet
Assignment 02
9 pages
Approaches To The Analysis of Survey Data PDF
No ratings yet
Approaches To The Analysis of Survey Data PDF
28 pages
Lecture 9 PDF
100% (1)
Lecture 9 PDF
28 pages
Weka Lab
No ratings yet
Weka Lab
11 pages
Crime Prediction in Nigeria's Higer Institutions
No ratings yet
Crime Prediction in Nigeria's Higer Institutions
13 pages
2nd Unit - 2.2 - Data Analytics
No ratings yet
2nd Unit - 2.2 - Data Analytics
22 pages
Written Questions
No ratings yet
Written Questions
33 pages
AI Course File HIMAKIRAN
No ratings yet
AI Course File HIMAKIRAN
161 pages
Advanced Certification in Data Science and Artificial Intelligence
No ratings yet
Advanced Certification in Data Science and Artificial Intelligence
18 pages
Applied Statistics: Assessment Tasks
No ratings yet
Applied Statistics: Assessment Tasks
4 pages
SMOTE: Synthetic Minority Over-Sampling Technique: Nitesh V. Chawla
No ratings yet
SMOTE: Synthetic Minority Over-Sampling Technique: Nitesh V. Chawla
37 pages
Confidence Interval Exercise
No ratings yet
Confidence Interval Exercise
19 pages
EDA Assignment
No ratings yet
EDA Assignment
15 pages
Implement of Salary Prediction System To Improve Student Motivation Using Data Mining Technique PDF
No ratings yet
Implement of Salary Prediction System To Improve Student Motivation Using Data Mining Technique PDF
6 pages
SAS Presentation
No ratings yet
SAS Presentation
49 pages
Tutorial On "R" Programming Language
No ratings yet
Tutorial On "R" Programming Language
25 pages
Ai Course File
No ratings yet
Ai Course File
67 pages
Ai Course File Final
No ratings yet
Ai Course File Final
155 pages
Chapter 4 - AI - Notes
No ratings yet
Chapter 4 - AI - Notes
16 pages
Distributed Shared Memory: Pham Quoc Cuong & Phan Dinh Khoi Use Some Slides of James Deak - Njit
No ratings yet
Distributed Shared Memory: Pham Quoc Cuong & Phan Dinh Khoi Use Some Slides of James Deak - Njit
53 pages
06 Learning Systems
No ratings yet
06 Learning Systems
82 pages
Ai Humaira Anwer
No ratings yet
Ai Humaira Anwer
1 page
Resolution Frws and BCKWRD Chaining
No ratings yet
Resolution Frws and BCKWRD Chaining
17 pages
Google Cloud Dataproc The Ultimate Step-By-Step Guide
From Everand
Google Cloud Dataproc The Ultimate Step-By-Step Guide
Gerardus Blokdyk
No ratings yet

Random Forest

Uploaded by

Random Forest

Uploaded by

Use Random Forest to prepare a model on fraud data

install.packages("caret", dependencies = TRUE)

Mean of squared residuals: 693268098

You might also like