MLR PDF

The document discusses machine learning workflows in R, including: 1) Preprocessing data by creating dummy features, normalizing features, and merging small factor levels. 2) Setting up training and testing by making classification, regression, and other task types from data, and creating resampling instances like cross validation folds. 3) Refining model performance by tuning hyperparameters, training models, predicting on test data, and calculating evaluation metrics.

Uploaded by

ayrusurya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

166 views2 pages

MLR PDF

Uploaded by

ayrusurya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Setup Training & Testing Refining Performance

createDummyFeatures(obj=,target=,method=,cols=) setHyperPars(learner=,...) makeParamSet(make<type>Param())

• makeNumericParam(id=,lower=,upper=,trafo=)
target cols • makeIntegerParam(id=,lower=,upper=,trafo=)
• makeIntegerVectorParam(id=,len=,lower=,upper=,
normalizeFeatures(obj=,target=,method=,cols=, makeLearner() trafo=)
range=,on.constant=) • makeDiscreteParam(id=,values=c(...))

Introduction • "center"
method getParamSet(learner=)
trafo
• "scale" lower=-2,upper=2,trafo=function(x) 10^x
• "standardize" "classif.qda"
• "range" range=c(0,1) Logical
LogicalVector CharacterVector DiscreteVector
mergeSmallFactorLevels(task=,cols=,min.perc=)
train(learner=,task=) makeTuneControl<type>()
WrappedModel • Grid(resolution=10L)
summarizeColumns(obj=) obj • Random(maxit=100)
• MBO(budget=)
• Irace(n.instances=)
capLargeValues dropFeatures getLearnerModel() • CMAES Design GenSA
removeConstantFeatures summarizeLevels
predict(object=,task=,newdata=) tuneParams(learner=,task=,resampling=,
measures=,par.set=,control=)
pred
View(pred)
makeClassifTask(data=,target=)
as.data.frame(pred)
A B C
positive Quickstart
makeRegrTask(data=,target=)
0 63 100 performance(pred=,measures=)

listMeasures() library(mlbench)
makeMultilabelTask(data=,target=)
• acc auc bac ber brier[.scaled] f1 fdr fn data(Soybean)
A B C fnr fp fpr gmean multiclass[.au1u .aunp .aunu soy = createDummyFeatures(Soybean,target="Class")
.brier] npv ppv qsr ssr tn tnr tp tpr wkappa tsk = makeClassifTask(data=soy,target="Class")
makeClusterTask(data=) • arsq expvar kendalltau mae mape medae ho = makeResampleInstance("Holdout",tsk)
medse mse msle rae rmse rmsle rrse rsq sae tsk.train = subsetTask(tsk,ho$train.inds[[1]])
spearmanrho sse tsk.test = subsetTask(tsk,ho$test.inds[[1]])
makeSurvTask(data=,target= • db dunn G1 G2 silhouette
c("time","event")) • multilabel[.f1 .subset01 .tpr .ppv
.acc .hamloss]
• mcp meancosts
• cindex
makeCostSensTask(data=,costs=) • featperc timeboth timepredict timetrain
A B lrn = makeLearner("classif.xgboost",nrounds=10)
cv = makeResampleDesc("CV",iters=5)
• calculateConfusionMatrix(pred=) res = resample(lrn,tsk.train,cv,acc)
task • calculateROCMeasures(pred=)
• weights=
• blocking=

makeResampleDesc(method=,...,stratify=)
method ps = makeParamSet(makeNumericParam("eta",0,1),
• "CV" iters= makeNumericParam("lambda",0,200),
makeLearner(cl=,predict.type=,...,par.vals=) • "LOO" iters= makeIntegerParam("max_depth",1,20))
• "RepCV" tc = makeTuneControlMBO(budget=100)
reps= folds= tr = tuneParams(lrn,tsk.train,cv5,acc,ps,tc)
• cl= "classif.xgboost" • "Subsample" lrn = setHyperPars(lrn,par.vals=tr$x)
"regr.randomForest" "cluster.kmeans" iters= split= eta lambda max_depth
• predict.type="response" • "Bootstrap" iters=
"prob" • "Holdout" split=
"se" stratify

"prob" "se" makeResampleInstance(desc=,task=)

• par.vals= mdl = train(lrn,tsk.train)
... prd = predict(mdl,tsk.test)
makeLearners() resample(learner=,task=,resampling=,measures=) calculateConfusionMatrix(prd)
mdl = train(lrn,tsk)

• View(listLearners()) cv2
• View(listLearners(task)) cv3 cv5 cv10 hout
• View(listLearners("classif",
properties=c("prob", "factors"))) resample()
"classif" crossval() repcv() holdout() subsample()
"prob" "factors" bootstrapOOB() bootstrapB632() bootstrapB632plus()
• getLearnerProperties()

function(required_parameters=,optional_parameters=)
Configuration Feature Extraction Visualization Wrappers
configureMlr()
• show.info Wrapper 3, etc.
TRUE filterFeatures(task=,method=, generateThreshVsPerfData(obj=,measures=)
• on.learner.error "stop" perc=,abs=,threshold=) Wrapper 2
"warn" Wrapper 1
"quiet" "stop" • plotThreshVsPerf(obj)
• on.learner.warning Learner
"warn" "quiet" "warn" perc= abs= ThreshVsPerfData
• on.par.without.desc threshold= • plotROCCurves(obj)
"stop" "warn" "quiet" "stop"
• on.par.out.of.bounds method ThreshVsPerfData
"stop" "warn" "quiet" "stop" "randomForestSRC.rfsrc" measures=list(fpr,tpr) makeDummyFeaturesWrapper(learner=)
• on.measure.not.applicable "anova.test" "carscore" "cforest.importance" makeImputeWrapper(learner=,classes=,cols=)
"stop" "warn" "quiet" "stop" "chi.squared" "gain.ratio" "information.gain" makePreprocWrapper(learner=,train=,predict=)
• show.learner.output "kruskal.test" "linear.correlation" "mrmr" "oneR" makePreprocWrapperCaret(learner=,...)
TRUE "permutation.importance" "randomForest.importance" • plotResiduals(obj=) makeRemoveConstantFeaturesWrapper(learner=)
• on.error.dump "randomForestSRC.rfsrc" "randomForestSRC.var.select" Prediction BenchmarkResult
on.learner.error "stop" TRUE "rank.correlation" "relief"
"symmetrical.uncertainty" "univariate.model.score"
getMlrOptions() "variance" makeOverBaggingWrapper(learner=)
generateLearningCurveData(learners=,task=, makeSMOTEWrapper(learner=)
resampling=,percs=,measures=) makeUndersampleWrapper(learner=)
makeWeightedClassesWrapper(learner=)

Parallelization selectFeatures(learner=,task=
resampling=,measures=,control=)
• plotLearningCurve(obj=)

LearningCurveData
control makeCostSensClassifWrapper(learner=)
parallelMap
makeCostSensRegrWrapper(learner=)
makeCostSensWeightedPairsWrapper(learner=)
generateFilterValuesData(task=,method=)
• makeFeatSelControlExhaustive(max.features=)
parallelStart(mode=,cpus=,level=) max.features • plotFilterValues(obj=)
• makeMultilabelBinaryRelevanceWrapper(learner=)
• mode makeFeatSelControlRandom(maxit=,prob=,
makeMultilabelClassifierChainsWrapper(learner=)
• "local" mapply max.features=) FilterValuesData
makeMultilabelDBRWrapper(learner=)
• "multicore" prob maxit
makeMultilabelNestedStackingWrapper(learner=)
parallel::mclapply
• makeMultilabelStackingWrapper(learner=)
• "socket" makeFeatSelControlSequential(method=,maxit=,
• "mpi" max.features=,alpha=,beta=) generateHyperParsEffectData(tune.result=)
parallel::makeCluster parallel::clusterMap method "sfs"
• "BatchJobs" "sbs" "sffs"
"sfbs" alpha • plotHyperParsEffect(hyperpars.effec makeBaggingWrapper(learner=)
BatchJobs::batchMap
makeConstantClassWrapper(learner=)
• cpus beta t.data=,x=,y=,z=)
makeDownsampleWrapper(learner=,dw.perc=)
• level "mlr.benchmark"
• makeFeatSelControlGA(maxit=,max.features=,mu=, HyperParsEffectData makeFeatSelWrapper(learner=,resampling=,control=)
"mlr.resample" "mlr.selectFeatures"
lambda=,crossover.rate=,mutation.rate=) makeFilterWrapper(learner=,fw.perc=,fw.abs=,
"mlr.tuneParams" "mlr.ensemble"
• plotOptPath(op=) fw.threshold=)
<obj>$opt.path <obj> makeMultiClassWrapper(learner=)
parallelStop()
mu tuneResult featSelResult makeTuneWrapper(learner=,resampling=,par.set=,
lambda crossover.rate • plotTuneMultiCritResult(res=) control=)

Imputation mutation.rate

impute(obj=,target=,cols=,dummy.cols=,dummy.type=)
selectFeatures FeatSelResult
generatePartialDependenceData(obj=,input=) Nested Resampling
fsr tsk obj
tsk = subsetTask(tsk,features=fsr$x) input
• obj= • plotPartialDependence(obj=)
• target=
• cols= PartialDependenceData
• dummy.cols=
• dummy.type=
classes
"numeric"
dummy.classes cols
Benchmarking • resample benchmark
• makeTuneWrapper
benchmark(learners=,tasks=,resamplings=,measures=) • plotBMRBoxplots(bmr=) makeFeatSelWrapper
cols classes • plotBMRSummary(bmr=)
cols=list(V1=imputeMean()) V1 • plotBMRRanksAsBarChart(bmr=)
imputeMean()

imputeConst(const=) imputeMedian() imputeMode()

Ensembles
imputeMin(multiplier=) imputeMax(multiplier=) getBMR<object> AggrPerformance • generateCritDifferencesData(bmr=,
imputeNormal(mean=,sd=) B makeStackedLearner(base.learners=,super.learner=,
FeatSelResults FilteredFeatures LearnerIds measure=,p.value=,test=)
imputeHist(breaks=,use.mids=) method=)
LeanerShortNames Learners MeasureIds Measures A C
imputeLearner(learner=,features=) • base.learners=
Models Performances Predictions TaskDescs TaskIds "bd" "Nemenyi"
impute 0 1 2 3 • super.learner=
TuneResults • plotCritDifferences(obj=)
• method=
reimpute • "average"
• generateCalibrationData(obj=)
• "stack.nocv" "stack.cv"
agri.task bc.task bh.task costiris.task iris.task
reimpute(obj=,desc=) lung.task mtcars.task pid.task sonar.task
obj desc impute • "hill.climb"
wpbc.task yeast.task • plotCalibration(obj=)
• "compress"

Effective Xgboost
No ratings yet
Effective Xgboost
221 pages
AWS Machine Learning Specialty Master Cheat Sheet
No ratings yet
AWS Machine Learning Specialty Master Cheat Sheet
24 pages
Separator Sizing
67% (3)
Separator Sizing
11 pages
mlr3 Tutorial
100% (2)
mlr3 Tutorial
271 pages
MLR 3 Book
100% (1)
MLR 3 Book
291 pages
Andrew NG Main - Notes PDF
No ratings yet
Andrew NG Main - Notes PDF
226 pages
Machine Learning Notes
100% (3)
Machine Learning Notes
134 pages
Unit 2 - Machine Learning - WWW - Rgpvnotes.in
100% (2)
Unit 2 - Machine Learning - WWW - Rgpvnotes.in
21 pages
ML Main Printing Material
No ratings yet
ML Main Printing Material
241 pages
Super Cheatsheet Machine Learning
100% (1)
Super Cheatsheet Machine Learning
15 pages
Cs229-Main Notes Andrew NG and Tengyu Ma
No ratings yet
Cs229-Main Notes Andrew NG and Tengyu Ma
227 pages
Basic Concepts of Machine Learning For Beginners 1732109263
No ratings yet
Basic Concepts of Machine Learning For Beginners 1732109263
102 pages
Condenser Vacuum Problem
100% (4)
Condenser Vacuum Problem
4 pages
Main Notes
No ratings yet
Main Notes
227 pages
Chapter 2 Machine Learning Draft-85-172
No ratings yet
Chapter 2 Machine Learning Draft-85-172
88 pages
CS229
No ratings yet
CS229
216 pages
CS229 Lecture Notes: Andrew NG and Tengyu Ma April 25, 2023
No ratings yet
CS229 Lecture Notes: Andrew NG and Tengyu Ma April 25, 2023
223 pages
ML Workshop
No ratings yet
ML Workshop
78 pages
CS229 Andrew NG Lecture Notes
No ratings yet
CS229 Andrew NG Lecture Notes
216 pages
R Machine Learning PDF
No ratings yet
R Machine Learning PDF
137 pages
GATE ML Updated 111023
No ratings yet
GATE ML Updated 111023
109 pages
Xgboost: Notebook
No ratings yet
Xgboost: Notebook
8 pages
Machine Learning Notes
No ratings yet
Machine Learning Notes
48 pages
Python 06 MachineLearning
No ratings yet
Python 06 MachineLearning
45 pages
M2 AI Chap1 Neural-Network
No ratings yet
M2 AI Chap1 Neural-Network
60 pages
Algorithmeknn 121213175830 Phpapp02
No ratings yet
Algorithmeknn 121213175830 Phpapp02
52 pages
Ml2 Script v2
No ratings yet
Ml2 Script v2
123 pages
July4 SaketAnand FriendlyIntroToML
No ratings yet
July4 SaketAnand FriendlyIntroToML
84 pages
ML Lectures Summary 2
No ratings yet
ML Lectures Summary 2
52 pages
Unit 1
No ratings yet
Unit 1
38 pages
ML Unit 2
No ratings yet
ML Unit 2
37 pages
MLSM Lecture1 050923
No ratings yet
MLSM Lecture1 050923
37 pages
Lec2 Intro To ML
No ratings yet
Lec2 Intro To ML
35 pages
Unit 5 Intro To Machine Learning
No ratings yet
Unit 5 Intro To Machine Learning
25 pages
Lecture 15 - Recap and Midterm Review
No ratings yet
Lecture 15 - Recap and Midterm Review
37 pages
05 - Ensemble Learning
No ratings yet
05 - Ensemble Learning
39 pages
UCS - 401 - Unit-LV - Trends in Machine Learning - Model and Symbols - Bagging and Boosting, Multitask
No ratings yet
UCS - 401 - Unit-LV - Trends in Machine Learning - Model and Symbols - Bagging and Boosting, Multitask
44 pages
6th Central Pay Commission Salary Calculator
100% (436)
6th Central Pay Commission Salary Calculator
15 pages
2-ML Principles
No ratings yet
2-ML Principles
34 pages
Nyy - Iec PDF
No ratings yet
Nyy - Iec PDF
5 pages
Gentle Introduction of XGBoost Library - by Mohit Sharma - Medium
No ratings yet
Gentle Introduction of XGBoost Library - by Mohit Sharma - Medium
17 pages
Week 01
No ratings yet
Week 01
37 pages
6036 Lecture Notes
No ratings yet
6036 Lecture Notes
56 pages
Unit 1
No ratings yet
Unit 1
28 pages
Importance of Lift
No ratings yet
Importance of Lift
10 pages
ML Answer Key (M.tech)
No ratings yet
ML Answer Key (M.tech)
31 pages
01 - Introduction
No ratings yet
01 - Introduction
35 pages
Accelerated Data Science Introduction To Machine Learning Algorithms
No ratings yet
Accelerated Data Science Introduction To Machine Learning Algorithms
37 pages
Introduction To Machine Learning
No ratings yet
Introduction To Machine Learning
15 pages
Introduction and Basics of Machine Learning
No ratings yet
Introduction and Basics of Machine Learning
9 pages
Approaching (Almost) Any Machine Learning Problem - Abhishek Thakur - No Free Hunch
No ratings yet
Approaching (Almost) Any Machine Learning Problem - Abhishek Thakur - No Free Hunch
22 pages
XGBoost - Unleashing The Power of Gradient Boosting
No ratings yet
XGBoost - Unleashing The Power of Gradient Boosting
10 pages
5.1 Large Scale ML
No ratings yet
5.1 Large Scale ML
10 pages
Historic Firearms
No ratings yet
Historic Firearms
22 pages
Chapter 7 - Ensemble
No ratings yet
Chapter 7 - Ensemble
12 pages
PE IV - Practical Machine Learning
No ratings yet
PE IV - Practical Machine Learning
7 pages
Introduction R
No ratings yet
Introduction R
9 pages
Aula 4 (L) - Oggi La Tua Lezione È in Presenza
No ratings yet
Aula 4 (L) - Oggi La Tua Lezione È in Presenza
11 pages
Integrated Learners - MLR Tutorial
No ratings yet
Integrated Learners - MLR Tutorial
15 pages
Piping Interview Questions and Answers - Part 01
No ratings yet
Piping Interview Questions and Answers - Part 01
5 pages
ML
No ratings yet
ML
8 pages
Final ML
No ratings yet
Final ML
2 pages
Machine Learning With R
No ratings yet
Machine Learning With R
2 pages
The Design Criteria For Water Supply Facilities
No ratings yet
The Design Criteria For Water Supply Facilities
252 pages
NOTES: Fundamentales of Machine Learning: Vocabulary
No ratings yet
NOTES: Fundamentales of Machine Learning: Vocabulary
4 pages
Pipesim Training: 25 - Oct-04 To 29-Jul-04 Gatwick
No ratings yet
Pipesim Training: 25 - Oct-04 To 29-Jul-04 Gatwick
9 pages
ECDIS: New Standards & Old Underwater Rocks
No ratings yet
ECDIS: New Standards & Old Underwater Rocks
59 pages
Data Science in Spark With Sparklyr::: Cheat Sheet
No ratings yet
Data Science in Spark With Sparklyr::: Cheat Sheet
2 pages
Amit R. Gawade - CV
No ratings yet
Amit R. Gawade - CV
4 pages
Huawei at Command Reference
0% (1)
Huawei at Command Reference
207 pages
Es M150 SXH 04
No ratings yet
Es M150 SXH 04
6 pages
ABB Motors and Technical Data Sheet Generators: No. Data Unit Remarks
No ratings yet
ABB Motors and Technical Data Sheet Generators: No. Data Unit Remarks
5 pages
Chapter 1 Ancient Civilization Brief History of Science and Technology in The Philippine Before The Spanish Times Stone Age
No ratings yet
Chapter 1 Ancient Civilization Brief History of Science and Technology in The Philippine Before The Spanish Times Stone Age
4 pages
EY IFRS Accounting For Crypto Assets
No ratings yet
EY IFRS Accounting For Crypto Assets
24 pages
Coralia Antenas
No ratings yet
Coralia Antenas
3 pages
GE LMS100 World Power Briefing Systems (May 2010) PDF
No ratings yet
GE LMS100 World Power Briefing Systems (May 2010) PDF
4 pages
How Weighted Overlay Works
100% (4)
How Weighted Overlay Works
15 pages
Spectro Color
No ratings yet
Spectro Color
5 pages
The Design of A Peristaltic Pump: Interim Report
No ratings yet
The Design of A Peristaltic Pump: Interim Report
8 pages
Resume:: 35 + Years in Power Plants
No ratings yet
Resume:: 35 + Years in Power Plants
3 pages
Vertical Separator Sizing Report
No ratings yet
Vertical Separator Sizing Report
4 pages
2016 Cushman CV
0% (1)
2016 Cushman CV
6 pages
Developers
No ratings yet
Developers
45 pages
Model 273A Potentiostat-Galvanostat
No ratings yet
Model 273A Potentiostat-Galvanostat
142 pages
Wcöwj Gv÷Vi: Mini Law School
No ratings yet
Wcöwj Gv÷Vi: Mini Law School
30 pages
Frequent Item Mining
No ratings yet
Frequent Item Mining
35 pages
TE IT SEM-5 Advanced Data Structure - Analysis
No ratings yet
TE IT SEM-5 Advanced Data Structure - Analysis
2 pages
3996 Seal Chamber
No ratings yet
3996 Seal Chamber
2 pages
InstructionBook KBV420 KBV480
No ratings yet
InstructionBook KBV420 KBV480
16 pages
Quanteda PDF
No ratings yet
Quanteda PDF
2 pages
Data & Variable Transformation: Recode and Transform Variables Summarise Variables and Cases Descriptives and Summaries
No ratings yet
Data & Variable Transformation: Recode and Transform Variables Summarise Variables and Cases Descriptives and Summaries
1 page
Machine Learning Modelling in R PDF
No ratings yet
Machine Learning Modelling in R PDF
1 page
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet