Sample Code For Twitter Processing in R

This document loads personality trait training and test data, preprocesses the data by adding indicator columns for missing values and replacing missing values with -1, trains random forest models to predict each trait using the training data, makes predictions on the test data, and writes the results to a CSV file for submission.

Uploaded by

vinodnerella

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

91 views

Sample Code For Twitter Processing in R

Uploaded by

vinodnerella

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 1

test = read.csv("Personality_Traits_Testset_v1.

csv")
target_names = names(test)[2:8]

set.seed(48484)
submission = test[,1:8]
for (name in target_names) {
submission[,name] = sample(1:nrow(test))
}
write.csv(submission, file = "./upload/random.csv", row.names = FALSE)

train = read.csv("Personality_Traits_Trainingset_v1.csv")

#function for adding NAs indicators to dataframe and replacing NA's with a
value---"cols" is vector of columns to operate on
# (necessary for randomForest package)
appendNAs <- function(dataset, cols) {
append_these = data.frame( is.na(dataset[, cols] ))
names(append_these) = paste(names(append_these), "NA", sep = "_")
dataset = cbind(dataset, append_these)
dataset[is.na(dataset)] = -1
return(dataset)
}

#replacements:
train <- appendNAs(train,9:ncol(train))
test <- appendNAs(test,9:ncol(test))

submissionRF = test[,1:8]
library("randomForest")
set.seed(939547)
for (name in target_names) {
print(name)
rf = randomForest(train[,9:ncol(train)],train[,name],
do.trace=TRUE,importance=FALSE, sampsize = nrow(train)*.7, ntree = 100)
predictions = predict(rf, test[,9:ncol(test)])
submissionRF[,name] = predictions
}

write.csv(submissionRF, file = "./upload/random_forest.csv", row.names = FALSE)

Assignment#3 (Naive Bayes)
No ratings yet
Assignment#3 (Naive Bayes)
5 pages
Pattern Recognition
No ratings yet
Pattern Recognition
26 pages
Import Numpy As NP
No ratings yet
Import Numpy As NP
4 pages
C121 Exp1
No ratings yet
C121 Exp1
32 pages
Code
No ratings yet
Code
25 pages
Practical 1 EDA
No ratings yet
Practical 1 EDA
14 pages
IFM GROUP2 CODE
No ratings yet
IFM GROUP2 CODE
7 pages
Ex-12 Implementation of LSTM
No ratings yet
Ex-12 Implementation of LSTM
6 pages
DOC-20250211-WA0009. (1)
No ratings yet
DOC-20250211-WA0009. (1)
26 pages
Cardio Screen RF
100% (1)
Cardio Screen RF
27 pages
Code Documentation: Loading The Packages
No ratings yet
Code Documentation: Loading The Packages
5 pages
ML Lab
No ratings yet
ML Lab
7 pages
EDS - Python Cheat Sheet
No ratings yet
EDS - Python Cheat Sheet
3 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Materi Demo Data Mining
No ratings yet
Materi Demo Data Mining
5 pages
Email Spam Classifier
No ratings yet
Email Spam Classifier
22 pages
cyberbullying code
No ratings yet
cyberbullying code
6 pages
Ex 6
No ratings yet
Ex 6
2 pages
Ai Last 5
No ratings yet
Ai Last 5
4 pages
Newserver : Server (: Step-01 Class Def
No ratings yet
Newserver : Server (: Step-01 Class Def
3 pages
DataCamp DataScience
No ratings yet
DataCamp DataScience
18 pages
3NaiveBayesModel
No ratings yet
3NaiveBayesModel
3 pages
Activity 4 CGPA Vs Placement Package Program
No ratings yet
Activity 4 CGPA Vs Placement Package Program
4 pages
DSCI 100 Cheat Sheet
No ratings yet
DSCI 100 Cheat Sheet
3 pages
XX
No ratings yet
XX
4 pages
Pandas CheatSheet
No ratings yet
Pandas CheatSheet
18 pages
Laporan Praktikum 2 672022337
No ratings yet
Laporan Praktikum 2 672022337
33 pages
Nibedita Dehury, 123CE0079, ASSIGNMENT 9
No ratings yet
Nibedita Dehury, 123CE0079, ASSIGNMENT 9
18 pages
dl_5 excuted
No ratings yet
dl_5 excuted
13 pages
External
No ratings yet
External
11 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
Pandas
No ratings yet
Pandas
9 pages
Chapter 3 Data Management in R
No ratings yet
Chapter 3 Data Management in R
12 pages
CopulaGJM
No ratings yet
CopulaGJM
1 page
naivebayes labprg2
No ratings yet
naivebayes labprg2
3 pages
1.1 Loading The Data: Survival by Sex
No ratings yet
1.1 Loading The Data: Survival by Sex
6 pages
main.py (1)
No ratings yet
main.py (1)
10 pages
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
No ratings yet
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
25 pages
Upgrade Config - Py
No ratings yet
Upgrade Config - Py
5 pages
CHAPTER 3 DATA MANAGEMENT IN R
No ratings yet
CHAPTER 3 DATA MANAGEMENT IN R
13 pages
Titanic Dataset Model Prediction
No ratings yet
Titanic Dataset Model Prediction
11 pages
8 R Basics 3
No ratings yet
8 R Basics 3
27 pages
Dl 5 Excuted
No ratings yet
Dl 5 Excuted
13 pages
Creating Deep Learning Model in vs Code
No ratings yet
Creating Deep Learning Model in vs Code
5 pages
Experiment 1 solution
No ratings yet
Experiment 1 solution
5 pages
Project Ali Huzaifa
No ratings yet
Project Ali Huzaifa
6 pages
Monitor Py
No ratings yet
Monitor Py
35 pages
Pandasmatplotlib Practical File
No ratings yet
Pandasmatplotlib Practical File
15 pages
Shiva Teja
No ratings yet
Shiva Teja
19 pages
Loading Pandas
No ratings yet
Loading Pandas
23 pages
Exp 5
No ratings yet
Exp 5
4 pages
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
100% (1)
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
10 pages
Principal Component Analysis Notes : Info
No ratings yet
Principal Component Analysis Notes : Info
22 pages
DL 8
No ratings yet
DL 8
2 pages
Pandas: Import
100% (1)
Pandas: Import
13 pages
code
No ratings yet
code
13 pages
Ex 3
No ratings yet
Ex 3
5 pages
Train Edu Bert
No ratings yet
Train Edu Bert
3 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet
Spark and Scala 2
No ratings yet
Spark and Scala 2
11 pages
Yug Chhabda: Engineer" in Your Organization
No ratings yet
Yug Chhabda: Engineer" in Your Organization
1 page
Account Financial Report
No ratings yet
Account Financial Report
1 page
Solved Problems
No ratings yet
Solved Problems
55 pages