0% found this document useful (0 votes)

40 views15 pages

R Practicals (2007 Version)

Uploaded by

20AUCS04 Anandham Nithiya.V

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views15 pages

R Practicals (2007 Version)

Uploaded by

20AUCS04 Anandham Nithiya.V

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 15

ST.

MARY’S COLLEGE (AUTONOMOUS)

THOOTHUKUDI

M.Sc Computer Science(SSC)

(DATAMINING USING R)
2023-2024

Reg.No :

Name :

Semester :

Year :

ST.MARY’S COLLEGE (AUTONOMOUS)

THOOTHUKUDI

DEPARTMENT OF COMPUTER SCIENCE (SSC)

BONAFIDE CERTIFICATE

Reg.No :

Name :

Sub.Code :

This is to certify that this is the bonafide record of the practical work done in
DATAMINING USING R at St .Mary’s College (Autonomous), during the year 2023-2024,
submitted for the M.Sc. Computer Science Practical Examination held on
at St. Mary’s College (Autonomous), Thoothukudi.

Date: Staff-in-charge

Head of the department External Examiner

INDEX

EX.NO. DATE CONTENT PG. NO. SIGNATURE

1 27.11.2023 APRIORI ALGORITHM

2 06.12.2023 K-MEANS CLUSTERING

3 11.01.2024 HIERARCHICAL CLUSTERING

4 07.02.2024 CLASSIFICATION

5 13.02.2024 DECISION TREE

6 22.02.2024 LINEAR REGRESSION

7 06.03.2024 DATA VISUALIZATION

1. Apriori Algorithm
library(arules)

library(arulesViz)

library(RColorBrewer)

# import dataset

data("Groceries")

# using apriori() function

rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.2))

# using inspect() function

inspect(rules[1:10])

# using itemFrequencyPlot() function

arules::itemFrequencyPlot(Groceries, topN = 20,col = brewer.pal(8, 'Pastel2'),

main = 'Relative Item Frequency Plot',

type = "relative",

ylab = "Item Frequency (Relative)")

OUTPUT:

2. K- Means Clustering
set.seed(123)

data<- data.frame(x = c(rnorm(50, mean = 0), rnorm(50, mean = 5)),

y = c(rnorm(50, mean = 0), rnorm(50, mean = 5)))

plot(data$x, data$y, col = "blue", pch = 16, main = "Sample Data for K-Means Clustering")

kmeans_result<- kmeans(data, centers = 2, nstart = 20)

data$cluster<- kmeans_result$cluster

plot(data$x, data$y, col = data$cluster, pch = 16, main = "K-Means Clustering (K=2)")

points(kmeans_result$centers, col = 1:2, pch = 8, cex = 2)

cat("Cluster Centers:\n")

print(kmeans_result$centers)

OUTPUT:
3. Hierarchical Clustering
library(dplyr)

# Summary of dataset in package

head(mtcars)

# Finding distance matrix

distance_mat <- dist(mtcars, method = 'euclidean')

distance_mat

# Fitting Hierarchical clustering Model to training dataset

set.seed(240) # Setting seed

Hierar_cl <- hclust(distance_mat, method = "average")

Hierar_cl

# Plotting dendrogram

plot(Hierar_cl)

# Choosing no. of clusters

# Cutting tree by height

abline(h = 110, col = "green")

# Cutting tree by no. of clusters

fit <- cutree(Hierar_cl, k = 3 )

fit

table(fit)

rect.hclust(Hierar_cl, k = 3, border = "green")

OUTPUT:
4. Classification Algorithm

library(party)
# Create the input data frame.

input.data <- readingSkills[c(1:105), ]

# Create the tree.

output.tree <- ctree(nativeSpeaker ~ age + shoeSize + score, data = input.data)

# Plot the tree.

plot(output.tree)

OUTPUT:

5. Decision Tree

library(dataset)
library(caTools)

library(party)

library(dplyr)

library(magrittr)

data("readingSkills")

head(readingSkills)

sample_data = sample.split(readingSkills, SplitRatio = 0.8)

train_data<- subset(readingSkills, sample_data == TRUE)

test_data<- subset(readingSkills, sample_data == FALSE)

model<- ctree(nativeSpeaker ~ ., train_data)

plot(model)

OUTPUT:

6. Linear Regression
x <-c(151,174,138,186,128,136,179,163,152,131)

y <-c(63,81,56,91,47,57,76,72,62,48)

# Apply the lm() function.

relation<- lm(y~x)

print(summary(relation))

# Plot the chart.

plot(y,x,col="blue",main="Height & Weight Regression",

abline(lm(x~y)),cex=1.3,pch =16,xlab ="Weight in Kg",ylab="Height in cm")

OUTPUT:

7. Data Visualization

barplot(airquality$Ozone, main = 'Ozone Concenteration in air', xlab = 'ozone levels', horiz = TRUE)
barplot(airquality$Ozone, main = 'Ozone Concenteration in air', xlab = 'ozone levels', col ='blue',
horiz = FALSE)
data(airquality)
hist(airquality$Temp, main ="La Guardia Airport's\ Maximum Temperature(Daily)",
xlab ="Temperature(Fahrenheit)",
xlim = c(50, 125), col ="yellow",
freq = TRUE)
boxplot(airquality[, 0:4],main ='Box Plots for Air Quality Parameters')
boxplot(airquality$Wind, main = "Average wind speed\ at La Guardia Airport",
xlab = "Miles per hour", ylab = "Wind",
col = "orange", border = "brown",
horizontal = TRUE, notch = TRUE)
plot(airquality$Ozone, airquality$Month, main ="Scatterplot Example",
xlab ="Ozone Concentration in parts per billion",
ylab =" Month of observation ",
pch = 19)

OUTPUT:

Profitalgo
No ratings yet
Profitalgo
14 pages
Fixed Effects, Random Effects Model Cheat Sheet
100% (1)
Fixed Effects, Random Effects Model Cheat Sheet
4 pages
The Stata Survival Manual by Pevalin D., Robson K.
No ratings yet
The Stata Survival Manual by Pevalin D., Robson K.
389 pages
Biostatistics Syllabus
No ratings yet
Biostatistics Syllabus
11 pages
Chap 011
No ratings yet
Chap 011
183 pages
50 R Exercises
No ratings yet
50 R Exercises
44 pages
Action Research Data Analysis Tutorial
No ratings yet
Action Research Data Analysis Tutorial
30 pages
Forecasting Quiz
No ratings yet
Forecasting Quiz
8 pages
R Lab Manual (1) - Merged
No ratings yet
R Lab Manual (1) - Merged
25 pages
Practical Guide To Statistical Forecasting in APO DP
100% (3)
Practical Guide To Statistical Forecasting in APO DP
49 pages
R - Language
No ratings yet
R - Language
23 pages
DM Lab
No ratings yet
DM Lab
18 pages
DSR LAB MANUAL - 10 Programs
No ratings yet
DSR LAB MANUAL - 10 Programs
34 pages
R Lab Manual
No ratings yet
R Lab Manual
22 pages
Final Data Lab
No ratings yet
Final Data Lab
21 pages
R Record-1
No ratings yet
R Record-1
53 pages
Ida PDF
No ratings yet
Ida PDF
62 pages
Shahun Term Workr1
No ratings yet
Shahun Term Workr1
34 pages
R Program 2025,-1
No ratings yet
R Program 2025,-1
11 pages
R - Language Lab Manual - PG 2024
No ratings yet
R - Language Lab Manual - PG 2024
29 pages
Advanced Databricks Curriculum
No ratings yet
Advanced Databricks Curriculum
2 pages
Da Exp9,10
No ratings yet
Da Exp9,10
9 pages
Datamining
No ratings yet
Datamining
20 pages
Course PDF
No ratings yet
Course PDF
44 pages
KVA Anusha - PGP12021 - BA
100% (1)
KVA Anusha - PGP12021 - BA
8 pages
Data Science Project
No ratings yet
Data Science Project
31 pages
Da Lab Exp 7,8,9,10,11,12
No ratings yet
Da Lab Exp 7,8,9,10,11,12
32 pages
R Programming Practical File
No ratings yet
R Programming Practical File
38 pages
Big Data Analytics Programs Only
No ratings yet
Big Data Analytics Programs Only
22 pages
1
No ratings yet
1
19 pages
Record
No ratings yet
Record
23 pages
R Lab Program
No ratings yet
R Lab Program
20 pages
First Machine Problem
No ratings yet
First Machine Problem
6 pages
Ds
No ratings yet
Ds
2 pages
Big Data Slip Solution
No ratings yet
Big Data Slip Solution
18 pages
Datamining Lab Record
No ratings yet
Datamining Lab Record
36 pages
Fdsa Record Ai&Ds
No ratings yet
Fdsa Record Ai&Ds
26 pages
Data Scinece Practical File
No ratings yet
Data Scinece Practical File
23 pages
Juno Data Analytics Course Package
100% (1)
Juno Data Analytics Course Package
12 pages
Data Science Solved
No ratings yet
Data Science Solved
12 pages
Kanak Gupta 1116 SEC Assignment
No ratings yet
Kanak Gupta 1116 SEC Assignment
3 pages
Datamining 2
No ratings yet
Datamining 2
54 pages
BDA Lab Manual (12 Weeks)
No ratings yet
BDA Lab Manual (12 Weeks)
22 pages
R Commands
No ratings yet
R Commands
18 pages
Saurabh
No ratings yet
Saurabh
22 pages
Data Analysis Using R and Python
No ratings yet
Data Analysis Using R and Python
99 pages
Part A R Programming
No ratings yet
Part A R Programming
10 pages
R Program
No ratings yet
R Program
22 pages
Ds
No ratings yet
Ds
2 pages
Model 1
No ratings yet
Model 1
14 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
40 pages
2359-Article Text-7873-1-10-20230314
No ratings yet
2359-Article Text-7873-1-10-20230314
8 pages
R Lab
No ratings yet
R Lab
15 pages
DA Lab Week-1
No ratings yet
DA Lab Week-1
7 pages
DATAMINING
No ratings yet
DATAMINING
24 pages
BDA MSC It
No ratings yet
BDA MSC It
35 pages
WEEK
No ratings yet
WEEK
17 pages
R Program Record Book Iba
No ratings yet
R Program Record Book Iba
24 pages
05 MQA Pre-Test & Post Test Analysis With SAMPLE COMPUTATIONS
No ratings yet
05 MQA Pre-Test & Post Test Analysis With SAMPLE COMPUTATIONS
5 pages
R Programs 2024-2025
No ratings yet
R Programs 2024-2025
13 pages
Cost Practical
No ratings yet
Cost Practical
13 pages
PG DM
No ratings yet
PG DM
4 pages
DS Lab
No ratings yet
DS Lab
31 pages
Ismaykim1 PDF
No ratings yet
Ismaykim1 PDF
522 pages
Neeraj - Nepal Resume - D365
No ratings yet
Neeraj - Nepal Resume - D365
9 pages
R Workshop Material 18-19, Oct-2023
No ratings yet
R Workshop Material 18-19, Oct-2023
67 pages
R Lab File Deepak
No ratings yet
R Lab File Deepak
27 pages
Unit 9 (STAT 17 Assignment)
No ratings yet
Unit 9 (STAT 17 Assignment)
5 pages
R File Code
No ratings yet
R File Code
16 pages
BAN5
No ratings yet
BAN5
2 pages
Stin 5014 (Artificial Intelligence Assignment II (20 %)
No ratings yet
Stin 5014 (Artificial Intelligence Assignment II (20 %)
14 pages
DR - Arunachalam Rajagopal - Time Series Forecasting With R A Beginner's Guide (2020)
No ratings yet
DR - Arunachalam Rajagopal - Time Series Forecasting With R A Beginner's Guide (2020)
93 pages
RSTUDIO
No ratings yet
RSTUDIO
44 pages
Skripsi Eka Serli Sudarni
No ratings yet
Skripsi Eka Serli Sudarni
62 pages
The Effect of Indigofera Sp. Leaf On The Protein Level of Rabbit Meat (Orictolagus SP)
No ratings yet
The Effect of Indigofera Sp. Leaf On The Protein Level of Rabbit Meat (Orictolagus SP)
6 pages
Eco 404
No ratings yet
Eco 404
3 pages
Some Statistical Methods in Anachem
No ratings yet
Some Statistical Methods in Anachem
39 pages
Chapter 11
No ratings yet
Chapter 11
134 pages
10 1108 - MD 09 2021 1199
No ratings yet
10 1108 - MD 09 2021 1199
28 pages
Printchoices Cdac1
No ratings yet
Printchoices Cdac1
2 pages
Linear Regression Using TensorFlow PDF
No ratings yet
Linear Regression Using TensorFlow PDF
5 pages
Data Ind
No ratings yet
Data Ind
4 pages
Scatter PLOTS - 20 Jan 2023
No ratings yet
Scatter PLOTS - 20 Jan 2023
23 pages
IME 212 Course Orientation
No ratings yet
IME 212 Course Orientation
15 pages
Simple Tutorial in R
No ratings yet
Simple Tutorial in R
15 pages
UNIT 2-3 - Notes - Unit-2-3-Notes
No ratings yet
UNIT 2-3 - Notes - Unit-2-3-Notes
16 pages
Regression Dataset
No ratings yet
Regression Dataset
3 pages
CHAPTER 5 Exploratory Research Design: Qualitative Research
No ratings yet
CHAPTER 5 Exploratory Research Design: Qualitative Research
3 pages
Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

R Practicals (2007 Version)

Uploaded by

R Practicals (2007 Version)

Uploaded by

ST.

MARY’S COLLEGE (AUTONOMOUS)

M.Sc Computer Science(SSC)

ST.MARY’S COLLEGE (AUTONOMOUS)

DEPARTMENT OF COMPUTER SCIENCE (SSC)

Head of the department External Examiner

EX.NO. DATE CONTENT PG. NO. SIGNATURE

1 27.11.2023 APRIORI ALGORITHM

2 06.12.2023 K-MEANS CLUSTERING

3 11.01.2024 HIERARCHICAL CLUSTERING

5 13.02.2024 DECISION TREE

6 22.02.2024 LINEAR REGRESSION

7 06.03.2024 DATA VISUALIZATION

# using apriori() function

rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.2))

# using inspect() function

# using itemFrequencyPlot() function

arules::itemFrequencyPlot(Groceries, topN = 20,col = brewer.pal(8, 'Pastel2'),

main = 'Relative Item Frequency Plot',

ylab = "Item Frequency (Relative)")

data<- data.frame(x = c(rnorm(50, mean = 0), rnorm(50, mean = 5)),

y = c(rnorm(50, mean = 0), rnorm(50, mean = 5)))

kmeans_result<- kmeans(data, centers = 2, nstart = 20)

points(kmeans_result$centers, col = 1:2, pch = 8, cex = 2)

# Summary of dataset in package

# Finding distance matrix

distance_mat <- dist(mtcars, method = 'euclidean')

# Fitting Hierarchical clustering Model to training dataset

set.seed(240) # Setting seed

Hierar_cl <- hclust(distance_mat, method = "average")

# Choosing no. of clusters

# Cutting tree by height

abline(h = 110, col = "green")

# Cutting tree by no. of clusters

fit <- cutree(Hierar_cl, k = 3 )

rect.hclust(Hierar_cl, k = 3, border = "green")

input.data <- readingSkills[c(1:105), ]

# Create the tree.

output.tree <- ctree(nativeSpeaker ~ age + shoeSize + score, data = input.data)

# Plot the tree.

sample_data = sample.split(readingSkills, SplitRatio = 0.8)

train_data<- subset(readingSkills, sample_data == TRUE)

test_data<- subset(readingSkills, sample_data == FALSE)

model<- ctree(nativeSpeaker ~ ., train_data)

# Apply the lm() function.

# Plot the chart.

plot(y,x,col="blue",main="Height & Weight Regression",

abline(lm(x~y)),cex=1.3,pch =16,xlab ="Weight in Kg",ylab="Height in cm")

You might also like