Ds

The document outlines various statistical analyses and data manipulation techniques using R, including correlation tests, t-tests, ANOVA, decision trees, and clustering methods. It also includes practical applications of time-series forecasting and principal component analysis on different datasets. Additionally, there are examples of MongoDB queries for data retrieval and manipulation.

Uploaded by

sefami1889

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views2 pages

Ds

Uploaded by

sefami1889

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Bankai str(cor)

BANKAI summary(cor)
BANKAI cor.test(cor$aptitude,cor$job_prof,alternative = "two.sided",method =
BANKIA "pearson")
AIDEJDXSKN #paired t-test application
FDNVFJSKNDCK stud<-read.csv("student.csv",sep = ",",header = T)
FVISJICKN;KSJFNVXC View(stud)
str(stud)
JM’LFVKNLKNXFV summary(stud)
boxplot(stud)
t.test(stud$Test1,stud$Test2,alternative="less",paired = T)
#correlation - Ice cream
OXMFMVL NKLJVF ice<-read.csv("icecream.csv",sep = ",",header = T)
;X KNDKLFVXN LXKNVF View(ice)
mean(biopsy1$predict==biopsy1$class) str(ice)
summary(ice)
Practical of Decision Tree boxplot(ice)
Regression tree cor.test(ice$Total.sales,ice$Temp,alternative = "two.sided",method =
data<-read.csv("Hitters.csv",sep = ",",header = T) "pearson")
View(data)...str(data) …summary(data)... names(data) …library(rpart)
regtree<-rpart(Salary~Hits+Runs+Years,data=data) Aim : Practical of Analysis of Variance
regtree …plot(regtree) …plot(regtree)... text(regtree) #one-way-anova test
install.packages("rpart.plot") library(rpart.plot) …rpart.plot(regtree) … data1<-read.csv("one-way-anova.csv",sep = ",", header = T)
View(regtree) … names(data1) …str(data1)
//Cp-complexity parameter data1$dept<-as.factor(data1$dept)
regtree$cptable …cp=min(regtree$cptable[5,]) … str(data1) …summary(data1) …View(data1) …head(data1)
pr=prune(regtree,cp=cp) …rpart.plot(pr) … anv1<-aov(formula=satindex~dept,data=data1)...summary(anv1)
//Classification Tree
library("MASS") …data("biopsy") …View(biopsy) …str(biopsy) … #two-way-anova test
names(biopsy) …summary(biopsy) …biopsy$ID=NULL data2<-read.csv("crop-data.csv",sep = ",",header = T)
classtree<-rpart(class~.,data=biopsy) names(data2)
rpart.plot(classtree) str(data2)
biopsy$pred=predict(classtree,biopsy,type = "class") data2$density<-as.factor(data2$density)
table(biopsy$pred,biopsy$class) str(data2)
install.packages("titanic") summary(data2)
library("titanic") head(data2)
data("titanic_train") View(data2)
str(titanic_train) anv2<-aov(formula=yield~density+block+fertilizer,data=data2)
View(titanic_train) summary(anv2)
titanic_train$Name=NULL
titanictree<-rpart(Survived~Pclass+Age+Parch,data = titanic_train) library(readxl)
rpart.plot(titanictree) mydata<-read.csv("newsadv.csv") …View(mydata) …names(mydata)
anv<-aov(formula=Count~Day+Section,data=mydata)
'Classification tree' summary(anv)
golf<-read.csv("Golf.csv",sep = ',',header = T) Practical of Clustering
View(golf)...str(golf) …names(golf) …library("rpart") … # K-means clustering on IRIS dataset
install.packages("rpart.plot") …library("rpart.plot") … data("iris")...names(iris)...newdata<-iris[,-5]...head(newdata)
tree<-rpart(Play~.,data=golf,control = rpart.control(minsplit = fit<-kmeans(newdata,3)
1,minbucket = 1,cp=0)) …rpart.plot(tree) library(cluster)
clusplot(newdata,fit$cluster,color=T,shade=T,labels=2,lines=0)
fit… fit$size
Practical of Hypothesis Testing #one sample t-test dim(newdata)
data<-read.csv("onesample.csv",sep = ",",header = T) # Hierarchical clustering on IRIS dataset
View(data) …str(data) …summary(data) …boxplot(data) # dist function is used to compute the distance matrix
t.test(data$Time,mu=80,alternative="greater") # i.e. Euclidean distance between every pair of observations
#two sample t-test clust<-hclust(dist(iris[,3:4]))
my_data<-read.csv("twosample.csv",sep = ",",header = T) plot(clust)
View(my_data) …str(my_data) … clusterCut<-cutree(clust,3)
summary(my_data) …boxplot(my_data) … table(clusterCut,iris$Species)
var.test(my_data$time_g1,my_data$time_g2,alternative="two.sided") clust<-hclust(dist(iris[,3:4]),method = "average")
t.test(my_data$time_g1,my_data$time_g2,alternative="two.sided") plot(clust)
#paired t-test clusterCut<-cutree(clust,3)
time<-read.csv("paired_t_test.csv",sep = ",",header = T) table(clusterCut,iris$Species)
View(time) …str(time) …
summary(time) …boxplot(time) Aim : Practical of Time-Series Forecasting
t.test(time$time_before,time$time_after,alternative="greater",paired = # Time Series Analysis and Forecasting on AirPassengers
T) install.packages("forecast")
#correlation library(forecast)
cor<-read.csv("correlation.csv",sep = ",",header = T) data("AirPassengers")
View(cor) class(AirPassengers)
head(AirPassengers)
sum(is.na(AirPassengers))
summary(AirPassengers)
plot(AirPassengers)
tsdata<-ts(AirPassengers,frequency = 12)
ddata<-decompose(tsdata)
plot(ddata)
holt<-HoltWinters(tsdata,beta = FALSE,gamma = FALSE)
plot(holt)
# Time Series Analysis on Rainfall dataset
rainfall<-read.csv("rainfall.csv",sep = ",",header = T)
head(rainfall)
summary(rainfall)
class(rainfall)
tsdata<-ts(rainfall,frequency = 12,start = c(2012,1))
class(tsdata)
plot(tsdata)

Aim : Practical of Principal Component Analysis.

# Principal Component Analysis upon IRIS dataset
data("iris")
str(iris)
summary(iris)
mypr<-prcomp(iris[,-5])
mypr
summary(mypr)
plot(mypr,type="l")
biplot(mypr)

db.student.insert({_id=101,RollNo:4,Name=”Laxmi”,Marks:450,H
obbies:[“Reading”,”Danci ng”]});

db.student.find({Class:”TYCS”},{Name:1,Class:1,_id=0})
db.student.find({Class:{$ne:”TYCS”}},{Name:1,Class:1,_id:0})
db.student.find().sort({Marks:1}) //ascending
db.student.find({Class:”TYCS”},Marks:{$gt:400}})
//or, and, not
db.student.find({$or:[{Class:”TYCS”},Marks:{$gt:500}}]})
db.student.find({Class:{$ne:”TYCS”}},{Name:1,Class:1,_id:0}) ->
will name and class of those students whose class not TYCS
db.student.update({RollNo:2},{$set:{Marks:531}})
db.student.remove({Class:”FYCS”})
db.student.updateMany({Class:”TYCS”},{$inc:{Marks:5}})
db.Employee.aggregate({$group:{“_id”:”$Dept”,”Count”:{$sum:
1}}}) -> This will retrieve the number of employees in each
department
…………..:”$Dept”,”Count”:{$avg:”$Salary”}}})

db.student.find({},{Name:1,Marks:1,_is:0}).sort({Marks:1}) ->
sort the name and marks using projection argument

Ds
No ratings yet
Ds
2 pages
Toc ch1
No ratings yet
Toc ch1
9 pages
R Lab Program
No ratings yet
R Lab Program
20 pages
DATAMINING
No ratings yet
DATAMINING
24 pages
Data Science
No ratings yet
Data Science
15 pages
Bi 5to 8
No ratings yet
Bi 5to 8
6 pages
Lab Manual - DSR
No ratings yet
Lab Manual - DSR
32 pages
Model Lab
No ratings yet
Model Lab
6 pages
R Practicals (2007 Version)
No ratings yet
R Practicals (2007 Version)
15 pages
Aman DA 111
No ratings yet
Aman DA 111
14 pages
Syntax For R Stats: Appraisal - Data (Name of Data Sheet) Descriptive
No ratings yet
Syntax For R Stats: Appraisal - Data (Name of Data Sheet) Descriptive
4 pages
R - Language Lab Manual - PG 2024
No ratings yet
R - Language Lab Manual - PG 2024
29 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
BAN5
No ratings yet
BAN5
2 pages
Module - 4 (R Training) - Basic Stats & Modeling
No ratings yet
Module - 4 (R Training) - Basic Stats & Modeling
15 pages
Shahun Term Workr1
No ratings yet
Shahun Term Workr1
34 pages
R Commands
No ratings yet
R Commands
18 pages
R
No ratings yet
R
6 pages
Da 06-10
No ratings yet
Da 06-10
14 pages
Datamining Lab Record
No ratings yet
Datamining Lab Record
36 pages
R Course
No ratings yet
R Course
7 pages
Final Data Lab
No ratings yet
Final Data Lab
21 pages
WEEK
No ratings yet
WEEK
17 pages
DM Lab
No ratings yet
DM Lab
18 pages
R Practicals
No ratings yet
R Practicals
32 pages
R Codes
No ratings yet
R Codes
5 pages
Datamining
No ratings yet
Datamining
20 pages
Rstudio Study Notes For PA 20181126
No ratings yet
Rstudio Study Notes For PA 20181126
6 pages
Codes
No ratings yet
Codes
14 pages
R Assignment
No ratings yet
R Assignment
8 pages
R Training AM
No ratings yet
R Training AM
6 pages
21BCS5999 - Ankit Kumar (Assignment 2)
No ratings yet
21BCS5999 - Ankit Kumar (Assignment 2)
16 pages
R Basics
No ratings yet
R Basics
18 pages
COST - JournalPracticals (1-7)
No ratings yet
COST - JournalPracticals (1-7)
22 pages
Time Series Analysis
No ratings yet
Time Series Analysis
4 pages
1
No ratings yet
1
19 pages
R Note
No ratings yet
R Note
56 pages
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
No ratings yet
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
8 pages
R File Code
No ratings yet
R File Code
16 pages
R Program
No ratings yet
R Program
22 pages
BDA MSC It
No ratings yet
BDA MSC It
35 pages
Da Thoery
No ratings yet
Da Thoery
24 pages
R Code
No ratings yet
R Code
9 pages
Datamining 2
No ratings yet
Datamining 2
54 pages
Cost Practical
No ratings yet
Cost Practical
13 pages
CORRELATION AND COVARIANCE in R
100% (1)
CORRELATION AND COVARIANCE in R
24 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
Da Lab File
No ratings yet
Da Lab File
33 pages
4063 Final复习资料
No ratings yet
4063 Final复习资料
6 pages
Statistics Cheatsheet 1703847367
No ratings yet
Statistics Cheatsheet 1703847367
8 pages
R Syntax Examples 1
No ratings yet
R Syntax Examples 1
6 pages
DSR LAB MANUAL - 10 Programs
No ratings yet
DSR LAB MANUAL - 10 Programs
34 pages
R Studio Notes
No ratings yet
R Studio Notes
10 pages
Data Analyzer
No ratings yet
Data Analyzer
10 pages
Statistical Methods For Data Science
100% (2)
Statistical Methods For Data Science
406 pages
8 - Cia 3 Key
No ratings yet
8 - Cia 3 Key
3 pages
List of Functions
No ratings yet
List of Functions
7 pages
AMDA Practical - A048
No ratings yet
AMDA Practical - A048
35 pages
Data Science Practicals
No ratings yet
Data Science Practicals
47 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet

Ds

Uploaded by

Ds

Uploaded by

Bankai str(cor)

Aim : Practical of Principal Component Analysis.

You might also like