Assignment 2 Tidyr

R assignment

Uploaded by

prashatri5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views2 pages

Assignment 2 Tidyr

R assignment

Uploaded by

prashatri5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

Assignment 2

Q1: Discuss tidyr Package in R Programming

The `tidyr` package in R is part of the tidyverse collection of packages designed for data
manipulation and cleaning. It provides a set of functions to restructure and clean datasets,
enabling data scientists and analysts to organize their data in a format that is easier to
analyze and visualize. The primary goal of `tidyr` is to convert datasets into a tidy format,
where each variable is a column, each observation is a row, and each type of observational
unit forms a table.

The tidy data principles ensure consistency and compatibility with other tidyverse tools like
`dplyr`, `ggplot2`, and `purrr`. The `tidyr` package offers a suite of tools for reshaping,
splitting, and unifying data to make it suitable for analysis.

Q2: tidyr Package Functions for Data Cleaning

The `tidyr` package provides several functions that are essential for cleaning and reshaping
data. Below are key functions with examples using inbuilt datasets in R:

1. gather()
The `gather()` function reshapes data from a wide format to a long format, combining
multiple columns into key-value pairs. It is particularly useful when variables are spread
across columns and need to be combined into two columns: one for the variable name and
another for its value.

Example using the `mtcars` dataset:

```R
library(tidyr)
data <- data.frame(model = rownames(mtcars), mtcars[, 1:4])
tidy_data <- gather(data, key = "variable", value = "value", mpg:hp)
print(tidy_data)
```

2. separate()
The `separate()` function splits a single column into multiple columns based on a specified
delimiter. This is helpful when data is stored in a combined format, such as a full name or a
date.

Example using a custom dataset:

```R
data <- data.frame(name = c("John_Doe", "Jane_Smith"))
tidy_data <- separate(data, name, into = c("first_name", "last_name"), sep = "_")
print(tidy_data)
```

3. spread()
The `spread()` function transforms data from a long format to a wide format, converting
key-value pairs into columns. This is useful when observations need to be spread across
multiple columns.

Example using a custom dataset:

```R
data <- data.frame(key = c("A", "A", "B", "B"),
variable = c("X", "Y", "X", "Y"),
value = c(1, 2, 3, 4))
tidy_data <- spread(data, key = variable, value = value)
print(tidy_data)
```

4. unite()
The `unite()` function combines multiple columns into a single column, with values
separated by a specified delimiter. It is the inverse of the `separate()` function.

Example using a custom dataset:

```R
data <- data.frame(first_name = c("John", "Jane"), last_name = c("Doe", "Smith"))
tidy_data <- unite(data, full_name, first_name, last_name, sep = " ")
print(tidy_data)
```

RSCH2111 Practical Research 1 First Quarter Exam
No ratings yet
RSCH2111 Practical Research 1 First Quarter Exam
123 pages
Bayanan 2
No ratings yet
Bayanan 2
63 pages
Assignment 2 Tidyr
No ratings yet
Assignment 2 Tidyr
2 pages
Tidyr Assignment
No ratings yet
Tidyr Assignment
1 page
Advanced R Programming Tidyverse Packages Notes
No ratings yet
Advanced R Programming Tidyverse Packages Notes
12 pages
DV Lab
No ratings yet
DV Lab
52 pages
Learn R - Learn R - Data Cleaning Cheatsheet - Codecademy
No ratings yet
Learn R - Learn R - Data Cleaning Cheatsheet - Codecademy
4 pages
BMR Assignment: Tidyr
No ratings yet
BMR Assignment: Tidyr
3 pages
MIT 302 - Statistical Computing II - Tutorial 02
No ratings yet
MIT 302 - Statistical Computing II - Tutorial 02
5 pages
RSTUDIO
No ratings yet
RSTUDIO
44 pages
What Are The Tidyverse Packages in R Language?
No ratings yet
What Are The Tidyverse Packages in R Language?
12 pages
Data Analytics Lesson 10 Notes
No ratings yet
Data Analytics Lesson 10 Notes
7 pages
Data Cleaning Using R
No ratings yet
Data Cleaning Using R
26 pages
Intro To Data Science Lecture 4
No ratings yet
Intro To Data Science Lecture 4
13 pages
Unit - 2: Data Manipulation With R & Data Visualization in Watson Studio
No ratings yet
Unit - 2: Data Manipulation With R & Data Visualization in Watson Studio
58 pages
Group Manipulation and Data Reshaping in R
No ratings yet
Group Manipulation and Data Reshaping in R
10 pages
Data Tidying With Tidyr::: Cheat Sheet
No ratings yet
Data Tidying With Tidyr::: Cheat Sheet
2 pages
Data Cleaning Using R
No ratings yet
Data Cleaning Using R
26 pages
BS730 Class 12
No ratings yet
BS730 Class 12
36 pages
Tidyverse - Tidyr and Dplyr
No ratings yet
Tidyverse - Tidyr and Dplyr
33 pages
Plyr Package in R Programming
No ratings yet
Plyr Package in R Programming
9 pages
R Reference Card
No ratings yet
R Reference Card
1 page
DataCamp Week 5
No ratings yet
DataCamp Week 5
7 pages
R Basic and Advanced
No ratings yet
R Basic and Advanced
9 pages
R Packages Dplyr Sem-III 2021
No ratings yet
R Packages Dplyr Sem-III 2021
13 pages
Unit 5 - R and Data Analysis
No ratings yet
Unit 5 - R and Data Analysis
29 pages
Apply Functions With Purrr::: Cheat Sheet
No ratings yet
Apply Functions With Purrr::: Cheat Sheet
2 pages
ProgrammingForDS14 Rbasics
No ratings yet
ProgrammingForDS14 Rbasics
32 pages
Data Cleansing Using R
0% (1)
Data Cleansing Using R
10 pages
CRM Cheat Sheet
No ratings yet
CRM Cheat Sheet
7 pages
R Programming Cheat Sheet
No ratings yet
R Programming Cheat Sheet
7 pages
CleaningData Chapter 2
No ratings yet
CleaningData Chapter 2
21 pages
Important R Codes and Notes
No ratings yet
Important R Codes and Notes
13 pages
Solutions For QB3
No ratings yet
Solutions For QB3
14 pages
Manipulating Data in R
No ratings yet
Manipulating Data in R
32 pages
MIT 201 - Tutorial 02
No ratings yet
MIT 201 - Tutorial 02
12 pages
R Programming Cont..
No ratings yet
R Programming Cont..
24 pages
R Reference Card
No ratings yet
R Reference Card
6 pages
R Reference Card
No ratings yet
R Reference Card
6 pages
Phan Project2 Report
No ratings yet
Phan Project2 Report
10 pages
Importing The Files
No ratings yet
Importing The Files
14 pages
Data Manipulation in R
No ratings yet
Data Manipulation in R
5 pages
R
No ratings yet
R
13 pages
1 - Tidying Data - R - Primary
No ratings yet
1 - Tidying Data - R - Primary
13 pages
Tidyverse: Core Packages in Tidyverse
No ratings yet
Tidyverse: Core Packages in Tidyverse
8 pages
Advanced R Data Analysis Training PDF
No ratings yet
Advanced R Data Analysis Training PDF
72 pages
R Programming
No ratings yet
R Programming
11 pages
R Vectors
No ratings yet
R Vectors
22 pages
BA Notes
No ratings yet
BA Notes
5 pages
De&v Record
No ratings yet
De&v Record
36 pages
Lesson 7 - The Data Frame
No ratings yet
Lesson 7 - The Data Frame
7 pages
Basic R Dplyr Session 4 Demonstration
No ratings yet
Basic R Dplyr Session 4 Demonstration
18 pages
UL2
No ratings yet
UL2
2 pages
Mod3 Tables EPP
No ratings yet
Mod3 Tables EPP
9 pages
Cleaning Data
No ratings yet
Cleaning Data
17 pages
Tidy Data PDF
No ratings yet
Tidy Data PDF
21 pages
4 Aids
No ratings yet
4 Aids
4 pages
Algorithms and Data Structures: An Easy Guide to Programming Skills
From Everand
Algorithms and Data Structures: An Easy Guide to Programming Skills
Rigdon Jonathan
No ratings yet
Mastering Data Structures and Algorithms in Python & Java
From Everand
Mastering Data Structures and Algorithms in Python & Java
Sachin Naha
No ratings yet
Data Science with R: Beginner to Expert
From Everand
Data Science with R: Beginner to Expert
Narayana Nemani
No ratings yet
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Design And Analysis Of Algorithm
From Everand
Design And Analysis Of Algorithm
Bhupendra Mandloi
No ratings yet
Geospatial Visualisation
No ratings yet
Geospatial Visualisation
38 pages
HVCO Draft Report by BBA - Sem3 - C5
No ratings yet
HVCO Draft Report by BBA - Sem3 - C5
15 pages
An Introduction To Mongodb: Rácz Gábor
No ratings yet
An Introduction To Mongodb: Rácz Gábor
18 pages
Sample Resume 10 - HIVE, Hadoop, Ad - SAS, Tableau, SAS, VBA, MS Excel, MS Access 8 Yrs
No ratings yet
Sample Resume 10 - HIVE, Hadoop, Ad - SAS, Tableau, SAS, VBA, MS Excel, MS Access 8 Yrs
2 pages
12th BST Chapter 2 Notes
No ratings yet
12th BST Chapter 2 Notes
4 pages
Normalization
No ratings yet
Normalization
2 pages
Tesi ALBERTO FERRARIO
No ratings yet
Tesi ALBERTO FERRARIO
120 pages
TeamMate Operational Utility
No ratings yet
TeamMate Operational Utility
35 pages
Research Project: Assignment Submitted by
No ratings yet
Research Project: Assignment Submitted by
11 pages
Sustainable Livelihood Program in Davao City: An Assessment
No ratings yet
Sustainable Livelihood Program in Davao City: An Assessment
8 pages
It Capstone Project Proposed Contents
No ratings yet
It Capstone Project Proposed Contents
24 pages
5 D 8 D 1 F 1 D 55 D
No ratings yet
5 D 8 D 1 F 1 D 55 D
3 pages
DBMS 2 3
No ratings yet
DBMS 2 3
2 pages
Big Data Analytics - Lecture 4
No ratings yet
Big Data Analytics - Lecture 4
23 pages
Beyond Apps Digital Literacies in A Plat
No ratings yet
Beyond Apps Digital Literacies in A Plat
7 pages
Learning-Practice - Oracle 12C PDF
100% (1)
Learning-Practice - Oracle 12C PDF
7 pages
SQL Commands For Class XII Computer Science - IP CBSE - Computer Science Tutorial
No ratings yet
SQL Commands For Class XII Computer Science - IP CBSE - Computer Science Tutorial
18 pages
Common Sensor Data Record Science Processing Algorithm (C-SDR - SPA) User's Guide
No ratings yet
Common Sensor Data Record Science Processing Algorithm (C-SDR - SPA) User's Guide
18 pages
Nptel Week12 MCQ
No ratings yet
Nptel Week12 MCQ
6 pages
HC110111012 File System Navigation and Management
No ratings yet
HC110111012 File System Navigation and Management
19 pages
ADS Tut 5 UE213073
No ratings yet
ADS Tut 5 UE213073
7 pages
Spanner Google's Globally-Distributed Database
No ratings yet
Spanner Google's Globally-Distributed Database
14 pages
Cost Engineering
No ratings yet
Cost Engineering
6 pages
GPFS and HDFS
No ratings yet
GPFS and HDFS
5 pages
Pisa 2015 Ms - Released Item Descriptions Final English
No ratings yet
Pisa 2015 Ms - Released Item Descriptions Final English
29 pages
Relational Model in DBMS
No ratings yet
Relational Model in DBMS
5 pages
Thesis About K-12 Curriculum in The Philippines
100% (2)
Thesis About K-12 Curriculum in The Philippines
6 pages
Tutorial9 Solutions 2
No ratings yet
Tutorial9 Solutions 2
3 pages

Assignment 2 Tidyr

Uploaded by

Assignment 2 Tidyr

Uploaded by

Assignment 2

Q1: Discuss tidyr Package in R Programming

Q2: tidyr Package Functions for Data Cleaning

Example using the `mtcars` dataset:

Example using a custom dataset:

Example using a custom dataset:

Example using a custom dataset:

You might also like