Data and Visual Analytics Lesson 1
Data and Visual Analytics Lesson 1
ini sangat penting di mesin pencari, jejaring sosial, e-niaga, dan banyak bidang teknologi tinggi
lainnya
hal ini juga sangat penting untuk induistri tradisional seperti perbankan dan asuransi
saya telah bekerja di bidang ini selama hampir 20 tahun di dunia akademis dan industri. dan saya
senang berbagi pengalaman saya dengan anda.
memahami berbagai teknik dan teori di balik visualisasi dan analisis data.
mampu menulis program dan skrip yang menganalisis dan memvisualisasikan data,
Berikut ini adalah daftar referensi yang mungkin berguna bagi siswa untuk kursus ini:
swirl : Kursus mini interaktif di R (bagus untuk pemula).
Daftar perintah untuk R
Tutorial impor data
Membentuk kembali data
kuatHD :
Memuat robustHD (Catatan: WRScpp adalah opsional)
Menggunakan robustHD
Referensi untuk robustHD
Berikut ini adalah daftar kumpulan data dan pustaka yang digunakan dalam kursus. Anda tidak
perlu menginstalnya sekarang. Instruksi untuk menginstal setiap kumpulan data dan pustaka
juga terdapat dalam pelajaran di mana mereka digunakan.
R Dataset: iris , faithful , mtcars
Kumpulan data ini dibundel dengan R, artinya, Anda tidak perlu menginstalnya secara
terpisah.
Untuk memuat dataset bunga Iris ( iris ), cukup ketik:
data(iris)
Perpustakaan
Paket atau pustaka R menyediakan fungsionalitas dan/atau kumpulan data tambahan.
ggplot2
Anda dapat menginstal paket apa pun dari R prompt
menggunakan install.packages() perintah dengan nama paket "dalam tanda kutip" ,
misalnya:
install.packages("ggplot2")
Pilih cermin (sebaiknya yang dekat dengan Anda), dan paket akan diinstal bersama
dengan dependensi apa pun. Anda hanya perlu melakukan ini sekali untuk setiap paket
(dan terkadang ketika Anda mengupgrade versi R Anda).
Sekarang, untuk menggunakan paket, Anda harus memuatnya ke sesi R Anda
menggunakan library() perintah (kali ini Anda dapat meninggalkan tanda kutip, karena
R sekarang mengenali nama perpustakaan):
library(ggplot2)
Anda sekarang dapat menggunakan fungsi dan kumpulan data dari paket.
Kumpulan data: mpg , midwest
Paket ini ggplot2 menyediakan kumpulan data Ekonomi Bahan Bakar ( mpg ), Demografi
Kabupaten Midwest ( midwest ) dan Berlian ( diamonds ). Setelah Anda menginstal dan
memuat ggplot2 , Anda dapat memuat kumpulan data menggunakan:
data(mpg)
data(midwest)
data(diamonds)
Kumpulan Data IMDB: movies
Paket ggplot2 yang digunakan untuk menyertakan IMDB Dataset ( movies ), tetapi
sekarang didistribusikan dalam paket terpisah:
install.packages("ggplot2movies")
library(ggplot2movies)
data(movies)
plyr
install.packages("plyr")
library(plyr)
Kumpulan data: baseball , ozone
data(baseball)
data(ozone)
reshape2
Paket- reshape2 paket tersebut menyediakan beberapa fungsi praktis yang dapat Anda
gunakan untuk mengubah struktur dan format data Anda, termasuk melt() fungsi
populer. Ini harus sudah diinstal sebelumnya dengan R:
library(reshape2)
Ini juga menyediakan tips kumpulan data:
data(tips)
MASS
Paket ini mencakup perpustakaan fungsi pemodelan statistik tingkat lanjut, dan
biasanya sudah diinstal sebelumnya dengan R. Coba MASS :
library(MASS)
robustHD
Paket ini berisi statistik robustHD yang kuat dan metode pemilihan model untuk data
berdimensi tinggi:
install.packages("robustHD")
Ini harus menginstal dependensi minimal
untuk robustHD (termasuk ggplot2 , perry dan robustbase ).
WRS (opsional)
Fungsi-fungsi tertentu di robustHD dapat dioptimalkan menggunakan WRS paket (yang
bergantung pada WRScpp ).
Catatan: Lewati perpustakaan ini jika Anda mendapatkan kesalahan selama
penginstalan - ini tidak sepenuhnya diperlukan untuk robustHD .
# First: Install dependent packages
install.packages(c("MASS", "akima", "robustbase"))
Perhatikan bahwa pelajaran berikutnya dalam kursus ini adalah pelajaran Dasar-dasar R yang
awalnya dibuat untuk Analisis Data Udacity dalam kursus R. Ini adalah pengantar yang bagus
untuk memulai dengan R. Kami merekomendasikan untuk melewatinya, tetapi itu tidak
diperlukan: jangan ragu untuk melompat ke depan ke Bahasa Pemrograman R jika Anda
merasa percaya diri melakukannya.