0% menganggap dokumen ini bermanfaat (0 suara)
25 tayangan4 halaman

Data and Visual Analytics Lesson 1

Kursus ini akan memperkenalkan teknik dan teori analisis data dan visualisasi, kemampuan menulis program untuk menganalisis dan memvisualisasikan data, serta menerapkan konsep-konsep tersebut dalam kasus-kasus dunia nyata menggunakan bahasa pemrograman R. Peserta akan belajar berbagai teknik visualisasi data, analisis, dan pemodelan menggunakan pustaka R seperti ggplot2 dan robustHD.

Diunggah oleh

Rendy Bayu Saputra
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
25 tayangan4 halaman

Data and Visual Analytics Lesson 1

Kursus ini akan memperkenalkan teknik dan teori analisis data dan visualisasi, kemampuan menulis program untuk menganalisis dan memvisualisasikan data, serta menerapkan konsep-konsep tersebut dalam kasus-kasus dunia nyata menggunakan bahasa pemrograman R. Peserta akan belajar berbagai teknik visualisasi data, analisis, dan pemodelan menggunakan pustaka R seperti ggplot2 dan robustHD.

Diunggah oleh

Rendy Bayu Saputra
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 4

Data and Visual Analytics

Analisis Data dan visualisasi adalah bidang yang sangat penting.

ini sangat penting di mesin pencari, jejaring sosial, e-niaga, dan banyak bidang teknologi tinggi
lainnya

hal ini juga sangat penting untuk induistri tradisional seperti perbankan dan asuransi

saya telah bekerja di bidang ini selama hampir 20 tahun di dunia akademis dan industri. dan saya
senang berbagi pengalaman saya dengan anda.

dalam kursus ini, kita akan mencapai tiga tujuan

memahami berbagai teknik dan teori di balik visualisasi dan analisis data.

mampu menulis program dan skrip yang menganalisis dan memvisualisasikan data,

dan menjadi efektif dalam situasi analisis data dunia nyata.

dalam kursus ini kita akan menggunakan bahasa pemrograman R

Berikut ini adalah daftar referensi yang mungkin berguna bagi siswa untuk kursus ini:
 swirl : Kursus mini interaktif di R (bagus untuk pemula).
 Daftar perintah untuk R
 Tutorial impor data
 Membentuk kembali data
 kuatHD :
 Memuat robustHD (Catatan: WRScpp adalah opsional)
 Menggunakan robustHD
 Referensi untuk robustHD

Berikut ini adalah daftar kumpulan data dan pustaka yang digunakan dalam kursus. Anda tidak
perlu menginstalnya sekarang. Instruksi untuk menginstal setiap kumpulan data dan pustaka
juga terdapat dalam pelajaran di mana mereka digunakan.
R Dataset:  iris ,  faithful , mtcars
Kumpulan data ini dibundel dengan R, artinya, Anda tidak perlu menginstalnya secara
terpisah.
Untuk memuat dataset bunga Iris (  iris ), cukup ketik:

data(iris)

Anda sekarang dapat menggunakannya, misalnya untuk membuat daftar beberapa


baris pertama, atau spesies (kelas) berbeda yang ada:
head(iris)
levels(iris$Species)
Demikian pula, Anda dapat memuat set data letusan geyser Old Faithful (  faithful )
dan uji jalan mobil Trend Motor (  mtcars ) sebagai berikut:
data(faithful)
data(mtcars)

Perpustakaan
Paket atau pustaka R menyediakan fungsionalitas dan/atau kumpulan data tambahan.
ggplot2
Anda dapat menginstal paket apa pun dari R prompt
menggunakan  install.packages() perintah dengan nama paket "dalam tanda kutip" ,
misalnya:
install.packages("ggplot2")
Pilih cermin (sebaiknya yang dekat dengan Anda), dan paket akan diinstal bersama
dengan dependensi apa pun. Anda hanya perlu melakukan ini sekali untuk setiap paket
(dan terkadang ketika Anda mengupgrade versi R Anda).
Sekarang, untuk menggunakan paket, Anda harus memuatnya ke sesi R Anda
menggunakan  library() perintah (kali ini Anda dapat meninggalkan tanda kutip, karena
R sekarang mengenali nama perpustakaan):
library(ggplot2)
Anda sekarang dapat menggunakan fungsi dan kumpulan data dari paket.
Kumpulan data:  mpg , midwest
Paket ini  ggplot2 menyediakan kumpulan data Ekonomi Bahan Bakar (  mpg ), Demografi
Kabupaten Midwest (  midwest ) dan Berlian (  diamonds ). Setelah Anda menginstal dan
memuat  ggplot2 , Anda dapat memuat kumpulan data menggunakan:
data(mpg)
data(midwest)
data(diamonds)
Kumpulan Data IMDB: movies
Paket  ggplot2 yang digunakan untuk menyertakan IMDB Dataset (  movies ), tetapi
sekarang didistribusikan dalam paket terpisah:
install.packages("ggplot2movies")
library(ggplot2movies)
data(movies)
plyr
install.packages("plyr")
library(plyr)
Kumpulan data:  baseball , ozone
data(baseball)
data(ozone)
reshape2
Paket-  reshape2 paket tersebut menyediakan beberapa fungsi praktis yang dapat Anda
gunakan untuk mengubah struktur dan format data Anda, termasuk  melt() fungsi
populer. Ini harus sudah diinstal sebelumnya dengan R:
library(reshape2)
Ini juga menyediakan  tips kumpulan data:
data(tips)
MASS
Paket ini mencakup perpustakaan fungsi pemodelan statistik tingkat lanjut, dan
biasanya sudah diinstal sebelumnya dengan R. Coba  MASS :
library(MASS)
robustHD
Paket ini berisi statistik  robustHD yang kuat dan metode pemilihan model untuk data
berdimensi tinggi:
install.packages("robustHD")
Ini harus menginstal dependensi minimal
untuk  robustHD (termasuk  ggplot2 ,  perry dan  robustbase ).
WRS (opsional)
Fungsi-fungsi tertentu di  robustHD dapat dioptimalkan menggunakan  WRS paket (yang
bergantung pada  WRScpp ).
Catatan: Lewati perpustakaan ini jika Anda mendapatkan kesalahan selama
penginstalan - ini tidak sepenuhnya diperlukan untuk  robustHD .
# First: Install dependent packages
install.packages(c("MASS", "akima", "robustbase"))

# Second: Install suggested packages


install.packages(c("cobs", "robust", "mgcv", "scatterplot3d", "quantreg",
"rrcov", "lars", "pwr", "trimcluster", "parallel", "mc2d", "psych", "Rfit"))

# Third: Install an additional package which provides some C functions


install.packages("devtools")
library(devtools)
install_github("mrxiaohe/WRScpp") # or install_github("mrxiaohe/WRScppWin")
for Windows

# Fourth: Install WRS


install_github("nicebread/WRS", subdir="pkg")
Instruksi ini juga dapat ditemukan di sini: Instalasi paket WRS (Statistik Kuat Wilcox)

Memeriksa Kumpulan Data


Anda dapat membuat daftar semua kumpulan data yang tersedia untuk Anda
menggunakan  data() perintah (tanpa memasukkan parameter apa pun), termasuk yang
tersedia di dalam paket lain. Untuk mengetahui lebih lanjut tentang kumpulan data,
coba gunakan perintah bantuan R, misalnya memuat  reshape2 paket terlebih dahulu
lalu:
?tips
Untuk membuat daftar beberapa baris pertama dari kumpulan data:
head(tips)
Dan untuk mendapatkan ringkasan statistik dari setiap kolom:
summary(tips)

Perhatikan bahwa pelajaran berikutnya dalam kursus ini adalah pelajaran Dasar-dasar R yang
awalnya dibuat untuk Analisis Data Udacity dalam kursus R. Ini adalah pengantar yang bagus
untuk memulai dengan R. Kami merekomendasikan untuk melewatinya, tetapi itu tidak
diperlukan: jangan ragu untuk melompat ke depan ke Bahasa Pemrograman R jika Anda
merasa percaya diri melakukannya.

Anda mungkin juga menyukai