GUI R (Test)
GUI R (Test)
‐4‐
©sht90 Paket Statistik R
Kemudian klik Open, maka R akan menginstal paket R‐commander yang ditandai
dengan dialog berikut pada jendela R‐console.
> utils:::menuInstallLocal()
package 'RcmdrPlugin.TeachingDemos' successfully unpacked and MD5 sums
checked
package 'Rcmdr' successfully unpacked and MD5 sums checked
package 'RcmdrPlugin.epack' successfully unpacked and MD5 sums checked
package 'RcmdrPlugin.FactoMineR' successfully unpacked and MD5 sums
checked
package 'RcmdrPlugin.HH' successfully unpacked and MD5 sums
checked updating HTML package descriptions >
3. Paket R‐commander dapat dijalankan dengan dua cara yang berbeda, yaitu:
Dengan mengetikkan perintah library(Rcmdr) pada jendela R‐console dan
menekan Enter satu kali.
> library(Rcmdr)
Memilih menu Packages, pilih Load package … dan kemudian memilih Rcmdr
pada daftar paket library yang telah terinstal, seperti yang terlihat pada
Gambar 1.5.
‐5‐
©sht90 Paket Statistik R
Apabila proses instalasi paket R‐commander berjalan dengan sukses, maka paket R‐
commander tersebut akan diloading dan muncul seperti pada Gambar 1.6 berikut
ini.
Pada saat ini, bahasa yang digunakan dalam paket R‐commander sudah ada yang
dalam bahasa Indonesia sebagai hasil pengembangan dan kontribusi statistisi di
Indonesia.
4. Untuk keluar dari paket R‐commander dan sekaligus R dapat dilakukan dengan
memilih menu File, pilih Keluar, dan klik pada pilihan Dari Commander dan R yang
tersedia di jendela R‐commander.
‐6‐
©sht90 Paket Statistik R
Misalkan kita telah mempunyai direktori C:\Kerja_dg_R (buatlah direktori ini jika
belum ada). Langkah pertama, buatlah satu direktori baru di C:\Kerja_dg_R dengan
nama direktori “Nama_Pekerjaan”, misalkan Kerja1. Dengan demikian, pada tahap
ini diperoleh suatu direktori baru yaitu
C:\Kerja_dg_R\Kerja1.
Buatlah copy dari shortcut program R di desktop window, dan rename shortcut ini
sebagai shortcut Kerja1. Sehingga di desktop window muncul shortcut Kerja1
seperti Gambar 1.7 berikut ini.
Kemudian arahkan mouse pada shortcut tersebut dan klik kanan. Pilih Properties
dan ganti informasi pada kolom Start in menjadi C:\Kerja_dg_R\Kerja1 seperti yang
terlihat pada Gambar 1.8, setelah itu klik OK.
Untuk mengetahui perubahan lokasi direktori kerja di R, lakukan klik dua kali
pada icon shortcut Kerja1 untuk menjalankan R. Sebagai ilustrasi sederhana, ketikkan
beberapa baris perintah berikut ini setelah jendela R terbuka.
> x=1:15
> y=x+5
>x
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
>y
[1] 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
‐7‐
©sht90 Paket Statistik R
“C:\Program Files\R\R-2.7.2\bin\Rgui.exe”
‐8‐
©sht90 Paket Statistik R
> x=1:15
> y=x+5
>x
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
>y
[1] 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Proses penyimpanan data atau obyek, yaitu x dan y seperti yang tertulis di atas,
ke dalam direktori C:\Kerja_dg_R\Kerja1 dengan nama file coba1.Rdata dapat
dilakukan dengan menggunakan menu File, dan pilih Save Workspace … . Selanjutnya
lakukan keluar dari R, dan pilih No (yang berarti tidak menyimpan imag dari file kerja)
pada dialog Save Workspace Image? Sekarang jalankan kembali program R, maka data
atau obyek di file coba1.Rdata dapat diload kembali dengan menggunakan dua macam
cara, yaitu:
Pilih menu File, dan pilih Load Workspace … , dan setelah itu pilih file di direktori
C:\Kerja_dg_R\Kerja1 dengan nama coba1.Rdata
> load("C:\\Kerja_dg_R\\Kerja1\\Coba1.RData")
> objects()
[1] "x" "y"
>x
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
>y
[1] 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Dari jendela kotak R‐console di atas dapat dilihat bahwa semua obyek yang dikerjakan
pada sesi sebelumnya telah berhasil diload kembali. Dengan cara yang sama, semua
history dari perintah pada suatu sesi dapat disimpan melalui menu File, dan pilih Save
‐9‐
©sht90 Paket Statistik R
History… . Untuk melakukan load kembali history pada sesi sebelumnya yang sudah
tersimpan ini, dapat dilakukan dengan melalui menu File, dan pilih Load History … ,
kemudian pilih nama file history yang akan dipanggil kembali tersebut. History dari sesi
R yang telah diload ini dapat diakses dengan menggunakan tanda panah ke atas dan ke
bawah.
> help(plot)
> ?plot
Jendela help yang sama dapat juga diperoleh dengan menggunakan menu dengan
pilihan Help, dan pilih R function (text) … dan setelah jendela dialog muncul, ketikkan
kata plot seperti yang terlihat pada Gambar 1.9 berikut ini.
Gambar 1.9. Jendela dialog help untuk suatu fungsi atau perintah
‐ 10 ‐
©sht90 Paket Statistik R
Setelah salah satu dari perintah di atas dijalankan, maka akan ditampilkan bagian
dari jendela help dari perintah plot seperti yang terlihat pada Gambar 1.10 berikut ini.
Penjelasan dari jendela hasil pencarian help untuk fungsi plot ini adalah sebagai berikut:
Ada dua kolom jendela yang muncul, yaitu kolom kiri tentang index dari fungsi
atau perintah yang dicari (misal plot), dan kolom kanan adalah hasil atau
penjelasan dari pencarian fungsi yang ingin diketahui.
Pada bagian kiri atas kolom jendela hasil help adalah tentang keterangan nama
dari perintah atau fungsi yang sedang ditampilkan dan nama paket atau library
yang memuat perintah tersebut. Dalam contoh di atas, untuk perintah plot dapat
dilihat bahwa perintah plot ini tersimpan dalam paket atau library graphics..
Pada setiap jendela help dari suatu perintah secara umum akan memuat bagian‐
bagian berikut:
• Description: uraian singkat tentang perintah tersebut
• Usage: uraian tentang syntax perintah untuk penggunaan perintah tersebut.
• Arguments: uraian tentang argumen‐argumen yang diperlukan dari
fungsi atau perintah tersebut.
• Details: uraian yang lebih lengkap (daripada yang diberikan pada
bagian description) tentang perintah tersebut.
‐ 11 ‐
©sht90 Paket Statistik R
Manajemen data yang meliputi data entry, edit, import dan export, merupakan
suatu langkah yang penting dalam analisis statistika. Ada beberapa macam dan ukuran
data yang dapat diolah menggunakan R. Secara umum, minimal ada dua macam bentuk
data yang dapat diolah, yaitu data yang dimasukkan langsung lewat R editor melalui
keyboard, dan data yang sudah ditulis menggunakan Program Sheet lain, seperti Text,
SPSS, MINITAB, Access ataupun dBase. R menyediakan dua cara untuk melakukan
manajemen data, yaitu menggunakan R‐GUI dan melalui command line di R‐console.
Pada bab ini, pembahasan tentang manajemen data difokuskan yang melalui R‐GUI,
khususnya pemakaian R‐Commander.
Gambar 2.1. Jendela awal dari paket library R‐commander yang sukses diloading
‐ 16 ‐
©sht90 Manajemen data di Paket R
Kemudian klik OK, dan jendela RGui ‐ Data Editor akan terbuka seperti pada Gambar 2.3
berikut ini.
Pengisian nama variabel dilakukan dengan cara klik pada kolom paling atas dari
data editor. Sebagai contoh, untuk mengisikan nama variabel pertama, misalnya
responden, klik pada var1. Kemudian pada jendela Variable editor seperti yang terlihat
pada Gambar 2.4, isikan responden sebagai variable name dan tipe data adalah
character (karena yang akan diisikan pada kolom ini adalah nama‐nama responden).
‐ 17 ‐
©sht90 Manajemen data di Paket R
Sebagai latihan, isikan data tentang nama mahasiswa, nilai UAN tiga mata pelajaran, dan
IPK semester 1, berikut ini kedalam R Data editor.
Pada dasarnya, proses pengisian data ini adalah sama dengan paket statistik yang lain,
yaitu mulai isian nama kolom dan tipe data yang diinputkan (numeric atau character).
Setelah semua data selesai diinputkan, maka akan diperoleh tampilan Data Editor
seperti berikut ini.
Gambar 2.5. Jendela Data Editor setelah semua data selesai diisikan
‐ 18 ‐
©sht90 Manajemen data di Paket R
Setelah dilakukan data entry, maka tutup jendela R Data Editor diatas untuk
mengakhiri proses data entry. Pada jendela R‐Commander terlihat Data set yang dengan
nama latihan1 saat ini sedang aktif, seperti yang terlihat pada Gambar 2.6. Untuk
menampilkan data yang sedang aktif di Jendela Keluaran R‐Commander, tulis nama data
set yaitu latihan1 di Jendela Skrip, kemudian klik Kirim, maka akan terlihat data seperti
berikut ini.
‐ 19 ‐
©sht90 Manajemen data di Paket R
Pada bagian berikut ini akan dijelaskan penggunaan impor data dari Excel, SPSS, dan
MINITAB. Untuk file dari program yang lain, proses impor data melalui R‐Commander
dapat dilakukan secara sama dengan cara mengimpor data dari program Excel, SPSS,
ataupun MINITAB.
‐ 20 ‐
©sht90 Manajemen data di Paket R
Langkah selanjutnya, simpan file ini sebagai file text (yaitu tab delimited txt), dengan
nama data1.txt di direktori C:\Kerja_R\. Untuk mengimpor data file ini kedalam R‐
Commander, pilihlah pada R‐Commander menu Data, pilih Impor data, dan kemudian
pilih dari file teks atau clipboard … . Pada jendela dialog yang muncul, isikan informasi
nama untuk data set, nama variabel, dan lain‐lain, seperti berikut ini.
Gambar 2.10. Jendela dialog Impor data dari file teks atau clipboard
‐ 21 ‐
©sht90 Manajemen data di Paket R
Dalam hal ini, data hasil impor akan disimpan kedalam R‐Commander dengan
nama latihan2. Data ini diimpor dengan Pemisah Field/Medan adalah spasi. Klik OK,
kemudian akan muncul untuk melakukan browsing ke lokasi dari file teks yang akan
diimpor. Arahkan ke direktori C:\Kerja_R\ dan pilih file data1.txt. Kemudian klik Open,
maka sekarang data yang berada pada file data1.txt telah diimpor kedalam R‐
Commander dengan nama latihan2. Sekarang, data set yang aktif pada R‐Commander
adalah latihan2 seperti yang terlihat pada Gambar 2.11. Gunakan tombol Lihat data set
untuk melihat hasil impor data ini.
Gambar 2.11. Jendela dialog hasil impor data dan latihan2 sebagai data set aktif
‐ 22 ‐
©sht90 Manajemen data di Paket R
Klik OK, dan selanjutnya arahkan ke direktori tempat penyimpanan file SPSS yang akan
diimpor, misalkan saja di C:\Kerja_R\ dengan nama data2.sav. Kemudian klik Open,
maka data hasil impor dari file data2.sav akan disimpan kedalam file latihan3. Pada
jendela R‐Commander terlihat data set latihan3 sedang aktif, seperti pada Gambar 2.13.
Klik tombol Lihat data set untuk melihat hasil impor data ini.
Gambar 2.13. Jendela dialog hasil impor data dan latihan3 sebagai data set aktif
MANAJEMEN DATA DI R DENGAN COMMAND LINE
Pada R, data yang ada dipandang sebagai suatu objek yang memiliki suatu
attributes atau sifat. Sifat data ditentukan oleh type data dan mode data. Ada berbagai
type data yang dikenal oleh R, antara lain vektor, matriks, list, data frame, array, factor,
dan function (built‐in command). Sedangkan mode data yang dikenal R ada 4 macam
seperti yang terlihat pada Tabel 3.1 berikut ini.
Nama objek dalam R harus dimulai dengan huruf, ditambah dengan kombinasi
dari huruf besar, huruf kecil, angka dan titik. Penggunaan titik biasanya dilakukan untuk
memudahkan pengorganisasian data. Berikut ini adalah beberapa contoh dari nama
objek yang valid.
databudi
data.budi
data.budi.1
data.budi.5
data.budi.no7.02.02.08
Contoh dari nama objek yang tidak valid (invalid) adalah sebagai berikut:
1databudi : dimulai dari angka
data‐budi : operator ‐ tidak dapat digunakan
databudi=1 : operator = tidak dapat digunakan
Dalam R versi 2.7.2 ini, assignment dapat digunakan dengan operator “<‐” dan “=”.
Untuk melihat isi dari suatu data objek, dapat dilakukan dengan mengetikkan nama
objek tersebut di R prompt pada R‐console.
‐ 29 ‐
©sht90 Manajemen Data di R dengan Command Line
Vektor merupakan suatu array atau himpunan bilangan, character atau string,
logical value, dan merupakan objek paling dasar yang dikenal dalam R. Pada data vektor
harus digunakan mode tunggal pada data, sehingga gabungan dua data atau lebih yang
berbeda mode tidak dapat dilakukan kedalam satu objek vektor. Jika ini dilakukan, maka R
akan mengubah data ke mode yang lebih umum, seperti contoh berikut ini.
> c(T,1:10)
[1] 1 1 2 3 4 5 6 7 8 9 10
> c("A",F,T)
[1] "A" "FALSE" "TRUE"
> c("A",2,4,F,T)
[1] "A" "2" "4" "FALSE" "TRUE"
> x=c(1:10)
>x
[1] 1 2 3 4 5 6 7 8 9 10
> mode(x)
[1] "numeric"
> length(x)
[1] 10
Pada contoh pertama dapat dilihat bahwa pada command line menghasilkan vektor yang
semua data diubah menjadi mode numerik, sedangkan pada contoh kedua dan ketiga
menghasilkan vektor yang semua datanya diubah menjadi mode karakter. Untuk
mengetahui mode suatu objek vektor dapat dilakukan dengan menggunakan command
mode seperti pada contoh diatas. Jumlah atau panjang data yang bertipe vektor dapat
diketahui dengan memanfaatkan fungsi length (perhatikan contoh diatas).
Ekstraksi sebagian data vektor dapat dilakukan dengan berbagai cara atau
langkah. Dalam praktek analisis data statistik, ekstraksi ini biasanya dilakukan untuk
pembentukan data baru berdasarkan data yang sudah ada. Berikut ini adalah beberapa
contoh hasil ekstraksi dari suatu data vektor yang terdiri dari 10 elemen, yaitu 10, 5, 14,
12, 8, 11, 9, 10, 16, 20.
‐ 30 ‐
©sht90 Manajemen Data di R dengan Command Line
Matriks atau data array dua dimensi adalah salah satu tipe data yang banyak
digunakan dalam pemrograman statistik. Sebagian besar fungsi‐fungsi statistik dalam R
dapat dianalisis dengan menggunakan bentuk matriks. Bentuk matriks ini juga banyak
digunakan pada operasi fungsi‐fungsi built‐in untuk aljabar linear dalam R, seperti untuk
penyelesaian suatu persamaan linear.
Keempat perintah diatas akan menghasilkan matriks yang sama. Untuk mengetahuinya
ketikkan matriks.2, matriks.3, matriks.4, dan kemudian enter untuk masing‐masing
perintah tersebut.
‐ 31 ‐
©sht90 Manajemen Data di R dengan Command Line
Pada R, data secara default akan diisikan kolom perkolom seperti yang terlihat
pada contoh berikut ini.
> data=c(6.4,8.8,7.5,5.3,7.6,9.5)
> data
[1] 6.4 8.8 7.5 5.3 7.6 9.5
> matriks.a=matrix(data,nrow=3,ncol=2)
> matriks.a
[,1] [,2]
[1,] 6.4 5.3
[2,] 8.8 7.6
[3,] 7.5 9.5
> matriks.b=matrix(data,nrow=3,ncol=2,byrow=T)
> matriks.b
[,1] [,2]
[1,] 6.4 8.8
[2,] 7.5 5.3
[3,] 7.6 9.5
> dim(matriks.a)
[1] 3 2
> length(matriks.a)
[1] 6
> mode(matriks.a)
[1] "numeric"
Dimensi, length dan mode dari suatu matriks dapat dilihat dengan menggunakan
perintah dim, length, dan mode seperti pada contoh diatas. Perlu diingat bahwa semua
elemen dari matriks harus memiliki mode yang sama. Jika hal ini tidak dipenuhi, maka
elemen‐elemen akan diubah menjadi mode yang paling umum.
Ada beberapa operator yang biasa digunakan untuk operasi matriks dan vektor,
antara lain perkalian, invers matriks, transpose matriks dan crossproduct. Ringkasan
dari operator‐operator ini dapat dilihat pada Tabel 2.2.
‐ 32 ‐
©sht90 Manajemen Data di R dengan Command Line
Operator Keterangan
* Perkalian elemen demi elemen dari matriks
%*% Perkalian matriks
%o% Outer
solve Invers dari suatu matriks
t Transpose dari suatu matriks
crossprod Crossproduct suatu matriks, yaitu t(x) %*% x
Berikut ini adalah beberapa contoh hasil penggunaan operator pada suatu matriks dan
vektor.
> a=1:5
>a
[1] 1 2 3 4 5
> a*a # perkalian elemen demi elemen dari matriks a
[1] 1 4 9 16 25
> crossprod(a) # crossproduck dari matriks a, yaitu t(a) %*% a
[,1]
[1,] 55
> b=matrix(c(1:4),2)
>b
[,1] [,2]
[1,] 1 3
[2,] 2 4
> b*b # perkalian elemen demi elemen dari matriks b
[,1] [,2]
[1,] 1 9
[2,] 4 16
> b%*%b # perkalian matriks b dengan matriks b
[,1] [,2]
[1,] 7 15
[2,] 10 22
> solve(b) # invers dari matriks b
[,1] [,2]
[1,] ‐2 1.5
[2,] 1 ‐0.5
‐ 33 ‐
©sht90 Manajemen Data di R dengan Command Line
Pada R, dapat pula dilakukan penggabungan satu kolom atau satu baris baru
kedalam matriks lain. Hal ini dapat dilakukan dengan menggunakan perintah rbind
(untuk menambahkan ke baris) dan cbind (untuk menambahkan ke kolom). Perhatikan
contoh‐contoh berikut ini.
> a=matrix(c(3,4,5,6,7,8),2,3)
>a
[,1] [,2] [,3]
[1,] 3 5 7
[2,] 4 6 8
> a1=cbind(a,c(1,2)) # menambahkan ke kolom ke‐4 dari a
> a1
[,1] [,2] [,3] [,4]
[1,] 3 5 7 1
[2,] 4 6 8 2
> a2=cbind(c(1,2),a) # menambahkan ke kolom ke‐1 dari a
> a2
[,1] [,2] [,3] [,4]
[1,] 1 3 5 7
[2,] 2 4 6 8
> a3=rbind(a,c(1,2,3)) # menambahkan ke baris ke‐3 dari a
> a3
[,1] [,2] [,3]
[1,] 3 5 7
[2,] 4 6 8
[3,] 1 2 3
> a4=rbind(c(1,2,3),a) # menambahkan ke baris ke‐1 dari a
> a4
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 3 5 7
[3,] 4 6 8
Data frame merupakan objek yang mempunyai bentuk sama dengan matriks,
yaitu terdiri atas baris dan kolom. Perbedaannya adalah data frame dapat terdiri atas
mode data yang berbeda‐beda untuk setiap kolomnya. Misalkan saja, kolom pertama
adalah numeric, kolom kedua adalah string/character, dan kolom ketiga adalah logical.
Objek data frame dapat dibuat dengan menggunakan perintah data.frame, seperti pada
contoh‐contoh berikut ini.
‐ 34 ‐
©sht90 Manajemen Data di R dengan Command Line
> data.frame(c(1:4),c(T,T,F,F))
c.1.4. c.T..T..F..F.
1 1 TRUE
2 2 TRUE
3 3 FALSE
4 4 FALSE
> data.frame(nomer=c(1:4),jawaban=c(T,T,F,F)) # ada nama kolom
nomer jawaban
1 1 TRUE
2 2 TRUE
3 3 FALSE
4 4 FALSE
> cobaframe=data.frame(c(1:4),c(T,T,F,F)) # simpan objek di cobaframe
> cobaframe c.1.4.
c.T..T..F..F.
1 1 TRUE
2 2 TRUE
3 3 FALSE
4 4 FALSE
> names(cobaframe)[1]="nomer" # nama kolom ke‐1 “nomer”
> names(cobaframe)[2]="jawaban" # nama kolom ke‐2 “jawaban”
> cobaframe
nomer jawaban
1 1 TRUE
2 2 TRUE
3 3 FALSE
4 4 FALSE
> cobaframe1=data.frame(c(1:4),c(T,T,F,F))
> cobaframe1
c.1.4. c.T..T..F..F.
1 1 TRUE
2 2 TRUE
3 3 FALSE
4 4 FALSE
> names(cobaframe1)=c("nomer","jawaban") # beri nama kolom
> cobaframe1
nomer jawaban
1 1 TRUE
2 2 TRUE
3 3 FALSE
4 4 FALSE
‐ 35 ‐
©sht90 Manajemen Data di R dengan Command Line
Secara umum, perintah‐perintah diatas adalah ekuivalen dengan perintah berikut ini.
> cobaframe2=data.frame(nomer=c(1:4),jawaban=c(T,T,F,F))
> cobaframe2
nomer jawaban
1 1 TRUE
2 2 TRUE
3 3 FALSE
4 4 FALSE
Seperti pada data vektor, ekstraksi sebagian data pada matriks dan data frame dapat
pula dilakukan dengan berbagai cara atau langkah. Berikut ini adalah beberapa contoh
hasil ekstraksi dari suatu matriks dan data frame.
> matriks.1=matrix(1:9,3)
> dataframe.1=data.frame(nomer=1:4,nama=c("Adi","Budi","Cika","Dony"),
nilai=7:10)
> matriks.1
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
> matriks.1[2,2]
[1] 5
> dataframe.1
nomer nama nilai
1 1 Adi 7
2 2 Budi 8
3 3 Cika 9
4 4 Dony 10
> dataframe.1[2,2]
[1] Budi
Levels: Adi Budi Cika Dony
> dataframe.1["nama"]
nama
1 Adi
2 Budi
3 Cika
4 Dony
‐ 36 ‐
Importing Data File Excel
Data file Excel dengan ekstensi .XLS dapat diimpor secara langsung meng‐ gunakan
fasilitas GUI R‐Cmdr (lihat bagian sebelumnya). Untuk dapat diimpor ke dalam R dengan
fasilitas command line, maka data file Excel harus terlebih dulu diubah menjadi format Text
Tab Delimited (ekstensi .TXT) atau CSV comma delimited (ekstensi
.CSV). Setelah itu, data ini dapat diimpor menggunakan perintah read.table atau
read.csv.
‐ 39 ‐
©sht90 Manajemen Data di R dengan Command Line
Misalkan saja data file Excel yang akan diimpor adalah seperti pada gambar
berikut ini dan telah disimpan menjadi file data1.txt atau data1.csv.
Proses impor data1.txt dapat dilakukan dengan perintah read.table, sedangkan, impor
data1.csv dilakukan dengan perintah read.csv. Argumen optional header=T digunakan
dengan tujuan agar R menggunakan baris pertama dari file sebagai header atau nama
dari variabel. Seperti pada bagian sebelumnya, apabila data tidak berada pada direktori
kerja R, maka tulis juga direktori tersebut pada argumennya. Berikut ini adalah contoh
proses impor data file dengan ekstensi .TXT dan .CSV.
‐ 40 ‐
©sht90 Manajemen Data di R dengan Command Line
> latihan3
Responden.Matematika.BIndonesia.BInggris.IPK1
1 Adi;8;9.1;8.4;3.35
2 Budi;7.6;8.8;8.5;3.02
3 Dany;6.9;8.1;7.2;2.9
4 Eka;8.9;9.2;9;3.42
5 Fery;9.5;9.6;9.5;3.75
6 Nuri;7.3;8.7;7.9;3.26
7 Rury;6.5;7.5;8.2;2.76
R mempunyai paket atau library foreign untuk melakukan importing data dari
file dalam format paket statistika yang lain. Sampai saat ini yang tersedia pada R adalah
importing data file dari paket‐paket statistika berikut :
Pada bagian ini akan diberikan contoh hanya untuk mengimpor data file SPSS
dan MINITAB yang seringkali digunakan dalam analisis data statistik. Misalkan data file
SPSS yang sudah dimiliki diberi nama WORLD95.SAV dan telah disimpan di direktori
kerja R. Proses impor data ini ke dalam R dengan menggunakan perintah command line
adalah sebagai berikut.
‐ 41 ‐
©sht90 Manajemen Data di R dengan Command Line
Berikut ini adalah proses impor data file MINITAB dalam ekstensi .MTP ke dalam R
dengan menggunakan perintah command line. Misalkan data file MINITAB yang sudah
dimiliki adalah FA.MTW dan telah disimpan ke dalam ekstensi .MTP menjadi FA.MTP.
> latihan5
$X
[1] 10 8 13 9 11 14 6 4 12 7 5
$Y1
[1] 8.04 6.95 7.58 8.81 8.33 9.96 7.24 4.26 10.84 4.82 5.68
$Y2
[1] 9.14 8.14 8.74 8.77 9.26 8.10 6.13 3.10 9.13 7.26 4.74
$Y3
[1] 7.46 6.77 12.74 7.11 7.81 8.84 6.08 5.39 8.15 6.42 5.73
$X4
[1] 8 8 8 8 8 8 8 19 8 8 8
$Y4
[1] 6.58 5.76 7.71 8.84 8.47 7.04 5.25 12.50 5.56 7.91 6.89
‐ 42 ‐
GRAFIK MENGGUNAKAN R‐Commander
Pada bab ini akan dibahas penggunaan R‐Commander untuk membuat penyajian
statistik deskriptif dari suatu kumpulan data. Fokus utama adalah pembuatan beberapa
macam bentuk grafik yang banyak digunakan dalam analisis data.
Sebagai langkah awal, buka kembali program R dengan mengklik icon R 2.7.2.
Kemudian, ubah direktori dimana file workspace berada. Misalkan file latihan4.RData
(hasil impor data SPSS dengan nama file WORLD95.SAV) ada di ‘C:\Kerja_R’, maka
direktori diubah ke C:\Kerja_R. Load file workspace tersebut dengan menggunakan
menu File, pilih Load Workspace… seperti pada gambar berikut ini.
Setelah diklik Load Workspace… maka jendela R akan memberikan pilihan direktori dan
file workspace mana yang akan ditampilkan, seperti yang terlihat pada Gambar 4.2.
Pilihlah file workspace latihan4.RData yang ada di direktori C:\Kerja_R.
‐ 43 ‐
©sht90 Grafik Menggunakan R‐Commander
Gambar 4.2. Jendela dialog untuk pilihan file workspace yang akan diaktifkan
Gambar 4.3. Jendela dialog untuk memilih dataset yang akan diaktifkan
‐ 44 ‐
©sht90 Grafik Menggunakan R‐Commander
Dari beberapa pilihan Datasets yang ada, klik latihan4 sebagai file workspace yang akan
diaktifkan, seperti pada Gambar 4.4. Dengan demikian, proses pengaktifan kembali data
latihan4 sudah dilakukan, dan proses analisis data baik secara statistik deskriptif atau
inferens dapat dilakukan.
Gambar 4.4. Jendela dialog untuk pilihan dataset yang akan diaktifkan
‐ 45 ‐
©sht90 Grafik Menggunakan R‐Commander
Output histogram untuk data LIFEEXPF yang diperoleh dari perintah di atas dapat dilihat
pada Gambar 4.6. Dalam contoh ini, digunakan metode auto untuk pemilihan jumlah
interval, yaitu metode Sturges dan Cacahan Frekuensi yang digunakan untuk nilai (Skala
Sumbu) yang diplotkan pada histogram. Selain itu dapat digunakan pilihan Persentase
atau Kepadatan pada Skala Sumbu.
Output histogram ini dapat disimpan dengan menggunakan menu File, dan pilih
Save as dari jendela grafik. Pilihlah output yang sesuai, misalkan saja dalam format PDF.
Maka pilih format PDF dalam daftar format file output. Selanjutnya, beri nama file
output dengan histogramLIFEEXPF.PDF. Selain itu, output histogram ini dapat pula
disimpan dalam format Metafile, Postcript, Png, Bmp, dan Jpeg.
Jika file histogram ini ingin dikopi untuk di insert kedalam program lain, misalkan
kedalam Microsoft Word, maka dapat digunakan menu File, pilih Copy to the clipboard,
dan pilih as a Bitmap atau Ctrl‐C. Kemudian, buka program Microsoft Word, maka file
grafik dapat di paste kan menggunakan perintah Ctrl‐V.
‐ 46 ‐
©sht90 Grafik Menggunakan R‐Commander
‐ 47 ‐
©sht90 Grafik Menggunakan R‐Commander
Gambar 4.7. Jendela dialog untuk pembuatan diagram batang dan daun
Isikan argumen optional yang diinginkan pada kolom‐kolom yang tersedia, dan klik OK
untuk menampilkan output diagram batang dan daun. Output dari diagram ini akan
ditampilkan di Jendela Keluaran pada R‐Commander seperti pada Gambar 4.8.
‐ 48 ‐
©sht90 Grafik Menggunakan R‐Commander
> stem.leaf(latihan4$LIFEEXPF)
1 | 2: represents 12
leaf unit: 1
n: 109
LO: 43 44 44 45 45 46 47
9 5* | 00
12 t | 223
15 f | 455
17 s | 77
22 5. | 88889
6* |
23 t | 3
26 f | 455
32 s | 677777
39 6. | 8888899
45 7* | 000001
51 t | 222333
(14) f | 44444555555555
44 s | 66666777777888888888
24 7. | 9999999
17 8* | 00000001111111
3 t | 222
Gambar 4.8. Output diagram batang dan daun pada variabel LIFESXPF
Pembuatan diagram batang dan daun ini dapat juga dilakukan dengan command
line di R‐Console, yaitu dengan command stem.leaf diikuti argumen optional yang
diinginkan. Berikut adalah contoh pembuatan diagram batang dan daun dengan
command line untuk variabel LIFEEXPF dan LIFEEXPM.
> stem.leaf(latihan4$LIFEEXPF)
> stem.leaf(latihan4$LIFEEXPF, m=2)
> stem.leaf(latihan4$LIFEEXPF, style="bare", unit=1)
> # lihat perbedaan output diagram batang dan daun yang dihasilkan
> stem.leaf(latihan4$LIFEEXPM)
> stem.leaf(latihan4$LIFEEXPM, m=3)
> stem.leaf(latihan4$LIFEEXPF, style="bare", unit=1)
FUNGSI DISTRIBUSI PELUANG DI R‐Commander
Pada bab ini akan dijelaskan penggunaan R‐Commander untuk perhitungan yang
berkaitan dengan fungsi distribusi peluang. R‐Commander menyediakan menu untuk
melakukan beberapa operasi standar yang berkaitan dengan fungsi distribusi peluang,
yaitu :
Secara umum ada dua macam distribusi yang disediakan paket R, yaitu Distribusi
Kontinu dan Diskrit. Untuk mengetahui distribusi kontinu atau diskrit apa saja yang ada
di R, dapat dilakukan dengan memilih menu Distribusi, kemudian pilih Distribusi
Kontinu, sehingga akan muncul pilihan dari berbagai distribusi kontinu yang ada di R,
seperti yang terlihat pada Gambar 5.1.
Dari Gambar 5.1 dapat dilihat macam‐macam distribusi kontinu yang ada di R, yaitu
Distribusi Normal, t, Chi‐kuadrat, F, Eksponensial, Seragam, Beta, Cauchy, Logistik, Log‐
Normal, Gamma, Weibull, dan Gumbel. Secara umum, proses perhitungan yang berkaitan
dengan distribusi peluang untuk macam‐macam distribusi kontinu tersebut adalah relatif
sama. Untuk itu, pada bab ini fokus pembahasan hanya diberikan pada distribusi yang banyak
dipakai di analisis statistika dasar, yaitu Distribusi Normal.
‐ 61 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
‐ 62 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Misalkan akan dihitung nilai kuantil α=0,05 (5%) dari Distribusi Normal Standar,
yaitu ingin dicari nilai Zα sedemikian hingga
P(Z ≤ Zα ) = 0,05 (luasan lower tail atau ekor bawah),
maka pada jendela isian Peluang tulis nilai 0.05. Dalam hal ini rata‐rata adalah 0 dan deviasi
standar 1. Kemudian klik OK, sehingga akan diperoleh nilai pada jendela keluaran
R‐Commander yaitu Z0,05 = −1.644854 . Pilihan ekor atas atau upper tail digunakan jika
ingin dicari nilai Z1−α sedemikian hingga
P(Z ≤ Z1−α ) = 1 − α (luasan upper tail atau ekor atas).
Jika pilihan ekor atas yang digunakan, maka keluaran R‐Commander memberikan nilai
1.644854 pada jendela keluarannya.
Selain menggunakan menu di R‐Commander, perhitungan kuantil normal dapat
juga dilakukan dengan command line di R‐Console, yaitu dengan command qnorm
diikuti argumen optional yang diinginkan. Berikut adalah contoh perhitungan kuantil
normal dengan command line untuk α=0,05.
‐ 63 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Ada empat isian utama dari jendela dialog untuk perhitungan Peluang Normal, yaitu
Nilai peubah, mu, sigma, dan pilihan Ekor bawah atau Ekor atas. Secara matematis,
fasilitas ini dapat digunakan untuk menghitung
dari suatu peubah (variabel) random X yang berdistribusi Normal, atau X ~ N (μ, σ ) .
Misalkan akan dihitung nilai peluang dari Distribusi Normal Standar, yaitu ingin
dicari nilai
P(Z ≤ −3) = … ? (luasan lower tail atau ekor bawah),
maka pada jendela isian Nilai peubah tulis nilai ‐3. Dalam hal ini rata‐rata adalah 0 dan deviasi
standar 1. Klik OK, sehingga akan diperoleh nilai 0.001349898 pada jendela keluaran R‐
Commander. Pilihan ekor atas atau upper tail digunakan jika ingin dicari nilai
P(Z ≥ c) = … ? (luasan upper tail atau ekor atas).
Jika pilihan ekor atas yang digunakan dan c = 3 , maka keluaran R‐Commander juga akan
memberikan nilai 0.001349898 pada jendela keluarannya.
‐ 64 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Misalkan akan dibuat plot fungsi kepadatan peluang dari Distribusi Normal Standar,
maka pada jendela isian mu (rerata) tulis nilai 0 dan sigma (simpangan baku) 1. Klik pilihan
Plot fungsi kepadatan, dan kemudian klik OK, sehingga akan diperoleh plot fungsi kepadatan
dari Distribusi Normal Standar seperti pada Gambar 5.6 berikut ini.
‐ 65 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Jika pilihan Plot fungsi distribusi (kumulatif) yang dipilih, maka akan diperoleh output
plot fungsi distribusi kumulatif dari Distribusi Normal Standar seperti terlihat pada
Gambar 5.7.
Gambar 5.7. Output plot fungsi distribusi kumulatif dari Distribusi Normal Standar
‐ 66 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Pembuatan plot fungsi kepadatan dan fungsi distribusi kumulatif dapat juga
dilakukan dengan command line di R‐Console, yaitu dengan command dnorm (untuk
plot fungsi kepadatan) dan command pnorm (untuk plot fungsi distribusi kumulatif)
diikuti argumen optional yang diinginkan. Berikut adalah contoh pembuatan plot fungsi
kepadatan dengan command line untuk suatu nilai peubah.
Sedangkan contoh pembuatan plot fungsi distribusi kumulatif dengan command line
untuk suatu nilai peubah adalah seperti berikut.
‐ 67 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Gambar 5.8. Jendela dialog untuk membangkitkan data dari Distribusi Normal
Untuk mengetahui hasil data yang dibangkitkan, klik pilihan Lihat data set pada
R‐Commander, sehingga akan terlihat data‐data hasil bangkitan seperti pada Gambar
5.9. Secara umum akan diperoleh 15 baris sampel dan 11 kolom data, yaitu 10 kolom
data hasil bangkitan dan 1 kolom terakhir yang berisi rata‐rata dari setiap sampel yang
dibangkitkan.
Gambar 5.9. Output data hasil bangkitan dari Distribusi Normal Standar
‐ 68 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Pembangkitan data dari suatu distribusi statistika tertentu ini juga dapat
dilakukan dengan command line di R‐Console, yaitu dengan command rnorm (untuk
Distribusi Normal) diikuti argumen optional yang diinginkan. Berikut adalah contoh
pembangkitan data dengan command line untuk Distribusi Normal dengan rata‐rata dan
deviasi standar tertentu.
> # Bangkitkan data dan simpan hasilnya dalam bentuk seperti matriks
> as.data.frame(matrix(rnorm(15*5, mean=100, sd=10), ncol=5))
V1 V2 V3 V4 V5
1 84.46823 108.53078 104.05075 77.02379 91.55903
2 98.15929 93.74033 124.44052 80.38603 102.47690
3 95.00374 106.84794 104.09301 106.48609 97.34608
4 101.29297 118.54484 81.04212 98.63245 102.88233
5 98.92599 86.56266 86.52845 66.00474 90.27446
6 95.15418 102.50113 105.34845 79.55246 97.73824
7 106.38983 89.38471 85.31907 100.10805 91.51123
8 86.04483 104.22601 80.81650 101.08752 120.83886
9 84.41069 105.68604 91.14394 99.07307 99.37543
10 112.78286 104.58306 108.08592 109.01078 110.87053
11 109.17854 99.67204 97.54832 91.57182 104.02405
12 100.85442 98.14412 100.82436 97.54563 88.32492
13 111.41381 100.48431 103.03010 100.38959 101.00266
14 124.13427 101.54886 98.13771 102.57961 114.76246
15 93.99127 108.28097 107.97942 94.53939 86.20123
16 90.35201 123.02141 103.70384 95.25282 100.77538
‐ 69 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
x
dengan n adalah banyaknya pengamatan atau percobaan binomial, p adalah peluang
sukses untuk suatu percobaan binomial, dan (1− p) adalah peluang gagal atau tidak
suksesnya. Notasi untuk peubah dan distribusinya adalah X ~ B(n, p) .
‐ 70 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Misalkan akan dihitung nilai kuantil α=0,25 (25%) dari Distribusi Binomial dengan n=20
dan p=0.5 atau X ~ B(20,0.5) , yaitu ingin dicari nilai Xα sedemikian hingga
P( X ≤ Xα ) = 0,25 (luasan lower tail atau ekor bawah).
Untuk mendapatkan kuantil di atas, maka pada jendela isian Peluang tulis nilai 0.25, Trial
Binomial 20, dan Peluang Sukses 0.5. Kemudian klik OK, sehingga akan diperoleh nilai
pada jendela keluaran R‐Commander yaitu X 0,25 = 8 , yang berarti
P( X ≤ 8) = 0,25 .
Pilihan ekor atas (upper tail) digunakan jika akan dicari nilai X1−α sedemikian
hingga
P( X ≤ X1−α ) = 1 − α (luasan upper tail atau ekor atas).
Jika pilihan ekor atas yang digunakan, maka keluaran R‐Commander memberikan nilai
12 pada jendela keluarannya, yang berarti
P( X ≤ 12) = 0,75 .
‐ 71 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Misalkan akan dihitung nilai peluang dari Distribusi Binomial Kumulatif, yaitu
ingin dicari nilai P( X ≤ 8) (luasan lower tail atau ekor bawah) dari Distribusi Binomial
dengan n=20 dan p=0.5, maka pada jendela isian Nilai peubah tulis nilai 8. Dalam contoh
ini isikan Trial Binomial 20, dan Peluang Sukses 0.5. Klik OK, sehingga akan diperoleh
nilai 0. 2517223 pada jendela keluaran R‐Commander.
Selain itu, R juga memberikan fasilitas untuk menghitung nilai peluang untuk
suatu nilai tertentu. Misalkan akan dicari P( X = 8) dari Distribusi Binomial dengan n=20
dan p=0.5. Untuk itu, pilih menu Distribusi, pilih Distribusi Diskrit, pilih Distribusi
Binomial, dan klik Peluang Binomial… . Isikan Trial Binomial 20, dan Peluang Sukses 0.5.
Klik OK, maka akan ditampilkan nilai peluang untuk X = 0,1,2,K,20 .
‐ 72 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
‐ 73 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Misalkan akan dibuat plot fungsi kepadatan peluang dari Distribusi Binomial dengan
n=20 dan p=0.5, atau akan ditampilkan secara grafik nilai‐nilai dari f (x) = P( X = x)
untuk X ~ B(20,0.5) , atau
20 x 20−x
f (x) = 0,5 (1− 0,5) , untuk x = {0,1,2,K,20) .
x
Untuk menampilkan itu, maka pada jendela tulis 20 pada isian Trial Binomial, dan tulis
0.5 pada isian Peluang Sukses.
Setelah itu pilih plot yang akan dibuat, misalkan saja plot fungsi kepadatan
peluang, maka klik pilihan Plot fungsi kepadatan peluang. Klik OK, sehingga akan
diperoleh plot fungsi kepadatan dari Distribusi Binomial dengan n=20 dan p=0.5 seperti
pada Gambar 5.13. Dari gambar ini dapat dilihat bahwa nilai f (x) terbesar adalah pada
X = 10 , yang secara matematis dapat dihitung seperti berikut
20 10 20−10
f (10) = 0,5 (1− 0,5)
10
20
= 0,5
10 (0,5) 10
10
= 0,1601.
‐ 74 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Gambar 5.13. Output plot fungsi kepadatan Distribusi Binomial dengan n=20 dan p=0.5
Jika pilihan Plot fungsi distribusi (kumulatif) atau F (x) = P( X ≤ x) yang dipilih,
maka akan diperoleh output plot fungsi distribusi kumulatif dari Distribusi Binomial
dengan n=20 dan p=0.5 seperti pada Gambar 5.14 berikut ini.
Gambar 5.14. Output plot fungsi Distribusi Kumulatif Binomial dengan n=20 dan p=0.5
‐ 75 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Pembuatan plot fungsi kepadatan dan fungsi distribusi kumulatif dapat juga
dilakukan dengan command line di R‐Console, yaitu dengan command dnorm (untuk
plot fungsi kepadatan) dan command pnorm (untuk plot fungsi distribusi kumulatif)
diikuti argumen optional yang diinginkan. Berikut adalah contoh pembuatan plot‐plot
tersebut dengan command line untuk suatu nilai peubah.
‐ 76 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Gambar 5.15. Jendela dialog untuk membangkitkan data dari Distribusi Binomial
Untuk mengetahui hasil data yang dibangkitkan, klik pilihan Lihat data set pada R‐
Commander, sehingga akan terlihat data‐data hasil bangkitan seperti pada Gambar 5.16.
Secara umum akan diperoleh 15 baris sampel dan 6 kolom data, yaitu 5 kolom data hasil
bangkitan dan 1 kolom terakhir yang berisi rata‐rata dari setiap sampel bangkitan.
Gambar 5.16. Output data hasil bangkitan dari Distribusi Binomial (n=20 dan p=0.5)
Fungsi Distribusi Peluang di R‐Commander
Proses pembangkitan data dari suatu distribusi statistika yang diskrit ini juga
dapat dilakukan dengan command line di R‐Console, yaitu dengan command rbinom
(untuk Distribusi Binomial) diikuti argumen optional yang diinginkan. Berikut adalah
contoh pembangkitan data dengan command line untuk Distribusi Binomial dengan n
dan p tertentu.
‐ 78 ‐
©sht90 Fungsi Distribusi Peluang di R‐Commander
Berikut ini adalah ringkasan fungsi kepadatan probabilitas dari distribusi diskrit yang
disediakan R pada tabel diatas.
Distribusi Geometrik
x−1
f (x) = p(1− p) , untuk x = {1,2,K} dan 0 < p ≤ 1 .
Distribusi ini merepresentasikan terjadinya sukses pertama kali pada percobaan ke x
dalam suatu barisan percobaan Bernoulli.
Distribusi Hipergeometrik
m+n
k
m n
x k−x
f (x) = , untuk x = {0,1,2,K, k} .
Distribusi Poisson
λx e−λ
f (x) = , untuk x = {1,2,K} dan λ = parameter rata‐rata .
x!