Modul Pelatihan R PDF
Modul Pelatihan R PDF
1. Pengantar ................................................................. 1
2. Tipe Data .................................................................. 7
3. Vektor ...................................................................... 10
4. Matrix ...................................................................... 17
5. List ........................................................................... 26
6. Data Frame ............................................................... 29
7. Manajemen Data ...................................................... 32
8. Diagram atau Grafik .................................................. 38
9. Uji T .......................................................................... 62
10. Korelasi .................................................................... 81
11. Analisis Regresi ......................................................... 88
12. R Commander ........................................................... 100
Pengantar R
Apa itu R?
R merupakan salah satu paket analisis data open source yang dapat
diperoleh secara cuma-cuma di situs http://www.r-project.org/ atau
http://cran.rproject.org/. R termasuk bahasa S. Ada dua program utama
yang ditulis dengan bahasa S, yaitu S-Plus yang dikembangkan secara
komersial dan R yang dikembangkan melalui konsep open source. Beda
keduanya terletak pada antarmuka/interface penggunanya. S-Plus telah
dilengkapi dengan menu yang sangat lengkap yang sering disebut
sebagai advanced Grapical User Interface (GUI), sedangkan R lebih
mengandalkan Command Line Interface (CLI) dari pada menu.
Belakangan banyak kontributor yang menyumbang paket menu interface
untuk R. Paket program R ini sudah dilengkapi banyak kemampuan
internal untuk menganalisis data dan menampilkan grafik sehingga R bisa
dikatagorikan sebagai paket pengolahan data (paket statistika). Dewasa
ini R semakin populer dipergunakan baik di bidang akademik maupun
industri.
Kelebihan R
Beberapa kelebihan R yang menjadi alasan banyak statistisi
memilihnya sebagai paket aplikasi diantaranya:
Ada koleksi program analisis data, yang disebut library atau pustaka
yang sangat luas seperti statistika deskriptif, regresi, pemodelan
statistika (baik linear maupun nonlinear), anova dan multivariat, atau
untuk tujuan khusus seperti Geo Statistika, Pengolahan Citra (Image
Processing), bahkan untuk pengembangan Interface atau antarmuka
grafis (GUI) R itu sendiri.
1
Pengantar R
Kemampuan pemrograman (bahasa S) dapat dikembangkan secara
fleksibel untuk kepentingan khusus yang lebih lanjut.
Variasi penampilan grafiknya sangat banyak dan berkualitas tinggi
baik penampilan di layar monitor maupun dalam bentuk cetak di atas
kertas.
R termasuk pemrograman yang berorientasi pada objek (object
oriented programming). Semua hasil, baik berupa variabel, konstanta
maupun fungsi, oleh R disimpan dalam bentuk objek.
Keuntungannya adalah apabila apa yang telah dikerjakan R saat ini
dikemudian hari diperlukan, maka R dapat mengambilnya tanpa
harus melakukan perhitungan ulang dari awal. Dengan demikian
proses untuk objek yang sama menjadi lebih cepat. Dalam mencari
objek yang diperlukan, mula-mula R akan melihat daftar objek yang
masih ada di memori, apabila tidak ditemukan, maka R akan
melanjutkan pencariannya ke hardisk yang semuanya dilakukan
secara otomatis tanpa dirasakan oleh penggunanya.
R juga termasuk bahasa terinterpretasi/ interpreted, bukan
terkompilasi/ compilled. Dalam bahasa terinterpretasi setiap
ekspresi/ perintah tunggal dievaluasi dan dieksekusi dengan
segera. Sedangkan dalam bahasa kompilasi (C dan Fortran
misalnya), maka keseluruhan program harus dikompilasi oleh
sebuah kompiler yang menerjemahkan bahasa C atau Fortran
tadi ke dalam bahasa mesin. Keunggulan bahasa interpretasi ini
adalah fleksibilitasnya untuk dikembangkan secara bertahap,
sedangkan kelemahannya dia memerlukan lebih banyak
memori. Namun dengan kemajuan perangkat keras komputer,
2
Pengantar R
memori dan kecepatan proses tidak lagi merupakan masalah
yang serius.
3
Pengantar R
Instalasi R
Download dan Install RStudio
Beberapa langkah menginstall R diantaranya:
1. Download R di link cran.r-project.org/.
4
Pengantar R
3. Jalankan Rstudio.
5
Pengantar R
Misalkan ingin menginstall packages regresi dan komputer
berhubungan dengan internet.
6
Tipe data
Data pada R terbagi atas beberapa tipe yakni, logical, numeric, integer,
complex, dan string/character. Adapun untuk penjelasan lebih
lengkapnya adalah sebagai berikut.
Logical
Logical merupakan tipe data yang sering dibuat melalui perbandingan
antar objek yang menghasilkan nilai kebenaran TRUE atau FALSE.
x=1
y=2
z=x>y
print(z)
class(z)
Output:
> print(z)
[1] FALSE # memberikan pernyataan salah karena
seharusnya x<y
> class(z)
[1] "logical" # memberikan pernyataan bahwa z adalah
Tipe data logical
Numeric
Contoh sintaks pada tipe data numerik di R adalah sebagai berikut
v=2.35
class(v)
Output:
> class(v)
7
Tipe Data
Integer
Contoh sintaks pada tipe data integer adalah sebagai berikut
q=1:5
q
class(q)
r=2L
class(r)
Output:
> q
[1] 1 2 3 4 5
> class(q)
[1] "integer" # memberikan pernyataan bahwa q adalah
Tipe data integer
> r=2L
> class(r)
[1] "integer" # memberikan pernyataan bahwa r adalah
Tipe data integer
Complex
Contoh sintaks pada tipe data complex adalah sebagai berikut
b=3+7i
class(b)
Output:
> class(b)
[1] "complex" # memberikan pernyataan bahwa v adalah
Tipe data integer
8
Tipe Data
String
Objek string dalam R biasanya disebut dengan character. Contoh
sintasknya adalah sebagai berikut
k = "hai sabil"
k
class(k)
Output:
> k
[1] "hai sabil"
> class(k)
[1] "character" # memberikan pernyataan bahwa k
adalah tipe data characater
9
Vektor
Bagaimana membuat vektor di R ?
Vektor merupakan serangkaian elemen (anggota) yang berasal dari jenis
data yang sama. Vektor umumnya dibuat dengan menggunakan fungsi
c(). Sebagai contoh sebagai berikut:
Misalnya kita ingin membuat vektor yang mengandung tiga nilai numerik
seperti 2,3, dan 5. Atau misalnya ingin membuat vektor yang terdiri dari
anggotanya berjenis string. Maka contoh sintaksnya adalah:
v=c(2,3,5)
v
W=(“aku” , ”sangat” , ”cinta” , ”kamu”)
w
Output:
> v
[1] 2 3 5
> w
[1] “aku” ”sangat” ”cinta” ”kamu”
Sering kali kita ingin mengetahui ukuran vektor atau jumlah anggota yang
ada di dalam vektor. Sebagai contoh kita ingin menghitung jumlah
anggota pada vektor v di contoh sebelumnya.
Length(v)
Length(w)
Output:
> length(v)
[1] 3
> length(w)
[1] 4
10
Vektor
Vektor di R juga bisa dibuat dengan menggunakan operasi :
x=1:7
x
y=5:-5
y
p=c(1:7)
p
q=c(-5:5)
q
Output:
> x
[1] 1 2 3 4 5 6 7
> y
[1] 5 4 3 2 1 0 -1 -2 -3 -4 -5
> p
[1] 1 2 3 4 5 6 7
> q
[1] 5 4 3 2 1 0 -1 -2 -3 -4 -5
11
Vektor
h=seq(1, 2, by=0.2) # vektor dengan jarak tertentu
h
j=seq(1, 5, length.out=4) # vektor dengan jumlah
anggota tertentu
j
Output:
> h
[1] 1 1.2 1.4 1.6 1.8 2.0
> j
[1] 1.0000 2.3333 3.6667 5.0000
x=c(5,6,9,10,13)
x
x[4] # mengambil anggota ke empat pada vektor x
12
Vektor
Output:
> x
[1] 5 6 9 10 13
> x[4]
[1] 10
> x[-4]
[1] 5 6 9 13
> x[c(1,3)]
[1] 5 9
> x[c(-1,-3)]
[1] 6 10 13
> x[1:3]
[1] 5 6 9
> x[-1:-3]
[1] 10 13
> x[c(TRUE,FALSE,FALSE,TRUE,FALSE)]
[1] 5 10
13
Vektor
Bagaimana memodifikasi vektor di R ?
Memodifikasi dalam hal ini adalah mengganti atau mengubah sebagian
atau seluruh anggota yang ada pada vektor tertentu dengan anggota
baru. Contohnya yaitu;
X=c(-2,-1,0,1,2)
x
X[2]=0 # mengganti anggota ke 2 dengan angka 0
x
x[x<0]=5 # mengganti anggota yang lebih kecil dari 0
dengan angka 5
x
Output:
> x
[1] -2 -1 0 1 2
> x
[1] -2 0 0 1 2
> x
[1] 5 0 0 1 2
Output:
> x
NULL
14
Vektor
Aritmatika Vektor
Operasi aritmatika vektor dilakukan elemen per elemen. Misalkan, kita
memiliki dua vektor x dan y yang berukuran sama, maka dapat dilakukan
operasi penjumlahan, pengurangan, perkalian, dan pembagian elemen.
Sebagai berikut :
x=c(-2,-1,0,1,2); y=c(1,3,5,7,9)
#operasi penjumlahan dua vektor
a=x+y
a # cetak vektor baru a
#operasi pengurangan dua vektor
b=x-y
b # cetak vektor baru b
#operasi perkalian dua vektor
d=x*y
d # cetak vektor baru d
#operasi pembagian dua vektor
e=x/y
e # cetak vektor baru e
Output:
> a
[1] -1 -2 5 8 10
> b
[1] -3 -4 -5 -6 -7
> d
[1] -2 -3 0 7 18
> e
[1] -2 -0.3333333 0 0.1428571 0.2222222
15
Vektor
QUIZZ
Diketahui peubah x=c(-2,4,0,1,2,5,7,9);y=c(1,2)
a. Lakukanlah operasi penjumlahan, pengurangan,
perkalian dan pembagian
b. Ambil elemen di x yang lebih kecil dari 7
kemudian lakukan poin a
Output:
c. Buatlah sintaks untuk mencari indeks elemen
vector x yang lebih kecil dari 3 dan elemen yang
lebih besar dari 5
16
Matriks
Matriks merupakan kumpulan bilangan, simbol, atau ekspresi, yang
disusun menurut baris dan kolom. Isi di dalam suatu matriks disebut
dengan elemen atau anggota.
Output:
> M
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
> N
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
17
Matriks
Matriks juga bisa dibuat dari vektor tertentu. Misalnya kita ingin membuat
Matriks dengan jumlah baris 2 dan jumlah kolom 3 maka contoh
sintaksnya sebagai berikut.
Output:
> M
[,1] [,2] [,3]
[1,] 1 5 9
[2,] 3 7 11
> N
[,1] [,2] [,3]
[1,] 1 5 9
[2,] 3 7 11
Matriks juga bisa diberi label atau nama pada baris dan kolomnya.
18
Matriks
Output:
> M
A B C
X 1 4 7
Y 2 5 8
Z 3 6 9
> colnames(M)
[1] "A" "B" "C"
> rownames(M)
[1] "X" "Y" "Z"
A=cbind(c(1,2,3),c(4,5,6))
B=rbind(c(1,2,3),c(4,5,6))
Output:
> A
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 3 6
> B
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
19
Matriks
Bagaimana mengambil atau menghilangkan
anggota pada matriks di R ?
Anggota-anggota pada matriks dapat diambil atau dihilangkan sesuai
dengan keinginan kita. Pada penerapannya, terkadang kita ingin
menyeleksi variabel tertentu pada data yang berbentuk matriks dengan
tujuan tertentu. Kemugkinan lain kita ingin menghilangkan variabel atau
pengamatan tertentu pada data berbentuk matriks karena tidak
diperlukan. Contohnya sebagai berikut.
Output:
> x
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
> x[2,3]
[1] 8
> x[2,]
[1] 2 5 8
> x[,3]
[1] 7 8 9
20
Matriks
Lanjutan Output:
> x[c(1,2),c(1,3)]
[,1] [,2]
[1,] 1 7
[2,] 2 8
> x[c(3,2),]
[,1] [,2] [,3]
[1,] 3 6 9
[2,] 2 5 8
> x[-2,]
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 3 6 9
> x[,-3]
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 3 6
21
Matriks
Output:
> x
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
> x[2,2]=10
> x
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 10 8
[3,] 3 6 9
> x[x<5]=0
> x
[,1] [,2] [,3]
[1,] 0 0 7
[2,] 0 10 8
[3,] 0 6 9
Operasi Matriks
Operasi matriks pada dasarnya hampir sama dengan operasi aritmatika
di vektor, hanya saja operasi aritmatika di matriks harus mengikuti aturan
tertentu yaitu menyesuaikan jumlah baris dan kolom
> m1=matrix(1:10,nrow=2)
> m2=matrix(seq(5.5,10,by=0.5),nrow=2)
> m1
> m2
> m1+m2
> m1-m2
> m1*m2 #perkalian antara elemen matriks
> m1%*%m2 #perkalian antara matriks m125*m225
> m1%*%t(m2) #lakukan transpose pada m2, t()
perkalian antara matriks m125*m252
> m1/m2 #pembagian antara elemen matriks
22
Matriks
output:
> m1
[,1] [,2] [,3] [,4] [,5]
[1,] 1 3 5 7 9
[2,] 2 4 6 8 10
> m2
[,1] [,2] [,3] [,4] [,5]
[1,] 5.5 6.5 7.5 8.5 9.5
[2,] 6.0 7.0 8.0 9.0 10.0
> m1+m2
[,1] [,2] [,3] [,4] [,5]
[1,] 6.5 9.5 12.5 15.5 18.5
[2,] 8.0 11.0 14.0 17.0 20.0
> m1-m2
[,1] [,2] [,3] [,4] [,5]
[1,] -4.5 -3.5 -2.5 -1.5 -0.5
[2,] -4.0 -3.0 -2.0 -1.0 0.0
> m1*m2
[,1] [,2] [,3] [,4] [,5]
[1,] 5.5 19.5 37.5 59.5 85.5
[2,] 12.0 28.0 48.0 72.0 100.0
> m1%*%t(m2)
[,1] [,2]
[1,] 207.5 220
[2,] 245.0 260
> m1/m2
[,1] [,2] [,3] [,4] [,5]
[1,] 0.18181 0.46153 0.66666 0.82352 0.94736
[2,] 0.33333 0.57142 0.75000 0.88888 1.00000
23
Matriks
Pada pengerjaan dengan melibatkan objek matriks, biasanya terjadi
error pada saat melakukan operasi matriks, hal ini biasa terjadi jika,
dimensi dari matriks tidak bersesuaian, kelas dari objek data ternyata
bukan objek matriks. Oleh karena itu ada baiknya kita mengecek dimensi
dan kelas dari objek data. Dapat menggunakan perintah dim( ) untuk
dimensi, class( ) atau is.matrix( ) untuk mengecek tipe objek matriks
class(m1)
> class(m1)
[1] "matrix"
is.matrix(m1)
> is.matrix(m1)
[1] TRUE
dim(m1)
> dim(m1)
[1] 2 5
24
Matriks
QUIZZ
Diketahui 2 buah matiks:
m1=matrix(1:10,nrow=2)
m2=matrix(seq(5.5,10,by=0.5),nrow=2)
a. Buatlah sintaks sehingga kedua matriks mengeluarkan
output seperti di bawah ini!
m1 m2
[1,] 1 5.5
[2,] 2 6.0
[3,] 3 6.5
[4,] 4 7.0
[5,] 5 7.5
[6,] 6 8.0
[7,] 7 8.5
[8,] 8 9.0
[9,] 9 9.5
[10,] 10 10.0
b. Selesaikanlah persamaan berikut:
25
List
List
Bagaimana membuat list di R ?
List adalah suatu vektor yang memiliki berbagai tipe data yang berbeda.
Komponen data suatu list terdiri dari dari vektor beranggota tunggal,
vektor beranggota ganda, bahkan bisa juga beranggota matriks. List
dapat dibuat pada R dengan menggunakan fungsi list(). Berikut ini adalah
contoh membuat list yang anggotanya numerik, string, logical, dan
integer.
x=list(2.5,"tampan",TRUE,1:3)
x
Output:
> x
[[1]]
[1] 2.5
[[2]]
[1] "tampan"
[[3]]
[1] TRUE
[[4]]
[1] 1 2 3
Informasi tipe dapat juga kita ketahui dengan menggunakan fungsi str().
Adapun sintaksnya adalah sebagai berikut:
x=list(2.5,"tampan",TRUE,1:3)
str(x)
Output:
> str(x)
List of 4
$ : num 2.5 # num = numerik
$ : chr "tampan" # chr = string
$ : logi TRUE # logi = logical
$ : int [1:3] 1 2 3 # int = integer
26
List
Panjang atau ukuran list juga dapat kita ketahui di R dengan
menggunakan fungsi length(). Adapun fungsinya adalah sebagai berikut:
x=list(2.5,"tampan",TRUE,1:3)
length(x)
Output:
> length(x)
[1] 4
List juga dapat kita dibuat dari beberapa variabel tertentu. Contoh
sintaksnya adalah sebagai berikut:
f=2.5
g="tampan"
h=TRUE
i=1:3
gabung=list(f,g,h,i)
gabung
Output:
> gabung
[[1]]
[1] 2.5
[[2]]
[1] "tampan"
[[3]]
[1] TRUE
[[4]]
[1] 1 2 3
27
List
List juga dapat dibuat dengan memberikan nama pada tiap anggotanya.
Sintaksnya adalah sebagai berikut:
x=list(2.5,"tampan",TRUE,1:3)
names(x)=c("nama1","nama2","nama3","nama4")
x
Output:
> x
$nama1
[1] 2.5
$nama2
[1] "tampan"
$nama3
[1] TRUE
$nama4
[1] 1 2 3
28
Data
DataFrame
Frame
Data Frame merupakan bentuk khusus dari list yang komponennya
memilki panjang yang sama. Komponen dalam data frame disebut
sebagai variabel atau peubah yang disusun dalam bentuk kolom
sedangkan isi dari komponen disebut observasi atau pengamatan yang
disusun dalam bentuk baris. Ketika kita megambil data dari excel,spss,
sas , atau software lain untuk diolah di R maka data akan tampil dalam
bentuk data frame. Data frame inilah yang biasanya digunakan untuk
melakukan pengolahan data. Tapi kita bisa juga membuat data frame
secara langsung di R.
nama=c("sabil","pipit","shynde","ana","hasan","ary","
fadhlul","hijrah","yunus","iswan","rizal")
nilai=c(85,87,90,81,80,75,94,92,60,84,75)
laporan_nilai=data.frame(nama,nilai)
laporan_nilai
Output:
> laporan_nilai
nama nilai
1 sabil 85
2 pipit 87
3 shynde 90
4 ana 81
5 hasan 80
6 ary 75
7 fadhlul 94
8 hijrah 92
9 yunus 60
10 iswan 84
11 rizal 75
29
Data Frame
Bagaimana mengambil komponen data
frame di R?
Pada analisis data, terkadang kita hanya memerlukan beberapa variabel
untuk kita olah. Dengan kata lain, di data frame terkadang kita hanya ingin
mengambil kolom atau variabel tertentu untuk diolah. Mungkin juga baris
tertentu yang ingin kita ambil dari suatu data frame. Berikut adalah contoh
sintaks untuk mengambil komponen data frame dengan menggunakan
data frame di contoh sebelumnya dengan nama laporan_nilai.
Output:
> laporan_nilai["nama"]
nama
1 sabil
2 pipit
3 shynde
4 ana
5 hasan
6 ary
7 fadhlul
8 hijrah
9 yunus
10 iswan
11 rizal
30
Data Frame
Lanjutan Output:
> laporan_nilai[c("nama","nilai")]
nama nilai
1 sabil 85
2 pipit 87
3 shynde 90
4 ana 81
5 hasan 80
6 ary 75
7 fadhlul 94
8 hijrah 92
9 yunus 60
10 iswan 84
11 rizal 75
> laporan_nilai$nama
[1] sabil pipit shynde ana hasan ary
fadhlul hijrah yunus iswan rizal
> laporan_nilai$nilai
[1] 85 87 90 81 80 75 94 92 60 84 75
> laporan_nilai[,1]
[1] sabil pipit shynde ana hasan ary
fadhlul hijrah yunus iswan rizal
> laporan_nilai[,2]
[1] 85 87 90 81 80 75 94 92 60 84 75
> laporan_nilai[3,]
nama nilai
3 shynde 90
31
Manajemen Data
Mengapa manajemen data diperlukan? Jika seandainya kita ingin
mengolah data di R studio kemudian data tersebut tersimpan di excel
tentu sangat tidak efektif bila datanya diketik ulang satu persatu ke
software R studio. Manajemen data diperlukan agar memudahkan kita
dalam menggunakan data yang sudah ada di software lain atau bisa juga
sebaliknya yakni menyimpan data di sotware lain. R studio menyediakan
fitur import data (mengambil data) dari csv, excel, spss, stata, dan sas.
Berikut ini adalah contoh import data dari excel.
Import data
Langkah pertama yang harus dilakukan adalah klik :
File ----> Import Dataset ----> From Excel
32
Manajemen Data
setelah di klik “From excel” maka akan muncul tampilan seperti gambar
di bawah ini, kemudian klik “Browse”
33
Manajemen Data
Setelah itu akan muncul seperti tampilan di bawah ini. excel terdiri dari
beberapa sheet. Jika kita ingin mengolah data excel kita yang berada
pada “Sheet1”, maka perhatikan lingkaran merah pada gambar di
bawah kemudian ubah menjadi “Sheet1”. Lalu klik “Import”.
34
Manajemen Data
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.
Export data
Ada begitu banyak cara untuk menyimpan hasil output dari R studio ke
software lain. Tapi dalam modul ini kita hanya memberikan contoh
bagaimana cara menyimpan hasil output R studio di csv.
Export csv
Misalnya kita ingin membangkitkan 10 bilangan acak dengan
menyebar normal. sintaksnya sebagai berikut:
x=rnorm(10,5,1)
datanorm=data.frame(x)
data norm
35
Manajemen Data
Output
> datanorm
x
1 4.350645
2 3.190941
3 4.792829
4 4.464292
5 5.373125
6 5.664427
7 3.719065
8 6.299645
9 6.345545
10 4.884426
36
Manajemen Data
Kemudian klik file csv dengan nama “datanormal”. maka hasilnya
sebagai berikut:
37
Diagram dan Grafik
Diagram atau grafik merupakan gambar-gambar yang menunjukan
data secara visual baik berbentuk gambar maupun lambang. Kegunaan
diagram atau grafik antara lain untuk mempertegas dan memperjelas
penyajian data, mempercepat pengertian, mengurangi kejenuhan melihat
angka, menunjukkan arti secara menyeluruh.
Diagram Batang
Grafik batang merupakan grafik data berbentuk persegi panjang yang
lebarnya sama dan dilengkapi dengan skala atau ukuran sesuai dengan
data yang bersangkutan serta menyajikan data yang bersifat kategori.
Pada Rstudio digunakan fungsi barplot() untuk membuat Diagram
Batang.
barplot(x,xlab,ylab,main,names.arg,col)
Keterangan:
38
Diagram dan Grafik
Berikut perintah dalam Rstudio terkait kasus diatas:
pendapatan<-c(2,1,3,2,3,2)
nama<-c("Aad","Dira","Lida","Tri","Vida","Fadu")
barplot(pendapatan,names.arg =nama,
xlab="nama",ylab="pendapatan",
col="blue",main="diagram pendapatan")
barplot(pendapatan,names.arg =nama,
xlab="bulan",ylab="pendapatan",
col="blue",main="diagram pendapatan",
horiz=TRUE)
39
Diagram dan Grafik
barplot(table(pendapatan),xlab="nama",
ylab="pendapatan",
border="black",col="blue",
main="diagram pendapatan")
40
Diagram dan Grafik
Diagram batang juga dapat dibentuk dari data yang berkelompok dengan
data matrix() sebagai nilai input. Misalkan terdapat data banyaknya
(frekuensi) investor yang diperoleh oleh pasangan suami istri (Aad dan
Dara). Pada Bulan Januari, Aad memperoleh klien sebanyak 5 orang dan
Dira sebanyak 6 orang. Pada Bulan Februari, Aad memperoleh klien
sebanyak 9 orang dan Dira sebanyak 8 orang.
#input data
warna<-c("yellow","green")
nama<-c("aad","dira")
bulan<-c("Jan","Feb","Mar","Apr","Mei")
pendapatan<-matrix(c(15,19,16,28,24,
18,23,8,25,19),
nrow=2,ncol=5,byrow=TRUE)
#diagram batang
barplot(pendapatan,main="pendapatan alumni STT",
xlab="bulan",ylab="pendapatan",col=warna,names.arg
= bulan)
#keterangan pada plot
legend("topleft",nama,cex=1.3,fill=warna)
41
Diagram dan Grafik
Histogram
Histogram mempresentasikan data dalam bentuk visual dari distribusi
data yang digambarkan dengan grafis berbentuk batang. Histogram
hampir mirip dengan diagam batang, namun histogram dibentuk
berdasarkan frekuensi data dalam tipe data interval dan rasio. Selain itu,
pada histogram tidak terdapat jarak antara batang seperti pada diagram
batang. Pada Rstudio digunakan fungsi hist() untuk membuat histogram.
hist(x,xlab,ylab,xlim,ylim,main,col,breaks)
42
Diagram dan Grafik
Keterangan:
hist(histogram$uas,main="Histogram UAS",
xlab="nilai",ylab="frekuensi",
xlim=c(70,100),ylim=c(0,10))
43
Diagram dan Grafik
Pada perintah (sintaks) diatas terlihat data yang yang diambil adalah
peubah (variabel) uas, histogram dibuat dengan judul “Histogram UAS”,
label untuk sumbu mendatar bernama “nilai”, label untuk sumbu tegak
bernama “frekuensi”, rentang nilai sumbu mendatar berada diantara 70
hingga 100, dan rentang nilai untuk sumbu tegak antara 0 hingga 10.
hist(histogram$uas,breaks=6,main="Histogram UAS",
xlab="nilai",ylab="kepadatan peluang",
freq=FALSE)
Pada perintah diatas terlihat banyaknya kelas dan lebar batang pada
histogram adalah 6, label untuk sumbu tegak bernama “kepadatan
peluang”, dan frekuensi diganti dengan kepadatan peluang.
44
Diagram dan Grafik
Jika ingin menampilkan merubah jumlah kelas dan lebar batang dengan
menambahkan argumen breaks() dengan beberapa nilai seperti 70, 85,
dan 100.
hist(histogram$uas,main="Histogram UAS",
xlab="nilai",ylab="kepadatan peluang",
freq=FALSE,breaks = c(70,85,100))
45
Diagram dan Grafik
Jika ingin ditampilkan teks pada masing-masing batang maka
menggunakan fungsi text().
h<-hist(histogram$uas)
text(h$mids,h$counts,labels = h$counts,
adj=c(0.5,-0,5))
46
Diagram dan Grafik
Diagram Lingkaran
Diagram lingkaran merupakan penyajian data statistik dengan
menggunakan gambar berbentuk lingkaran yang dibagi menjadi sudut-
sudut sektor (juring). Setiap sektor melukiskan kategori data yang terlebih
dahulu diubah ke dalam derajat dengan menggunakan busur derajat.
Diagram lingkaran sangat cocok untuk menyajikan data yang berbentuk
kategori atau atribut dalam persentase. Pada Rstudio digunakan fungsi
pie() untuk membuat diagram lingkaran.
pie(x,labels,radius,main,col,clockwise)
Keterangan:
x<-c(30,25,55)
label<-c("PNS","pengusaha","lainnya")
warna<-c("blue","yellow","green")
pie(x,labels=label,
main="Pie profesi alumni",
col=warna)
47
Diagram dan Grafik
x<-c(30,25,55)
label<-c("PNS","pengusaha","lainnya")
#persentasi data
pie.persen<-round(100*x/sum(x),1)
#penggabungan label
pielabel<-paste(pie.persen,"%",sep="")
pie(x,labels=pielabel,
main="Pie profesi
alumni",col=rainbow(length(x)))
#menambahkan legenda
legend("topright",label,cex=0.6,
fill=rainbow(length(x)))
48
Diagram dan Grafik
Boxplot
Selain histogram, penyajian grafis lainnya yang bisa merangkum
informasi lebih detail mengenai distribusi nilai-nilai data pengamatan
adalah Boxplot. Terdapat 5 ukuran statistik dari boxplot yaitu:
Nilai minimum: nilai observasi terkecil.
Q1: kuartil terendah atau kuartil pertama.
Q2: median atau nilai pertengahan.
Q3: kuartil tertinggi atau kuartil ketiga.
Nilai maksimum: nilai observasi terbesar.
49
Diagram dan Grafik
50
Diagram dan Grafik
Garis yang merupakan perpanjangan dari box (baik ke arah atas ataupun
ke arah bawah) dinamakan dengan whiskers.
Whiskers bawah menunjukkan nilai yang lebih rendah dari kumpulan
data yang berada dalam IQR.
Whiskers atas menunjukkan nilai yang lebih tinggi dari kumpulan
data yang berada dalam IQR.
Panjang whisker ≤ 1,5 IQR. Masing-masing garis whisker dimulai dari
ujung kotak IQR, dan berakhir pada nilai data yang bukan
dikategorikan sebagai outlier (pada Gambar, batasnya adalah garis
UIF dan LIF). Sehingga nilai terbesar dan terkecil dari data
pengamatan (tanpa termasuk outlier) masih merupakan bagian
boxplot yang terletak tepat di ujung garis tepi whiskers.
Nilai yang berada di atas atau dibawah whiskers dinamakan nilai outlier
atau ekstrim.
Nilai outlier adalah nilai data yang letakknya lebih dari 1,5 IQR, diukur
dari UQ (atas kotak) atau LQ (bawah kotak).
Q3+(1,5 IQR) < outlier atas ≤ Q3+(3 IQR).
Q1-(1,5 IQR) > outlier bawah ≥ Q1-(3 IQR)
Nilai ekstrim adalah nilai-nilai yang letaknya lebih dari 3 IQR, diukur
dari UQ atau LQ.
Ekstrim bagian apabila atas apabila nilainya berada di atas
Q3+3 IQR.
Ekstrim bagian bawah apabila nilainya lebih rendah dari Q1-(3
IQR).
Boxplot dapat membantu kita dalam memahami karakteristik dari
distribusi data. Selain untuk melihat derajat penyebaran data (yang dapat
dilihat dari tinggi/panjang boxplot) juga dapat digunakan untuk menilai
kesimetrisan sebaran data. Panjang kotak menggambarkan tingkat
penyebaran atau keragaman data pengamatan, sedangkan letak median
dan panjang whisker menggambarkan tingkat kesimetrisannya.
Jika data simetris (berasal dari distribusi normal):
Garis median akan berada di tengah boxplot bagian atas dan
bawah akan memiliki panjang yang sama serta tidak terdapat
nilai outlier ataupun nilai ekstrim.
51
Diagram dan Grafik
Diharapkan nilai-nilai pengamatan yanng berada di luar
whiskers tidak lebih dari 1%.
Jika data tidak simetris (miring), median tidak akan berada di tengah
box dan salah satu dari whisker lebih panjang dari yang lainnya.
Adanya outlier di bagian atas boxplot yang disertai denggan
whiskers bagian atas yang lebih panjang, menunjukkan bahwa
distribusi data cendrung menjulur ke arah kanan (positive
skewness)
Sebaliknya, adanya outlier di bagian bawah boxplot yang
disertai dengan whisker bagian bawah yang lebih panjang,
menunjukkan bahwa distribusi data cendrung menjulur ke arah
kiri (negative skewness)
boxplot(x,data,notch,varwidth,names,main,col)
Keterangan:
x merupakan data berupa vektor atau formula.
data merupakan data frame.
notch merupakan nilai logical. Bila TRUE maka garis median pada
boxplot berbentuk cekuk.
varwidth merupakan nilai logical. Tetapkan nilai TRUE untuk
proporsi lebar boxplot sesuai dengan ukuran data.
names merupakan label masing-masing boxplot.
main merupakan pemberian judul pada diagram.
col merupakan pemberian warna.
52
Diagram dan Grafik
Misalkan terdapat data nilai uas mahasiswa statistika IPB yang ingin
dibuat boxplot.
boxplot(boxplot$uas,main="boxplot uas",
ylab="nilai")
53
Diagram dan Grafik
Histogram juga bisa dibuat secara bersamaan dengan beberapa data.
Misalkan terdapat nilai uas, uts, dan tugas mahasiswa statistika IPB yang
akan dibuat dengan histogramnya secara masing-masing berdasarkan
nilai uas, nilai uts, dan nilai tugas.
#data
uas<-boxplot$uas
uts<-boxplot$uts
tugas<-boxplot$tugas
#boxplot berganda
boxplot(uas,uts,tugas,main="boxplot nilai",
names=c("uas","uts","tugas"),
col=c("blue","yellow","green"),
horizontal=TRUE)
Pada perintah tersebut terdapat 3 boxplot yang akan dibentuk dalam satu
sumbu. Masing-masing boxplot dibedakan berdasarkan warna, boxplot
uas berwarna biru, boxplot uts berwarna kuning, boxplot tugas berwarna
hijau.
54
Diagram dan Grafik
55
Diagram dan Grafik
Scatterplot
Scatter plot menunjukkan plot titik dalam diagram kartesius. Setiap titik
merupakan koordinat dari 2 peubah yaitu 1 peubah pada sumbu mendatar
dan 1 peubah lainnya pada sumbu tegak. Banyak cara untuk membuat
scatterplot pada Rstudio diantaranya fungsi plot(x,y).
plot(x,y,main,xlab,ylab,xlim,ylim,axes)
Keterangan:
x merupakan vektor numerik yang digunakan pada sumbu
mendatar (sumbu x).
y merupakan vektor numerik yang digunakan pada sumbu tegak
(sumbu y).
xlab merupakan nama label pada sumbu mendatar.
ylab merupakan nama label pada sumbu tegak.
xlim merupakan rentang nilai pada sumbu mendatar.
ylim merupakan rentang nilai pada sumbu tegak.
main merupakan nama judul dari histogram.
col merupakan warna pada scaterplot.
Misalkan akan dibentuk scatterplot dari nilai uas dan uts mahasiswa
statistika IPB.
56
Diagram dan Grafik
#data
uas<-boxplot$uas
uts<-boxplot$uts
#scatter plot
plot(uas,uts,xlab="uas",ylab="uts",
main="scatter plot nilai",col="blue")
abline(lm(y~x),col)
Keterangan:
x merupakan peubah penjelas (independent)
y merupakan peubah respon (dependent)
57
Diagram dan Grafik
Pada scatter plot kasus nilai mahasiswa.
abline(lm(uas~uts),col="red")
pairs(formula,data)
Keterangan:
formula merupakan deretan peubah yang akan dibuat scatter plot
data merupakan data set yang berisi kumpulan peubah dan data
yang akan dibuat scatterplot
58
Diagram dan Grafik
pairs(~uas+uts+tugas,col="blue",
main="scatterplot matriks nilai mahasiswa")
Diagram Garis
Diagram garis menunjukkan diagram yang menghubungkan deretan titik
menggunakan garis. Umumnya diagram garis digunakan untuk emlihat
pola atau tren suatu data. Banyak cara untuk membuat diagram garis
menggunakan Rstudio, salah satunya plot() dengan tambahan type.
plot(data,type,main,col,xlab,ylab)
Keterangan:
data merupakan vektor yang memuat nilai numerik.
type merupakan jenis diagram garis. Jika diisi “l” maka diagram
hanya berbentuk garis saja dan jika diisi “o” maka diagram berbentuk
garis dan titik.
Main merupakan judul diagram.
col merupakan warna diagram.
xlab dan ylab nama label sumbu.
59
Diagram dan Grafik
Misalkan akan dibuat diagram garis untuk nilai uts mahasiswa statistika
IPB.
plot(boxplot$uts,type="o")
60
Diagram dan Grafik
Diagram garis lebih dari juga dapat dalam 1 sumbu (frame) dengan
bantuan fungsi lines() yang ditambahkan setelah fungsi plot().
lines(data1,type)
Misalkan akan dibentuk diagram garis untuk data uas, uts, dan tugas
mahasiswa statistika IPB dalam 1 sumbu.
plot(boxplot$uts,type="o",xlab="nama mahasiswa",
ylab="nilai",col="blue")
lines(boxplot$uas,type="o",col="green")
lines(boxplot$tugas,type="o",col="red")
61
Uji t
Mengapa menggunakan uji t ?
Pernahkah anda mendengar tentang uji beda? Sesuai dengan namanya,
uji beda biasanya dilakukan untuk membandingkan nilai tengah (rata-
rata/modus/median) kelompok dengan suatu nilai atau dengan nilai
tengah kelompok lainnya. Misalnya,
62
Uji t
One sample t test
Uji t satu sampel merupakan prosedur uji t yang digunakan untuk
membandingkan nilai tengah suatu sampel dengan suatu nilai konstanta
tertentu. Nilai konstanta tersebut pada umumnya merupakan sebuah nilai
parameter untuk mengukur nilai populasi.
Hipotesis pada uji t satu sampel
63
Uji t
Contoh1
Berikut contoh data mengenai waktu penanganan suatu kasus di
pengadilan. Pada data ini ingin dilakukan pengujian apakah rata-rata
waktu penyelesaian suatu kasus di pengadilan kurang dari 80 hari.
Kemudian diambil sampel secara acak sebanyak 20 kasus dan
diasumsikan berasal dari distribusi normal.
Langkah pertama adalah menentukan hipotesisnya:
H0 : μ ≥ 80 waktu penyelesaian suatu kasus di pengadilan paling
rendah sebesar 80 hari
H1 : μ < 80 waktu penyelesaian suatu kasus di pengadilan kurang
dari 80
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data
Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut
64
Uji t
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.
t.test(one_sample_t_test$hari,alternative="less",
mu=80,conf.level=0.95) # uji t satu sampel
qt(0.05,df=19,lower.tail=TRUE) # t tabel
65
Uji t
Output:
> t.test(one_sample_t_test$hari,alternative="less",
mu=80,conf.level=0.95)
> qt(0.05,df=19,lower.tail=TRUE)
[1] -1.729133
Hasil analisis:
Dari hasil output diperoleh t hitung = 2.3008 > t tabel = -1.729133 dimana
p-value = 0.9836 > alpha = 0.05. Uji hipotesis yang digunakan pada kasus
ini adalah uji sisi kiri. Pada uji sisi kiri H0 ditolak jika t hitung < dari tabel
dan p-value<alpha. Sedangkan pada output t hitung > t tabel dan p-value
> alpha sehingga terima H0. Dengan demikian, dapat disimpulkan bahwa
dengan tingkat kepercayaan 95% tidak cukup bukti untuk mengatakan
waktu penyelesaian suatu kasus di pengadilan kurang dari 80 hari.
Contoh2
Berikut contoh data mengenai waktu penanganan suatu kasus di
pengadilan. Pada data ini ingin dilakukan pengujian apakah rata-rata
waktu penyelesaian suatu kasus di pengadilan lebih dari 80 hari.
Kemudian diambil sampel secara acak sebanyak 20 kasus dan
diasumsikan berasal dari distribusi normal.
66
Uji t
Langkah pertama adalah menentukan hipotesisnya:
H0 : μ ≤ 80 waktu penyelesaian suatu kasus di pengadilan paling
tinggi sebesar 80 hari
H1 : μ > 80 waktu penyelesaian suatu kasus di pengadilan lebih
dari 80
Langkah berikutnya yaitu uji t satu sampel dengan menggunakan fungsi
t.test() dan untuk t tabel menggunakan fungsi qt(). Sintaksnya adalah
sebagai berikut:
t.test(one_sample_t_test$hari,alternative="greater"
,mu=80,conf.level=0.95) # uji t satu sampel
qt(0.05,df=19,lower.tail=FALSE) # t tabel
Output:
> t.test(one_sample_t_test$hari,alternative="greater"
,mu=80,conf.level=0.95)
> qt(0.05,df=19,lower.tail=FALSE)
[1] 1.729133
67
Uji t
Hasil analisis:
Dari hasil output diperoleh t hitung = 2.3008 > t tabel = 1.729133 dimana
p-value = 0.01645 < alpha = 0.05. Uji hipotesis yang digunakan pada
kasus ini adalah uji sisi kanan. Pada uji sisi kiri H0 ditolak jika t hitung >
dari tabel dan p-value<alpha. Sedangkan pada output t hitung > t tabel
dan p-value < alpha sehingga tolak H0. Dengan demikian, dapat
disimpulkan bahwa waktu penyelesaian suatu kasus di pengadilan kurang
dari 80 hari dengan tingkat percayaan 95 %.
Contoh 3
Berikut contoh data mengenai waktu penanganan suatu kasus di
pengadilan. Pada data ini ingin dilakukan pengujian apakah rata-rata
waktu penyelesaian suatu kasus di pengadilan sama dengan 80 hari.
Kemudian diambil sampel secara acak sebanyak 20 kasus dan
diasumsikan berasal dari distribusi normal.
Langkah pertama adalah menentukan hipotesisnya:
t.test(one_sample_t_test$hari,alternative="two.sided"
,mu=80,conf.level=0.95) # uji t satu sampel
alpha=0.05
qt(c(alpha/2, 1-(alpha/2)), df=19) # t tabel
68
Uji t
Output:
> t.test(one_sample_t_test$hari,alternative="two.sided"
,mu=80,conf.level=0.95)
> alpha=0.05
> qt(c(alpha/2, 1-(alpha/2)), df=19) # t tabel
[1] -2.093024 2.093024
Hasil analisis:
Dari hasil output diperoleh t hitung = 2.3008 tidak berada pada selang
-2.093024 < t < 2.093024 dan p-value = 0.0329 < alpha = 0.05. Uji
hipotesis yang digunakan pada kasus ini adalah uji dua sisi. Pada uji dua
sisi H0 ditolak jika t hitung tidak berada pada selang (–t tabel < t < t tabel)
dan p-value<alpha Sedangkan pada output, t hitung tidak berada pada
selang (–t tabel < t < t tabel) dan p-value < alpha sehingga tolak H0.
Dengan demikian, dapat disimpulkan bahwa waktu penyelesaian suatu
kasus di pengadilan tidak sama dengan 80 hari dengan tingkat percayaan
95 %.
69
Uji t
Independent sample t test
Independent sample t test merupakan uji perbandingan nilai tengah pada
dua kelompok sampel yang independent. Dengan kata lain, dua kelompok
sampel yang tidak berhubungan. Sebagai contoh kita akan menguji
apakah ada perbedaan rata-rata (dua ) sampel yang terdiri dari kelompok
A dan kelompok B terkait dengan prestasi belajarnya. Contoh ini
menjelaskan bahwa sampel penelitian ini terdiri dari dua kelompok yang
berbeda atau tidak berhubungan satu sama lain.
Salah satu syarat dari inpendent sample t test adalah kita harus tahu
mengetahui terlebih dahulu apakah dua kelompok sampel tersebut
berasal dari populasi yang ragamnya sama atau tidak. sehingga sintaks
di R untuk menguji apakah ragamnya sama atau tidak adalah:
Var.test (x,y)
Contoh 4
Seorang Guru matematika di salah satu SMA Negeri di Bogor ingin
menguji apakah terdapat perbedaan nilai ujian matematika antara Kelas
A dan B. Guru tersebut mengambil sampel secara acak sebanyak 15
orang siswa dari masing-masing kelas.
70
Uji t
Langkah pertama adalah menentukan hipotesisnya. Karena dalam kasus
ini ingin melihat apakah sama atau tidak nilai ujiannya maka hipotesis nya
adalah hipotesis dua arah yakni :
Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut
71
Uji t
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.
72
Uji t
Output:
> var.test(a,b)
data: a and b
F = 0.82426, num df = 14, denom df = 14, p-value = 0.7227
alternative hypothesis: true ratio of variances is not equal
to 1
95 percent confidence interval:
0.2767275 2.4551214
sample estimates:
ratio of variances
0.8242569
Hasil analisis:
Pada uji keragaman jika p-value lebih kecil dari alpha 0.05 maka
ragamnya berbeda tapi jika sebaliknya maka ragamya sama. Dari hasil
ouput menujukkan bahwa p-value = 0.7227 > alpha = 0.05 sehingga dapat
disimpulkan bahwa ragam antara kedua kelompok sama. Hasil ini akan
menentukan langkah berikutnya yaitu, sintaks uji t nya (var.equal) harus
sama dengan TRUE
alpha=0.05
db=15+15-2
qt(c(alpha/2, 1-(alpha/2)), df=db) # t tabel
Output:
> t.test(a,b, var.equal=TRUE, paired=FALSE) # uji t
data: a and b
t = 12.671, df = 28, p-value = 4.081e-13
alternative hypothesis: true difference in means is not equal
to 0
95 percent confidence interval:
25.59742 35.46925
sample estimates:
mean of x mean of y
84.73333 54.20000
73
Uji t
Output t tabel:
> alpha=0.05
> n=15+15-2
> qt(c(alpha/2, 1-(alpha/2)), df=n) # t tabel
[1] -2.048407 2.048407
Hasil analisis:
Dari hasil output diperoleh t hitung = 12.671 tidak berada pada selang
-2.048407 < t < 2.048407 dan p-value = 0.0329 < alpha = 0.05. Uji
hipotesis yang digunakan pada kasus ini adalah uji dua sisi. Pada uji dua
sisi H0 ditolak jika t hitung tidak berada pada selang (–t tabel < t < t tabel)
dan p-value<alpha Sedangkan pada output, t hitung tidak berada pada
selang (–t tabel < t < t tabel) dan p-value < alpha sehingga tolak H0.
Dengan demikian, dapat disimpulkan bahwa rata-rata ujian kelas A dan
kelas B berbeda dengan tingkat percayaan 95 %.
74
Uji t
Paired sample t test
Paired sample t test atau uji t berpasangan merupakan membandingkan
rata-rata dua grup yang saling berpasangan, yaitu sampel dengan subjek
yang sama namun terdapat dua perlakuan/kejadian berbeda, misalnya
pengukuran sampel terhadap treatment tertentu sebelum dan
sesudahnya.
Hipotesis pada uji t satu sampel
75
Uji t
Sintaks uji t berpasangan di R adalah sebagai berikut:
Contoh 5
Akan diteliti mengenai perbedaan penjualan sepeda motor merk A
disebuah Kabupaten sebelum dan sesudah adanya ketetapan kenaikan
pajak kendaraan. Data diambil dari 15 dealer
Hipotesis
76
Uji t
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data
Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut
77
Uji t
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.
t.test(a,b,alternative="two.sided",paired=TRUE,
conf.level=0.95) # uji t
alpha=0.05
db=15-1
qt(c(alpha/2, 1-(alpha/2)), df=db) # t tabel
78
Uji t
Output:
> t.test(a,b,alternative="two.sided",paired=TRUE,conf.level=0.95)
Paired t-test
data: a and b
t = 1.0312, df = 14, p-value = 0.32
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.295969 3.695969
sample estimates:
mean of the differences
1.2
> alpha=0.05
> db=15-1
> qt(c(alpha/2, 1-(alpha/2)), df=db)
Hasil analisis:
Dari hasil output diperoleh t hitung = 1.0312 t berada pada selang
-2.144787 < t < 2.14478 dan p-value = 0.32 > alpha = 0.05. Uji hipotesis
yang digunakan pada kasus ini adalah uji dua sisi. Pada uji dua sisi H0
ditolak jika t hitung tidak berada pada selang (–t tabel < t < t tabel) dan p-
value<alpha Sedangkan pada output, t hitung berada pada selang
(–t tabel < t < t tabel) dan p-value > alpha sehingga terima H0. Dengan
demikian, dapat disimpulkan bahwa penjualan sepeda motor merk A
sebelum da sesudah adanya ketetapan kenaikan pajak kendaraan
berbeda dengan tingkat percayaan 95 %.
79
Uji t
Latihan
Dari hasil penelitian sebelumnya di ketahui bahwa rata-rata tinggi badan
mahasiswa adalah 170cm dan berat badan 70 kg. Seorang peneliti ingin
melakukan penelitian mengenai tinggi badan dan berat badan yang di
ambil dari 20 mahasiswa secara acak. Berdasarkan 20 data mahasiswa
di atas, ujilah :
1. Apakah benar jika ada seorang dosen yang mengatakan bahwa
rata-rata tinggi mahasiswa paling rendah adalah 170cm?
2. Apakah benar jika ada mahasiswa yang mengatakan bahwa rata-
rata berat badan mahasiswa paling tinggi 70 kg?
3. Apakah rata-rata tinggi badan dan berat badan pada penelitian saat
ini masih sama dengan penelitian sebelumnya?
80
Korelasi
Apa itu korelasi?
Korelasi bisa diartikan sebagai “hubungan”. Istilah korelasi berkembang
jika didefinisakan dalam ilmu statistika. Korelasi merupakan salah satu
teknik analisis dalam statistik yang digunakan untuk mencari hubungan
antara dua variabel yang bersifat kuantitatif. Hubungan dua variabel
tersebut mungkin bisa terjadi karena adanya hubungan sebab akibat atau
karena kebetulan saja. Jadi secara umum gambaran korelasi adalah
sebagai berikut:
Digunakan untuk menganalisis atau mengukur keeratan hubungan
linier antara dua peubah atau lebih
Koefisien korelasi sering dinotasikan dengan r dan nilainya berkisar
antara -1 dan 1
Nilai r yang mendekati 1 atau -1 menunjukkan semakin erat hubungan
linier antara kedua peubah tersebut. Nilai r yang mendekati nol
menggambarkan hubungan kedua peubah tidak linier.
Tanda (+) / (-) menggambarkan arah hubungan
o (+) searah;
o (-) berlawanan arah
Berikut ini adalah gambar kemungkinan nilai korelasi
81
Korelasi
Jika data yang kita miliki adalah data sampel maka tentunya diperlukan
pengujian hipotesis untuk membuktikan bahwa populasinya berkorelasi
atau tidak. bentuk hipotesis dalam korelasi adalah sebagai berikut:
Hipotesis pada uji t satu sampel
Korelasi Pearson
Korelasi pearson digunakan untuk mengukur hubungan dua atau lebih
peubah dengan tipe data peubah tersebut berskala kontinyu( interval atau
rasio). Metode ini harus memenuhi asumsi normalitas bila ingin
melakukan uji hipotesis. Namun, jika kepentingan kita hanya sebatas
untuk mengetahui nilai koefisien korelasinya saja maka asumsi normalitas
diabaikan.
Adapun untuk sintaks korelasi pearson adalah sebagai berikut:
cor.test(a,b,alternative="...........",method="pearson",conf.level=....)
a,b merupakan data a less = uji sisi kiri Nilai tingkat kepercayaan
dan data b yang greater = uji sisi kanan misalnya 95 % maka diisi
dikorelasikan dengan angka 0.95
two.sided = uji dua sisi
shapiro.test(x)
82
Korelasi
Contoh 1
Sebagai ilustrasi perhitungan koefisien korelasi, berikut ini data tingkat
kematian (death rate) dan tingkat perceraian (divorce rate) pada tahun
1985 untuk 9 daerah bagian di Amerika Serikat. Pada data ini ingin dilihat
apakah ada hubungan antara kematian dan perceraian di Amerika Serikat
pada tahun 1985?
Jumlah Jumlah
Daerah Kematian per Perceraian
1000 per 100
Penduduk Penduduk
Mountain 6,9 7,0
Pasific 7,7 5,4
West South Central 7,9 7,0
East North Central 8,9 4,6
South Atlantic 9,0 5,2
West North Central 9,2 4,2
East South Central 9,3 5,7
New England 9,3 3,9
Mid Atlantic 9,9 3,7
Sumber data: Juanda (2009), Ekonometrika Pemodelan dan Pendugaan
Pada data di atas yang ingin dilihat adalah apakah ada hubungan atau
tidak sehingga jenis hipotesis yang tepat pada kasus ini adalah hipotesis
dua sisi.
Hipotesis:
H0 : ρ = 0 tidak ada korelasi antara perceraian dengan kematian
H1 : ρ ≠ 0 ada korelasi antara perceraian dengan kematian
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data
83
Korelasi
Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut
Output:
data: b
W = 0.91395, p-value = 0.3445
Hasil analisis:
Pada uji asumsi normalitas, jika p-value<alpha maka data tidak menyebar
normal tetapi jika p-value> alpha maka data menyebar normal. Dari hasil
output dapat kita lihat bahwa p-value pada data a dan data b masing-
masing lebih besar dari alpha sehingga data a dan data b menyebar
normal. setelah kita tahu a dan b menyebar normal maka uji hipotesis
untuk korelasi pearson dapat dilakukan. Adapun sintaks untuk korelasi
pearson adalah sebagai berikut;
cor.test(a,b,alternative="two.sided",method="pearson",c
onf.level=0.95)
85
Korelasi
Output:
> cor.test(a,b,alternative="two.sided",method="pearson",
conf.level=0.95)
Pearson's product-moment correlation
data: a and b
t = -3.8278, df = 7, p-value = 0.006477
alternative hypothesis: true correlation is not equal to
0
95 percent confidence interval:
-0.9614705 -0.3493555
sample estimates:
cor
-0.8226179
Hasil analisis:
Dari hasil output, p-value = 0.006477 < alpha = 0.05 maka tolak H0
sehingga dapat disimpulkan terdapat hubungan atau korelasi antara
kematin dengan perceraian di Amerika Serikat pada tahun 1985. Hasil
output juga menunjukkan kematian dan perceraian di Amerika Serikat
pada tahun 1985 memiliki korelasi negatif yakni sebesar -0.8226179.
korelasi negatif yang cukup kuat karena mendekati satu. Dengan kata
lain, semakin tinggi tingkat perceraian maka semakin rendah tingkat
kematian atau bisa sebaliknya.
86
Korelasi
Latihan
Diambil contoh 10 mobil secara acak, kemudian dicatat jarak tempuh
yang sudah dijalani mobil (dalam ribu kilometer) dan diukur Emisi HC-nya
(dalam ppm)
Jarak Emisi
31 553
38 590
48 608
52 682
63 752
67 725
75 834
84 752
89 845
99 960
Hitung nilai korelasi !
87
Regresi
Analisis regresi dalam statistika adalah salah satu metode untuk
menentukan hubungan sebab akibat antara satu variabel dengan
variabel-variabel lain. Dengan kata lain, analisis regresi dapat digunakan
untuk melihat pengaruh satu variabel X atau lebih dari satu varibel X
(variabel bebas) terhadap suatu variabel Y (varibel tidak bebas).
Misalnya, kita ingin melihat pengaruh tinggi badan(cm) terhadap berat
badan (kg). Jika dilihat dari jumlah peubah bebasnya maka analisis
regresi terbagi dua yakni, regresi lienar sederhana dan regresi linear
berganda. Analisis regresi dapat juga dimanfaatkan untuk memprediksi
nilai Y dari X.
Y = β0 + β1 X + ε
Keterangan:
Y = peubah bebas
β0 = intersep(nilai Y jika X nya sama dengan 0)
β1 = slope (nilai yang menggambarkan pengaruh X terhadap Y)
X = peubah tak bebas
ε = error dari model
88
Regresi
Contoh 1
Suatu penelitian ingin mengetahui pengaruh tinggi badan(cm) terhadap
berat badan (kg) manusia di suatu daerah. Pada penelitian ini, diambil
sampel secara acak sebanyak 15 orang di daerah tersebut. Dimisalkan
tinggi badan sebagai x dan berat badan y.
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data
Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut
89
Regresi
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.
x=regresi_linear_sederhana$tinggi
y=regresi_linear_sederhana$berat
model=lm(y~x)
summary(model)
90
Regresi
Output:
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-2.9047 -2.0453 -0.2000 0.4984 10.5638
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -61.55304 8.78578 -7.006 9.26e-06 ***
x 0.81969 0.05829 14.063 3.05e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’
1
Interpretasi Hasil:
Uji koefisien regresi
Uji koefisien dilakukan untuk melihat apakah ada pengaruh signifikan
variabel tinggi badan(X) terhadap berat badan(Y)?.
Hasil analisis:
Dari hasil analisis diperoleh nilai p-value koefisien X sebesar
3.05e-09 lebih kecil dari alfa 0.05. karena nilai p-value < 0.05 maka
tolak H0. Dengan demikian, dapat kita simpulkan bahwa terdapat
pengaruh tinggi badan terhadap berat badan dengan tingkat
keyakinan sebesar 95%.
91
Regresi
Koefisien determinasi
Koefisien determinasi adalah sebagian dari total variasi dalam variabel
dependen yang dijelaskan oleh variasi dalam variabel independen.
Koefisien determinasi juga disebut R-squared dan dilambangkan
sebagai R2. Hasil Output menunjukkan bahwa R-squarednya sebesar
0.9383 atau 93.83%. dengan demikian, 93.83 % dari variasi berat
badan barang dijelaskan oleh variasi tinggi badan, sisanya dijelaskan
variabel lain yang tidak masuk ke dalam model.
Model regresi
Dari hasil output diperoleh model regresi yang menghubungkan
variabel tinggi badan (X) dengan variabel berat badan (Y) secara
linear. Modelnya sebagai berikut:
Dari model di atas dapat kita lihat bahwa nilai slope atau koefisien X
nya sebesar 0.81969. angka ini menunjukkan bahwa setiap kenaikan
1 cm tinggi badan maka rata-rata berat badan akan naik sebesar
0.81969 kg. Pada model tersebut juga diperoleh intersep sebesar
-61.55304. angka ini menunjukkan bahwa ketika X nya sama dengan
0 maka nilai Y nya sebesar -61.55304. Jika dilihat dari kasus ini maka
sebenarnya nilai intersepnya tidak punya makna karena cakupan
populasi yang kita bicarakan pasti mempunyai tinggi dan tidak mungkin
sama dengan 0 cm. Jadi, kita tidak perlu memaksakan untuk
meginterpretasikan nilai intersep jika tak bermakna.
Prediksi
Prediksi dalam analisis regresi bisa dilakukan dengan syarat X yang
kita ingin prediksi nilai Y nya masih dalam selang nilai-nilai X pada data
yang kita milki. Jadi, jika kita ingin memprediksikan berat badan dari
nilai tinggi badan tertentu maka sebaiknya nilai tinggi badan tersebut
masih dalam selang data tinggi badan sebelumnya. Misalnya, kita ingin
memprediksikan nilai berat badan jika tinggi badannya sebesar 168
cm. Sintaksnya adalah:
92
Regresi
Output:
fit lwr upr
1 76.15436 68.32362 83.98511
Hasil output menunjukkan bahwa jika tinggi badan sebsar 168 cm maka
rata-rata berat badan sebesar 76.1546 kg dengan dugaan prediksi
terendahnya 68.32362 kg dan dugaan prediksi tertingginya sebesar
83.98511 kg.
Y = β0 + β1 X1 + β1 X2 + ⋯ + βn Xn + ε
Keterangan:
Y = peubah bebas
β0 = intersep(nilai Y jika X nya sama dengan 0)
βn = slope untuk Xn
Xn = peubah tak bebas ke n
ε = error dari model
Berikut ini adalah contoh gambar model regresi linear berganda dengan
dua variabel bebas.
93
Regresi
Contoh 2
Seorang peneliti ingin melihat pengaruh skor tes kecerdasan dan
frekuensi membaca terhadap nilai ujian siswa. Pada kasus ini diambil 45
siswa untuk dijadikan sampel. Dimisalkan skor tes kecerdasan dengan
X1, frekuensi membaca dengan X2, dan nilai ujian siswa sebagai Y.
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data
Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut
94
Regresi
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.
x1=regresi_linear_berganda$kecerdasan
x2=regresi_linear_berganda$membaca
y=regresi_linear_berganda$nilai
model=lm(y~x1+x2)
summary(model)
95
Regresi
Output:
Call:
lm(formula = y ~ x1 + x2)
Residuals:
Min 1Q Median 3Q Max
-7.034 -3.358 -1.566 2.906 18.174
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 32.38098 15.26494 2.121 0.03984 *
x1 0.54716 0.17661 3.098 0.00347 **
x2 0.09453 0.10147 0.932 0.35690
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Interpretasi Hasil:
Uji koefisien regresi
Uji koefisien regeresi dilakukan untuk melihat apakah ada pengaruh
signifikan pada masing-masing variabel bebasnya terhadap variabel
tidak bebas?
Koefisien β1
hipotesis nol dan alternatif adalah sebagai berikut:
96
Regresi
Koefisien β2
hipotesis nol dan alternatif adalah sebagai berikut:
Uji simultan
Uji simultan digunakan untuk melihat hubungan linear varibel bebas
secara simultan (bersama-sama) terhadap variabel tak bebasnya.
Dalam hal ini, ingin pengaruh skor tes kecerdasan dan frekuensi
membaca secara bersama-sama terhadap nilai ujian siswa.
hipotesis nol dan alternatif adalah sebagai berikut:
Hasil analisis:
Dari hasil analisis diperoleh nilai p-value sebesar 0.007228 lebih kecil
dari alfa 0.05. karena nilai p-value < 0.05 maka tolak H0. Dengan
demikian, dapat kita simpulkan bahwa minimal ada satu variabel tak
bebas yang berpengaruh terhadap variabel bebas dengan tingkat
keyakinan sebesar 95%.
97
Regresi
Koefisien determinasi
Koefisien determinasi adalah sebagian dari total variasi dalam variabel
dependen yang dijelaskan oleh variasi dalam variabel independen.
Koefisien determinasi juga disebut R-squared dan dilambangkan
sebagai R2. Hasil Output menunjukkan bahwa R-squarednya sebesar
0.2092 atau 20.92%. dengan demikian, 20.92 % dari variasi nilai ujian
siswa dijelaskan oleh variabel-variabel bebasnya, sisanya dijelaskan
variabel lain yang tidak masuk ke dalam model.
Model regresi
Dari hasil output diperoleh model regresi yang menghubungkan skor
tes kecerdasan (X1) dan frekuensi membaca (X2) terhadap nilai ujian
siswa (Y) secara linear. Modelnya sebagai berikut:
Dari model di atas dapat kita lihat bahwa nilai slope atau koefisien X1
nya sebesar 0.54716. angka ini menunjukkan bahwa setiap kenaikan
1 satuan skor tes kecerdasan maka rata-rata nilai siswa akan naik
sebesar 0.54716 satuan. Pada model tersebut juga diperoleh nilai
slope atau koefisien X2 nya sebesar 0.09453. angka ini menunjukkan
bahwa setiap kenaikan 1 satuan frekuensi membaca maka rata-rata
nilai siswa akan naik sebesar 0.09453 satuan. Kenaikan nilai siswa
sebesar 0.09453 sangatlah kecil karena pada hasil uji koefisien regresi
menunjukkan bahwa frekuensi membaca tidak berpengaruh signifikan
terhadap nilai ujian siswa. Kemudian diperoleh intersep sebesar
32.38098. angka ini menunjukkan bahwa ketika X1 dan X2 nya sama
dengan 0 maka nilai Y nya sebesar 32.38098.
98
Regresi
Latihan
Data tentang kemampuan kerja, pemahaman tugas, motivasi dan
produktivitas kerja
responden x1 x2 x3 y
1 60 59 67 56
2 31 33 41 36
3 70 70 71 71
4 69 69 70 68
5 50 48 49 47
6 30 29 33 34
7 40 48 51 50
8 55 54 60 60
9 58 61 59 61
10 26 34 31 29
11 78 76 75 77
12 45 43 43 46
13 47 56 46 50
14 34 42 43 39
15 57 58 56 56
Sumber data: 2004 Prof. Dr. Sugiyono, metode penelitian bisnis
X1= kemampuan kerja
X2= pemahaman tugas
X3= motivasi
Y= produktivitas kerja
Pada data ini ingin dilihat pengaruh X1,X2, X3 terhadap Y !
99
R commander
Apa itu Rcommander?
Kita telah mempelajari penggunaan R.studio berbasis perintah
(command driven), namun adakalanya pengguna pemula sulit untuk
mengingat serangkaian perintah ataupun formula. Hal ini sudah
diantisipasi oleh para contributor R dengan menyediakan penggunaan
Graphical User Interface (GUI) yang memudahkan pengguna tanpa harus
mengingat serangkaian perintah-perintah. GUI untuk R dalam 1 paket
yang bernama Rcmdr yang berisikan GUI untuk statistika dasar dan
statistika lanjut, meliputi diantaranya pemodelan uji hipotesis, distribusi
(normal, F, binomial, t, Chi-square, poisson), graph (histogram,
scatterplot, boxplot, dan lain lain), statisik deskriptif, pemodelan linier,
generalized-linear, dsb.
Instalasi
Instalasi R Commander
Jika anda terkoneksi dengan Internet dengan melalui Menu
R.studio. fokuslah pada jendela R.studio pada kanan bawah
Packages>install . R secara otomatis akan meminta anda untuk
memilih mirror tempat Rcmdr akan didownload dan diinstal.
100
R commander
Tampilan dan menu R
Jendela A
Jendela B
Jendela C
Pada Rcmdr, terdiri dari tiga sub window (layar) utama, yakni:
A. jendela A yaitu Script Window dimana pada layar menampilkan
perintah (command) R. Perintah dalam bagian ini dapat di edit dan di
eksekusi dan di eksekusi ulang (dengan menekan tobol submit)
B. jendela B yaitu Output Window dimana pada layar menampilkan hasil
perhitungan yang di eksekusi dari Script Window
C. jendela C yaitu Warning Window dimana pada layar menampilkan
peringatan seperti pesan error, data missing, atau adanya paket yang
belum diinstall
101
R commander
Menu dan Sub menu dari R commander
menu keterangan
File Loading, menyimpan file script,
menyimpan output dan R
workspace, keluar aplikasi
edit Cut,copy ,paste,editing konten dari
script dan output windows,
data Membaca dan memanipulasi data,
import data dari file ber-ektensi
Text,SPSS, minitab, STATA
statistics alat analisis statistika dasar
graphs membuat grafik statistic dasar,
seperi histogram, scatterplot,
Boxplot, Pie chart, 3D dan lain lain.
102
Pengantar
R commander
R
Memanggil data yang ada di R
Pada menu utama, pilih data yang tersedia Data> Data in
packages>List data set in packages, misalkan kita ingin mengambil data
road dengan menuliskan pada windows script data(road). Maka data road
sudah termasuk dalam active data set yang sewaktu-waktu dapat
digunakan manakala diperlukan. Untuk menambahkan data lainnya
dalam active data set, cukup menuliskan perintah data(nama data) yang
diinginkan
103
R commander
104
R commander
Mencari nilai Statistik
Misalkan kita ingin melihat korelasi antara dua variable deaths dan fuel
dalam data(road)¸ maka pilih Statistics> Summaries> Correlation test>
(Pilih variabel dan jenis korelasinya, misal) Pearson product-moment.
105
R commander
Latihan.
1. Panggillah data dari file
Latihan<latihan_analisis_regresi_berganda.xlsx!
a. Keluarkan grafik scatter plot untuk setiap
peubah x terhadap peubah y
b. Cari nilai korelasi setiap peubah
c. Regresikan peubah x1,x2,x3 terhadap y
106