0% menganggap dokumen ini bermanfaat (1 suara)
873 tayangan109 halaman

Modul Pelatihan R PDF

Dokumen tersebut membahas tentang pengantar R dan beberapa konsep dasar seperti tipe data, vektor, dan matriks. Secara ringkas, dokumen tersebut menjelaskan bahwa: 1. R merupakan paket analisis data open source yang memiliki berbagai kelebihan seperti koleksi library yang luas dan fleksibilitas pemrograman. 2. Terdapat beberapa tipe data dasar dalam R seperti logical, numeric, integer, complex, dan string. 3. V

Diunggah oleh

Oka Lakoro
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (1 suara)
873 tayangan109 halaman

Modul Pelatihan R PDF

Dokumen tersebut membahas tentang pengantar R dan beberapa konsep dasar seperti tipe data, vektor, dan matriks. Secara ringkas, dokumen tersebut menjelaskan bahwa: 1. R merupakan paket analisis data open source yang memiliki berbagai kelebihan seperti koleksi library yang luas dan fleksibilitas pemrograman. 2. Terdapat beberapa tipe data dasar dalam R seperti logical, numeric, integer, complex, dan string. 3. V

Diunggah oleh

Oka Lakoro
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 109

DAFTAR ISI

1. Pengantar ................................................................. 1
2. Tipe Data .................................................................. 7
3. Vektor ...................................................................... 10
4. Matrix ...................................................................... 17
5. List ........................................................................... 26
6. Data Frame ............................................................... 29
7. Manajemen Data ...................................................... 32
8. Diagram atau Grafik .................................................. 38
9. Uji T .......................................................................... 62
10. Korelasi .................................................................... 81
11. Analisis Regresi ......................................................... 88
12. R Commander ........................................................... 100
Pengantar R
Apa itu R?
R merupakan salah satu paket analisis data open source yang dapat
diperoleh secara cuma-cuma di situs http://www.r-project.org/ atau
http://cran.rproject.org/. R termasuk bahasa S. Ada dua program utama
yang ditulis dengan bahasa S, yaitu S-Plus yang dikembangkan secara
komersial dan R yang dikembangkan melalui konsep open source. Beda
keduanya terletak pada antarmuka/interface penggunanya. S-Plus telah
dilengkapi dengan menu yang sangat lengkap yang sering disebut
sebagai advanced Grapical User Interface (GUI), sedangkan R lebih
mengandalkan Command Line Interface (CLI) dari pada menu.
Belakangan banyak kontributor yang menyumbang paket menu interface
untuk R. Paket program R ini sudah dilengkapi banyak kemampuan
internal untuk menganalisis data dan menampilkan grafik sehingga R bisa
dikatagorikan sebagai paket pengolahan data (paket statistika). Dewasa
ini R semakin populer dipergunakan baik di bidang akademik maupun
industri.

Kelebihan R
Beberapa kelebihan R yang menjadi alasan banyak statistisi
memilihnya sebagai paket aplikasi diantaranya:
Ada koleksi program analisis data, yang disebut library atau pustaka
yang sangat luas seperti statistika deskriptif, regresi, pemodelan
statistika (baik linear maupun nonlinear), anova dan multivariat, atau
untuk tujuan khusus seperti Geo Statistika, Pengolahan Citra (Image
Processing), bahkan untuk pengembangan Interface atau antarmuka
grafis (GUI) R itu sendiri.

1
Pengantar R
Kemampuan pemrograman (bahasa S) dapat dikembangkan secara
fleksibel untuk kepentingan khusus yang lebih lanjut.
Variasi penampilan grafiknya sangat banyak dan berkualitas tinggi
baik penampilan di layar monitor maupun dalam bentuk cetak di atas
kertas.
R termasuk pemrograman yang berorientasi pada objek (object
oriented programming). Semua hasil, baik berupa variabel, konstanta
maupun fungsi, oleh R disimpan dalam bentuk objek.
Keuntungannya adalah apabila apa yang telah dikerjakan R saat ini
dikemudian hari diperlukan, maka R dapat mengambilnya tanpa
harus melakukan perhitungan ulang dari awal. Dengan demikian
proses untuk objek yang sama menjadi lebih cepat. Dalam mencari
objek yang diperlukan, mula-mula R akan melihat daftar objek yang
masih ada di memori, apabila tidak ditemukan, maka R akan
melanjutkan pencariannya ke hardisk yang semuanya dilakukan
secara otomatis tanpa dirasakan oleh penggunanya.
 R juga termasuk bahasa terinterpretasi/ interpreted, bukan
terkompilasi/ compilled. Dalam bahasa terinterpretasi setiap
ekspresi/ perintah tunggal dievaluasi dan dieksekusi dengan
segera. Sedangkan dalam bahasa kompilasi (C dan Fortran
misalnya), maka keseluruhan program harus dikompilasi oleh
sebuah kompiler yang menerjemahkan bahasa C atau Fortran
tadi ke dalam bahasa mesin. Keunggulan bahasa interpretasi ini
adalah fleksibilitasnya untuk dikembangkan secara bertahap,
sedangkan kelemahannya dia memerlukan lebih banyak
memori. Namun dengan kemajuan perangkat keras komputer,

2
Pengantar R
memori dan kecepatan proses tidak lagi merupakan masalah
yang serius.

 R berbasis S yang merupakan bahasa dasar dari paket


komersial S-Plus. Kedua bahasa tersebut sangat kompatibel.
Hampir semua skrip yang dihasilkan dengan program R akan
dapat dijalankan pada paket S-Plus dan sebaliknya. Sebagian
besar panduan atau manual pemrograman untuk S-Plus dapat
dipergunakan sebagai panduan untuk R.
 R termasuk program open sources (OSS-R: Open Source
Software-R) yang multiplatform (tersedia pada sistem operasi
Windows, Unix dan Linux) dan dapat diperoleh pada Situs
Projek-R. Sebagai open source, skrip programnya dapat
diakses, dimodifikasi dan dikembangkan sesuai keperluan dan
tingkat kemampuan pengguna. R juga didukung oleh banyak
ahli statistika dari berbagai universitas di seluruh dunia.

3
Pengantar R
Instalasi R
Download dan Install RStudio
Beberapa langkah menginstall R diantaranya:
1. Download R di link cran.r-project.org/.

2. Setelah R (R3.3.2.exe) dijalankan, selanjutnya download RStudio di


www.rstudio.com/products/rstudio/download/.

4
Pengantar R
3. Jalankan Rstudio.

Install packages Rstudio


Packages di Rstudio dapat diinstlall untuk mendukung analisis
statistika dengan langkah-langkah sebagai berikut:
1. Jalankan Rstudio.
2. Beberapa cara install packages diantaranya:
a. Jika terhubung ke internet: install.packages(“namapackage”)
b. Jika sudah melakukan download pada binary (*.zip):
install.packages(“drive:/namafile.zip”,repos=NULL)
c. Menggunakan menu:

Tools > Install packages(s)… >

5
Pengantar R
Misalkan ingin menginstall packages regresi dan komputer
berhubungan dengan internet.

6
Tipe data
Data pada R terbagi atas beberapa tipe yakni, logical, numeric, integer,
complex, dan string/character. Adapun untuk penjelasan lebih
lengkapnya adalah sebagai berikut.

Logical
Logical merupakan tipe data yang sering dibuat melalui perbandingan
antar objek yang menghasilkan nilai kebenaran TRUE atau FALSE.

x=1
y=2
z=x>y
print(z)
class(z)

Output:

> print(z)
[1] FALSE # memberikan pernyataan salah karena
seharusnya x<y
> class(z)
[1] "logical" # memberikan pernyataan bahwa z adalah
Tipe data logical

Numeric
Contoh sintaks pada tipe data numerik di R adalah sebagai berikut
v=2.35
class(v)
Output:
> class(v)

[1] "numeric" # memberikan pernyataan bahwa v adalah


Tipe data numeric

7
Tipe Data
Integer
Contoh sintaks pada tipe data integer adalah sebagai berikut

q=1:5
q
class(q)

r=2L
class(r)

Output:

> q
[1] 1 2 3 4 5
> class(q)
[1] "integer" # memberikan pernyataan bahwa q adalah
Tipe data integer

> r=2L
> class(r)
[1] "integer" # memberikan pernyataan bahwa r adalah
Tipe data integer

Complex
Contoh sintaks pada tipe data complex adalah sebagai berikut
b=3+7i
class(b)
Output:
> class(b)
[1] "complex" # memberikan pernyataan bahwa v adalah
Tipe data integer
8
Tipe Data
String
Objek string dalam R biasanya disebut dengan character. Contoh
sintasknya adalah sebagai berikut

k = "hai sabil"
k
class(k)

Output:

> k
[1] "hai sabil"

> class(k)
[1] "character" # memberikan pernyataan bahwa k
adalah tipe data characater

9
Vektor
Bagaimana membuat vektor di R ?
Vektor merupakan serangkaian elemen (anggota) yang berasal dari jenis
data yang sama. Vektor umumnya dibuat dengan menggunakan fungsi
c(). Sebagai contoh sebagai berikut:
Misalnya kita ingin membuat vektor yang mengandung tiga nilai numerik
seperti 2,3, dan 5. Atau misalnya ingin membuat vektor yang terdiri dari
anggotanya berjenis string. Maka contoh sintaksnya adalah:

v=c(2,3,5)
v
W=(“aku” , ”sangat” , ”cinta” , ”kamu”)
w
Output:

> v
[1] 2 3 5
> w
[1] “aku” ”sangat” ”cinta” ”kamu”

Sering kali kita ingin mengetahui ukuran vektor atau jumlah anggota yang
ada di dalam vektor. Sebagai contoh kita ingin menghitung jumlah
anggota pada vektor v di contoh sebelumnya.

Length(v)
Length(w)

Output:

> length(v)
[1] 3
> length(w)
[1] 4

10
Vektor
Vektor di R juga bisa dibuat dengan menggunakan operasi :

x=1:7
x
y=5:-5
y
p=c(1:7)
p
q=c(-5:5)
q

Output:

> x
[1] 1 2 3 4 5 6 7
> y
[1] 5 4 3 2 1 0 -1 -2 -3 -4 -5
> p
[1] 1 2 3 4 5 6 7
> q
[1] 5 4 3 2 1 0 -1 -2 -3 -4 -5

Vektor di R dapat juga dibuat dengan menggunakan fungsi seq().Fungsi


seq() bisa digunakan untuk membuat vektor yang anggotanya dari angka
tertentu sampai angka tertentu dimana jarak antara satu angka dengan
angka berikutnya kita tentukan sendiri. Tidak hanya itu, fungsi seq() juga
bisa digunakan untuk membuat vektor yang anggotanya dari angka
tertentu sampai angka tertentu dimana ukuran vektor (jumlah
anggotanya) kita tentukan sendiri. Untuk lebih jelasnya akan diperlihatkan
pada sintaks berikut.

11
Vektor
h=seq(1, 2, by=0.2) # vektor dengan jarak tertentu
h
j=seq(1, 5, length.out=4) # vektor dengan jumlah
anggota tertentu
j
Output:

> h
[1] 1 1.2 1.4 1.6 1.8 2.0
> j
[1] 1.0000 2.3333 3.6667 5.0000

Bagaimana mengambil dan menghilangkan


anggota vektor di R ?
Anggota vektor di R dapat diambil atau dihilangkan sesuai dengan
keinginan kita. Misalnya pada vektor v=(5,6,9,10,13) kita ingin mengambil
atau menghilangkan anggota vektor pada urutan 4 berarti anggota yang
dimaksud adalah 10. Sebagai contoh seperti berikut.

x=c(5,6,9,10,13)
x
x[4] # mengambil anggota ke empat pada vektor x

x[-4] # menghilangkan anggota ke empat pada vektor x

x[c(1,3)] # mengambil anggota ke 1 dan ke 3 pada vektor x

x[c(-1,-3)] # menghilangkan anggota ke 1 dan ke 3 pada vektor x

x[1:3] # mengambil anggota ke 1 sampai anggota ke 3 pada vektor x

x[-1:-3] # menghilangkan anggota ke 1 sampai anggota ke 3 pada


vektor x

x[c(TRUE,FALSE,FALSE,TRUE,FALSE)] # mengambil anggota ke


1 dan ke 4 dengan
menggunakan logika

12
Vektor
Output:

> x
[1] 5 6 9 10 13

> x[4]
[1] 10

> x[-4]
[1] 5 6 9 13

> x[c(1,3)]
[1] 5 9

> x[c(-1,-3)]
[1] 6 10 13

> x[1:3]
[1] 5 6 9

> x[-1:-3]
[1] 10 13

> x[c(TRUE,FALSE,FALSE,TRUE,FALSE)]
[1] 5 10

13
Vektor
Bagaimana memodifikasi vektor di R ?
Memodifikasi dalam hal ini adalah mengganti atau mengubah sebagian
atau seluruh anggota yang ada pada vektor tertentu dengan anggota
baru. Contohnya yaitu;

X=c(-2,-1,0,1,2)
x
X[2]=0 # mengganti anggota ke 2 dengan angka 0
x
x[x<0]=5 # mengganti anggota yang lebih kecil dari 0
dengan angka 5
x

Output:
> x
[1] -2 -1 0 1 2
> x
[1] -2 0 0 1 2
> x
[1] 5 0 0 1 2

Bagaimana menghilangkan suatu vektor ?


x=c(-2,-1,0,1,2)
x=NULL
x[4] # misalnya kita ingin mengambil anggota ke empat
x

Output:
> x
NULL

14
Vektor
Aritmatika Vektor
Operasi aritmatika vektor dilakukan elemen per elemen. Misalkan, kita
memiliki dua vektor x dan y yang berukuran sama, maka dapat dilakukan
operasi penjumlahan, pengurangan, perkalian, dan pembagian elemen.
Sebagai berikut :

x=c(-2,-1,0,1,2); y=c(1,3,5,7,9)
#operasi penjumlahan dua vektor
a=x+y
a # cetak vektor baru a
#operasi pengurangan dua vektor
b=x-y
b # cetak vektor baru b
#operasi perkalian dua vektor
d=x*y
d # cetak vektor baru d
#operasi pembagian dua vektor
e=x/y
e # cetak vektor baru e

Output:
> a
[1] -1 -2 5 8 10
> b
[1] -3 -4 -5 -6 -7
> d
[1] -2 -3 0 7 18
> e
[1] -2 -0.3333333 0 0.1428571 0.2222222

15
Vektor
QUIZZ
Diketahui peubah x=c(-2,4,0,1,2,5,7,9);y=c(1,2)
a. Lakukanlah operasi penjumlahan, pengurangan,
perkalian dan pembagian
b. Ambil elemen di x yang lebih kecil dari 7
kemudian lakukan poin a
Output:
c. Buatlah sintaks untuk mencari indeks elemen
vector x yang lebih kecil dari 3 dan elemen yang
lebih besar dari 5

16
Matriks
Matriks merupakan kumpulan bilangan, simbol, atau ekspresi, yang
disusun menurut baris dan kolom. Isi di dalam suatu matriks disebut
dengan elemen atau anggota.

Bagaimana membuat matriks di R ?


Matriks biasanya dibuat dengan menggunkan fungsi matrix(). Dimensi
matriks dapat kita tentukan dengan menggunakan argumen nrow untuk
jumlah baris dan ncol untuk jumlah kolom. Untuk lebih jelasnya akan
ditampilkan pada sintaks berikut.

M=matrix(1:9, nrow=3, ncol=3) # membuat matriks yang


anggotanya berisikan angka
1 sampai 9 dengan jumlah
baris 3 dan jumlah kolom 3
M
N=matrix(1:9, nrow=3, ncol=3, byrow=TRUE) # matriks
yang urutan anggotanya
berdasarkan baris
N

Output:

> M
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9

> N
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9

17
Matriks
Matriks juga bisa dibuat dari vektor tertentu. Misalnya kita ingin membuat
Matriks dengan jumlah baris 2 dan jumlah kolom 3 maka contoh
sintaksnya sebagai berikut.

M=matrix(c(1,3,5,7,9,11), nrow=2, ncol=3)


M
#atau
P= c(1,3,5,7,9,11)
N=matrix(P, nrow=2, ncol=3)
N

Output:

> M
[,1] [,2] [,3]
[1,] 1 5 9
[2,] 3 7 11

> N
[,1] [,2] [,3]
[1,] 1 5 9
[2,] 3 7 11

Matriks juga bisa diberi label atau nama pada baris dan kolomnya.

M=matrix(1:9, nrow=3, ncol=3, dimnames


=list(c("X","Y","Z"),c("A"
,"B","C")))
M
#untuk memanggil nama baris atau nama kolom:
colnames(M)
rownames(M)

18
Matriks
Output:

> M
A B C
X 1 4 7
Y 2 5 8
Z 3 6 9

> colnames(M)
[1] "A" "B" "C"
> rownames(M)
[1] "X" "Y" "Z"

Matriks juga dapat dibuat di R dengan menggunakan fungsi cbind() dan


rbind(). Sintaksnya adalah sebagai berikut:

A=cbind(c(1,2,3),c(4,5,6))
B=rbind(c(1,2,3),c(4,5,6))
Output:
> A
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 3 6
> B
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6

19
Matriks
Bagaimana mengambil atau menghilangkan
anggota pada matriks di R ?
Anggota-anggota pada matriks dapat diambil atau dihilangkan sesuai
dengan keinginan kita. Pada penerapannya, terkadang kita ingin
menyeleksi variabel tertentu pada data yang berbentuk matriks dengan
tujuan tertentu. Kemugkinan lain kita ingin menghilangkan variabel atau
pengamatan tertentu pada data berbentuk matriks karena tidak
diperlukan. Contohnya sebagai berikut.

x=matrix(1:9, nrow=3, ncol=3)


x
x[2,3] # mengambil baris ke 2 dan kolom ke 3
x[2,] # mengambil baris ke 2
x[,3] # mengambil kolom ke 3
x[c(1,2),c(1,3)] # mengambil baris ke 1 dan ke 2 ,
kolom ke 1 dan ke 3
x[c(3,2),] # mengambil baris ke 3 dan ke 2
x[-2,] # menghilangkan baris ke 2
x[,-3] # menghilangkan kolom ke 3

Output:

> x
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9

> x[2,3]
[1] 8

> x[2,]
[1] 2 5 8

> x[,3]
[1] 7 8 9

20
Matriks
Lanjutan Output:

> x[c(1,2),c(1,3)]
[,1] [,2]
[1,] 1 7
[2,] 2 8
> x[c(3,2),]
[,1] [,2] [,3]
[1,] 3 6 9
[2,] 2 5 8
> x[-2,]
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 3 6 9
> x[,-3]
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 3 6

Bagaimana memodifikasi elemen matriks di R


Memodifikasi dalam hal ini adalah mengganti atau mengubah sebagian
atau seluruh anggota yang ada pada matriks tertentu dengan anggota
baru. Contohnya yaitu;
x=matrix(1:9, nrow=3, ncol=3)
x
x[2,2]=10 # mengubah baris ke 2 dan kolom ke 2 dengan
angka 10
x
x[x<5]=0 # mengubah semua anggota matriks yang lebih
kecil dari 5 dengan angka 0
x

21
Matriks
Output:

> x
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
> x[2,2]=10
> x
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 10 8
[3,] 3 6 9
> x[x<5]=0
> x
[,1] [,2] [,3]
[1,] 0 0 7
[2,] 0 10 8
[3,] 0 6 9

Operasi Matriks
Operasi matriks pada dasarnya hampir sama dengan operasi aritmatika
di vektor, hanya saja operasi aritmatika di matriks harus mengikuti aturan
tertentu yaitu menyesuaikan jumlah baris dan kolom

> m1=matrix(1:10,nrow=2)
> m2=matrix(seq(5.5,10,by=0.5),nrow=2)

> m1
> m2

> m1+m2
> m1-m2
> m1*m2 #perkalian antara elemen matriks
> m1%*%m2 #perkalian antara matriks m125*m225
> m1%*%t(m2) #lakukan transpose pada m2, t()
perkalian antara matriks m125*m252
> m1/m2 #pembagian antara elemen matriks
22
Matriks
output:

> m1
[,1] [,2] [,3] [,4] [,5]
[1,] 1 3 5 7 9
[2,] 2 4 6 8 10
> m2
[,1] [,2] [,3] [,4] [,5]
[1,] 5.5 6.5 7.5 8.5 9.5
[2,] 6.0 7.0 8.0 9.0 10.0

> m1+m2
[,1] [,2] [,3] [,4] [,5]
[1,] 6.5 9.5 12.5 15.5 18.5
[2,] 8.0 11.0 14.0 17.0 20.0
> m1-m2
[,1] [,2] [,3] [,4] [,5]
[1,] -4.5 -3.5 -2.5 -1.5 -0.5
[2,] -4.0 -3.0 -2.0 -1.0 0.0
> m1*m2
[,1] [,2] [,3] [,4] [,5]
[1,] 5.5 19.5 37.5 59.5 85.5
[2,] 12.0 28.0 48.0 72.0 100.0
> m1%*%t(m2)
[,1] [,2]
[1,] 207.5 220
[2,] 245.0 260
> m1/m2
[,1] [,2] [,3] [,4] [,5]
[1,] 0.18181 0.46153 0.66666 0.82352 0.94736
[2,] 0.33333 0.57142 0.75000 0.88888 1.00000

23
Matriks
Pada pengerjaan dengan melibatkan objek matriks, biasanya terjadi
error pada saat melakukan operasi matriks, hal ini biasa terjadi jika,
dimensi dari matriks tidak bersesuaian, kelas dari objek data ternyata
bukan objek matriks. Oleh karena itu ada baiknya kita mengecek dimensi
dan kelas dari objek data. Dapat menggunakan perintah dim( ) untuk
dimensi, class( ) atau is.matrix( ) untuk mengecek tipe objek matriks

class(m1)
> class(m1)
[1] "matrix"

is.matrix(m1)
> is.matrix(m1)
[1] TRUE

dim(m1)
> dim(m1)
[1] 2 5

24
Matriks
QUIZZ
Diketahui 2 buah matiks:
m1=matrix(1:10,nrow=2)
m2=matrix(seq(5.5,10,by=0.5),nrow=2)
a. Buatlah sintaks sehingga kedua matriks mengeluarkan
output seperti di bawah ini!
m1 m2
[1,] 1 5.5
[2,] 2 6.0
[3,] 3 6.5
[4,] 4 7.0
[5,] 5 7.5
[6,] 6 8.0
[7,] 7 8.5
[8,] 8 9.0
[9,] 9 9.5
[10,] 10 10.0
b. Selesaikanlah persamaan berikut:

b=(m1Tm1)-1 m1Tm2 #T adalah transpose


# -1 adalah inverse, solve()

g= (m2Tm2-bTm1Tm2)/n-(p+1) #n banyak data


#p banyak matriks

25
List
List
Bagaimana membuat list di R ?
List adalah suatu vektor yang memiliki berbagai tipe data yang berbeda.
Komponen data suatu list terdiri dari dari vektor beranggota tunggal,
vektor beranggota ganda, bahkan bisa juga beranggota matriks. List
dapat dibuat pada R dengan menggunakan fungsi list(). Berikut ini adalah
contoh membuat list yang anggotanya numerik, string, logical, dan
integer.

x=list(2.5,"tampan",TRUE,1:3)
x

Output:

> x
[[1]]
[1] 2.5
[[2]]
[1] "tampan"
[[3]]
[1] TRUE
[[4]]
[1] 1 2 3

Informasi tipe dapat juga kita ketahui dengan menggunakan fungsi str().
Adapun sintaksnya adalah sebagai berikut:

x=list(2.5,"tampan",TRUE,1:3)
str(x)

Output:
> str(x)
List of 4
$ : num 2.5 # num = numerik
$ : chr "tampan" # chr = string
$ : logi TRUE # logi = logical
$ : int [1:3] 1 2 3 # int = integer
26
List
Panjang atau ukuran list juga dapat kita ketahui di R dengan
menggunakan fungsi length(). Adapun fungsinya adalah sebagai berikut:

x=list(2.5,"tampan",TRUE,1:3)
length(x)

Output:
> length(x)
[1] 4

List juga dapat kita dibuat dari beberapa variabel tertentu. Contoh
sintaksnya adalah sebagai berikut:

f=2.5
g="tampan"
h=TRUE
i=1:3
gabung=list(f,g,h,i)
gabung

Output:

> gabung
[[1]]
[1] 2.5
[[2]]
[1] "tampan"
[[3]]
[1] TRUE
[[4]]
[1] 1 2 3

27
List
List juga dapat dibuat dengan memberikan nama pada tiap anggotanya.
Sintaksnya adalah sebagai berikut:

x=list(2.5,"tampan",TRUE,1:3)
names(x)=c("nama1","nama2","nama3","nama4")
x

Output:

> x
$nama1
[1] 2.5
$nama2
[1] "tampan"
$nama3
[1] TRUE
$nama4
[1] 1 2 3

28
Data
DataFrame
Frame
Data Frame merupakan bentuk khusus dari list yang komponennya
memilki panjang yang sama. Komponen dalam data frame disebut
sebagai variabel atau peubah yang disusun dalam bentuk kolom
sedangkan isi dari komponen disebut observasi atau pengamatan yang
disusun dalam bentuk baris. Ketika kita megambil data dari excel,spss,
sas , atau software lain untuk diolah di R maka data akan tampil dalam
bentuk data frame. Data frame inilah yang biasanya digunakan untuk
melakukan pengolahan data. Tapi kita bisa juga membuat data frame
secara langsung di R.

Bagaimana membuat data frame di R?


Berikut ini adalah contoh sintaks membuat data frame di R dengan
menggunakan fungsi data.frame()

nama=c("sabil","pipit","shynde","ana","hasan","ary","
fadhlul","hijrah","yunus","iswan","rizal")
nilai=c(85,87,90,81,80,75,94,92,60,84,75)
laporan_nilai=data.frame(nama,nilai)
laporan_nilai

Output:

> laporan_nilai

nama nilai
1 sabil 85
2 pipit 87
3 shynde 90
4 ana 81
5 hasan 80
6 ary 75
7 fadhlul 94
8 hijrah 92
9 yunus 60
10 iswan 84
11 rizal 75

29
Data Frame
Bagaimana mengambil komponen data
frame di R?
Pada analisis data, terkadang kita hanya memerlukan beberapa variabel
untuk kita olah. Dengan kata lain, di data frame terkadang kita hanya ingin
mengambil kolom atau variabel tertentu untuk diolah. Mungkin juga baris
tertentu yang ingin kita ambil dari suatu data frame. Berikut adalah contoh
sintaks untuk mengambil komponen data frame dengan menggunakan
data frame di contoh sebelumnya dengan nama laporan_nilai.

laporan_nilai["nama"] # mengambil kolom dengan


varibel “nama”
laporan_nilai[c("nama","nilai")] # mengambil kolom
dengan varibel
“nama” dan “nilai”
laporan_nilai$nama # mengambil kolom dengan varibel
“nama”
laporan_nilai$nilai # mengambil kolom dengan varibel
“nilai”
laporan_nilai[,1] # mengambil kolom pertama
laporan_nilai[,2] # mengambil kolom kedua
laporan_nilai[3,] # mengambil baris ketiga

Output:

> laporan_nilai["nama"]
nama
1 sabil
2 pipit
3 shynde
4 ana
5 hasan
6 ary
7 fadhlul
8 hijrah
9 yunus
10 iswan
11 rizal

30
Data Frame
Lanjutan Output:

> laporan_nilai[c("nama","nilai")]
nama nilai
1 sabil 85
2 pipit 87
3 shynde 90
4 ana 81
5 hasan 80
6 ary 75
7 fadhlul 94
8 hijrah 92
9 yunus 60
10 iswan 84
11 rizal 75

> laporan_nilai$nama
[1] sabil pipit shynde ana hasan ary
fadhlul hijrah yunus iswan rizal

Levels: ana ary fadhlul hasan hijrah iswan pipit ri


zal sabil shynde yunus

> laporan_nilai$nilai
[1] 85 87 90 81 80 75 94 92 60 84 75

> laporan_nilai[,1]
[1] sabil pipit shynde ana hasan ary
fadhlul hijrah yunus iswan rizal

Levels: ana ary fadhlul hasan hijrah iswan pipit ri


zal sabil shynde yunus

> laporan_nilai[,2]
[1] 85 87 90 81 80 75 94 92 60 84 75

> laporan_nilai[3,]
nama nilai
3 shynde 90

31
Manajemen Data
Mengapa manajemen data diperlukan? Jika seandainya kita ingin
mengolah data di R studio kemudian data tersebut tersimpan di excel
tentu sangat tidak efektif bila datanya diketik ulang satu persatu ke
software R studio. Manajemen data diperlukan agar memudahkan kita
dalam menggunakan data yang sudah ada di software lain atau bisa juga
sebaliknya yakni menyimpan data di sotware lain. R studio menyediakan
fitur import data (mengambil data) dari csv, excel, spss, stata, dan sas.
Berikut ini adalah contoh import data dari excel.

Import data
Langkah pertama yang harus dilakukan adalah klik :
File ----> Import Dataset ----> From Excel

32
Manajemen Data
setelah di klik “From excel” maka akan muncul tampilan seperti gambar
di bawah ini, kemudian klik “Browse”

setelah di klik “Browse” maka akan muncul tampilan seperti gambar di


bawah ini, kemudian cari data excel yang ingin kita olah di R studio.
Misalnya data excel yang ingin kita olah adalah data dengan nama
“manajamen data”. Lalu klil “Open”

33
Manajemen Data
Setelah itu akan muncul seperti tampilan di bawah ini. excel terdiri dari
beberapa sheet. Jika kita ingin mengolah data excel kita yang berada
pada “Sheet1”, maka perhatikan lingkaran merah pada gambar di
bawah kemudian ubah menjadi “Sheet1”. Lalu klik “Import”.

Setelah di klik “import” pada gambar di atas maka akan muncul


tampilan berikut

34
Manajemen Data
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.

Perhatikan lingkaran merah pada gambar di atas! Di gambar tersebut


menunjukkan bahwa nama data yang akan kita olah adalah
manajemen_data. Jadi ketika dibutuhkan nama data yang akan kita
olah maka nama tersebut yang kita masukkan untuk pengolahannya.

Export data
Ada begitu banyak cara untuk menyimpan hasil output dari R studio ke
software lain. Tapi dalam modul ini kita hanya memberikan contoh
bagaimana cara menyimpan hasil output R studio di csv.
Export csv
Misalnya kita ingin membangkitkan 10 bilangan acak dengan
menyebar normal. sintaksnya sebagai berikut:

x=rnorm(10,5,1)
datanorm=data.frame(x)
data norm

35
Manajemen Data
Output

> datanorm
x
1 4.350645
2 3.190941
3 4.792829
4 4.464292
5 5.373125
6 5.664427
7 3.719065
8 6.299645
9 6.345545
10 4.884426

Misalnya kita ingin menyimpan outputnya di lokasi file:


"E:/JOBS/SWAN/PELATIHAN/fix1/"
Dengan nama file misalnya:
datanormal.csv
Maka sintaks untuk menyimpan output di atas adalah sebagai berikut:
write.table(datanorm, "E:/JOBS/SWAN/PELATIHAN/fix1/d
atanormal.csv",sep=";")

Setelah sintaksnya dirunning, maka data tersebut bisa kita temukan di


lokasi file sesuai dengan lokasi yang kita tuliskan di sintaks.

36
Manajemen Data
Kemudian klik file csv dengan nama “datanormal”. maka hasilnya
sebagai berikut:

37
Diagram dan Grafik
Diagram atau grafik merupakan gambar-gambar yang menunjukan
data secara visual baik berbentuk gambar maupun lambang. Kegunaan
diagram atau grafik antara lain untuk mempertegas dan memperjelas
penyajian data, mempercepat pengertian, mengurangi kejenuhan melihat
angka, menunjukkan arti secara menyeluruh.

Diagram Batang
Grafik batang merupakan grafik data berbentuk persegi panjang yang
lebarnya sama dan dilengkapi dengan skala atau ukuran sesuai dengan
data yang bersangkutan serta menyajikan data yang bersifat kategori.
Pada Rstudio digunakan fungsi barplot() untuk membuat Diagram
Batang.

barplot(x,xlab,ylab,main,names.arg,col)

Keterangan:

 x merupakan data berupa vektor ataupun matriks yang akan dibuat


ke dalam diagram batang.
 xlab merupakan nama label pada sumbu mendatar (sumbu x).
 ylab merupakan nama label pada sumbu tegak (sumbu y).
 main merupakan judul diagram.
 names.arg merupakan vektor yang berisi nama-nama yang
muncul di bawah diagram.
 col adalah pemberian warna dalam chart.

Misalkan data kriteria pendapatan beberapa alumni Statistika IPB


dengan keterangan 1=rendah, 2=sedang, dan 3=tinggi. Aad memiliki
pendapatan dengan kriteria 2, dan Dira memiliki pendapatan dengan
kriteria 1, Lida memiliki pendapatan dengan kriteria 3, Tri memiliki
pendapatan dengan kriteria 2, Vida memiliki pendapatan dengan kategori
3, dan Fadu memiliki pendapatan dengan kriteria 2.

38
Diagram dan Grafik
Berikut perintah dalam Rstudio terkait kasus diatas:

pendapatan<-c(2,1,3,2,3,2)
nama<-c("Aad","Dira","Lida","Tri","Vida","Fadu")

barplot(pendapatan,names.arg =nama,
xlab="nama",ylab="pendapatan",
col="blue",main="diagram pendapatan")

Output yang diperoleh dari perintah diatas adalah

Diagram dapat juga ditampilkan dalam bentuk mendatar yaitu dengan


menambahkan argumen horiz=TRUE dalam fungsi.

barplot(pendapatan,names.arg =nama,
xlab="bulan",ylab="pendapatan",
col="blue",main="diagram pendapatan",
horiz=TRUE)

39
Diagram dan Grafik

Terkadang dalam sebuah penelitian, ingin dibentuk diagram batang dari


frekuensi data dari data kategori dengan argumen table().
> table(pendapatan)
pendapatan
1 2 3
1 3 2

Berdasarkan output yang ada, diketahui bahwa kategori 1 memiliki 1 data,


kategori 2 memiliki 3 data, dan kategori 3 memiliki 2 data. Berdasarkan
tabel frekuensi hasil output, dapat juga dibentuk diagram batang dari tabel
frekuensi tersebut.

barplot(table(pendapatan),xlab="nama",
ylab="pendapatan",
border="black",col="blue",
main="diagram pendapatan")

40
Diagram dan Grafik

Diagram batang juga dapat dibentuk dari data yang berkelompok dengan
data matrix() sebagai nilai input. Misalkan terdapat data banyaknya
(frekuensi) investor yang diperoleh oleh pasangan suami istri (Aad dan
Dara). Pada Bulan Januari, Aad memperoleh klien sebanyak 5 orang dan
Dira sebanyak 6 orang. Pada Bulan Februari, Aad memperoleh klien
sebanyak 9 orang dan Dira sebanyak 8 orang.

#input data
warna<-c("yellow","green")
nama<-c("aad","dira")
bulan<-c("Jan","Feb","Mar","Apr","Mei")
pendapatan<-matrix(c(15,19,16,28,24,
18,23,8,25,19),
nrow=2,ncol=5,byrow=TRUE)

#diagram batang
barplot(pendapatan,main="pendapatan alumni STT",
xlab="bulan",ylab="pendapatan",col=warna,names.arg
= bulan)
#keterangan pada plot
legend("topleft",nama,cex=1.3,fill=warna)

41
Diagram dan Grafik

Histogram
Histogram mempresentasikan data dalam bentuk visual dari distribusi
data yang digambarkan dengan grafis berbentuk batang. Histogram
hampir mirip dengan diagam batang, namun histogram dibentuk
berdasarkan frekuensi data dalam tipe data interval dan rasio. Selain itu,
pada histogram tidak terdapat jarak antara batang seperti pada diagram
batang. Pada Rstudio digunakan fungsi hist() untuk membuat histogram.

hist(x,xlab,ylab,xlim,ylim,main,col,breaks)

42
Diagram dan Grafik
Keterangan:

 x merupakan data berupa vektor yang akan dibuat ke dalam


histogram.
 xlab merupakan nama label pada sumbu mendatar (sumbu x).
 ylab merupakan nama label pada sumbu tegak (sumbu y).
 xlim merupakan rentang nilai pada sumbu mendatar
 ylim merupakan rentang nilai pada sumbu tegak
 main merupakan judul diagram.
 col adalah pemberian warna dalam chart.
 breaks merupakan banyaknya kelas atau lebar setiap batang yang
dimunculkan.

Misalkan data uas studi kasus beberapa mahasiswa statistika IPB.

hist(histogram$uas,main="Histogram UAS",
xlab="nilai",ylab="frekuensi",
xlim=c(70,100),ylim=c(0,10))

43
Diagram dan Grafik
Pada perintah (sintaks) diatas terlihat data yang yang diambil adalah
peubah (variabel) uas, histogram dibuat dengan judul “Histogram UAS”,
label untuk sumbu mendatar bernama “nilai”, label untuk sumbu tegak
bernama “frekuensi”, rentang nilai sumbu mendatar berada diantara 70
hingga 100, dan rentang nilai untuk sumbu tegak antara 0 hingga 10.

Jika ingin menampilkan histogram dengan sumbu tegaknya adalah


kepadatan (density) peluang maka ditambahkan argumen freq=FALSE.

hist(histogram$uas,breaks=6,main="Histogram UAS",
xlab="nilai",ylab="kepadatan peluang",
freq=FALSE)

Pada perintah diatas terlihat banyaknya kelas dan lebar batang pada
histogram adalah 6, label untuk sumbu tegak bernama “kepadatan
peluang”, dan frekuensi diganti dengan kepadatan peluang.

44
Diagram dan Grafik

Jika ingin menampilkan merubah jumlah kelas dan lebar batang dengan
menambahkan argumen breaks() dengan beberapa nilai seperti 70, 85,
dan 100.
hist(histogram$uas,main="Histogram UAS",
xlab="nilai",ylab="kepadatan peluang",
freq=FALSE,breaks = c(70,85,100))

45
Diagram dan Grafik
Jika ingin ditampilkan teks pada masing-masing batang maka
menggunakan fungsi text().
h<-hist(histogram$uas)
text(h$mids,h$counts,labels = h$counts,
adj=c(0.5,-0,5))

 mids merupakan nilai tengah masing-masing kelas.


 counts merupakan jumlah data yang terdapat dalam masing-
masing kelas (batang).
 adj() merupakan pengaturan posisi.

46
Diagram dan Grafik
Diagram Lingkaran
Diagram lingkaran merupakan penyajian data statistik dengan
menggunakan gambar berbentuk lingkaran yang dibagi menjadi sudut-
sudut sektor (juring). Setiap sektor melukiskan kategori data yang terlebih
dahulu diubah ke dalam derajat dengan menggunakan busur derajat.
Diagram lingkaran sangat cocok untuk menyajikan data yang berbentuk
kategori atau atribut dalam persentase. Pada Rstudio digunakan fungsi
pie() untuk membuat diagram lingkaran.

pie(x,labels,radius,main,col,clockwise)

Keterangan:

 x merupakan data berupa vektor yang akan dibuat ke dalam


histogram.
 labels merupakan nama label pada masing-masing irisan diagram
lingkaran.
 raidus merupakan nilai yang mengukur radiu lingkaran pada
diagram yang nilainya antara -1 hingga 1.
 main merupakan judul diagram.
 col adalah pemberian warna dalam diagram.
 clockwise merupakan nilai logical yang mengindikasikan arah
suatu diagram.

Misalkan suatu penelitian terkait pekerjaan alumni statistika IPB diperoleh


data yang memiliki pekerjaan PNS sebanyak 30 orang, yang memiliki
pekerjaan sebagai pengusaha sebanyak 25 orang, dan yang memiliki
perkerjaan lainnya sebanyak 55 orang.

x<-c(30,25,55)
label<-c("PNS","pengusaha","lainnya")
warna<-c("blue","yellow","green")

pie(x,labels=label,
main="Pie profesi alumni",
col=warna)

47
Diagram dan Grafik

Jika ingin menambahkan legenda, presentase dan, pewarnaan grafik


seperti pelanggi, maka digunakan argumen round(), paste(), dan
legend().

x<-c(30,25,55)
label<-c("PNS","pengusaha","lainnya")

#persentasi data
pie.persen<-round(100*x/sum(x),1)

#penggabungan label
pielabel<-paste(pie.persen,"%",sep="")

pie(x,labels=pielabel,
main="Pie profesi
alumni",col=rainbow(length(x)))

#menambahkan legenda
legend("topright",label,cex=0.6,
fill=rainbow(length(x)))

48
Diagram dan Grafik

Boxplot
Selain histogram, penyajian grafis lainnya yang bisa merangkum
informasi lebih detail mengenai distribusi nilai-nilai data pengamatan
adalah Boxplot. Terdapat 5 ukuran statistik dari boxplot yaitu:
Nilai minimum: nilai observasi terkecil.
Q1: kuartil terendah atau kuartil pertama.
Q2: median atau nilai pertengahan.
Q3: kuartil tertinggi atau kuartil ketiga.
Nilai maksimum: nilai observasi terbesar.

49
Diagram dan Grafik

Bagian utama boxplot adalah kotak berbentuk persegi yang merupakan


bidang yang menyajikan interquartile range (IQR), dimana 50% dari nilai
data pengamatan terletak disana.
Panjang kotak sesuai dengan jangkauan kuartil dalam (inner quartile
range, IQR) yang merupakan selisih antara kuartil ketiga (Q3)
dengan kuartil pertama (Q1). IQR mengambarkan ukuran
penyebaran data. Semakin panjang bidang IQR menunjukkan data
semakin menyebar. Pada Gambar, IQR=UQ-LQ=Q3-Q1.
Garis bawah kotak (LQ)=Q1 (kuartil pertama), dimana 25% data
pengamatan lebih kecil atau sama dengan nilai Q1.
Garis tengah kotak=Q2 (median), dimana 50% data pengamatan
lebih kecil atau sama dengan nilai Q2.
Garis atas kotak (UQ)=Q3 (kuartil ketiga) dimana 75% data
pengamatan lebih kecil atau sama dengan nilai Q3.

50
Diagram dan Grafik
Garis yang merupakan perpanjangan dari box (baik ke arah atas ataupun
ke arah bawah) dinamakan dengan whiskers.
Whiskers bawah menunjukkan nilai yang lebih rendah dari kumpulan
data yang berada dalam IQR.
Whiskers atas menunjukkan nilai yang lebih tinggi dari kumpulan
data yang berada dalam IQR.
Panjang whisker ≤ 1,5 IQR. Masing-masing garis whisker dimulai dari
ujung kotak IQR, dan berakhir pada nilai data yang bukan
dikategorikan sebagai outlier (pada Gambar, batasnya adalah garis
UIF dan LIF). Sehingga nilai terbesar dan terkecil dari data
pengamatan (tanpa termasuk outlier) masih merupakan bagian
boxplot yang terletak tepat di ujung garis tepi whiskers.

Nilai yang berada di atas atau dibawah whiskers dinamakan nilai outlier
atau ekstrim.
Nilai outlier adalah nilai data yang letakknya lebih dari 1,5 IQR, diukur
dari UQ (atas kotak) atau LQ (bawah kotak).
 Q3+(1,5 IQR) < outlier atas ≤ Q3+(3 IQR).
 Q1-(1,5 IQR) > outlier bawah ≥ Q1-(3 IQR)
Nilai ekstrim adalah nilai-nilai yang letaknya lebih dari 3 IQR, diukur
dari UQ atau LQ.
 Ekstrim bagian apabila atas apabila nilainya berada di atas
Q3+3 IQR.
 Ekstrim bagian bawah apabila nilainya lebih rendah dari Q1-(3
IQR).
Boxplot dapat membantu kita dalam memahami karakteristik dari
distribusi data. Selain untuk melihat derajat penyebaran data (yang dapat
dilihat dari tinggi/panjang boxplot) juga dapat digunakan untuk menilai
kesimetrisan sebaran data. Panjang kotak menggambarkan tingkat
penyebaran atau keragaman data pengamatan, sedangkan letak median
dan panjang whisker menggambarkan tingkat kesimetrisannya.
Jika data simetris (berasal dari distribusi normal):
 Garis median akan berada di tengah boxplot bagian atas dan
bawah akan memiliki panjang yang sama serta tidak terdapat
nilai outlier ataupun nilai ekstrim.

51
Diagram dan Grafik
 Diharapkan nilai-nilai pengamatan yanng berada di luar
whiskers tidak lebih dari 1%.
Jika data tidak simetris (miring), median tidak akan berada di tengah
box dan salah satu dari whisker lebih panjang dari yang lainnya.
 Adanya outlier di bagian atas boxplot yang disertai denggan
whiskers bagian atas yang lebih panjang, menunjukkan bahwa
distribusi data cendrung menjulur ke arah kanan (positive
skewness)
 Sebaliknya, adanya outlier di bagian bawah boxplot yang
disertai dengan whisker bagian bawah yang lebih panjang,
menunjukkan bahwa distribusi data cendrung menjulur ke arah
kiri (negative skewness)

Pada Rstudio fungsi boxplot() digunakan untuk membuat boxplot.

boxplot(x,data,notch,varwidth,names,main,col)

Keterangan:
 x merupakan data berupa vektor atau formula.
 data merupakan data frame.
 notch merupakan nilai logical. Bila TRUE maka garis median pada
boxplot berbentuk cekuk.
 varwidth merupakan nilai logical. Tetapkan nilai TRUE untuk
proporsi lebar boxplot sesuai dengan ukuran data.
 names merupakan label masing-masing boxplot.
 main merupakan pemberian judul pada diagram.
 col merupakan pemberian warna.

52
Diagram dan Grafik
Misalkan terdapat data nilai uas mahasiswa statistika IPB yang ingin
dibuat boxplot.

boxplot(boxplot$uas,main="boxplot uas",
ylab="nilai")

Berdasarkan gambar, terlihat bahwa terdapat 1 nilai pencilan yaitu pada


nilai uas 50.

53
Diagram dan Grafik
Histogram juga bisa dibuat secara bersamaan dengan beberapa data.
Misalkan terdapat nilai uas, uts, dan tugas mahasiswa statistika IPB yang
akan dibuat dengan histogramnya secara masing-masing berdasarkan
nilai uas, nilai uts, dan nilai tugas.

#data
uas<-boxplot$uas
uts<-boxplot$uts
tugas<-boxplot$tugas

#boxplot berganda
boxplot(uas,uts,tugas,main="boxplot nilai",
names=c("uas","uts","tugas"),
col=c("blue","yellow","green"),
horizontal=TRUE)

Pada perintah tersebut terdapat 3 boxplot yang akan dibentuk dalam satu
sumbu. Masing-masing boxplot dibedakan berdasarkan warna, boxplot
uas berwarna biru, boxplot uts berwarna kuning, boxplot tugas berwarna
hijau.

54
Diagram dan Grafik

Unsur-unsur (deskripsi) dari boxplot juga dapat ditampilkan.

55
Diagram dan Grafik
Scatterplot
Scatter plot menunjukkan plot titik dalam diagram kartesius. Setiap titik
merupakan koordinat dari 2 peubah yaitu 1 peubah pada sumbu mendatar
dan 1 peubah lainnya pada sumbu tegak. Banyak cara untuk membuat
scatterplot pada Rstudio diantaranya fungsi plot(x,y).

plot(x,y,main,xlab,ylab,xlim,ylim,axes)

Keterangan:
 x merupakan vektor numerik yang digunakan pada sumbu
mendatar (sumbu x).
 y merupakan vektor numerik yang digunakan pada sumbu tegak
(sumbu y).
 xlab merupakan nama label pada sumbu mendatar.
 ylab merupakan nama label pada sumbu tegak.
 xlim merupakan rentang nilai pada sumbu mendatar.
 ylim merupakan rentang nilai pada sumbu tegak.
 main merupakan nama judul dari histogram.
 col merupakan warna pada scaterplot.

Misalkan akan dibentuk scatterplot dari nilai uas dan uts mahasiswa
statistika IPB.

56
Diagram dan Grafik
#data
uas<-boxplot$uas
uts<-boxplot$uts
#scatter plot
plot(uas,uts,xlab="uas",ylab="uts",
main="scatter plot nilai",col="blue")

Pada scatterplot dapat ditambahkan garis regresi linear dengan bantuan


fungsi abline(lm())

abline(lm(y~x),col)

Keterangan:
 x merupakan peubah penjelas (independent)
 y merupakan peubah respon (dependent)

57
Diagram dan Grafik
Pada scatter plot kasus nilai mahasiswa.

abline(lm(uas~uts),col="red")

Scatterplot dapat ditampilkan lebih dari 2 peubah menggunakan data


matriks sebagai input. Hal itu bertujuan untuk melihat hubungan 1 peubah
dengan peubah lainnya. Pada Rstudio digunakan fungsi pairs() untuk
membuat scatterplot matriks.

pairs(formula,data)

Keterangan:
 formula merupakan deretan peubah yang akan dibuat scatter plot
 data merupakan data set yang berisi kumpulan peubah dan data
yang akan dibuat scatterplot

58
Diagram dan Grafik
pairs(~uas+uts+tugas,col="blue",
main="scatterplot matriks nilai mahasiswa")

Diagram Garis
Diagram garis menunjukkan diagram yang menghubungkan deretan titik
menggunakan garis. Umumnya diagram garis digunakan untuk emlihat
pola atau tren suatu data. Banyak cara untuk membuat diagram garis
menggunakan Rstudio, salah satunya plot() dengan tambahan type.

plot(data,type,main,col,xlab,ylab)

Keterangan:
 data merupakan vektor yang memuat nilai numerik.
 type merupakan jenis diagram garis. Jika diisi “l” maka diagram
hanya berbentuk garis saja dan jika diisi “o” maka diagram berbentuk
garis dan titik.
 Main merupakan judul diagram.
 col merupakan warna diagram.
 xlab dan ylab nama label sumbu.

59
Diagram dan Grafik
Misalkan akan dibuat diagram garis untuk nilai uts mahasiswa statistika
IPB.

plot(boxplot$uts,type="o")

60
Diagram dan Grafik
Diagram garis lebih dari juga dapat dalam 1 sumbu (frame) dengan
bantuan fungsi lines() yang ditambahkan setelah fungsi plot().
lines(data1,type)

Misalkan akan dibentuk diagram garis untuk data uas, uts, dan tugas
mahasiswa statistika IPB dalam 1 sumbu.

plot(boxplot$uts,type="o",xlab="nama mahasiswa",
ylab="nilai",col="blue")
lines(boxplot$uas,type="o",col="green")
lines(boxplot$tugas,type="o",col="red")

61
Uji t
Mengapa menggunakan uji t ?
Pernahkah anda mendengar tentang uji beda? Sesuai dengan namanya,
uji beda biasanya dilakukan untuk membandingkan nilai tengah (rata-
rata/modus/median) kelompok dengan suatu nilai atau dengan nilai
tengah kelompok lainnya. Misalnya,

Perusahaan ingin mengetahui apakah lampu yang diproduksi mampu


menyala lebih dari 1000 jam sesuai dengan standar yang ditetapkan
perusahaan
Seorang peneliti dari dunia pendidikan ingin mengetahui apakah ada
perbedaan hasil belajar diantara dua kelas yang berbeda dengan
metode pembelajaran yang berbeda
Seorang guru ingin mengkaji apakah ada perbedaan hasil belajar
sebelum dan sesudah pemberian metode pembelajaran tertentu.
Uji yang bisa diterapkan untuk menyelesaikan permasalahan pada
contoh-contoh di atas adalah uji Z. Uji Z bisa dilakukan untuk
membandingkan nilai tengah dan memliki distribusi normal. Hanya saja
jika kita ingin melakukan uji Z maka ragam populasi (𝜎 2 ) harus diketahui.
Namun, biasanya data yang kita peroleh adalah data sampel bukan
populasi. Tapi uji Z masih bisa diatasi dengan menggunakan ragam
sampel (𝑠 2 ). Apakah kebanyakan dari sampel yang kita peroleh memiliki
ukuran yang besar? Biasanya tidak! karena keterbatasan biaya,waktu,
dan tenaga maka kebanyakan sampel yang kita peroleh adalah sampel
kecil. Jika sampelnya kecil maka ragam sampel (𝑠 2 ) tidak cukup akurat
untuk mendekati atau menduga ragam populasi (𝜎 2 ) sehingga hasil
analisis uji Z menjadi kurang valid. Solusi untuk mengatasi masalah ini
adalah dengan menggunakan uji t. Uji t dapat digunakan untuk sampel
berukuran kecil dan memiliki distribusi normal. Uji t dalam hal menguji nilai
tengah dibagi menjadi tiga macam, yakni:
1) Uji perbedaan nilai tengah sampel dengan nilai konstanta tertentu
(One sample t test)
2) Uji perbedaan nilai tengah pada dua kelompok sampel (independent
sample t test)
3) Uji perbedaan nilai tengah sampel pada pengamatan berpasangan
(Paired sample t test)

62
Uji t
One sample t test
Uji t satu sampel merupakan prosedur uji t yang digunakan untuk
membandingkan nilai tengah suatu sampel dengan suatu nilai konstanta
tertentu. Nilai konstanta tersebut pada umumnya merupakan sebuah nilai
parameter untuk mengukur nilai populasi.
Hipotesis pada uji t satu sampel

1) Uji Sisi Kiri


H0 : μ ≥ μ0 nilai tengah populasi paling rendah sebesar μ0
H1 : μ < μ0 nilai tengah populasi kurang dari μ0
2) Uji Sisi Kanan
H0 : μ ≤ μ0 nilai tengah populasi paling tinggi sebesar μ0
H1 : μ > μ0 nilai tengah populasi lebih dari μ0
3) Uji Dua Sisi
H0 : μ = μ0 nilai tengah populasi mencapai μ0
H1 : μ ≠ μ0 nilai tengah populasi tidak mencapai μ0

Sintaks uji t satu sampel di R adalah sebagai berikut:

t.test(........., alternative="...........", mu=...., conf.level=....)

Nama data less = uji sisi kiri Nilai tertentu yang


dibandingkan dengan
greater = uji sisi kanan
Nilai tengah sampel
two.sided = uji dua sisi

Nilai tingkat kepercayaan misalnya 95 % maka diisi dengan angka 0.95

63
Uji t
Contoh1
Berikut contoh data mengenai waktu penanganan suatu kasus di
pengadilan. Pada data ini ingin dilakukan pengujian apakah rata-rata
waktu penyelesaian suatu kasus di pengadilan kurang dari 80 hari.
Kemudian diambil sampel secara acak sebanyak 20 kasus dan
diasumsikan berasal dari distribusi normal.
Langkah pertama adalah menentukan hipotesisnya:
H0 : μ ≥ 80 waktu penyelesaian suatu kasus di pengadilan paling
rendah sebesar 80 hari
H1 : μ < 80 waktu penyelesaian suatu kasus di pengadilan kurang
dari 80
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data

Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut

64
Uji t
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.

Perhatikan lingkaran merah pada gambar di atas! Di gambar tersebut


menunjukkan bahwa nama data yang akan kita olah untuk uji t satu
sampel adalah one_sample_t_test. Jadi ketika pada sintaks uji t satu
sampel dibutuhkan nama data yang akan kita olah maka nama tersebut
yang kita masukkan untuk analisisnya.
Langkah berikutnya yaitu uji t satu sampel dengan menggunakan fungsi
t.test() dan untuk t tabel menggunakan fungsi qt(). Sintaksnya adalah
sebagai berikut:

t.test(one_sample_t_test$hari,alternative="less",
mu=80,conf.level=0.95) # uji t satu sampel

qt(0.05,df=19,lower.tail=TRUE) # t tabel

65
Uji t
Output:

> t.test(one_sample_t_test$hari,alternative="less",
mu=80,conf.level=0.95)

One Sample t-test


data: one_sample_t_test$hari
t = 2.3008, df = 19, p-value = 0.9836
alternative hypothesis: true mean is less than 80
95 percent confidence interval:
-Inf 97.25258
sample estimates:
mean of x
89.85

> qt(0.05,df=19,lower.tail=TRUE)
[1] -1.729133

Hasil analisis:
Dari hasil output diperoleh t hitung = 2.3008 > t tabel = -1.729133 dimana
p-value = 0.9836 > alpha = 0.05. Uji hipotesis yang digunakan pada kasus
ini adalah uji sisi kiri. Pada uji sisi kiri H0 ditolak jika t hitung < dari tabel
dan p-value<alpha. Sedangkan pada output t hitung > t tabel dan p-value
> alpha sehingga terima H0. Dengan demikian, dapat disimpulkan bahwa
dengan tingkat kepercayaan 95% tidak cukup bukti untuk mengatakan
waktu penyelesaian suatu kasus di pengadilan kurang dari 80 hari.

Contoh2
Berikut contoh data mengenai waktu penanganan suatu kasus di
pengadilan. Pada data ini ingin dilakukan pengujian apakah rata-rata
waktu penyelesaian suatu kasus di pengadilan lebih dari 80 hari.
Kemudian diambil sampel secara acak sebanyak 20 kasus dan
diasumsikan berasal dari distribusi normal.

66
Uji t
Langkah pertama adalah menentukan hipotesisnya:
H0 : μ ≤ 80 waktu penyelesaian suatu kasus di pengadilan paling
tinggi sebesar 80 hari
H1 : μ > 80 waktu penyelesaian suatu kasus di pengadilan lebih
dari 80
Langkah berikutnya yaitu uji t satu sampel dengan menggunakan fungsi
t.test() dan untuk t tabel menggunakan fungsi qt(). Sintaksnya adalah
sebagai berikut:

t.test(one_sample_t_test$hari,alternative="greater"
,mu=80,conf.level=0.95) # uji t satu sampel

qt(0.05,df=19,lower.tail=FALSE) # t tabel

Output:

> t.test(one_sample_t_test$hari,alternative="greater"
,mu=80,conf.level=0.95)

One Sample t-test


data: one_sample_t_test$hari
t = 2.3008, df = 19, p-value = 0.01645
alternative hypothesis: true mean is greater than 80
95 percent confidence interval:
82.44742 Inf
sample estimates:
mean of x
89.85

> qt(0.05,df=19,lower.tail=FALSE)
[1] 1.729133

67
Uji t
Hasil analisis:
Dari hasil output diperoleh t hitung = 2.3008 > t tabel = 1.729133 dimana
p-value = 0.01645 < alpha = 0.05. Uji hipotesis yang digunakan pada
kasus ini adalah uji sisi kanan. Pada uji sisi kiri H0 ditolak jika t hitung >
dari tabel dan p-value<alpha. Sedangkan pada output t hitung > t tabel
dan p-value < alpha sehingga tolak H0. Dengan demikian, dapat
disimpulkan bahwa waktu penyelesaian suatu kasus di pengadilan kurang
dari 80 hari dengan tingkat percayaan 95 %.

Contoh 3
Berikut contoh data mengenai waktu penanganan suatu kasus di
pengadilan. Pada data ini ingin dilakukan pengujian apakah rata-rata
waktu penyelesaian suatu kasus di pengadilan sama dengan 80 hari.
Kemudian diambil sampel secara acak sebanyak 20 kasus dan
diasumsikan berasal dari distribusi normal.
Langkah pertama adalah menentukan hipotesisnya:

H0 : μ ≠ 80 waktu penyelesaian suatu kasus di pengadilan tidak


sama dengan 80 hari
H1 : μ = 80 waktu penyelesaian suatu kasus di pengadilan sama
dengan 80

Langkah berikutnya yaitu uji t satu sampel dengan menggunakan fungsi


t.test() dan untuk t tabel menggunakan fungsi qt(). Sintaksnya adalah
sebagai berikut:

t.test(one_sample_t_test$hari,alternative="two.sided"
,mu=80,conf.level=0.95) # uji t satu sampel

alpha=0.05
qt(c(alpha/2, 1-(alpha/2)), df=19) # t tabel

68
Uji t
Output:

> t.test(one_sample_t_test$hari,alternative="two.sided"
,mu=80,conf.level=0.95)

One Sample t-test


data: one_sample_t_test$hari
t = 2.3008, df = 19, p-value = 0.0329
alternative hypothesis: true mean is not equal to 80
95 percent confidence interval:
80.88957 98.81043
sample estimates:
mean of x
89.85

> alpha=0.05
> qt(c(alpha/2, 1-(alpha/2)), df=19) # t tabel
[1] -2.093024 2.093024

Hasil analisis:
Dari hasil output diperoleh t hitung = 2.3008 tidak berada pada selang
-2.093024 < t < 2.093024 dan p-value = 0.0329 < alpha = 0.05. Uji
hipotesis yang digunakan pada kasus ini adalah uji dua sisi. Pada uji dua
sisi H0 ditolak jika t hitung tidak berada pada selang (–t tabel < t < t tabel)
dan p-value<alpha Sedangkan pada output, t hitung tidak berada pada
selang (–t tabel < t < t tabel) dan p-value < alpha sehingga tolak H0.
Dengan demikian, dapat disimpulkan bahwa waktu penyelesaian suatu
kasus di pengadilan tidak sama dengan 80 hari dengan tingkat percayaan
95 %.

69
Uji t
Independent sample t test
Independent sample t test merupakan uji perbandingan nilai tengah pada
dua kelompok sampel yang independent. Dengan kata lain, dua kelompok
sampel yang tidak berhubungan. Sebagai contoh kita akan menguji
apakah ada perbedaan rata-rata (dua ) sampel yang terdiri dari kelompok
A dan kelompok B terkait dengan prestasi belajarnya. Contoh ini
menjelaskan bahwa sampel penelitian ini terdiri dari dua kelompok yang
berbeda atau tidak berhubungan satu sama lain.
Salah satu syarat dari inpendent sample t test adalah kita harus tahu
mengetahui terlebih dahulu apakah dua kelompok sampel tersebut
berasal dari populasi yang ragamnya sama atau tidak. sehingga sintaks
di R untuk menguji apakah ragamnya sama atau tidak adalah:
Var.test (x,y)

Setelah kita menguji ragamnya maka inpendent sample t test bisa


dilakukan. Adapun sintaksnya sebagai berikut:

t.test(a,b, var.equal=TRUE, paired=FALSE)

a,b merupakan data a Jika ragamnya sama maka var.equal=TRUE, jika


dan data b yang beda maka var.equal=FALSE
dibandingkan

Contoh 4
Seorang Guru matematika di salah satu SMA Negeri di Bogor ingin
menguji apakah terdapat perbedaan nilai ujian matematika antara Kelas
A dan B. Guru tersebut mengambil sampel secara acak sebanyak 15
orang siswa dari masing-masing kelas.

70
Uji t
Langkah pertama adalah menentukan hipotesisnya. Karena dalam kasus
ini ingin melihat apakah sama atau tidak nilai ujiannya maka hipotesis nya
adalah hipotesis dua arah yakni :

H0 : μA = μB ,rata-rata nilai ujian kelas A dan kelas B sama

H0 : μA ≠ μB , rata-rata nilai ujian kelas A dan kelas B berbeda

Langkah pertama adalah melakukan import data dari excel ke R. Lakukan


cara ini sesuai dengan panduan manajemen data

Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut

71
Uji t
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.

Perhatikan lingkaran merah pada gambar di atas! Di gambar tersebut


menunjukkan bahwa nama data yang akan kita olah untuk uji t adalah
independent_sample_t_test. Jadi ketika pada sintaks uji t dibutuhkan
nama data yang akan kita olah maka nama tersebut yang kita masukkan
untuk analisisnya.
Langkah berikutnya yaiu menggunakan fungsi var.test() untuk kesamaan
ragamnya, t.test() uji t nya dan untuk t tabel menggunakan fungsi qt().
Sintaksnya adalah sebagai berikut:

a=independent_sample_t_test$A #data di kelompok A


b=independent_sample_t_test$B #data di kelompok B

Var.test(a,b) # uji kesamaan ragam

72
Uji t
Output:

> var.test(a,b)

F test to compare two variances

data: a and b
F = 0.82426, num df = 14, denom df = 14, p-value = 0.7227
alternative hypothesis: true ratio of variances is not equal
to 1
95 percent confidence interval:
0.2767275 2.4551214
sample estimates:
ratio of variances
0.8242569

Hasil analisis:
Pada uji keragaman jika p-value lebih kecil dari alpha 0.05 maka
ragamnya berbeda tapi jika sebaliknya maka ragamya sama. Dari hasil
ouput menujukkan bahwa p-value = 0.7227 > alpha = 0.05 sehingga dapat
disimpulkan bahwa ragam antara kedua kelompok sama. Hasil ini akan
menentukan langkah berikutnya yaitu, sintaks uji t nya (var.equal) harus
sama dengan TRUE

t.test(a,b, var.equal=TRUE, paired=FALSE) # uji t

alpha=0.05
db=15+15-2
qt(c(alpha/2, 1-(alpha/2)), df=db) # t tabel

Output:
> t.test(a,b, var.equal=TRUE, paired=FALSE) # uji t

Two Sample t-test

data: a and b
t = 12.671, df = 28, p-value = 4.081e-13
alternative hypothesis: true difference in means is not equal
to 0
95 percent confidence interval:
25.59742 35.46925
sample estimates:
mean of x mean of y
84.73333 54.20000

73
Uji t
Output t tabel:

> alpha=0.05
> n=15+15-2
> qt(c(alpha/2, 1-(alpha/2)), df=n) # t tabel
[1] -2.048407 2.048407

Hasil analisis:
Dari hasil output diperoleh t hitung = 12.671 tidak berada pada selang
-2.048407 < t < 2.048407 dan p-value = 0.0329 < alpha = 0.05. Uji
hipotesis yang digunakan pada kasus ini adalah uji dua sisi. Pada uji dua
sisi H0 ditolak jika t hitung tidak berada pada selang (–t tabel < t < t tabel)
dan p-value<alpha Sedangkan pada output, t hitung tidak berada pada
selang (–t tabel < t < t tabel) dan p-value < alpha sehingga tolak H0.
Dengan demikian, dapat disimpulkan bahwa rata-rata ujian kelas A dan
kelas B berbeda dengan tingkat percayaan 95 %.

74
Uji t
Paired sample t test
Paired sample t test atau uji t berpasangan merupakan membandingkan
rata-rata dua grup yang saling berpasangan, yaitu sampel dengan subjek
yang sama namun terdapat dua perlakuan/kejadian berbeda, misalnya
pengukuran sampel terhadap treatment tertentu sebelum dan
sesudahnya.
Hipotesis pada uji t satu sampel

1) Uji Sisi Kiri


H0 : μa ≥ μb nilai tengah populasi sesudah diberi perlakuan tidak
lebih kecil dari nilai tengah populasi sebelum diberi
perlakuan
H1 : μb < μb nilai tengah populasi sesudah diberi perlakuan lebih
kecil dari nilai tengah populasi sebelum diberi
perlakuan
2) Uji Sisi Kanan
H0 : μa ≤ μb nilai tengah populasi sesudah diberi perlakuan tidak
lebih besar dari nilai tengah populasi sebelum diberi
perlakuan
H0 : μa > μb nilai tengah populasi sesudah diberi perlakuan tidak
lebih besar dari nilai tengah populasi sebelum diberi
perlakuan
3) Uji Dua Sisi
H0 : μa = μb nilai tengah populasi sesudah diberi perlakuan sama
dengan nilai tengah populasi sebelum diberi
perlakuan
H0 : μa ≠ μb nilai tengah populasi sesudah diberi berbeda dengan
nilai tengah populasi sebelum diberi perlakuan

75
Uji t
Sintaks uji t berpasangan di R adalah sebagai berikut:

t.test(a,b alternative="...........", paired=TRUE, conf.level=....)

a = data sesudah less = uji sisi kiri Sintaks TRUE untuk


uji berpasangan
b= data sebelum greater = uji sisi kanan
two.sided = uji dua sisi

Nilai tingkat kepercayaan misalnya 95 % maka diisi dengan angka 0.95

Contoh 5
Akan diteliti mengenai perbedaan penjualan sepeda motor merk A
disebuah Kabupaten sebelum dan sesudah adanya ketetapan kenaikan
pajak kendaraan. Data diambil dari 15 dealer

Hipotesis

H0 : μa = μb penjualan sepeda motor merk A sebelum da sesudah


adanya ketetapan kenaikan pajak kendaraan sama
saja
H0 : μa ≠ μb penjualan sepeda motor merk A sebelum da sesudah
adanya ketetapan kenaikan pajak kendaraan
berbeda

76
Uji t
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data

Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut

77
Uji t
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.

Perhatikan lingkaran merah pada gambar di atas! Di gambar tersebut


menunjukkan bahwa nama data yang akan kita olah untuk uji t adalah
paired_t_test. Jadi ketika pada sintaks uji t dibutuhkan nama data yang
akan kita olah maka nama tersebut yang kita masukkan untuk analisisnya.
Langkah berikutnya yaiu menggunakan fungsi t.test() uji t nya dan untuk
t tabel menggunakan fungsi qt(). Sintaksnya adalah sebagai berikut:
....
a=paired_t_test$sesudah # data sesudah
b=paired_t_test$sebelum # data sebelum

t.test(a,b,alternative="two.sided",paired=TRUE,
conf.level=0.95) # uji t

alpha=0.05
db=15-1
qt(c(alpha/2, 1-(alpha/2)), df=db) # t tabel

78
Uji t
Output:

> t.test(a,b,alternative="two.sided",paired=TRUE,conf.level=0.95)

Paired t-test

data: a and b
t = 1.0312, df = 14, p-value = 0.32
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.295969 3.695969
sample estimates:
mean of the differences
1.2

> alpha=0.05
> db=15-1
> qt(c(alpha/2, 1-(alpha/2)), df=db)

[1] -2.144787 2.14478

Hasil analisis:
Dari hasil output diperoleh t hitung = 1.0312 t berada pada selang
-2.144787 < t < 2.14478 dan p-value = 0.32 > alpha = 0.05. Uji hipotesis
yang digunakan pada kasus ini adalah uji dua sisi. Pada uji dua sisi H0
ditolak jika t hitung tidak berada pada selang (–t tabel < t < t tabel) dan p-
value<alpha Sedangkan pada output, t hitung berada pada selang
(–t tabel < t < t tabel) dan p-value > alpha sehingga terima H0. Dengan
demikian, dapat disimpulkan bahwa penjualan sepeda motor merk A
sebelum da sesudah adanya ketetapan kenaikan pajak kendaraan
berbeda dengan tingkat percayaan 95 %.

79
Uji t
Latihan
Dari hasil penelitian sebelumnya di ketahui bahwa rata-rata tinggi badan
mahasiswa adalah 170cm dan berat badan 70 kg. Seorang peneliti ingin
melakukan penelitian mengenai tinggi badan dan berat badan yang di
ambil dari 20 mahasiswa secara acak. Berdasarkan 20 data mahasiswa
di atas, ujilah :
1. Apakah benar jika ada seorang dosen yang mengatakan bahwa
rata-rata tinggi mahasiswa paling rendah adalah 170cm?
2. Apakah benar jika ada mahasiswa yang mengatakan bahwa rata-
rata berat badan mahasiswa paling tinggi 70 kg?
3. Apakah rata-rata tinggi badan dan berat badan pada penelitian saat
ini masih sama dengan penelitian sebelumnya?

Nama file : latihan uji t

80
Korelasi
Apa itu korelasi?
Korelasi bisa diartikan sebagai “hubungan”. Istilah korelasi berkembang
jika didefinisakan dalam ilmu statistika. Korelasi merupakan salah satu
teknik analisis dalam statistik yang digunakan untuk mencari hubungan
antara dua variabel yang bersifat kuantitatif. Hubungan dua variabel
tersebut mungkin bisa terjadi karena adanya hubungan sebab akibat atau
karena kebetulan saja. Jadi secara umum gambaran korelasi adalah
sebagai berikut:
Digunakan untuk menganalisis atau mengukur keeratan hubungan
linier antara dua peubah atau lebih
Koefisien korelasi sering dinotasikan dengan r dan nilainya berkisar
antara -1 dan 1
Nilai r yang mendekati 1 atau -1 menunjukkan semakin erat hubungan
linier antara kedua peubah tersebut. Nilai r yang mendekati nol
menggambarkan hubungan kedua peubah tidak linier.
Tanda (+) / (-) menggambarkan arah hubungan
o (+) searah;
o (-) berlawanan arah
Berikut ini adalah gambar kemungkinan nilai korelasi

81
Korelasi
Jika data yang kita miliki adalah data sampel maka tentunya diperlukan
pengujian hipotesis untuk membuktikan bahwa populasinya berkorelasi
atau tidak. bentuk hipotesis dalam korelasi adalah sebagai berikut:
Hipotesis pada uji t satu sampel

1) Uji Sisi Kiri


H0 : ρ = 0 tidak ada korelasi
H1 : ρ < 0 berkorelasi negatif
2) Uji Sisi Kanan
H0 : ρ = 0 tidak ada korelasi
H1 : ρ > 0 berkorelasi positif
3) Uji Dua Sisi
H0 : ρ = 0 tidak ada korelasi
H1 : ρ ≠ 0 ada korelasi

Korelasi Pearson
Korelasi pearson digunakan untuk mengukur hubungan dua atau lebih
peubah dengan tipe data peubah tersebut berskala kontinyu( interval atau
rasio). Metode ini harus memenuhi asumsi normalitas bila ingin
melakukan uji hipotesis. Namun, jika kepentingan kita hanya sebatas
untuk mengetahui nilai koefisien korelasinya saja maka asumsi normalitas
diabaikan.
Adapun untuk sintaks korelasi pearson adalah sebagai berikut:

cor.test(a,b,alternative="...........",method="pearson",conf.level=....)

a,b merupakan data a less = uji sisi kiri Nilai tingkat kepercayaan
dan data b yang greater = uji sisi kanan misalnya 95 % maka diisi
dikorelasikan dengan angka 0.95
two.sided = uji dua sisi

Uji asumsi normalitas adalah sebagai berikut:

shapiro.test(x)

82
Korelasi
Contoh 1
Sebagai ilustrasi perhitungan koefisien korelasi, berikut ini data tingkat
kematian (death rate) dan tingkat perceraian (divorce rate) pada tahun
1985 untuk 9 daerah bagian di Amerika Serikat. Pada data ini ingin dilihat
apakah ada hubungan antara kematian dan perceraian di Amerika Serikat
pada tahun 1985?
Jumlah Jumlah
Daerah Kematian per Perceraian
1000 per 100
Penduduk Penduduk
Mountain 6,9 7,0
Pasific 7,7 5,4
West South Central 7,9 7,0
East North Central 8,9 4,6
South Atlantic 9,0 5,2
West North Central 9,2 4,2
East South Central 9,3 5,7
New England 9,3 3,9
Mid Atlantic 9,9 3,7
Sumber data: Juanda (2009), Ekonometrika Pemodelan dan Pendugaan

Pada data di atas yang ingin dilihat adalah apakah ada hubungan atau
tidak sehingga jenis hipotesis yang tepat pada kasus ini adalah hipotesis
dua sisi.
Hipotesis:
H0 : ρ = 0 tidak ada korelasi antara perceraian dengan kematian
H1 : ρ ≠ 0 ada korelasi antara perceraian dengan kematian
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data

83
Korelasi
Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut

Kemudian pada tampilan R-console juga akan tampil bagian seperti


pada gambar di bawah ini.

Perhatikan lingkaran merah pada gambar di atas! Di gambar tersebut


menunjukkan bahwa nama data yang akan kita olah untuk uji korelasi
pearson adalah korelasi_pearson. Jadi ketika pada sintaks uji korelasi
pearson dibutuhkan nama data yang akan kita olah maka nama tersebut
yang kita masukkan untuk analisisnya.
84
Korelasi
langkah berikutnya adalah melakukan uji asumsi normalitas. Adapun
sintaksnya sebagai berikut:

a=korelasi_pearson$mati # data kematian


b=korelasi_pearson$cerai # data perceraian
shapiro.test(a) # uji normalitas untuk data a
shapiro.test(b) # uji normalitas untuk data b

Output:

> shapiro.test(a) # uji normalitas untuk data a

Shapiro-Wilk normality test


data: a
W = 0.90516, p-value = 0.2834

> shapiro.test(b) # uji normalitas untuk data b


Shapiro-Wilk normality test

data: b
W = 0.91395, p-value = 0.3445

Hasil analisis:
Pada uji asumsi normalitas, jika p-value<alpha maka data tidak menyebar
normal tetapi jika p-value> alpha maka data menyebar normal. Dari hasil
output dapat kita lihat bahwa p-value pada data a dan data b masing-
masing lebih besar dari alpha sehingga data a dan data b menyebar
normal. setelah kita tahu a dan b menyebar normal maka uji hipotesis
untuk korelasi pearson dapat dilakukan. Adapun sintaks untuk korelasi
pearson adalah sebagai berikut;

cor.test(a,b,alternative="two.sided",method="pearson",c
onf.level=0.95)

85
Korelasi
Output:

> cor.test(a,b,alternative="two.sided",method="pearson",
conf.level=0.95)
Pearson's product-moment correlation
data: a and b
t = -3.8278, df = 7, p-value = 0.006477
alternative hypothesis: true correlation is not equal to
0
95 percent confidence interval:
-0.9614705 -0.3493555
sample estimates:
cor
-0.8226179

Hasil analisis:
Dari hasil output, p-value = 0.006477 < alpha = 0.05 maka tolak H0
sehingga dapat disimpulkan terdapat hubungan atau korelasi antara
kematin dengan perceraian di Amerika Serikat pada tahun 1985. Hasil
output juga menunjukkan kematian dan perceraian di Amerika Serikat
pada tahun 1985 memiliki korelasi negatif yakni sebesar -0.8226179.
korelasi negatif yang cukup kuat karena mendekati satu. Dengan kata
lain, semakin tinggi tingkat perceraian maka semakin rendah tingkat
kematian atau bisa sebaliknya.

86
Korelasi
Latihan
Diambil contoh 10 mobil secara acak, kemudian dicatat jarak tempuh
yang sudah dijalani mobil (dalam ribu kilometer) dan diukur Emisi HC-nya
(dalam ppm)
Jarak Emisi
31 553
38 590
48 608
52 682
63 752
67 725
75 834
84 752
89 845
99 960
Hitung nilai korelasi !

Nama file : latihan korelasi pearson

87
Regresi
Analisis regresi dalam statistika adalah salah satu metode untuk
menentukan hubungan sebab akibat antara satu variabel dengan
variabel-variabel lain. Dengan kata lain, analisis regresi dapat digunakan
untuk melihat pengaruh satu variabel X atau lebih dari satu varibel X
(variabel bebas) terhadap suatu variabel Y (varibel tidak bebas).
Misalnya, kita ingin melihat pengaruh tinggi badan(cm) terhadap berat
badan (kg). Jika dilihat dari jumlah peubah bebasnya maka analisis
regresi terbagi dua yakni, regresi lienar sederhana dan regresi linear
berganda. Analisis regresi dapat juga dimanfaatkan untuk memprediksi
nilai Y dari X.

Regresi linear Sederhana


Regresi linear sederhana merupakan suatu model regresi yang
menggambarkan hubungan linear antara satu variabel bebas (X) dengan
suatu varibel tidak bebas (Y) secara linear. Bentuk modelnya adalah
sebagai berikut:

Y = β0 + β1 X + ε
Keterangan:
Y = peubah bebas
β0 = intersep(nilai Y jika X nya sama dengan 0)
β1 = slope (nilai yang menggambarkan pengaruh X terhadap Y)
X = peubah tak bebas
ε = error dari model

jika persamaan di atas digambarkan dalam bentuk grafik makanya


gambarnya seperti gambar di bawah ini

88
Regresi
Contoh 1
Suatu penelitian ingin mengetahui pengaruh tinggi badan(cm) terhadap
berat badan (kg) manusia di suatu daerah. Pada penelitian ini, diambil
sampel secara acak sebanyak 15 orang di daerah tersebut. Dimisalkan
tinggi badan sebagai x dan berat badan y.
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data

Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut

89
Regresi
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.

Perhatikan lingkaran merah pada gambar di atas! Di gambar tersebut


menunjukkan bahwa nama data yang akan kita olah untuk analisis regresi
adalah regresi_linear_sederhana. Jadi ketika pada sintaks analisis
regresi dibutuhkan nama data yang akan kita olah maka nama tersebut
yang kita masukkan untuk analisisnya.
Langkah berikutnya yaitu analisis regresi dengan menggunakan fungsi
lm() dan untuk hasil analisisnya menggunakan fungsi summary().
Sintaksnya adalah sebagai berikut:

x=regresi_linear_sederhana$tinggi
y=regresi_linear_sederhana$berat
model=lm(y~x)
summary(model)

90
Regresi
Output:

Call:
lm(formula = y ~ x)

Residuals:
Min 1Q Median 3Q Max
-2.9047 -2.0453 -0.2000 0.4984 10.5638

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -61.55304 8.78578 -7.006 9.26e-06 ***
x 0.81969 0.05829 14.063 3.05e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’
1

Residual standard error: 3.359 on 13 degrees of freedom


Multiple R-squared: 0.9383, Adjusted R-squared: 0.9336
F-statistic: 197.8 on 1 and 13 DF, p-value: 3.05e-09

Interpretasi Hasil:
Uji koefisien regresi
Uji koefisien dilakukan untuk melihat apakah ada pengaruh signifikan
variabel tinggi badan(X) terhadap berat badan(Y)?.

hipotesis nol dan alternatif adalah sebagai berikut:


H0: β1 = 0 (tidak ada pengaruh tinggi badan terhadap berat badan
seseorang)
H1: β1 ≠ 0 (ada pengaruh tinggi badan terhadap berat badan
seseorang)

Hasil analisis:
Dari hasil analisis diperoleh nilai p-value koefisien X sebesar
3.05e-09 lebih kecil dari alfa 0.05. karena nilai p-value < 0.05 maka
tolak H0. Dengan demikian, dapat kita simpulkan bahwa terdapat
pengaruh tinggi badan terhadap berat badan dengan tingkat
keyakinan sebesar 95%.

91
Regresi
Koefisien determinasi
Koefisien determinasi adalah sebagian dari total variasi dalam variabel
dependen yang dijelaskan oleh variasi dalam variabel independen.
Koefisien determinasi juga disebut R-squared dan dilambangkan
sebagai R2. Hasil Output menunjukkan bahwa R-squarednya sebesar
0.9383 atau 93.83%. dengan demikian, 93.83 % dari variasi berat
badan barang dijelaskan oleh variasi tinggi badan, sisanya dijelaskan
variabel lain yang tidak masuk ke dalam model.

Model regresi
Dari hasil output diperoleh model regresi yang menghubungkan
variabel tinggi badan (X) dengan variabel berat badan (Y) secara
linear. Modelnya sebagai berikut:

Yduga = -61.55304 + 0.81969 X

Dari model di atas dapat kita lihat bahwa nilai slope atau koefisien X
nya sebesar 0.81969. angka ini menunjukkan bahwa setiap kenaikan
1 cm tinggi badan maka rata-rata berat badan akan naik sebesar
0.81969 kg. Pada model tersebut juga diperoleh intersep sebesar
-61.55304. angka ini menunjukkan bahwa ketika X nya sama dengan
0 maka nilai Y nya sebesar -61.55304. Jika dilihat dari kasus ini maka
sebenarnya nilai intersepnya tidak punya makna karena cakupan
populasi yang kita bicarakan pasti mempunyai tinggi dan tidak mungkin
sama dengan 0 cm. Jadi, kita tidak perlu memaksakan untuk
meginterpretasikan nilai intersep jika tak bermakna.

Prediksi
Prediksi dalam analisis regresi bisa dilakukan dengan syarat X yang
kita ingin prediksi nilai Y nya masih dalam selang nilai-nilai X pada data
yang kita milki. Jadi, jika kita ingin memprediksikan berat badan dari
nilai tinggi badan tertentu maka sebaiknya nilai tinggi badan tersebut
masih dalam selang data tinggi badan sebelumnya. Misalnya, kita ingin
memprediksikan nilai berat badan jika tinggi badannya sebesar 168
cm. Sintaksnya adalah:

predict(model, data.frame(x=c(168)),interval= "pred")

92
Regresi
Output:
fit lwr upr
1 76.15436 68.32362 83.98511

Hasil output menunjukkan bahwa jika tinggi badan sebsar 168 cm maka
rata-rata berat badan sebesar 76.1546 kg dengan dugaan prediksi
terendahnya 68.32362 kg dan dugaan prediksi tertingginya sebesar
83.98511 kg.

Regresi linear Berganda


Regresi linear merupakan model regresi yang membentuk hubungan
linear antara satu variabel tidak bebas (Y) dengan dua variabel bebas
atau lebih (X1,X2,.....Xn). bentuk model regresi linear sederhana dapat
kita lihat sebagai berikut:

Y = β0 + β1 X1 + β1 X2 + ⋯ + βn Xn + ε
Keterangan:
Y = peubah bebas
β0 = intersep(nilai Y jika X nya sama dengan 0)
βn = slope untuk Xn
Xn = peubah tak bebas ke n
ε = error dari model
Berikut ini adalah contoh gambar model regresi linear berganda dengan
dua variabel bebas.

93
Regresi
Contoh 2
Seorang peneliti ingin melihat pengaruh skor tes kecerdasan dan
frekuensi membaca terhadap nilai ujian siswa. Pada kasus ini diambil 45
siswa untuk dijadikan sampel. Dimisalkan skor tes kecerdasan dengan
X1, frekuensi membaca dengan X2, dan nilai ujian siswa sebagai Y.
Langkah pertama adalah melakukan import data dari excel ke R. Lakukan
cara ini sesuai dengan panduan manajemen data

Setelah di klik “import” pada gambar di atas maka akan muncul tampilan
berikut

94
Regresi
Kemudian pada tampilan R-console juga akan tampil bagian seperti
pada gambar di bawah ini.

Perhatikan lingkaran merah pada gambar di atas! Di gambar tersebut


menunjukkan bahwa nama data yang akan kita olah untuk analisis regresi
adalah regresi_linear_berganda. Jadi ketika pada sintaks analisis
regresi dibutuhkan nama data yang akan kita olah maka nama tersebut
yang kita masukkan untuk analisisnya.
Langkah berikutnya yaitu analisis regresi dengan menggunakan fungsi
lm() dan untuk hasil analisisnya menggunakan fungsi summary().
Sintaksnya adalah sebagai berikut:

x1=regresi_linear_berganda$kecerdasan
x2=regresi_linear_berganda$membaca
y=regresi_linear_berganda$nilai
model=lm(y~x1+x2)
summary(model)

95
Regresi
Output:

Call:
lm(formula = y ~ x1 + x2)

Residuals:
Min 1Q Median 3Q Max
-7.034 -3.358 -1.566 2.906 18.174

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 32.38098 15.26494 2.121 0.03984 *
x1 0.54716 0.17661 3.098 0.00347 **
x2 0.09453 0.10147 0.932 0.35690
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5.649 on 42 degrees of freedom


Multiple R-squared: 0.2092, Adjusted R-squared: 0.1716
F-statistic: 5.557 on 2 and 42 DF, p-value: 0.007228

Interpretasi Hasil:
Uji koefisien regresi
Uji koefisien regeresi dilakukan untuk melihat apakah ada pengaruh
signifikan pada masing-masing variabel bebasnya terhadap variabel
tidak bebas?

Koefisien β1
hipotesis nol dan alternatif adalah sebagai berikut:

H0: β1 = 0 (tidak ada pengaruh skor tes kecerdasan terhadap berat


nilai ujian siswa)
H1: β1 ≠ 0 (ada pengaruh skor tes kecerdasan terhadap berat nilai
ujian siswa)
Hasil analisis:
Dari hasil analisis diperoleh nilai p-value koefisien X sebesar
0.00347 lebih kecil dari alfa 0.05. karena nilai p-value < 0.05 maka
tolak H0. Dengan demikian, dapat kita simpulkan bahwa ada pengaruh
skor tes kecerdasan terhadap nilai ujian siswa dengan tingkat
keyakinan sebesar 95%.

96
Regresi
Koefisien β2
hipotesis nol dan alternatif adalah sebagai berikut:

H0: β2 = 0 (tidak ada pengaruh frekuensi membaca terhadap berat


nilai ujian siswa)
H1: β2 ≠ 0 (ada pengaruh frekuensi membaca terhadap berat nilai
ujian siswa)
Hasil analisis:
Dari hasil analisis diperoleh nilai p-value koefisien X sebesar
0.35690 lebih kecil dari alfa 0.05. karena nilai p-value > 0.05 maka
terima H0. Dengan demikian, dapat kita simpulkan bahwa tidak ada
pengaruh frekuensi membaca terhadap nilai ujian siswa dengan
tingkat keyakinan sebesar 95%.

Uji simultan
Uji simultan digunakan untuk melihat hubungan linear varibel bebas
secara simultan (bersama-sama) terhadap variabel tak bebasnya.
Dalam hal ini, ingin pengaruh skor tes kecerdasan dan frekuensi
membaca secara bersama-sama terhadap nilai ujian siswa.
hipotesis nol dan alternatif adalah sebagai berikut:

H0: β1 = β2 = 0 (tidak ada satupun variabel bebas yang berpengaruh


terhadap variabel tak bebas)
H1: minimal ada satu βi ≠ 0 (minimal ada satu variabel bebas yang
berpengaruh terhadap variabel tak bebas)

Hasil analisis:
Dari hasil analisis diperoleh nilai p-value sebesar 0.007228 lebih kecil
dari alfa 0.05. karena nilai p-value < 0.05 maka tolak H0. Dengan
demikian, dapat kita simpulkan bahwa minimal ada satu variabel tak
bebas yang berpengaruh terhadap variabel bebas dengan tingkat
keyakinan sebesar 95%.

97
Regresi
Koefisien determinasi
Koefisien determinasi adalah sebagian dari total variasi dalam variabel
dependen yang dijelaskan oleh variasi dalam variabel independen.
Koefisien determinasi juga disebut R-squared dan dilambangkan
sebagai R2. Hasil Output menunjukkan bahwa R-squarednya sebesar
0.2092 atau 20.92%. dengan demikian, 20.92 % dari variasi nilai ujian
siswa dijelaskan oleh variabel-variabel bebasnya, sisanya dijelaskan
variabel lain yang tidak masuk ke dalam model.

Model regresi
Dari hasil output diperoleh model regresi yang menghubungkan skor
tes kecerdasan (X1) dan frekuensi membaca (X2) terhadap nilai ujian
siswa (Y) secara linear. Modelnya sebagai berikut:

Yduga = 32.38098 + 0.54716X1 + 0.09453X2

Dari model di atas dapat kita lihat bahwa nilai slope atau koefisien X1
nya sebesar 0.54716. angka ini menunjukkan bahwa setiap kenaikan
1 satuan skor tes kecerdasan maka rata-rata nilai siswa akan naik
sebesar 0.54716 satuan. Pada model tersebut juga diperoleh nilai
slope atau koefisien X2 nya sebesar 0.09453. angka ini menunjukkan
bahwa setiap kenaikan 1 satuan frekuensi membaca maka rata-rata
nilai siswa akan naik sebesar 0.09453 satuan. Kenaikan nilai siswa
sebesar 0.09453 sangatlah kecil karena pada hasil uji koefisien regresi
menunjukkan bahwa frekuensi membaca tidak berpengaruh signifikan
terhadap nilai ujian siswa. Kemudian diperoleh intersep sebesar
32.38098. angka ini menunjukkan bahwa ketika X1 dan X2 nya sama
dengan 0 maka nilai Y nya sebesar 32.38098.

98
Regresi
Latihan
Data tentang kemampuan kerja, pemahaman tugas, motivasi dan
produktivitas kerja
responden x1 x2 x3 y
1 60 59 67 56
2 31 33 41 36
3 70 70 71 71
4 69 69 70 68
5 50 48 49 47
6 30 29 33 34
7 40 48 51 50
8 55 54 60 60
9 58 61 59 61
10 26 34 31 29
11 78 76 75 77
12 45 43 43 46
13 47 56 46 50
14 34 42 43 39
15 57 58 56 56
Sumber data: 2004 Prof. Dr. Sugiyono, metode penelitian bisnis
X1= kemampuan kerja
X2= pemahaman tugas
X3= motivasi
Y= produktivitas kerja
Pada data ini ingin dilihat pengaruh X1,X2, X3 terhadap Y !

Nama file : latihan analisis regresi berganda

99
R commander
Apa itu Rcommander?
Kita telah mempelajari penggunaan R.studio berbasis perintah
(command driven), namun adakalanya pengguna pemula sulit untuk
mengingat serangkaian perintah ataupun formula. Hal ini sudah
diantisipasi oleh para contributor R dengan menyediakan penggunaan
Graphical User Interface (GUI) yang memudahkan pengguna tanpa harus
mengingat serangkaian perintah-perintah. GUI untuk R dalam 1 paket
yang bernama Rcmdr yang berisikan GUI untuk statistika dasar dan
statistika lanjut, meliputi diantaranya pemodelan uji hipotesis, distribusi
(normal, F, binomial, t, Chi-square, poisson), graph (histogram,
scatterplot, boxplot, dan lain lain), statisik deskriptif, pemodelan linier,
generalized-linear, dsb.

Instalasi
Instalasi R Commander
Jika anda terkoneksi dengan Internet dengan melalui Menu
R.studio. fokuslah pada jendela R.studio pada kanan bawah
Packages>install . R secara otomatis akan meminta anda untuk
memilih mirror tempat Rcmdr akan didownload dan diinstal.

100
R commander
Tampilan dan menu R

Jendela A

Jendela B

Jendela C

Pada Rcmdr, terdiri dari tiga sub window (layar) utama, yakni:
A. jendela A yaitu Script Window dimana pada layar menampilkan
perintah (command) R. Perintah dalam bagian ini dapat di edit dan di
eksekusi dan di eksekusi ulang (dengan menekan tobol submit)
B. jendela B yaitu Output Window dimana pada layar menampilkan hasil
perhitungan yang di eksekusi dari Script Window
C. jendela C yaitu Warning Window dimana pada layar menampilkan
peringatan seperti pesan error, data missing, atau adanya paket yang
belum diinstall

101
R commander
Menu dan Sub menu dari R commander
menu keterangan
File Loading, menyimpan file script,
menyimpan output dan R
workspace, keluar aplikasi
edit Cut,copy ,paste,editing konten dari
script dan output windows,
data Membaca dan memanipulasi data,
import data dari file ber-ektensi
Text,SPSS, minitab, STATA
statistics alat analisis statistika dasar
graphs membuat grafik statistic dasar,
seperi histogram, scatterplot,
Boxplot, Pie chart, 3D dan lain lain.

models summary , confidence intervals,


hypothesis tests, diagnostics, dan
graphs untuk model statistic dan
untuk menambahkan kuantitas
diagnostic seperti residual, melihat
kebaikan model menggunakan
AIC, BIC.
Distributions Sebaran kontinyu dan diskrit.

Tools loading paket R yang tidak berelasi


dengan paket Rcmdr (misal,untuk
mengakses data yang tersimpan
dalam paket lain), dan untuk men-
setting
beberapa option
Help Berisikan informasi mengenai R
dan R Commander termasuk
manualnya. Setiap kotak dialog
(dialog box) mempunyai tombol
Help button

102
Pengantar
R commander
R
Memanggil data yang ada di R
Pada menu utama, pilih data yang tersedia Data> Data in
packages>List data set in packages, misalkan kita ingin mengambil data
road dengan menuliskan pada windows script data(road). Maka data road
sudah termasuk dalam active data set yang sewaktu-waktu dapat
digunakan manakala diperlukan. Untuk menambahkan data lainnya
dalam active data set, cukup menuliskan perintah data(nama data) yang
diinginkan

103
R commander

Sebelum menganalisis data yang telah dipanggil, mula-mula data


road diaktifkan dengan mengklik <No active dataset> kemudian pilih road.

104
R commander
Mencari nilai Statistik
Misalkan kita ingin melihat korelasi antara dua variable deaths dan fuel
dalam data(road)¸ maka pilih Statistics> Summaries> Correlation test>
(Pilih variabel dan jenis korelasinya, misal) Pearson product-moment.

Pada Output window nilai korelasi antara variabel fuel dengan


variable death adalah 0.5209 dengan p-value sebesar 0.006354.

105
R commander
Latihan.
1. Panggillah data dari file
Latihan<latihan_analisis_regresi_berganda.xlsx!
a. Keluarkan grafik scatter plot untuk setiap
peubah x terhadap peubah y
b. Cari nilai korelasi setiap peubah
c. Regresikan peubah x1,x2,x3 terhadap y

106

Anda mungkin juga menyukai