Modul Statistik
Modul Statistik
PRAKTIKUM
STATISTIK
JURUSAN PENDIDIKAN
EKONOMI
FAKULTAS EKONOMI
UNIVERSITAS NEGERI
SURABAYA
OLEH:
RIZA YONISA KURNIAWAN, S.Pd., M.Pd
2 | Page
Bab 1
Pengenalan dan Pembuatan File Data
SPSS merupakan salah satu sekian banyak software statistika yang telah dikenal luas
dikalangan penggunaannya. Disamping masih banyak lagi software statistika lainnya
seperti Minitab, Syastas, Microstat dan masih banyak lagi. SPSS sebagai sebuah tools
mempunyai banyak kelebihan, terutama untuk aplikasi di bidang ilmu sosial.
SPSS Environment
MENU BAR
TOOL
BAR
DATA VIEW
VARIABLE VIEW
3 | Page
MENU BAR
2. Systax
3. Output
4. Script
5. Database
NEW
OPEN
Secara umum ada 3 macam ekstensi dalam lembar kerja SPSS, yaitu :
1. *.spo
2. *.sav
3. *.cht
Read Text Data : membuka dokumen dari file text (yang berekstensi txt),
yang bisa dimasukkan/dikonversi dalam lembar data SPSS
Save
: menyimpan dokumen/hasil kerja yang telah dibuat.
Save As
: menyimpan ulang dokumen dengan nama/tempat/type
dokumen yang berbeda
Page Setup
: mengatur halaman kerja SPSS
Print
: mencetak hasil output/data/syntaq lembar SPSS
Ada 2 option/pilihan cara mencetak, yaitu :
- All visible output :mencetak lembar kerja secara keseluruhan
- Selection
: mencetak sesuai keinginan yang kita sorot/blok
Print Preview
: melihat contoh hasil cetakan yang nantinya diperoleh
Recently used data: berisi list file data yang pernah dibuka sebelumnya.
Recently used file : berisi list file secara keseluruhan yang pernah dikerjakan
2. EDIT
Untuk melakukan pengeditan pada operasi SPSS baik data, serta pengaturan/option
untuk konfigurasi SPSS secara keseluruhan.
Undo
Redo
Cut
4 | Page
Paste
Paste after
Paste spesial
Clear
Find
Options
3. VIEW
Untuk pengaturan tambilan di layar kerja SPSS, serta mengetahu proses-prose yang
sedang terjadi pada operasi SPSS.
Status Bar
Toolbar
Fonts
- Outline size
- Outline font
Gridlines
Value labels
4. DATA
Menu data digunakan untuk melakukan pemrosesan data.
Define Dates
: mendefinisikan sebuah waktu untuk variable yang
meliputi jam, tanggal, tahun, dan sebagainya
Insert Variable
: menyisipkan kolom variable
Insert case
: menyisipkan baris
Go to case
: memindahkan cursor pada baris tertentu
Sort case
: mengurutkan nilai dari suatu kolom variable
Transpose
: operasi transpose pada sebuah kolom variable menjadi
baris
Merge files
: menggabungkan beberapa file dokumen SPSS, yang
dilakukan dengan penggabungan kolom-kolom
variablenya
Split file
: memecahkan file berdasarkan kolom variablenya
Select case
: mengatur sebuah variable berdasarkan sebuah
persyaratan tertentu
5. TRANSFORM
Menu transform dipergunakan untuk melakukan perubahan-perubahan atau
penambahan data.
Compute
Count
Recode
5 | Page
6. ANALYSE
Menu analyse digunakan untuk melakukan analisis data yang telah kita masukkan
ke dalam komputer. Menu ini merupakan menu yang terpenting karena semua
pemrosesan dan analisis data dilakukan dengan menggunakan menu correlate,
compare mens, regresion.
7. GRAPH
Menu graph digunakan untuk membuat grafik, diantaranya ialah bar, line, pie, dll
8. UTILITIES
Menu utilities dipergunakan untuk mengetahui informasi variabel, informasi file,
dll
9. AD-ONS
Menu ad-ons digunakan untuk memberikan perintah kepada SPSS jika ingin
menggunakan aplikasi tambahan, misalnya menggunakan alikasi Amos, SPSS data
entry, text analysis, dsb
10. WINDOWS
Menu windows digunakan untuk melakukan perpindahan (switch) dari satu file ke
file lainnya
11. HELP
Menu help digunakan untuk membantu pengguna dalam memahami perintahperintah SPSS jika menemui kesulitan
TOOL BAR
POINTER
Percobaan
Menu File merupakan menu pertama dari Data Editor yang dibuka oleh para pengguna
SPSS. Dimana Data Editor pada SPSS mempunyai dua bagian utama :
1. Kolom, dengan ciri adanya kata var dalam setiap kolomnya. Kolom dalam SPSS akan
diisi oleh variabel.
2. Baris, dengan ciri adanya angka 1, 2, 3 dan seterusnya. Baris dalam SPSS akan diisi
oleh data.
Kasus : Berikut ini data barang di gudang 10 barang diambil secara acak (angka
dalam rupiah)
6 | Page
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Barang
Buku Tulis
Tas Punggung
Dompet
Jam Tangan
Spidol
Kertas File
Gunting
Tempat CD
Pensil Zebra
Penggaris
Harga Pokok/Unit
3000
80000
45000
70000
7000
30000
70000
45000
17000
5000
Stock Di Gudang
5240
40000
22000
2500
7800
25000
7800
5200
22000
10500
Membuat Variabel
b. Comma
c. Dot
f. Dollar
g. Custom currency
f. String
7 | Page
2.
Mengisi Data
Memasukkan data pada Data Editor dilakukan dengan cara mengetik data yang akan
dianalisa pada sel-sel (case) dibawah judul (heading) kolom nama variabel.
3.
Menyimpan Data
Setelah data dimasukkan, maka data perlu disimpan untuk kepeluan analisa
selanjutnya. Langkah penyimpanan data adalah sebagai berikut :
Klik Menu File Save Data (Pilih folder penyimpanan), ketik Nama File
Klik OK.
Latihan
Berikut ini adalah data 15 Responden pria dan wanita sanggar tari PRIMA yang diambil
secara acak :
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
Nama
Adelia
Erick
Anggoro
Amelia
Lidya
Liana
Cicil
Andre
Agus
Lana
Mely
Diana
Oon
Dodi
Agung
Tinggi
165
170
171
166
165
167
166
173
175
174
163
164
170
171
172
Berat
45
60
65
50
46
49
44
70
71
73
65
67
75
74
70
Gender
Wanita
Pria
Pria
Wanita
Wanita
Pria
Wanita
Pria
Pria
Pria
Wanita
Wanita
Pria
Pria
Pria
8 | Page
Bab 2
Ukuran Data Menggunakan Analisa Frekuensi
Distribusi Frekuensi.
Presentasi grafis seperti Histogram, Pie chart dan lainnya.
Untuk mendapatkan gambaran yang lebih jelas tentang data, selain dengan tabel dan
diagram, masih diperlukan ukuran-ukuran lain yang merupakan wakil dari data
tersebut. Ukuran yang dimaksudkan dapat berupa :
Ukuran Pemusatan (Rata-Rata Hitung atau Mean, Median dan Modus)
Ukuran Letak (Quartil dan Persentil)
Ukuran Penyimpangan/Penyebaran (Range, Ragam, Simpangan Baku dan
Galat Baku)
Skewness adalah tingkat kemiringan
Kurtosis adalah tingkat keruncingan
Untuk menganalisa ukuran pemusatan, ukuran letak dan ukuran penyimpangan (ketika
ukuran termasuk ke dalam statistika deskripsi), dapat dilakukan dengan prosedur.
a.
Analyse
b.
Analyse
Descriptive Statistics
Description
c.
Analyse
Descriptive Statistics
Explore
Descriptive Statistics
Frequencies
PROSEDUR : Analyse
Klik menu Analyse
Descriptive Statistics
Descriptive Statistics
Frequencies
Frequencies
Sorot variabel yang akan dianalisa lalu pindahkan ke kotak variabel dengan cara
mengklik tanda
Klik Statistics, berilah tanda pada semua check box Percetile Values
(Keterangan : untuk menentukan nilai Percentile 10,25 dan seterusnya, dilakukan
dengan cara memberi tanda pada check box percentile)
Klik chart, pilih Histogram jika ingin menampilkan
UNIVERSITAS NEGERI SURABAYA 2012
9 | Page
Klik format, beri tanda pada ascending value pada pilihan order by untuk
mengurutkan data dari nilai terkecil terbesar.
Klik OK.
Percobaan
Data nilai UTS Statistik dari 15 anak kelas A yaitu :
Nama
1.
2.
3.
4.
5.
6.
7.
8.
9.
10. 10
11
12
13
14
15
Mimi
Melisa
Yolin
Nina
Parto
Jerry
Tom-Tom
Yusron
Ableh
Stefanus
Chandra
Roy
Ardian
Nita
Mawan
Nilai UTS
90
60
65
55
70
71
72
80
76
56
59
77
85
89
90
10 | P a g e
Latihan
Mentaricell dalam 20 minggu melakukan penjualan dengan data sebagai berikut
Minggu
Penjualan Handphone
Tayangan Iklan
1
118
12
2
180
13
3
186
14
4
132
16
5
178
19
6
156
22
7
148
23
8
196
24
9
188
29
10
152
36
11
123
14
12
147
17
13
155
69
14
178
40
15
165
12
16
187
11
17
136
10
18
195
7
19
222
8
20
546
9
Cari : N, Mean, Std. Eror, Median, Standart Deviasi, Skewness, Kurtosis, Data
Minimum, Data Maksimum, Range, Percentile.
11 | P a g e
BAB 3
ANALISA DESKRIPSI
Teori
Analisa Deskripsi
PROSEDUR : Analyse
Descriptive Statistics
Klik Analyse
Klik Options, tandai pada semua check box ukuran data yang ingin
dianalisis. Klik continue.
Klik OK
Descriptive Statistics
Description
Description
Percobaan
Data barang penjualan Koperasi Mahasiswa :
............................................................................................................
Barang
Harga
1.
Bolpoint
3500
2.
Kertas File
30000
3.
CD Blank
5000
4.
Buku Tulis
5000
5.
Majalah Komputex
35000
6.
Tempat HP
40000
7.
Tempat Pensil
20000
8.
Bingkai Foto
45000
9.
Jepit Rambut
7000
10
Penggaris
5000
12 | P a g e
Latihan
Data dari hasil penelitian kemasan pasta gigi diambil sample sebagai berikut :
Responden
1
2
3
4
5
6
7
8
9
10
Merk
Pepsodent
Ciptadent
Sensodyne
Kodomo
Close Up
Listerin
Switsal
Pepsodent Herbal
Ritadent
Close Up Whitening
Nilai Desain
Kemasan
10
75
86
10
10
91
10
86
70
80
Minat Beli
100
80
94
88
90
96
95
75
60
86
13 | P a g e
Bab 4
Pengujian Rata-Rata Satu Sampel
Teori
Pengertian
Hipotesis dapat diartikan sebagai dugaan mengenai suatu hal, atau hipotesis
merupakan jawaban sementara suatu masalah, atau juga hipotesis dapat diartikan sebagai
kesimpulan sementara tentang hubungan suatu variabel dengan satu atau lebih variabel
yang lain. Namun menurut Prof. Dr. S. Nasution definisi hipotesis adalah pernyataan
tentatif yang merupakan dugaan mengenai apa saja yang sedang kita amati dalam usaha
untuk memahaminya.
Fungsi
Untuk menguji kebenaran suatu teori
Memberikan gagasan baru untuk mengembangkan suatu teori.
Memperluas pengetahuan peneliti mengenai suatu gejala yang sedang dipelajari.
Pengujian hipotesis
Hipotesis yang baik selalu memenuhi dua pernyataan, yaitu :
Menggambarkan hubungan antar variabel.
Dapat memberikan petunjuk bagaimana pengujian hubungan tersebut.
Oleh karena itu hipotesis perlu dirumuskan terlebih dahulu sebelum dilakukan
pengumpulan data. Hipotesis ini disebut Hipotesis Alternatif (Ha) atau Hipotesis kerja
(Hk) atau H . Hipotesis kerja atau H merupakan kesimpulan sementara dan hubungan
antar variabel yang sudah dipelajari dari teori-teori yang berhubungan dengan masalah
tersebut. Untuk pengujian H perlu ada pembanding yaitu Hipotesis Nol (Ho). Ho
disebut juga sebagai Hipotesis Statistik, karena digunakan sebagai dasar pengujian.
Langkah atau prosedur untuk menentukan apakah menerima atau menolak Hipotesis
Statistik (Ho) disebut Pengujian Hipotesis. Oleh karena itu dalam pengujian Hipotesis,
penarikan kesimpulan mengenai populasi didasarkan pada informasi sampel bukan
populasi itu sendiri, maka kesimpulannya dapat saja keliru. Dalam Pengujian Hipotesis
terdapat dua kekeliruan atau galat, yaitu :
Kesimpulan
Keadaan sebenarnya Ho
Ho benar
Terima Ho
tepat
Tolak Ho
galat jenis I ()
Ho salah
galat jenis II ()
tepat
Penarikan kesimpulan dinyatakan tepat apabila kita menerima Ho, karena memang
Ho benar, atau menolah Ho, karena memang Ho salah. Apabila kita menyimpulkan
menolak Ho padahal Ho benar, maka kita telah melakukan kekeliruan yang disebut
kekeliruan atau galat jenis I (). Begitu pula sebaliknya jika kita menyimpulkan untuk
menerima Ho padahal Ho salah, maka kita telah melakukan kekeliruan yang disebut
kekeliruan atau galat jenis II ().
UNIVERSITAS NEGERI SURABAYA 2012
14 | P a g e
Jika nilai diperkecil, maka akan menjadi besar. Nilai biasanya ditetapkan
sebesar 0,05 atau 0,01. Jika = 0,05, artinya 5 dari setiap 100 kesimpulan kita akan
menolak Ho, yang seharusnya diterima. Harga (1- ) disebut Kuasa Uji atau Kekuatan
Uji.
Teknik dalam pengujian hipotesis dilakukan berdasarkan :
a. Pengujian Satu Pihak
Ho : = o
H : > o
H : < o
b. Pengujian Dua Pihak
Ho : = o
H : # o
Pengujian rata-rata satu sampel dimaksudkan untuk menguji nilai tengah atau
rata-rata populasi sama dengan nilai tertentu o, lawan hipotesis alternatifnya bahwa
nilai tengah atau rata-rata populasi tidak sama dengan o. Jadi kita akan menguji :
Ho : = o
lawan
H : # o
atau
t > t /2(n-1).
5. Perhitungan, dari data : rata-rata x = 10.06 dan simpangan baku sampel s = 0.2459.
x-
t=
= 0,772
s/n
15 | P a g e
1. Masukkan data diatas pada Data View, namun sebelumnya kita harus
menentukan nama dan tipe datanya pada Variable View.
2. klik Menu Analyze
Compare Means
= Standar Error
= nilai hitung
Df
= derajat kebebasan
Sig (2-tailed)
= probabilitas (/2)
16 | P a g e
Latihan
Seorang pengusaha berpendapat bahwa rata-rata penjualan perhari karyawankaryawannya adalah sebesar Rp. 1.020,00 dengan alternatif tidak sama dengan itu. Untuk
maksud pengujian pendapatnya, pengusaha tersebut melakukan wawancara terhadap 20
orang karyawannya yang dipilih secara acak. Dengan menggunakan = 0,05. ujilah
pendapat tersebut dan berikan analisa anda. Hasil wawancaranya adalah sebagai berikut.
Nama
aan
andi
beril
bona
cici
dimas
erik
gogon
Hari
heru
ila
osin
mima
neni
sila
Siqi
Tata
Tita
Wina
zula
Penjualan (Rp.)
1000
980
880
970
850
750
770
920
870
900
930
1080
1200
1040
1040
850
950
1100
1110
990
17 | P a g e
BAB 5
Pengujian Rata-Rata Dua Sampel
.
Teori
Untuk pengujian rata-rata dua sampel terdapat 2 jenis data :
1. Dua Sampel Berpasangan.
Artinya kedua sampel bersifat mutually exclusive (saling asing) dan
banyaknya pengamatan (ulangan) sama pada masing-masing sampel.
2. Sampel Bebas / Independen.
Pada pengujian rata-rata dua sampel berpasangan, banyaknya nilai
pengamatan harus sama (n1=n2), sedangkan pada dua sampel yang bebas
banyaknya pengamatan tidak harus sama.
Percobaan
1.
Langkah penyelesaiannya adalah sebagai berikut :
1. Masukkan data diatas pada Data View, namun sebelumnya kita harus
nenentukan nama dan tipe datanya pada Variable View.
2. Klik Analyze
Compare Means
18 | P a g e
2. misal kita akan menguji sampel pada taraf nyata = 0.05 bahwa masa putar
roda pada sepeda 1 berbeda dengan sepeda 2. Data masa putar roda (menit)
kedua sepeda tersebut adalah :
sepeda 1
sepeda 2
55
65
65
58
Compare Means
Latihan
Seorang guru berpendapat bahwa tidak ada perbedaan nilai rata-rata murid
kelas A dan murid kelas B, namun dengan alternatif ada perbedaan. Untuk
menguji pendapat tersebut, kemudian dilakukan penelitian berdasarkan penarikan
sampel secara acak dimana ada 8 murid kelas A dan 6 murid kelas B. Ternyata
hasil penelitian nilai siswa adalah sebagai berikut :
Kelas A
Kelas B
19 | P a g e
Bab 6
ANALISA DATA KATEGORIK
Dalam bab ini kita akan membahas analisis data kategorik (analysis of categorical data)
menggunakan uji khi kuadrat (chi-square test), yaitu uji khi kuadrat untuk satu variabel
kategorik ( one categorical variable) yang disebut uji kebaikan suai khi kuadrat ( chisquare goodness-of-fit test) dan uji khi kuadrat untuk dua variabel kategorik ( two
categorical variable) yang disebut uji khi kuadrat untuk kebebasan (chi square test for
independence).
20 | P a g e
Frekuensi
tersebut
Strawberry
32
Vanilla
30
Coklat
28
Jeruk
58
Nanas
52
total
200
konsumen
yang
memilih
rasa
Apakah ada preferesi tertentu konsumen terhadap kelima rasa pasta gigi tersebut ?
( gunakan = 0,01 ).
Penyelesaiannya :
Ada 5 kategori untuk variable kategorik rasa pasta gigi, k= 5.
Frekuensi harapan =
= 40.
Bentuk hipotesis :
H0 : preferensi terhadap kelima rasa pasta gigi sama.
H1 : preferensi terhadap kelima rasa pasta gigi tidak sama.
Atau
H0 : strawberry = vanila = coklat = jeruk = nanas = 40
H1 : tidak semua strawberry = vanila = coklat = jeruk = nanas sama dengan 40.
2.
21 | P a g e
3.
4. pilih option weight cases by. Masukkan variabel frekuensi. Lalu klik ok.
5.
lalu klik analyze pilih nonparametric Test, Chi-Square. Pindahkan variabel rasa
pasta gigi [rasa] ke dalam box test variable(s). klik option. Pilih descriptive lalu
klik continue.
6.
kemudian klik ok maka akan di dapat hasil analisi chi-square goodness-of-fit test
sebagai berikut :
Descriptive Statistics
rasa
gigi
pasta
Mean
Std.
Deviation
Minimu
m
Maximu
m
200
3.34
1.419
22 | P a g e
Chi-Square Test
Frequencies
rasa pasta gigi
Observed
N
Expected
N
Residual
strawberr
32
y
40.0
-8.0
vanila
30
40.0
-10.0
coklat
28
40.0
-12.0
jeruk
58
40.0
18.0
nanas
52
40.0
12.0
Total
200
Test Statistics
19.400
df
Asymp. Sig.
.001
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell
frequency is 40.0.
interpretasi hasil
untuk chi-square goodness-of-fit test, SPSS memberikan hasil 2 = 19.4 dengan derajat
kebebasan = k-1 =5-1 =4 dan P-value = 0.001. karena P-value=0.001 lebih kecil dari
=0.01, maka H0 : strawberry = vanila = coklat = jeruk = nanas = 40 di tolak.
Kesimpulan preferensi konsumen terhadap kelima rasa pasta gigi tidak sama.
23 | P a g e
24 warna biru. Gunakan taraf signifikan =0.01, untuk menguji apakah distribusi warna
permen sesuai dengan pernyataan pabrik.
Penyelesaianya:
Bentuk hipotesis :
H0 : coklat =56,4; hijau = 37,6; merah =37,6; kuning =37,6; biru = 18,8.
H1 :Distribusi warna permen coklat kacang tidak sesuai dengan coklat =56,4; hijau =
37,6; merah =37,6; kuning =37,6; biru = 18,8.
Dimana :
coklat =30% x 188= 56,4.
2.
3.
24 | P a g e
4. pilih option weight cases by. Masukkan variabel frekuensi. Lalu klik ok.
5.
lalu klik analyze pilih nonparametric Test, Chi-Square. Pindahkan variabel warna
permen [warna] ke dalam box test variable(s). pada Expected value. Pilih values
masukkan ke lima frekuensi harapan lalu klik add.
6.
klik menu option. Pilih descriptive lalu klik continue. Lalu klik ok
7.
maka akan di dapat hasil analisis chi-square goodness-of-fit test sebagai berikut :
Descriptive Statistics
warna
permen
Mean
Std.
Deviation
Minimu
m
Maximu
m
188
2.53
1.404
Chi-Square Test
Frequencies
warna permen
Observed
N
Expected
N
Residual
coklat
67
56.4
10.6
hijau
24
37.6
-13.6
merah 51
37.6
13.4
kunin
g
22
37.6
-15.6
biru
24
18.8
5.2
Total
188
25 | P a g e
Test Statistics
warna permen
Chi-Square(a)
19.598
df
Asymp. Sig.
.001
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell
frequency is 18.8.
interprestasi hasil
. karena P-value=0.001 lebih kecil dari =0.01, maka H 0 : coklat =56,4; hijau = 37,6; merah
=37,6; kuning =37,6; biru = 18,8. Ditolak
Kesimpulan distribusi warna permen coklat kacang tidak sesuai dengan pernyataan
pabrik.
Dibawah 25
25-49
50 keatas
Dengan kekerasan
15
30
10
Tanpa kekerasan
30
10
Apakah data tersebut menunjukkan bahwa tipe tindak kriminal tergantung pada usia
pelaku? gunakan =0.05.
penyelesaiannya
hipotesis:
H0 : tipe tindak kriminal tidak tegantung pada usia pelaku.
UNIVERSITAS NEGERI SURABAYA 2012
26 | P a g e
2.
kemudian pada lembar data view kita masukkan data sebagai berikut :
a. untuk tipe tindak kriminal 1 = dengan kekerasan dan usia 1 = dibawah 25
dengan frekuensi data 15.
b. untuk tipe tindak kriminal 1 = dengan kekerasan dan usia 2 = 25-49 dengan
frekuensi data 30.
dan seterusnya
3.
4.
5.
pindahkan variabel tipe tindak kriminal [kriminal] ke box row(s) dan variabel
kelompok usia[usia] ke dalam box column(s).
27 | P a g e
6.
klik cells, pada pilihan counts pilih observed dan expected, lalu klik continue.
7.
8.
Missing
Total
Percen
t
N
Percen
t
N
Percent
100.0
%
.0%
100.0%
100
kelompok usia
UNIVERSITAS NEGERI SURABAYA 2012
28 | P a g e
tanpa
kekerasn
Count
Total
30
10
45
Expected
Count
9.0
27.0
9.0
45.
0
Count
20
60
20
100
Expected
Count
20.0
60.0
20.0
100
.0
Chi-Square Tests
Value
df
Asymp.
Sig.
(2sided)
4.040(a)
.133
Likelihood Ratio
4.231
.121
Linear-by-Linear
Association
2.500
114
Pearson
Square
Chi-
N of Valid Cases
100
a 0 cells (.0%) have expected count less than 5. The minimum expected count is 9.00.
interpretasi hasil
. untuk chi-square test for independence, SPSS memberikan hasil 2 = 4,040 dengan derajat
kebebasan
= (r-1)(c-1)=(2-1)(3-1)=2 dan P-value=0,133. Karena P-value=0,133 lebih besar dari
=0.05, maka
H0 : tipe tindak kriminal tidak tergantung pada kelompok usia pelaku tidak dapat
ditolak.
Kesimpulan tipe tindak kriminal tidak tergantung pada kelompok usia pelaku.
Rumus chi-square test
Rumus untuk uji kebaikan suai (goodness-of-fit test) adalah sebagai berikut :
UNIVERSITAS NEGERI SURABAYA 2012
29 | P a g e
kolom ke-
kolom ke-
: jumlah frekuensi pada baris baris ke: jumlah frekuensi pada baris kolom ke: jumlah total frekuensi
r
BAB 7
ANALISA RAGAM SATU ARAH
Analisa ragam satu arah ( oneway ANOVA) digunakan untuk membandingkan mean lebih
dari satu.
UNIVERSITAS NEGERI SURABAYA 2012
30 | P a g e
Production line 2
Production line 3
4.1
2.5
2.6
3.9
2.4
2.2
41
3.0
2.2
3.5
1.5
2.5
1.2
1.2
Apakah ketiga production line tersebut menghasilkan produk dengan kualitas yang sama ?
gunakan = 0,01.
Penyelesaiannya
1. pada lembar variable view kita definisikan variabel production line dengan nama
variabel line dan di beri label production line seta value 1 = production line 1; 2 =
production line 2;3 =production line 3. Untuk variabel jumlah produk yang cacat
gunakan nama cacat dan diberi label jumlah produk cacat.
2.
kemudian pada lembar data view kita masukkan data line dan cacat sebagai berikut
3.
31 | P a g e
4.
pindahkan variabel jumlah produk cacat [cacat] ke dependen list. Dan variabel
production line ke factor.
5.
untuk menghitung post Hoc Multiple Comparison dengan asumsi ketiga sample
production line memiliki ragam ( variance ) yang sama, klik tombol berjudul Post
Hoc. Pilih Bonferroni dan Scheffe lalu continue.
6.
kemudian klik option pilih homogeneity of variance test untuk menguji asumsi
apakah ketiga sampel production line berasal dari populasi yang mempunyai ragam (
variance ) sama. Lalu klik continue.
7.
df1
df2
Sig.
32 | P a g e
1.613
11
.243
ANOVA
jumlah produk cacat
Sum of
Mean
Squares df
Square
Between
9.274
Groups
Within Groups 3.378
Total
12.652
4.637
11
13
.307
Sig.
15.098
.001
Homogeneous Subsets
jumlah produk cacat
production line
Scheffe
(a,b)
N
1
production line 3 6
production line 2 4
production line 1 4
Sig.
3.900
1.000
Interpretasi hasil
Dari test of homogeneity of variance di dapat nilai P-value = 0,243 yang lebih besar
dari = 0,01. Sehingga H0 : 12 = 22 = 32 tidak dapat ditolak. Kesimpulan ketiga
sampel production line berasal dari populasi yang memiliki ragam sama.
Dari tabel ANOVA di dapat nilai sttistik F= 15,098 dengan derajar kebebasan K-1=
3 = 2 dan n-k =14-3 = 11 dan P-value = 0,0001. Karena P-value lebih kecil dari =
0,01, maka H0 : 1 = 2 = 3 ditolak. Kesimpulan ketiga production line
menghasilkan produk dengan kualitas yang berbeda.
33 | P a g e
Latihan
1. seseorang ingin mengetahui apakah ada perbedaan terhadap pertambahan berat
badan 3 kelompok bayi berusia 2 bulan apabila di perlakukan dengan 3 cara
pemberian ASI dan diperoleh datanya sebagai berikut :
BB1
350
375
380
370
410
400
500
475
385
420
BB2
300
300
275
290
310
330
350
290
310
305
BB3
342
310
290
370
340
330
350
400
450
325
Ket:
BB1 = berat badan bayi berumur 2 bulan yang hanya diberi ASI saja
BB2 = berat badan bayi berumur 2 bulan yang Tidak diberi ASI saja
BB3 = berat badan bayi berumur 2 bulan yang hanya diberi ASI dan susu bayi
Gunakan = 0,05.
BAB 8
ANALISA RAGAM DUA ARAH
Analisa ragam dua arah ( Twoway Analysis of Variance) digunakan untuk membandingkan
mean lebih dari dua sampel yang diklasifikasikan menjadi dua factor atau dua klasifikasi.
Ada tiga bentuk hipotesis analisa ragam dua arah :
Untuk factor pertama (A) :
H0 :
= =
34 | P a g e
= =
Nama
mahasiswa
Nilai kuis
Matematika
statistika
Bahasa
inggris
Bahasa
indonesia
andy
75
74
72
70
72
73
78
79
76
77
79
80
diah
79
77
78
85
87
88
82
80
81
80
83
81
35 | P a g e
hendra
70
71
72
74
76
77
81
84
83
76
75
73
sinta
55
54
53
54
53
56
53
50
52
54
50
53
yanti
80
82
84
84
83
81
82
81
85
83
82
80
Penyelesaiannya.
1.
2.
3.
kemudian klik analyze dan klik general linear model lalu pilih univariate.
4.
pindahkan variabel nilai kuis [nilai]. Kedependen variable dan variabel mahasiswa
[mahasiswa] serta variabel matakuliah[mtkuliah] ke Fixed factor(s).
36 | P a g e
5.
untuk menghitung Post Hoc Multiple Comparison terhadap variabel mahasiswa dan
variabel mata kuliah. Klik post Hoc. Pundahkan factor mahasiswa dan mtkuliah ke
post hoc test for dan kemudian pilih Bonferroni biladiasumsikan sama dan GamesHowell bila di asumsikan variance tidak sama.
Disini kita memilih Bonferroni karena belum tahu asumsi mana yang bisa dipenuhi.
6.
7.
kemudian klik continue lalu klik ok. Maka akan didapat hasil sebagai berikut :
Univariate Analysis of Variance
Between-Subjects Factors
Mahasisw
a
Matakulia
h
1
2
3
4
5
1
2
Value
Label
Andy
12
Diah
Hendra
Sinta
Yanti
Matematik
a
Statistika
12
12
12
12
15
15
37 | P a g e
3
4
Bahasa
Inggris
Bahasa
Indonesia
15
15
df1
df2
Sig.
.370
19
40
.989
Tests the null hypothesis that the error variance of the dependent variable is
equal across groups.
a Design: Intercept+mahasisw+mtkuliah+mahasisw * mtkuliah
Tests of Between-Subjects Effects
Dependent Variable: Nilai Kuis
Type
III
Sum
of
Source
Squares
df
Corrected Model
7300.600(a
19
)
Intercept
325901.40
1
0
mahasisw
6854.267
4
mtkuliah
92.600
3
mahasisw
*
353.733
12
mtkuliah
Error
94.000
40
Total
333296.00
60
0
Corrected Total
7394.600
59
Mean
Square
Sig.
384.242
163.507
.000
1713.567
30.867
138681.
447
729.177
13.135
29.478
12.544
325901.400
.000
.000
.000
.000
2.350
Andy
Diah
Hendra
Mean
Difference (I- Std.
J)
Error
Upper
Lower Bound Bound
-6.33(*)
.626
-.58
.626
Sig.
Lower
Bound
.000
1.000
38 | P a g e
Diah
Hendra
Sinta
Yanti
Sinta
Yanti
Andy
Hendra
Sinta
Yanti
Andy
Diah
Sinta
Yanti
Andy
Diah
Hendra
Yanti
Andy
Diah
Hendra
Sinta
22.33(*)
-6.83(*)
6.33(*)
5.75(*)
28.67(*)
-.50
.58
-5.75(*)
22.92(*)
-6.25(*)
-22.33(*)
-28.67(*)
-22.92(*)
-29.17(*)
6.83(*)
.50
6.25(*)
29.17(*)
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.626
.000
.000
.000
.000
.000
1.000
1.000
.000
.000
.000
.000
.000
.000
.000
.000
1.000
.000
.000
20.47
-8.69
4.47
3.89
26.81
-2.36
-1.28
-7.61
21.06
-8.11
-24.19
-30.53
-24.78
-31.03
4.97
-1.36
4.39
27.31
24.19
-4.97
8.19
7.61
30.53
1.36
2.44
-3.89
24.78
-4.39
-20.47
-26.81
-21.06
-27.31
8.69
2.36
8.11
31.03
Interpretasi hasil
Dari tabel levenes test of equality of error variance yang menguji hipotesis
H0 : variance diasumsikan sama
H1 : variance diasumsikan tidak sama
Didapat hasil P-value = 0,989 yang lebih besar dari = 0,05 sehingga H0 : variance
diasumsikan sama tidak dapat ditolak. Kesimpulan variance sama.
Dari tabel ANOVA di dapat nilai statistik untuk main effect sebagai berikut :
a. Faktor mahasiswa : nilai uji F = 729,177 dengan derajat kebebasan r -1 = 5 -1
= 4 dan rc(n-1) = 5x4(3-1) = 40 serta P-value=0,000. Karena P-value lebih kecil
dari =0,05, maka H0 : andy = diah = hendra = sinta = yanti ditolak. Kesimpulan
kelima mahasiswa mepunyai kemampuan yang berbeda.
b. Faktor matakuliah nilai uji F = 13,135 dengan derajar kebebasan c -1 = 4-1
= 3 dan rc(n-1) = 5x4(3-1) = 40 serta P-value=0,000. Karena P-value lebih kecil
dari =0,05, maka H0 : matematika = statistika = bahasainggris = bahasa indonesia ditolak.
Kesimpulan keempat mata kuliah mepunyai tingkat kesulitan yang berbeda.
39 | P a g e
Latihan
1. Suatu perusahaan roti menduga bahwa penataan roti pada etalase yang dipajang
mempengaruhi penjualan roti. Penataan roti pada etalase meliputi tinggi (A :A 1 , A2,
A3) dan lebar (B1,B 2, B3). Apabila tingkat penjualan di ukur dari banyaknya roti
yang terjual dan asumsikan = 0,05 diperoleh data sebagai berikut :
Faktor B
Faktor A
B1 ( regular)
B2 (non regular)
A1 (dasar)
47
43
46
40
A2 (tengah)
62
68
67
71
A3 (tengah)
41
39
42
46
BAB 9
ALALISIS REGRESI SEDERHANA
Analisis regresi sederhana digunakan untuk mempredeksi nilai suatu variabel dependen y
berdasarkan nilai variabel independen x. analisis regresi juga dapat digunakan untuk
melihat pengaruh variabel independen x terhadap variabel dependen y. variabel independen
x sering disebut sebagai variabel prediktor, sedangkan variabel dependen y sering disebut
sebagai variabel respons.
Contoh kasusnya adalah sebagai berikut :
Sebuah perusahaan jeans memperkirakan bahwa iklan di televisi akan meningkatkan
permintaan produk jeans perusahaan tersebut. Bagian marketing perusahaan tersebut
membuat model persamaan regresi untuk mempredeksi permintaan produk berdasarakan
biaya iklan yang pernah dianggarakan dan digunakan selama 19 tahun terakhir seperti
tercantum dalam tabel berikut :
UNIVERSITAS NEGERI SURABAYA 2012
40 | P a g e
Tentukan persamaan regresi untuk data diatas. Apakah regresi yang didapat signifikan.
Gunakan = 0,05.
Penyelesaiannya
Bentuk hipotesis untuk menguji koefisien b0 dan b1
H0 : 0 = 0, H0 : 0
0 DanH1 : 1 = 0 , H0 : 1
pada lembar variable view kita definisikan variabel jumlah permintaan jeans
dengan nama variabel jeans dan labelnya jumlah permintaan jeans. Untuk variabel
biaya iklan gunakan nama iklan dan labelnya biaya iklan.
2.
3.
41 | P a g e
4.
pastikan anda memilih method : enter. Kemudian klik ok., maka akan di dapat hasil
sebagai berikut :
Model Summary
Mode
l
R
1
.969(a)
Adjusted
R Square R Square
.938
.935
Std. Error
of
the
Estimate
3.019
ANOVA(b)
Sum of
Mean
Squares df
Square
Sig.
2363.055 1
2363.055
259.266
.000(a)
154.945 17
2518.000 18
9.114
Coefficients(a)
Unstandardized
Standardized
Coefficients
Coefficients t
Std.
B
Error
Beta
B
74.673
2.124
35.161
Sig.
Std.
Error
.000
24.280
.000
Model
(Constant)
Biaya
Iklan
1.508
.969
16.102
dari R2 (R square ) dari tabel Model Summary menunjukkan bahwa 93,8% dari
variance jumlah permintaan jeans dapat di jelaskan oleh perubahan dalam
variabel biaya iklan
42 | P a g e
BAB 10
ANALISA REGRESI LINEAR BERGANDA
UNIVERSITAS NEGERI SURABAYA 2012
43 | P a g e
Analisa regresi linear berganda adalah pengembangan dari analisa regresi linear sederhana
dimana terdapat lebih dari satu variabel independen x. analisa ini digunakan untuk melihat
sejumlah variabel independen x1 , x2 , xk terhadap variabel dependen y berdasarkan nilai
variabel-variabel independen x1 , x2 , xk.
Contoh kasusnya adaalah sebagai berikut :
Suatu perusahaan memiliki data usia, income sales person, dan pengalaman kerja sebagai
sales. Perusahaan itu ingin membuat model regresi berganda untuk memprediksi income
berdasarkan usia dan pengalaman kerja. Data dapat dilihat pada tabel dibawah ini ;
Usia (x1)
Income (y)
31
35400
41200
38
45000
39
40300
30
22000
28
28000
20
13000
23
22000
25
26000
28
27000
29
30000
Tentukan koefisiensi dari persamaan regresi berganda dan tentukan apakah koefisiensi
yang diperoleh signifikan. Lakukan pula estimasi untuk seorang sales yang berusia 40
tahun dengan pengalaman kerja 4 tahun. Gunakan = 0,05.
Penyelesaiannya
1.
pada lembar variable view kita definisikan variabel usia dengan nama usia. Variabel
pengalaman kerja dengan nama pengalaman, dan variabel income dengan nama
income. Untuk variabel pengalaman kerja di beri label pengalaman kerja.
2.
3.
kemudian klik analyze, regression, lalu pilih linear. Pindahkan variabel income ke
dependent dan variabel usia serta pengalaman kerja ke independent(s)
44 | P a g e
4.
pastikan method : enter telah terpilih, lalu klik statistics dan pilih estimates, model
fit, collinearity diagnostics dan durbin-waston
5.
kemudian klik continue , lalu klik plots. Pilih normal probability plot. Kemudian
pindahkan standardized residual *BZRESID ke dalam kotak Y dan standardized
predicted value *ZPRED ke dalam kotak X.
6.
kemudian klik continue , lalu klik ok maka akan di dapat hasil sebagai berikut :
Variables Entered/Removed(b)
Mode Variables
l
Entered
1
Variables
Removed
Pengalam
an Kerja, .
usia(a)
Method
Enter
45 | P a g e
Adjusted
R Square R Square
Std. Error
of
the DurbinEstimate
Watson
.941
2615.354
.970(a)
.927
1.497
Sum of
Squares df
Mean
Square
Regressio
n
8769684
63.994
438484231.
64.105
997
Residual
5472062
6.915
6840078.36
4
Total
9316890
90.909
10
Sig.
.000(a)
Residuals Statistics(a)
Minimu
Maximu
Mean
Std.
46 | P a g e
Predicted Value
13661.4
5
43598.7
9
29990.9
1
9364.659
11
Residual
3672.42
9
3071.74
0
.000
2339.244
11
Std.
Value
Predicted
Deviation
N
o
r
m
a
l
P
P
P
l
o
t
o
f
R
e
g
r
e
s
i
o
n
S
t
a
n
d
a
r
d
i
z
e
d
R
e
s
i
d
u
a
l
1
.
0
Std. Residual
-1.744
1.453
.000
1.000
11
-1.404
1.175
.000
.894
11
R
egrsionStandrizedR
esidual ExpectdCumProb
chart
0
.
8
0
.
6
0
.
4
0
.
2
0
.0
.0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
O
b
s
e
r
v
e
d
C
u
m
P
r
o
b
S
c
a
te
rp
lo
t
.1
1
5
.0
0
.-0
5
.-1
0
.-1
5
..0
5-2R
-1
0
e
g
re
s
io
n
S
ta
n
d
a
rd
iz
e
d
P
re
d
ic
te
d
V
a
l1
u
e2
Interpretasi hasil
Nilai R2 (R square) dari tabel model summary menunjukkan bahwa 94.1% dari
variance income dapat di jelaskan oleh perubahan dalam variabel usia dan
pengalaman kerja
Nilai uji statistik durbin-watson = 1,497. Jadi dapat diasumsikan tidak terjadi
autocorrelation.
47 | P a g e
Hasil uji-t : t = 7,605 dengan derajat kebebasan n-k = 11-2-1= 8, dan P-value =
0.000 yang lebih kecil dari dari = 0,05.. hal ini merupakan bukti kuat
penolakan H0 : 1 = 0.
b. Variabel pengalaman kerja : H0 : 2 = 0. Terhadap H1:2
Hasil uji-t :t = 3,169 dengan derajat kebebasan n-k = 11-2-1= 8, dan P-value =
0.013 yang lebih kecil dari dari = 0,05.. hal ini merupakan bukti kuat
penolakan H0 : 2 = 0.
Sehingga dapat disimpulkan bahwa koefisien regresi tidak ada yang bernilai
nol.
Persamaan regresi berganda yang diperoleh dengan menggunakan metode kuadrat
terkecil kriteria adalah
= -10360,5 + 1201,098x1 + 1663,516 x2
dimana : = income, x1 = usia, x2 = pengalaman kerja.
Dari tabel coefficients juga terlihat baha nilai VIF = 1,377 sehingga masih dapat
dianggap tidak terjadi multicollinearity ( atau tepatnya hanya low collinearity).
Dari normal probability plot juga terlihat bahwa titik-titik data berbentuk pola
linear sehinggga konsisten dengan distribusi normal.
Scatterplot anatara *ZRESID dan *ZPRED tidak membentuk pola tertentu,
sehingga bias dianggap residual mempunyai variance konstan. ( homoscedasticity)
BAB 11
ANALISA REGRESI LOGISTIK
Analisa regresi logistik digunakan untuk melihat pengaruh sejumlah variabel independen
x1, x2 xk terhadap variabel dependen y yang berupa variabel kategorik ( binominal, multi
UNIVERSITAS NEGERI SURABAYA 2012
48 | P a g e
nominal, atau ordinal ) atau juga untuk memprediksi nilai suatu variabel dependen y ( yang
berupa variabel kategorik ) berdasarkan nilai variabel-variabel independen x1, x2 xk .
Regresi logistik biner
Adalah regresi logistik dimana variabel dependennya berupa variabel dikotomi atau
variabel biner, misalnya sukses-gagal, ya-tidak, benar-salah dll.
Contoh kasusnya adalah sebagai berikut :
Seorang peneliti mengamati pengaruh merokok dan berat badan terhadap detak jantung
saat responden beristirahat. Detak jantung responden di kategorikan menjadi 1= tinggi dan
0=rendah, variabel merokok dikategorikan menjadi 1=merokok dan 0= tak merokok.
Berikut data ini datanya:
Detak jantung
1= tinggi, 0= rendah
1
0
0
0
0
0
0
0
0
1
0
0
0
1
0
1
0
0
0
0
0
0
1
0
1
1
0
0
1
0
Merokok
1= merokok, 0= tak merokok
1
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
1
0
1
0
1
0
0
Berat badan
kg
68
71
57
86
70
77
70
98
59
59
70
74
57
61
57
54
55
52
46
75
68
50
53
79
43
57
60
80
68
90
Tentukan persamaan regresi logistik biner dan tentukan apakah koefisien regresi yang
diperoleh signifikan. Gunakan =0,05
Penyelesaiannya
n = 30 , y = detak jantung, x1 = merokok, x2 = berat badan.
1.
49 | P a g e
b. untuk variabel merokok beri nama merokok dan labelnya merokok, sedang
value labelnya 1 = merokok ;2 = tak merokok .
c. untuk variabel berat badan beri nama berat dan labelnya berat badan,
2.
3.
kemudian klik analyze, regression. Pilih binary logistic. Pindahkan variabel detak
jantung [detak] ke dependent dan variabel merokok [merokok] dan berat
badan[berat] ke covariates.
4.
pastikan method : enter telah terpilih. Kemudian klik ok, maka akan didapat hasil
sebagai berikut :
Logistic Regression
Case Processing Summary
Unweighted Cases(a)
Percent
30
100.0
Missing Cases
.0
Total
30
100.0
Unselected Cases
.0
Total
30
100.0
Selected Cases
Included
Analysis
in
a If weight is in effect, see classification table for the total number of cases.
Dependent Variable Encoding
Original
Value
Internal
Value
Rendah
Tinggi
Classification Table(a,b)
Observed
Predicted
Detak Jantung
Percentage
Correct
50 | P a g e
Step
0
Detak Jantung
Rendah
Tinggi
Rendah
Tinggi
Rendah
22
100.0
.0
Overall Percentage
73.3
Model Summary
Step
-2
Log Cox
&
likelihoo Snell
R Nagelkerke
d
Square
R Square
23.178(a) .321
.468
Interpretasi hasil
tabel dependen variable enconding menunjukkan variabel detak jantung diberi kode
1= tinggi dan 0= rendah.
Output block : 0 beginning block
1. Classification table menunjukkan tabel 2x2 dengan kolom berupa predicted values
dari variabel dependen dan baris berupa niali data aktual yang diamati. Untuk
model yang sempurna, semua cases akan terletak pada diagonal tabel dan overall
51 | P a g e
percentage akan bernilai 100%. Jika model regresi logistic mempunyai variance
sama, maka nilai persen (%) pad akedua baris hampir sama. Overall percentage
yang memprediksi model dengan benar mempunyai nilai cukup baik sebesar
100% - 73,3 %.
2. Tabel variables in the equation yang hanya berisi constant memberikan nilai b0 =
-1,102 atau exp(-1,012)= -1,012 = 0,364. Karena responden yang mempunyai detak
jantung tinggi ada 8 dan yang mempunyai detak jantung rendah ada 22, maka odd
ratio =
= 0,364 .
3. Uji wald pada tabel variables in the equation digunakan untuk menguji apakah
masing-masing koefisien regresi logistik signifikan. Uji wald sama dengan
kuadrat dari rasio koefisien regresi logistic B dan standar error S.E . dalam contoh
ini uji wald
=[
]2 =
Atau
=exp (8,016 0,166 berat + 3,425 merokok)
6.
52 | P a g e
End of Modul
UNIVERSITAS NEGERI SURABAYA 2012