K13 - Statistik Non Parametrik Untuk Uji Kemaknaan Sampel Tunggal

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 42

Statistik Non Parametrik

untuk Uji Kemaknaan


Sampel Tunggal
(lanjutan)
Oleh : Arifa Masyitah P., M.Kes.
Uji Kesesuaian
Kolmogorov Smirnov
 Kegunaan : test goodness of fit  tingkat kesesuaian
antara distribusi serangkaian sampel (skor yang
diobservasi) dengan suatu distribusi teoritis tertentu

 Umumnya digunakan untuk menguji asumsi


normalitas data

 Data berskala ordinal, namun dapat digunakan juga


bagi data berskala nominal

 Jenis data adalah interval dan rasio, namun distribusi


datanya tidak mengikuti distribusi normal
RUMUS

𝑫 = 𝑭𝒐 𝒙 − 𝑭𝒕 (𝒙)ȁ𝐦𝐚𝐤𝐬

D = penyimpangan
F0 x = distribusi kumulatiif teoritis
Fn x = distribusi kumulatif hasil observasi
Ketentuan

• Signifikansi
• Nilai D hitung dibandingkan nilai tabel D
• D < D tabel; Ho diterima, Ha ditolak
• D ≥ D tabel; Ho ditolak, Ha diterima
Untuk data di atas 35, nilai D tabel
dapat diperoleh dengan rumus apabila
alpha 5%:

1,36
𝐷=
𝑛
CONTOH

Sebuah studi berminat memeriksa apakah berat otak para penderita penyakit tertentu didistribusikan secara
normal. Dari suatu autopsi diketahui berat otak 15 orang dewasa penderita penyakit tertentu sebagaimana
tersaji pada tabel berikut.

Tabel 1. Data berat otak 15 orang dewasa penderita penyakit tertentu


BERAT OTAK (GRAM)
1348 1140 1086 1039 920
1233 1146 1002 1012 904
1255 1168 1016 1001 973

Dapatkah berdasarkan data tersebut, kita menarik kesimpulan bahwa populasi asal sampel didistribusi secara
normal, dengan mean 1083 dan simpang baku 129? Tentukan pula p untuk uji ini.
Asumsi
Sampel yang tersedia adalah sampel acak sederhana dari sebuah distribusi populasi kontinu

Hipotesis
𝐻𝑜 ∶ 𝐹 𝑥 = 𝐹𝑡 𝑥 untuk semua x dari – sampai +
𝐻𝑎 ∶ 𝐹 𝑥 ≠ 𝐹𝑡 𝑥 untuk paling sedikit sebuah x

Statistik Uji
𝐷 = 𝐹𝑜 𝑥 − 𝐹𝑡 (𝑥)ȁmaks

Distribusi Statistik Uji


Nilai-nilai kritis statistik uji untuk ⍺ yang dipilih diberikan pada Tabel D

Aturan Pengambilan Keputusan


Dengan n = 15 dan ⍺ = 0,05, tolak Ho bila nilai D hitung melebihi nilai D tabel
Penghitungan Statistik Uji
Langkah pertama adalah menghitung nilai-nilai 𝐹𝑜 𝑥 seperti pada tabel berikut.

Xi FREKUENSI FREKUENSI KUMULATIF 𝐹𝑜 𝑥 KUMULATIF


904 1 1 0,0667
920 1 2 0,1333
973 1 3 0,2000
1001 1 4 0,2667
1002 1 5 0,3333
1012 1 6 0,4000
1016 1 7 0,4667
1039 1 8 0,5333
1086 1 9 0,6000
1140 1 10 0,6667
1146 1 11 0,7333
1168 1 12 0,8000
1233 1 13 0,8667
1255 1 14 0,9333
1348 1 15 1,0000
15
Langkah menghitung nilai-nilai 𝐹𝑡 𝑥 seperti pada tabel berikut.
Xi 𝑧 = (𝑥𝑖 − 𝑥)/𝑠
ҧ 𝐹𝑡 𝑥 KUMULATIF
904
920
973
1001
1002
1012
1016
1039
1086
1140
1146
1168
1233
1255
1348
Langkah menghitung nilai-nilai 𝐹𝑡 𝑥 seperti pada tabel berikut.
Xi 𝑧 = (𝑥𝑖 − 𝑥)/𝑠
ҧ 𝐹𝑡 𝑥 KUMULATIF
904 -1,39 0,0823
920 -1,26 0,1038
973 -0,85 0,1977
1001 -0,64 0,2611
1002 -0,63 0,2643
1012 -0,55 0,2912
1016 -0,52 0,3015
1039 -0,34 0,3669
1086 0,02 0,5080
1140 0,44 0,6700
1146 0,49 0,6879
1168 0,66 0,7454
1233 1,16 0,8770
1255 1,33 0,9082
1348 2,05 0,9798
Langkah menghitung nilai-nilai 𝐹𝑜 𝑥 − 𝐹𝑡 (𝑥) seperti pada tabel berikut.
Xi 𝐹𝑜 𝑥 𝐹𝑡 𝑥 𝐹𝑜 𝑥 − 𝐹𝑡 (𝑥)
904 0,0677 0,0823 0,0146
920 0,1333 0,1038 0,0295
973 0,2000 0,1977 0,0023
1001 0,2667 0,2611 0,0056
1002 0,3333 0,2643 0,0690
1012 0,4000 0,2912 0,1088
1016 0,4667 0,3015 0,1652
1039 0,5333 0,3669 0,1664
1086 0,6000 0,5080 0,1080
1140 0,6667 0,6700 0,0033
1146 0,7333 0,6879 0,0454
1168 0,8000 0,7454 0,0546
1233 0,8667 0,8770 0,0103
1255 0,9333 0,9082 0,0251
1348 1,0000 0,9798 0,0202

Ternyata D maksimum adalah = 0,1664


Keputusan Statistik
Kita mengacu pada Tabel Kolmogorov Smirnoff, dengan n = 15 dan ⍺ = 0,05 (dua sisi)
Karena D hitung = 0,1664 < D tabel = 0,338, maka Ho diterima

Kesimpulan
Dapat kita simpulkan bahwa sampel berat otak berasal dari populasi dengan distribusi normal.
Uji Independensi
Chi Square
(test of independence)
• Untuk mengetahui apakah dua variabel saling
berhubungan (tergantung, mempengaruhi,
dependen) atau tidak saling berhubungan (tidak
tergantung, tidak mempengaruhi, independen)
• Data yang dianalisis berasal dari sebuah sampel
acak dari sebuah populasi
• Data dianalisis menurut 2 variabel  variabel c
kategori dan variabel r kategori  dipresentasikan
ke dalam tabel r x c
RUMUS

2
𝑂𝑖𝑗 − 𝐸𝑖𝑗
𝜒2 =෍
𝐸𝑖𝑗

Di mana :
𝑂𝑖𝑗 = frekuensi teramati pada sel ij
𝐸𝑖𝑗 = frekuensi harapan pada sel ij

Dengan derajat bebas = (r-1)(c-1)


Format tabel kontingensi r x c
Format tabel kontingensi 2 x 2

Variabel I
Kategori 1 Kategori 2

Kategori 1 a b a+b
Variabel II
Kategori 2 c d c+d

a+c b+d a+b+c+d=N


Frekuensi Harapan pada tiap-tiap sel dihitung sebagai berikut:

𝑎+𝑐 × 𝑎+𝑏
𝐸11 =
𝑁
𝑏+𝑐 × 𝑎+𝑏
𝐸12 = dan 𝑁 =𝑎+𝑏+𝑐+𝑑
𝑁
𝑎+𝑐 × 𝑐+𝑑
𝐸21 =
𝑁
𝑏+𝑑 × 𝑐+𝑑
𝐸22 =
𝑁
Dengan demikian, statistik χ2 dapat dihitung lebih cepat dengan alternatif sbb:

𝑁(𝑎𝑑 − 𝑏𝑐) 2
𝜒2 =
(𝑎 + 𝑏)(𝑐 + 𝑑)(𝑎 + 𝑐)(𝑏 + 𝑑)

Dalam pengambilan keputusan statistik, χ2 𝑡𝑒𝑟𝑎𝑚𝑎𝑡𝑖 (χ2 ℎ𝑖𝑡𝑢𝑛𝑔 ) dibandingkan


dengan χ2 ℎ𝑎𝑟𝑎𝑝𝑎𝑛 (χ2 𝑡𝑎𝑏𝑒𝑙 ) pada derajat bebas yang sesuai dan tingkat
kemaknaan ⍺.
Contoh:

Sebuah studi berminat mengetahui hubungan antara persepsi tentang kerentanan terhadap penyakit dan pemilihan
jenis pemberi pelayanan kesehatan. Dari populasi pemakai pelayanan kesehatan modern dan tradisional dicuplik
sebuah sampel. Persepsi kerentanan dibagi dua kategori: sangat serius dan kurang serius. Hasilnya disajikan pada tabel
berikut.
PERSEPSI KERENTANAN
TERHADAP PENYAKIT
Sangat Serius Kurang Serius

PILIHAN Rumah Sakit 24 6 30


PELAYANAN
KESEHATAN
Dukun 12 20
8
32 18 50

Berdasarkan data tersebut, dapatkah kita simpulkan bahwa terdapat hubungan antara persepsi kerentanan terhadap
penyakit dan pemilihan jenis pemberi pelayanan kesehatan pada ⍺ = 0,05?
Penyelesaian:

Asumsi
Sebuah sampel dipilih secara acak dari populasi dan pengamatan dilakukan independen

Hipotesis
Ho : Kedua variabel (persepsi kerentanan terhadap penyakit dan pemilihan jenis pemberi pelayanan kesehatan) tidak
saling tergantung
Ha : Kedua variabel saling tergantung

Statistik Uji
2
2
𝑂𝑖𝑗 − 𝐸𝑖𝑗
𝜒 =෍
𝐸𝑖𝑗

Dengan derajat bebas = (r-1)(c-1) = (2-1)(2-1) = 1


⍺ = 0,05  Nilai χ2 𝑡𝑎𝑏𝑒𝑙 = χ21;0,05 = 3,84

Aturan Pengambilan Keputusan


Ho ditolak bila nilai χ2 ℎ𝑖𝑡𝑢𝑛𝑔 ≥ χ2 𝑡𝑎𝑏𝑒𝑙
Penghitungan Statistik Uji

𝑎+𝑐 × 𝑎+𝑏 32 × 30
𝐸11 = = = 19,2
𝑁 50

𝑏+𝑑 × 𝑎+𝑏 18 × 30
𝐸12 = = = 10,8
𝑁 50

𝑎+𝑐 × 𝑐+𝑑 32 × 20
𝐸21 = = = 12,8
𝑁 50

𝑏+𝑑 × 𝑐+𝑑 18 × 20
𝐸22 = = = 7,2
𝑁 50

Statistik uji χ2 adalah


2 2 2 2 2
𝑂𝑖𝑗 −𝐸𝑖𝑗 24 − 19,2 6 − 10,8 8 − 12,8 12 − 7,2
𝜒2 =σ = + + + = 8,33
𝐸𝑖𝑗 19,2 10,8 12,8 7,2

Perhitungan χ2 dengan rumus alternatif adalah

2 𝑁(𝑎𝑑−𝑏𝑐)2 50 24 12 −(6)(8) 2
𝜒 = = = 8,33
(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) (30)(20)(32)(18)
Keputusan Statistik

Karena nilai χ2 ℎ𝑖𝑡𝑢𝑛𝑔 = 8,33 ≥ χ21;0,05 = 3,84, maka Ho ditolak

Kesimpulan

Dapat disimpulkan bahwa terdapat hubungan yang bermakna antara persepsi pasien tentang kerentanan
terhadap penyakit dan jenis pemberi pelayanan kesehatan yang dipilih.
Dengan memperhatikan distribusi frekuensi dalam tabel 2x2, dapat dikatakan bahwa jika pasien
menganggap sakitnya sangat serius, ia cenderung memilih rumah sakit untuk berobat daripada dukun.
Uji Exact Fisher
• Digunakan untuk menguji kemaknaan hubungan
antara dua variabel kategorikal
• Menggunakan pendekatan probabilitas pasti
(exact probability)
• Alternatif dari uji Kai Kuadrat bila jumlah sel dalam
tabel kontingensi yang memuat frekuensi harapan
< 5 lebih dari 20%
• Memberikan hasil yang akurat untuk semua tabel
2x2 yang nilai-nilai harapannya terlalu kecil untuk
dianalisis dengan uji Kai Kuadrat
Format tabel 2 x 2 dalam uji pasti Fisher

Variabel I
Kategori 1 Kategori 2 TOTAL

Kategori 1 a b a+b
Variabel II
Kategori 2 c d c+d

TOTAL a+c b+d n


RUMUS

𝑎+𝑏 ! 𝑐+𝑑 ! 𝑎+𝑐 ! 𝑏+𝑑 !


𝑃(𝑎,𝑏,𝑐,𝑑) =
𝑛! 𝑎! 𝑏! 𝑐! 𝑑!
Pengambilan Keputusan Statistik
 Dua sisi
Ho : p1 = p2
Ha : p1 ≠ p2

p = 2 x min [P(0) + P(1) + … +P(a), P(a) + P(a+1) + … + P(k)]

 Satu sisi
Ho : p1 = p2
Ha : p1 < p2

p = P(0) + P(1) + … +P(a)

Ho : p1 = p2
Ha : p1 > p2
p = P(a) + P(a+1) + … + P(k)
Contoh:

Sebuah studi kasus kontrol meneliti jumlah kematian orang-orang berusia 50-54 tahun di sebuah kabupaten dalam 1
bulan. Ditemukan bahwa dari 30 orang yang meninggal karena penyakit serebrovaskuler (CVD), 4 orang mempunyai
riwayat diet tiggi garam. Sedangkan dari 20 orang yang meninggal karena sebab lain. 2 orang mempunyai riwayat diet
tinggi garam. Data disajikan pada tabel kontingensi berikut.

KONSUMSI GARAM
Tinggi garam Rendah garam TOTAL

CVD 4 26 30
SEBAB
KEMATIAN
NON CVD 2 18 20

TOTAL 6 44 50

Nilai harapan dari tabel tersebut


6 30
𝐸11 = = 3,6
50 Jumlah sel dengan frekuensi harapan < 5 lebih dari
6 20
𝐸21 = = 2,4 20%, maka uji χ2 tidak boleh digunakan
50
Sebuah konfigurasi tabel dengan jumlah tepi baris maupun kolom tabel tetap

KONSUMSI GARAM
Tinggi garam Rendah garam

CVD 0 30 30
SEBAB
KEMATIAN
NON CVD 6 14 20

6 44 50

Maka kita dapat menghitung probabilitas pasti

30!20!6!44! 30! 20 × 19 × 18 × 17 × 16 × 15 14! 6! 44!


𝑃(𝑎,𝑏,𝑐,𝑑) = =
50!0!30!6!14! 50 × 49 × 48 × 47 × 46 × 45 44! 0! 30! 6! 14!

20 × 19 × 18 × 17 × 16 × 15
=
50 × 49 × 48 × 47 × 46 × 45

= 0,00244
Pembuatan semua konfigurasi table dengan jumlah tepi tetap

0 1 2 3

4 26 5 6

2 18
Pembuatan semua konfigurasi table dengan jumlah tepi tetap

0 30 1 29 2 28 3 27

6 14 5 15 4 16 3 17

4 26 5 25 6 24

2 18 1 19 0 20
Keuntungan dari memakai rumus pengulangan, kita hanya perlu menghitung tabel ke 0 dengan
menggunakan rumus faktorial. Berdasarkan nilai probabilitas tabel ke 0 tersebut, penghitungan
probabilitas tabel-tabel berikutnya cukup memaka rumus ulangan sbb:

𝑏𝑐
𝑃(𝑎+1) = 𝑃(𝑎)
(𝑎 + 1)(𝑑 + 1)

Dengan
𝑃(𝑎) = probabilitas untuk memperoleh tabel a, dengan a = 0,1,…,k
𝑃(𝑎+1) = probabilitas untuk memperoleh tabel a + 1
Maka,

𝑃(0) = 1 × 𝑃 0 = 1 × 0,00244

30×6 30×6
𝑃(1) = 𝑃(0) 1×15 = 0,00244 1×15
= 0,02928

29×5 29×5
𝑃(2) = 𝑃(1) 2×16 = 0,02928 = 0,13267
2×16

28×4 28×4
𝑃(3) = 𝑃(2) 3×17 = 0,13267 = 0,29135
3×17

27×3 27×3
𝑃(4) = 𝑃(3) 4×18 = 0,29135 = 0,32777
4×18
Dan seterusnya hingga 𝑃(6)
Pembuatan semua konfigurasi table dengan jumlah tepi tetap

0 30 1 29 2 28 3 27

6 14 5 15 4 16 3 17

0,00244 0,02928 0,13267 0,29135

4 26 5 25 6 24

2 18 1 19 0 20

0,32777 0,17941 0,03738


Menghitung nilai p

Uji dua sisi:


Ho : p1 = p2
Ha : p1 ≠ p2

p = 2 x min [P(0) + P(1) + … +P(a), P(a) + P(a+1) + … + P(k)]

Luas area sebelah kiri = P(0) + P(1) + P(2) + P(3) + P(4)


= 0,0024 + 0,02928 +0,13267 + 0,29135 + 0,32777
= 0,78351

Luas area sebelah kanan = P(4) + P(5) + P(6)


= 0,3277 + 0,17937 + 0,03737
= 0,54451
Maka, p = 2 x min [0,78351;0,54451] = 2 x 0,54451 = 1,08902

Karena p = 1,089 > ⍺ = 0,05, maka Ho gagal ditolak


Uji satu sisi:
Ho : p1 = p2
Ha : p1 > p2

p = P(a) + P(a+1) + … + P(k)


= P(4) + P(5) + P(6)
= 0,3277 + 0,17937 + 0,03737
= 0,54456

Karena p = 0,54 > ⍺ = 0,05, maka Ho gagal ditolak


Jadi, probabilitas seseorang dengan diet tinggi garam untuk meninggal karena CVD dan
karena non CVD tidak berbeda secara bermakna, baik dengan uji dua sisi maupun uji satu
sisi.
Dengan demikian, kita dapat menyimpulkan bahwa antara konsumsi garam dan sebab
kematian karena CVD tidak terdapat hubungan bermakna.
TERIMA
KASIH

Anda mungkin juga menyukai