TUGAS2 - Ratu Aam Amaliyah - BI

Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

TUGAS II

MATA KULIAH : BIOSTATISTIK INTERMEDIET

DISUSUN OLEH :
RATU AAM AMALIYAH (2106776230)

PROGRAM STUDI MAGISTER KESELAMATAN DAN KESEHATAN KERJA


FAKULTAS KESEHATAN MASYARAKAT
UNIVERSITAS INDONESIA
2021
Review Questions 6B
1. What is a sampling distribution?
Jawab :
Distribusi sampling adalah distribusi dari besaran-besaran statistik seperti rata-rata,
simpangan baku, proporsi yang mungkin muncul dari sampel-sampel. Dengan kata lain,
distribusi samping adalah distribusi peluang untuk nilai statistik yang diperoleh dari
sampel acak untuk menggambarkan populasi.

2. Why is the sample mean X used to estimate the population mean µ?


Jawab :
Misal sampel acak n diambil dari populasi normal dengan rataan µ dan varians σ2. Tiap
pengamatan Xi, I = 1, 2, 3, ..., n dari sampel acak tersebut akan berdistribusi normal yang
sama dengan populasi yang diambil sampelnya. Jadi

Berdistribusi normal dengan rataan

Dan variasi

Bila populasi yang di sampel tidak diketahui distribusinya, berhingga atau tidak, maka
distribusi sampe 𝑋̅ masih akan berdistribusi hampir normal dengan rataan µ dan varians
σ2/n asalkan ukuran sampelnya besar. Ini merupakan akibat dari Teorema Limit Pusat.

Hampiran normal untuk 𝑋̅ umumnya cukup baik bila n>30, terlepas dari bentuk populasi.
Bila n<30, hampiran hanya akan baik bila populasinya tidak jauh berbeda dengan normal.
Bila populasi diketahui normal, maka distribusi sampel 𝑋̅ akan tepat berdistribusi
normal, dan ukuran sampelnya tidak menjadi soal.

3. What is the difference between a standard deviation and a standard error?


Jawab :
Standar deviasi atau sering disebut simpangan baku, mengambarkan seberapa besar
perbedaan nilai sampel terhadap rata-ratanya. Standar deviasi juga menggambarkan seberapa
besar keragaman sampel. Sementara, standar error diartikan sebagai standar deviasi dari rata-
rata sampel. Oleh karena itu standard error dapat pula disebet sebagai standard error of
the mean (sem)

4. Suppose we have a sample of five values of hemoglobin A1c (HgbA1c) obtained from a
single diabetic patient. HgbA1c is a serum measure often used to monitor compliance
among diabetic patients. The values are 8.5%, 9.3%, 7.9%, 9.2%, and 10.3%.
a. What is the standard deviation for this sample?
Jawab :
Menghitung rata-rata
0.085 + 0.093 + 0.079 + 0.092 + 0.103
𝑋̅ = = 0.090
5
Menghitung Standar Deviasi
(∑5𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆=√ = 0.009
5−1

b. What is the standard error for this sample?


Jawab :
𝑠 0.009
𝑆𝐸 = = = 0.004
√𝑛 √5

5. Suppose the number of values from the patient in Review Question 6B.4 increases from 5
to 20.
a. Would you expect the standard deviation to increase, decrease, or remain the same?
Why?
Jawab :
Jika diasumsikan nilai sampel sama namun dinaikkan jumlah sampelnya sampai
dengan 20 sampel atau bisa dikatakan 4 kali lebih besar dari sampel awal. Maka,
nilai standar deviasi akan naik. Dikarenakan nilai denumerator naik, nilai
denumerator naik dikarenakan adanya peningkatan jumlah sampel. Jika kita
tuliskan seperti berikut :
(∑5𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆=√ = 0.008299651
20 − 1
Oleh karena itu, semakin banyak jumlah sampel maka semakin mendekati nilai ke
populasi. Nilai rata-rata sampel semakin mewakili nilai rata-rata pada populasi.

b. Would you expect the standard error to increase, decrease, or remain the same?
Why?
Jawab :
Standar Eror untuk 5 sampel :
𝑠 0.009
𝑆𝐸 = = = 0.004
√𝑛 √5
Standar Eror untuk 20 Sampel :
𝑠 0.009
𝑆𝐸 = = = 0.0018
√𝑛 √20

Sehingga dapat disimpulkan bahwa semakin banyak jumlah sampel,, standar eror
semakin menurun.
Review Questions 6C

1. What does a 95% CI mean?


Jawab :
Confidence Interval (CI) merupakan interval kepercayaan atau tingkat kepercayaan yang
akan digunakan untuk menggambarkan estimasi parameter (data populasi) berdasarkan
statistik (data sampel) agar estimasi sampel akurat. Jika CI 95% artinya kita yakin bahwa
presisi atau ketepatan atau kepercayaannya 95% = 1,96 dan berarti penyimpangan terhadap
populasi sebesar 5% = 0,05.

2. (a) Derive a 95% CI for the underlying mean HgbA1c in Review Question 6B.4.
Jawab :
Dikarenakan tidak ada data yang menginformasikan nilai standar deviasi pada kelompok
populasi, maka digunakan distribusi t sehingga rumus CInya sebagai berikut :

Rata-rata : 0,0904
Standar Deviasi : 0,00904
SD/ √n : 0,004
t = (α/2, df = n-1) = 2,776
Maka :
CI atas :
𝑠
𝐶𝐼 = 𝑋 + 𝑡 = 0,0904 + (2,776 𝑥 0,004) = 0.1016 𝑎𝑡𝑎𝑢 10,16%
√𝑛
CI bawah :
𝑠
𝐶𝐼 = 𝑋 − 𝑡 = 0,0904 − (2,776 𝑥 0,004) = 0.0792 𝑎𝑡𝑎𝑢 7,92%
√𝑛
Sehingga nilai CI nya = 7,92% < μ sampel < 10,16%

(b) Suppose that diabetic patients with an underlying mean HgbA1c < 7% are considered
in good compliance. How do you evaluate the compliance of the patient in Review
Question 6B.4?
Jawab :
Jika dinyatakan dalam soal bahwa Hemoglobin <7% adalah komplikasi baik, maka tingkat
kepatuhan pasien masih kurang karena mean sampel >7% yaitu = 9,04 % dengan CI '=
7,92% - 10,16%

3. (a) What is the difference between a t distribution and a normal distribution?


Jawab :
Distribusi normal atau distribusi Z dipakai Ketika jumlah sampel lebih dari sama dengan
30 sampel dan nilai standar deviasi pada populasi diketahui, sedangkan distribusi t
digunakan saat jumlah sampel kurang dari 30 dan nilai standar deviasi pada populasi tidak
diketahui.

(b) What is the 95th percentile of a t distribution with 30 df? What symbol is used to denote
this percentile?
Jawab :

Dengan t = 0,05/2, df = 30-1


Sehingga t = 0,025 dan df=29.

4. What is the central-limit theorem? Why is it important in statistics?


Jawab :
Ada satu populasi. Kemudian ada banyak penelitian dari n1 s/d np. Dimana setiap peneliti
mengambil sejumlah sampel beragam jumlahnya. Dari satu peneliti bisa menghitung mean
nya. Jumlah sampel : number of sampel : berapa kali kita mengambil sampel. Tetapi jika
kita mengambil sampel berapa besarnya yang dihitung adalah besar sampel. Jika mean ini
dikumpulkan dan diperlakukan sebagai data, kemudian dibuat distribusi frekuensinya, dia
akan membentuk distribusi yang simetris dengan syarat sampelnya diambil secara random
dan jumlah yang cukup. Besar sampel dan cara memilihnya yaitu random. Base
replacement : infinite (tidak terbatas)
Sifat-sifat distribusi sampel tersebut dikenal dengan Central Limit Theorem.
• Bentuk distribusi dari rata-rata sampel akan mendekati distribusi normal
meskipun distribusi populasi tidak normal
• Rata-rata dari rata-rata sampel sama dengan rata-rata populasi
• Standar deviasi dari rata-rata sampel = sama dengan standar deviasi populasi dibagi
dengan akar jumlah sampel. Dikenal dengan istilah standard error (SE)

Environmental Health
Much discussion has taken place concerning possible health hazards from exposure to
anesthetic gases. In one study conducted in 1972, 525 Michigan nurse anesthetists were
surveyed by mail questionnaires and telephone interviews to determine the incidence rate of
cancer [8]. Of this group, 7 women reported having a new malignancy other than skin cancer
during 1971.
- 6.33 What is the best estimate of the 1971 incidence rate from these data?
Jawab :
Insiden rate : 7/525 = 0,0133333
Atau dapat dikatakan 1,33 kasus per 100 orang tahun atau 1333,33 kasus per 100.000
orang tahun

- 6.34 Provide a 95% CI for the true incidence rate. A comparison was made between the
Michigan report and the 1969 cancer-incidence rates from the Connecticut tumor
registry, where the expected incidence rate, based on the age distribution of the
Michigan nurses, was determined to be 402.8 per 100,000 person-years.
Jawab :

Diketahui :
P = 7/525 = 0,013
Z(1-α) = 1,96
n = 525
𝑆𝐸 = √𝑃(1 − 𝑝)/𝑛 = 0,00494

Sehingga :
CI atas =
𝐶𝐼 = 𝑝 + 𝑍(1 − 𝛼)𝑥𝑆𝐸 = 0,013 + 1,96(0,00494) = 0,226 𝑎𝑡𝑎𝑢 2,26%

CI bawah =
𝐶𝐼 = 𝑝 − 𝑍(1 − 𝛼)𝑥𝑆𝐸 = 0,013 − 1,96(0,00494) = 0,00331 𝑎𝑡𝑎𝑢 0,3%

Sehingga nilai CInya sebagai berikut 0,3% < μ < 2,2%


- 6.35 Comment on the comparison between the observed incidence rate and the
Connecticut tumor registry data.
Jawab :
Diketahui bahwa pada tahun 1969 terdapat 402,8 kasus tumor per 100.000 orang tahun
dan kemudian meningkat sebanyak 1333,33 kasus per 100.000 orang tahun menjadi
kasus kanker kulit pada tahun 1971. Hal ini mengatakan bahwa adanya kenaikan
insiden rate dan adanya kenaikan keparahan kesakitan yang mulanya tumor menjadi
kanker. Hal tersebut dapat disebabkan karena tidak adanya upaya pengendalian
penyakit yang kurang baik sehingga tingkat keparahan suatu penyakit meningkat dan
upaya penegakan studi epidemiologi juga belum berjalan maksimal.

You might also like