Datpus TM 7-14 - Compressed
Datpus TM 7-14 - Compressed
Datpus TM 7-14 - Compressed
ICF International
9/2/2021 FOOTER GOES HERE 11
© ICF International
History
Before the DHS:
1950-60s: Surveys on fertility
and family planning
in the US
1960-70s: KAP (Knowledge,
Attitudes and
Practice) Surveys on
family planning
1972-84: World Fertility
Survey
1977-85: Contraceptive
Prevalence Survey
9/2/2021 12
© ICF International
History
The DHS started in 1984:
• DHS-I (DHS-1, 1984−1989)
• DHS-II (DHS-2, 1989−1993)
• DHS-III (DHS-3, 1992−1997)
• MEASURE DHS+
(DHS-4, 1997−2003)
• MEASURE DHS
(DHS-5, 2003−2008)
• MEASURE DHS Phase III
(DHS-6, 2008−2014)
• The DHS Program
(DHS-7, 2013−2018)
9/2/2021 13
To date, DHS has implemented more than 300
surveys in over 90 countries.
9/2/2021 16
© ICF International
Biomarkers
As of 2014, more than 10 million
biomarker tests have been
completed as part of The DHS
Program.
Most common biomarkers:
• Anemia
• Anthropometry
(height/weight)
• HIV prevalence
• Malaria prevalence
9/2/2021
17
Other Biomarkers
Chronic conditions Nutrition
• Blood pressure • Iodine (salt and urine
test)
• Diabetes
• Lipids • Iron
STIs • Lead
• Vitamin A
• Chlamydia
• Hepatitis B Antibodies/immunity
• Hepatitis C • Measles
• Tetanus
• Herpes
• Syphilis Water testing
• Arsenic, chlorine, E.coli
9/2/2021 18
How is Sampling Done?
STAGE 1 STAGE 2
Stratify the
sampling
1a. Select
frame by
clusters from
geographic
each strata
area
1b. List
2. Select
households in
households to be
selected
interviewed
clusters
The Problem of Over- and Under-Sampling
Gambela Oromiya
Tetapi, setelah peneliti mencoba memastikan ada tidaknya keterkaitan antara usia dengan
kesediaan divaksinasi, peneliti tidak menemukan hubungan yang kuat. Artinya,
meskipun nampaknya kesediaan divaksinasi pada partisipan berusia 22-25 cukup
mengkhawatirkan, namun hal ini tidak bermakna apa-apa.”
TERIMA KASIH
Confidence Interval
Referensi:
Field, A. (2016). An Adventure in Statistics:
Page : 270. The Reality Enigma. London:
SAGE Publications.
Ilustrasi Standard Error
Hasil menghitung rata-rata sampel yang diambil dari
populasi sebesa =45, padahal rata-rata populasi 𝝁 = 50.
Terdapat selisih 5.
Contoh :
- µ diestimasi dengan
- σ2 diestimasi dengan s2
- P diestimasi dengan p
Estimasi Interval
Memperkirakan nilai parameter dengan
menggunakan 2 (dua) nilai atau dalam
interval tertentu atau disebut juga
Confidence Interval
Jenis Estimasi :
1). Estimasi untuk rata-rata
2). Estimasi untuk varians
3). Estimasi untuk proporsi
Definisi Confidence Interval
Perkiraan/ estimasi rentang nilai parameter
populasi sebenarnya. Disebut juga selang
kepercayaan
dimana :
= rata-rata dari sampel
Z = tabel Normal Standart
N = banyaknya data
Menentukan Nilai Kritis, Z
(Distribusi Normal Standar)
Kita percaya
bahwa 95%nilai
akan berada pada
interval antara 2,5
sampai dengan 2,7
Estimasi Rata-rata
Jika standar deviasi (σ) tidak diketahui
Karena standar deviasi di populasi tidak diketahui, maka digunakan
nilai standar deviasi dari sampel (s), yaitu :
Dimana :
n = banyaknya data
s = standar deviasi data
= tabel chi-square dengan derajat bebas (n –1) dan
α tertentu
Nilai kritis dengan jumlah n=6 pada tingkat
kepercayaan 𝝰=5% ⇒ Nilai kritis = 12,833
dan = 0,831
Dimana :
p = proporsi di sampel
n = besar sampel
Z = tabel normal standar
Contoh Kasus
Pada suatu sampel random 500 keluarga yang memiliki
pesawat televisi di Kota A, ditemukan 340 keluarga telah
mengubah televisi analognya menjadi televisi digital.
Hitunglah selang kepercayaan 95% untuk proporsi
sesungguhnya dari keluarga yang telah memiliki televisi
digital di Kota tersebut.
Menentukan Ukuran Sampel
Menentukan ukuran sampel
berdasarkan selang kepercayaan
rata-rata
Sampling error
(margin of error)
Menentukan Ukuran Sampel
Sampling error
(margin of error)
X hubungan
Y Dalam simbol notasi standar:
X disebut sebagai variabel independent
Y disebut sebagai variabel dependent
X pengaruh Y
Korelasi rendah
-1 0 1
Interpretasi nilai koefisien korelasi
Rumus :
Makna Koefisien Korelasi Pearson
Tanda (-) dan (+) hanya menunjukkan arah hubungan
(+) Jika nilai variabel X naik maka nilai pada variabel Y juga akan naik,
Atau Jika nilai variabel X turun maka nilai pada variabel Y juga akan
turun
(-) Jika nilai variabel X naik maka nilai pada variabel Y akan turun, Atau
Jika nilai variabel X turun maka nilai pada variabel Y akan naik
Hitung berapa koefisien
korelasi Pearson pada data
tabel di samping ini
dimana :
ryx2 = korelasi antara y dan x2
ryx1 = korelasi antara y dan x1
rx1x2 = korelasi antara x1 dan x2
Korelasi Berganda
Hubungan yang terjadi antara
variabel depedent dengan lebih
dari 1 variabel independent.
Bisa juga merupakan uji alternatif dari uji korelasi Pearson. Data
dengan skala kontinyu juga dapat dihitung menggunakan formula
Korelasi Spearman.
Koefisien Korelasi Spearman
dimana :
Contoh soal : Makanan Juri I Juri II
= 1 – 0,04 = 0,96
Coefficient Contingency C
Coefficient contingency untuk mengukur keeratan hubungan
antara 2 variabel dengan skala data nominal. Data nominal
diubah dalam bentuk tabel kontingensi.
Silakan didiskusikan.
correlation does not imply causation
Requirement for causal relationship
Necessary Condition:
1. Empirical association (korelasi)
2. Appropriate time order: sebab (faktor independen) ada sebelum dampak ada (faktor
dependen)
3. Nonspuriousness: bukan terjadi karena variabel lain
Important Condition:
1. Mechanism
2. Context
Contoh:
● Media violence would increase aggression only among individuals who were
already predisposed to aggression
● children reacted more aggressively after observing men committing violent acts
than after observing women committing these same acts.
http://www.sagepub.com/sites/default/files/upm-binaries/14289_BachmanChapter5.pdf
Spurious relationship
https://tylervigen.com/spurious-correlations
Distribusi Data, Tendensi Sentral, dan Dispersi
(Variabilitas)
Topik
+ Menghitung tendensi sentral
+ Membedakan jenis-jenis distribusi data
+ Melakukan uji normalitas data
+ Menginterpretasi hasil uji normalitas data
+ Menginterpretasi boxplot dan violin plot
2
Menghitung Tendensi Sentral
(Mean, Median, Modus)
Nilai pusat dari sekumpulan data Beberapa ukuran pemusatan/ ukuran sentral
yaitu :
Fungsi mencari tendensi sentral:
1. Rata-rata hitung (mean)
Mencari nilai yang mewakili sekumpulan data
2. Rata-rata terboboti
3. Median
4. Modus
5. Rata-rata ukur
6. Rata-rata harmonis
3
Rata-Rata Hitung
4 7 3 5 6 9 8 6 3 2 5 6 9
Maka rata-rata hitungnya adalah :
4 7 3 5 6 9 8 6 3 2 5 6 9
2 3 3 4 5 5 6 6 6 7 8 9 9
Median
Median Untuk Data Individu
Jika jumlah data ganjil ( n ganjil )
n = 2k – 1
misal : jumlah data n = 111
n = 2k – 1
111 = 2k – 1
k = 56 (median terdapat pada data ke-56 atau X56)
Jika jumlah data genap ( n genap )
n = 2k – 1
misal : jumlah data n = 112
n = 2k – 1
112 = 2k – 1
k = 56,5 (median terdapat pada data ke- = (X56 + X57)/2 )
Median Untuk Data Berkelompok
Nilai Ujian Nilai Jumlah
Tengah Mahasiswa
20,00 – 29,99 24,995 4
30,00 – 39,99 34,995 9
40,00 – 49,99 44,995 25
50,00 – 59,99 54,995 48
60,00 – 69,99 64,995 20
70,00 – 79,99 74,995 5
Jumlah 111
4 7 3 5 6 9 8 6 3 2 5 6 9
2 3 3 4 5 5 6 6 6 7 8 9 9
Modus
Modus Untuk Data Berkelompok
Nilai Ujian Nilai Jumlah
Tengah Mahasiswa
20,00 – 29,99 24,995 4
30,00 – 39,99 34,995 9
40,00 – 49,99 44,995 25
50,00 – 59,99 54,995 48
60,00 – 69,99 64,995 20
70,00 – 79,99 74,995 5
Jumlah 111
Modus
Median
Mean
+ Jika distribusi menceng ke Kiri
Mean
Median
Modus
Variabilitas/Dispersi Data
(Range, IQR, Varians, Standar Deviasi)
RANGE
adalah perbedaan antara entri maksimum dan minimum pada
kumpulan data
17
Kelemahan & Kelebihan Range
Kelebihan range yaitu :
1. Perhitungannya sederhana
2. Perhitungan dapat dilakukan secara cepat
3. Sudah dapat menggambarkan ketersebaran data observasi
= rata-rata
Cara II. Dengan Rumus Perhitungan Singkat
Rumus penghitungan varians untuk data berkelompok adalah :
Rata-rata =
Bahan Diskusi
● Data yang berdistribusi normal adalah data yang pola distribusinya berbentuk
lonceng dan simetris, artinya pola data tersebut tidak menceng ke kiri ataupun ke
kanan
● Distribusi normal dapat disebut juga sebagai distribusi Gauss.
● Distribusi normal sangat penting untuk dipelajari terutama dalam melakukan analisis data
statistika. Dengan data yang diambil secara acak dan berdistribusi normal akan
memudahkan dalam melakukan analisis dan meramalkan serta mengambil kesimpulan
untuk cakupan yang lebih luas
27
Bagaimana data dikatakan memiliki
distribusi normal?
Mempunyai rumus fungsi distribusi normal Mempunyai fungsi distribusi normal standard
Seragam (uniform)
GRAFIK DISTRIBUSI YANG
TIDAK BIASA/TIDAK UMUM
Manakah yang lebih powerfull antara Uji Kolmogorov Smirnov dan Uji Shapiro-
Wilk. Pada umumnya jumlah sampel juga akan menentukan tingkat sensitifitas uji
normalitas. Silakan referensi berikut sebagai bahan kajian.
Referensi 1
Referensi 2
Ukuran Skewness dan Kurtosis
• Tingkat kemencengan kurva dari nilai tengahnya (skewness)
• Tingkat runcingnya sebuah kurva (Kurtosis) : parameter yang
menunjukkan sebuah kurva berdistribusi normal/tidak:
– Leptokurtik
– Mesokurtik
– Platikurtik
• Merupakan salah satu parameter untuk menentukan
kenormalan sebuah kurva (distribusi peluang)
Skewed distribution
Merupakan salah satu parameter untuk
menentukan kenormalan sebuah
kurva(distribusi peluang)
PRESENTATION TITLE 50
A box-and-whisker plot (Box Plot)
● A box and whisker plot : alat analisis data eksplorasi yang menyoroti fitur
penting kumpulan data.
● Suatu metode yang digunakan untuk mendeteksi adanya outliers pada suatu
data.
Untuk membuat grafik box and whisker plot: harus mengetahui nilai nilai berikut
1. Nilai minimum
2. Q1
ringkasan lima angka dari kumpulan data
3. Median
4. Q3
5. Nilai Maksimum
Panduan membuat a Box-and-Whisker Plot
1. Temukan ringkasan 5 angka dari kumpulan data
Contoh:
● Distribusi total pembayaran dalam
seminggu dengan memisahkannya sesuai
jenis kelamin.
● Pada violin plot nilai kuartil dan whisker
nya dimasukkan kedalam violin plot itu
sendiri. Sehingga, pada violin plot tidak
dapat diketahui outliers pada data
yang digunakan.
THANK YOU. SEE YOU NEXT WEEK!
DATA DAN PUSTAKA (SIP107)
Selasa 15 14 16
Rabu 15 11 19
dengan
Bulan Jeruk Apel Buah Naga
001 Senin 10 12 15 37
Diurutkan
003 Rabu 15 11 19 45
berdasarkan jumlah
002 Selasa 15 14 20 49
Prinsip tidy data (Wickham, 2014)
Dalam menyimpan data dalam bentuk tabel (set data/dataset), gunakan prinsip tidy
1. Satu kolom memuat satu variabel
2. Satu baris mewakili satu unit analisis (case)
3. Satu tabel mewakili satu observational unit
2. Judul tabel
Judul tabel harus jelas menggambarkan karakteristik data dalam tabel.
4. Sumber data
Sumber data harus jelas dan lengkap diletakkan di bawah tabel.
Perhatikan!
5. Persentase
Jika angka persentase dibutuhkan harus dihitung dengan perincian yang jelas.
6. Jumlah
Jika angka jumlah dalam tabel merupakan sesuatu yang penting harus ditonjolkan.
7. Unit pengukuran
Unit pengukuran data harus dicantumkan, e.g. tahun, Kg, Km, dsb.
8. Keterangan
Hal-hal lain yang perlu dicantumkan sebagai bentuk penjelasan. Pada umumnya berbentuk
catatan kaki (footnote) di bawah tabel.
Penyusunan Secara Alfabetis
Jumlah kecelakaan akibat kerja di 9 negara tahun 2005
Negara Jumlah Jika data jumlah kecelakaan akibat
kerja tersebut meliputi seluruh negara-
Amerika Serikat 2160
negara di dunia, maka teknik
Australia 2280
Belanda 780
penyusunan secara alfabetis ini
Cina 940 memudahkan pembaca untuk mencari
India 2760 data yang diinginkan
Inggris 960
Jepang 2150 Contoh lain tabel alfabetis
Kanada 1960
Spanyol 410 https://febpwt.webhosting.rug.nl/Dmn/
Jumlah Total 14400 AggregateXs/PivotShow#
https://www.sjkdt.org/viewimage.asp?img=SaudiJKidneyDisTranspl_2020_31_1_10_279928_t5.jpg
Penyusunan menurut besaran angkanya
https://www.pewresearch.org/fact-tank/2019/06/17/worlds-population-is-projected-to-nearly-stop-growing-by-the-end-of-the-century/
Penyusunan secara historis
https://www.semanticscholar.org/paper/A-comparative-study-on-application-of-time-series-Jha-
Sinha/1d2e15c7db73604cf3c0159735bf24222bb60d15/figure/0
Penyusunan atas dasar kelas lazim
Penyusunan secara progresif
https://ec.europa.eu/eurostat/statistics-explained/index.php?title=File:World_population_(mid-year)_(million).png
Tabel distribusi frekuensi
Tabel distribusi frekuensi adalah tabel yang memuat data frekuensi tadi tiap
variabel sehingga setiap case dalam tabel memuat frekuensi (atau kejadian -
occurrence) dari nilai tertentu.
Berikut ini adalah contoh tabel kontijensi dengan persentase baris dan kolom.
Menghitung berbagai bentuk probabilitas
Tabel kontijensi memungkinkan peneliti untuk menghitung berbagai bentuk
probabilitas, misalnya:
1. Rasio
a. Rasio adalah besaran relatif atau perbandingan dari dua nilai.
b. Dapat dihitung dengan membagi satu variabel skala interval atau rasio dengan
variabel lainnya, namun pembilang dan penyebut tidak harus berhubungan.
c. Oleh karena itu, kita dapat membandingkan rasio laki-laki dengan perempuan
dan rasio laki-laki dengan penggemar K-Pop.
d. Contoh rasio → “Rasio antara remaja putri yang menyukai K-Pop dengan yang
tidak adalah 5 : 1”
Menghitung berbagai bentuk probabilitas
2. Proporsi
a. Proporsi adalah perbandingan sebagian dengan keseluruhan.
b. Proporsi adalah jenis rasio di mana pembilang termasuk dalam penyebut.
c. Proporsi dapat dinyatakan sebagai desimal, pecahan, atau persentase.
d. Contoh proporsi → “35% penduduk Indonesia berusia 18-30 tahun mengalami
buta aksara fungsional.”
Menghitung berbagai bentuk probabilitas
3. Rate
a. Rate merupakan salah satu bentuk pengukuran frekuensi yang menggambarkan
suatu kejadian di suatu populasi dalam satu periode waktu tertentu.
b. Dalam Ilmu Epidemiologi, rate merupakan ukuran yang sangat informatif
karena rate memberikan informasi berapa banyak orang yang menderita
penyakit pada satu kelompok demografi (subpopulasi) tertentu.
c. Oleh karena itu, rate sering digunakan untuk menggambarkan tingkat risiko
(dalam menderita penyakit).
d. Contoh rate → “perempuan lebih berisiko menjadi korban begal karena pada
tahun 2020 saja, ada sekitar 300 perempuan korban begal per 1000 perempuan
di Indonesia.”
Berikut ini adalah contoh penghitungan dan interpretasi dari proporsi, rasio, dan
rate.
Korelasi dan tabel kontijensi
Tabel kontijensi juga dapat memungkinkan peneliti mengukur korelasi antara
dua variabel (nominal) dengan berbagai teknik, misalnya:
1. Odds ratio (OR)
2. Phi coefficient
3. Cramer’s V
4. Koefisien lambda
5. Tetrachoric dan polychoric correlation
Dapat Ö Ö Ö Ö
diklasifikasikan
Dapat diurutkan Ö Ö Ö
Dapat dihitung Ö Ö
selisihnya
Mempunyai titik Ö
nol mutlak
4
Nominal & Ordinal
(KATEGORIK)
• Data nominal & ordinal : mempunyai
kategori variabel.
• Contoh I :
– Jenis Kelamin -------- variabel
* Pria & Wanita ------ kategori data
5
• Contoh II :
– Kadar Kolesterol -------------variabel
• Rendah -------
• Normal -------- kategori data
• Tinggi --------
• Pertanyaan :
1. Apakah Anda melihat perbedaan contoh I & II ?
2. Contoh mana yang mempunyai skala nominal & mana
yang skala ordinal ?
3. Apa yang membedakan skala nominal & skala ordinal ?
4. Diskusikan ! Buat contoh-contoh yang lain !
6
• Berdasarkan kategori itulah dapat
dibedakan data nominal & variabel
ordinal;
9
Bar Graph
• Bar graph atau grafik batang
merupakan grafik untuk menampilkan
data kategorik. Bar chart digunakan
jika kita ingin membandingkan data
antar kategori dan melihat frekuensi
atau besaran dari kategori/variabel
tersebut. Bar chart dapat disajikan
dalam bentuk vertikal maupun
horizontal. 11
Pie Chart
• Pie chart atau diagram lingkaran merupakan
grafik yang paling sederhana dan paling sering
digunakan dalam memvisualisikan komposisi dari
data kita. Pie chart dapat digunakan untuk data
nominal dan ordinal (data kategorik). Diagram
lingkaran mewakili angka dalam persentase, dan
jumlah total semua segmen harus sama dengan
100%. Yang perlu diperhatikan dalam pembuatan
pie chart adalah jangan memasukkan terlalu
banyak kategori agar dapat terlihat perbedaan
antar komposisinya.
12
Line Chart
• Line chart atau grafik garis merupakan chart
yang pada umumnya digunakan untuk
mengilustrasikan trend atau menggambarkan
hubungan dalam bagaimana data berubah dalam
periode waktu tertentu. Kita dapat melihat pola
dan fluktuasi dalam data, membandingkan
variabel, dan membuat proyeksi dari data kita.
Tipe data yang dapat digunakan dalam line chart
umumnya adalah kontinum, namun line chart juga
dapat digunakan untuk data diskrit (misalnya
jumlah data per kategori variable dalam beberapa
periode waktu) 13
Grafik yang menyesatkan →
jangan ditiru
How to Mislead with Graphs. By Gwenyth Brockman | by CHI KT Platform | KnowledgeNudge | Medium
RATIO & INTERVAL
• Data interval & ratio : tidak berupa kategori
• Data interval adalah, data yang didapatkan
dengan cara pengukuran. Dimana jarak antara
dua titik di dalam skala sudah diketahui.
• Ukuran rasio atau data rasio yaitu ukuran yang
memberikan keterangan mengenai nilai absolut
dari objek yang diukur.
18
• Contoh III :
– Suhu
– Kecerdasan (IQ)
• Contoh IV :
– Berat,
– tinggi,
– jarak,
– waktu,
– volume
19
• Pertanyaan :
1. Apakah anda melihat perbedaan contoh
III & IV ?
2. Contah mana yang merupakan data
interval & contoh mana yang data ratio ?
3. Apa yang membedakan data interval &
data ratio ?
4. Diskusikan ! Buat contoh-contoh yang lain
!
20
• Anda dapat membedakan kedua variabel tsb
berdasarkan “nilai nolnya”;
• Apabila data pengukuran mempunyai nilai nol
alami/mutlak, maka disebutnya sebagai data
ratio (misalnya berat & tinggi badan, jarak);
• Apabila data tidak mempunyai nilai nol
alami/mutlak, disebut data Interval (misalnya
suhu, IQ)
21
Skala data apa saja yang ada dalam contoh diatas?
Reference : Andi Field. 2016. An Adventure in Statistics. SAGE. London
Visualisasi Data
• Histogram, grafik ini
ditampilkan dalam
bentuk beberapa bar
atau batang yang
mewakili rentang-
rentang data. Tinggi
setiap bar menunjukkan
seberapa banyak data
ada di rentang tersebut.
24
Beda Histogram dengan bar chart
27
Cara Penentuan jumlah kelas
29
Penentuan batas kelas
1. Penentuan jarak untuk menentukan jumlah kelas dan
interval kelas sebaiknya dilakukan atas dasar perbedaan
angka terendah yang telah mengalami pembulatan ke
bawah dan angka tertinggi yang telah mengalami
pembulatan ke atas
2. Pengulangan penggunaan batas kelas atas bagi batas
kelas bawah berikutnya dihindari
3. Batas kelas sebaiknya menggunakan bilangan bulat
Contoh penggunaan aturan Sturgess.
Diketahui data-data sebagai berikut:
42 62 59 46 53 60 65 72 51 53 61 63 69 64 65 67 72 91 52 59
69 72 88 65 65 75 67 78 81 47 79 55 62 32 71 67 62 54 66 69
•N = 40 data
•Data terkecil = 32, data terbesar = 91
•Range = 91 - 32 = 59
•Banyak kelas k = 1 + 3,322 log 40 = 6,3. Dibulatkan k = 6 kelas
•Panjang interval kelas = ⁵⁹/₆ = 9,8 dibulatkan menjadi 10
•Batas bawah kelas pertama = 32, batas atas kelas pertama = 41
Rumus Sturgess tidak sesuai jika digunakan dalam data yang
jumlahnya terlalu sedikit atau terlalu banyak
Jumlah 75
Histogram Frekuensi
Visualisasi Data :
Scatterplot
• Scatterplot adalah salah satu tipe grafik yang
menampilkan titik-titik dalam koordinat Cartesian
untuk menunjukkan hubungan antar dua dataset.
• Misalnya, pada suatu kecamatan dikumpulkan data
berat badan dan usia sejumlah balita. Data ini
digambarkan di scatterplot berikut. Sumbu X
menunjukkan umur balita, dan sumbu Y
menunjukkan berat badan. Terlihat ada banyak
balita yang berusia 10 bulan ternyata memiliki
berat badan antara 7 hingga 10 kg 35
Contoh Scatter Plot
36
Visualisasi Data :
Stem and Leaf Plot
• Stem-leaf plot merupakan alat untuk menyajikan data kuantitatif
dalam format grafis, mirip dengan histogram, yaitu
untuk membantu dalam memvisualisasikan bentuk distribusi data
yang sering digunakan dalam analisis eksplorasi.
• Stem-and-leaf plot memberikan informasi lebih banyak tentang
nilai yang sebenarnya dibanding histogram. Seperti dalam
histogram, panjang setiap batang sesuai dengan jumlah kejadian
yang jatuh ke dalam interval tertentu. Pada Histogram. kita hanya
bisa melihat nilai frekuensi dari data namun kita tidak tahu berapa
nilai angka sebenarnya. Berbeda dengan histogram, pada SLP selain
kita bisa mengetahui nilai frekuensinya, kita pun bisa tau berapa
nilai data sebenarnya. Hal ini dilakukan dengan membagi nilai-nilai
yang diamati menjadi dua komponen, stem dan leaf.
38
• Stem-and-leaf plot menggambarkan/menyajikan data
dengan cara memisahkan setiap nilai menjadi dua bagian:
bagian batang (stem) yaitu digit angka paling kiri dan diikuti
dengan angka berikutnya, yaitu daun (leaf), digit angka
paling kanan.
• Tujuan utama Stem-and-leaf plot:
- Apakah pola pengamatan simetris?
- Penyebaran atau variasi dari data pengamatan.
• Apakah terdapat pencilan (outlier, nilai-nilai yang berada
jauh dari yang lainnya).
• Titik pemusatan data.
• Ada Lokasi yang merupakan gap (kesenjangan dalam data)
39
Stem and Leaf Plots
40
Keterangan Stem and Leaf Plot
Diagram Keterangan
Dahan Daun
4 9 Memuat data 49
5 578 Memuat data 55,57,58
6 12347 Memuat data 61,61,63,64,67
7 2333558 Memuat data 72,73,73,73,73,75,75,78
8 355 Memuat data 83,85,85
9 1 Memuat data 91
41
21 30 34 41 43 46 50 57 61
23 31 35 41 44 47 52 58 67
23 32 35 42 45 48 52 59 70
25 33 35 42 45 48 55 59 77
26 33 38 43 46 50 57 60 78
Contoh stem and leaf plot dengan 2 baris stem yang digunakan.
Banyaknya stem bergantung dengan jumlah data. Peneliti yang
memutuskan berapa banyak stem yang digunakan. 42
Diskusi
Apa berbedaan visualisasi data dengan skala data
kategorikal (nominal & ordinal) dan skala data kuantitatif
(internal & ratio)?
43
Jenis Data & Fungsinya
JENIS DATA FUNGSI
Nominal Untuk identifikasi,
klasifikasi & kategorisasi.
Ordinal Penjenjangan kualitatif.
Interval Dapat dihitung jaraknya.
Ratio Memiliki angka nol mutlak
44
SOME ASPECTS OF SCALES OF MEASUREMENT
Nominal Ordinal Interval Ratio
Mathematical Identity Identity Identity Identity
properties Magnitude Magnitude Magnitude
Equal interval Equal interval
True zero point
Mathematical None Rank order Add Add
operations Subtract Subtract
Multiply
Divide
Type of data Nominal Ordered Score Score
Typical statistics Chi-square Sign test t-test t-test
used Mann-Whitney Anova Anova
U-test
Examples Diagnostic Socioeconomi IQ test scores Weight
categories c class Personality & Length
Brand name Rank attitude scales Reaction time 45
TERIMA KASIH