Coding
Coding
Meskipun demikian, berikut penjelasan dan contoh penggunaan distplot serta alternatif
modern yang bisa digunakan:
1. distplot (Deprecated)
Di sini, kde=True menunjukkan bahwa plot KDE akan ditampilkan bersamaan dengan
histogramnya. Namun, karena fungsi ini deprecated, disarankan untuk menggunakan
alternatif berikut.
a. Menggunakan histplot
histplot adalah cara yang lebih modern untuk menampilkan histogram distribusi. Ini
memungkinkan pengaturan bin (lebar batang histogram) dan juga bisa
dikombinasikan dengan KDE.
Contoh Penggunaan:
import seaborn as sns
import matplotlib.pyplot as plt
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6]
sns.histplot(data, kde=True)
plt.title('Distribusi dengan histplot')
plt.show()
b. Menggunakan kdeplot
kdeplot fokus pada estimasi kepadatan kernel (KDE) saja, tanpa histogram. Ini
digunakan ketika kita hanya ingin menampilkan distribusi halus.
Contoh Penggunaan:
import seaborn as sns
import matplotlib.pyplot as plt
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6]
sns.kdeplot(data)
plt.title('Distribusi dengan kdeplot')
plt.show()
Untuk mendapatkan tampilan yang serupa dengan distplot (histogram dan KDE
bersama-sama), kita bisa mengkombinasikan kedua grafik ini secara manual, atau
cukup mengatur parameter kde=True dalam histplot.
Contoh Penggunaan:
import seaborn as sns
import matplotlib.pyplot as plt
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6]
sns.histplot(data, kde=True)
plt.title('Histogram dan KDE')
plt.show()
Distribusi Data: Jika kamu ingin melihat bagaimana data tersebar (apakah miring,
berpusat di suatu nilai, dll.), histogram adalah pilihan yang tepat.
Analisis Kepadatan: KDE memberikan gambaran halus tentang distribusi data tanpa
bergantung pada lebar bin histogram. Jadi, jika kamu ingin fokus pada estimasi
distribusi halus, gunakan KDE.
Gabungan: Jika kamu ingin gambaran lengkap, histogram dan KDE bisa digabung
untuk menunjukkan frekuensi diskrit (dalam histogram) dan pola distribusi yang halus
(dengan KDE).
Sekarang, Seaborn telah menggantikan distplot dengan histplot, yang lebih fleksibel dan
memiliki kinerja lebih baik, jadi disarankan untuk beralih ke metode baru ini.