0% menganggap dokumen ini bermanfaat (0 suara)
23 tayangan8 halaman

Artikel Data Science

Diunggah oleh

Andreano Laheping
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
23 tayangan8 halaman

Artikel Data Science

Diunggah oleh

Andreano Laheping
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 8

Apa Itu Data Science?

( Andreano Laheping, Rhetorica)

Menurut Data Robot, data science merupakan ilmu yang menggabungkan sebuah


kemahiran di bidang ilmu tertentu dengankeahlianpemrograman, matematika,dan
statistik.Tujuannya adalah untuk mengekstrak sebuah pengetahuan atau informasi dari
data.Biasanya, orang-orang yang mahir dalam bidang data science menggunakan
algoritma machine learning atau pemelajaran mesin. Dari namanya, orang-orang yang paham
dan cakap akan ilmu ini memiliki keterampilan pada pembelajaran mesin ataupun algoritma-
algoritma machine learning yang ada seperti Decision Tree, Support Vector Machine dan K
Nearest Neighbor  (KNN). Hal-hal tersebut berguna dalam mengelola teks, gambar, audio,
video, dan sebagainya yang nantinya akan terkompilasi pada sistem kecerdasan buatan
sebuah aplikasi ataupun website. Sistem kecerdasan buatan tersebut tentunya terancang untuk
mengerjakan tugas-tugas yang sulit yang tidak dapat dikerjakan secara manual oleh manusia.
Nantinya, hasil dari mesin learning inilah yang akan perusahaan manfaatkan sebagai analisis
untuk merancang strategi yang tepat untuk mencapai tujuan perusahaan. Untuk memiliki
kemampuan data science ini, Anda harus memiliki kemampuan untuk menganalisis big
data (data yang jumlahnya banyak dan besar), kemampuan menjalankan unsupervised
learning, kemampuan komputasi cloud dan memproses natural language.
Manfaat Data Science

Data science adalah suatu ilmu yang sangat penting, karena seperti yang kita ketahui
bersama bahwa data sangat diperlukan oleh berbagai jenis bisnis, baik itu bisnis skala kecil
ataupun bisnis skala besar. Bila suatu perusahaan tidak bisa mengolah data secara baik, maka
bisnisnya tidak akan mempunyai suatu pedoman dalam melakukan strategi operasional yang
efisien dan efektif dalam memperoleh keuntungan. Akhir-akhir ini, berbagai perusahaan di
seluruh penjuru dunia sudah menyadari akan peran penting dari machine learning, data
science, dan kecerdasan buatan. Mereka menyadari bahwa bila bisnisnya ingin terus
berkompetisi di pasar dan tetap relevan, maka mereka harus bisa menerapkan data
science dengan baik.

Salah seorang ahli ekonom Google dan dosen Ilmu Komputer, Bisnis dan Ekonomi
dari UC Berkeley yang bernama Hal Varian menjelaskan bahwa kemampuan dalam
memahami, memproses, mengambil dan menyaring nilai dari sebuah data dan
memvisualisasikannya dengan baik adalah suatu keahlian yang semakin penting dalam
beberapa dekade yang akan datang. Mereka yang mempunyai keahlian dan juga pemahaman
akan data science yang baik tentunya akan semakin berharga dan banyak dicari.

Setelah kita melihat pengertian dan pentingnya data science itu, sekarang kita melihat
beberapa manfaatnya :

 Untuk meningkatkan kualitas produk yang gagal agar tidak terulang kembali.
 Dapat memprediksi produk atau strategi yang baik pada musim-musim tertentu
 Memprediksi perilaku konsumen atau pembeli pada produk perusahaan
 Mengambil keputusan berdasarkan data-data yang ada pada perusahaan.
 Membuat proses pengiriman menjadi lebih efisien dengan mengecek data yang ada
pada traffic  dari bagian logistic.
 Meningkatkan tingkat kepuasan para karyawan suatu perusahaan berdasarkan
data feedback yang perusahaan miliki.
 Untuk perusahaan sekuritas, manfaat data science adalah agar membuat keputusan
investasi yang lebih efektif untuk para nasabahnya.
 Melakukan klasifikasi suatu produk yang bermutu tinggi menggunakan data dari
tim quality control.
Proses Data Science

Tentu saja proses dari data science adalah hal yang tidak mudah dan cukup kompleks.
Namun, kira-kira prosesnya dapat dirangkum sebagai berikut:

1. Obtain

Langkah pertama dalam memulai proyek data science adalah memperoleh atau


mengumpulkan data. Data-data tersebut dikumpulkan dari berbagai sumber data. Kemudian
untuk mengolah data, digunakan kemampuan teknis seperti MySQL. Jika kamu
menggunakan Python atau R, kamu dapat membaca data langsung dari sumbernya ke dalam
program data science. Untuk mengambil data dari sumber, juga membutuhkan keterampilan
yang berbeda tergantung pada jenis dan ukuran file yang diterima.

2. Scrub

Setelah data terkumpul, langkah selanjutnya dalam proses data science adalah


data  scrubbing. Scrubbing adalah membersihkan atau memfilter data. Jika terdapat data yang
tidak penting atau tidak relevan maka data harus dihapus. Format data juga distandarisasi
dalam proses ini.

Pada langkah pertama, semua data dalam format yang berbeda dikonversi ke format
yang sama. Setelah itu, jika ada data yang hilang maka harus disesuaikan untuk
menanganinya. Proses pembersihan juga mencakup penggabungan dan pemisahan kategori
data sesuai kebutuhan. Jadi kesimpulannya, fase scrubbing adalah proses mengatur dan
membersihkan data, menghapus apa pun yang tidak perlu, mengganti data yang hilang, dan
menstandardisasi seluruh format.

3. Explore

Pada tahap ini, semua data tadi diekstraksi dan divalidasi. Pertama, kita perlu
memeriksa properti semua data, karena tipe data yang berbeda ditangani secara berbeda.
Selanjutnya, kita perlu menghitung statistik deskriptif untuk mengekstrak fitur dan menguji
variabel penting. 

Terakhir, gunakan visualisasi data untuk mengidentifikasi pola dan tren penting dalam
data yang kamu terima. Ini memberikan gambaran yang lebih jelas dalam baganmu sehingga
dapat lebih memahami arti dari data.

4. Model

Setelah memastikan bahwa proses scrubbing dan explore berjalan dengan optimal,


kita dapat melanjutkan ke proses data science berikutnya, yaitu model. Pada fase ini, kamu
membuat model data untuk mencapai tujuan. Dalam tahap ini, regresi dan prediksi digunakan
untuk memperkirakan nilai masa depan, mengklasifikasikan dan mengelompokkan kelompok
nilai dari data.

5. Interpret

Langkah terakhir dalam proses data science adalah interpretasi data. Interpretasi data adalah
proses penting dilakukannya model dan interpretasi data. Output dari pengolahan data yang
ditafsirkan harus dapat dimengerti oleh non-ahli yang tidak memahami terminologi.

Presentasi bertujuan untuk menjawab pertanyaan bisnis berdasarkan data yang diperoleh.
Pada tahap interpretasi data juga membutuhkan keterampilan komunikasi yang baik untuk
mengomunikasikan poin-poin penting secara efektif kepada semua pemangku kepentingan.

Proses Data Science juga merupakan pendekatan sistematis untuk memecahkan masalah
terkait data dan terdiri dari langkah-langkah berikut:

1. Definisi Masalah: Mendefinisikan masalah dengan jelas dan mengidentifikasi tujuan


analisis.
2. Pengumpulan Data: Mengumpulkan dan memperoleh data dari berbagai sumber,
termasuk pembersihan dan persiapan data.

3. Eksplorasi Data: Mengeksplorasi data untuk mendapatkan wawasan dan mengidentifikasi


tren, pola, dan hubungan.

4. Pemodelan Data: Membangun model matematika dan algoritme untuk memecahkan


masalah dan membuat prediksi.

5. Evaluasi: Mengevaluasi kinerja dan akurasi model menggunakan metrik yang sesuai.

6. Penerapan: Menerapkan model di lingkungan produksi untuk membuat prediksi atau


mengotomatiskan proses pengambilan keputusan.

Pemantauan dan Pemeliharaan: Memantau kinerja model dari waktu ke waktu dan melakukan
pembaruan sesuai kebutuhan untuk meningkatkan akurasi.

Masalah-masalah dalam Ilmu Data antara lain :

1. Kualitas dan Ketersediaan Data: Kualitas data dapat mempengaruhi keakuratan model
yang dikembangkan dan oleh karena itu, penting untuk memastikan bahwa data
tersebut akurat, lengkap, dan konsisten. Ketersediaan data juga dapat menjadi
masalah, karena data yang diperlukan untuk analisis mungkin tidak tersedia atau tidak
dapat diakses.
2. Bias dalam Data dan Algoritma: Bias dapat terjadi pada data karena teknik
pengambilan sampel, kesalahan pengukuran, atau kumpulan data yang tidak
seimbang, yang dapat memengaruhi keakuratan model. Algoritme juga dapat
melanggengkan bias yang ada di masyarakat, yang mengarah pada hasil yang tidak
adil atau diskriminatif.
3. Model Overfitting dan Underfitting: Overfitting terjadi ketika sebuah model terlalu
kompleks dan cocok dengan data pelatihan, tetapi gagal menggeneralisasi ke data
baru. Di sisi lain, underfitting terjadi ketika sebuah model terlalu sederhana dan tidak
mampu menangkap hubungan yang mendasari data.
4. Kemampuan Interpretasi Model: Model yang kompleks bisa jadi sulit untuk
ditafsirkan dan dipahami, sehingga sulit untuk menjelaskan keputusan dan keputusan
model. Hal ini dapat menjadi masalah dalam membuat keputusan bisnis atau
mendapatkan dukungan pemangku kepentingan.
5. Pertimbangan Privasi dan Etika: Ilmu data sering kali melibatkan pengumpulan dan
analisis informasi pribadi yang sensitif, sehingga menimbulkan masalah privasi dan
etika. Penting untuk mempertimbangkan implikasi privasi dan memastikan bahwa
data digunakan dengan cara yang bertanggung jawab dan etis.
6. Tantangan Teknis: Tantangan teknis dapat muncul selama proses data science seperti
penyimpanan dan pemrosesan data, pemilihan algoritma, dan skalabilitas komputasi.
Contoh Penerapan Data Science

Data science adalah bidang yang bertujuan


untuk memberikan wawasan penting
tentang ketersediaan data dalam jumlah
besar. Mereka biasanya dikaitkan dengan
berbagai ruang kerja untuk tujuan
melakukan perhitungan dan proses
transformasi pada data yang akan disaring.
Oleh karena itu, ilmu yang satu ini telah
diterapkan ke berbagai industri, dari sektor
kesehatan hingga e-commerce untuk tujuan
bisnis. 

Berikut ini adalah beberapa contoh penerapan Data Science :

1. Bidang Finansial

Contoh pertama untuk penerapan data science adalah deteksi penipuan di sektor


keuangan. Sebagian besar bank dan perusahaan keuangan saat ini menggunakan data
science untuk mengklasifikasikan, mengkategorikan, dan mengelompokkan data yang dapat
mengindikasikan pola penipuan. Hal ini diperlukan untuk menghindari proses kriminalisasi
yang sedang berlangsung dalam sistem perusahaan. Sistem pakar perusahaan keuangan juga
dapat mengodekan data yang dapat mendeteksi penipuan dalam bentuk yang tidak terduga.

2. Bidang E-Commerce

Selanjutynya, contoh penerapan data science dapat ditemukan di e-commerce untuk


berbagai tujuan penetapan harga yang dinamis. Penetapan harga ini dibentuk oleh bisnis e-
commerce untuk mengelompokkan pelanggan atau konsumen yang sesuai. Penetapan harga
yang dinamis juga diperlukan agar setiap kelompok pelanggan dapat menawarkan produk
dengan harga yang sesuai dengan kebutuhannya. Perhitungan harga dinamis perusahaan
biasanya mempertimbangkan berbagai kategori data, termasuk: lead time, penilaian aset, dan
fasilitas yang disediakan oleh produk.
3. Bidang Kesehatan

Salah satu contoh penerapan terbesar penggunaan data science adalah dalam sektor


kesehatan. Menurut situs Built-In, data science pertama kali diadopsi oleh industri perawatan
kesehatan global pada tahun 2008. Tahun itu, Google menemukan bahwa epidemi influenza
dapat dipetakan secara real time dengan melacak data lokasi dalam pencarian terkait flu. 

FluView, peta dari CDC  (Centers for Disease Control and Prevention) yang ada untuk kasus
influenza terdokumentasi, diperbarui hanya sekali seminggu. Akibatnya, Google dengan
cepat meluncurkan alat pesaing, Google Flu Trends, yang menyediakan pembaruan berita
yang lebih tepat waktu.

4. Bidang Olahraga Profesional

Siapa yang mengira bahwa data science akan berdampak besar pada dunia olahraga
profesional? Yap, ilmu ini sering digunakan untuk merekrut bintang muda potensial. Contoh
aplikasi itu adalah tim baseball Oakland Athletics. Mereka menggunakan statistik
dalam game yang sering diabaikan oleh tim lain untuk memprediksi pemain potensial dan
membangun tim yang kuat dengan biaya rendah.

Itulah beberapa informasi yang saya dapatkan tentang Data Science. Semoga bisa
bermanfaat untuk para pembaca. Saya menggunakan beberapa sumber untuk melakukan
perbandingan dan melihat informasi secara lengkap dan jelas tentang Data Science. (AL)
Daftar pustaka :
https://glints.com/id/lowongan/data-science-adalah/#.ZAmtO3ZByUk

https://accurate.id/lifestyle/apa-itu-data-science/#Apa_Itu_Data_science

https://vocasia.id/blog/data-science-adalah/#:~:text=Contoh%20pertama%20untuk
%20penerapan%20data,yang%20dapat%20mengindikasikan%20pola%20penipuan.

https://makinrajin.com/blog/data-science-adalah/#Apa_Itu_Data_Science

https://www.geeksforgeeks.org/data-science-process/

Anda mungkin juga menyukai