0% menganggap dokumen ini bermanfaat (0 suara)
27 tayangan

Reading+3+-+Programming+for+Data+Science en Id

Dokumen tersebut membandingkan dua bahasa pemrograman populer untuk ilmu data, yaitu Python dan R. Python adalah bahasa multi-tujuan yang fleksibel untuk manipulasi data, sedangkan R dirancang khusus untuk analisis statistik. Meskipun keduanya cocok untuk tugas ilmu data, Python lebih umum untuk pembelajaran mesin sedangkan R lebih kuat untuk analisis statistik mendalam.

Diunggah oleh

Desy Rohmahdani
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
27 tayangan

Reading+3+-+Programming+for+Data+Science en Id

Dokumen tersebut membandingkan dua bahasa pemrograman populer untuk ilmu data, yaitu Python dan R. Python adalah bahasa multi-tujuan yang fleksibel untuk manipulasi data, sedangkan R dirancang khusus untuk analisis statistik. Meskipun keduanya cocok untuk tugas ilmu data, Python lebih umum untuk pembelajaran mesin sedangkan R lebih kuat untuk analisis statistik mendalam.

Diunggah oleh

Desy Rohmahdani
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 6

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com
Jelajahi dasar-dasar kedua bahasa pemrograman sumber terbuka ini,
perbedaan utama yang membedakannya, dan cara memilih yang tepat untuk
situasi Anda.

Jika Anda bekerja di bidang ilmu data atau analitik, Anda mungkin sangat
menyadari perdebatan Python vs. R. Meskipun kedua bahasa menghidupkan masa
depan — melalui kecerdasan buatan, pembelajaran mesin, dan inovasi berbasis
data — ada kekuatan dan kelemahan yang ikut berperan.

Dalam banyak hal, kedua bahasa open source ini sangat mirip. Gratis diunduh untuk semua

orang, kedua bahasa ini sangat cocok untuk tugas ilmu data — mulai dari manipulasi dan

otomatisasi data hingga analisis bisnis dan eksplorasi data besar. Perbedaan utama adalah

bahwa Python adalah bahasa pemrograman tujuan umum, sedangkan R berakar pada analisis

statistik. Semakin, pertanyaannya bukanlah yang mana yang harus dipilih, tetapi bagaimana

memanfaatkan kedua bahasa pemrograman dengan sebaik-baiknya untuk kasus penggunaan

spesifik Anda.

Apa itu Python?

Python adalah tujuan umum, bahasa pemrograman berorientasi objek yang menekankan

keterbacaan kode melalui penggunaan ruang putih yang murah hati. Dirilis pada tahun

1989, Python mudah dipelajari dan menjadi favorit para programmer dan developer.

Faktanya, Python adalah salah satu bahasa pemrograman paling populer di dunia, tepat di

belakang Java dan C.

Beberapa pustaka Python mendukung tugas ilmu data, termasuk yang berikut:

● Numpy untuk menangani array dimensi besar


● Panda untuk manipulasi dan analisis data
● Matplotlib untuk membangun visualisasi data

Plus, Python sangat cocok untuk menerapkan pembelajaran mesin dalam skala besar.
Rangkaian pustaka pembelajaran mendalam dan pembelajaran mesin khusus
mencakup alat seperti scikit-learn, Keras, dan TensorFlow, yang memungkinkan data

1
ilmuwan untuk mengembangkan model data canggih yang terhubung langsung ke
sistem produksi. Kemudian, Jupyter Notebooks adalah aplikasi web open source
untuk dengan mudah berbagi dokumen yang berisi kode Python langsung,
persamaan, visualisasi, dan penjelasan ilmu data.

Apa itu R?

R adalah bahasa pemrograman open source yang dioptimalkan untuk analisis statistik dan

visualisasi data. Dikembangkan pada tahun 1992, R memiliki ekosistem yang kaya dengan

model data yang kompleks dan alat yang elegan untuk pelaporan data. Pada hitungan

terakhir, lebih dari 13.000 paket R tersedia melalui Comprehensive R Archive Network

(CRAN) untuk analisis mendalam.

Populer di kalangan ilmuwan dan peneliti ilmu data, R menyediakan berbagai macam
perpustakaan dan alat untuk hal-hal berikut:

● Membersihkan dan menyiapkan data


● Membuat visualisasi
● Melatih dan mengevaluasi pembelajaran mesin dan algoritma pembelajaran mendalam

R umumnya digunakan dalam RStudio, lingkungan pengembangan terintegrasi (IDE) untuk

analisis statistik, visualisasi, dan pelaporan yang disederhanakan. Aplikasi R dapat

digunakan secara langsung dan interaktif di web melalui Shiny.

Perbedaan utama antara R dan Python: Tujuan analisis data

Perbedaan utama antara kedua bahasa adalah dalam pendekatan mereka terhadap ilmu

data. Kedua bahasa pemrograman open source didukung oleh komunitas besar, terus

memperluas perpustakaan dan alat mereka. Tapi sementara R terutama digunakan untuk

analisis statistik, Python menyediakan pendekatan yang lebih umum untuk perselisihan

data.

Python adalah bahasa multi-tujuan, seperti C++ dan Java, dengan mudah dibaca

2
sintaks yang mudah dipelajari. Pemrogram menggunakan Python untuk mempelajari analisis data atau

menggunakan pembelajaran mesin di lingkungan produksi yang skalabel. Misalnya, Anda mungkin

menggunakan Python untuk membangun pengenalan wajah ke dalam API seluler Anda atau untuk

mengembangkan aplikasi pembelajaran mesin.

R, di sisi lain, dibangun oleh ahli statistik dan sangat bersandar pada model statistik dan

analitik khusus. Ilmuwan data menggunakan R untuk analisis statistik yang mendalam,

didukung oleh hanya beberapa baris kode dan visualisasi data yang indah. Misalnya, Anda

dapat menggunakan R untuk analisis perilaku pelanggan atau penelitian genomik.

Perbedaan utama lainnya

● Pengumpulan data: Python mendukung semua jenis format data, dari file comma-

separated value (CSV) hingga JSON yang bersumber dari web. Anda juga dapat

mengimpor tabel SQL langsung ke kode Python Anda. Untuk pengembangan web,

pustaka permintaan Python memungkinkan Anda dengan mudah mengambil data dari

web untuk membangun kumpulan data. Sebaliknya, R dirancang untuk analis data untuk

mengimpor data dari Excel, CSV, dan file teks. File yang dibangun di Minitab atau dalam

format SPSS juga dapat diubah menjadi R dataframe. Sementara Python lebih fleksibel

untuk menarik data dari web, paket R modern seperti Rvest dirancang untuk

webscraping dasar.

● Eksplorasi data: Dengan Python, Anda dapat menjelajahi data dengan Pandas, pustaka

analisis data untuk Python. Anda dapat memfilter, mengurutkan, dan menampilkan data

dalam hitungan detik. R, di sisi lain, dioptimalkan untuk analisis statistik kumpulan data

besar, dan menawarkan sejumlah opsi berbeda untuk menjelajahi data. Dengan R, Anda

dapat membangun distribusi probabilitas, menerapkan uji statistik yang berbeda, dan

menggunakan pembelajaran mesin standar dan teknik penambangan data.

● Pemodelan data: Python memiliki pustaka standar untuk pemodelan data,


termasuk Numpy untuk analisis pemodelan numerik, SciPy untuk komputasi dan
kalkulasi ilmiah, dan scikit-learn untuk algoritme pembelajaran mesin. Untuk

3
analisis pemodelan khusus di R, Anda terkadang harus bergantung pada paket di luar

fungsionalitas inti R. Tetapi kumpulan paket khusus yang dikenal sebagai Tidyverse

memudahkan untuk mengimpor, memanipulasi, memvisualisasikan, dan melaporkan

data.

● Visualisasi data: Meskipun visualisasi bukanlah kekuatan dalam Python, Anda dapat

menggunakan pustaka Matplotlib untuk menghasilkan grafik dan bagan dasar. Plus,

perpustakaan Seaborn memungkinkan Anda menggambar grafik statistik yang lebih

menarik dan informatif dengan Python. Namun, R dibuat untuk mendemonstrasikan

hasil analisis statistik, dengan modul grafik dasar yang memungkinkan Anda membuat

bagan dan plot dasar dengan mudah. Anda juga dapat menggunakan ggplot2 untuk

plot yang lebih maju, seperti plot sebar kompleks dengan garis regresi.

Python vs. R: Mana yang tepat untuk Anda?

Memilih bahasa yang tepat tergantung pada situasi Anda. Berikut adalah beberapa hal yang perlu

dipertimbangkan:

● Apakah Anda memiliki pengalaman pemrograman? Berkat sintaksnya yang mudah

dibaca, Python memiliki kurva pembelajaran yang linier dan mulus. Ini dianggap sebagai

bahasa yang baik untuk programmer pemula. Dengan R, pemula dapat menjalankan

tugas analisis data dalam hitungan menit. Tetapi kompleksitas fungsionalitas tingkat

lanjut di R membuatnya lebih sulit untuk mengembangkan keahlian.

● Apa yang rekan Anda gunakan? R adalah alat statistik yang digunakan oleh
akademisi, insinyur, dan ilmuwan tanpa keterampilan pemrograman. Python
adalah bahasa siap produksi yang digunakan dalam berbagai alur kerja industri,
penelitian, dan rekayasa.
● Masalah apa yang Anda coba selesaikan? Pemrograman R lebih cocok untuk
pembelajaran statistik, dengan perpustakaan yang tak tertandingi untuk
eksplorasi dan eksperimen data. Python adalah pilihan yang lebih baik untuk
pembelajaran mesin dan aplikasi skala besar, terutama untuk analisis data
dalam aplikasi web.
● Seberapa penting bagan dan grafik? Aplikasi R ideal untuk

4
memvisualisasikan data Anda dalam grafik yang indah. Sebaliknya, aplikasi Python

lebih mudah diintegrasikan dalam lingkungan teknik.

● Perhatikan bahwa banyak alat, seperti Server Pembelajaran Mesin Microsoft,

mendukung R dan Python. Itulah mengapa sebagian besar organisasi menggunakan

kombinasi kedua bahasa, dan debat R vs. Python semuanya sia-sia. Bahkan, Anda

mungkin melakukan analisis dan eksplorasi data tahap awal di R dan kemudian beralih

ke Python saat tiba waktunya untuk mengirimkan beberapa produk data.

Sumber Bahan:
https://www.ibm.com/cloud/blog/python-vs-r

Sumber Bacaan Lainnya:


https://www.python.org/about/gettingstarted/

http://www.sthda.com/english/wiki/r-basics-quick-and-easy

https://towardsdatascience.com/python-basics-for-data-science-6a6c9
87f2755

https://medium.com/datactw/a-complete-introduction-to-r-for-data-sc
ience-1858c69f76b0

https://towardsdatascience.com/getting-started-with-r-programming-2
f15e9256c9

https://r4ds.had.co.nz/index.html

https://dplyr.tidyverse.org/

https://datacarpentry.org/R-ecology-lesson/03-dplyr.html

https://medium.com/analytics-vidhya/python-data-manipulation-fb86d
0cdd028

Anda mungkin juga menyukai