Python-Spark-GPU v1.1 MAG
Python-Spark-GPU v1.1 MAG
2
Python merupakan salah satu bahasa pilihan data
scientist
3
Alasan Pemilihan Bahasa Python
Sangat mudah dipelajari, dokumentasi lengkap
Kaya akan library dan framewroks
Komunitas Open source yang bertumbuh pesat
Data science dan Machine Learning
Dapat menggunakan resource cloud secara gratis
4
Python Cheat dengan ChatGPT
Fakta: code python selalu lebih pendek
5
Jupyter Notebook mengubah segalanya, sehingga kita dapat
melakukan coding hanya dengan browser, menggunakan resource
cloud.
6
Apache Spark merupakan Framework yang
populer untuk melakukan pengolahan data besar
MLlib GraphX
Spark SQL Streaming Machine Graph
Learning Computation
7
Memulai coding dengan Python pada Spark
Instalasi PySpark
pip install pyspark
Import PySpark
from pyspark.sql import SparkSession
8
9
10
Bagian 2
11
Numba
Numba merupakan compiler python untuk array dan
numerical functions.
Merubah bahasa python menjadi C, C++, Fortran.
Mempercepat ekseskusi.
12
Fitur Numba
On-the-fly code generation
Native code generation untuk CPU dan GPU
Integrasi errat dengan library scientific python (dengan
menggunakan library numpy)
13
14
GPU Compilation and Code Delivery
LLVM
Intermediate LLVM
Representation IR
(IR)
CUDA
Client Server
Python CUDA Binary
Kernel
Parallel Thread
Execution (PTX) PTX
Code
15
16
17
Bagian 3
18
19
Spark NVIDIA
20
Unified AI Framework for ETL + ML/DL
21
Ease of Use
22
RAPIDS membungkus library menjadi seamless
dan mudah digunakan.
23
Terima kasih
24