Modul Introduction To Data Analytics
Modul Introduction To Data Analytics
Materi:
Disusun oleh:
Ambar Kusumaningsih, S.E., Ak., M.A., CA, CFE, ASEAN CPA
NIP 198605162019032011
PRODI S1 AKUNTANSI
FAKULTAS EKONOMIKA DAN BISNIS
UNIVERSITAS NEGERI SURABAYA
2023
DEFINISI DATA ANALYTICS
Data analytics dalam konteks bisnis adalah proses mengevaluasi data dengan tujuan menarik
kesimpulan untuk menjawab pertanyaan bisnis (Richardson, Teeter, & Terrell, 2023). Analisis
Data yang efektif menyediakan cara untuk menelusuri data terstruktur berukuran besar (data
yang mengikuti model data yang telah ditentukan sebelumnya dalam format tabel) dan data
tidak terstruktur (data yang tidak mengikuti format data yang telah ditentukan sebelumnya)
untuk menemukan pola atau hubungan yang tidak diketahui. Analisis Data sering kali
melibatkan teknologi, sistem, praktik, metodologi, basis data, statistik, dan aplikasi yang
digunakan untuk menganalisis beragam data bisnis guna memberikan informasi yang
dibutuhkan organisasi untuk membuat keputusan bisnis yang tepat dan tepat waktu. Artinya,
proses Analisis Data bertujuan untuk mengubah data mentah menjadi pengetahuan untuk
menciptakan nilai.
B. Akuntansi Manajemen
Dari semua bidang akuntansi, tujuan Analisis Data paling mirip dengan akuntansi
manajemen. Akuntan manajemen (1) ditanyai pertanyaan oleh manajemen, (2) menemukan
data untuk menjawab pertanyaan tersebut, (3) menganalisis data, dan (4) melaporkan
hasilnya kepada manajemen untuk membantu pengambilan keputusan. Deskripsi tugas
akuntan manajemen dan analis data tampaknya sangat mirip, bahkan identik dalam banyak
hal. Baik itu memahami biaya melalui job order costing, memahami activity based costing
drivers, memperkirakan penjualan di masa depan, atau menentukan apakah akan menjual
atau memproses lebih lanjut atau membuat atau melakukan outsourcing proses
produksinya. Sebagai penyedia informasi bagi perusahaan, penting bagi akuntan
manajemen untuk memahami kemampuan data dan Analisis Data untuk menjawab
pertanyaan manajemen.
D. Perpajakan
Perencana perpajakan harus mengembangkan kemampuan perencanaan pajak yang
canggih yang membantu perusahaan meminimalkan pajaknya sedemikian rupa untuk
menghindari atau mempersiapkan kemungkinan audit. Analisis data perpajakan menjadi
berharga karena kemampuannya membantu staf pajak memprediksi apa yang akan terjadi
daripada bereaksi terhadap apa yang baru saja terjadi. Salah satu hal terbaik yang dilakukan
Analisis Data adalah analisis prediktif atau memprediksi masa depan. Contoh bagaimana
analisis data pajak dapat digunakan adalah kemampuan untuk memprediksi potensi
konsekuensi pajak dari potensi transaksi internasional, investasi penelitian dan
pengembangan, atau usulan merger atau akuisisi.
Seorang akuntan mungkin tidak perlu membangun database dari awal atau melakukan Analisis
Data yang kompleks, namun untuk menjalankan tugasnya sebagai akuntan sebaiknya memiliki
kemampuan melakukan hal-hal berikut:
Mengartikulasikan dengan jelas permasalahan bisnis yang dihadapi perusahaan.
Berkomunikasi dengan data scientist tentang kebutuhan data tertentu dan memahami
kualitas dasar data tersebut.
Menarik kesimpulan yang tepat terhadap masalah bisnis berdasarkan data dan memberikan
rekomendasi secara tepat waktu.
Menyajikan hasilnya kepada masing-masing anggota manajemen (CEO, manajer audit,
dll.) dengan cara yang dapat diakses oleh setiap anggota.
JENIS DATA
Data dapat diklasifikasikan berdasarkan jenisnya dalam tiga kelompok klasifikasi. Kelompok
klasifikasi yang pertama membagi data menjadi data kualitatif dan kuantitatif, kemudian
kelompok klasifikasi kedua membagi jenis data menjadi data terstruktur dan data tak
terstruktur. Klasifikasi ketiga adalah berdasarkan kumpulan data yang digunakan dalam
analisis ekonometrik, yaitu terdapat tiga jenis: data cross section, data time series, dan data
panel.
Klasifikasi 1
1. Data Kualitatif
Data kualitatif merupakan data yang direpresentasikan baik dalam format verbal
maupun naratif (Academy for Educational Development, 2006). Jenis data ini
dikumpulkan melalui kelompok fokus, wawancara, kuesioner terbuka, dan situasi
kurang terstruktur lainnya. Data kualitatif dapat berupa data categorical atau counting
yang dapat disajikan dalam bentuk nominal (misalnya suku, warna mata, negara asal,
dsb), ordinal (misalnya tingkat pendidikan, tingkat pendapatan, status ekonomi) dan
binary (misalnya True/False, Yes/No) (Köseoğlu, 2022).
2. Data Kuantitatif
Data kuantitatif merupakan data yang dinyatakan dalam bentuk numerik (Academy for
Educational Development, 2006). Data kuantitatif dapat merupakan hasil dari suatu
pengukuran atau menyatakan bilangan hasil perhitungan (Köseoğlu, 2022). Data hasil
pengukuran atau continuous data dapat disajikan dalam bentuk interval (misalnya
pendapatan tahunan, suhu udara, tingkat IQ). Data hasil perhitungan atau discrete data
misalnya jumlah orang (1000 orang, 2000 penduduk) dapat disajikan dalam bentuk
binary (nomor yang diberikan ke kategori biner 1-0), nominal (nomor yang diberikan
nilai nominal), atau ordinal (misal rating 1-10).
Klasifikasi 2
1. Data Terstruktur
Data terstruktur adalah data yang terorganisir sehingga dapat dengan mudah dicari di
database terkait. Data terstruktur umumnya disimpan dalam tabel di database. Data
terstruktur dapat dilihat dari bentuk data berupa tabel dengan baris dan kolom di
dalamnya. Pada umumnya, data berupa angka-angka, tanggal, string yang disimpan
dalam tabel termasuk data terstruktur. Data dengan tipe ini memiliki biaya memori yang
sedikit karena data ini sudah dalam bentuk yang paling sederhana dan terstruktur
(Indwiarti, Rohmawati, & Gunawan, 2021).
2. Data tidak Terstruktur
Data tidak terstruktur tidak memiliki format yang ditentukan, data tersebut disimpan
dalam potongan yang lebih tidak beraturan di database. Contoh umum dari data tidak
terstruktur adalah file teks sederhana, gambar, video, dll. Data tidak terstruktur dapat
diubah menjadi data terstruktur setelah melalui proses. Perbandingan antara data
terstruktur dengan data tidak terstruktur dapat dilihat pada gambar 1.
Klasifikasi 3
1. Data Cross Section
Data cross section dikumpulkan melalui survei sampel atau metode enumerasi lengkap.
Informasi yang dikumpulkan dari seluruh unit lintas bagian (cross section) seperti
rumah tangga, perusahaan atau negara, pada suatu waktu tertentu membentuk data cross
section. Dalam sebagian besar kasus, informasi tidak dapat dikumpulkan secara tepat
pada periode waktu yang sama. Data cross section dihasilkan oleh seorang peneliti
individu melalui survei lapangan atau oleh lembaga resmi di berbagai negara. Data
cross section banyak digunakan di bidang ekonomi dan ilmu sosial lainnya (Das, 2019).
2. Data Time Series
Data time series terdiri dari pengamatan terhadap suatu variabel atau beberapa variabel
yang dikumpulkan sepanjang waktu (Das, 2019). Waktu merupakan dimensi penting
dalam data time series. Sebagian besar data makroekonomi bersifat time series. Proses
pembuatan data time series bersifat stokastik, dan realisasi data time series dicirikan
oleh fungsi kepadatan probabilitas gabungan. Karena data time series bersifat stokastik,
peneliti harus menguji perilaku stokastik variabel sebelum menggunakannya dalam
model ekonometrik. Data time series tidak dikumpulkan melalui survei seperti pada
data cross section. Sebagian besar data time series merupakan perkiraan dan tersedia
dalam statistik resmi. Saat data time series diestimasi, data tersebut bersifat stokastik.
Data time series berguna dalam menganalisis tren dan peramalan dalam model
makroekonometrik. Di bidang keuangan, mereka digunakan dalam memperkirakan
volatilitas serta pengembalian rata-rata suatu aset keuangan.
Ciri utama data time series adalah bahwa data tersebut terkait, seringkali sangat terkait,
dengan sejarah terkininya. Fitur ini menimbulkan masalah kritis dalam penggunaan
data time series dalam model ekonometrik standar. Diperlukan lebih banyak langkah
dalam menentukan model ekonometrik untuk data time series sebelum
menggunakannya dalam metode ekonometrik standar.
3. Data Panel
Data panel merupakan gabungan data cross section dan time series (Das, 2019). Data
panel diperoleh dengan mengulangi survei dengan kumpulan unit sampel yang sama
untuk mendapatkan informasi mengenai isu serupa dari waktu ke waktu. Time series
untuk setiap unit penampang membentuk sekumpulan data panel atau data longitudinal.
Jika unit penampangnya adalah unit mikro seperti rumah tangga, dan perusahaan, maka
panel tersebut disebut panel mikro. Dalam panel mikro, dimensi waktu lebih kecil dari
dimensi penampang. Sebaliknya, jika unit penampangnya merupakan unit makro
seperti negara, maka panel tersebut disebut panel makro. Dimensi waktu sangat besar
dibandingkan dengan dimensi penampang pada panel makro. Data panel juga mungkin
seimbang atau tidak seimbang tergantung pada apakah semua informasi tersedia untuk
semua unit pada setiap titik waktu.
Fitur utama dari data panel adalah bahwa ia mempertimbangkan unit-unit penampang
yang sama selama periode waktu tertentu. Kumpulan data panel, terutama data
individu, rumah tangga, dan perusahaan, lebih sulit diperoleh di negara-negara
berkembang. Karena alasan ini, kumpulan data penampang telah mendapatkan
popularitas dalam penggunaan model ekonometrik di negara berkembang.
Pilihan model Analisis Data sangat bergantung pada jenis pertanyaan yang ingin dijawab dan
akses ke data yang diperlukan untuk menjawab pertanyaan tersebut. Analisis deskriptif dan
diagnostik biasanya dipasangkan ketika ingin mendeskripsikan data masa lalu dan kemudian
membandingkannya dengan tolok ukur untuk menentukan mengapa hasilnya seperti itu, mirip
dengan konsep akuntansi perencanaan dan pengendalian. Demikian pula, analitik prediktif dan
preskriptif dapat menjadi pilihan ketika ingin memprediksi suatu hasil dan kemudian membuat
rekomendasi tentang cara menindaklanjutinya, mirip dengan auditor yang menandai suatu
transaksi sebagai risiko tinggi dan kemudian mengikuti diagram alur keputusan untuk
menentukan apakah akan meminta tambahan bukti atau memasukkannya ke dalam temuan
audit.
Analisis Deskriptif
Analisis deskriptif membantu meringkas apa yang terjadi di masa lalu. Misalnya, seorang
akuntan keuangan akan menghitung semua transaksi penjualan dalam suatu periode untuk
menghitung nilai Penjualan yang muncul pada laporan laba rugi. Akuntan dapat menggunakan
fungsi Excel “=SUM()” untuk mendapatkan jumlah tersebut. Contoh lainnya, seorang analis
akan menghitung jumlah record dalam suatu data ekstrak untuk memastikan data sudah
lengkap sebelum melakukan analisis yang lebih kompleks. Analis tersebut dapat menggunakan
fungsi Excel “=COUNT()” atau “=COUNTA()” atau “COUNTIF()”. Kedua contoh tersebut
merupakan bagian dari summary statistics. Summary statistics menggambarkan lokasi,
penyebaran, bentuk, dan ketergantungan serangkaian pengamatan (Richardson, Teeter, &
Terrell, 2023). Fungsi pad Excel yang termasuk summary statistics antara lain count, sum,
minimum, maximum, mean or average, standard deviation, median, quartiles, correlation
covariance, dan frequency.
Latihan
Dari data Excel yang tersedia, lakukan analisis dekripsi – summary statistics untuk mengetahui
hal-hal berikut:
1. Berapa jumlah staff Precision Prosperity Corporation?
Langkah pengerjaan:
a. Buka file Excel sheet “Staff”
b. Pada baris terbawah tulis rumus berikut: “=COUNTA(C6:C16)”
Latihan
Dari data Excel yang tersedia, lakukan analisis dekripsi – data reduction untuk mengetahui
hal-hal berikut:
1. Temukan 3 Vendor dengan jumlah pembelian terbanyak!
Langkah pengerjaan:
a. Buatlah tabel pivot dari data pembelian yang tersedia.
Pilih data pembelian, kemudian buat tabel pivot dengan cara: Insert > PivotTable >
From Table/Range
Ditemukan hasil Vendor dengan pembelian terbanyak adalah Daniel Clark, Stella
Coleman, dan Emma Lopez.
2. Apakah terdapat indikasi karyawan melakukan penggelapan dana dengan cara berpura-
pura menjadi vendor?
Langkah pengerjaan:
Salah satu indikasi penggelapan adalah apabila karyawan memalsukan informasi vendor,
misal no rekening, alamat, atau informasi lainnya, sehingga apabila dana dikirim ke
rekening tersebut seolah-olah dana untuk membayar barang dagangan namun sebetulnya
dana masuk ke rekening pribadi karyawan. Untuk memeriksa apakah terdapat informasi
yang sama dari dua data berbeda, bisa menggunakan fungsi VLOOKUP pada Excel dengan
cara sebagai berikut:
1. Tentukan data tujuan dan data sumber. Dalam hal ini data tujuan adalah data karyawan
dan data sumber adalah data vendor. Data tujuan dan sumber dapat diganti sesuai
kebutuhan. Pada latihan ini hanya terdapat informasi alamat, sehingga hal yang
diperiksa pada latihan ini memastikan apakah ada alamat karyawan yang sama dengan
alamat vendor. Apabila terdapat informasi lain yang lebih lengkap, auditor dapat
melakukan pemeriksaan untuk semua informasi terkait yang memiliki risiko indikasi
kecurangan.
2. Lakukan operasi VLOOKUP pada data karyawan dengan rumus
“=VLOOKUP(D6;Vendor!$D$6:$D$30;1;FALSE)”
D6 = cell alamat karyawan yang diperiksa
Vendor!$D$6:$D$30 = sumber data alamat vendor
penggunaan tanda $ agar sumber data tidak bergeser
ketika rumus dicopy ke baris lainnya
1 = menunjukkan kolom ke berapa yang diambil datanya
dalam hal ini yang dipilih hanya 1 kolom yaitu D
FALSE = range lookup ketika tidak ditemukan data pada sumber
Dari hasil VLOOKUP diketahu terdapat dua karyawan yang alamatnya sama dengan
vendor. Perlu pemeriksaan lebih lanjut di lapangan apakah transaksi terkait vendor
tersebut valid.
Analisis Diagnostik
Analisis diagnostik memberikan wawasan tentang alasan terjadinya sesuatu atau
bagaimana nilai data individu berhubungan dengan populasi umum. Salah satu metode
analisis diagnostik yang umum adalah profiling. Profiling atau pembuatan profil data
dapat dilakukan dengan cara yang sederhana seperti menghitung ringkasan statistik
pada data transaksional, seperti jumlah hari rata-rata untuk mengirimkan suatu produk,
jumlah rata-rata yang kami bayarkan untuk suatu produk, atau jumlah jam kerja yang
diharapkan oleh seorang karyawan. Di sisi lain, pembuatan profil dapat digunakan untuk
mengembangkan model kompleks untuk memprediksi potensi fraud. Misalnya data
profil untuk setiap karyawan di perusahaan yang mungkin menyertakan kombinasi gaji,
jam kerja, dan perilaku pembelian perjalanan dan hiburan. Penyimpangan yang tiba-tiba
dari perilaku karyawan di masa lalu mungkin merupakan risiko dan memerlukan tindak
lanjut oleh auditor internal. Mirip dengan mengevaluasi perilaku, pembuatan profil data
biasanya digunakan untuk menilai kualitas data dan pengendalian internal. Misalnya,
pembuatan profil data dapat mengidentifikasi pelanggan dengan data master yang tidak
lengkap atau salah atau transaksi yang salah ketik.
Latihan
Dari data Excel yang tersedia, lakukan analisis diagnostik – profiling untuk mengetahui
profil penjualan berdasarkan hari.
Langkah pengerjaan:
1. Menentukan hari penjualan
Pada file excel hanya terdapat informasi tanggal, sehingga perlu dicari terlebih dahulu
penjualan terjadi pada hari apa. Rumus yang digunakan adalah
“=TEXT(C7;"[$]dddd")”
4. Membuat grafik
Pilih data penjualan (kolom Day dan Sales), klik Insert > pilih model chart yang
diinginkan.
1. Dari data Excel yang tersedia, lakukan analisis dekripsi – summary statistics untuk
mengetahui hal-hal berikut:
a. Berapa jumlah vendor di Precision Prosperity Corporation?
b. Berapa jumlah vendor yang memiliki alamat di City M?
c. Berapa jumlah pembelian setiap bulan?
d. Berapa jumlah penjualan tertinggi per bulan dan pada bulan apa?
e. Buat daftar harga pembelian barang per vendor!
2. Dari data Excel yang tersedia, kalukan analisa diagnostic – profiling untuk mengetahui hal-
hal berikut:
a. Profil jumlah pembelian ke vendor berdasarkan kota asalnya
b. Profil pembelian per bulan
DAFTAR PUSTAKA