Modul Analisis Data (TM1)
Modul Analisis Data (TM1)
MODUL PERKULIAHAN
W542100001
– Analisis
Data
Pendahuluan
Abstrak Sub-CPMK
Analisis Teks
Analisis statistik
Analisis Diagnostik
Analisis Prediktif
Analisis Preskriptif
Analisis Teks
Analisis Teks juga disebut sebagai Data Mining. Ini adalah salah satu metode
analisis data untuk menemukan pola dalam kumpulan data besar menggunakan database
atau alat data mining . Ini digunakan untuk mengubah data mentah menjadi informasi
bisnis. Alat Business Intelligence hadir di pasar yang digunakan untuk mengambil
keputusan bisnis strategis. Secara keseluruhan ia menawarkan cara untuk mengekstrak
dan memeriksa data dan menurunkan pola dan akhirnya interpretasi data.
Analisis statistik
Analisis Statistik menunjukkan "Apa yang terjadi?" dengan menggunakan data
masa lalu berupa dashboard. Analisis Statistik meliputi pengumpulan, Analisis,
interpretasi, penyajian, dan pemodelan data. Ini menganalisis satu set data atau sampel
data. Ada dua kategori dari jenis Analisis – Analisis Deskriptif dan Analisis Inferensial.
Analisis Deskriptif
Analisis Deskriptif merupakan data lengkap atau sampel data numerik yang
diringkas. Ini menunjukkan mean dan deviasi untuk data kontinu sedangkan persentase
dan frekuensi untuk data kategorikal.
Metode ini menganalisis sampel dari data yang lengkap. Dalam jenis Analisis ini,
Anda dapat menemukan kesimpulan yang berbeda dari data yang sama dengan memilih
sampel yang berbeda.
Analisis Diagnostik
Analisis Prediktif
Analisis Preskriptif
Pengumpulan data
Setelah pengumpulan kebutuhan, Anda akan mendapatkan ide yang jelas tentang
hal-hal apa yang harus Anda ukur dan apa yang harus menjadi temuan Anda. Sekarang
saatnya untuk mengumpulkan data Anda berdasarkan persyaratan. Setelah Anda
mengumpulkan data Anda, ingatlah bahwa data yang dikumpulkan harus diproses atau
diatur untuk Analisis. Saat Anda mengumpulkan data dari berbagai sumber, Anda harus
menyimpan log dengan tanggal pengumpulan dan sumber data.
Pembersihan Data
Sekarang data apa pun yang dikumpulkan mungkin tidak berguna atau tidak relevan
dengan tujuan Analisis Anda, oleh karena itu harus dibersihkan. Data yang dikumpulkan
mungkin berisi catatan duplikat, spasi atau kesalahan. Data harus dibersihkan dan bebas
dari kesalahan. Fase ini harus dilakukan sebelum Analisis karena berdasarkan
Analisis data
Setelah data dikumpulkan, dibersihkan, dan diproses, data siap untuk Analisis. Saat
Anda memanipulasi data, Anda mungkin menemukan bahwa Anda memiliki informasi
yang tepat yang Anda butuhkan, atau Anda mungkin perlu mengumpulkan lebih banyak
data. Selama fase ini, Anda dapat menggunakan alat dan perangkat lunak analisis data
yang akan membantu Anda memahami, menafsirkan, dan menarik kesimpulan
berdasarkan persyaratan.
Interpretasi data
Visualisasi data
Visualisasi data sangat umum dalam kehidupan Anda sehari-hari; mereka sering
muncul dalam bentuk bagan dan grafik. Dengan kata lain, data ditampilkan secara grafis
sehingga akan lebih mudah bagi otak manusia untuk memahami dan mengolahnya.
Visualisasi data sering digunakan untuk menemukan fakta dan tren yang tidak diketahui.
Dengan mengamati hubungan dan membandingkan kumpulan data, Anda dapat
menemukan cara untuk menemukan informasi yang berarti.
Analisis data berarti proses pembersihan, transformasi, dan pemodelan data untuk
menemukan informasi yang berguna untuk pengambilan keputusan bisnis
Jenis Analisis Data adalah Teks, Statistik, Diagnostik, Prediktif, Analisis Preskriptif
Analisis Data terdiri dari Pengumpulan Kebutuhan Data, Pengumpulan Data,
Pembersihan Data, Analisis Data, Interpretasi Data, Visualisasi Data
Seperti tampak pada gambar 1.1., analisis data terkait dengan beberapa proses
lainnya. Tentu saja, lingkaran sadar ini memiliki banyak cabang. Untuk memetakan
semuanya akan membuat fraktal rekursif tak terbatas, di mana setiap langkah tunduk
pada pemeriksaan, tindakan, dan perubahan lebih lanjut .
Dalam model lingkaran sadar yang disederhanakan dan disarikan, kehebatan suatu
analisis hanya dapat dipertimbangkan dari segi efeknya. Analisis data dapat dikatakan
berhasil jika:
1. Data yang dikumpulkan diperiksa kualitasnya
2. Analisis dilakukan dengan ketelitian
3. Kesimpulan mengalir dari premis
4. Tindakan yang berguna diambil (atau dapat diambil)
Jika ada langkah yang hilang, analisis itu sendiri akan berantakan. Dengan
pemikiran ini, saya menyajikan beberapa contoh sepanjang sejarah, analisis data yang
efektif. Berikut ini adalah contoh-contoh tersebut.
Kita tidak akan pernah tahu kapan atau di mana orang pertama memutuskan untuk
merekam data tentang orang atau untuk tujuan apa. Kami tahu itu berguna karena idenya
bertahan lama. Catatan data tertulis dimulai dengan catatan perdagangan kuno, tercatat
pada lempengan tanah liat sekitar lima ribu tahun yang lalu.
Pertama kali ( yang kita ketahui ) analisis data tertulis semacam ini berdampak tidak
proporsional pada banyak orang sekaligus adalah ketika kerajaan Sumeria (kadang
disebut Babilonia ) mulai mencatat populasinya untuk mendistribusikan stok pangan.
Beberapa tablet yang digunakan untuk sensus ini bertahan hingga hari ini dan dipajang di
The British Museum.
Masih banyak yang tidak kita ketahui tentang Sumeria, tetapi kita tahu mereka
mencapai kesuksesan dalam arsitektur, teknik, matematika, peperangan, hukum,
administrasi, dan bahasa tertulis paling awal. Berapa banyak dari ini dapat dikaitkan
dengan pengumpulan dan analisis data mereka, kita mungkin tidak akan pernah tahu.
Pada waktunya, pengambilan sensus berlangsung di Mesir kuno, di mana ia
digunakan untuk menghitung dan mengatur angkatan kerja. Kitab Bilangan dalam Taurat
Yahudi mencatat pengambilan sensus untuk tujuan militer, dan orang Romawi mulai
merekam data demografis sekitar 600 SM.
The data sensus tertua adalah dari dinasti Han di Cina selama abad kedua, rekaman
populasi 59.600.000. Sensus kuno dan analisis datanya merupakan pencapaian sosial
2. Florence Nightingale
Florence Nightingale dikenal sebagai perawat, tetapi dia juga salah satu yang
pertama menggunakan infografis untuk menampilkan hasil analisis statistik. Menurut
Nightingale :
"Diagram sangat berguna untuk mengilustrasikan pertanyaan-pertanyaan tertentu
tentang statistik vital dengan menyampaikan ide-ide subjek melalui mata, yang tidak
dapat dengan mudah dipahami ketika terkandung dalam angka." Saat ini, kita biasanya
menyebutnya info grafis.
Nightingale menggunakan statistik dan koneksinya dengan kelas penguasa Inggris
untuk secara mendasar mereformasi dan memodernisasi perawatan kesehatan di akhir
abad kesembilan belas dengan mengidentifikasi sanitasi dan kebersihan sebagai hal yang
sangat penting untuk hasil kesehatan. Dia sampai pada kesimpulan ini melalui
pengumpulan dan analisis data. Tetapi presentasinya tentang data kekaisaran begitu
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
4. Abraham Wald
5. Perubahan Iklim
Sulit untuk menulis artikel tentang analisis data tanpa menyebutkan perubahan
iklim. Akan tetapi, juga sulit untuk menggambarkan analisis data yang sejauh ini berhasil.
Meskipun telah ada banyak kesadaran publik tentang isu-isu seputar dampak iklim global,
faktanya masih buram bagi sebagian orang lainnya.
Perhitungan pertama dari efek rumah kaca, di mana panas terperangkap dekat
dengan permukaan bumi, dimulai pada tahun 1896, dilakukan oleh ilmuwan Swedia,
Svante Arrhenius, menyimpulkan bahwa dua kali lipat karbon dioksida atmosfer (CO2) akan
memberikan pemanasan total 5-6 derajat Celcius . Ide-ide Arrhenius dikembangkan lebih
lanjut pada tahun 1899, oleh Thomas Crowder Chamberlin .
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
Sebelum menggunakan fungsi sortir atau Pivot Table, data harus “dibersihkan”. Ini
berarti bahwa langkah pertama dalam analisis data adalah menelusuri data dan
memastikan bahwa gaya entri data konsisten dalam kolom. Dalam hal ini, untuk
diagnosis, penting untuk memastikan bahwa hanya satu kata, frasa, atau singkatan yang
digunakan untuk menggambarkan setiap diagnosis. Jika beberapa kata digunakan untuk
menggambarkan hal yang sama—misalnya, jika "alergi" ditulis dalam database sebagai
"alergi", "alergi", dan "alergi" — analisisnya akan lebih sulit, jadi yang terbaik adalah
memilih satu istilah dan menggunakannya secara konsisten. Mungkin perlu untuk
mengubah terminologi yang digunakan dalam kumpulan data agar konsisten di seluruh;
perubahan tersebut harus dilakukan pada tahap awal ini. Jika ada beberapa diagnosis
untuk satu subjek, penting untuk membuat daftar diagnosis secara terpisah. Mungkin
perlu membuat kolom tambahan berlabel “Diagnosis 2” dan “Diagnosis 3”, yang
mencantumkan satu diagnosis di setiap kolom. (Jika demikian, dimungkinkan untuk
membuat beberapa Tabel Pivot dan menambahkan hasilnya secara manual.)
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 1 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 2 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 2 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 2 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 2 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 2 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
202
1 2 Analisis Data
Biro Bahan Ajar E-learning dan MKCU
https://www.uipath.com/blog/digital-transformation/top-10-examples-successful-data-
analysis
http://www.uniteforsight.org/global-health-university/data-analysis
202
1 2 Analisis Data
Biro Bahan Ajar E-learning dan MKCU