0% menganggap dokumen ini bermanfaat (0 suara)
93 tayangan6 halaman

Mini Task SC Data Science - November 2023

Data Science adalah disiplin ilmu yang menggabungkan statistika, matematika, dan pemrograman untuk menganalisis dan mengekstraksi pola dari data guna membuat keputusan yang lebih baik dan memecahkan masalah kompleks. Materi ini menjelaskan proses pengumpulan, penyimpanan, dan persiapan data untuk analisis."

Diunggah oleh

Alifa Azwadina
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
93 tayangan6 halaman

Mini Task SC Data Science - November 2023

Data Science adalah disiplin ilmu yang menggabungkan statistika, matematika, dan pemrograman untuk menganalisis dan mengekstraksi pola dari data guna membuat keputusan yang lebih baik dan memecahkan masalah kompleks. Materi ini menjelaskan proses pengumpulan, penyimpanan, dan persiapan data untuk analisis."

Diunggah oleh

Alifa Azwadina
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 6

SHORT CLASS

DATA ANALYSIS

Portofolio - Short Class

Data Visualization
Data Science
Practice
Introduction
Oleh : (Nama Kamu)
Owner: Alifa Azwadina Fuad
JOIN THE BEST
Build yourUPSKILLING
skill and portfolio via myskill.id/bootcamp
COMMUNITY MINI TASK
WITH ME at myskill.id/bootcamp
Short Class Data Science Introduction

Course Summary
Poin Belajar Rangkuman

Data Science merupakan disiplin ilmu yang menggabungkan keterampilan dari berbagai bidang seperti statistika, matematika, dan
Pengenalan
pemrograman untuk menganalisis dan mengekstraksi wawasan dari data. Tujuannya adalah untuk membuat keputusan yang lebih
Data Science
baik, memahami pola, dan memecahkan masalah kompleks.

Mengumpulkan Data:
1. Identifikasi Sumber Data: Tentukan sumber data yang relevan untuk tujuan analisis.
2. Pilih Metode Pengumpulan Data: Pilih metode seperti survei, observasi, atau eksperimen sesuai kebutuhan.
3. Desain Alat Pengumpulan Data: Buat pertanyaan atau instrumen pengumpulan data yang sesuai dengan variabel yang diamati.
4. Lakukan Pengumpulan Data: Kumpulkan data dengan akurat dan konsisten.
5. Verifikasi Kualitas Data: Periksa kualitas data untuk memastikan ketepatan dan kelengkapan, dan perbaiki kesalahan jika ditemukan.
Mengumpulkan
Menyimpan Data:
dan Menyimpan
1. Pilih Format Penyimpanan: Tentukan format penyimpanan yang sesuai, seperti spreadsheet, database, CSV, atau JSON.
Data
2. Buat Struktur Data yang Jelas: Tetapkan struktur data dengan kolom dan tipe data yang konsisten.
Menyiapkan
3. Buat Backup Data: Rutin buat backup data dan simpan salinan di lokasi yang aman.
Data
4. Gunakan Kode Unik atau ID: Identifikasi setiap entitas data dengan kode unik atau ID untuk pelacakan yang efisien.
5. Dokumentasikan Metadata: Catat metadata, termasuk definisi variabel, unit pengukuran, dan informasi lain yang mendukung
pemahaman data.
6. Atur Izin Akses: Lindungi data sensitif dengan mengatur tingkat akses sesuai kebijakan keamanan.
7. Rencanakan Struktur Penyimpanan: Jika menggunakan database, susun skema dan indeks dengan cermat untuk meningkatkan
kinerja.
#RintisKarirImpian
Short Class Data Science Introduction

Course Summary
Poin Belajar Rangkuman

Langkah2 Menyiapkan Data:


1. Pemahaman Data:
Menganalisis data untuk memahami karakteristiknya, termasuk variabel yang ada, format data, dan potensi isu seperti missing value
atau duplikasi.
2. Handling Missing Value:
Mengatasi missing value dengan metode yang sesuai, seperti pengisian dengan nilai rata-rata, median, atau menggunakan model
prediktif.
3. Handling Duplikasi:
Menghilangkan atau mengelola duplikasi data untuk memastikan integritas dan keakuratan hasil analisis.
4. Menggunakan ID Unik:
Menambahkan identifikasi unik (ID) pada setiap entitas data untuk memudahkan referensi dan pengelolaan data.
Menyiapkan
5. Mengatasi Tipe Data:
Data Menyesuaikan tipe data untuk setiap variabel, termasuk mengubah data menjadi format numerik jika diperlukan.
6. Mengatasi Inconsistent Format:
Menyelaraskan format data agar seragam, seperti format tanggal, mata uang, atau unit pengukuran.
7. Data Normalization:
Melakukan normalisasi data jika diperlukan, terutama jika data memiliki skala yang berbeda-beda.
8. Dokumentasi Metadata:
Dokumentasikan metadata, termasuk definisi variabel, format data, dan informasi penting lainnya.
9. Backup Data:
Melakukan backup data secara teratur untuk mencegah kehilangan informasi dan memastikan keamanan data.
10. Pengaturan Izin Akses:
Menetapkan tingkat izin akses yang sesuai dengan kebijakan keamanan untuk melindungi data sensitif.
#RintisKarirImpian
Mini Task
Nama Umur Tinggi Badan Negara

Teresa “23” 165 Belgia

Alex “20” USA

Simaklah tabel di samping, lalu siapkanlah data Patricia “18” 181 Prancis

tersebut menggunakan materi yang sudah Michelle “22” 172 SG


dijelaskan, yakni mencakup menghilangkan
Anggun “21” 156 Indonesia
duplikasi data, menggunakan ID unik, membuat
Michelle “22” 172 SG
data menjadi homogen, menyesuaikan tipe data,
John “25” 169 Kanada
dan mengatasi missing value.
Timothy “29” 180 USA

Timothy “29” 180 USA

Airlangga “20” ID

#RintisKarirImpian
Short Class Data Science Introduction
Hasil Persiapan Data
Penjelasan perubahan:

ID Nama Umur Tinggi Badan Negara


1. Menghilangkan Duplikasi Data:
Duplikasi nama "Michelle" dan “Timothy” dihapus, 1 Teresa 23 165 Belgia
sehingga hanya ada satu baris dengan nama tersebut.
2. Menggunakan ID Unik: 2 Alex 20 173 USA
Menambahkan kolom ID sebagai identifier unik untuk
setiap entitas. 3 Patricia 18 181 Prancis
3. Membuat Data Menjadi Homogen:
- Umur dan tinggi badan diubah menjadi tipe data 4 Michelle 22 172 SG
numerik.
- Umur dan negara diisi dengan data yang hilang 5 Anggun 21 156 Indonesia
(missing value)
4. Menyesuaikan Tipe Data: 6 John 25 169 Kanada
Umur dan tinggi badan diubah menjadi tipe data
numerik. 7 Timothy 29 180 USA
5. Mengatasi Missing Value:
8 Airlangga 20 173 USA
Memilih pendekatan sederhana dengan mengisi
missing value pada tinggi badan dengan nilai rata-rata
tinggi badan yang ada.
Follow me!
Instagram : @alifaazwadinaf
Twitter : -
LinkedIn : @Alifa Azwadina

Short Class Data Analysis


by @myskill.id

Anda mungkin juga menyukai