0% menganggap dokumen ini bermanfaat (0 suara)
68 tayangan

Modul 1 Import Data

Modul ini membahas proses import data dari file Excel ke dalam Jupyter Notebook untuk melakukan analisis data mining. Langkah-langkahnya meliputi membuka file Excel, menggunakan library openpyxl dan pandas, memuat data ke dalam DataFrame, mengatur kolom data, dan menampilkan hasil berdasarkan kriteria tertentu seperti jumlah baris dan urutan kolom. Contohnya menggunakan data set siswa dan data penumpang trans Jogja.

Diunggah oleh

ADE
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
68 tayangan

Modul 1 Import Data

Modul ini membahas proses import data dari file Excel ke dalam Jupyter Notebook untuk melakukan analisis data mining. Langkah-langkahnya meliputi membuka file Excel, menggunakan library openpyxl dan pandas, memuat data ke dalam DataFrame, mengatur kolom data, dan menampilkan hasil berdasarkan kriteria tertentu seperti jumlah baris dan urutan kolom. Contohnya menggunakan data set siswa dan data penumpang trans Jogja.

Diunggah oleh

ADE
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 4

MODUL 1

IMPORT DATA

Pertemuan ke : 1
Alokasi Waktu : 1,5 Jam
Kompetensi Dasar : Mahasiswa paham, mampu menjelaskan dan membuat proses data
mining sesuai dengan data yang diperoleh sebelumnya.
Indikator : Import data untuk data mining dapat dilakukan dengan baik

A. Import data dari file Excel


Saat memulai suatu proyek tentang data science, kemungkinan besar kita akan sering
mengambil data melalui web scrapping, dan tidak menutup kemungkinan juga mengambil
data dari kumpulan data yang di unduh dari tempat lain, seperti Kaggle, Quandl, dll. Data
tersebut mungkin dalam format file Excel atau disimpan dalam ekstensi .csv.
B. Langkah Praktikum :
Ikuti langkah praktikum berikut ini:
1. Lakukan analisis data mining menggunakan Data Alumni untuk dilakukan proses
import data.
2. Buka data set alumni dengan nama Data Alumni.xlxs
3. Perhatikan record-record pada tabel tersebut
4. Lakukan langkah berikut :
a. Membuka Anaconda Jupyter Notebook.
b. Import library yang akan digunakan.

- openpyxl : library yang digunakan untuk read dan write file Excel
- pandas : library data analysis, untuk mengolah data secara terstruktur
c. Inisialisasi file excel yang akan di import

- load_workbook : nama function dari library openpyxl yang digunakan


melakukan import data dari excel (kemudian disimpan dalam variabel wb).
- sheet_ranges : variable yang menampung data dari sheet mana yang akan
diambil dalam file excel (pada contoh ini adalah Sheet5).
- DataFrame : adalah function dari library pandas yang digunakan untuk
melakukan parsing data terstruktur kedalam bentuk kolom dan baris,
dengan demikian data yang telah diparsing akan menjadi sebuah table yang
nampak seperti susunan pada relational database, dimana sebuah baris
tunggal mewakili sebuah contoh tunggal dan kolom mewakili
atribut tertentu. (Kemudian dimasukkan ke dalam variabel df ).
d. Setting data ke dalam template

- d = df[1:12][[1,3,12,9,6,7,10,11]] : digunakan untuk memasukkan


dataframe df ke dalam variable d
- columns : function dari library pandas
e. Menampilkan data pada kolom TTL

f. Menampilkan data pada kolom TTL dengan bentuk tabel

g. Menampilkan data dengan jumlah tertentu

h. Menampilkan data secara ascending atau descending berdasarkan kolom TTL

5. Analisis dan berikan penjelasan hasil dari load data!

C. Post Test / Tugas Praktikum


1. Lakukanlah import data dari data set penumpangtransjogja.xlxs
2. Tampilkan data kolom Halte dala bentuk tabel
3. Tampilkan data dengan jumlah 8
Hasil :
4. Tampilkan data kolom Halte dengan jumlah 8
Hasil :

5. Tampilkan data secara ascending kolom Halte dengan jumlah 8


Hasil :

D. Evaluasi

Nilai Yogyakarta,
………………………………………….
Paraf asisten

(……………………………………)
1. Data set siswa. xlxs

2. Data set penumpangtransjogja.xlxs

Anda mungkin juga menyukai