0% menganggap dokumen ini bermanfaat (0 suara)
19 tayangan

Python Pandas For Data Analytic

Diunggah oleh

Ohm Ron
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
19 tayangan

Python Pandas For Data Analytic

Diunggah oleh

Ohm Ron
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 18

TechLisik

3 | PYTHON LIBS FOR


DATA ANALYTIC
MOHAMAD RONI HAMID

TechLisik
DATA FLOW PROCESSING
PYTHON PANDAS

• Pandas adalah sebuah library open-source di Python yang menyediakan


struktur data dan fitur analisis data
• 2 jenis struktur data yang bisa ditangani oleh Pandas
• Series (array satu dimensi)
• Data Frame (array dua dimensi/mengandung baris & kolom)
• Pandas dapat difungsikan untuk
• Membaca data dari beragam jenis file, seperti: .txt, .csv, dan .tsv
• Membuat tabel
• Mengolah data melalui operasi join, distinct, group by, dll
PANDAS APAKAH SUDAH TERINSTAL?

• Command: import pandas


INSTALASI PANDAS

• Command: pip3 install pandas


MEMBACA DATA EXCEL

• Script:
import pandas as pd
data = pd.read_excel(r'rekap_penjualan.xls')
df = pd.DataFrame(data, columns=['Tanggal Pemesanan', 'ID
Customer'])
columns = data.head()

print(list(data.columns.values.tolist()))
MEMBACA DATA EXCEL
MEMBACA RECORD EXCEL

• Script:
import pandas as pd
data = pd.read_excel(r'rekap_penjualan.xls')
df = pd.DataFrame(data, columns=['Tanggal Pemesanan', 'ID
Customer'])

print(df)
MEMBACA RECORD EXCEL
PYTHON BEAUTIFULSOUP

• BeautifulSoup adalah library Python yang digunakan untuk


mempermudah proses pembacaan data HTML dan XML
• BeautifulSoup dapat digunakan untuk melakukan Web Scraping
• BeautifulSoup berfungsi sebagai parser untuk memisahkan komponen-
komponen HTML menjadi rangkain elemen yang mudah dibaca
BEAUTIFUL SOUP APAKAH SUDAH
TERINSTAL?
• Command: from bs4 import BeautifulSoup
INSTALASI BEAUTIFUL SOUP

• Command: pip3 install beautifulsoup4


NGODING YUK!

• Membaca data spreadsheet


import pandas as pd
data = pd.read_excel(r'rekap_penjualan.xls')
df = pd.DataFrame(data, columns=['Tanggal Pemesanan',
'ID Customer'])
columns = data.head()
print(df)
NGODING YUK!

• Webscraping
from bs4 import BeautifulSoup
import requests
import pandas as pd
import datetime

URL =
"https://www.sigmaatk.id/product/category/baterai"
page = requests.get(URL)
NGODING YUK!

• Webscraping
soup = BeautifulSoup(page.content, "html.parser")
results = soup.find(id="page-content")
job_elements = results.find_all("div", class_="product")
NGODING YUK!

• Webscraping
for job_element in job_elements:
description_element =
job_element.find(class_="product-description")
title = description_element.find("h3").text
price = description_element.find("ins").text
product_element = title.split(" - ")[0]
satuan_element = title.split(" - ")[1]
price_element = price.split("Rp ")[1]
NGODING YUK!

• Webscraping
price_element = price_element.replace('.', '')
print(product_element, "|", satuan_element, "|",
price_element)
print()

Anda mungkin juga menyukai