0% menganggap dokumen ini bermanfaat (0 suara)
49 tayangan3 halaman

Tutorial Pandas Bag-1

Dokumen ini memberikan pengantar singkat tentang penggunaan pandas untuk membuat dan mengolah objek data seperti Series dan DataFrame. Ia mendemonstrasikan cara membuat Series dan DataFrame dengan berbagai metode seperti daftar nilai, array NumPy, dan kamus objek serta menjelaskan tipe data kolom yang dihasilkan.

Diunggah oleh

NUR JAYA
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
49 tayangan3 halaman

Tutorial Pandas Bag-1

Dokumen ini memberikan pengantar singkat tentang penggunaan pandas untuk membuat dan mengolah objek data seperti Series dan DataFrame. Ia mendemonstrasikan cara membuat Series dan DataFrame dengan berbagai metode seperti daftar nilai, array NumPy, dan kamus objek serta menjelaskan tipe data kolom yang dihasilkan.

Diunggah oleh

NUR JAYA
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 3

10 menit ke panda 

#
Ini adalah pengantar singkat tentang panda, yang ditujukan terutama untuk pengguna
baru. Anda dapat melihat resep yang lebih kompleks di Cookbook .

Biasanya, kami mengimpor sebagai berikut:

>>>
In [1]: import numpy as np

In [2]: import pandas as pd

Pembuatan objek 
Lihat bagian Pengantar struktur data .

Membuat Seriesdengan meneruskan daftar nilai, membiarkan panda membuat indeks integer


default:

>>>
In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8])

In [4]: s
Out[4]:
0 1.0
1 3.0
2 5.0
3 NaN
4 6.0
5 8.0
dtype: float64

Membuat DataFramedengan melewatkan array NumPy, dengan indeks datetime


menggunakan date_range() dan kolom berlabel:

>>>
In [5]: dates = pd.date_range("20130101", periods=6)

In [6]: dates
Out[6]:
DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',
'2013-01-05', '2013-01-06'],
dtype='datetime64[ns]', freq='D')

In [7]: df = pd.DataFrame(np.random.randn(6, 4), index=dates,


columns=list("ABCD"))
In [8]: df
Out[8]:
A B C D
2013-01-01 0.469112 -0.282863 -1.509059 -1.135632
2013-01-02 1.212112 -0.173215 0.119209 -1.044236
2013-01-03 -0.861849 -2.104569 -0.494929 1.071804
2013-01-04 0.721555 -0.706771 -1.039575 0.271860
2013-01-05 -0.424972 0.567020 0.276232 -1.087401
2013-01-06 -0.673690 0.113648 -1.478427 0.524988

Membuat DataFramedengan melewati kamus objek yang dapat diubah menjadi struktur seperti
seri:

>>>
In [9]: df2 = pd.DataFrame(
...: {
...: "A": 1.0,
...: "B": pd.Timestamp("20130102"),
...: "C": pd.Series(1, index=list(range(4)), dtype="float32"),
...: "D": np.array([3] * 4, dtype="int32"),
...: "E": pd.Categorical(["test", "train", "test", "train"]),
...: "F": "foo",
...: }
...: )
...:

In [10]: df2
Out[10]:
A B C D E F
0 1.0 2013-01-02 1.0 3 test foo
1 1.0 2013-01-02 1.0 3 train foo
2 1.0 2013-01-02 1.0 3 test foo
3 1.0 2013-01-02 1.0 3 train foo

Kolom yang dihasilkan DataFramememiliki tipe yang berbeda :

>>>
In [11]: df2.dtypes
Out[11]:
A float64
B datetime64[ns]
C float32
D int32
E category
F object
dtype: object

Jika Anda menggunakan IPython, penyelesaian tab untuk nama kolom (serta atribut publik)
diaktifkan secara otomatis. Berikut subset atribut yang akan dilengkapi:

>>>
In [12]: df2.<TAB> # noqa: E225, E999
df2.A df2.bool
df2.abs df2.boxplot
df2.add df2.C
df2.add_prefix df2.clip
df2.add_suffix df2.columns
df2.align df2.copy
df2.all df2.count
df2.any df2.combine
df2.append df2.D
df2.apply df2.describe
df2.applymap df2.diff
df2.B df2.duplicated

Seperti yang Anda lihat, kolom A, B, C, dan Dtab secara otomatis selesai. Edan Fapakah ada
juga; atribut lainnya telah dipotong untuk singkatnya.

Anda mungkin juga menyukai