Pandas Menampilkan Data
import pandas as pd df = pd.read_csv('penjualan.csv') df.loc[0:3, ['nama', 'jan', 'mar']] df.iloc[0:3, [0, 1, 3]] df[['nama', 'jan', 'mar']][:3] df[:3][['nama', 'jan', 'mar']]
Ref: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html
Sudah bisa mengakses data dari csv, excel, pdf dan MSSQL. Sekarang saatnya melakukan eksplorasi terhadap data kita.
Yang mudah dulu, bagaimana memilih data yang akan ditampilkan. Data yang akan digunakan pun tidak rumit, hanya 10 baris sahadja.
Data di atas adalah data penjualan odol merk GigiSepertiBaru oleh sepuluh tenaga pemasar. Data penjualan.csv di atas dan Notebook tulisan ini dapat diakses di sini.
Definisi
Pandas menyediakan setidaknya tiga cara menampilkan (menyeleksi) data, yaitu .loc, .iloc dan [].
.loc
Memilih baris dan kolom berdasarkan labelnya.
.iloc
Memilih baris dan kolom berdasarkan posisi, yang ditunjukkan dengan angka integer.
[]
Memilih baris dan kolom berdasarkan nama kolom, mirip dengan .loc namun fitur ini yang paling sering digunakan karena umumnya kebutuhan kita adalah mengambil semua baris dari kolom tertentu.
Contoh Penggunaan
Catatan
Ada alasan kenapa di atas selalu disebutkan baris terlebih dahulu baru kemudian kolom. Secara umum urutan seleksi data di pandas adalah seperti ini.
Baris dulu baru, dipisahkan koma, kemudian kolom. Dalam bahasa Indonesia, kode di atas berarti “dari data di df tampilkan semua baris dan semua kolom“.
Python Slicing
Bagi sesiapa yang belum karib dengan Python mungkin janggal dengan tanda baca yang berurutan seperti itu, kurung siku dan titik dua yang dipisahkan koma.
Pada Python, cara memotong (slicing) variabel array/list adalah seperti di bawah ini.
list[start:stop:step]
Jika sebelum titik dua (start) tidak terdapat angka, Python menganggap tempat tersebut diisi angka 0, alias data pertama pada array/list. Demikian pula jika tempat kedua (stop) tidak diisi, Python menganggap tempat itu diisi dengan akhir data, sehingga akan ditampilkan data sampai akhir. Jika tempat ketiga (step) tidak diisi maka dianggap data akan melompat satu per satu.
Contoh
Me-load Data
import pandas as pd df = pd.read_csv('penjualan.csv') df
Menampilkan Baris Pertama
df.loc[0] df.iloc[0] df[:1]
Pada .loc, 0 adalah label dari baris pertama. Karena kolom tidak didefinisikan maka semua kolom pada baris dengan label 0 akan ditampilkan.
Pada .iloc, 0 adalah posisi data pertama, sama seperti penjelasan .loc di atas, karena kolom tidak didefinisikan maka semua kolom ditampilkan.
Kode df[:1] berarti ambil satu data pertama dari df. Penggunaan [] memberikan efek seperti melihat tabel sehingga lebih nyaman dan mudah dimengerti.
Menampilkan Baris Pertama pada Kolom jan
df.loc[0, 'jan'] df.iloc[0, 1] df[['jan']][:1] df[:1][['jan']]
Menampilkan Empat Baris Pertama pada Kolom nama, jan dan mar
df.loc[0:3, ['nama', 'jan', 'mar']] df.iloc[0:3, [0, 1, 3]] df[['nama', 'jan', 'mar']][:3] df[:3][['nama', 'jan', 'mar']]
Menampilkan Semua Baris pada Kolom nama dan apr
df.loc[:, ['nama', 'apr']] df.iloc[:, [0, 4]] df[['nama', 'apr']]
Menampilkan Semua Baris pada Kolom nama Sampai feb
df.loc[:, 'nama':'feb'] df.iloc[:, :3] df[['nama', 'jan', 'feb']]
Menampilkan Semua Baris pada Semua Kolom
df.loc[:, :] df.loc[:,] df.iloc[:, :] df.iloc[:] df
Perhatian
Pada .loc dan .iloc setidaknya kita harus mendefinisikan baris yang akan ditampilkan. Kita tidak dapat hanya mendefinisikan kolom.
Cover Image by ElasticComputeFarm from Pixabay
One Reply to “Pandas Menampilkan Data”