Pandas Menampilkan Data

Kode Lima Detik

import pandas as pd

df = pd.read_csv('penjualan.csv')

df.loc[0:3, ['nama', 'jan', 'mar']]
df.iloc[0:3, [0, 1, 3]]
df[['nama', 'jan', 'mar']][:3]
df[:3][['nama', 'jan', 'mar']]

Ref: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html


Sudah bisa mengakses data dari csv, excel, pdf dan MSSQL. Sekarang saatnya melakukan eksplorasi terhadap data kita.

Yang mudah dulu, bagaimana memilih data yang akan ditampilkan. Data yang akan digunakan pun tidak rumit, hanya 10 baris sahadja.

Data di atas adalah data penjualan odol merk GigiSepertiBaru oleh sepuluh tenaga pemasar. Data penjualan.csv di atas dan Notebook tulisan ini dapat diakses di sini.


Definisi

Pandas menyediakan setidaknya tiga cara menampilkan (menyeleksi) data, yaitu .loc, .iloc dan [].

.loc

Memilih baris dan kolom berdasarkan labelnya.

.iloc

Memilih baris dan kolom berdasarkan posisi, yang ditunjukkan dengan angka integer.

[]

Memilih baris dan kolom berdasarkan nama kolom, mirip dengan .loc namun fitur ini yang paling sering digunakan karena umumnya kebutuhan kita adalah mengambil semua baris dari kolom tertentu.


Contoh Penggunaan

Catatan

Ada alasan kenapa di atas selalu disebutkan baris terlebih dahulu baru kemudian kolom. Secara umum urutan seleksi data di pandas adalah seperti ini.

Baris dulu baru, dipisahkan koma, kemudian kolom. Dalam bahasa Indonesia, kode di atas berarti “dari data di df tampilkan semua baris dan semua kolom“.

Python Slicing

Bagi sesiapa yang belum karib dengan Python mungkin janggal dengan tanda baca yang berurutan seperti itu, kurung siku dan titik dua yang dipisahkan koma.

Pada Python, cara memotong (slicing) variabel array/list adalah seperti di bawah ini.

list[start:stop:step]

Jika sebelum titik dua (start) tidak terdapat angka, Python menganggap tempat tersebut diisi angka 0, alias data pertama pada array/list. Demikian pula jika tempat kedua (stop) tidak diisi, Python menganggap tempat itu diisi dengan akhir data, sehingga akan ditampilkan data sampai akhir. Jika tempat ketiga (step) tidak diisi maka dianggap data akan melompat satu per satu.


Contoh

Me-load Data

import pandas as pd

df = pd.read_csv('penjualan.csv')
df

Menampilkan Baris Pertama

df.loc[0]
df.iloc[0]
df[:1]

Pada .loc, 0 adalah label dari baris pertama. Karena kolom tidak didefinisikan maka semua kolom pada baris dengan label 0 akan ditampilkan.

Pada .iloc, 0 adalah posisi data pertama, sama seperti penjelasan .loc di atas, karena kolom tidak didefinisikan maka semua kolom ditampilkan.

Kode df[:1] berarti ambil satu data pertama dari df. Penggunaan [] memberikan efek seperti melihat tabel sehingga lebih nyaman dan mudah dimengerti.

Menampilkan Baris Pertama pada Kolom jan

df.loc[0, 'jan']
df.iloc[0, 1]
df[['jan']][:1]
df[:1][['jan']]

Menampilkan Empat Baris Pertama pada Kolom nama, jan dan mar

df.loc[0:3, ['nama', 'jan', 'mar']]
df.iloc[0:3, [0, 1, 3]]
df[['nama', 'jan', 'mar']][:3]
df[:3][['nama', 'jan', 'mar']]

Menampilkan Semua Baris pada Kolom nama dan apr

df.loc[:, ['nama', 'apr']]
df.iloc[:, [0, 4]]
df[['nama', 'apr']]

Menampilkan Semua Baris pada Kolom nama Sampai feb

df.loc[:, 'nama':'feb']
df.iloc[:, :3]
df[['nama', 'jan', 'feb']]

Menampilkan Semua Baris pada Semua Kolom

df.loc[:, :]
df.loc[:,]
df.iloc[:, :]
df.iloc[:]
df

Perhatian

Pada .loc dan .iloc setidaknya kita harus mendefinisikan baris yang akan ditampilkan. Kita tidak dapat hanya mendefinisikan kolom.


Cover Image by ElasticComputeFarm from Pixabay

One Reply to “Pandas Menampilkan Data”

Leave a Reply

Your email address will not be published.