Pandas Ekstraksi Angka dari Teks

Kode Lima Detik

import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/aansubarkah/basangdata_pandas/master/pandas-beginner/penjualan.csv')

df['angka'] = df['kolom_teks_dengan_angka'].str.extract('(\d+)').astype('int64')

Latar Belakang

Ingin mengambil angka dari teks di pandas? Hanya butuh sebaris kode.


Kode

Untuk kebutuhan ilustrasi kita akan menyiapkan data bersahadja kita kemudian menambahkan kolom berisi campuran teks dan angka.

import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/aansubarkah/basangdata_pandas/master/pandas-beginner/penjualan.csv')
penjual = ['penjual no ' + str(i) for i in range(1, 11)]
df['urutan'] = penjual

Lalu sebaris kode pamungkas.

df['no'] = df['urutan'].str.extract('(\d+)').astype('int64')

Untuk yang belum mengetahui, (\d+) adalah regex, sangat berguna saat mengekstraksi data dari teks. Banyak regex online yang dapat diberdayakan untuk menguji.


Lebih lanjut:


Cover Photo by Austris Augusts on Unsplash

One Reply to “Pandas Ekstraksi Angka dari Teks”

  1. Pingback: Bar Chart Race

Leave a Reply

Your email address will not be published.