Pandas Ekstraksi Angka dari Teks
import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/aansubarkah/basangdata_pandas/master/pandas-beginner/penjualan.csv') df['angka'] = df['kolom_teks_dengan_angka'].str.extract('(\d+)').astype('int64')
Daftar Isi
hide
Latar Belakang
Ingin mengambil angka dari teks di pandas? Hanya butuh sebaris kode.
Kode
Untuk kebutuhan ilustrasi kita akan menyiapkan data bersahadja kita kemudian menambahkan kolom berisi campuran teks dan angka.
import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/aansubarkah/basangdata_pandas/master/pandas-beginner/penjualan.csv') penjual = ['penjual no ' + str(i) for i in range(1, 11)] df['urutan'] = penjual
Lalu sebaris kode pamungkas.
df['no'] = df['urutan'].str.extract('(\d+)').astype('int64')
Untuk yang belum mengetahui, (\d+) adalah regex, sangat berguna saat mengekstraksi data dari teks. Banyak regex online yang dapat diberdayakan untuk menguji.
Lebih lanjut:
- https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.extract.html
- https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.astype.html
- https://pythex.org/
Cover Photo by Austris Augusts on Unsplash
One Reply to “Pandas Ekstraksi Angka dari Teks”