Dalam keseharian kadang kita bertemu kalimat kurang lebih seperti ini, “menurut statistik …” atau “survei membuktikan …“. Hmm, statistik itu apa, atau siapa? Kenapa seperti penting sekali pendapatnya, harus diimani. Menurut wiki, statistik adalah cabang matematika yang ngurusin data, dari mengambil, mengatur, menganalisa, menginterpretasi sampai menyajikan. Buat penulis, sih, saat mendengar orang mengatakan “statistik …” selalu bernuansa statistik = angka yang digunakan untuk menguatkan argumen yang dikatakan pembicara. Hal itu diperkuat dengan kecenderungan orang menggunakan statistik untuk memanipulasi lawan bicaranya. Karena itulah ada tulisan macam ini atau bahkan buku populer bernama how to lie with statistics. Kalau dalam game, statistik biasanya menampilkan paling banyak, gol paling banyak, kartu kuning terbanyak, jumlah hit dan lainnya yang serba terbanyak. Kembali ke halaman[…]

Judul tulisan sengaja menggunakan kata “jenis” alih-alih “tipe” untuk mengurangi kemungkinan ada yang nyasar di tulisan ini karena mengira akan membahas mengenai tipe data yang digunakan dalam pemrograman (integers, boolean, dll). Jenis data yang akan dibahas adalah yang digunakan dalam penelitian (atau skripsi). Pengetahuan mengenai jenis data akan menentukan alat analisis apa yang digunakan, karenanya menjadi penting untuk diketahui. Data dapat berupa kuantitatif dan kualitatif. Data Kuantitatif adalah data yang dapat diukur, ditulis dalam bentuk angka dan dapat dilakukan perhitungan matematika (tambah kurang kali bagi). Sederhananya, data kuantitatif adalah data angka (ini simplifikasi yang keterlaluan tapi efektif kwkwkw). Data Kualitatif tidak dapat benar-benar diukur misalnya enak tidak enaknya bubur ayam. Untuk kemudahan, ingat saja kata data kualitatif = kualitas. Dalam[…]

Jika menemukan orang yang menyatakan matematika itu mudah, segera jauhi, kemungkinan ia aneh. Kwkwkw. Tapi sungguh, matematika adalah bagian penting dalam kehidupan kita yang tidak mungkin terhindarkan. Bahkan di bagian yang menurut kita tidak berhubungan dengannya, matematika ternyata berperan penting. Seperti soalan yang akan kita bahas. Melanjutkan tulisan sebelumnya mengenai Teorema Bayes, kali ini akan dibahas bagaimana melakukan klasifikasi teks menggunakan Naive Bayes.     Untuk apa kita perlu melakukan klasifikasi teks? Klasifikasi teks adalah jamak dilakukan di era industry 4.0 ini. Kita telah menggunakan (atau merasakan manfaatnya) bahkan tanpa kita sadari. Brand (dalam bentuk apapun, misal tokoh politik) menggunakan klasifikasi teks untuk menjaring opini publik, misal suka atau tidak suka dengan produk (atau kebijakan atau tema kampanye). Kantor berita[…]

Tulisan ini adalah pekerjaan rumah yang tertunda lebih dari setahun. Semua bermula dari sebuah rumus dalam tugas akhir kuliah.     Atau dalam dokumen yang sama (baca: laporan tugas akhir) disimplifikasi menjadi.     Sebaris rumus di atas adalah teorema Bayes yang dalam tugas akhir saya gunakan untuk mengelompokkan (klasifikasi) teks dari Twitter. Sebenernya diminta untuk kasih contoh perhitungan sederhana oleh dosen penguji proposal. Untungnya Pak Dosen ga menguji laporan akhir, jadi saya lolos tanpa tahu bagaimana cara menghitungnya deh, kwkwkw. Beberapa hari ini entah kenapa berurusan lagi dengan Teori Bayes, karena itu sekalian saja dituliskan hasil perjalanan itu sebagai bentuk ‘mengumpulkan tugas’ dan pasti berguna sebagai future reference. Versi wikipedia untuk rumus Bayes adalah adalah berikut (posisi Prior dan[…]

Khususnya adalah kata (atau kalimat) setelah karakter (tertentu) yang terakhir ditemukan. Misal mengambil judul artikel dari pranala https://basangdata.com/python-menjumlahkan-baris-tertentu-pada-semua-sheet-excel menjadi python-menjumlahkan-baris-tertentu-pada-semua-sheet-excel. setelah mempelajari file Excel ini, kita tahu delimiter (pembatas) dari tiap-tiap informasi adalah tanda / karena itu sebuah formula dapat dibuat dengan syarat mengetahui posisi terakhir tanda tersebut, lalu formula tersebut mengambil semua karakter setelah posisi tersebut. Jika Anda tertarik bagaimana menyelesaikan ini dengan Python, silahkan gunakan Notebook ini. Pada tulisan ini kita akan menggunakan cara yang lebih portable, formula Excel (meski dapat pula diterapkan pada teknologi lain seperti Google Sheets). Kita akan menggunakan formula yang digunakan oleh Excel University di sini. Berikut langkah kerja yang diperlukan. #1. Mengetahui berapa jumlah tanda / pada teks, dengan begitu kita dapat menentukan[…]

Ternyata memilih judul tulisan sulit juga. Masalah yang kita hadapi adalah seperti ini, kita memiliki sebuah file dengan banyak sheet, di tiap sheet terdapat data pada kolom H yang ingin kita jumlahkan, hasil penjumlahan semua sheet kita simpan di sheet bernama Total. Ilustrasi masalah tersebut seperti di bawah ini. File Excel di atas dapat diunduh di sini. Untuk mencapai tujuan menjumlahkan kolom H dari baris 2 sampai baris 18 (atau baris n ke m) kita punya beberapa alternatif solusi formula di sheet Total. =SUM(JAN!H1:H14)+SUM(FEB!H1:H14) namun dengan konsekuensi kita menuliskan sebanyak sheet yang ada =SUM(JAN!H1:H14,FEB!H1:H14) formula ini hanya berlaku di Excel (Google Sheets tidak dapat memproses). =SUM(JAN:APR!H1:H14) lagi, hanya berlaku di Excel, formula ini akan memproses semua sheet antara JAN sampai[…]

Salah satu keunggulan scripting language seperti Python adalah kemudahan eksekusi sehingga tepat digunakan untuk menyelesaikan masalah sehari-hari. Dengan scripting language (baca: Python) kode relatif lebih pendek dan tidak membutuhkan waktu untuk mengkompilasi. Tapi kita simpan pembahasan itu untuk entah kapan, sekarang saatnya menyelesaikan real world problem. Bagaimana memindahkan data dari kolom B ke kolom C pada baris 96 dan 108 dan entah baris berapa lagi, tanpa merubah data kolom C baris 100, 101 dan baris-baris lainnya. Dengan fungsi Excel tentu sulit karena kita tidak tahu akan muncul di baris ke berapa saja, tidak mungkin pula copy and paste formula pada kolom C yang ada isinya. Cut and Paste, sama saja bunuh diri. Jangan worry, Python to the rescue. Kita akan[…]

Jupyter Lab adalah teknologi yang bagus, kegunaan paling terasa adalah kita tak perlu menghadapi layar hitam (Command Prompt/Console) untuk menjalankan kode Python, selain karena dapat memberikan penjelasan soal yang kita kerjakan. Instalasi di Windows cukup melelahkan, sejujurnya itulah alasan saya pindah ke *nix family karena instalasi paket software untuk memprogram jauh lebih mudah, karena butuh banyak bandwith dan instalasi macam-macam. Karena telah memiliki pip awalnya saya pikir cukup melakukan instalasi Jupyter dengan perintah pip install jupyter di Command Prompt. Menunggu cukup lama karena banyak paket program yang perlu diinstal. Oke, hal itu cukup normal. Dan kemudian masalah mulai timbul. Muncul teks merah, blablabla… failed. Alamak. Tepat di atas error message berwarna merah, ada keterangan Get it with “Microsoft Visual C++[…]

VBA Excel adalah teknologi yang bagus dan telah menyelesaikan persoalan banyak orang. Seseorang bertanya bagaimana menampilkan Id Pelanggan (ID_Pel) di I3 jika drop-down (Nama) di H3 diubah. Persoalan seperti ini adalah wilayah VBA Excel, dimana pengguna butuh kendali lebih atas data namun dapat tetap interaktif. Sejujurnya penulis sudah >11 tahun tidak pernah lagi memprogram Basic, terakhir VB 6.0, karena itu bahkan untuk membuka VBA Excel penulis harus meng-googling (ternyata Alt + F11 di Excel). Karena file yang penulis buat adalah reproduksi dari kasus di atas, penulis juga harus meng-googling bagaimana cara membuat drop-down list dengan nilai dari kolom B. Penulis sempat berpikir membuat drop-down list harus dengan VBA, dan ternyata cukup menggunakan Menu Data > Data Tools > Data Validation[…]

Setelah berhasil membuat dan mengubah file Excel menggunakan Python, mari mulai mencari studi kasus yang lebih mudah dikerjakan dengan bantuan Python alih-alih hanya Excel. Selalu menggunakan Python untuk semua kasus atau sebaliknya, menggunakan Excel saja untuk semua masalah yang dihadapi, adalah tidak efisien, gunakan alat yang tepat untuk masing-masing kondisi agar kita dapat segera meninggalkan layar komputer dan melanjutkan hidup. Hehehe. Di grup Excel diberikan soal seperti ini, jika ada nama pada kolom H yang mirip dengan nama pada kolom F, tampilkan nilai kolom I pada kolom G. Jika nama pada kolom H dan F sama maka kita dapat dengan mudah menggunakan fungsi vlookup. Namun vlookup sensitif sekali, beda satu spasi saja tidak akan menghasilkan keluaran yang kita harapkan apalagi[…]