Diskusi statistika deskriptif selanjutnya setelah central tendency adalah mengukur variasi data. Jika pada central tendency yang diukur adalah “apa yang ada di tengah” atau “apa yang paling banyak” maka di bagian ini yang akan dinilai adalah “bagaimana tersebarnya data” atau “jarak dari satu data ke tengah” intinya soal variasi data. Ada beberapa ukuran yang digunakan: Range, Interquartile Range (IQR), Mean Absolute Deviation, Median Absolute Deviation, Variance dan Standard Deviation. Kita akan menjelajah sumber data lain yang tak kalah menarik dari data.go.id yaitu data.jakarta.go.id. Dan tak lupa, kita akan menggunakan R Console untuk mencoba konsep-konsep yang kita bahas. 1. Range Konsep ini sederhana, untuk menentukan range alias jangkauan data maka kita mengurangkan nilai tertinggi dengan nilai terendah.     Untuk mencoba[…]

Pada tulisan sebelumnya kita telah melakukan instalasi R dan sedikit (sekali) membahas mengenai statistika deskriptif. Telah pula disebutkan bahwa kata statistika dalam obrolan sehari-hari digunakan untuk menyatakan paling banyak, atau ter ter-(besar, kecil, banyak, sedikit) lainnya. Penggunaan istilah statistika tersebut mengacu pada statistika deskriptif. Kenapa? Akan kita bahas beberapa topik dalam statistika deskriptif yang sepertinya membuat orang mengasosiasikan ter-ter dengan kata statistik. Central Tendency, sesuatu tentang tengah data, metode apa yang bisa membantu kita mendeskripsikan tengah data yang kita punya. Beberapa pendekatan yang bisa dilakukan untuk mendeskripsikan tengah data kita adalah Mean, Median, Mode (modus). Mean Dalam istilah sehari-hari, rata-rata. Tambahkan seluruh nilai, bagi dengan banyaknya nilai. Sebagai contoh, kita akan menggunakan data proporsi penduduk yang memiliki ponsel di daerah[…]

Dalam keseharian kadang kita bertemu kalimat kurang lebih seperti ini, “menurut statistik …” atau “survei membuktikan …“. Hmm, statistik itu apa, atau siapa? Kenapa seperti penting sekali pendapatnya, harus diimani. Menurut wiki, statistik adalah cabang matematika yang ngurusin data, dari mengambil, mengatur, menganalisa, menginterpretasi sampai menyajikan. Buat penulis, sih, saat mendengar orang mengatakan “statistik …” selalu bernuansa statistik = angka yang digunakan untuk menguatkan argumen yang dikatakan pembicara. Hal itu diperkuat dengan kecenderungan orang menggunakan statistik untuk memanipulasi lawan bicaranya. Karena itulah ada tulisan macam ini atau bahkan buku populer bernama how to lie with statistics. Kalau dalam game, statistik biasanya menampilkan paling banyak, gol paling banyak, kartu kuning terbanyak, jumlah hit dan lainnya yang serba terbanyak. Kembali ke halaman[…]