Statistik : Kejujuran aplikasi yang terus-menerus diuji
(Tulisan ini saya persembahkan pada 2 orang guru Metode Penelitian dan Statistika, SB Hari Lubis dan Rudi MS.)
Ada sebuah buku lama yang pernah diberikan teman kurang lebih 10 tahun yang lalu, “How to Lie With Statistics” karangan Darrell Huff, terbitan tahun 1993. Ternyata buku itu adalah buku kuno karena pertama terbit tahun 1954!
Waktu masih kuliah, saya pernah mendapat pelajaran Statistika (Statistics) dua Semester masing-masing 3 SKS. Benar-benar mata kuliah yang sulit saya cerna, karena (mungkin) terlalu matematis.
Setelah lulus, sialnya, saya dihadapkan kondisi harus ngajar mata kuliah membingungkan ini. Terpaksalah pontang-panting belajar lagi. Dari situasi keterpepetan akhirnya saya merasa lebih ‘nyaman’ dengan ilmu yang satu ini.
Walaupun secara matematis cukup ‘berat’, saya dapat menyimpulkan bahwa aplikasi statistika (terutama statistika inferens yang berhubungan dengan sampling) sebenarnya sangat logis dan yang paling penting: ‘Statistika itu cuma alat‘ yang harus digunakan secara tepat sesuai asumsi-asumsi yang membatasinya.
Tidak kalah penting, statistika juga berhubungan erat dengan ilmu lain yang disebut metodologi penelitian (research metodology/RM). Bahkan dalam banyak hal, RM ini jauh lebih penting untuk dipahami ketimbang Statistika, untuk mengetahui ‘kualitas’ sebuah kesimpulan yang ‘diolah’ menggunakan Statistika.
Dengan kata lain, jika RM-nya amburadul, sehebat apapun metode Statistika yang diaplikasikan, kesimpulannya ya amburadul juga! Itulah kemudian menjadi celah yang dimanfaatkan oleh orang-orang tertentu untuk memanipulasi kesimpulan sesuai dengan keinginan. Dan dengan ringannya mengatakan: secara statistika (ilmiah) kesimpulannya valid!
Contoh yang sekarang sedang tren, bagaimana statistika rawan dimanipulasi oleh survei-survei Pemilu. Dalam sebuah survei disimpulkan bahwa: tokoh A sangat difavoritkan menjadi Presiden, tokoh B anjok popularitasnya, dan sebagainya.
Semua kesimpulan survei (yang menerapkan prinsip-prinsip Statistika) tersebut akan sangat sulit diukur ‘kualitasnya’ (dalam RM dikenal dengan istilah reliabilitas dan validitas), jika RM-nya tidak diketahui. Mari kita lihat beberapa ilustrasi berikut :
1. Rancangan kuesioner (questioner design).
Salah satu prinsip yang tidak boleh dilanggar dalam pembuatan kuesioner adalah: Pertanyaan harus disusun sedemikian rupa agar responden tidak ‘digiring’ pada jawaban-jawaban tertentu.
Contohnya:
Jika anda diminta memilih Presiden pada saat ini, siapa yang Anda pilih?
a. SBY
b. Megawati
c. Wiranto
Ini adalah contoh pertanyaan yang ‘menggiring’, karena responden dipaksa memilih salah satu dari mereka. Walaupun daftar ini dibuat dengan lebih banyak calon, tetap saja ‘menggiring’.
Yang terbaik adalah pertanyaan dengan jawaban terbuka. Atau jika ingin dibuat pilihan, harus disediakan pilihan :
d. Lainnya (sebutkan), atau
d. Tidak satupun.
2. Rancangan pengambilan sampel (sampling design).
Prinsip utama dalam pengambilan sampel adalah acak (random), artinya setiap anggota populasi harus memiliki kesempatan yang sama untuk menjadi sampel.
Tidak kalah pentingnya, harus jelas definisi populasinya.
Jika populasinya adalah responden pemilik telepon, maka kesimpulan hanya berlaku untuk populasi tersebut. Kecuali bisa dibuktikan secara statistik bahwa tidak ada perbedaan signifikan antara responden pemilik telepon dengan responden lainnya.
Jika populasinya adalah 10 kota besar, maka kesimpulannya juga hanya berlaku untuk 10 kota besar tersebut. Kecuali bisa dibuktikan secara statistik bahwa tidak ada perbedaan signifikan antara responden 10 kota besar dengan responden kota lainnya.
Pemilihan sampel adalah tahap krusial, banyak teknik sampling yang bisa digunakan, masing-masing memiliki keterbatasan sendiri-sendiri.
Tidak kalah pentingnya adalah kualitas pelaksana pengambilan sampel. Sebaik apapun sampling design jika pelaksanaannya asal-asalan, kesimpulannya ya amburadul juga.
3. Error (Galat).
Statistika Inferens (pengambilan kesimpulan atas populasi berdasarkan analisis atas sampel), tidak pernah lepas dari apa yang disebut dengan galat (error). Dengan demikian kesimpulan yang diperoleh itu tidak akan pernah 100% benar.
4. Variabel Penelitian.
Dalam RM, biasanya harus dijelaskan mengenai variabel-variabel yang diukur, paling tidak mencakup:
- Apa variabel yang diukur?
- Kenapa variabel itu yang diukur?
- Bagaimana definisi variabel tersebut?
- Jika variabel yang diukur merupakan indikator terhadap sesuatu, perlu ada penjelasan alasan pemilihan variabel tersebut sebagai indikatornya.
Contohnya:
Jika yang ingin kita ukur adalah ‘orang miskin‘. Apa indikator yang akan kita gunakan untuk menentukan seseorang dinyatakan sebagai ‘miskin’. Misalnya, diukur atas dasar pendapatan bruto per bulan. Berapa per bulan yang dianggapa miskin? Jika ditentukan, misalnya Rp 1 juta. Apa alasannya? Apakah ada beda antara yang masih bujang dengan yang sudah punya keluarga? Kemudian bisa disempurnakan dengan pernyataan, dianggap miskin jika:
- Bujang, pendapatan kurang dari Rp 500 ribu per bulan.
- Suami-Istri, pendapatan kurang dari Rp 750 ribu per bulan.
- Keluarga dengan anak, ditambah Rp 250 ribu per anak yang masih dalam tanggungan.
- Demikian seterusnya.
Yang perlu diingat adalah definisi ‘orang miskin’ di atas bisa berbeda antara satu penelitian dengan penelitian yang lain. Jika ada 2 penelitian yang menggunakan definisi yang berbeda, tentu saja tidak bisa dibandingkan!
Jika SBY mengatakan jumlah ‘orang miskin’ berkurang, perlu diteliti hal-hal berikut:
- Apa definisinya? Apakah Anda sepakat dengan definisi tersebut?
- Kapan dilakukan? Dibandingkan dengan data yang Kapan?
- Apakah kondisinya memang ‘bisa dibandingkan‘? Misalnya apakah pengaruh inflasi diperhitungkan? Jika tingkat inflasi 0%, jelas bisa langsung dibandingkan. Jika tidak, harus ada penyesuaian terlebih dahulu. Dengan demikian perlu dicek lanjutan.
- Selain inflasi, variabel lain apa saja yang perlu ‘diwaspadai’?
- Apakah pengaruh musim juga sudah diperhitungkan? Misalnya, untuk petani, pendapatan pada musim panen tentunya berbeda dengan musim tanam.
- Intinya, variabel-variabel yang bisa mempengaruhi kesimpulan, harus dikontrol terlebih dahulu, agar kesimpulannya valid.
Dengan demikian, adalah tidak mudah untuk membuat ‘klaim-klaim’ atas hasil pengolahan Statistika karena banyak hal yang harus dicek dalam setiap tahapan RM dan pengolahan statistikanya. Jika semua tahapan ini tidak transparan dan/atau tidak bisa diketahui oleh publik, kita patut curiga: Jangan-jangan hasilnya direkayasa?
Coba apa yang bisa Anda simpulkan dari kutipan pidato kenegaraan Presiden SBY 15 Agustus 2008 yang lalu sebagai berikut:
“…Tingkat pengangguran terbuka pada Februari 2006 mencapai 10,5 persen, kini telah berhasil diturunkan menjadi 8,5 persen pada Februari 2008. Begitu pula, tingkat kemiskinan, mengalami penurunan dari 17,7 persen pada tahun 2006 menjadi 15,4 persen pada Maret 2008. Angka kemiskinan tahun 2008 ini, adalah angka kemiskinan terendah, baik besaran maupun prosentasenya, selama 10 tahun terakhir. Tren penurunan angka kemiskinan ini juga terjadi, walaupun kita menggunakan kriteria angka kemiskinan dari Bank Dunia. Ini merupakan suatu kemajuan yang nyata dan patut kita syukuri. Dan saya mengucapkan terima kasih kepada semua pihak, termasuk para Gubernur, Bupati dan Walikota di seluruh tanah air, yang telah bekerja keras untuk itu…”
Apakah ada dokumen yang bisa diakses oleh publik mengenai RM yang digunakan sehingga keluar klaim ini?
Apalagi Darrell Huff sudah mewanti-wanti sejak 54 tahun yang lalu melalui bukunya ‘How to Lie with Statistics‘.
Ahah …!
About this entry
You’re currently reading “Statistik : Kejujuran aplikasi yang terus-menerus diuji,” an entry on Another Adji Wigjoteruna's Personal Blog
- Telah Diterbitkan:
- September 19, 2008 / 11:10 pm
- Kategori:
- Ilmu Nyo, Politik Nyo, Umum Nyo
13 Komentar
Langsung ke formulir komentar | comment rss [?] | trackback uri [?]