Rabu, 30 Maret 2011

Analisis Statistika Berdasarkan Kenormalan Data

Berdasarkan kenormalan data, analisis statistika terbagi menjadi dua yakni Analisis Parametrik dan Analisis Non Parametrik.

Analisis Parametrik
Parametrik ... hmm jika pembaca membaca dari awal, dalam pembahasan Dasar-Dasar dalam Statistik, kata ini mengandung arti nilai-nilai yang didapatkan dari populasi, dugaan anda sudah benar, karena nama analisis ini akan selalu didasarkan pada nilai-nilai parameter.

Dalam metode statistika parametrik ini, ada asumsi-asumsi utama yang harus dipenuhi yaitu kenormalan data dan minimal skala data pengukuran minimal interval. Mengapa minimal skala data pengukuran minimal harus interval? Hal ini disebabkan untuk skala interval dan rasio operasi matematika bisa diberlakukan (penjumlahan, pengurangan, dsb), sedangkan kita tahu untuk nominal dan ordinal operasi aritmatika tidak bisa dilakukan. Inilah kadang beberapa peneliti tidak memperhatikan, banyak sekali kasus seperti kuesioner yang umumnya skala pengukuran nominal ordinal (sangat tidak setuju, tidak setuju, setuju, sangat setuju) kadang dipaksakan untuk menggunakan regresi-korelasi (untuk melihat hubungan) padahal regresi korelasi ini termasuk parametrik.
Mengapa dalam analisis parametrik data harus normal?
Suatu data dapat dikatakan normal apabila nilai rata-rata benar-benar mencerminkan keadaan suatu populasi atau sampel, artinya data akan mengumpul pada satu nilai sehingga bila kita lihat data akan terlihat sama satu sama lain (jika ada perbedaan, perbedaan tersebut tidak terlalu jauh). Untuk menjelaskan mengenai data normal ini bisa diilustrasikan sebagai berikut:
Sebagai ilustrasi misalkan terdapat kelompok data yang terdiri dari 2, 3, 4, 2, 2, 5, dan 3. Secara kasat mata, kumpulan data itu normal (jika ingin memastikan bisa dilanjutkan dengan uji normalitas), mengapa normal? Coba kita lihat data hanya berkisar antara 2 s.d 5. Jarak tidak terlalu jauh satu sama lain. Dari hasil perhitungan kita dapatkan nilai rata-rata 3 dan standar deviasi 1.15. Nilai rata-rata ini menunjukkan nilai tengah dari kumpulan data. Artinya data mengumpul pada area 3, sedangkan nilai standar deviasi 1.15 terlihat kecil menandakan keseragaman data.
Kemudian bandingkan dengan kumpulan data sebagai berikut: 2, 3, 4, 2, 2, 5, dan 15. Normalkah data itu? Tentu tidak, hal ini disebabkan nilai 15 akan merusak. Dari kumpulan data ini didapatkan rata-rata 4.71 dan standar deviasi 4.68. Nilai rata-rata ini tidak mencerminkan nilai tengah dari kumpulan data ini. Seharusnya nilai tengah antara 2 sampai dengan 3. Kemudian dari nilai standar deviasi variasi data terlihat terlalu besar.
Dapat simpulkan mengapa analisis statistika parametrik memerlukan data yang normal. Hal ini disebabkan apabila data tidak normal, maka hasil pengujian tidak dapat dipertanggung jawabkan atau dalam statistika disebut dengan bias dikarenakan tidak mencerminkan keadaan yang sebenarnya. Ketidak normalan data ini mungkin saja peneliti tidak sengaja memilih data yang sebenarnya diluar populasi penelitian. Nilai ini dalam statistika disebut outlier atau anomali yaitu data yang tidak pada tempatnya. Untuk menormalkan data biasanya nilai ini tidak dimasukkan dalam pengujian.
Analisis Statistika Non Parametrik
Berangkat dari sinilah timbul metode baru yang disebut dengan non parametrik, yang tidak mengindahkan kenormalan data. Hampir semua skala pengukuran dapat digunakan dengan menggunakan metode ini disebabkan dalam pengolahan non parametrik tidak mengenal rata-rata dan standar deviasi. Ambil ilustrasi dua kumpulan data di atas. Dalam ilustrasi pertama didapatkan rata-rata 3. Sebenarnya nilai rata-rata ini mewakili nilai tengah data. Dalam non parametrik nilai tengah data ini dapat dihitung dengan cara mencari nilai mediannya. Nilai median dapat dicari dengan mengurutkan data terlebih dahulu dari yang terkecil ke yang terbesar kemudian (1) apabila jumlah data genap, maka nilai tengah bisa didapatkan dengan cara nilai ke-(jumlah data dibagi 2) ditambahkan dengan nilai ke-(jumlah data dibagi 2 kemudian ditambah 1) dibagi dengan 2, (2) apabila jumlah data ganjil, maka nilai tengah bisa didapatkan dari nilai ke-(jumlah data dibagi 2 kemudian dibulatkan keatas). Kembali ke contoh kita lihat bahwa jumlah data ganjil (ada 7 data) maka point 2 yang digunakan. Berdasarkan poin 2 tujuh dibagi 2 (3.5) kemudian dibulatkan ke atas didapatkan 4. Nilai urutan ke 4 ini lah yang merupakan nilai tengah data. Bila kita urutkan data tersebut 2, 2, 2, 3, 3, 4, 5, maka nilai urutan ke-4 adalah 3. Nilai ini sama dengan nilai rata-rata yang telah dihitung.

Kemudian untuk ilustrasi ke-2. Bila kita cari nilai mediannya (nilai tengah) dengan cara yang telah dijabarkan akan didapatkan nilai 3. Terlihat bahwa dengan menggunakan nilai tengah (median) nilai ini lebih mewakili data dibandingkan dengan menggunakan rata-rata biasa.
Jadi kapan kita gunakan parametrik? Parametrik digunakan bila asumsi normalitas terpenuhi (bagaimana cara pengujiannya, nanti dibahas dalam bahasan tersendiri), bila tidak terpenuhi ya gunakan non parametrik. Bagaimana data yang tidak normal dibuat normal? Caranya gampang yaitu dengan cara membuang terlebih dahulu data yang membuat tidak normal, uji kembali, bila normal sudah terpenuhi, gunakan data tersebut.

Kadang ada yang bertanya, jadi powerfull mana parametrik atau non parametrik. Jawabnya jelas, parametrik akan lebih powerfull apabila asumsi normalitas tercapai, sedangkan apabila asumsi normalitasi tidak terpenuhi maka non parametrik akan lebih powerfull dibandingkan dengan parametrik. Tidak salah bila kumpulan data normal dianalisis dengan menggunakan non parametrik, namun sangat lebih baik bila asumsi-asumsi parametrik telah dipenuhi, analisis parametrik yang digunakan.
 
Sumber: Pengalaman Pribadi