Rabu, 30 Maret 2011

Analisis Statistika Berdasarkan Kenormalan Data

Berdasarkan kenormalan data, analisis statistika terbagi menjadi dua yakni Analisis Parametrik dan Analisis Non Parametrik.

Analisis Parametrik
Parametrik ... hmm jika pembaca membaca dari awal, dalam pembahasan Dasar-Dasar dalam Statistik, kata ini mengandung arti nilai-nilai yang didapatkan dari populasi, dugaan anda sudah benar, karena nama analisis ini akan selalu didasarkan pada nilai-nilai parameter.

Dalam metode statistika parametrik ini, ada asumsi-asumsi utama yang harus dipenuhi yaitu kenormalan data dan minimal skala data pengukuran minimal interval. Mengapa minimal skala data pengukuran minimal harus interval? Hal ini disebabkan untuk skala interval dan rasio operasi matematika bisa diberlakukan (penjumlahan, pengurangan, dsb), sedangkan kita tahu untuk nominal dan ordinal operasi aritmatika tidak bisa dilakukan. Inilah kadang beberapa peneliti tidak memperhatikan, banyak sekali kasus seperti kuesioner yang umumnya skala pengukuran nominal ordinal (sangat tidak setuju, tidak setuju, setuju, sangat setuju) kadang dipaksakan untuk menggunakan regresi-korelasi (untuk melihat hubungan) padahal regresi korelasi ini termasuk parametrik.
Mengapa dalam analisis parametrik data harus normal?
Suatu data dapat dikatakan normal apabila nilai rata-rata benar-benar mencerminkan keadaan suatu populasi atau sampel, artinya data akan mengumpul pada satu nilai sehingga bila kita lihat data akan terlihat sama satu sama lain (jika ada perbedaan, perbedaan tersebut tidak terlalu jauh). Untuk menjelaskan mengenai data normal ini bisa diilustrasikan sebagai berikut:
Sebagai ilustrasi misalkan terdapat kelompok data yang terdiri dari 2, 3, 4, 2, 2, 5, dan 3. Secara kasat mata, kumpulan data itu normal (jika ingin memastikan bisa dilanjutkan dengan uji normalitas), mengapa normal? Coba kita lihat data hanya berkisar antara 2 s.d 5. Jarak tidak terlalu jauh satu sama lain. Dari hasil perhitungan kita dapatkan nilai rata-rata 3 dan standar deviasi 1.15. Nilai rata-rata ini menunjukkan nilai tengah dari kumpulan data. Artinya data mengumpul pada area 3, sedangkan nilai standar deviasi 1.15 terlihat kecil menandakan keseragaman data.
Kemudian bandingkan dengan kumpulan data sebagai berikut: 2, 3, 4, 2, 2, 5, dan 15. Normalkah data itu? Tentu tidak, hal ini disebabkan nilai 15 akan merusak. Dari kumpulan data ini didapatkan rata-rata 4.71 dan standar deviasi 4.68. Nilai rata-rata ini tidak mencerminkan nilai tengah dari kumpulan data ini. Seharusnya nilai tengah antara 2 sampai dengan 3. Kemudian dari nilai standar deviasi variasi data terlihat terlalu besar.
Dapat simpulkan mengapa analisis statistika parametrik memerlukan data yang normal. Hal ini disebabkan apabila data tidak normal, maka hasil pengujian tidak dapat dipertanggung jawabkan atau dalam statistika disebut dengan bias dikarenakan tidak mencerminkan keadaan yang sebenarnya. Ketidak normalan data ini mungkin saja peneliti tidak sengaja memilih data yang sebenarnya diluar populasi penelitian. Nilai ini dalam statistika disebut outlier atau anomali yaitu data yang tidak pada tempatnya. Untuk menormalkan data biasanya nilai ini tidak dimasukkan dalam pengujian.
Analisis Statistika Non Parametrik
Berangkat dari sinilah timbul metode baru yang disebut dengan non parametrik, yang tidak mengindahkan kenormalan data. Hampir semua skala pengukuran dapat digunakan dengan menggunakan metode ini disebabkan dalam pengolahan non parametrik tidak mengenal rata-rata dan standar deviasi. Ambil ilustrasi dua kumpulan data di atas. Dalam ilustrasi pertama didapatkan rata-rata 3. Sebenarnya nilai rata-rata ini mewakili nilai tengah data. Dalam non parametrik nilai tengah data ini dapat dihitung dengan cara mencari nilai mediannya. Nilai median dapat dicari dengan mengurutkan data terlebih dahulu dari yang terkecil ke yang terbesar kemudian (1) apabila jumlah data genap, maka nilai tengah bisa didapatkan dengan cara nilai ke-(jumlah data dibagi 2) ditambahkan dengan nilai ke-(jumlah data dibagi 2 kemudian ditambah 1) dibagi dengan 2, (2) apabila jumlah data ganjil, maka nilai tengah bisa didapatkan dari nilai ke-(jumlah data dibagi 2 kemudian dibulatkan keatas). Kembali ke contoh kita lihat bahwa jumlah data ganjil (ada 7 data) maka point 2 yang digunakan. Berdasarkan poin 2 tujuh dibagi 2 (3.5) kemudian dibulatkan ke atas didapatkan 4. Nilai urutan ke 4 ini lah yang merupakan nilai tengah data. Bila kita urutkan data tersebut 2, 2, 2, 3, 3, 4, 5, maka nilai urutan ke-4 adalah 3. Nilai ini sama dengan nilai rata-rata yang telah dihitung.

Kemudian untuk ilustrasi ke-2. Bila kita cari nilai mediannya (nilai tengah) dengan cara yang telah dijabarkan akan didapatkan nilai 3. Terlihat bahwa dengan menggunakan nilai tengah (median) nilai ini lebih mewakili data dibandingkan dengan menggunakan rata-rata biasa.
Jadi kapan kita gunakan parametrik? Parametrik digunakan bila asumsi normalitas terpenuhi (bagaimana cara pengujiannya, nanti dibahas dalam bahasan tersendiri), bila tidak terpenuhi ya gunakan non parametrik. Bagaimana data yang tidak normal dibuat normal? Caranya gampang yaitu dengan cara membuang terlebih dahulu data yang membuat tidak normal, uji kembali, bila normal sudah terpenuhi, gunakan data tersebut.

Kadang ada yang bertanya, jadi powerfull mana parametrik atau non parametrik. Jawabnya jelas, parametrik akan lebih powerfull apabila asumsi normalitas tercapai, sedangkan apabila asumsi normalitasi tidak terpenuhi maka non parametrik akan lebih powerfull dibandingkan dengan parametrik. Tidak salah bila kumpulan data normal dianalisis dengan menggunakan non parametrik, namun sangat lebih baik bila asumsi-asumsi parametrik telah dipenuhi, analisis parametrik yang digunakan.
 
Sumber: Pengalaman Pribadi

Analisis Statistika Berdasarkan Tujuan

Berdasarkan tujuan analisis statistika dibedakan menjadi dua yakni pertama menggambarkan atau mengidentifikasi data tanpa mengambil kesimpulan dari kumpulan data tersebut atau dikenal dengan Statistika Deskriptif, dan yang kedua analisis yang memiliki tujuan untuk mengumpulkan, mengidentifikasi, menganalisis data dimana kemudian diambil kesimpulan dari kumpulan data tersebut dikenal dengan sebutan Statistika induktif/inferensi.

Statistika deskriptif merupakan statistika yang paling mudah karena peneliti hanya menggambarkan misal berapa rata-ratanya, berapa standar deviasinya, berapa persen responden laki-laki/wanita dst. Biasanya statistika deskriptif ini digambarkan dengan grafik (diagram batang, pie chart, dll).

Sedangkan untuk statistika inferensi karena tujuannya untuk mengambil kesimpulan dari kumpulan data, maka dalam analisisnya akan melibatkan pengujian. Misal apakah rata-rata kelompok A sama dengan rata-rata kelompok B dll.

Klasifikasi Data

Langkah selanjutnya setelah menentukan populasi yang dijadikan penelitian adalah menentukan skala pengukuran data. Terdapat empat level atau pengukuran atau empat cara penetapan ukuran suatu individu, objek, ataupun variabel yang dapat diukur meliputi skala nominal, ordinal, interval, dan rasio. Setiap level memiliki aturan dan keterbatasan masing-masing (Cohen & Holliday, 1983). Keempat skala pengukuran tersebut apabila dijabarkan adalah sebagai berikut:

  1. Skala Nominal, merupakan skala yang paling sederhana yang sekedar hanya mengidentifikasi maupun mengkategorikan jenis-jenis individu atau objek yang diteliti tanpa disertai adanya tingkatan antara satu kategori dengan kategori lainnya. Sebagai contoh no 1 untuk jenis kelamin laki-laki, dan no 2 untuk jenis kelamin perempuan. Arti dari tidak disertai adanya tingkatan adalah laki-laki tidak lebih baik dibandingkan dengan perempuan, dan sebaliknya perempuan tidak lebih baik dibandingkan dengan laki-laki atau dengan kata lain sama. Oleh karena hal tersebut bila terdapat penomoran (dalam hal ini 1 dan 2), nomor-nomor tersebut tidak bisa diberlakukan operasi matematika (penjumlahan, pengurangan, pengalian, dan pembagian).
  2. Skala Ordinal, satu tingkat lebih tinggi dibandingkan dengan skala nominal. Fungsinya sama dengan skala nominal yakni skala yang mengidentifikasi maupun mengkategorikan jenis-jenis individu atau objek yang diteliti, tetapi disertai adanya tingkatan antara satu kategori dengan kategori lainnya. Sifat penomoran ini pun sama dengan skala nominal yakni tidak bisa diberlakukan operasi matematika. Sebagai contoh persepsi yang diwakili 4 tingkatan yakni 1 untuk Sangat Tidak Setuju, 2 untuk Tidak Setuju, 3 untuk Setuju, 4 untuk Sangat Setuju. Dalam contoh ini terlihat kategori sangat setuju tingkatannya paling tinggi dibandingkan kategori lainnya.
  3. Skala Interval, sebagai tambahan fungsi dari skala ordinal, skala interval memperbolehkan untuk menetapkan secara tepat ataupun pasti berapa selisih nilai numerik atau kuantitatif dari beda antar dua individu, sehingga nilai lebih tinggi menyatakan kelas lebih atas sekaligus selisih nilai yang pasti; artinya selisih nilai yang sama dari dua selisih antara dua individu menyatakan makna dan besaran yang sama. Contoh penerapan ini adalah skala temperatur Celcius. Pada skala ini operasi matematika sudah bisa digunakan.
  4. Skala Rasio, skala ini mempunyai semua karakteristik yang dipunyai oleh skala nominal, ordinal dan interval dengan kelebihan skala ini mempunyai nilai 0 (nol) empiris absolut. Nilai absoult nol tersebut terjadi pada saat ketidakhadirannya suatu karakteristik yang sedang diukur.
Berikut adalah tabel ringkasan dari uraian pengertian ke-4 skala di atas:

Deskripsi Nominal Ordinal Interval Rasio
Berfungsi sebagai lambang Ya Ya Ya Ya
Memiliki tingkatan Tidak Ya Ya Ya
Memiliki titik nol absolut Tidak Tidak Tidak Ya
Operasi Matematika berlaku Tidak Tidak Ya Ya


Daftar Pustaka:

Cohen, L & Holliday, M, 1983, Statistics for social scientists, An Introductory Text with Computer Programs in Basic, Harper & Row, London, 382

Hirnawan, F., 2007, Riset, Bergulirlah Proses Ilmiah, Unpad Press, Bandung

Dasar-dasar dalam Statistika

Setelah kita mengetahui apa dan kegunaan dari ilmu statistika, selanjutnya peneliti diharuskan memahami komponen dasar dalam statistika yakni populasi dan sampel. Karena untuk analisis selanjutnya, kedua komponen inilah yang akan terus digunakan.

Populasi adalah totalitas semua nilai yang mungkin baik hasil menghitung maupun hasil pengukuran kuantitatif atau kualitatif dan pada karasteristik tertentu mengenai sekumpulan obyek yang lengkap. Berdasarkan banyaknya sumber data populasi terbagi menjadi dua yakni:
  1. Populasi terbatas yaitu populasi yang mempunyai sumber data terbatas dan dapat dihitung jumlahnya. Contoh Populasi Mahasiswa Statistika UNPAD angkatan 2001.
  2. Populasi tidak terbatas yaitu populasi yang mempunyai sumber data yang jumlahnya tidak dapat dihitung. Contoh Jumlah kerikil di Gunung Merapi.
Meskipun terdapat populasi yang terbatas, terkadang peneliti tidak bisa melakukan penelitian pada satu populasi keseluruhan. Hal ini disebabkan oleh pertimbangan biaya, waktu, dan efisiensi. Untuk mengatasi permasalahan tersebut diambil dari populasi beberapa objek yang dianggap mewakili populasi. Objek yang terambil inilah yang dikenal dengan istilah Sampel, sedangkan proses pengambilan objek tersebut dikenal dengan nama Sampling.

Dari populasi ini kita dapatkan nilai-nilai seperti rata-rata dan standar deviasi. Apabila kedua nilai ini diambil langsung dari populasi maka disebut dengan parameter, sedangkan bila kedua nilai ini diambil dari sampel maka disebut dengan statistik. Untuk membedakan kedua istilah ini (parameter dan statistik) para ahli membedakan simbol yang digunakan. Untuk rata-rata populasi digunakan ยต (baca: miu), sedangkan dalam sampel digunakan (baca: x-bar)


Daftar Pustaka:

Sudjana. 1996. Metode Statistika Edisi Ke-6. Penerbit Tarsito Bandung. Bandung

Statistika ... Apa sih Statistika itu?

Ketika mendengar kata Statistika, pembaca pasti akan berpikir Matematika. Hal ini wajar mengingat Statistika merupakan pengembangan dari Matematika. Hal yang membedakan Matematika dan Statistika adalah sifatnya, dimana sifat Matematika bersifat deterministik yaitu suatu sistem yang operasinya dapat diprediksi secara tepat, sedangkan Statistika bersifat probabilistik yaitu sistem yang tak dapat diramal dengan pasti karena mengandung unsur probabilitas. Oleh sebab itu dinegara kita, Program studi statistika sebagian besar masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam departemen tersendiri maupun tergabung dengan matematika.

Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah Statistika sendiri pertama kali diperkenalkan oleh Gottfried Achenwall pada tahun 1749 sebagai sebutan untuk kegiatan analisis data kenegaraan, dengan mengartikannya sebagai "ilmu tentang negara (state)". Dalam perkembangannya istilah Statistika oleh Sir John Sinclair mengalami pergeseran arti menjadi ilmu pengumpulan data dan klasifikasi data.

Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang dalam matematika, terutama peluang. Statistika inferensi, dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher (peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.


Daftar Pustaka:

Anonymous, 2011, Statistika, Ensiklopedia bebas Wikipedia, diunduh pada April, 6, 2011,    dari http://id.wikipedia.org/wiki/Statistika

Sudjana. 1996. Metode Statistika Edisi Ke-6. Penerbit Tarsito Bandung. Bandung

Tentang Penyusun

Kenapa Penyusun??? Karena saya merasa tidak menulis apa yang saya akan ungkapkan dalam blog ini. Saya hanya menyusun dari beberapa acuan buku, yang kemudian coba untuk menerangkan sesederhana mungkin mengenai Ilmu Statistika.

Saya bukanlah ahli, tapi bukan berarti tidak tahu juga mengenai Ilmu Statistika. Mungkin saya tak tahu darimana asal rumus rata-rata, standar deviasi, dan lain-lain (dulu pernah diajarkan oleh dosen saya dalam mata kuliah Teori Statistika dari mana saja rumus-rumus tersebut berasal, hanya saja mungkin saya yang kurang dalam menangkap apa yang dosen ajarkan), tetapi dalam penggunaan sudah bisa dipastikan bisa.

Setiap orang sebenarnya sudah mengenal statistik dari semenjak SMP, mungkin kita kenal istilah rata-rata. Dulupun saya berpikir itu adalah bagian dari Matematika, namun ternyata Statistika.

Statistik selama ini mungkin menjadi suatu hal yang ditakuti oleh sebagian peneliti, tapi dewasa ini, mau tak mau peneliti (baik Skripsi, Tesis, Disertasi, atau penelitian lain) selalu menyertakan Analisis Statistika dalam bahasan hasil penelitian mereka. Tentu fungsi analisis statistik ini sebagai pendukung atas apa yang peneliti kemukakan dalam penelitian. Sebagai ilustrasi, ketika kita berbicara kepada teman pernah berkunjung ke suatu tempat, akan lebih dapat dipercaya apabila ada bukti (dalam hal ini bisa bentuk foto, video atau lainnya) dibandingkan kita hanya berbicara saja.

Jadi ... Dalam blog ini penyusun harap bisa menjelaskan sesederhana mungkin, dengan bahasa, dan ilustrasi yang dapat dimengerti oleh orang yang bukan berbasis ilmu Statistika.

Akhir kata semoga bermanfaat.