RELIABILITAS DAN VALIDITAS INSTRUMEN PENELITIAN

Bagi seorang peneliti atau mahasiswa semester akhir yang saat ini sedang dalam proses menuntaskan skripsi atau tugas akhir, istilah reliabilitas dan validitas sudah tidak asing lagi. Sebagian besar dari kita menganggap kedua istilah ini adalah hampir sama.
Meskipun istilah ‘reliabilitas’ dan ‘validitas’ sekilas hampir identik, namun keduanya memiliki arti yang sangat berbeda dalam kaitannya dengan evaluasi pengukuran suatu konsep atau variabel. Reliabilitas merujuk pada konsistensi ukuran, sedangkan validitas menekankan apakah pengukuran benar-benar mengukur suatu konsep.
Bila kita analogikan dengan pengukuran benda konkret, misalnya pengukuran berat dengan alat timbangan, maka reliabilitas berarti ketika timbangan tersebut mengukur berat badan, ketika saat ini saya ukur dengan hasil 70kg, kemudian setelah saya ulang kembali tetap 70kg, meskipun 5 menit kemudian saya coba sekali lagi juga tetap tidak berubah. Meskipun kemudian saya coba lebih dari sepuluh kali dan hasilnya tetap sama maka timbangan tersebut reliabel.
Validitas terkait pada bahwa timbangan tersebut benar-benar mengukur berat badan saya. Yang diukur oleh timbangan ini bukan volume atau bahkan tinggi badan saya. Validitas juga berarti bahwa timbangan tersebut mampu mengukur berat badan saya dengan baik, banyangkan bila saya mengukur menggunakan timbangan barang dengan kemampuan menimbang maksimal 5 ton, maka ketika saya naik ke timbangan maka hasilnya akan susah ditentukan.

RELIABILITAS

Reliabilitas atau keandalan pada dasarnya berkaitan dengan masalah konsistensi tindakan. Reliabilitas menekankan pada konsistensi pengukuran suatu konsep. Ada tiga makna istilah yang berbeda dari reliabilitas ini. Berikut diuraikan tiga konsep utama dari reliabilitas, yaitu: stabilitas, reliabilitas internal, dan konsistensi internal observer/pengamat.

Stabilitas

Stabilitas menunjukkan bagaimana sebuah pengukuran selalu stabil setiap saat, sehingga peneliti yakin bahwa hasil pengukuran terhadap responden tidak berfluktuasi. Hal ini berarti bahwa ketika kita melakukan pengukuran ulang pada sebuah grup observasi hasilnya cenderung sama atau nilai variasinya kecil.
Cara terbaik untuk menguji stabilitas suatu alat ukur adalah dengan menggunakan metode uji ulang. Secara teknis dilakukan dengan melakukan tes atau tindakan pada satu kesempatan dan kemudian melakukan tes lagi dengan sampel yang sama pada kesempatan lain.
Bila ada korelasi yang tinggi antara hasil tes (jawaban responden) antara Observasi 1 dan Observasi 2 maka alat ukur bisa dianggap stabil. Alasannya adalah karena korelasi merupakan ukuran kekuatan hubungan antara dua variabel sehingga hasil tes atau jawaban responden pada kedua observasi harus identik. Jika korelasinya rendah, ukurannya akan tampak tidak stabil, menyiratkan bahwa jawaban responden tidak dapat diandalkan.
Namun, ada sejumlah masalah dengan pendekatan stabilitas untuk mengevaluasi reliabilitas. Jawaban responden tes pertama dapat mempengaruhi bagaimana mereka menjawab di tes kedua. Hal ini dapat menghasilkan konsistensi yang lebih besar daripada pada kenyataannya. Peristiwa yang terjadi di antara tes juga dapat mengintervensi jawaban sehingga mempengaruhi tingkat konsistensi. Misalnya, jika rentang waktu tes yang panjang, perubahan dalam ekonomi atau dalam keadaan keuangan pribadi responden dapat memengaruhi pandangan mereka tentang barang yang ingin dibeli.
Tidak ada cara mudah untuk mengurai dampak dari kurangnya stabilitas dalam ukuran dari perubahan ‘nyata’ yang terjadi. Tidak ada solusi yang jelas untuk masalah ini, selain dengan memperkenalkan desain penelitian yang kompleks dan dengan demikian mengubah penyelidikan reliabilitas menjadi pekerjaan besar disamping penelitian itu sendiri. Mungkin karena alasan ini, sebagian besar penelitian tampaknya tidak melakukan uji stabilitas, selain penelitian longitudinal yang memang dilakukan untuk mengidentifikasi perubahan sosial dan korelasinya.

Reliabilitas Internal

Reliabilitas internal ini pada intinya adalah apakah indikator-indikator yang digunakan dapat digunakan untuk membangun skala, konstruk, atau variabel secara konsisten. Dengan kata lain, apakah skor yang diberikan responden pada sebuah indikator terkait dengan indikator lainnya dalam satu konstruk.
Dengan demikian reliabilitas internal ini berlaku untuk pengukuran menggunakan multi-indikator atau multi-item. Ketika kita memiliki ukuran multi-item di mana jawaban masing-masing responden untuk setiap pertanyaan digunakan untuk membentuk skor keseluruhan, akan ada kemungkinan munculnya item atau indikator yang tidak berhubungan dengan hal yang sama. Dengan kata lain, item tersebut kurang koheren.
Kita harus yakin bahwa semua indikator dalam satu konstruk atau variabel terkait satu sama lain. Jika tidak, item tersebut mungkin sebenarnya tidak ada kaitannya dengan indikator atau justru mengindikasikan sesuatu yang lain.
Salah satu cara menguji reliabilitas internal adalah menggunakan metode split-half. Misalnya sebuah variabel diukur menggunakan sepuluh indikator, maka dibagi menjadi dua bagian yang sama yaitu lima indikator di masing-masing kelompok. Indikator bisa dialokasikan secara acak atau ganjil genap. Tingkat korelasi antara skor pada dua bagian kemudian dihitung. Dengan kata lain, tujuannya adalah untuk menentukan apakah responden memberikan skor tinggi pada satu bagian kelompok juga memberikan skor tinggi pada kelompok indikator yang lain.
Perhitungan korelasi akan menghasilkan angka, yang dikenal sebagai koefisien korelasi, yang bervariasi antara 0 (tidak ada korelasi dan dengan demikian tidak ada konsistensi internal) hingga 1 (korelasi sempurna atau ada konsistensi internal lengkap). Biasanya angka korelasi diharapkan adalah minimal 0,80 sehingga dapat menyiratkan tingkat reliabilitas internal yang dapat diterima.
Saat ini, sebagian besar peneliti menggunakan uji reliabilitas internal yang dikenal dengan nama Alpha Cronbach. Penggunaan uji ini sudah sangat umum dan mudah berkat adanya perangkat lunak komputer untuk analisis data kuantitatif.
Pada dasarnya uji Alpha Cronbach adalah penghitungan rata-rata nilai korelasi dari setiap kemungkinan uji split-half pada indikator-indikator suatu konstruk. Nilai Alpha Cronbach ini juga berkisar antara 0 sampai 1. Ada semacam kesepakatan umum (rule of thumb) bahwa nilai Alpha Cronbach yang dapat diterima adalah minimal 0,80 namun beberapa penulis mengatakan bahwa angka tersebut bisa sedikit ditoleransi asal tidak kurang dari 0,7.

Konsistensi Antar Pengamat

Ketika banyak penilaian subjektif harus dilakukan, seperti dalam kegiatan mengkategorikan rekaman pengamatan atau terjemahan data di mana lebih dari satu ‘pengamat ‘ yang terlibat dalam kegiatan tersebut, ada kemungkinan adanya inkonsistensi dalam keputusan mereka. Hal ini dapat timbul dalam sejumlah konteks, misalnya: dalam penelitian konten analisis di mana keputusan harus dibuat dengan mengkategorikan item; ketika jawaban dari pertanyaan terbuka harus dikategorikan; atau dalam pengamatan terstruktur ketika pengamat harus memutuskan bagaimana mengklasifikasikan perilaku subyek.

VALIDITAS

Loading...

Masalah validitas pengukuran juga berkaitan dengan apakah ukuran sebuah konsep benar-benar mengukur konsep tersebut. Ketika kita berdebat tentang apakah skor IQ seseorang benar-benar mengukur atau mencerminkan tingkat kecerdasan seseorang, dengan demikian kita telah mengajukan pertanyaan tentang validitas pengukuran tes IQ tersebut terkait dengan konsep kecerdasan.
Ketika kita sering mendengar orang mengatakan bahwa mereka tidak percaya bahwa Indeks Harga Eceran atau indeks harga konsumen (IHK) benar-benar merefleksikan inflasi dan kenaikan biaya hidup. Sekali lagi, sebuah pertanyaan semacam itu sangat terkait dengan validitas pengukuran. Ketika mahasiswa atau dosen berdiskusi apakah ujian formal dapat dijadikan ukuran kemampuan akademik yang akurat, mereka juga sedang mendiskusikan validitas pengukuran.
Beberapa penulis membedakan beberapa cara untuk menilai validitas pengukuran. Jenis-jenis ini mencerminkan berbagai cara untuk mengukur validitas ukuran suatu konsep. Berbagai cara penilaian validitas pengukuran ini diantaranya adalah validitas wajah, validitas serentak, validitas prediktif, validitas konstruk, dan validitas konvergen,

Validitas Wajah

Ketika seorang peneliti sedang mengembangkan ukuran baru, maka minimal ia harus menetapkan bahwa ia telah melakukan proses validitas wajah. Yaitu, bahwa ukuran tersebut tampak mencerminkan isi konsep yang dimaksud. Validitas wajah dapat dilakukan dengan cara bertanya kepada orang lain apakah ukuran atau indikator tersebut tampak mengarah pada konsep yang menjadi fokus perhatian. Dengan kata lain, orang yang ditanya tersebut mungkin memiliki pengalaman di lapangan atau bidang keahlian yang sesuai, kemudian ia diminta sebagai penilai atau bertindak semacam hakim untuk menentukan apakah ukuran atau indikator tersebut tampak merefleksikan konsep yang diukur. Oleh karena itu, validitas wajah merupakan proses yang intinya bersifat intuitif, namun dilakukan oleh orang yang mempunyai kompetensi.

Validitas Serentak

Peneliti mungkin juga perlu mengukur validitas serentak/konkuren dari sebuah ukuran konsep. Di sini peneliti menggunakan kriteria di sebuah kasus (misalnya, orang) diketahui berbeda dan relevan dengan suatu konsep. Misalnya ukuran baru dari kepuasan kerja adalah absensi. Kriteria absensi mungkin saja berlaku karena beberapa orang diketahui lebih sering absen dari pekerjaan (selain karena sakit) daripada yang lain.
Untuk menetapkan validitas serentak dari ukuran kepuasan kerja, kita mungkin melihat seberapa jauh orang yang puas dengan pekerjaannya mempunyai kemungkinan lebih kecil absen daripada mereka yang tidak puas. Jika ditemukan rendahnya korespondensi, di mana tidak ada perbedaan tingkat kepuasan kerja di antara yang sering absen, maka patut diragukan bahwa ukuran tersebut benar-benar mampu mengukur kepuasan kerja.

Validitas Prediktif

Loading...

Tes lain yang bisa dilakukan untuk menguji validitas ukuran adalah validitas prediktif, di mana peneliti menggunakan ukuran kriteria masa depan, daripada ukuran konvensional saat ini seperti dalam kasus validitas serentak. Dengan validitas prediktif, peneliti mengambil tingkat absensi di masa depan sebagai kriteria yang menjadi tolok ukur dari ukuran baru. Jadi kepuasan kerja diukur dari indikator keinginan untuk absen di masa yang akan datang, misalnya bulan depan atau tahun depan. Perbedaan dari validitas serentak hanya pada penggunaan kriteria masa depan daripada ukuran kriteria simultan.

Validitas Konstruk

Beberapa penulis menganjurkan bahwa peneliti juga harus memperkirakan validitas konstruk suatu ukuran. Di sini, peneliti didorong untuk menyimpulkan hipotesis dari teori yang relevan dengan konsep tersebut. Sebagai contoh, mengambil ide tentang dampak teknologi pada pengalaman kerja, peneliti mungkin mengantisipasi bahwa orang yang puas dengan pekerjaannya cenderung bekerja pada pekerjaan rutin. Dengan demikian, kita dapat menyelidiki deduksi teoretis ini dengan memeriksa hubungan antara kepuasan kerja dan rutinitas kerja. Namun, ada beberapa kehati-hatian yang diperlukan dalam menafsirkan tidak adanya hubungan antara kepuasan kerja dan rutinitas kerja. Pertama, baik teori atau deduksi yang dibuat darinya tidak boleh salah arah. Kedua, ukuran rutinitas pekerjaan bisa menjadi ukuran yang tidak valid dari konsep itu.
Pengujian validitas konstruk ini biasanya dilakukan dengan melakukan uji korelasi antara setiap skor indikator dengan skor konstruknya. Bila ada korelasi yang signifikan maka indikator tersebut bisa digunakan, dan sebaliknya. Korelasi yang digunakan bisa menggunakan korelasi parsial maupun korelasi bivariat. Selain korelasi, peneliti juga bisa menggunakan Confirmatory Factor Analysis (CFA).

Validitas Konvergen

Dalam pandangan beberapa ahli metodologi penelitian, validitas suatu ukuran harus diukur dengan membandingkannya dengan ukuran dari konsep yang sama dengan metode lain. Misalnya, jika kita mengembangkan ukuran kuesioner tentang berapa banyak waktu yang dihabiskan manajer untuk berbagai kegiatan (seperti menghadiri pertemuan, mengadakan tur organisasi mereka, diskusi informal, dan sebagainya), selain menggunakan kuesioner kita dapat memeriksa validitasnya dengan melacak sejumlah manajer dan menggunakan jadwal pengamatan terstruktur untuk mencatat berapa banyak waktu yang dihabiskan dalam berbagai kegiatan dan frekuensinya.

One comment

Tinggalkan Balasan