Validitas.docx

  • Uploaded by: Mutia tya
  • 0
  • 0
  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Validitas.docx as PDF for free.

More details

  • Words: 2,645
  • Pages: 7
Validitas Validitas berasal dari kata validity yang mempunyai arti kebenaran atau keabsahan. Validitas berarti sejauh mana ketepatan dan kebsahan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan memiliki validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Artinya hasil ukur dari pengukuran tersebut merupakan besaran yang mencerminkan secara tepat fakta atau keadaan sesungguhnya dari apa yang diukur. Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu tes. Validitas suatu tes mempermasalahkan apakah tes tersebut benar-benar mengukur apa yang hendak diukur. Maksudnya adalah seberapa jauh suatu tes mampu mengungkapkan dengan tepat ciri atau keadaan yang sesungguhnya dari obyek ukur, akan tergantung dari tingkat validitas tes yang bersangkutan. Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai. Suatu tes yang valid untuk tujuan tertentu atau pengambilan keputusan tertentu, mungkin tidak valid untuk tujuan atau pengambilan keputusan lain. Jadi validitas suatu tes, harus selalu dikaitkan dengan tujuan atau pengambilan keputusan tertentu. Tes masuk di SMA misalnya harus selalu dikaitkan dengan seberapa jauh tes masuk tersebut dapat mencerminkan prestasi atau hasil belajar para calon peserta didik baru setelah belajar nanti. Validitas merupakan isu sentral pada proses pengembangan instumen, terutama jika digunakan untuk mengukur konsep/konstrak yang masih ambigu, abstrak dan tidak bisa diamati secara langsung. Sebagai contoh, motivasi dapat dinyatakan sebagai proses yang menggerakkan diri seseorang untuk melakukan sesuatu. Konsep ini masih abstrak sehingga diperlukan operasionalisasi lebih lanjut agar dapat diamati dan diukur. Validitas menggambarkan sejauh alat ukur (tes) benar-benar mengukur apa yang hendak diukur. Menetapkan validitas sebuah test atau instrument test sangat sulit, terutama karena variabelvariabel psikologi biasanya adalah konsep-konsep abstrak, seperti inteligensi, kecemasan, dan kepribadian.; Validitas teoritik Validitas alat evaluasi yang dilakukan berdasarkan pertimbangan (judgement) teoritik atau logika yang dilakukan oleh para ahli atau orang yang dianggap ahli. Untuk mempertimbangkan suatu alat evaluasi berdasarkan validitas teoritik dikaji atau dipertimbangkan oleh evaluator. Agar hasil pertimbangan tersebut memadai sebaiknya dilakukan para ahli atau orang yang dianggap dalam bidangnya. Hal yang dipertimbangkan adalah dalam rangka menjawab pertanyaan-pertanyaan seperti : apakah konsep-konsep atau ateri yang terkandung dalam soal itu sudah benar?, apakah sesuai dengan TIK, GBPP, atau buku sumber ?, apakah penggunaan bahasa dan susunan kalimat dalam soal itu dapat dipahami oleh peserta uji (testi), sehingga tidak menimbulkan salah tafsir?, apakah aspek

psikologi yang terdapat dalam soal tersebut tidak mengganggu emosi si teruji jawaban menjadi basis?. Jika pertanyaan-pertanyaan diatas sudah terjawab dengan baik dan terpenuhi, maka validitas teoritik alat evalusi tersebut bisa dikatakan baik. Ada tiga macam validitas yang termasuk kedalam validitas teoritik yaitu : 1. Validitas Isi Dalam Standar untuk Tes Pendidikan dan Psikologi (American Educational Research Association, American Psychological Association & National Council of Measurement in Education, 1985:9)"bukti validitas terkait konten" didefinisikan sebagai "bukti yang menunjukkan sejauh mana isi tes sesuai dengan tujuan yang dimaksudkannya. Bukti tersebut digunakan untuk menetapkan bahwa pengujian tersebut mencakup contoh yang representatif atau kritis dari domain konten yang relevan dan isinya tidak termasuk konten di luar domain tersebut". Validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap kelayakan atau relevansi isi tes melalui analisis rasional oleh panel yang berkompeten atau melalui expert judgement (penilaian ahli). Validitas isi atau content validity memastikan bahwa pengukuran memasukkan sekumpulan item yang memadai dan mewakili yang mengungkap konsep. Semakin item skala mencerminkan kawasan atau keseluruh konsep yang diukur, semakin besar validitas isi. Atau dengan kata lain, validitas isi merupakan fungsi seberapa baik dimensi dan elemen sebuah konsep yang telah digambarkan (Sekaran, 2006). Keputusan berdasarkan validitas isi menentukan apakah siswa telah menguasai, terkelompok dalam, atau butir yang gagal mengukur tujuan pembelajaran khusus. Buitr soal memiliki validitas isi jika mengarahkan siswa untuk mendemonstrasikan keterampilan dan kompontensi yang dibutuhkan sesuai dengan tujuan pembelajaran. Tes memiliki validitas isi jika perilaku dan subyek matter sesuai dengan butir yang berhubungan dengan tujuan khusus. Masuknya butir soal yang tidak sesuai dengan tujuan atau gagal memasukan butir soal yang sesuai dengan tujuan akan menghasilkan isi yang tidak valid. Beberapa tes diarahkan mengukur tujuan secara langsung, walaupun keterampilan atau kemampuan yang diukur secara terwujud. Misalnya mengukur kemampuan mengeja dengan menyeleksi kata-kata yang salah eja dibandingkan dengan yang dieja dengan benar. Kemampuan untuk mengidentifikasi kata-kata yang salah eja berbeda dengan kemampuan mengeja kata secara lisan dengan benar. Contoh lain adalah tes prestasi membaca lambang-lambang matematika di California dimana siswa diminta untuk mendefinisikan kata “star” dan “choose” yang relevan dengan bahasa matematika seperti pembagi, mengurangi, dan hasil bagi. Kemampuan untuk mendefinisikan bahasa matematika harus disesuaikan dengan istilah yang lebih jelas untuk mengukur tujuan pembelajaran. Kriteria yang dapat diterima untuk validitas isi membutuhkan 2 kelompok independent atau individu dalam mengkonstruksi tes menggunakan spesifikasi yang sama. Setiap hal harus diberikan informasi seperti (1) deskripsi umum dari butir yang dikonstruksi; (2) rangkaian tujuan perilaku; (3) jumlah butir yang dikonstruksi untuk setiap tujuan pembelajaran; (4) format (multiple choice, melengkapi, esay dan lainlain); (5) sifat siswa yang mengikuti tes harus dipersiapkan (umur, kemampuan

membaca, latar belakang sosial ekonomi, dan data relevan lain); dan (6) tujuan terhadap pengadministrasian dan penskoran tes. Ketika 2 tes telah dikonstruksi, kedua bentuk diberikan kepada kelompok siswa yang sama; korelasi antara 2 pengukuran akan menunjukka seberapa baik butir soal mengukur kemampuan atau sifat yang sama. Namun demikian Lee Cronbach (1971) menyatakan bahwa kesulitan yang melekat pada validitas tes melalui prosedur ini telah mendorong kebanyakan individu untuk melakukan usaha dan hanya sedikit usaha tersebut yang tidak memberikan kepuasan. Biasanya pengajar akan mengevaluasi validitas isi dari tesnya sendiri dan hal ini dimulai pada tahap perencanaan. Karena pengajar terlibat langsung dengan tes yang dibuat maka ada manfaat dengan bertanya pada pengajar lain untuk membandingkan butir soal yang sesuai dengan tujuan untuk menghindari soal-soal yang bias. Dalam mempertahankan masuknya suatu butir dalam tes atau menjelaskan hilangnya butir yang tidak sesuai tujuan akan mendorong pengajar lebih mengkonstruksi bentuk tes yang lebih bermakna. Proses mengevaluasi validitas isi dari tes menghasilkan hubungan yang sangat erat antara mengajar dan menguji. Mengembangkan validitas dengan menentukan hubungan antara butir soal dan tujuan utamanya diterapkan dalam tes prestasi atau mengukur perolehan siswa dari subyek matter. Umumnya pengajar membuat tes tidak mengukur berdasarkan kriteria tetapi berdasarkan tujuan pengajar itu sendiri. Tes itu sendiri minimal harus mampu mengukur pembelajaran atau unit tujuan pembelajaran. Tetapi tidak semua tes dikonstruksi untuk mengukur prestasi, dan suatu kriteria akan lebih relevan dari pada tujuan yang diinginkan pengajar. Misalnya seseorang tidak dapat menentukan apakah tes mampu mengukur kejiwaan dengan menguji isi. Peristiwa empirik dibutuhkan untuk mendemonstrasikan tes secara nyata mengukur hal seperti itu. Contoh Validitas Isi : Koefisien Validitas Isi – Aiken’s V Aiken (1985) merumuskan formula Aiken’s V untuk menghitung content-validity coefficient yang didasarkan pada hasil penilaian dari panel ahli sebanyak n orang terhadap suatu item dari segi sejauh mana item tersebut mewakili konstrak yang diukur. Formula yang diajukan oleh Aiken adalah sebagai berikut (dalam Azwar, 2012) 𝑉 = ∑ 𝑠/[𝑛(𝐶 − 1)] 𝑆 = 𝑟 − 𝑙𝑜 𝐿𝑜 = 𝑎𝑛𝑔𝑘𝑎 𝑝𝑒𝑛𝑖𝑙𝑎𝑖𝑎𝑛 𝑡𝑒𝑟𝑒𝑛𝑑𝑎ℎ (𝑚𝑖𝑠𝑎𝑙𝑛𝑦𝑎 1) 𝐶 = 𝑎𝑛𝑔𝑘𝑎 𝑝𝑒𝑛𝑖𝑙𝑎𝑖𝑎𝑛 𝑡𝑒𝑟𝑡𝑖𝑛𝑔𝑔𝑖 (𝑀𝑖𝑠𝑎𝑙𝑛𝑦𝑎 4) 𝑅 = 𝑎𝑛𝑔𝑘𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑏𝑒𝑟𝑖𝑘𝑎𝑛 𝑜𝑙𝑒ℎ 𝑝𝑒𝑛𝑖𝑙𝑎𝑖 Tabel. 1. Contoh Validitas Isi Aiken’s V Item 1 Penilai Nilai ( R ) S = R – Lo 1 3 3–1=2 2 4 4–1=3 3 4 4–1=3 4 3 3–1=2 5 3 3–1=2

6 7

4 4 ∑s V

4–1=3 4–1=3 18 0.857

Nilai S untuk penilai 1 diperoleh dari skor penilai 3 dikurangi skor terendah (Lo), sehingga 3 –1= 2, dan seterusnya. Nilai Σs adalah penjumlahan dari skor S yaitu 2 + 1 + 3 + 2 + 2 + 3 + 3 = 18. Dengan demikian, nilai V dapat dihitung sebagai berikut : V = Σ s / [n(C-1)] V = 18 / [7(4-1)] V = 0.857 Nilai koefisien Aiken’s V berkisar antara 0 – 1. Koefisien sebesar 0.857 ini sudah dapat dianggap memiliki validitas isi yang memadai. Koefisien Validitas Isi – Lawshe’s CVR Lawshe’s CVR (content validity ratio) merupakah salah satu metode yang digunakan secara luas untuk mengukur validitas isi. Teknik ini dikembangkan oleh Lawshe (1975). Pendekatan ini pada dasarnya adalah sebuah metode untuk mengukur kesepakatan di antara penilai atau hakim tentang pentingnya item tertentu. Lawshe (1975) mengusulkan bahwa setiap penilai / subject matter experts (SME) yang terdiri dari panel ahli untuk menjawab pertanyaan untuk setiap item dengan tiga pilihan jawaban yaitu (1) esensial, (2) berguna tapi tidak esensial, (3) tidak diperlukan. Menurut Lawshe, jika lebih dari setengah panelis menunjukkan bahwa item penting/esensial, maka item tersebut memiliki setidaknya validitas isi yang cukup. Formula yang diajukan oleh Lawshe adalah : CVR = (ne – N/2) / (N/2), dimana CVR adalah content validity ratio, ne adalah jumlah anggota panelis yang menjawab “penting”, N adalah jumlah total panelis. Misalnya, Seorang peneliti ingin menguji validitas isi dari sebuah skala yang terdiri dari 1 item. Sebanyak 12 orang panel ahli dijadikan penilai dengan memilih 3 pilihan jawaban yaitu “penting”, “sesuai, tidak penting” dan “tidak berguna”. Dari 12 orang panel ahli, 10 orang menyatakan item tersebut “penting”, 1 orang menyatakan “sesuai, tidak penting”, dan 1 orang menyatakan “tidak berguna (Lihat tabel 2). Dari data ini kemudian dapat dihitung CVR sebagai berikut : CVR = ((10 – (12/2)) / (12/2) CVR = 0.667 Formula ini menghasilkan nilai-nilai yang berkisar dari +1 sampai -1, nilai positif menunjukkan bahwa setidaknya setengah panelis menilai item sebagai penting/esensial. Semakin lebih besar CVR dari 0, maka semakin “penting” dan semakin tinggi validitas isinya. Dari contoh di atas diperoleh nilai CVR sebesar 0.667 yang menunjukkan bahwa item yang digunakan sudah memenuhi validitas isi yang baik dan dianggap penting lebih dari separuh ahli yang digunakan sebagai penilai.

Tabel 2. Data Simulasi Validitas Isi Lawshe’s CVR Penilai (SME) 1 2 3 4 5 6 7 8 9 10 11 12

Penilaian Penting Penting Penting Tidak Berguna Penting Penting Sesuai, Tidak Penting Penting Penting Penting Penting Penting Jawaban Penting = 10

2. Face Validity Face validity suatu tes adalah tingkat di mana nampak relevan, penting dan menarik bagi peserta ujian. Guru ingin siswa menikmati dalam melakukan tes dan merasakan bahwa mereka tidak menyia-nyiakan waktu mereka. Yang penting adalah apakah kenyataannya siswa membuang-buang waktu mereka pada tes yang tidak valid dan reliabel - tidak masalah bagaimana tes nampak relevan. Meskipun begitu, untuk memotivasi dan hubungan yang baik adalah penting bagi siswa dan orang tua merasa tes adalah penting. Keluhan untuk sekolah utama siswa dapat dikurangi jika tes tidak nampak sepele dalam isi atau tidak menggunakan bahasa yang rendah kepada siswa. Beberapa butir mungkin mempunyai face validity, tapi kurang validitas empirik. Itu mungkin bagi siswa untuk menikmati pengambilan pengalaman tanpa menggunakan tes. Mungkin juga mengukur validitas empiris, tapi mempunyai face validity yang kecil. Sering menulis ulang butir-butir dapat membuat butir nampak lebih relevan. Tes aritmatika dasar untuk siswa SMA yang lambat sebaiknya menggunakan cara dewasa, contoh tes membaca untuk seleksi sekretaris perlu menggunakan contoh praktis dan menghindari kepustakaan, tes matematika dengan ilmu fisika kelas perlu menggunakan contoh dari ilmu fisika. Harus jelas bahwa face validity adalah tidaklah penting ke bentuk validitas lain. Jika mungkin bagaimanapun butir-butir perlu nampak relevan untuk peserta ujian sebab jika tes nampak sepele dan kekanak-kanakan mungkin, validitas empiris mungkin lemah. –

Misalnya : Untuk mengukur sikap tidak dibuat dalam bentuk pertanyaan tetapi pernyataan. Bila kuesioner dibuat dalam pertanyaan dari permukaan saja sudah bisa dilihat bahwa kuesioner tersebut tidak valid.

3. Validitas Kontruksi (Construksi Validity) Validitas dapat didefinisikan sebagai pengembangan pengukuran yang digunakan dalam pengambilan keputusan sesuai dengan tujuan yang diberikan. Validitas dari judul tes harus didukung oleh peristiwa dalam tes manual. Misalnya tes motivasi harus menimbulkan peristiwa yang dapat dilakukan dalam kenyataan untuk mengukur motivasi dan dapat digunakan dalam situasi untuk keputusan yang berhubungan dengan konstruk. Menentukan validitas konstruk adalah penting ketika pengembang tes atau pengguna tes ingin mempelajari lebih banyak tentang kualitas psikologi yang diukur melalui tes dari pada dipelajari melalui kriteria tunggal yang berhubungan dengan koefisien validitas (APA 1974: 30). Misalnya keputusan yang berhubungan dengan keterampilan siswa pada suatu tes yang didesain untuk mengukur kreatifitas, dapat dikembangkan jika guru memahami bagaimana skor tersebut berhubungan dengan konstruk seperti prestasi atau intelegensi. Validitas konstruk juga penting dalam menentukan perlakuan apa atau kemampuan yang dikembangkan dalam pengukuran tes terbaru. Tujuan lain dalam menentukan validitas konstruk adalah berhubungan dengan pengembangan dan perbaikan teori pendidikan dan psikologi. Observasi empiris (pengukuran) memberikan data input untuk mengklarifikasi dan mendefinisikan teori. Teori yang mengungkap bahwa frustasi menghasilkan agresi harus memiliki beberapa cara dalam mengukur frustasi dan agresi tersebut. Jika perbedaan pengukuran frustas berhubungan secara positif dan tinggi, hal ini menunjukkan bahwa frustasi adalah suatu perlakuan tunggal walaupun diukur dengan pendekatan yang berbeda. Dalam beberapa cara panjang dapat diukur dengan instrumen yang berbeda. Seseorang menunjukkan tidak frustasi dan juga tidak agresif. Para ahli teori memperoleh informasi sebanyak mungkin untuk memahami makna hipotesis konstruk. Peristiwa akan mendukung atau gagal mendukung konstruk tetapi tidak dapat membuktikan proposisi yang diberikan. Peristiwa lain diperoleh berdasarkan kondisi yang berbeda dan dengan subjek yang berbeda dapat diperoleh beberapa modifikasi konstruk. Tes kepribadian dan intelegensi secara khusus dilakukan untuk mengukur konstruk teoritik atau perlakuan. Misalnya teori intelektual dapat memberi dukungan jika tes dikembangkan untuk mengukur perilaku apa saja dari teori yang diprediksi. J.P. Guilford (1967) mempunyai hipotesis bahwa intelegensi terdiri dari 120 kecakapan dan dia telah melakukan penelitian yang luas untuk membuktikan hal tersebut. Beberapa peristiwa mempunyai korelasi yang rendah, dan peristiwa lain mencakup perbandingan prestasi siswa sebagai tes prediksi yang diperoleh dari teori Guilford dan berbagai pertimbangan teori lain. Dalam penelitian itu IP dan skor pada tes matematika (aljabar) digunakan sebagai kriteria. Keith Holy dan William Michael (1972) menemukan bahwa tes konstruk berdasarkan teori Guilford merupakan prediktor yang konsisten terhadap dua kriteria tersebut dan menghemat waktu untuk mengadministrasinya. Untuk memperjelas makna intelegensi beberapa penelitian harus dilakukan menggunakan tes dan kriteria lain untuk mengukur aspek-aspek yang berbeda. Umumnya proses validitas konstruk mencakup minimal 6 langkah : a. Justifikasi eksplisit bahwa konstruk adalah penting dalam pendidikan atau psikologi. Mengembangkan konstruk yang tidak berhungan dengan teori atau pengembangan praktek mencakup tujuan tertentu. Untuk menjustifikasi kebutuhan teori intelektual Guilford (1959) telah mendemonstrasikan nilai integrasi teori intelegensi dan menunjukkan implikasi teori tersebut terhadap teori psikologi, tes kejuruan dan praktek pendidikan.

b. Perbedaan harus dibuat antara hipotesis konstruk dan konstruk lain walaupun nampak sama. Misalnya Guilford menyebut “kreatifitas” lebih baik didefinisikan berpikir difergen. Berpikir divergen bukan berarti mengukur usaha yang dipertahankan tetapi justru lebih mempertimbangkan hal-hal yang logis. c. Hipotesis konstruk harus terukur. Teori Guilford tentang postulat intelektual bahwa terdapat perbedaan pengukuran antara “bilangan” dan “simbolik” dalam berpikir divergen. Berpikir divergen bilangan membutuhkan konstruksi tes yang mengukur variasi dari perbedaan respons terhadap ukuran, warna, bentuk, lokasi, dan susunan. Sebaliknya berpikir divergen simbolik membutuhkan penggunaan huruf, angka, atau simbol-simbol konvensional lain. Tes-tes yang digunakan untuk mengukur berbagai konstruk hipotesis telah disusun oleh Guilford. d. Bukti/keterangan haruslah diperoleh dari sumber yang berbeda, untuk mendukung konstruk. Biasanya investigator mencoba mengembangkan tes-tes yang berbeda, yang secara independen mengukur trait yang sama. Sebagai contoh : Figural divergent thinking harus bisa diukur oleh tes-tes yang berbeda, yang mempunyai ukuran, warna, bentuk, lokasi dan tekstur yang sama. Jika tes-tes yang berbeda semua mengukur konstruk yang sama, maka konstruk tersebut mempunyai validitas convergent (Campbell & Fiske, 1959). e. Bukti/keterangan haruslah diperoleh untuk memperlihatkan bahwa konstruk tidak berkorelasi dengan faktor-faktor yang tidak relevan. Konstruk harus mempunyai validitas discriminant. Sebagai contoh : Sebuah tes atas pemikiran yang berbeda/ baru, haruslah tidak berkorelasi dengan kuat/ positif, dengan sebuah pengukuran atas kekakuan, karena kedua trait tersebut secara logis bertentangan. Memperlihatkan apa yang tidak digambarkan sebuah konstruk, sama pentingnya dengan memperlihatkan apa yang digambarkannya. f. Konstruk dimodifikasi sesuai dengan informasi tambahan. Ketika bukti/ keterangan baru terkumpul, investigator harus memodifikasi sifat-sifat dari konstruk tersebut. Kapan pun konstruk tidak efisien/ gagal memprediksi suatu hipotesa, konstruk tersebut memerlukan modifikasi. Bukti/ keterangan baru akan memodifikasi harapanharapan, yang pada gilirannya menyarankan kepada investigator, pendekatanpendekatan baru untuk diikuti. –

Misalnya untuk mengukur citra perusahaan dibuat definisi operasional. Citra adalah penilaian seseorang atas perusahaan secara komprehensif (menyeluruh). Dalam hal ditemukan indikator, keuangan, sdm, manajemen, prasarana, iklim, teknologi, dll.

More Documents from "Mutia tya"