Universitas Sumatera Utara Repositori Institusi USU
http://repositori.usu.ac.id
Fakultas Psikologi
Skripsi Sarjana
2018
Analisis Karakteristik Psikometri Tes Army Alpha 1 Aqsari, Nurul Nia Universitas Sumatera Utara http://repositori.usu.ac.id/handle/123456789/7393 Downloaded from Repositori Institusi USU, Univsersitas Sumatera Utara
ANALISIS KARAKTERISTIK PSIKOMETRI TES ARMY ALPHA 1
SKRIPSI Diajukan untuk memenuhi persyaratan Ujian Sarjana Psikologi
Oleh: NURUL NIA AQSARI 131301071
FAKULTAS PSIKOLOGI UNIVERSITAS SUMATERA UTARA 2017
Universitas Sumatera Utara
Universitas Sumatera Utara
Universitas Sumatera Utara
ANALISIS KARAKTERISTIK PSIKOMETRI TES ARMY ALPHA 1 Nurul Nia Aqsari1 dan Etti Rahmawati2 ABSTRAK Saat ini, kebutuhan akan alat ukur psikologi semakin meningkat. Suatu tes harus memiliki kualitas psikometri yang baik agar hasilnya sesuai dengan fungsi ukur tes tersebut. Tujuan dari penelitian ini adalah untuk melihat dan mengetahui kualitas psikometri tes Army Alpha 1. Data yang digunakan dalam penelitian ini adalah data sekunder berupa respon subjek pada lembar jawaban sebanyak 412 lembar yang diperoleh dari beberapa biro psikologi di Medan yang menggunakan tes Army Alpha 1. Hasil penelitian menemukan bahwa terdapat beberapa aitem yang tingkat kesukarannya sudah tidak sesuai dengan yang seharusnya, yakni aitem 2 hingga aitem aitem 9. Namun untuk keseluruhan aitem yang terdapat dalam tes Army Alpha 1 masih memiliki indeks diskriminasi yang baik. Selain itu, dari hasil analisis validitas faktor konfirmatori, menemukan hanya terdapat 8 aitem yang memiliki t-value dan muatan faktor standar di atas nilai kritikal, sedangkan 4 aitem lainnya tidak memenuhi kriteria validitas sebagai tes inteligensi. Dari hasil estimasi reliabilitas juga menunjukkan bahwa tes Army Alpha 1 kurang reliabel dimana ditemukan besarnya koefisien reliabilitas dalam penelitian ini hanya sebesar 0,814. Kata Kunci : Tes Army Alpha 1, karakteristik psikometri
1 2
Mahasiswa Fakultas Psikologi Universitas Sumatera Utara Dosen Departemen Umum dan Eksperimen Fakultas Psikologi Universitas Sumatera Utara
i
Universitas Sumatera Utara
ANALYSIS OF ARMY ALPHA-1 TEST’S PSYCHOMETRIC CHARACTERISTIC Nurul Nia Aqsari1 and Etti Rahmawati2 ABSTRACT
Nowadays, the need for psychological test increases rapidly. The psychological test must has good psychometric quality so the result will be compatible with its function. The purpose of this study is to find out the Army Alpha-1’s psychometric quality. The data that was used in this study was secondary data in the form of 412 subject’s response on the answer sheet that was collected from some psychology consultation bureau in Medan who used Army Alpha-1 Test. The result of this study showed to several items whose level of difficulty is not in accordance with what should be, those items was second item (items number 2) until ninth item. But for the overall items in Army Alpha-1 Test still have good index of discrimination. Further, from the result of confirmatory factor validity analysis, found only 8 items had t-value and standard loading factor was above critical value, while the other four items didn’t meet the criteria of validity as intelligence tests. From the result of reliability estimation showed that Army Alpha-1 Test was less reliable because the reliability coefficient in this research just was 0.814. Keywords : Army Alpha-1 Test, Psychometric Characteristic.
1 2
Student of Faculty Of Psychology, University Of North Sumatera Lecturer of Departemen of General and Experimental Psychology University of North Sumatera
ii
Universitas Sumatera Utara
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat kepada Allah SWT atas segala rahmat yang telah diberikan selama ini, sehingga penulis dapat menyelesaikan skripsi yang berjudul “Analisis Karakteristik Psikometri Tes Army Alpha 1” dengan tepat pada waktunya. Selama proses pengerjaan skripsi ini, penulis tentu menerima banyak bantuan dari berbagai pihak. Untuk itu peneliti mengucapkan terima kasih kepada: 1. Bapak Zulkarnain, Ph.D, Psikolog selaku Dekan Fakultas Psikologi Universitas Sumatera Utara 2. Ibu Etti Rahmawati, M. Si. selaku dosen pembimbing seminar dan skripsi yang telah banyak membagi ilmu, waktu, motivasi dan masukkan yang luar sehingga peneliti dapat menyelesaikan penulisan skripsi ini dengan baik. 3. Bapak Ari Widiyanta, M.Si, Psikolog selaku dosen pembimbing akademik yang senantiasa membimbing peneliti selama proses perkuliahan.
|
4. Seluruh staf pengajar di Fakultas Pskologi USU, atas segala ilmu dan pengalaman yang peneliti dapatkan selama mengikuti perkuliahan di Fakultas Psikologi USU. 5. Seluruh pegawai di Fakultas Psikologi USU, yang telah membantu peneliti dalam pengurusan administrasi 6. Keluarga khususnya kepada kedua orang tua yang selalu senantiasa menasehati dan memberikan dorongan, dukungan baik secara moral maupun materil selama hidup peneliti, kepada saudara peneliti, serta teman-teman yang senantiasa selalu mendukung dan berdoa demi kelancaran menyelesaikan proposal ini. 7. Sahabat-sahabat dekat peneliti (Nurul Hasanah, Alifia Ridha, Delilah Wahyuni, Rifky Tiara Balqish dan Kak Nanda) yang senantiasa selalu menemani dan memberikan semangat baik suka dan duka 8. Teman-teman seperjuangan umeks (Delila, Andri, Shinta, dan Kak Mida) yang sama-sama selalu memberi dukungan dan dorongan kepada peneliti untuk segera menyelesaikan studi ini. iii
Universitas Sumatera Utara
9. Terkhusus untuk 2 teman peneliti (Rika dan Lely) yang membantu dalam penerjemahan bahasa Inggris. 10. Teman-teman Fakultas Psikologi Universitas Sumatera Utara Angkatan 2013 yang tidak dapat saya sebutkan satu per satu. 11. Seluruh pihak yang terlibat dalam proses pengerjaan skripsi ini yang tidak dapat disebut satu persatu. Penulis menyadari proposal penelitian ini masih terdapat banyak kekurangannya. Oleh karena itu, penulism mengharap kritik dan saran yang berguna untuk menyempurnakan proposal penelitian
ini. Akhir kata, peneliti mengucapkan
terima kasih, semoga proposal penelitian ini dapat bermanfaat bagi semua pihak.
Medan, 14 Agustus 2017
Nurul Nia Aqsari
iv
Universitas Sumatera Utara
DAFTAR ISI
ABSTRAK ........................................................................................................... i KATA PENGANTAR ......................................................................................... iii DAFTAR ISI ........................................................................................................ v DAFTAR TABEL ................................................................................................ vii DAFTAR LAMPIRAN ........................................................................................ viii
BAB 1 PENDAHULUAN A. Latar Belakang Masalah .................................................................................. 1 B. Rumusan Masalah ........................................................................................... 7 C. Tujuan Penelitian............................................................................................. 7 D. Manfaat Penelitian 1. Manfaat Teoritis .......................................................................................... 8 2. Manfaat Praktis ........................................................................................... 8 E. Kerangka Berpikir ........................................................................................... 9
BAB II TINJAUAN PUSTAKA A. Tes Army Alpha 1. Sejarah Perkembangan Tes Army Alpha .................................................... 10 2. Teori Dasar Tes Army Alpha ...................................................................... 11 4. Penelitian Sebelumnya terkait Tes Army Alpha ......................................... 11 B. Karakteristik Psikometri 1. Validitas a. Definisi Validitas .................................................................................... 12 b. Sumber Bukti Validitas .......................................................................... 13 c. Faktor-Faktor yang Mempengaruhi Validitas......................................... 20 d. Interpretasi Koefisien Validitas .............................................................. 22 2. Reliabilitas a. Definisi Reliabilitas ................................................................................ 23 b. Metode Estimasi Reliabilitas ................................................................. 25 v
Universitas Sumatera Utara
c. Faktor-Faktor yang Mempengaruhi Reliabilitas ..................................... 30 d. Interpretasi Koefisien Reliabiltas ........................................................... 31 3. Indeks Kesukaran Aitem dan Indeks Diskriminasi Aitem a. Indeks Kesukaran Aitem ......................................................................... 33 b. Indeks Diskriminasi Aitem ..................................................................... 34 C. Karakteristik Psikometri Tes Army Alpha 1 ................................................... 35
BAB III METODE PENELITIAN A. Jenis Penelitian ................................................................................................ 39 B. Subjek Penelitian ............................................................................................ 39 C. Data yang Digunakan ..................................................................................... 40 D. Persiapan Izin Pengambilan Data dan Prosedur Pelaksanaan Penelitian 1. Persiapan Izin Pengambilan Data ............................................................... 40 2. Pelaksanaan Penelitian ............................................................................... 40 E. Program Komputer yang Digunakan ............................................................... 42 F. Cara Analisis Data .......................................................................................... 43
BAB IV HASIL DAN PEMBAHASAN A. Gambaran Subjek Penelitian ........................................................................... 48 B. Hasil Uji Karakteristik Psikometri 1. Indeks Kesukaran Aitem ............................................................................. 49 2. Indeks Diskriminasi Aitem.......................................................................... 50 3. Validitas Konstruk....................................................................................... 51 4. Analisis Reliabilitas..................................................................................... 54 C. Pembahasan ..................................................................................................... 54
BAB V KESIMPULAN DAN SARAN A. Kesimpulan ..................................................................................................... 59 B. Saran ................................................................................................................ 59 DAFTAR PUSTAKA .......................................................................................... 61 LAMPIRAN ......................................................................................................... 63
vi
Universitas Sumatera Utara
DAFTAR TABEL
Tabel 1. Kategori Estimasi Koefisien Reliabilitas .............................................. 32 Tabel 2. Kategori Batasan Nilai p ....................................................................... 33 Tabel 3. Evaluasi Indeks Diskriminasi Aitem ..................................................... 34 Tabel 4. Perbandingan Ukuran Goodness of Fit ................................................ 46 Tabel 5. Gambaran Subjek Penelitian ................................................................. 49 Tabel 6. Hasil Analisis Indeks Kesukaran Aitem Tes Army Alpha1 .................. 50 Tabel 7. Pengelompokan p Tes Army Alpha 1 .................................................. 50 Tabel 8. Hasil Analisis d Tes Army Alpha 1 ...................................................... 50 Tabel 9. Kecocokan Model ................................................................................. 52 Tabel 10. Muatan Faktor ..................................................................................... 52 Tabel 11. Rekapitulasi Karakteristik Psikometri Aitem tes Army Alpha 1 ........ 53
vii
Universitas Sumatera Utara
DAFTAR LAMPIRAN
LAMPIRAN I.Output Lisrel ............................................................................... 64 LAMPIRAN II.Perhitungan Reliabilitas KR-20 ................................................70
viii
Universitas Sumatera Utara
BAB I PENDAHULUAN
A.
Latar Belakang Masalah Istilah psikologi tentu tidak asing lagi terdengar di telinga masyarakat
Indonesia. Bahkan masyarakat sekarang telah terbiasa menjalankan berbagai aktifitas yang berkaitan dengan ilmu psikologi. Hal ini tentulah sangat berbeda, dengan pandangan masyarakat awam yang dulunya menganggap ilmu psikologi sebagai ilmu yang erat kaitannya dengan paranormal, orang gila, dan sebagainya (Randika, Juni 17, 2015). Selain itu, dulunya masyarakat juga menganggap bahwa ilmu psikologi tidaklah penting untuk kehidupan. Seperti yang tertulis dalam sebuah artikel online yang mengatakan bahwa masyarakat hanya akan membuang waktu dan uangnya dengan sia-sia ketika menggunakan jasa psikologi (Randika, Juni 17, 2015). Namun, anggapan itu sekarang ditampik dengan semakin meningkatnya kebutuhan akan jasa psikologi dalam beberapa tahun belakangan ini. Salah satu jasa psikologi yang banyak dipakai adalah tes psikologi atau yang umum dikenal sebagai psikotes. Psikotes atau tes psikologi merupakan suatu ukuran yang obyektif dan standar dari sampel perilaku (Anastasi & Urbina, 1997). Menurut Urbina (2004) tes psikologi berperan sebagai alat dalam pengambilan keputusan, penelitian psikologi serta pemahaman diri dan pengembangan pribadi bagi individu. Sebagai alat pengambilan keputusan, tes psikologi sering kita jumpai dalam berbagai bidang seperti bidang pendidikan, industri atau organisasi, klinis ataupun bidang 1
Universitas Sumatera Utara
2
lainnya yang fungsi tes pada setiap bidang itupun berbeda-beda. Dalam konteks pendidikan contohnya, tes psikologi secara umum digunakan sebagai pedoman dalam pemilihan jurusan, minat dan bakat. Berbeda lagi ketika tes psikologi diterapkan pada konteks pekerjaan, yang biasanya dipakai sebagai penilaian, penyeleksian, penempatan hingga sampai pada pengklasifikasian individu di posisi yang tepat dan seterusnya. Banyaknya biro-biro psikologi yang muncul di kota-kota besar Indonesia menunjukkan penggunaan tes psikologi saat ini sudah jauh lebih berkembang dari sebelumnya (Fitriani, 2012). Masyarakat modern kini percaya bahwa tes psikologi bukan hanya dapat digunakan dalam hal perekrutan atau seleksi tes masuk, namun juga dapat sebagai bentuk pemahaman dan pengembangan diri individu. Gregory (2004) mengklasifikasikan tes psikologi ke dalam 8 kategorisasi yang salah satunya ialah tes intelegensi. Tes inteligensi termasuk tes yang paling sering dan populer digunakan oleh para pengguna tes. Biasanya individu ataupun kelompok yang sedang menjalani serangkaian tes psikologi seperti seleksi masuk Calon Pegawai Negeri Sipil (CPNS), Perbankan, Perguruan Tinggi Negri (PTN), kemiliteran dan sebagainya, akan diberikan sebuah tes inteligensi di awal pemberian tes sebelum diberikan tes psikologi lainnya. Inspirawan (2011) juga mengatakan alasan dari seringnya tes inteligensi dipakai dalam proses seleksi dan rekrutmen ialah karena tes ini digunakan sebagai tahap penyaringan data. Tes intelegensi merupakan suatu pengukuran kemampuan individu secara global, seperti kemampuan verbal, organisasi perseptual, ataupun penalaran yang dapat membantu menentukan potensi yang ada dalam bidang tertentu (Gregory, 2004). Berdasarkan jumlah subjeknya, tes inteligensi dibagi ke dalam dua bentuk
Universitas Sumatera Utara
3
yakni tes individual dan kelompok atau klasikal. Administrasi tes inteligensi secara kelompok atau klasikal memiliki beberapa keuntungan dibandingkan individual. Beberapa keuntungannya seperti dalam sekali administrasi tes dapat diberikan oleh orang banyak sehingga dapat menghemat dari segi waktu, biaya dan tenaga professional. Salah satu bagian dari tes inteligensi kelompok ialah tes Army Alpha. Tes Army Alpha merupakan bagian dari tes inteligensi yang dikembangkan oleh Robert Yerkes pada tahun 1917 (Gregory, 2004). Tes Army Alpha mencakup berbagai macam tes pengetahuan dan berbagai keterampilan kognitif yang terdiri dari 8 subtes, salah satunya ialah subtes petunjuk lisan. Dalam subtes ini (tes Army Alpha 1) digunakan untuk mengukur kemampuan daya tangkap dan konsentrasi dalam menerima dan melaksanakan instruksi dengan cepat dan tepat (Brigham, 1923). Tes ini melibatkan kepekaan dan pemahaman arah bahasa lisan yang sederhana atau kompleks dan melihat serta menandai di tempat yang sesuai pada lembar jawaban (Sticth & Armstrong, 1994). Tes ini juga biasanya digunakan dalam keperluan penyaringan umum dan penempatan. Di Indonesia sendiri, Tes Army Alpha 1 digunakan untuk mengukur kemampuan daya tangkap dan konsentrasi. Berdasarkan pengamatan dan hasil wawancara peneliti dengan beberapa pengguna tes psikologi di Kota Medan, disimpulkan bahwa ternyata beberapa biro psikologi khususnya di Kota Medan masih banyak menggunakan tes Army Alpha 1 sebagai salah satu rangkaian tes psikologi. Selain itu, tes Army Alpha 1 juga masih banyak digunakan dalam penelitian-penelitian ilmiah di Indonesia sebagai salah satu alat pengukuran skor dalam penelitian-penelitian tersebut. Misalnya saja dalam sebuah penelitian yang
Universitas Sumatera Utara
4
dilakukan oleh Mulyana, Izzati dan Rahmasari (2013), yang menggunakan tes Army Alpha 1 sebagai alat ukur untuk mengukur tingkat konsentrasi belajar siswa SMK sebelum dan sesudah diberikan penerapan relaksasi atensi. Penelitian tersebut merupakan sebuah penelitian eksperimen yang menggunakan tes Army Alpha 1 sebagai alat untuk mengukur konsentrasi belajar siswa ketika pretest dan posttest dilakukan terhadap kelompok eksperimen dan kelompok kontrol. Penelitian yang sama juga dilakukan oleh Hidayat (2011); Kusnanto, Sutardji, Junaidi (2012) dan Prasanti (2015) yang menggunakan tes Army Alpha 1 sebagai alat ukur konsentrasi dalam penelitian mereka. Hal tersebut menunjukkan bahwa tes Army Alpha 1 sampai sekarang masih banyak dan dipercaya sebagai salah satu tes psikologi untuk mengukur kemampuan konsentrasi. Sebagai alat ukur psikologi yang masih banyak digunakan hingga saat ini, tes Army Alpha 1 tentu diharapkan berfungsi sesuai dengan fungsi ukurnya. Suatu alat tes akan dikatakan berfungsi sesuai dengan fungsi ukurnya apabila memiliki kualitas psikometri yang baik pula. Kualitas psikometri suatu aitem dapat dilihat melalui kualitas aitem tes, validitas serta reliabilitas tes. Pada tes Army Alpha 1, validitas dan reliabilitas sebelumnya sudah pernah diuji dan hasilnya menunjukkan bahwa tes Army Alpha 1 cukup memiliki nilai validitas dan reliabilitas yang baik (Wells, 1986). Namun pengujian tersebut sudah lebih dari 30 tahun yang lalu dilakukan, tepatnya pada tahun 1980-an. Terlebih lagi, sampai saat ini, peneliti belum menemukan penelitian terkait dengan kualitas psikometri tes Army Alpha 1 sebelumnya di Indonesia. Osterlind (2010) mengatakan bahwa hasil dari suatu penelitian terkait dengan kualitas suatu
Universitas Sumatera Utara
5
tes standar akan sangat rentan berpengaruh terhadap perubahan waktu dan konteks yang berbeda. Banyaknya artikel yang menulis tentang teknik menjawab dengan benar tes Army Alpha 1 di internet, menyebabkan responden (subjek) memiliki pengalaman sebelum mengikuti tes. Adanya proses belajar sebelum mengikuti tes mengakibatkan responden akan cenderung lebih banyak menjawab tes dengan benar. Kecenderungan banyaknya jawaban benar dari responden dalam suatu tes akan mengakibatkan tingginya skor kesukaran aitem tes. Hal tersebut secara tidak langsung juga akan mengganggu daya diskriminasi aitem dari tes itu sendiri. Terganggunya indeks kesukaran item dan daya diskriminasi aitem pada skor yang dihasilkan dapat pula
mengganggu reliabilitas dan validitas alat tes tersebut
(Murphy dan Davidshofer, 2005) Skor validitas dari sebuah tes dapat diuji melalui beberapa sumber bukti, diantaranya dapat dilihat berdasarkan konten tes, proses respon, struktur internal, variabel lain dan pertimbangan dari eksternal (Osterlind, 2010). Jika dilihat dari kategorisasi validitas tersebut, maka validitas dari tes Army Alpha 1 dapat diuji berdasarkan bukti struktur internal. Selain pengujian validitas, reliabilitas dalam penelitian ini juga perlu diuji kembali. Pengujian nilai reliabilitas pada skor tes sangat penting dilakukan untuk membuktikan apakah suatu tes memiliki atribut pengukuran yang baik (Murphy & Davidshofer,
2005).
Reliabilitas
merupakan
ketepatan,
keakuratan
atau
kekonsistenan dari hasil-hasil pengukuran berulang (Osterlind, 2010). Sama halnya dengan nilai validitas, nilai reliabilitas juga harus diuji secara berkala mengingat adanya perubahan yang terjadi dipengaruhi oleh waktu. Azwar (2010)
Universitas Sumatera Utara
6
mengatakan bahwa tidak selamanya suatu pengukuran dapat dikatakan reliabel, tentu saja karena suatu pengukuran tidak akan selalu konsisten dari waktu ke waktu. Sebuah tes atau pengukuran dapat dikatakan memiliki nilai reliabilitas yang baik ketika tes tersebut dilakukan pengujian berulang maka semakin sedikit nilai eror yang muncul dalam skor tesnya (Osterlind, 2010). Eror yang muncul dalam pengukuran dapat berasal dari beberapa sumber antara lain waktu sampling, item sampling, konsistensi internal, dan perbedaan pandangan observer (Kaplan dan Saccuzzo, 2005). Beberapa
peneliti
menggunakan
metode
yang
berbeda
dalam
mengestimasi skor reliabilitas untuk mendeskripsikan berbagai sumber eror yang ada.
Untuk mengatasi eror yang muncul dalam pengukuran, maka estimasi
reliabilitas dari tes Army Alpha 1 dalam penelitian ini akan diuji dengan menggunakan metode penyajian tunggal (konsistensi internal) dengan formula Kuder-Richardson 20 (KR-20) atau KR-21. Penelitian tentang kualitas psikometri tes Army Alpha 1 memiliki sejumlah alasan yang cukup jelas. Selain terkait dengan jangka waktu, tingkat kepercayaan terhadap skor yang dihasilkan dari tes ini juga menjadi pertimbangan. Peneliti melihat jika tes ini sudah banyak beredar di internet baik itu pengadministrasiannya, cara pengisian tes, hingga pada kunci jawaban tes itu sendiri. Mengingat bahwa tes Army Alpha 1 sampai saat ini masih terus digunakan di Indonesia khususnya Kota Medan, dan terdapatnya kebocoran tes Army Alpha 1 di website internet, serta peneliti juga sampai sejauh ini masih belum menemukan bagaimana kualitas psikometri dari tes Army Alpha 1 di
Universitas Sumatera Utara
7
Indonesia. Hal ini menimbulkan pertanyaan bagi peneliti “apakah tes Army Alpha 1 dikatakan layak untuk digunakan dalam mengukur kemampuan konsentrasi seseorang”. Berdasarkan pemaparan di atas, maka perlu dilakukan analisis karakteristik psikometri pada Tes Army Alpha 1 untuk memastikan apakah tes ini berfungsi sesuai dengan tujuan asli tes tersebut. Maka dari itu, peneliti tertarik untuk menganalisis karakteristik psikometri tes Army Alpha 1. B. Rumusan Masalah Peneliti melihat perlunya dilakukan pengujian ulang terhadap validitas, reliabilitas, indeks kesukaran aitem, dan indeks diskriminasi aitem dari tes Army Alpha 1. Berdasarkan fenomena tes Army Alpha 1 yang sudah dijelaskan sebelumnya, maka peneliti merumuskan fokus permasalahan dalam penelitian ini. Adapun rumusan masalah tersebut antara lain: 1. Seberapa besarkah indeks kesukaran dan indeks diskriminasi aitem pada tes Army Alpha 1? 2. Apakah tes Army Alpha 1 memiliki nilai reliabilitas yang baik dan seberapa besar nilai koefisien reliabilitas tes Army Alpha 1? 3. Apakah tes Army Alpha 1 memiliki nilai validitas yang baik berdasarkan bukti struktur internal? C. Tujuan Penelitian Tujuan dari penelitian ini ialah untuk melihat dan mengetahui kualitas psikometri tes Army Alpha 1, apakah dapat digunakan dan berfungsi sesuai dengan fungsi ukur tes dengan mengevaluasi indeks kesukaran aitem, indeks
Universitas Sumatera Utara
8
diskriminasi aitem, validitas berdasarkan bukti struktur internal dan reliabilitas konsistensi internal. D. Manfaat Penelitian Penelitian ini diharapkan dapat memberikan manfaat, baik dari segi teoritis maupun dari segi praktis. 1. Manfaat Teoritis Penelitian ini diharapkan mampu memberikan manfaat dalam bidang ilmu Psikologi, khususnya Psikologi Umum dan Eksperimen mengenai karakteristik psikometri tes Army Alpha 1. 2. Manfaat Praktis Hasil dari penelitian ini diharapkan dapat memberi informasi kepada para praktisi atau psikolog sebagai pengguna tes mengenai karakteristik psikometri tes Army Alpha 1 dan menjadi bahan pertimbangan mereka sebelum mengambil keputusan.
Universitas Sumatera Utara
9
E. Kerangka Berpikir Tes psikologi
Aptitude Test
Achievement Test
Personality Test
Interest inventories
Creativity Test
Neuropsychological Test
Behavioral Procedures
Intelligence Test
Tes Kelompok Tes individual CFIT
2.Penalaran Aritmatika
1.Petunjuk Lisan
ARMY ALPHA
4. SinonimAntonim 3. Penilaian Praktis
6. Penyelesaian seri nomor
8. Informasi 7. Analogi
5. Kalimat tdk beraturan
Dilakukan pengujian ulang
Analisis Karakteristik Psikometri Tes Army Alpha 1
RPM
Masih banyak digunakan dalam penelitian-penelitian di Indonesia Cara menjawab & kunci jawaban dari tes ini sudah tersebar luas di Internet Belum ada penelitian terbaru mengenai validitas & reliabilitas tes Army Alpha 1 semenjak 1980-an tahun terakhir
a) Merupakan tes konsenttrasi b) Tes banyak digunakan baik dalam bidang pendidikan maupun pengrekrutan pegawai c) Efisiensi waktu d) Tes bersifat lebih praktis
NB: Garis tebal merupakan area penelitian ini
Universitas Sumatera Utara
BAB II TINJAUAN PUSTAKA
A. Tes Army Alpha 1. Sejarah Perkembangan Tes Army Alpha Tes Army Alpha merupakan salah satu dari bentuk tes inteligensi kelompok yang dikembangkan oleh Robert Yerkes dan enam orang lainnya yang didasarkan pada tes inteligensi Alfred Binet. Tes ini pertama kali diperkenalkan pada tahun 1917 oleh Yerkes dan teman-temannya yang pada saat itu digunakan untuk merekrut dan mengevaluasi beberapa tentara militer AS selama Perang Dunia I. Saat itu, tes ini diperkenalkan karena munculnya tuntutan akan metode yang sistematis dalam mengevaluasi fungsi intelektual dan emosional tentara (Gregory, 2004). Skor yang dihasilkan dari tes Army Alpha pada saat itu, akan digunakan dalam menentukan, menggolongkan serta menempatkan kemampuan seorang prajurit pada posisi yang sesuai (Schrammel, 1936). Setelah berakhirnya Perang Dunia I, tes Army Alpha terus mengalami perubahan revisi pada alat tesnya sendiri baik pada tujuan pemberian tesnya, instrument test, administrasi tes, norma hingga pada skoring tesnya. Saat ini tes Army Alpha tidak hanya digunakan dalam administrasi militer namun tes ini sudah banyak diaplikasikan dalam setting pendidikan, perekrutan pegawai dan sebagainya (Brannan, 1935). Saat ini, tes Army Alpha merupakan bagian dari baterai tes yang mencakup berbagai tes pengetahuan dan berbagai keterampilan kognitif. Tes Alpha dapat diinterpretasikan ulang bukan sebagai tes kecerdasan asli tetapi 10
Universitas Sumatera Utara
11
sebagai sampling dari berbagai kemampuan kognitif dengan menangani pengetahuan dasar individu terkait dengan bahasa lisan maupun tulisan. 2. Teori Dasar Tes Army Alpha Group Examination Alpha atau yang lebih dikenal dengan sebutan tes Army Alpha merupakan tes kecerdasan kelompok yang pertama untuk orang dewasa. Pada awalnya tes ini terdiri dari 13 subtes, namun kemudian tes Army Alpha beradaptasi dengan skala Binet untuk keperluan konten dan standar administrasi (Yoakum dan Yerkes, 1920, dalam Reynolds & Janzen, 2007). Beberapa subtes ada yang dieliminasi, direvisi, dan dikombinasikan kembali dengan memasukkan beberapa aitem yang mudah maupun aitem yang sulit sehingga pada akhirnya tes ini terdiri dari 8 subtes (Brannan, 1935). Kedelapan subtest tersebut ialah: (1), petunjuk lisan yang mengukur kemampuan konsentrasi dan daya tangkap dalam menerima dan melaksanakan instruksi dengan cepat dan tepat; (2), penalaran aritmatika; (3), penilaian praktis; (4), sinonim-antonim; (5), kalimat yang tidak beraturan; (6), penyelesaian seri nomor; (7), analogi; (8), informasi (Brigham, 1923; Brannan, 1935). 4. Penelitian Sebelumnya Terkait Tes Army Alpha Tes Army Alpha pernah direvisi beberapa kali oleh peneliti sebelumnya. Salah satunya terjadi pada tahun 1936 yang mana tes Army Alpha direvisi oleh Scrammel-Brannan. Pada saat itu, tes ini diberikan kepada sejumlah mahasiswa di perguruan tinggi. Tes Army Alpha yang diberikan oleh mahasiswa pada saat itu adalah hasil adaptasi dari tes sebelumnya yang mana terdiri dari 8 subtes yakni kemampuan mengikuti arah, penalaran aritmatika, penilaian praktikal, sinonimantonim, penyusunan kalimat, number series completion, analogi dan informasi.
Universitas Sumatera Utara
12
Dari kedelapan subtes Army Alpha, hanya 3 bentuk subtes yang diadaptasi dari bentuk aslinya, sedangkan subtes lainnya masih mengikuti bentuk aslinya. Hasil dari penelitian ini menunjukkan bahwa nilai koefisien reliabilitas yang diperoleh cukup baik yakni sekitar 0.88 – 0.97 (Schrammel, 1936). Tahun 1986, Wells kembali merevisi subtes Army Alpha. Dalam penelitian ini, subtes yang tidak sesuai akan dihilangkan dalam tes Army Alpha. Tentunya hal tersebut dilakukan dengan banyak pertimbangan. Hasilnya subtes 2, 4, 7 dan 8 dipertahankan dalam tes Army Alpha kemudian skor yang dihasilkan tersebut dikorelasikan dengan bentuk tes Army Alpha sebelum direvisi. Kemudian, dihitung koefisien reliabilitasnya dan didapatkan sebesar 0.72. B. Karakteristik Psikometri Metode psikometri merupakan metode analisis pengukuran psikologi dalam menginterpretasikan skor
secara
statistika.
Metode
psikometri
biasanya
menyajikan data yang berkaitan dengan validitas dan reliabilitas (Osterlind, 2010). Dan bukan hanya itu saja, analisis item pada suatu tes juga dibahas dalam metode psikometri. Analisis item sangat diperlukan untuk meningkatkan pemahaman terhadap suatu tes. Murphy dan Davidshofer (2005) mengatakan bahwa ada tiga tipe informasi yang disajikan dalam analisis item. Namun yang akan dibahas dalam penelitian ini hanya dua tipe saja yakni analisis indeks kesukaran item dan indeks diskriminasi item. 1. Validitas a. Definisi Validitas Pembahasan tentang validitas tentu berkaitan dengan tujuan penggunaan tes sebagai pengambilan keputusan. Validitas dapat diartikan sebagai sejauh mana
Universitas Sumatera Utara
13
informasi yang dihasilkan oleh suatu tes tepat, berarti, dan berguna untuk digunakan dalam mengambil keputusan yang merupakan tujuan dari suatu pengukuran mental (Osterlind, 2010). Seperti halnya juga yang tertulis di dalam Standards Text (American Educational Research Association et al., 1999 dalam Osterlind, 2010) mendeskripsikan bahwa validitas adalah pertimbangan yang paling
fundamental dalam mengembangkan dan mengevaluasi tes dimana
validitas mengarah pada sejauh mana bukti dan teori mendukung interpretasi skor tes berdasarkan tujuan penggunaan tes. Beberapa peneliti lain juga mendeskripsikan konsep dari istilah validitas. Angoff (1988, dalam Osterlind, 2010) juga mengatakan bahwa validitas selalu dianggap hal yang paling fundamental dan penting dalam pengukuran psikometri. Messick (1989, dalam Osterlind 2010) juga mengungkapkan istilah validitas sebagai penilaian yang evaluatif dan terintegrasi melalui bukti-bukti empiris dan teoritis yang mendukung kecukupan, kesesuaian inferenceserta tindakan yang diambil berdasarkan pada hasil skor tes atau output dari tes yang diperoleh. Osterlind (2010) juga mengungkapkan terdapat 3 elemen penting yang terdapat ketika mendefinisikan validitas, yaitu merujuk pada interpretasi hasil dari skor tes bukan merupakan bagian dari instrument yang diberikan, merupakan proses evaluasi dari skor tes dan bersifat konsisten dengan arah teori pengukuran. b. Sumber Bukti validitas Validitas skor tes dapat diuji melalui berbagai sumber bukti yang ada. Bukti-bukti validitas harus terkumpul dari banyak sumber ketika akan mengevaluasi validitas. Sumber-sumber ini memberikan informasi mengenai tingkat kepercayaan untuk membuat kesimpulan-kesimpulan berdasarkan skor
Universitas Sumatera Utara
14
dalam situasi tertentu (Osterlind, 2010). Beberapa bukti yang mendukung dalam mengevaluasi validitas diberikan dalam Standards for Educational and Psychological
Testing/Standards
text
(American
Educational
Research
Association et al., 1999, dalam Osterlind 2010). 1) Bukti Validitas berdasarkan Konten Tes Mengevaluasi bukti validitas dari skor tes biasanya selalu menggunakan informasi mengenai konten atau konstruk dari tes itu sendiri. Cara praktis dalam menganalisa validitas berdasarkan konten yakni dengan melihat apakah butir-butir tes yang telah disusun berdasarkan spesifikasi isi tes (TCS) yang telah dirancang sebelumnya oleh pengembang tes. TCS atau yang sering disebut cetak biru (blue print) merupakan dasar yang dibentuk oleh pengembang tes ketika membangun instrumen
menjadi
sebuah
tes
psikologi.
Biasanya
pengembang
tes
mengkombinasikan deskripsi konten atau ciri atribut yang hendak diukur kedalam garis besar tes sehingga menjadi dokumen yang sangat berguna bagi pengguna tes (Osterlind, 2010). Azwar (2012) mengemukakan validitas konten atau isi merupakan pengujian validitas terhadap kelayakan atau relevansi isi tes melalui analisis rasional oleh panel (ahli) yang berkompeten (expert judgement). Tujuan dari evaluasi validasi ini adalah untuk melihat sejauhmana item dalam sebuah tes mewakili keseluruhan aspek yang ingin diukur (aspek representasi) dan sejauh mana item tersebut dapat mengga mbarkan perilaku yang ingin diukur (aspek relevansi).
Universitas Sumatera Utara
15
2) Bukti Validitas berdasarkan Respon Proses Validitas dapat diperoleh dari proses kognitif (merespon) subjek yakni apakah subjek menjawab pertanyaan dari tes berdasarkan pemahaman yang saesuai dengan tes. Dalam Standart Text tertulis bahwa proses respon perlu dibuktikan khususnya untuk tes yang melibatkan analisa penalaran berhitung. Proses respon dalam mengevaluasi validitas tes menjadi penting dilakukan karena dapat menentukan apakah peserta tes, pada kenyataannya, memiliki penalaran tentang materi yang diberikan, bukan hanya mengikuti algoritma standar (American Educational Research Association et al., 1999, dalam Osterlind, 2010). Hasil dari pelaporan pada proses respon ini dapat memberikan bukti validitas yang kuat. Osterlind (2010) mengungkapkan terdapat beberapa metode statistik yang digunakan dalam mengalisis validitas tes berdasarkan bukti proses respon yakni analisis variabel laten, structural equation modeling (SEM, merupakan metode multivariat umum yang menganalisis dimensi laten dalam data psikologis), hierarchial linear modeling (HLM, bentuk kompleks kuadrat biasa (OLS) regresi yang digunakan untuk menganalisis varians dalam variabel hasil ketika variabel prediktor berada pada berbagai tingkat hirarki), conjectural analysis, path analysis (metode untuk mempelajari efek langsung dan tidak langsung dari variabel hipotesis sebagai penyebab variabel yang diperlakukan sebagai efek) dan beberapa jenis meta-analysis (Pedzahur, 1993; Osterlind, 2010). 3) Bukti Validitas berdasarkan Struktur Internal Evaluasi koefisien validitas juga dapat dianalisa melalui bukti struktur internal. Struktur internal dari sebuah tes berkaitan dengan pembuatan kesimpulan
Universitas Sumatera Utara
16
yang tepat mengenai konstrak yang akan dievaluasi (Osterlind, 2010). Biasanya struktur internal akan dievalusi dengan melihat teori-teori dasar yang berhubungan dengan tes. Dengan teori dasar yang jelas akan lebih memungkinkan untuk mengembangkan aitem tes yang sesuai dan pengukuran yang lebih tepat (Osterlind, 2010). Allen dan Yen (1979, dalam Azwar, 2012) mengatakan bahwa evaluasi bukti validitas berdasarkan struktur internal (validitas konstrak) ialah sejauhmana hasil dari tes mampu mengungkap trait atau suatu konstrak teoritik yang ingin diukur. Pengujian bukti validitas berdasarkan konstrak atau isi sangat berguna pada tes yang mengukur trait yang tidak memiliki kriteria eksternal (Azwar, 2012). Teknik yang digunakan dalam mengevaluasi validitas berdasarkan struktur internal
tergantung
pada
tujuan
tes
yang
dikembangkan,
dengan
mempertimbangkan secara hati-hati bagaimana cara penggunaan dan informasi apa yang akan diungkap dari tes (Osterlind, 2010). Ada beberapa strategi yang secara umum digunakan dalam menganalisis validitas berdasarkan struktur internal antara lain sebagai berikut: a)
Model Faktor Umum Pada
dasarnya model ini sejalan dengan teori faktor tunggal Charles
Spearman yang memiliki asumsi bahwa setiap faktor dari sebuah tes mempunyai suatu kesamaan yang juga diukur oleh faktor lain, dan juga mempunyai keunikan yang dimiliki setiap faktor berbeda-beda (Osterlind, 2010). Dalam model ini mengukur seberapa kuat faktor-faktor dalam tes berhubungan dengan konstruk dari tes diukur(Coaley, 2010).
Universitas Sumatera Utara
17
Model faktor umum dapat diuji dengan principal components analysis (PCA) dan factor analysis (FA). Kedua metode ini memiliki tujuan utama untuk mengurangi varians total antar faktor dalam tes menjadi varians yang dimiliki bersama setiap faktor, sehingga faktor umum dari konstruk alat tes dapat diperkirakan (Osterlind, 2010). Analisis faktor (FA) digunakan untuk menganalisis sejumlah faktor yang dapat digunakan untuk menjelaskan adanya hubungan diantara banyak variabel (Azwar, 2012). Pada prosedur analisis faktor, tes dipengaruhi oleh faktor-faktor tertentu akan memiliki muatan faktor (factor loading) yang tinggi (Azwar, 2012). Muatan faktor akan menggambarkan besar muatan varians aitem pada konstrak tes. Semakin besar muatan faktor, semakin besar kontribusi varians aitem. Analisis faktor berdasarkan tujuannya dapat diuji melalui dua prosedur yakni analisis faktor eksploratori (EFA) dan analisis faktor konfirmatori (CFA). EFA bertujuan untuk memeriksa data baru dengan memadukan variabel-variabel yang bervariasi. Sedangkan CFA digunakan untuk menguji sejauhmana model statistic yang dipakai sesuai dengan data empirik (Azwar, 2012). Metode statistik yang dapat digunakan untuk melakukan CFA adalah Hierarchical Linear Modelling (HLM) dan Structural Equation Model (Osterlind, 2010). b) IRT Model Pada model ini dilakukan dengan melihat uji asumsi unidimensionalitas, memeriksa indeks diskriminasi yang sama, investigasi fenomena tebakan, dan meneliti analisis waktu dengan membandingkan varians antara skor pada tes dengan set batas waktu dan tanpa batas waktu (Osterlind, 2010).
Universitas Sumatera Utara
18
c)
Multitrait-Multimethod Matrix (MTMM) MMTM merupakan prosedur yang dapat digunakan untuk menganalisis
hubungan dan menentukan pola antar data dari sebuah tes (Osterlind, 2010). Dasar pemikiran dalam proses validasi pada metode ini adalah bahwa validitas yang baik diperlihatkan dengan adanya korelasi yang tinggi diantara hasil pengukuran terhadap trait yang sama oleh beberapa metode yang berbeda (convergent validity) atau sebaliknya tidak adanya korelasi diantara hasil pengukuran terhadap beberapa trait yang berbeda sekalipun diukur menggunakan metode yang serupa (discriminant/divergent validity). Melalui MMTM, validitas kovergen dan diskriminan dapat diestimasi melalui matriks korelasi antara skor tes yang diuji dengan skor tes lainnya (Azwar, 2012). 4) Bukti Validitas berdasarkan Hubungan dengan Variabel Lain Bukti validitas yang selanjutnya dapat diuji dengan melihat korelasi antara variabel suatu tes dengan kriteria variabel tes lainnya yang relevan (Osterlind, 2010). Prosedur validitas tes berdasarkan kriteria menggunakan kriteria eksternal yang dijadikan dasar dalam pengujian validitas tes (Azwar, 2012). Pada umumnya, bukti validitas berdasarkan hubungan dengan variabel lain (kriteria) terbagi dalam dua tipe yakni bukti prediktif dan bukti konkruen (Osterlind, 2010). Bukti prediktif (predictive evidence) merupakan suatu indikator yang diperoleh dari perbandingan antara tes dengan kriteria tes itu sendiri di masa depan atau kriteria administrasi posttest (Oesterlind, 2010). Apabila tes bertujuan sebagai prediktor performa seseorang maka prosedur yang sesuai dalam mengestimasi validitas ialah pendekatan validitas prediktif (Azwar, 2012).
Universitas Sumatera Utara
19
Bukti lain dalam menginterpretasikan skor validitas pada sebuah tes yang tidak bertujuan dalam mengukur performa seseorang ialah bukti konkuren. Bukti konkuren (concurrent evidence) diperoleh dengan melihat kemiripan hasil pengukuran sebuah tes dengan hasil dari tes lain yang sejenis. Suatu tes yang tidak dirancang sebagai fungsi prediktor dan tidak merupakan hal yang tidak menjadi acuan tunggal dalam pengambilan keputusan pada situasi psikodiagnostik maka indikasi validitas yang dapat untuk ditegakkan adalah validitas konkruen (Azwar, 2012). Analisis validitas berdasarkan bukti konkruen dapat diperoleh dalam waktu yang sama ketika kedua skor dari suatu tes dengan kriteria tes lainnya telah dihitung. Hal inilah yang membedakan bukti konkruen dengan bukti prediktif. Koefisien validitas konkuren dapat dianalisis melalui komputasi koefisien korelasi (rxy) antara skor tes yang divalidasi dan skor tes kriteria. Koefisien korelasi adalah suatu statistika yang menunjukkan arah dan kekuatan hubungan antara variasi dua diskribusi skor (Azwar, 2012). Terdapat dua teknik dalam menghitung koefisien korelasi yaitu koefisien korelasi linear product-moment Pearson dan koefisien korelasi point-biserial (Azwar, 2012). 5) Bukti validitas berdasarkan Faktor Eksternal Sumber bukti yang terakhir dapat kita gunakan dalam mengestimasi nilai validitas tes ialah dengan melihat faktor-faktor eksternal. Faktor-faktor eksternal tersebut dapat berupa seperti tampilan alat tes atau validitas tampak (Osterlind, 2010). Asumsi dasar yang harus dipenuhi dalam validitas tampang ialah sebuah tes harus memiliki “look and feel” yang baik. Semakin baik tampilan sebuah tes maka semakin baik pula nilai validitasnya. Sebuah tes sebaiknya memiliki
Universitas Sumatera Utara
20
tampilan tes yang familiar atau tidak asing bagi responden. Meskipun validitas tampak tidak dapat menggunakan metode statistika dalam pengukurannya, namun validitas ini tetap merupakan sesuatu yang penting dan tidak boleh begitu saja di underestimate-kan oleh pengembang tes (Osterlind, 2010). c. Faktor-Faktor Yang Mempengaruhi Validitas Suatu nilai validitas akan berbeda jika keadaan, kondisi ataupun konteks administrasi
tes
berbeda
pula
(Coaley,
2010).
Osterlind
(2010)
juga
mengungkapkan bahwa suatu tes akan sangat rentan berubah terkait dengan adanya perubahan waktu. Coaley (2010) juga menambahkan beberapa faktor yang dapat mempengaruhi koefisien validitas tes, yakni: 1) Batasan jangkauan data Ketika sebuah kelompok tes bersifat homogen baik dari segi karakteristik usia, jenis kelamin, dan sebagainya maka sangat mungkin untuk terjadi munculnya jangkuan data yang terbatas. Azwar (2012) mengungkapkan bahwa jangkauan (sebaran) data yang terbatas (restriction of range) merupakan suatu keadaan dimana menyempitnya variasi skor dikarenakan berkurangnya jumlah subjek atau adanya homogenitas skor subjek yang diperoleh dari suatu tes. Kaufman (dalam Azwar, 2012) mengatakan bahwa apabila terjadi restriction of range maka koefisien korelasi (rxy) antara skor tes dengan suatu ukuran lain akan menjadi lebih rendah jika dibandingkan dengan korelasi skor tes yang tidak homogen. Adanya sebaran data yang terbatas maka akan mengakibatkan underestimate terhadap koefisien validitas yang sesungguhnya (Azwar, 2012).
Universitas Sumatera Utara
21
2) Pengurangan sampel (Sample attrition) Penyempitan jangkauan data juga berkaitan dengan pengurangan sampel (sample attrition) dalam suatu pengukuran. Adanya pengurangan sampel ketika mengestimasi skor validitas, akan mengakibatkan munculnya batasan jangkauan data yang akan mempengaruhi nilai validitas skor tes. 3) Ukuran sampel Ukuran sampel partisipan dapat mempengaruhi estimasi validitas sebuah alat tes. Semakin kecil sampel yang digunakan maka semakin besar jumlah kesalahan dalam pengukuran (error of measurement), begitu juga sebaliknya. Hal ini lah yang dapat mempengaruhi validitas sebuah alat tes. 4) Atenuasi Osterlind (2010) mengatakan bahwa efek atenuasi adalah menurunnya nilai sebuah statistik karena hilangnya asosiasi murni antar konstruk pengukuran. Azwar (2012) mengatakan bahwa efek atenuasi merupakan terbatasnya nilai koefisien validitas yang diperoleh karena adanya hasil komputasi dari koefisien korelasi liner yang disebabkan oleh rendahnya koefisien reliabilitas skor tes atau skor kriteria atau dipengaruhi oleh keduanya. 5) Kontaminasi kriteria Kriteria yang terkontaminasi adalah kriteria yang menyebabkan adanya bias dan variasi sebagai kriteria yang dapat mengakibatkan melemahnya nilai koefisien validitas dalam suatu pengukuran. Koefisien validitas akan lebih besar ketika dampak dari faktor-faktor lain yang tidak terkait dengan nilai pada kriteria diminimalkan (Mace, 1935; Thorndike, 1949; Smith, 1976 dalam Coaley 2010). Misalnya saja
orang yang memiliki pengalaman yang lebih besar terhadap
Universitas Sumatera Utara
22
pengerjaan suatu tes, akan cenderung menimbulkan bias ketika mengerjakan tes tersebut karena ada pengalaman sebelumnya ketika mengerjakan tes. Contoh lainnya dapat juga berasal dari kesalahan penguji atau interpreter (psikolog) dalam menafsirkan tanggapan responden terhadap tes atau kuisioner yang diberikan. 6) Kesalahan asumsi Ada asumsi yang mengatakan bahwa untuk menghasilkan koefisien validitas hubungan antara dua variable yang digunkan adalah asumsi linearitas. Asumsi ini memprediksikan koefisien validitas sebuah tes akan semakin tinggi apabila tes lain yang menjadi kriteria pengukuran semakin bisa mengukur suatu tes dengan akurat, dan sebaliknya. d. Interpretasi Koefisien Validitas Interpretasi koefisien validitas bersifat relatif artinya tidak ada aturan atau batasan universal yang mengarah pada angka minimal yang harus dipenuhi terkait dengan valid atau tidaknya suatu tes (Azwar, 2012). Sejauh mana suatu skor tes yang terkait
dapat
bermanfaat
dalam
pengambilan keputusan menjadi
pertimbangan penting dalam interpretasi koefisien validitas (Azwar, 2012). Cronbach (1970, dalam Azwar, 2012) mengatakan bahwa sebuah tes yang berfungsi untuk memprediksi hasil suatu prosedur seleksi dapat dikatakan memberikan kontribusi yang baik jika koefisien validitas berkisar antara 0,3 sampai dengan 0,5. Sedangkan menurut Murphy dan Davidshofer (2005), jika dikaji secara teoritis, maka koefisien validitas berada dalam rentang 0 sampai dengan 1,0. Namun asumsi ini tidak realistis, karena pada kenyataannya sangat sulit untuk mendapatkan nilai validitas di atas 0,5 dalam suatu pengukuran. Hal tersebut juga didukung dengan pertanyaan yang diungkapkan oleh Kaufman,
Universitas Sumatera Utara
23
Allen dan Yen serta Zwick (dalam Azwar 2012) yang menyatakan bahwa suatu koefisien validitas dapat dipengaruhi oleh efek restriksi sebaran skor dan efek atenuasi. Dengan demikian, pertimbangan mengenai tujuan atau fungsi skor yang diperoleh, heterogenitas skor kelompok sampel, ukuran sampel, seberapa kritis makna skor bagi subjek yang akan dites dan pertimbangan lainnya yang relevan menjadi salah satu faktor dalam memberikan interpretasi terhadap besarnya koefisien validitas yang diterima (Azwar, 2012). 2. Reliabilitas a. Definisi Reliabilitas Osterlind (2010) mendefinisikan istilah reliabilitas sebagai ketepatan, keakuratan, atau kekonsistenan dari hasil-hasil pengukuran berulang. Istilah reliabilitas dapat mengacu pada dua hal yakni mengungkap ketelitian dalam beberapa ataupun seluruh instrumen pengukuran mental dan telah terspesifikasi dalam pengukuran standar error (SEM). Azwar (2012) juga mendefinisikan konsep reliabilitas sebagai sejauhmana hasil dari suatu proses pengukuran dapat dipercaya (Azwar, 2012). Selain itu, Murphy dan Davidshofer (2005) menjelaskan istilah reliabilitas yakni sebagai suatu bentuk konsistensi dari skor tes yang sangat penting dalam menentukan apakah tes dapat memberikan suatu pengukuran yang baik. Mengacu pada teori tes klasik (classical test theory-CTT), Lord dan Novick (1968, dalam Osterlind, 2010) mengemukakan konsep reliabilitas sebagai korelasi kuadrat antara skor tampak (observed score) dan skor murni (true score). Indeks reliabilitas dapat dievaluasi dengan melihat konsistensi dari pengukuran
Universitas Sumatera Utara
24
semakin konstan pengukuran selama pengulangan administrasi, semakin tinggi reliabilitasnya. Sebuah tes dapat dikatakan memiliki nilai reliabilitas yang baik, jika suatu tes tersebut dilakukan pengujian berulang (paralel) maka skor yang dihasilkan akan sama (konsisten) dari hasil tes sebelumnya (Osterlind, 2010). Pengukuran berulang yang dilakukan harus independen dan melibatkan variabel yang parallel atau sama. Pengukuran yang dilakukan hanya sekali belum tentu dapat memberikan informasi mengenai konsistensi dan tingkat reliabiltasnya, reliabilitas hanya akan terbukti setelah dilakukan pengukuran beberapa kali. Namun reliabilitas tidak bersifat universal atau pasti. Dengan kata lain, banyak perspektif tentang reliabilitas, tergantung pada definisi tentang eror itu sendiri, dan konten domain yang telah didefinisikan sebelumnya (Osterlind, 2010). Tes yang memiliki nilai reliabilitas yang baik ketika tes tersebut dilakukan pengujian berulang maka semakin sedikit nilai eror yang muncul dalam skor tesnya (Osterlind, 2010). Murphy dan Davidshofer (2005) mendefinikan istilah dari eror dalam pengukuran (error measurement) sebagai perbedaan antara skor yang didapat dalam tes dengan kesesuaian pada true score. Eror yang muncul dalam pengukuran biasanya berasal dari beberapa aspek misalnya eror muncul dalam analisis tes yang tidak akurat, atau adanya faktor situational yang terjadi saat berlangsungnya tes, dan sebagainya. Kaplan dan Saccuzzo (2005) membaginya kedalam 4 sumber error pengukuran, yakni waktu sampling, item sampling, konsistensi internal, dan perbedaan pandangan observer. Tujuan dari teori reliabilitas adalah untuk memperkirakan kesalahan dalam pengukuran dan untuk menyarankan cara – cara tes memperbaiki sehingga
Universitas Sumatera Utara
25
kesalahan dapat diminimalkan Beberapa peneliti menggunakan metode yang berbeda dalam mengestimasi nilai reliabilitas untuk mendeskripsikan berbagai sumber eror yang ada. b.
Metode Estimasi Reliabilitas Tujuan dari estimasi reliabilitas tes ialah untuk menentukan seberapa
banyak variabilitas dalam skor tes yang disebabkan oleh adanya baik kesalahan dalam pengukuran maupun variabilitas yang disebabkan oleh skor murni (Murphy dan Davidshofer, 2005). Dalam pengukuran mental, reliabilitas dapat diestimasi pada beberapa pengukuran berulang yang sifatnya paralel. Pengukuran paralel awalnya, dilakukan dengan mengkondisikan peserta tes yang sama untuk mengikuti beberapa administrasi tes yang identik. Namun kenyataanya, metode ini sulit dilakukan sehingga para ahli psikometri membentuk beberapa cara untuk menghasilkan pengukuran yang paralel agar dapat mengestimasi nilai reliabilitas (Osterlind, 2010). 1) Metode tes-ulang (Test-retest methods) Metode tes-retest merupakan metode sederhana yang pertama kali digunakan untuk mengestimasi nilai reliabilitas bentuk paralel. Salah satu cara yang masuk akal untuk memperoleh pengukuran paralel adalah menggunakan tes yang sama
dua
kali
dengan
administrasi
berulang.
Tes
yang sama
diadministrasikan dua kali pada responden namun pada waktu yang berbeda diasumsikan sebagai metode test-retest (Osterlind, 2010). Metode test-retest bertujuan untuk menilai sejauh mana skor tes konsisten dari satu administrasi tes ke tes yang berikutnya (Murphy & Davidshofer, 2005).
Universitas Sumatera Utara
26
Murphy dan Davidshofer (2005) menyusun beberapa prosedur dalam menggunakan metode test-retest ini, antara lain meliputi: (a) Mengadministrasikan tes (tes pertama dan tes kedua) secara kelompok atau individual, (b) Memberi instruksi dan perlakuan yang sama
kelompok yang sama pada
beberapa waktu yang berbeda, (c) Mengkorelasikan serangkaian skor tes pertama dengan tes yang kedua. Estimasi metode test-retest dilakukan dengan cara menghitung korelasi antara distribusi skor subjek dari kedua pemberian tes. Suatu tes yang reliabel tentu akan menghasilkan distribusi yang sama apabila diberikan dua kali pada waktu yang berbeda. Semakin besar variasi perbedaan skor subjek antara kedua tes berarti semakin sulit untuk mempercayai bahwa tes itu memberikan hasil ukur yang konsisten (Azwar, 2012). Azwar (2012) menyatakan koefisien reliabilitas yang diperoleh sangat rentan terhadap perubahan. Perubahan tersebut sangat mungkin dialami oleh subjek karena adanya jeda antara pemberian tes pertama dengan tes yang kedua. Oesterlind (2010) menyatakan bahwa sebuah tes yang bahkan sudah dikondisikan sama antara administrasi tes pertama dengan tes yang kedua tidak dapat menjamin secara tepat apakah tes tersebut sudah merupakan salah satu bentuk tes paralel yang baik, karena pada dasarnya peserta yang diuji cenderung akan berubah pada beberapa hal diantara sesi pengujian, dan kondisi adminstrasi tidak dapat diduplikasi dengan sempurna. Adanya perubahan kondisi subjek, ingatan subjek tentang jawaban tes sehingga menimbulkan proses latihan, serta adanya proses rejeksi atau penolakan dari subjek merupakan contoh dari munculnya carry-over
Universitas Sumatera Utara
27
effects dalam sebuah pengukuran paralel (Azwar, 2012). Meskipun demikian, metode test-retest dianggap cukup memadai untuk digunakan dalam perhitungan nilai reliabilitas skor tes sehari-hari. 2) Metode Bentuk Alternatif (Alternate Forms) Apabila pengulangan administrasi tes (test-retest) tidak mungkin dilakukan, maka estimasi reliabilitas dapat dilakukan dengan memberikan dua tes paralel sekaligus pada responden yang sama dan di waktu yang sama juga (Azwar, 2012). Istilah lain yang sering digunakan untuk menggambarkan metode ini ialah koefisien ekuivalen atau koefisien reliabilitas bentuk alternatif (Oesterlind, 2010). Asumsi dasar dari metode bentuk paralel adalah mengembangkan tes yang memiliki aitem yang ekuivalen, misalnya indeks kesukaran aitem setara. Korelasi di antara kedua tes tersebut kemudian akan digunakan untuk mengestimasi reliabilitas tes (Osterlind, 2010). Dalam pelaksanaanya, kedua tes dapat digabungkan terlebih dahulu sehingga seakan-akan merupakan satu bentuk tes. Setelah selesai, barulah aitem pada masing-masing tes dipisahkan kembali untuk memberikan skor pada masing-masing tes sehingga diperoleh dua distribusi skor. Untuk membuat dua tes menjadi paralel satu sama lain, diperlukan penyusunan aitem tes yang berasal dari spesifikasi yang sama, seperti tujuan alat ukurnya, batasan objek ukur, banyaknya aitem, format aitem, sampai kepada parameterparameter aitemnya. Artinya tes yang disediakan harus memiliki tujuan ukur dan isi aitem yang setara baik secara kuantitas maupun kualitasnya (Azwar, 2012). Tes yang paralel, harus menghasilkan skor rata-rata (means), varians dan koefisien korelasi yang setara. Apabila kedua tes telah berbentuk paralel, maka tes tersebut akan menghasilkan reliabilitas yang berkorelasi tinggi jika
Universitas Sumatera Utara
28
menghasilkan skor-tampak yang sama pada setiap subjek yang pengukuran (Azwar, 2012) Murphy dan Davidshofer (2005) menyusun beberapa prosedur yang dilibatkan dalam metode bentuk alternatif ini, yakni antara lain: (a) Memberikan salah satu bentuk tes (misalnya, tes A) untuk sekelompok individu; (b) Setelah selang beberapa waktu, berikan alternatif bentuk tes yang sama (misalnya, tes B) untuk kelompok/individu yang sama; (c) Menghubungkan nilai pada tes A dengan skor tes B. Korelasi antara nilai pada bentuk dua alternatif yang akan digunakan untuk memperkirakan reliabilitas skor tes. Kelebihan dari metode ini ialah, dapat mengurangi carry-over yang merupakan
kelemahan
dari
metode
test-retest. Rentang waktu antara tes
pertama dan tes kedua juga tidak menjadi peranan penting. Namun perlu diingat, sesingkat-singkatnya waktu saat pemberian tes satu dengan tes paralel lainnya, tetap saja kemungkinan akan terjadi peningkatan performa subjek terhadap suatu tes yang diberikan karena adanya efek pengalaman atau latihan dari tes sebelumnya. Selain itu, kelelahan pada subjek juga mungkin saja dapat muncul selama pengujian yang dapat mempengaruhi hasil skor dari tes tersebut. Untuk mengatasi kelemahan tersebut, menyatukan semua item dari dua tes paralel sedemikian rupa sehingga membentuk seakan – akan hanya satu tes saja. Dan yang menjadi tantangan besar dalam metode ini ialah sulitnya menyusun item-item yang berasal dari dua tes paralel seolah-olah menjadi satu tes saja, tentu saja biaya yang
Universitas Sumatera Utara
29
dibutuhkan juga cukup besar. Formula estimasi yang digunakan pada metode ini ialah formula koefisien korelasi product moment kedua distribusi skor 3) Metode penyajian tunggal (single triad/internal consistency methods) Metode selanjutnya yang dapat digunakan untuk mengestimasi reliabilitas tes ialah metode penyajian tunggal (konsistensi intenal). Metode ini muncul karena tidak semua tes mempunyai bentuk alternatifnya. Untuk tes yang hanya mempunyai satu bentuk saja, maka pengukuran paralel dapat dilakukan dengan membagi tes menjadi dua bagian yang mana setiap bagian dianggap sebagai satu pengukuran. Estimasi reliabilitas yang dilakukan dengan cara ini menghasilkan reliabilitas split-half (Osterlind, 2010). Azwar (2012), perhitungan nilai koefisien reliablitas dalam metode ini dilakukan terhadap skor item dalam tes bukan terhadap skor tes secara keseluruhan, sehingga tes setidaknya akan dibelah menjadi dua bagian kelompok item tes yang memiliki keseimbangan komposisi itemnya baik dari segi aspek isi maupun karakter-karakter itemnya. Tujuan dari metode ini ialah untuk melihat konsistensi antar bagian atau antar item dalam sebuah tes. Untuk melihat keseimbangan antara belahan item tes yang satu dengan belahan item tes yang lain, dapat dilakukan perhitungan terhadap nilai analisis korelasi, analisis varians dan kovarians diantara item dan belahan item, dan sebagianya (Azwar, 2012). Pembagian tes menjadi dua bagian dapat dilakukan dengan beberapa cara yaitu membagi dengan angka genap dan ganjil atau dengan membagi dua tes berdasarkan letak awal dan akhir dari isi tes. Kelemahan dari penggunaan cara ini adalah memperpendek panjang tes yang juga mempengaruhi nilai reliabilitas Adapun beberapa formula (rumus) yang dapat digunakan dalam mengestimasi
Universitas Sumatera Utara
30
koefisien reliabilitas pada metode konsistensi intenal, yaitu Formula SpearmanBrown, Koefisien Reliabilitas Kuder-Richardson, dan Koefisien Alpha (Osterlind, 2010). c. Faktor-Faktor yang Mempengaruhi Reliabilitas Menurut Osterlind (2010), terdapat tiga faktor yang mempengaruhi hasil reliabilitas, yaitu: 1) Efek atenuasi Koefisien reliabilitas selalu lebih rendah daripada indeks reliabilitas. Hal ini dikarenakan terjadinya atenuasi. Koefisien reliabilitas yang membandingkan skor tampak dari pengukuran pertama dan kedua mengalami penyempitan karena tidak mengasosiasikan skor sebuah tes dengan skor murninya (Osterlind,2010). 2) Efek dari panjang tes pada estimasi reliabilitas Panjang tes mengacu pada banyaknya item dalam tes (Azwar, 2012). Semakin banyak item dalam suatu tes, semakin tinggi koefisien dan semakin panjang suatu tes maka manifestasi skor reliabilitas juga semakin besar. Item yang membentuk tes memiliki karakteristik-karakteristik tertentu yang dibentuk menjadi satu tes. Sehingga semakin banyak item yang menggambarkan karakteristik tersebut, akan semakin rinci gambaran konstruk seutuhnya (Osterlind, 2010). 3) Heterogenitas kelompok Hal lain yang menjadi pertimbangan saat mengestimasi skor reliabilitas pengukuran ialah variability within a grup. Semakin tinggi koefisien reliabilitas suatu tes menunjukkan semakin bervariasinya (heterogen) pula suatu kelompok dalam suatu tes. Hal ini dikarenakan kelompok yang memenuhi asumsi
Universitas Sumatera Utara
31
heterogenitas cenderung memiliki pilihan-pilihan aitem yang berbeda-beda pula. Sedangkan, ketika setiap orang memiliki pilihan-pilihan aitem yang sejenis (tidak ada perbedaan), maka alat ukur tersebut memiliki koefisien reliabilitas 0,0 (Murphy & Davidshofer, 2005). d. Interpretasi Koefisien Reliabilitas Sama seperti halnya dengan validitas, interpretasi koefisien reliabilitas juga bersifat relatif. Besarnya koefisien reliabilitas tergantung pada kepuasan penilai atau pemakai tes itu sendiri terhadap skor yang diperoleh dari hasil komputasi analisis reliabilitas terhadap suatu tes, apakah hasil yang didapat sudah sesuai dengan tujuan atau fungsi ukurnya (Azwar, 2012). Terdapat dua hal yang perlu dipahami ketika hendak menginterpretasikan tingginya koefisien reliabilitas suatu alat ukur, pertama koefisien reliabilitas yang dihasilkan dari sebuah tes pada suatu kelompok tertentu akan menghasilkan hasil yang berbeda ketika diterapkan pada kelompok atau situasi yang berbeda. Dan kedua, koefisien reliabilitas hanya mengindikasikan
besarnya
inkonsistensi
skor
hasil
pengukuran,
bukan
menyatakan secara langsung apa penyebabnya (Azwar, 2012). Secara teoritik, koefisien reliabilitas berkisar antara 0 sampai 1, namun secara empirik koefisien reliabilitas tidak pernah mencapai 1. Artinya terdapat ketidakkonsistenan skor antara dua tes yang paralel yang disebabkan oleh eror yang mempengaruhi performa subjek dalam mengikuti tes atau perbedaan antara skor tampak dan skor murni subjek (Crocker dan Algina, 2008). Wells dan Wollack (2003 dalam Azwar, 2012) menyatakan bahwasanya suatu tes standar yang memiliki nilai taruhan yang tinggi (high-stakes) dan disusun secara professional maka koefisien reliabilitas minimal 0.90. Sedangkan
Universitas Sumatera Utara
32
untuk tes yang tidak begitu tinggi nilai taruhannya, maka setidaknya minimal besarnya koefisien relibilitas yang dicapai sebesar 0.85 sampai dengan 0.80. Dan apabila tes tersebut digunakan oleh para guru di kelasnya maka setidaknya koefisien relibilitas yang dimiliki sebesar 0.70 atau lebih. Penafsiran terhadap koefisien reliabilitas dapat juga dilakukan melalui penafsiran standar eror pengukuran (SEm). Semakin tinggi koefisien reliabilitas suatu tes, maka kemungkinan kesalahan yang terjadi akan semakin kecil. Murphy dan Davidshofer (2005) menjelaskan bahwa makna tinggi atau rendahnya koefisien reliabilitas tergantung pada tipe dari tes yang dikategorikan sebagai berikut: Tabel 1 Kategori Estimasi Koefisien Reliabilitas Berdasarkan Perbedaan Tipe Tes Nilai Estimasi Tipe Tes Interpretasi Reliabilitas 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50
Eror pengukuran hampir tidak berpengaruh Tes kelompok standar inteligensi Tes standar prestasi Kelompok tes ganda Skala rating
Reliabilitas tinggi ke sedang
pilihan Reliabilitas sedang ke rendah
Reliabilitas rendah Beberapa projektif
pengukuran
Skor murni dan eror pengukuran seimbang pada skor tes
Universitas Sumatera Utara
33
3. Indeks Kesukaran Aitem dan Indeks Diskriminasi Aitem a. Indeks Kesukaran Aitem Rasio antara jumlah subjek yang menjawab aitem dengan benar dari total keseluruhan aitem jawaban dapat disebut sebagai indeks kesukaran aitem (Murphy dan Davidshofer, 2005). Banyaknya peserta tes yang berhasil menjawab dengan benar menjadi penentu dari kesukaran aitem itu sendiri. Semakin banyak peserta tes yang menjawab dengan benar, maka semakin mudah aitem dari tes tersebut. Begitu pula sebaliknya, jika semakin sedikit peserta menjawab dengan benar, maka semakin sulit aitem dari tes tersebut (Azwar, 2007). Indeks kesukarakan aitem sangat berkaitan dengan tujuan dari alat tes itu sendiri (Azwar, 2007). Misalnya saja jika suatu alat tes bertujuan untuk mengukur kemampuan seseorang pada proses seleksi masuk khususnya dalam bidang pendidikan, maka diperlukan tes yang memiliki nilai p yang rendah atau aitem yang sulit. Namun, uji kesukaran aitem dengan rentang skor p = 0.0 sampai dengan 0.1 tidak berpengaruh terhadap perbedaan skor yang diperoleh antar individu dan juga tidak memiliki efek apapun terhadap uji reliabilitas atau validitas dari suatu tes (Murphy dan Davidshofer, 2005).
Gregory (2004)
mengkategorikan nilai p sebagai berikut: Tabel 2 Kategori Batasan Nilai p No P 1 p < 0.3 2 0.3 < p < 0.7 3 p > 0.7
Kategori Sulit Sedang Mudah
Universitas Sumatera Utara
34
b. Indeks Diskriminasi Aitem Suatu aitem yang baik tentunya harus dapat membedakan antara subjek yang mampu mengerjakan tes dengan baik dan subjek yang tidak mampu mengerjakan tes dengan baik. Hal itulah yang disebut sebagai daya diskriminasi aitem (Murphy dan Davidshofer, 2005). Secara statistik dalam mengukur diskriminasi kekuatan dari suatu aitem salah satunya indeks diskriminasi aitem. Secara sederhana, indeks diskriminasi aitem dapat diartikan sebagai suatu nilai yang dapat menunjukkan perbedaan dalam proporsi jumlah subjek yang menjawab aitem dengan benar antara kelompok yang memiliki kemampuan tinggi dengan kelompok yang memiliki kemampuan rendah (Azwar, 2007). Sama halnya dengan indeks kesukaran aitem, indeks diskriminasi aitem juga berada di rentang 0.0 sampai dengan 1.0. Namun, pada indeks diskriminasi aitem, apabila nilai yang diperoleh semakin besar yakni mendekati angka 1.0 maka aitem yang ada mampu membedakan antara subjek yang menguasai materi dengan yang tidak menguasai materi yang diujikan. Begitu pula sebaliknya, semakin kecil angka yang didapat (semakin mendekati 0) maka semakin tidak jelaslah fungsi dari aitem yang bersangkutan dalam kata lain, aitem tersebut tidak dapat membedakan mana subjek yang memiliki kemampuan mana yang tidak memiliki kemampuan (Azwar, 2007). Ebel (1979, dalam Azwar, 2007) memberikan suatu panduan dalam evaluasi indeks diskriminasi aitem, yaitu : Tabel 3 Evaluasi Indeks Diskriminasi Aitem D Evaluasi ≥ 0.4 Bagus sekali 0.3 – 0.39 Bagus, tidak membutuhkan revisi aitem 0.2 – 0.29 Kurang baik dan memerlukan revisi aitem < 0.2 Jelek dan item harus dibuang
Universitas Sumatera Utara
35
C. Karakteristik Psikometri Tes Army Alpha 1 Tes Army Alpha merupakan tes inteligensi kelompok yang pertama untuk orang dewasa. Tes Army Alpha 1 adalah tes kemampuan inteligensi yang mengukur kemampuan daya tangkap, konsentrasi, pemahaman dan kepatuhan terhadap instruksi. Saat ini, tes Army Alpha 1 lebih sering digunakan dalam hal perekrutan calon karyawan baru, mendukung skor data yang telah diperoleh dari tes psikologi lainnya dan digunakan dalam beberapa penelitian ilmiah. Suatu tes dapat dikatakan berhasil menjalankan fungsi ukurnya jika mampu memberikan hasil ukur yang cermat dan akurat (Azwar, 2012). Oleh karena itu, tes Army Alpha 1 harus memiliki kualitas yang baik sebagai alat tes. Kualitas alat tes sangat bergantung pada kualitas aitem yang disusun dalam sebuah tes. Kualitas aitem setidaknya dapat dilihat dari dua kriteria yakni indeks kesukaran aitem dan indeks diskriminasi aitem (Azwar, 2012). Analisis terhadap kualitas aitem dapat memberikan informasi mengenai karakteristik psikometri termasuk reliabilitas dan validitas tes (Murphy dan Davidshofer, 2005). Data mengenai karakteristik psikometri tes Army Alpha 1 yang terakhir ditemukan berasal dari pengujian validitas dan reliabilitasnya pada tahun 1980-an. Artinya sudah lebih dari 30 tahun yang lalu tes tersebut dilakukan pengujian terkait analisis psikometrisnya. Seperti halnya yang telah diungkapkan oleh Osterlind (2010), bahwa validitas dan reliabilitas akan sangat rentan berubah apabila sebuah tes digunakan pada waktu dan konteks yang berbeda. Jika dilihat dari waktu penggunaannya, tes Army Alpha 1 sendiri patut diuji kembali terkait
Universitas Sumatera Utara
36
dengan
kelayakan fungsi ukurnya mengingat bahwa tes tersebut masih saja
digunakan hingga saat ini. Selain terkait dengan waktu yang sudah lama tidak dievaluasi, ternyata tes Army Alpha juga sudah banyak beredar di internet baik dari sisi prosedur, bentuk tes, trik menjawab hingga pada kunci jawaban tes itu sendiri. Kemudahan dalam mengakses tes ini di internet memungkinkan para peserta tes akan mempelajari isi dari tes Army Alpha 1 sebelum mengikuti tes. Kondisi tersebut tentunya akan mempengaruhi besarnya skor yang dihasilkan dari tes Army Alpha 1. Kemungkinan yang terjadi apabila peserta mempelajari isi tes terlebih dahulu sebelum mengikuti tes ialah tes tersebut akan dianggap mudah sehingga banyak peserta dapat menjawab tes tersebut dengan benar. Hal ini tentu saja berkaitan dengan indeks kesukaran aitem (p). Semakin banyak peserta tes yang menjawab dengan benar, maka dapat dikatakan semakin mudah aitem dalam tes tersebut. Padahal jika kita melihat tes Army Alpha 1 merupakan tes inteligensi yang seharusnya disusun dari aitem yang mudah, sedang hingga pada aitem yang sulit. Azwar (2012) mengatakan bahwa secara umum, nilai p dapat dikatakan baik jika berada pada skor 0.5. Implikasi dari aitem yang tergolong mudah dapat mempengaruhi indeks diskriminasi aitem. Aitem yang tergolong mudah tentu saja dapat dijawab dengan benar oleh semua kelompok sehingga aitem tersebut tidak dapat membedakan antara kelompok yang memiliki kemampuan tinggi dengan kelompok yang memiliki kemampuan rendah. Pada tes Army Alpha 1 yang merupakan bagian dari tes inteligensi, apabila aitem pada tes tersebut tergolong mudah, maka aitem tersebut tidak mampu membedakan mana subjek yang benar-benar memiliki
Universitas Sumatera Utara
37
kemampuan dan mana yang tidak memiliki kemampuan sehingga dapat dikatakan daya indeks diskriminasi aitem pada tes ini tergolong kurang baik. Azwar (2012) berpendapat bahwa apabila nilai yang diperoleh semakin besar yakni mendekati angka 1.0 maka aitem yang ada mampu membedakan antara subjek yang menguasai materi dengan yang tidak menguasai materi yang diujikan. Indeks kesukaran aitem juga akan memiliki efek yang mendalam terhadap variabilitas skor tes (Murphy dan Davidshofer, 2005). Fenomena kebocoran soal yang terjadi pada tes Army Alpha 1 memungkinkan banyaknya peserta menjawab dengan benar sehingga tidak adanya variasi data yang dihasilkan oleh skor tes. Hal ini tentu akan mengganggu besarnya koefisien reliabilitas menjadi rendah. Estimasi besarnya koefisien reliabilitas pada tes Army Alpha 1 dilakukan dengan menganalisis konsistensi antar-aitem dalam tes tersebut. Sehingga komputasi yang akan digunakan untuk menguji koefisien reliabilitas tes Army Alpha 1 dilakukan dengan menghitung skor menggunakan rumus KR-20 atau KR21. Hal tersebut dikarenakan bahwa tes Army Alpha 1 hanya terdiri dari sedikit item dan bersifat dikotomi. Penentuan menggunakan formula KR-20 atau KR-21 pada tes Army Alpha 1 akan diputuskan ketika telah diketahui tingkat kesukaran item dalam tes apakah bersifat homogen atau tidak. Tes Army Alpha 1 sebagai tes inteligensi dikatakan berkualitas baik apabila memiliki nilai reliabilitas minimal 0.90. Hal ini berdasarkan nilai koefisien reliabilitas minimum untuk tes psikologi yang dikemukakan oleh Coaley (2010). Besarnya koefisien reliabilitas tentu juga akan mempengaruhi koefisien validitas suatu tes. Apabila nilai koefisien reliabilitas tes rendah maka akan melemahkan nilai koefisien validitas tes yang disebut dengan efek atenuasi.
Universitas Sumatera Utara
38
Analisis koefisien validitas pada tes Army Alpha 1 dibuktikan berdasarkan struktur internal dengan menggunakan metode analisis faktor konfirmatori (CFA) melalui struktural equation model (SEM). Cronbach (dalam Azwar, 2012) mengatakan besarnya koefisien validitas yang baik dan dianggap memuaskan berada pada rentang 0.30 sampai dengan 0.50 atau lebih.
Universitas Sumatera Utara
BAB III METODE PENELITIAN
A. Jenis Penelitian Penelitian yang berjudul analisis karakteristik psikometri tes Army Alpha 1 ini menggunakan metode penelitian kuantitatif deskriptif. Metode penelitian kuantitatif merupakan suatu penelitian yang menekankan pada data berupa angkaangka yang diolah dengan menggunakan metode statistika dan melibatkan jumlah sampel yang relatif besar (Azwar, 2010). Pada penelitian ini, peneliti menggunakan dan mengolah data yang diperoleh dari respon subjek yang terekam dalam dokumentasi biro-biro psikologi. Data tersebut diperoleh dalam bentuk angka dan kemudian diolah dengan menggunakan metode statistika. Penelitian kuantitatif ini tergolong ke dalam penelitian deskriptif yang mana seperti yang diungkapkan oleh Azwar (2010) bahwa penelitian deskriptif merupakan data penelitian dianalisis dan hasilnya disajikan secara sistematik sehingga kesimpulan penelitian lebih mudah ditarik. Dikatakan sebagai penelitian kuantitatif deskriptif karena penelitian ini mendeskripsikan atau menggambarkan kualitas dari suatu tes Army Alpha 1 sebagai tes inteligensi yang mengukur kemampuan konsentrasi dan daya tangkap untuk menerima dan mengikuti arah instruksi dengan cepat dan tepat. B. Subjek Penelitian Subjek dalam penelitian ini merupakan respon lembar jawaban tes Army Alpha subtes 1 yang telah diisi oleh para peserta tes yang dilayani oleh biro-biro psikologi di Kota Medan, para peserta tes tersebut merupakan lulusan SMP, SMA,
39 Universitas Sumatera Utara
40
D1, D3, S1 dan S2 perguruan tinggi yang mengikuti seleksi masuk kerja di beberapa perusahaan atau institusi tertentu. C. Data yang Digunakan Data yang digunakan dalam penelitian ini adalah data yang berasal dari dokumentasi biro-biro psikologi di Kota Medan yang berupa respon dari responden yang mengikuti tes Army Alpha 1 dalam periode tahun 2016-2017. Jumlah keseluruhan data respon jawaban yang digunakan peneliti sebanyak 412 lembar responden tes Army Alpha subtes 1. D. Persiapan Izin Pengambilan Data dan Prosedur Pelaksanaan Penelitian 1. Persiapan Izin Pengambilan Data Adapun beberapa langkah yang dilakukan dalam mempersiapkan izin untuk pengambilan data adalah sebagai berikut: a) Mengurus surat permohonan izin di bagian Umum dan Eksperimen (Umeks) Fakultas Psikologi Universitas Sumatera Utara yang ditujukan kepada birobiro psikologi yang terkait untuk melakukan pengambilan data. b) Mengajukan surat permohonan izin penelitian kepada biro-biro psikologi di Kota Medan yang dimaksudkan untuk mengambil data penelitian yang berupa lembar jawaban tes Army Alpha 1 yang telah direspon oleh responden. 2. Pelaksanaan Penelitian Pelaksanaan dalam penelitian ini meliputi beberapa prosedur yang akan dilakukan peneliti yakni penyusunan proposal penelitian, pengambilan data, menganalisis data (karakteristik psikometri) yang dihasilkan dari pelaksanaan tes dan membahas hasil yang diperoleh serta membuat kesimpulan dan saran.
Universitas Sumatera Utara
41
a. Penyusunan Proposal Penelitian Penelitian ini diawali dengan merancang sebuah proposal penelitian. Proposal penelitian ini disusun guna mengarahkan penelitian menjadi sistematis. Penyusunan proposal penelitian yang dirancang ini terdiri dari bab I (berisi pendahuluan), bab II (berisi tinjauan pustaka), dan bab III (yang berisi metode penelitian). b. Pengambilan Data Metode pengumpulan data pada pengujian karakteristik psikometri dalam penelitian ini dilakukan dengan menggunakan data yang berasal dari biro-biro psikologi di Kota Medan. Data yang digunakan dalam penelitian ini berupa respon subjek pada lembar jawaban tes Army Alpha subtes 1. Respon subjek tersebut akan diskor satu (1) jika benar dan nol (0) jika respon salah. Penelitian ini akan dilaksanakan ketika data-data, yaitu lembar jawaban Army Alpha 1, telah berhasil dikumpulkan dari biro-biro psikologi tersebut Setelah data berhasil dikumpulkan, kemudian hasil respon yang tertera di lembar jawaban diskoring dan kemudian dianalisis kualitas validitas dan reliabilitas untuk mengetahui kelayakan dari Army Alpha subtes 1 sebagai pengukuran tes inteligensi. c. Pengujian Karakteristik Psikometri Data-data dalam penelitian ini dianalisis menggunakan metode analisis faktor konfirmatori untuk menguji validitas bukti struktur internal, sedangkan reliabilitasnya diuji dengan menggunakan pendekatan konsistensi internal dengan formula Kuder-Ricahardson 20 (KR-20). Selain itu, dalam penelitian ini juga akan dilakukan analisis terhadap indeks kesukaran aitem dan indeks diskriminasi aitem.
Universitas Sumatera Utara
42
Analisis ini akan dilakukan dengan bantuan beberapa program komputer, seperti Microsoft Excel, Iteman, Lisrel dan SPSS. d. Hasil dan Pembahasan Pada bagian ini akan dijelaskan bagaimana karakteristik psikometri alat ukur tersebut (tes Army Alpha 1) melalui analisis validitas struktur internal (konstrak), reliabilitas konsistensi internal, indeks kesukaran aitem, dan indeks diskriminasi aitem. Melalui analisis ini diharapkan akan diperoleh informasi mengenai kualitas kelayakan tes sebagai salah satu tes yang mengukur kemampuan konsentrasi yang merupakan bagian dari tes inteligensi. e. Kesimpulan dan Saran Bagian ini peneliti akan memaparkan kesimpulan akhir dari penelitian. Pada penelitian ini peneliti juga akan menjelaskan sejauhmana hasil penelitian dan kesimpulan tersebut dapat berlaku serta kelemahan maupun saran untuk penelitian selanjutnya. E. Program Komputer yang Digunakan Proses dalam menganalisis data yang dilakukan pada penelitian ini menggunakan bantuan beberapa program komputer. Terdapat beberapa program komputer yang digunakan sebagai alat bantu analisis karakteristik psikometri tes Army Alpha 1 antara lain sebagai berikut: 1. Microsoft Excel, digunakan untuk proses tabulasi data subjek, tabulasi jawaban dari lembar jawaban tes Army Alpha 1 dan analisis reliabilitas dari hasil pengukuran pada instrument tes Army Alpha 1. 2. Program Iteman, digunakan untuk analisis reliabilitas, indeks kesukaran aitem dan analisis indeks diskriminasi aitem.
Universitas Sumatera Utara
43
3. Lisrel, digunakan untuk analisis validitas dari hasil pengukuran pada instrumen tes Army Alpha 1. 4. SPSS, digunakan untuk koding jawaban pada lembar jawaban tes Army Alpha 1. F. Cara Analisis Data Proses analisis data dilakukan dalam beberapa tahapan, antara lain sebagai berikut: 1. Analisis Indeks Kesukaran Aitem Indeks kesukaran aitem akan dianalisis dengan menggunakan formula:
Keterangan: p = Derajat kesukaran aitem ni = Banyak peserta tes yang menjawab benar N = Banyak peserta tes yang menjawab aitem Idealnya, nilai p akan dianggap baik jika mendekati 0,5. Secara umum, aitem-aitem dalam tes inteligensi biasanya disusun dari tingkat yang tidak terlalu mudah ke tingkat yang tidak terlalu sulit. Komputasi analisis indeks diskriminasi aitem akan dibantu dengan menggunakan program Iteman. 2. Analisis Indeks Diskriminasi Aitem Indeks diskriminasi aitem akan dianalisis dengan menggunakan formula :
Universitas Sumatera Utara
44
Dimana, U = Jumlah peserta dari kelompok tinggi yang menjawab aitem dengan benar nu = Jumlah peserta dari kelompok tinggi L = Jumlah peserta dari kelompok rendah yang menjawab aitem dengan benar nl = Jumlah peserta dari kelompok rendah Pada penelitian ini, indeks diskriminasi aitem yang baik akan semakin mendekati 1. Berdasarkan tabel evaluasi Ebel, suatu aitem dikatakan memikili daya diskriminasi yang baik jika
≥ 0,4
(Crocker & Algina, 2005). Untuk
memudahkan perhitungan, peneliti menggunakan program Iteman. 3. Analisis Koefisien Validitas Koefisien validitas dalam penelitian ini akan diuji berdasarkan bukti struktur internal dengan analisis faktor konfirmatori (CFA). Metode yang digunakan pada penelitian ini bertujuan untuk melihat apakah skor yang diperoleh dari tes Army Alpha 1 masih berfungsi sesuai dengan tujuan tes Army Alpha 1 yang sudah disusun sebelumnya dan pola hubungan antara aitem dengan faktor. Analisis validitas pada penelitian ini akan dibantu dengan menggunakan program LISREL, adapun langkah-langkahnya adalah sebagai berikut (Wijanto, 2008): a) Spesifikasi Model Langkah pertama yang harus dilakukan adalah menspesifikasikan model penelitian yang akan dianalisis. Sebagai pengumpulan data, pada model ini instrumen akan disusun berdasarkan variabel teramati.
Universitas Sumatera Utara
45
b) Pengumpulan Data Pengumpulan data dilakukan melalui data sekunder, yang diperoleh dari database yang telah ada, dan sesuai dengan spesifikasi model yang sudah ditentukan. c) Pembuatan dan menjalankan program SIMPLIS pada program LISREL d) Analisis keluaran SIMPLIS pada program LISREL. Analisis terhadap hasil keluaran program SIMPLIS yang telah dijalankan terdiri dari : 1) Memeriksa adanya offending estimate, seperti negative error variance dan standardized loading factor yang nilainya lebih besar dari 1, tambahkan kalimat “Set Error Variance of (Name Variable) to 0.01” pada program SIMPLIS. 2) Menganalisis validitas model pengukuran dengan memeriksa nilai t dari standardized loading factor (λ) dari setiap variabel yang teramati dalam model ≥ 1,96 dan standardized loading factor (λ) variabel teramati ≥ 0,30. Penghapusan atau pengeluaran variabel dari model dapat berlaku jika tidak batas nilai minimum. 3) Menguji Goodness Of Fit (GOF) atau kecocokan keseluruhan model pengukuran dengan memeriksa nilai-nilai yang tertera dalam Tabel 4.
Universitas Sumatera Utara
46
Tabel 4 Perbandingan Ukuran Goodness of Fit Ukuran Goodness Tingkat Kecocokan yang Bisa Diterima of Fit (GOF) Goodness-of-Fit Nilai Berkisar antara 0-1 dengan nilai lebih tinggi Index (GFI) adalah lebih baik. GFI 0.90 adalah good-fit, sedangkan 0.80 ≤ GFI < 0.90 adalah marginal fit Adjusted Goodness Nilai berkisar antara 0-1 dengan nilai lebih tinggi of Fit (AGFI) adalah lebih baik. AGFI ≥ 0.90 adalah good-fit, sedangkan 0.80 ≤ AGFI < 0.90 adalah marginal fit. Root Mean Square Error of Approximation (RMSEA)
Rata-rata perbedaan per degree of freedom yang diharapkan terjadi dalam populasi dan bukan dalam sampel. RMSEA ≤ 0.08 adalah good fit, sedangkan RMSEA ≤ 0.05 adalah close fit.
4. Analisis Koefisien Reliabilitas Analisis koefisien reliabilitas akan dilakukan dengan menggunakan program Microsof Excel. Estimasi koefisien reliabilitas akan dilakukan dengan pendekatan konsistensi internal dengan menggunakan formula Kuder-Richardson 20 (KR-20) atau (KR-21). Penentuan menggunakan formula KR-20 atau KR-21 pada tes Army Alpha 1 akan diputuskan ketika telah diketahui tingkat kesukaran item dalam tes Army Alpha 1 apakah bersifat homogen atau tidak. Rumus KR-20 yang akan digunakan:
= koefisien reliabilitas = proporsi populasi yang menjawab aitem benar (atau aitem pertama). = proporsi populasi yang menjawab aitem salah (atau aitem kedua). = banyak aitem dalam tes. = varians skor tes.
Universitas Sumatera Utara
47
Sedangkan formula KR-21 dihitung dengan:
Koefisien reliabilitas akan dianggap baik jika nilai koefisien ≥ 0.90 (berdasarkan kategori Murpy & Davidshofer (2005)). Hal ini dikarenakan tes Army Alpha 1 merupakan tes inteligensi.
Universitas Sumatera Utara
BAB IV HASIL DAN PEMBAHASAN
Deskripsi terkait hasil dan pembahasan analisis karakteristik psikometri pada tes Army Alpha 1 akan dibahas dalam bab ini. Pengolahan data pada penelitian ini dilakukan dengan menggunakan bantuan program Iteman Version 3,00 MicroCAT I Testing, SPSS versi 21.0, Lisrel 8.30 for windows, dan Microsoft Excel. Hasil analisis karakteristik psikometri yang dideskripsikan pada bab ini akan meliputi indeks kesukaran aitem, indeks diskriminasi aitem, reliabilitas, dan validitas yang pembahasanya akan dikaitkan berdasarkan teori yang telah disampaikan sebelumnya. A. Gambaran Subjek Penelitian Subjek dalam penelitian ini berjumlah 412 orang. Subjek penelitian diambil dari populasi peserta tes Army Alpha yang memiliki tingkat pendikan mulai dari SMP hingga S2 perguruan tinggi. Data yang diperoleh dalam penelitian ini merupakan data sekunder yang dikumpulkan dari biro-biro psikologi di Kota Medan, sehingga sebagian besar data tidak memiliki data demografis subjek yang lengkap seperti usia dan jabatan/pekerjaan. Dengan demikian, informasi mengenai gambaran subjek yang dapat dijelaskan peneliti hanyalah berdasarkan jenjang pendidikannya saja. Gambaran subjek dalam penelitian ini dikategorisasikan dalam 6 kelompok tingkat pendidikan. Kategorisasi tersebut dapat dilihat pada Tabel 5 berikut ini:
48 Universitas Sumatera Utara
49
Tabel 5 Gambaran Subjek Penelitian Berdasarkan Tingkat Pendidikan No Jenjang Pendidikan Jumlah Persentase 1 SMP 17 4% 2 SMA 111 27% 3 D1 3 1% 4 D3 35 8% 5 S1 225 55% 6 S2 21 5% TOTAL 412 100% Berdasarkan kategorisasi tingkat pendidikan, diperoleh subjek yang berada didalam kategori tingkat pendidikan SMP sebanyak 17 orang dengan presentasi 4%, dalam kategori tingkat pendidikan SMA sebanyak 111 orang dengan presentasi 27%, dalam kategori tingkat pendidikan D1 hanya sebanyak 3 orang subjek dengan kategori 1%. Selanjutnya banyaknya subjek yang berada dalam kategori tingkat pendidikan D3 yakni 35 orang dengan presentasi 8%, untuk kategori tingkat pendidikan S1 sebanyak 225 orang subjek dengan presentasi 55%, dan 21 orang subjek dengan presentasi 5% yang berada dalam kategori tingkat pendidikan S2. B. Hasil Uji Karakteristik Psikometri 1. Indeks Kesukaran Aitem Hasil analisis indeks kesukaran aitem tes Army Alpha yang dilakukan dengan menggunakan bantuan program Iteman, diketahui bahwa dari 12 aitem yang dianalisis berdasarkan kategori indeks kesukaran dalam Gregory (2004) terdapat 4 aitem dalam kategori sulit (p < 0,3), 4 aitem dalam kategori sedang (0,3 < p < 0,7), dan 4 aitem dalam kategori mudah (p > 0,7). Hasil analisis indeks kesukaran aitem dapat dilihat pada Tabel 6 di bawah ini:
Universitas Sumatera Utara
50
Tabel 6 Hasil Analisis Indeks Kesukaran Aitem Tes Army Alpha 1 Aitem p Keterangan Aitem p Keterangan 1 0.854 Mudah 7 0.296 Sulit 2 0.561 Sedang 8 0.653 Sedang 3 0.748 Mudah 9 0.529 Sedang 4 0.757 Mudah 10 0.209 Sulit 5 0.743 Mudah 11 0.182 Sulit 6 0.670 Sedang 12 0.282 Sulit Berdasarkan hasil analisis indeks kesukaran pada tabel diatas maka deskripsi pengelompokan indeks kesukaran pada tes Army Alpha 1 akan disajikan dalam tabel dibawah ini. Tabel 7 Pengelompokan p Tes Army Alpha 1 P Kategori Nomor Aitem p < 0.3 Sulit 7, 10, 11 dan 12 0.3 < p < 0.7 Sedang 2, 6, 8 dan 9 p > 0,7 Mudah 1, 3, 4 dan 5
Jumlah Aitem 4 4 4
2. Indeks Diskriminasi Aitem Analisis indeks diskriminasi aitem juga dilakukan dengan menggunakan bantuan program Iteman. Hasil analisis indeks diskriminasi aitem yang dikeluarkan akan dilihat berdasarkan pada indeks diskriminasi Ebel (1979, dalam Azwar, 2007). Berikut hasil analisis indeks diskriminasi aitem tes Army Alpha 1, yang disajikan pada tabel dibawah ini Tabel 8 Hasil Analisis d Tes Army Alpha 1 Aitem D 1 0.430 2 0.605 3 0.623 4 0.637 5 0.618 6 0.594
Keterangan Bagus sekali Bagus sekali Bagus sekali Bagus sekali Bagus sekali Bagus sekali
Universitas Sumatera Utara
51
Sambungan tabel 8.. Aitem 7 8 9 10 11 12 Berdasarkan
D Keterangan 0.619 Bagus sekali 0.680 Bagus sekali 0.628 Bagus sekali 0.444 Bagus sekali 0.469 Bagus sekali 0.515 Bagus sekali tabel di atas, dapat diketahui bahwa proporsi besarnya
indeks diskriminasi pada semua aitem tes Army Alpha 1 berada di atas 0.4 yang artinya aitem-aitem tersebut masih memiliki daya diskriminasi yang baik sekali. Hal tersebut mengacu pada panduan Tabel Ebel (1979, dalam Azwar , 2007), menyatakan bahwa evaluasi besarnya indeks diskriminasi dikatakan bagus sekali jika mendekati nilai 0.4 atau lebih. 3. Validitas Konstruk Analisis validitas konstruk pada tes Army Alpha 1 dilakukan dengan metode analisis faktor konfirmatori (CFA) melalui bantuan program Lisrel 8.30. Dalam penelitian
ini, peneliti melakukan analisis dengan terlebih dahulu
memeriksa uji kecocokan model, kemudian mengevaluasi muatan faktor hasil estimasi (t-value), dan muatan faktor standar pada setiap aitem tes Army Alpha 1 untuk melihat nilai validitasnya. a. Uji Kecocokan Model Uji kecocokan model dilakukan untuk mengevaluasi apakah data dengan model memiliki derajat kecocokan atau Goodness Of Fit (GOF) yang baik. Deskripsi mengenai analisis hasil nilai GOF model akan disajikan pada daftar tabel di bawah ini
Universitas Sumatera Utara
52
Tabel 9 Kecocokan Model Keterangan Ukuran Goodness of Fit Tingkat Kecocokan Good fit Goodness-of-Fit Index 0.95 (GFI) Good fit Adjusted Goodness of Fit 0.92 (AGFI) Root Mean Square Error of 0.061 Good fit Approximation (RMSEA) Uji kecocokan model pada tes Army Alpha 1 dilakukan dengan memeriksa tiga nilai GOF yaitu GFI, AGFI dan RMSEA. Berdasarkan nilai GOF model pada tabel 7, maka ukuran GFI, AGFI , dan RMSEA menunjukkan hasil good-fit, yang berarti model memiliki tingkat kecocokan yang tinggi dengan data empirik. b. Uji Nilai t dan Nilai Muatan Faktor pada setiap Aitem Tes Army Alpha 1 Setelah diketahui bahwa model pengukuran pada tes Army Alpha 1 memiliki tingkat kecocokan yang sangat baik, maka langkah selanjutnya yang dapat dilakukan peneliti ialah menganalisa nilai muatan faktornya (nilai t dan nilai muatan faktor standar) pada setiap aitem tes guna mengetahui besarnya nilai validitas yang diperoleh pada model pengukuran. Nilai muatan faktor pada setiap aitem tes Army Alpha 1 akan disajikan dalam Tabel 10 berikut ini. Tabel 10 Muatan Faktor No t-value Keterangan Standardize Aitem loading factor 1 7.07 S 0.37 2 3 4 5 6 7 8 9
10.67 11.93 12.83 12.05 11.10 11.21 13.57 11.53
S S S S S S S S
0.53 0.59 0.62 0.59 0.55 0.56 0.65 0.57
Keterangan
Status
TS
Tidak Valid Valid Valid Valid Valid Valid Valid Valid Valid
S S S S S S S S
Universitas Sumatera Utara
53
Sambungan tabel 10 No Aitem
t-value
Keterangan Standardize loading factor S 0.36
Keterangan
Status
10
6.87
TS
Tidak Valid Tidak Valid Tidak Valid
11
7.28
S
0.38
TS
12
8.47
S
0.44
TS
Keterangan : t-value (<1.96 = TS ; ≥1,96 atau ≥ 2 = S) Standardize loading factor (< 0.5 = TS ; ≥ 0.70 atau ≥ 0.5 = S) TS = Tidak Sesuai dan S = Sesuai Guna memudahkan dalam melihat hasil dari analisis karakteristik psikometri tes Army Alpha 1, maka peneliti melakukan rekapitulasi karakteristik psikometri pada setiap aitem tes Army Alpha 1. Rekapitulasi tersebut akan disajikan dalam Tabel 11 berikut ini Tabel 11 Rekapitulasi Karakteristik Psikometri Aitem tes Army Alpha 1 No. P D t-value Standardize Status Aitem loading factor Validasi 0.854 0.430 1 7.07 0.37 Tidak Valid 0.561 0.605 2 10.67 0.53 Valid 0.748 0.623 3 11.93 0.59 Valid 0.757 0.637 4 12.83 0.62 Valid 0.743 0.618 5 12.05 0.59 Valid 0.670 0.594 6 11.10 0.55 Valid 0.296 0.619 7 11.21 0.56 Valid 8 0.653 0.680 13.57 0.65 Valid 9 0.529 0.628 11.53 0.57 Valid 10 0.209 0.444 6.87 0.36 Tidak Valid 11 0.182 0.469 7.28 0.38 Tidak Valid 12 0.282 0.515 8.47 0.44 Tidak Valid
Universitas Sumatera Utara
54
4. Analisis Reliabilitas Analisis reliabilitas pada tes Army Alpha 1 dilakukan melalui pendekatan konsistensi internal dengan menggunakan formula Kuder-Ricardson 20 (KR-20). Analisis skor reliabilitas dilakukan secara manual dengan menggunakan formula KR-20 dalam program excel. Hasil perhitungan analisis reliabilitas (
) pada
tes Army Alpha 1 menghasilkan skor sebesar 0.814648. C. Pembahasan Tes Army Alpha 1 merupakan tes kemampuan konsentrasi yang masih banyak digunakan dalam beberapa kegiatan pengukuran psikologi, seperti dalam seleksi karyawan ataupun penelitian-penelitian ilmiah lainnya. Oleh karena itu, tes Army Alpha 1 harus memiliki kualitas karakteristik psikometri yang baik. Karakteristik yang akan dibahas pada tes Army Alpha 1 mencakup indeks kesukaran aitem, indeks kesukaran aitem, validitas konstruk, dan reliabilitas. Perhitungan hasil analisis indeks kesukaran aitem tes Army Alpha 1 yang ditunjukkan dalam Tabel 6 di atas menyatakan bahwa proporsi variasi aitem memiliki nilai yang seimbang yakni 4 aitem tergolong mudah, 4 aitem juga tergolong sedang dan 4 aitem lainnya yang tergolong sulit. Namun, penyebaran pola variasi ini tidak disusun secara berurutan, artinya aitem tidak bergerak dari yang paling mudah, sedang hingga yang paling sulit, khusususnya yang terjadi pada aitem 2 hingga pada aitem 9 dalam tes Army Alpha 1. Hal ini tentu saja tidak sesuai dengan teori yang menyatakan bahwa pola penyusunan aitem seharusnya disusun berdasarkan tingkat kesukarannya, yakni penyusunan aitem dimulai dari aitem dengan harga p yang paling tinggi atau aitem yang mudah hingga aitem dengan harga p yang paling rendah atau aitem yang sulit (Murphy dan Davidshofer, 2005).
Universitas Sumatera Utara
55
Lain halnya dengan hasil perhitungan analisis indeks diskriminasi aitem pada tes Army Alpha 1. Diketahui bahwasanya keseluruhan aitem dalam tes ini masih dianggap sangat baik. Hal ini dapat dilihat pada Tabel 8 di atas yang menunjukkan bahwa masing-masing aitem memiliki harga d di atas 0,4. Artinya aitem-aitem dalam tes ini masih memiliki kualitas yang sangat baik dalam membedakan individu yang memiliki kemampuan dan individu yang tidak memiliki kemampuan sesuai dengan fungsi ukur tes Army Alpha 1 yakni kemampuan daya tangkap dan konsentrasi dalam melaksanakan instruksi dengan cepat dan tepat. Estimasi besarnya koefisien validitas tes Army Alpha 1 dalam penelitian ini dihitung menggunakan metode analisis faktor konfirmatori. Berdasarkan hasil perhitungan analisis validitas, diketahui bahwa uji kecocokan model pengukuran (seperti GFI, AGFI dan RMSEA) berada dalam kategori baik (good fit). Hal tersebut menunjukkan bahwa tes Army Alpha 1 memiliki tingkat kecocokan yang sangat baik antara data dengan modelnya, sehingga peneliti dapat melanjutkan analisis nilai-t (t-value) dan muatan faktor standar untuk mengetahui besarnya koefisien validitas masing-masing aitem. Berdasarkan hasil perhitungan analisis validitas yang ditunjukkan pada Tabel 10 diketahui bahwa terdapat 8 aitem yang memiliki nilai validitas yang baik, sedangkan 4 aitem lainnya memiliki koefisien validitas yang tidak cukup baik sebagai tes inteligensi. Keputusan ini tentu didasari dengan teori yang dinyatakan oleh Wijanto (2008) bahwa suatu variabel atau aitem akan memiliki validitas yang baik terhadap variabel latennya jika nilai-t (t-value) lebih besar dari nilai kritis (≥ 1,96) dan nilai muatan faktor standarnya lebih besar dari nilai kritis
Universitas Sumatera Utara
56
(≥0,5). Sehingga kedelapan aitem (yakni aitem 2 hingga aitem 9) seperti yang telah dipaparkan dalam tabel 8 sebelumnya dapat dikatakan memiliki nilai validitas yang cukup baik karena kedelapan aitem tersebut memenuhi kriteria nilai-t (t-value) dan nilai muatan faktor standarnya yang lebih besar dari nilai kritisnya. Sedangkan untuk keempat aitem lainnya, seperti aitem 1, 10, 11 dan 12 dikatakan memiliki nilai validitas yang kurang baik karena keempat aitem tersebut tidak memenuhi kriteria penilaian nilai-t (t-value) dan muatan faktor standarnya yang berada di bawah nilai kritis. Secara keseluruhan, berdasarkan hasil rekapitulasi analisis karakteristik psikometri masing-masing aitem, kenyataannya hanya 8 aitem dari total keseluruhan aitem yang memiliki kualitas karakteristik psikometri yang baik karena memenuhi semua kondisi psikometri mulai dari parameter indeks kesukaran aitem, diskriminasi aitem maupun uji validitasnya (t-value dan muatan faktor standar). Sedangkan 4 aitem lainnya meskipun memenuhi parameter kesukaran aitem dan diskriminasi aitem yang baik namun keempat aitem ini tidak dapat memenuhi nilai validitas (t-value dan muatan faktor standar) yang baik maka dapat disimpulkan aitem-aitem tersebut
tidak dapat digunakan sebagai
bagian dari tes inteligensi sehingga memerlukan adanya revisi. Penyebab dari keempat aitem yang memiliki koefisien validitas yang kurang baik diduga karena faktor batasan jangkauan data. Batasan jangkauan data merupakan suatu keadaan menyempitnya variasi skor dikarenakan jumlah subjek atau munculnya homogenitas skor subjek yang diperoleh dari suatu pengukuran (Coeley, 2010). Kebocoran soal di internet menyebabkan skor pada hasil tes Army Alpha 1 menjadi homogen. Adanya kebocoran soal di internet diduga
Universitas Sumatera Utara
57
menyebabkan efek pembelajaran sebelumnya pada peserta tes sebelum mengikuti tes. Efek belajar tersebut akan memungkinkan para peserta tes untuk mempelajari isi dari aitem-aitem soal, teknik menjawab hingga pada kunci jawaban tes sebelum mengikuti tes psikologi. Hal tersebut tentu saja akan mengakibatkan menyempitnya variasi atau underestimasi skor yang diperoleh dari hasil perhitungan sehingga akan mempengaruhi besarnya validitas skor pada penelitian ini. Di sisi lain, pengujian terhadap koefisien reliabilitas tes Army Alpha 1 dilakukan dengan menggunakan formula KR-20. Dari hasil perhitungan diketahui bahwa besarnya nilai koefisien reliabilitas tes Army Alpha 1 ialah 0,814. Hasil tersebut menunjukkan bahwa sekitar 81% variasi skor tampak pada tes Army Alpha 1 merupakan variasi skor murni, sedangkan 19% lainnya diakibatkan oleh adanya variasi eror pada subjek dalam pengukuran tes tersebut. Secara keseluruhan, dapat diketahui bahwa koefisien reliabilitas pada tes ini sudah cukup baik, namun karena tes ini mengukur kemampuan konsentrasi yang merupakan bagian di dalam tes inteligensi, koefisien reliabilitas tes Army Alpha 1 belum cukup memuaskan. Hal ini tentu saja berdasarkan pernyataan yang diungkapkan oleh Murphy dan Davidshofer (2005) yang menyatakan bahwa untuk tes inteligensi nilai estimasi reliabilitas biasanya dianggap baik jika koefisien reliabilitas ≥ 0.90. Kurangnya kontrol peneliti dalam proses administrasi tes juga mempengaruhi hasil dari pengujian analisis karakteristik psikometri tes Army Alpha 1. Hal ini dikarenakan data yang digunakan dalam penelitian ini merupakan data sekunder yang terekam dalam dokumentasi tes dari 2 biro psikologi yang
Universitas Sumatera Utara
58
berada di Kota Medan. Meskipun peneliti melakukan skoring ulang, namun tetap saja kurangnya kontrol peneliti terhadap proses administrasian tes yang dilakukan oleh kedua biro psikologi tersebut mempengaruhi besarnya koefisien validitas dan reliabilitas.
Universitas Sumatera Utara
BAB V KESIMPULAN DAN SARAN
A. Kesimpulan Berdasarkan hasil penelitian analisis karakteristik psikometri tes Army Alpha 1 dapat disimpulkan, antara lain: 1. Terdapat beberapa aitem dalam tes yang memiliki pola penyusunan yang tidak sesuai dengan tingkat kesukarannya dan berdasarkan hasil analisis indeks diskriminasi aitem, semua aitem masih tergolong mampu dalam membedakan individu yang memiliki kemampuan dengan individu yang tidak memiliki kemampuan sesuai dengan fungsi ukur tes Army Alpha 1. 2. Berdasarkan hasil analisis validitas faktor konfirmatori, bahwa hanya terdapat 8 aitem yang dapat dikatakan valid karena memiliki t-value dan nilai muatan faktor standar di atas nilai kritikal, sedangkan 4 aitem lainnya belum dapat dikatakan memiliki nilai validitas yang baik karena nilai muatan faktor standar berada dibawah nilai kritikal. Dan untuk hasil analisis estimasi reliabilitas, tes Army Alpha 1 juga kurang dapat dipercaya sebagai tes inteligensi.
B. Saran 1. Saran Praktis Sebaiknya perlu dipertimbangkan kembali penggunaan tes Army Alpha 1 sebagai dasar pengambilan keputusan ketika mengukur kemampuan daya tangkap dan konsentrasi dalam melaksanakan instruksi dengan cepat dan tepat.
59 Universitas Sumatera Utara
60
2. Saran Metodologis a. Untuk penelitian selanjutnya, sebaiknya peneliti melakukan kontrol yang penuh terhadap keseluruhan proses administrasi tes saat melakukan pengambilan data agar metode yang diberikan pada saat tes kepada semua subjek penelitian sama sehingga dapat menghindari bias yang mungkin saja muncul. b. Peneliti selanjutnya juga sebaiknya mencari informasi lebih dalam terkait perkembangan dan data-data maupun atribut psikologis yang diukur dari tes Army Alpha 1 di Indonesia agar hasil penelitiannya lebih akurat dan terpercaya penggunaannya saat ini.
Universitas Sumatera Utara
DAFTAR PUSTAKA
Anastasi, A., & Urbina, S. (1997). Psychological testing (7th ed.). Upper Saddle River, NJ: Prentice Hall. Azwar, Saifuddin. (2007). Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi Belajar. Cetakan kesepuluh. Yogyakarta: Pustaka Pelajar. Azwar, Saifuddin. (2010). Metode Penelitian. Yogyakarta: Pustaka Pelajar Azwar, Saifuddin. (2012). Reliabilitas & Validitas. Edisi IV. Yogyakarta: Pustaka Pelajar Brannan, C.V (1935). A Study Of The Difficulty Of Items In The Army Alpha Intelligence Test And A Suggested Revision of the Test. Disertasi Gelar Master Ilmuwan Brigham, C.C (1923). A Study Of American Intelligence. USA : Princeton University Press Coaley, K. (2010). An Introduction to Psychological Assessment and Psychometrics. London: Sage Publication Ltd. Crocker, L. & James Algina. (2008). Introduction to Classical and Modern Test Theory.USA: Cengage Learning. Fitriani, W. (2012). Bias Budaya dalam Tes Psikologi Ditinjau dari Aspek Testee dan Alternatif Solusinya.Ta’dib.Vol 15 (2). Gregory, R. J. (2004). Psychological Testing: History, Principles, and Application (Fourth Edition). United States of America: Pearson Education, Inc Hidayat, S. (2011). Pengaruh Musik Klasik Terhadap Daya Tahan Konsentrasi Belajar. Skripsi: Fakultas Psikologi Universitas Islam Negeri Sultan Syarif Kasim Riau. Inspirawan, R. (2011).Studi Validitas Konstruk Tes Inteligensi Multidimensional (TIM) Sesi Performance. Skripsi. Fakultas Psikologi Universitas Islam Negeri Syarif HIdayatullah. Jakarta Kaplan, R.M & Saccuzzo, D. P. (2005). Psychological Testing : Principles, applications, and Issues. USA : Thomson Wadsworth. Kusnanto, S.A, dkk. (2012). Kemampuan Memasukkan Bola Ke Ring Berdasarkan Nilai Konsentrasi. Journal of Sport Sciences and Fitness. Vol. 1 Murphy, K. R. & Davidshofer, C. O. (2005). Psychological Testing, Principles And Applications. 6th ed. Prentice-Hall. Inc. New Jersey.
61 Universitas Sumatera Utara
62
Mulyana, O.P., dkk. (2013). Penerapan Relaksasi Atensi untuk Meningkatkan Konsentrasi Belajar pada Siswa SMK. Jurnal Psikologi: Teori & Terapan, Vol 3. 103-112 Osterlind. S. J. (2010). Modern Measurement; Theory, Pricinple, and Applications of Mental Appraisal.2nd ed. USA:Allyn & Bacon. Pedzahur, E.J.(1993). Multiple Regression in Behavioral Research: Explanation and Prediction (Third Edition). USA: Thomson Learning, Inc. Prasanti, F.D. (2015). Pengaruh Brain Gym Terhadap Konsentrasi Belajar pada Siswa Kelas VIII SMP Negeri 16 Surakarta. Jurnal: Fakultas Keguruan dan Ilmu Pendikan Randika, B. 2015. Pandangan Orang Awam Terhadap Psikologi, dikutip dari: http://www.kompasiana.com/banirandika/pandangan-orang-awam-terhadappsikologi Reynolds, C.R & Janzen E.F. (2007). Encyclopedia of Special Education: A Reference for the Education of Children, Adolescents, and Adults with Disabilities and Other Exceptional Individuals (Third Edition). New Jersey: : John Wiley & Sons, Inc Schrammel, H.E., (1936). The Schrammel-Brannan Revision of the Army Alpha Intelligence Exammination. Vol 39, 239-242. Stich,T.G. & Armstrong, W.B. (1994). Adult Literacy in The United States: A Compendium of Quantitative Data and Interpretive Comments Urbina, Susana. (2004). Essential of Psychological Testing. New Jersey : John Wiley & Sons, Inc Wells, F.L. (1986). Army Alpha-Revised. Personnel Journal. 411 Wijanto, S. H. (2008). Structural 8.8.Yogyakarta: Graha Ilmu
equation
modeling
dengan
lisrel
Universitas Sumatera Utara
LAMPIRAN
Universitas Sumatera Utara
LAMPIRAN I Output Lisrel
Universitas Sumatera Utara
Path Diagram-Muatan Faktor Standar
0.86
A1
0.72
A2
0.66
A3
0.61 0.65
A4 A5
0.70
A6
0.69
A7
0.58
A8
0.68
A9
0.87
A10
0.86
A11
0.81
A12
0.37 0.53 0.59 0.62 0.59 0.55
ORAL DIRECTI
1.00
0.56 0.65 0.57 0.36 0.38 0.44
Chi-Square=137.61, df=54, P-value=0.00000, RMSEA=0.061
Universitas Sumatera Utara
Path Diagram, T- VALUES
13.87
A1
13.17
A2
12.79
A3
12.48
A4
12.76
A5
13.05
A6
13.02
A7
12.17
A8
12.92
A9
13.90
A10
13.84
A11
13.84
A12
7.07 10.67 11.93 12.83 12.05 11.10
ORAL DIRECTI
0.00
11.21 13.57 11.53 5.87 7.28 8.47
Universitas Sumatera Utara
DATE: 7/26/2017 TIME: 6:45 L I S R E L 8.50 BY Karl G. Jöreskog & Dag Sörbom This program is published exclusively by Scientific Software International, Inc. 7383 N. Lincoln Avenue, Suite 100 Lincolnwood, IL 60712, U.S.A. Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140 Copyright by Scientific Software International, Inc., 1981-2001 Use of this program is subject to the terms specified in the Universal Copyright Convention. Website: www.ssicentral.com The following lines were read from file D:\LISREL COBA LAGI\DATA.spj: ARMY ALPHA 1 CFA Raw Data from file 'D:\LISREL COBA LAGI\ANGKA.psf' Sample Size = 412 Latent Variables 'ORAL DIRECTI' Relationships A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 ='ORAL DIRECTI' Path Diagram Iterations = 250 Method of Estimation: Maximum Likelihood End of Problem Sample Size = 412 ARMY ALPHA 1 CFA Covariance Matrix
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12
A1 -------0.12 0.03 0.04 0.04 0.04 0.04 0.03 0.03 0.02 0.02 0.02 0.02
A2 --------
A3 --------
A4 --------
A5 --------
A6 --------
0.25 0.07 0.07 0.05 0.05 0.08 0.08 0.08 0.05 0.05 0.06
0.19 0.08 0.08 0.06 0.06 0.08 0.05 0.04 0.04 0.06
0.18 0.08 0.07 0.06 0.08 0.07 0.03 0.03 0.04
0.19 0.09 0.05 0.07 0.07 0.03 0.02 0.04
0.22 0.07 0.08 0.09 0.02 0.02 0.04
A8 -------
A9 -------
A10 -------
A11 -------
A12 --------
0.23 0.10 0.05 0.05 0.06
0.25 0.05 0.05 0.06
0.17 0.03 0.02
0.15 0.05
Covariance Matrix
A7 A8 A9 A10 A11 A12
A7 -------0.21 0.08 0.09 0.05 0.04 0.06
0.20
Universitas Sumatera Utara
ARMY ALPHA 1 CFA Number of Iterations = 7 LISREL Estimates (Maximum Likelihood) Measurement Equations A1 = 0.13*ORAL DIR, Errorvar.= 0.11 , R² = 0.14 (0.018) (0.0078) 7.07 13.87 A2 = 0.26*ORAL DIR, Errorvar.= 0.18 , R² = 0.28 (0.025) (0.013) 10.67 13.17 A3 = 0.25*ORAL DIR, Errorvar.= 0.12 , R² = 0.34 (0.021) (0.0097) 11.93 12.79 A4 = 0.27*ORAL DIR, Errorvar.= 0.11 , R² = 0.39 (0.021) (0.0091) 12.83 12.48 A5 = 0.26*ORAL DIR, Errorvar.= 0.12 , R² = 0.35 (0.021) (0.0098) 12.05 12.76 A6 = 0.26*ORAL DIR, Errorvar.= 0.15 , R² = 0.30 (0.023) (0.012) 11.10 13.05 A7 = 0.25*ORAL DIR, Errorvar.= 0.14 , R² = 0.31 (0.023) (0.011) 11.21 13.02 A8 = 0.31*ORAL DIR, Errorvar.= 0.13 , R² = 0.42 (0.023) (0.011) 13.57 12.17 A9 = 0.28*ORAL DIR, Errorvar.= 0.17 , R² = 0.32 (0.025) (0.013) 11.53 12.92 A10 = 0.15*ORAL DIR, Errorvar.= 0.14 , R² = 0.13 (0.021) (0.010) 6.87 13.90 A11 = 0.15*ORAL DIR, Errorvar.= 0.13 , R² = 0.14 (0.020) (0.0092) 7.28 13.84 A12 = 0.20*ORAL DIR, Errorvar.= 0.16 , R² = 0.19 (0.023) (0.012) 8.47 13.65 Correlation Matrix of Independent Variables ORAL DIR ------1.00
Universitas Sumatera Utara
Goodness of Fit Statistics Degrees of Freedom = 54 Minimum Fit Function Chi-Square = 125.38 (P = 0.00) Normal Theory Weighted Least Squares Chi-Square = 137.61 (P = 0.00) Estimated Non-centrality Parameter (NCP) = 83.61 90 Percent Confidence Interval for NCP = (52.79 ; 122.12) Minimum Fit Function Value = 0.31 Population Discrepancy Function Value (F0) = 0.20 90 Percent Confidence Interval for F0 = (0.13 ; 0.30) Root Mean Square Error of Approximation (RMSEA) = 0.061 90 Percent Confidence Interval for RMSEA = (0.049 ; 0.074) P-Value for Test of Close Fit (RMSEA < 0.05) = 0.068 Expected Cross-Validation Index (ECVI) = 0.45 90 Percent Confidence Interval for ECVI = (0.38 ; 0.55) ECVI for Saturated Model = 0.38 ECVI for Independence Model = 2.58 Chi-Square for Independence Model with 66 Degrees of Freedom = 1037.10 Independence AIC = 1061.10 Model AIC = 185.61 Saturated AIC = 156.00 Independence CAIC = 1121.35 Model CAIC = 306.12 Saturated CAIC = 547.64 Normed Fit Index (NFI) = 0.88 Non-Normed Fit Index (NNFI) = 0.91 Parsimony Normed Fit Index (PNFI) = 0.72 Comparative Fit Index (CFI) = 0.93 Incremental Fit Index (IFI) = 0.93 Relative Fit Index (RFI) = 0.85 Critical N (CN) = 266.76 Root Mean Square Residual (RMR) = 0.0091 Standardized RMR = 0.047 Goodness of Fit Index (GFI) = 0.95 Adjusted Goodness of Fit Index (AGFI) = 0.92 Parsimony Goodness of Fit Index (PGFI) = 0.66 The Modification Indices Suggest to Add an Error Covariance Between and Decrease in Chi-Square New Estimate A5 A4 8.4 0.02 A6 A5 17.7 0.03 A9 A3 11.4 -0.03 A11 A5 9.4 -0.02 Time used:
0.063 Seconds
Universitas Sumatera Utara
LAMPIRAN II Perhitungan Reliabilitas KR-20
Universitas Sumatera Utara
SUBJEK S001 S002 S003 ……. ……. ……. S412 Total
A1 1 1 1
A2 0 1 1
A3 1 1 1
A4 0 1 1
A5 0 1 1
AITEM A6 A7 0 0 1 1 1 1
1 352
1 231
1 308
0 312
1 306
1 276
0 122
A8 0 1 1
A9 A10 A11 A12 0 0 0 0 1 1 0 1 1 1 0 0
1 269
1 218
0 95
0 75
0 116
Total 2 11 10
7 2680
p
A1 0.854
A2 0.560
A3 0.748
A4 0.757
A5 0.743
A6 0.669
A7 0.296
A8 0.653
A9 0.529
A10 0.231
A11 0.182
A12 0.281
q
0.146
0.439
0.252
0.243
0.257
0.330
0.704
0.347
0.471
0.769
0.818
0.718
pq
0.124
0.246
0.189
0.184
0.191
0.221
0.208
0.227
0.249
0.177
0.149
0.202
k
Σpq Mean ρ (KR 20)
12 2.368 9.351 6.505 0.814
Ket: = koefisien reliabilitas = proporsi populasi yang menjawab aitem benar (atau aitem pertama). = proporsi populasi yang menjawab aitem salah (atau aitem kedua). = banyak aitem dalam tes. = varians skor tes.
Universitas Sumatera Utara