Salinan Terjemahan 5 Measurement And Scaling Techniques.docx

  • Uploaded by: Rizhky AW
  • 0
  • 0
  • December 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Salinan Terjemahan 5 Measurement And Scaling Techniques.docx as PDF for free.

More details

  • Words: 11,659
  • Pages: 44
Teknik Pengukuran dan Penskalaan 6 9Teknik

5 Pengukuran dan Pengukuran Skala PENGUKURAN DALAM PENELITIAN Dalam kehidupan sehari-hari, kita dikatakan mengukur ketika kita menggunakan beberapa ukuran untuk menentukan berat, tinggi badan, atau beberapa fitur lain dari objek fisik. Kami juga mengukur ketika kami menilai seberapa baik kami menyukai lagu, lukisan, atau kepribadian teman-teman kami. Kami, dengan demikian, mengukur objek fisik serta konsep abstrak. Pengukuran adalah tugas yang relatif rumit dan menuntut, khususnya jika menyangkut fenomena kualitatif atau abstrak. Dengan pengukuran yang kami maksud adalah proses menetapkan angka ke objek atau observasi, tingkat pengukuran menjadi fungsi dari aturan di mana angka-angka ditugaskan. Sangat mudah untuk menetapkan angka sehubungan dengan properti dari beberapa objek, tetapi relatif sulit dalam hal orang lain. Misalnya, mengukur hal-hal seperti penyesuaian sosial, kecerdasan, atau penyesuaian perkawinan jauh kurang jelas dan membutuhkan perhatian yang jauh lebih dekat daripada mengukur berat badan fisik, usia biologis, atau aset keuangan seseorang. Dengan kata lain, sifat seperti berat, tinggi, dll., Dapat diukur secara langsung dengan beberapa unit pengukuran standar, tetapi tidak mudah mengukur sifat seperti motivasi untuk berhasil, kemampuan untuk menahan stres dan sejenisnya. Kita dapat mengharapkan akurasi yang tinggi dalam mengukur panjang pipa dengan tongkat halaman, tetapi jika konsepnya abstrak dan alat pengukuran tidak terstandardisasi, kita kurang yakin tentang keakuratan hasil pengukuran. Secara teknis, pengukuran adalah proses pemetaan aspek-aspek domain ke aspek-aspek lain dari rentang menurut beberapa aturan korespondensi. Dalam mengukur, kami merancang beberapa bentuk skala dalam rentang (dalam hal teori himpunan, rentang mungkin merujuk ke beberapa himpunan) dan kemudian mengubah atau memetakan properti objek dari domain (dalam hal teori himpunan, domain dapat merujuk ke beberapa set lainnya) ke skala ini. Misalnya, jika kita menemukan rasio kehadiran laki-laki dan perempuan saat melakukan studi terhadap orang-orang yang menghadiri beberapa pertunjukan, maka kita dapat menabulasikan orang-orang yang datang ke pertunjukan berdasarkan jenis kelamin. Dalam hal teori himpunan, proses ini adalah salah satu pemetaan sifat fisik yang diamati dari mereka yang datang ke pertunjukan (domain) ke klasifikasi seks (kisaran). Aturan korespondensi adalah: Jika objek dalam domain tampak laki-laki, tetapkan ke "0" dan jika perempuan menetapkan ke "1". Demikian pula, kita dapat merekam status perkawinan seseorang sebagai 1, 2, 3 atau 4, tergantung pada apakah

7 0 Metodologi Penelitian orang tersebut lajang, menikah, janda atau bercerai. Kita dapat juga mencatat jawaban "Ya atau Tidak" untuk pertanyaan sebagai "0" dan "1" (atau sebagai 1 dan 2 atau mungkin sebagai 59 dan 60). Dengan cara buatan atau nominal ini, data kategori (kualitatif atau deskriptif) dapat dibuat menjadi data numerik dan jika kita mengkodekan berbagai kategori, kita mengacu pada angka-angka yang kita rekam sebagai data nominal. Data nominal bersifat numerik hanya dalam nama, karena mereka tidak berbagi satu pun dari properti angka yang kita bahas dalam aritmatika biasa. Sebagai contoh jika kita mencatat status perkawinan sebagai 1, 2, 3, atau 4 seperti yang disebutkan di atas, kita tidak dapat menulis 4> 2 atau 3 <4 dan kita tidak dapat menulis 3 - 1 = 4 - 2, 1 + 3 = 4 atau 4 2 = 2. Dalam situasi-situasi ketika kita tidak dapat melakukan apa pun kecuali mengatur ketidaksetaraan, kita merujuk pada data sebagai data ordinal. Misalnya, jika satu mineral dapat menggores yang lain, ia akan menerima nomor kekerasan yang lebih tinggi dan pada skala Mohs, angka dari 1 hingga 10 masing-masing diberikan kepada talc, gypsum, kalsit, fluorit, apatit, feldspar, kuarsa, topaz, sapphire, dan berlian . Dengan angka-angka ini kita dapat menulis 5> 2 atau 6 <9 karena apatit lebih keras daripada gipsum dan feldspar lebih lembut daripada safir, tetapi kita tidak dapat menulis misalnya 10 - 9 = 5 - 4, karena perbedaan kekerasan antara berlian dan safir adalah sebenarnya jauh lebih besar dari itu antara apatit dan fluorit. Juga tidak berarti untuk mengatakan bahwa topaz dua kali lebih keras daripada fluorit hanya karena nomor kekerasan masing-masing pada skala Mohs adalah 8 dan 4. Lebih besar dari simbol (yaitu,>) dalam kaitannya dengan data ordinal dapat digunakan untuk menunjuk “ lebih bahagia dari "" disukai "dan seterusnya. Ketika selain mengatur ketidaksetaraan kita juga dapat membentuk perbedaan, kita mengacu pada data sebagai data interval. Misalkan kita diberi pembacaan suhu berikut (dalam derajat Fahrenheit): 58 °, 63 °, 70 °, 95 °, 110 °, 126 ° dan 135 °. Dalam hal ini, kita dapat menulis 100 °> 70 ° atau 95 ° <135 ° yang berarti bahwa 110 ° lebih hangat dari 70 ° dan bahwa 95 ° lebih dingin dari 135 °. Kita juga dapat menulis misalnya 95 ° - 70 ° = 135 ° - 110 °, karena perbedaan temperatur yang sama adalah sama dalam arti bahwa jumlah panas yang sama diperlukan untuk menaikkan suhu suatu objek dari 70 ° sampai 95 ° atau dari 110 ° sampai 135 °. Di sisi lain, itu tidak akan berarti banyak jika kita mengatakan bahwa 126 ° dua kali lebih panas daripada 63 °, meskipun 126 ° 63 ° = 2. Untuk menunjukkan alasannya, kita hanya perlu mengubah ke skala celcius, di mana suhu pertama menjadi 5/9 (126 - 32) = 52 °, suhu kedua menjadi 5/9 (63 -] = 17 ° dan angka pertama sekarang lebih dari tiga kali detik. Kesulitan ini muncul dari fakta bahwa Skala Fahrenheit dan Celcius keduanya memiliki asal-usul buatan (nol) yaitu, angka 0 dari kedua skala tidak menunjukkan kuantitas apa pun yang kita coba ukur. Ketika selain menetapkan ketidaksetaraan dan membentuk perbedaan, kita juga dapat membentuk quotients (yaitu , ketika kita dapat melakukan semua operasi matematika yang lazim), kita mengacu pada data seperti data rasio .Dalam pengertian ini, data rasio mencakup semua pengukuran biasa (atau penentuan) panjang, tinggi, jumlah uang, berat, volume, area , tekanan dll. Perbedaan yang disebutkan di atas antara nominal, ordinal, inte data rona dan rasio penting untuk sifat serangkaian data mungkin menyarankan penggunaan teknik statistik tertentu *. Seorang peneliti harus cukup waspada tentang aspek ini ketika mengukur properti objek atau konsep abstrak. ] Ketika data dapat diukur dalam satuan yang dapat dipertukarkan, misalnya, bobot (dengan skala rasio), suhu (berdasarkan skala interval), data tersebut dikatakan sebagai parametrik dan dapat dikenai sebagian besar jenis proses statistik dan matematika. Tetapi ketika data diukur dalam satuan yang tidak dapat dipertukarkan, misalnya, preferensi produk (dengan skala ordinal), data dikatakan non-parametrik dan rentan hanya untuk sebatas terbatas pada perawatan matematika dan statistik.

Teknik Pengukuran danScaling) 7 1

SKALA PENGUKURAN Skala (Dari apa yang telah disebutkan di atas, kita dapat menulis bahwa skala pengukuran dapat dipertimbangkan dalam hal sifat matematika mereka. Klasifikasi pengukuran skala yang paling banyak digunakan adalah: (a) skala nominal; (b) skala ordinal; (c) skala interval; dan (d) skala rasio. $ Skala Nominal: Skala nominal hanyalah sebuah sistem penunjukan simbol angka untuk kejadian-kejadian untuk memberi label pada mereka. Contoh umum dari ini adalah penugasan sejumlah pemain bola basket untuk mengidentifikasi mereka. Angka-angka tersebut tidak dapat dianggap terkait dengan skala yang dipesan untuk pesanan mereka tidak ada konsekuensinya; angka-angka itu hanya label yang nyaman untuk kelas peristiwa tertentu dan dengan demikian tidak memiliki nilai kuantitatif. Skala nominal menyediakan cara yang mudah untuk melacak orang, benda, dan kejadian. Seseorang tidak dapat berbuat banyak dengan angkaangka yang terlibat. Sebagai contoh, seseorang tidak dapat menggunakan rata-rata angka di belakang sekelompok pemain sepak bola dan menghasilkan nilai yang berarti. Tidak seorang pun dapat dengan mudah membandingkan angka-angka yang diberikan kepada satu kelompok dengan angka-angka yang diberikan kepada yang lain. Penghitungan anggota dalam setiap kelompok adalah satu-satunya operasi aritmatika yang mungkin ketika skala nominal digunakan. Dengan demikian, kita dibatasi untuk menggunakan mode sebagai ukuran tendensi sentral. Tidak ada ukuran dispersi yang umum digunakan untuk skala nominal. Uji chisquare adalah tes yang paling umum dari signifikansi statistik yang dapat digunakan, dan untuk ukuran korelasi, koefisien kontingensi dapat dikerjakan. Skala nominal adalah tingkat pengukuran paling kuat. Ini menunjukkan tidak ada keteraturan atau hubungan jarak dan tidak memiliki asal aritmatika. Skala nominal hanya menggambarkan perbedaan antara hal-hal dengan menugaskannya ke kategori. Data nominal, dengan demikian, menghitung data. Skala ini membuang informasi apa pun yang mungkin kita miliki tentang berbagai tingkat sikap, keterampilan, pemahaman, dll. Terlepas dari semua ini, skala nominal masih sangat berguna dan secara luas digunakan dalam survei dan penelitian ex-post-facto lainnya ketika data diklasifikasikan oleh sub kelompok besar populasi. $ Ordinal scale: Level terendah skala yang umum digunakan adalah skala ordinal. Skala ordinal menempatkan peristiwa secara berurutan, tetapi tidak ada upaya untuk membuat interval skala sama dengan beberapa aturan. Perintah peringkat mewakili skala ordinal dan sering digunakan dalam penelitian yang berkaitan dengan fenomena kualitatif. Peringkat siswa di kelas kelulusannya melibatkan penggunaan skala ordinal. Seseorang harus sangat berhati-hati dalam membuat pernyataan tentang skor berdasarkan skala ordinal. Misalnya, jika posisi Ram di kelasnya adalah 10 dan posisi Mohan adalah 40, itu tidak dapat dikatakan bahwa posisi Ram empat kali lebih baik dari Mohan. Pernyataan itu tidak masuk akal sama sekali. Skala ordinal hanya mengizinkan peringkat item dari tertinggi ke terendah. Tindakan ordinal tidak memiliki nilai absolut, dan perbedaan nyata antara peringkat yang berdekatan mungkin tidak sama. Semua yang dapat dikatakan adalah bahwa satu orang lebih tinggi atau lebih rendah pada skala daripada yang lain, tetapi perbandingan yang lebih tepat tidak dapat dilakukan. Dengan demikian, penggunaan skala ordinal menyiratkan pernyataan 'lebih besar dari' atau 'kurang dari' (pernyataan kesetaraan juga dapat diterima) tanpa kita dapat menyatakan seberapa besar atau kurang. Perbedaan nyata antara peringkat 1 dan 2 mungkin lebih atau kurang dari perbedaan antara pangkat 5 dan 6. Karena jumlah skala ini hanya memiliki arti pangkat, ukuran yang tepat dari tendensi sentral adalah median. Ukuran persentil atau kuartil digunakan untuk mengukur dispersi. Korelasi dibatasi untuk berbagai metode urutan peringkat. Ukuran signifikansi statistik terbatas pada metode non-parametrik. $ Interval scale: Dalam kasus skala interval, interval disesuaikan dengan beberapa aturan yang telah ditetapkan sebagai dasar untuk membuat unit yang sama. Satuan tersebut hanya setara sejauh satu

7 2 Metodologi Penelitian menerima asumsi yang menjadi dasar aturan tersebut. Skala interval dapat memiliki nol acak, tetapi tidak mungkin untuk menentukan bagi mereka apa yang dapat disebut nol mutlak atau asal yang unik. Keterbatasan utama dari skala interval adalah tidak adanya nol yang benar; itu tidak memiliki kapasitas untuk mengukur tidak adanya ciri atau karakteristik yang lengkap. Skala Fahrenheit adalah contoh skala interval dan menunjukkan kesamaan dalam apa yang bisa dan tidak bisa dilakukan dengannya. Dapat dikatakan bahwa peningkatan suhu dari 30 ° sampai 40 ° melibatkan peningkatan suhu yang sama dengan peningkatan dari 60 ° hingga 70 °, tetapi tidak dapat dikatakan bahwa suhu 60 ° dua kali lebih hangat dari suhu 30 ° karena kedua bilangan bergantung pada fakta bahwa nol pada skala diatur secara acak pada suhu titik beku air. Rasio dari dua suhu, 30 ° dan 60 °, tidak ada artinya karena nol adalah titik sembarang. Skala interval memberikan pengukuran yang lebih kuat daripada skala ordinal untuk skala interval juga menggabungkan konsep kesetaraan interval. Dengan demikian ukuran statistik yang lebih kuat dapat digunakan dengan skala interval. Berarti adalah ukuran yang tepat dari kecenderungan sentral, sedangkan standar deviasi adalah ukuran dispersi yang paling banyak digunakan. Teknik korelasi momen produk sesuai dan tes yang umumnya digunakan untuk signifikansi statistik adalah uji 't' dan 'F'. Skala $ Rasio: Skala rasio memiliki pengukuran nol absolut atau benar. Istilah 'nol mutlak' tidak setepat yang pernah dipercayai. Kita bisa membayangkan nol mutlak panjang dan sama kita bisa membayangkan nol mutlak waktu. Misalnya, titik nol pada skala sentimeter menunjukkan tidak adanya panjang atau tinggi yang lengkap. Tapi nol mutlak suhu secara teoritis tidak mungkin diperoleh dan tetap menjadi konsep yang hanya ada di pikiran ilmuwan. Jumlah pelanggaran aturan lalu lintas kecil dan jumlah huruf yang salah dalam satu halaman skrip jenis mewakili skor pada skala rasio. Kedua skala ini memiliki nol mutlak dan dengan demikian semua pelanggaran lalu lintas kecil dan semua kesalahan pengetikan dapat dianggap sama pentingnya. Dengan skala rasio yang terlibat, seseorang dapat membuat pernyataan seperti kinerja pengetikan “Jyoti” dua kali lebih bagus daripada “Reetu.” Rasio yang terlibat memiliki signifikansi dan memfasilitasi semacam perbandingan yang tidak mungkin dalam skala interval. Skala rasio mewakili jumlah variabel aktual. Ukuran dimensi fisik seperti berat, tinggi, jarak, dll. Adalah contoh. Umumnya, semua teknik statistik dapat digunakan dengan skala rasio dan semua manipulasi yang dapat dilakukan dengan bilangan real dapat juga dilakukan dengan nilai skala rasio. Perkalian dan pembagian dapat digunakan dengan skala ini tetapi tidak dengan skala lain yang disebutkan di atas. Alat geometrik dan harmonik dapat digunakan sebagai ukuran tendensi sentral dan koefisien variasi juga dapat dihitung. Dengan demikian, melanjutkan dari skala nominal (jenis skala yang paling tidak tepat) ke skala rasio (yang paling tepat), informasi yang relevan diperoleh semakin banyak. Jika sifat variabel memungkinkan, peneliti harus menggunakan skala yang memberikan deskripsi paling tepat. Para peneliti dalam ilmu fisika memiliki keuntungan untuk menggambarkan variabel dalam bentuk skala rasio tetapi ilmu perilaku umumnya terbatas untuk menggambarkan variabel dalam bentuk skala interval, jenis pengukuran yang kurang tepat.

Sumber Kesalahan dalam Pengukuran Pengukuran harus tepat dan tidak ambigu dalam sebuah penelitian penelitian yang ideal. Tujuan ini, bagaimanapun, sering tidak dipenuhi secara keseluruhan. Dengan demikian peneliti harus sadar tentang sumber kesalahan dalam pengukuran. Berikut ini adalah kemungkinan sumber kesalahan dalam pengukuran.

Teknik Pengukuran dan Penskalaan 7 3 $ Responden: Kadang-kadang responden mungkin enggan mengungkapkan perasaan negatif yang kuat atau mungkin saja ia memiliki pengetahuan yang sangat sedikit tetapi mungkin tidak mengakui ketidaktahuannya. Semua keengganan ini cenderung menghasilkan wawancara tentang 'tebakan.' Faktor-faktor sementara seperti kelelahan, kebosanan, kecemasan, dll. Dapat membatasi kemampuan responden untuk merespon secara akurat dan penuh. $ Situasi: Faktor-faktor situasional juga dapat menghalangi pengukuran yang benar. Setiap kondisi yang menempatkan ketegangan pada wawancara dapat memiliki efek serius pada hubungan pewawancara-responden. Misalnya, jika orang lain hadir, dia dapat mengubah tanggapan dengan bergabung atau hanya dengan hadir. Jika responden merasa bahwa anonimitas tidak terjamin, dia mungkin enggan mengungkapkan perasaan tertentu. $ Measurer: Pewawancara dapat mendistorsikan tanggapan dengan menulis ulang atau mengatur ulang pertanyaan. Perilakunya, gaya dan penampilannya dapat mendorong atau menolak tanggapan tertentu dari responden. Pemrosesan mekanis yang ceroboh dapat merusak temuan. Kesalahan juga dapat merayap masuk karena pengkodean yang salah, tabulasi yang salah dan / atau perhitungan statistik, khususnya dalam tahap analisis data. $ Instrument: Kesalahan mungkin timbul karena alat ukur yang rusak. Penggunaan kata-kata kompleks, di luar pemahaman responden, makna yang ambigu, pencetakan yang buruk, ruang yang tidak memadai untuk balasan, kelalaian pilihan tanggapan, dll. Adalah beberapa hal yang membuat alat ukur rusak dan dapat mengakibatkan kesalahan pengukuran. Tipe lain dari defisiensi instrumen adalah pengambilan sampel yang buruk dari semesta item yang menjadi perhatian. Peneliti harus tahu bahwa pengukuran yang benar tergantung pada berhasil memenuhi semua masalah yang tercantum di atas. Dia harus, sejauh mungkin, mencoba untuk menghilangkan, menetralkan atau berurusan dengan semua kemungkinan sumber kesalahan sehingga hasil akhir mungkin tidak terkontaminasi.

Tes Pengukuran Suara Pengukuran suara harus memenuhi uji validitas, reliabilitas, dan kepraktisan. Sebenarnya, ini adalah tiga pertimbangan utama yang harus digunakan dalam mengevaluasi alat ukur. “Validitas mengacu pada sejauh mana suatu tes mengukur apa yang sebenarnya ingin kita ukur. Keandalan harus dilakukan dengan akurasi dan ketepatan prosedur pengukuran ... Kepraktisan berkaitan dengan berbagai faktor ekonomi, kenyamanan, dan interpretasi ... ”1 Kami secara singkat mengambil perincian yang relevan mengenai tes pengukuran suara ini . 1. Uji Validitas * Validitas adalah kriteria paling kritis dan menunjukkan sejauh mana suatu instrumen mengukur apa yang seharusnya diukur. Validitas juga dapat dianggap sebagai utilitas. Dengan kata lain, validitas adalah sejauh mana perbedaan yang ditemukan dengan alat ukur mencerminkan perbedaan nyata di antara mereka yang diuji. Tetapi timbul pertanyaan: bagaimana seseorang dapat menentukan validitas tanpa pengetahuan konfirmasi langsung? Jawabannya mungkin bahwa kami mencari bukti relevan lainnya yang menegaskan jawaban yang kami temukan dengan alat ukur kami. Apa yang relevan, bukti sering tergantung pada sifat ] Robert L. Thorndike dan Elizabeth Hagen: Pengukuran dan Evaluasi dalam Psikologi dan Pendidikan, Ed. 3, hal. 162. ] Dua bentuk validitas biasanya disebutkan dalam literatur penelitian yaitu, validitas eksternal dan validitas internal. Validitas eksternal dari temuan penelitian adalah generalisasi mereka ke populasi, pengaturan, variabel pengobatan dan variabel pengukuran. Kami akan membicarakannya dalam konteks tes signifikansi nanti. Validitas internal dari desain penelitian adalah kemampuannya untuk mengukur apa yang ingin diukur. Kita akan membahas validitas ini hanya di bab ini.

7 4Metodologi Masalah penelitianPenelitian dan penilaian dari peneliti. Tetapi seseorang dapat mempertimbangkan tiga jenis validitas dalam hubungan ini: (i) Validitas konten; (ii) Validitas terkait kriteria dan (iii) Membangun validitas.

] Validitas isi adalah sejauh mana suatu alat ukur menyediakan cakupan yang cukup dari topik yang diteliti. Jika instrumen mengandung sampel yang representatif dari alam semesta, validitas isinya bagus. Penentuannya terutama bersifat menghakimi dan intuitif. Ini juga dapat ditentukan dengan menggunakan panel orang yang akan menilai seberapa baik alat ukur memenuhi standar, tetapi tidak ada cara numerik untuk mengekspresikannya. ] Validitas terkait kriteria berhubungan dengan kemampuan kita untuk memprediksi beberapa hasil atau memperkirakan keberadaan beberapa kondisi saat ini. Bentuk validitas ini mencerminkan keberhasilan tindakan yang digunakan untuk beberapa tujuan estimasi empiris. Kriteria yang bersangkutan harus memiliki kualitas berikut: Relevansi: (Kriteria adalah relevan jika didefinisikan dalam istilah yang kami anggap sebagai ukuran yang tepat.) Kebebasan dari bias: (Kebebasan dari bias tercapai ketika kriteria memberi setiap subjek kesempatan yang sama untuk mendapatkan skor yang baik.) Keandalan: (Kriteria yang dapat diandalkan stabil atau dapat direproduksi.) Ketersediaan: (Informasi yang ditentukan oleh kriteria harus tersedia.) Faktanya, validitas terkait Kriteria adalah istilah luas yang sebenarnya mengacu pada (i) Validitas prediktif dan (ii) Validitas bersamaan. Yang pertama mengacu pada kegunaan tes dalam memprediksi beberapa kinerja masa depan sedangkan yang kedua mengacu pada kegunaan tes dalam kaitan erat dengan langkah-langkah lain yang diketahui validitas. Validitas terkait kriteria dinyatakan sebagai koefisien korelasi antara nilai tes dan beberapa ukuran kinerja masa depan atau antara nilai tes dan skor pada ukuran lain dari validitas yang diketahui. ] Membangun validitas adalah yang paling kompleks dan abstrak. Ukuran dikatakan memiliki validitas konstruk sampai pada tingkat yang menegaskan untuk memprediksi korelasi dengan proposisi teoretis lainnya. Validitas konstruk adalah sejauh mana skor pada tes dapat dipertanggungjawabkan oleh konstruksi penjelasan dari teori suara. Untuk menentukan validitas konstruk, kami mengaitkan serangkaian proposisi lain dengan hasil yang diterima dari menggunakan instrumen pengukuran kami. Jika pengukuran pada skala yang kita buat berkorelasi dengan cara prediksi dengan proposisi lainnya, kita dapat menyimpulkan bahwa ada beberapa validitas konstruk. Jika kriteria dan tes yang disebutkan di atas terpenuhi, kami dapat menyatakan bahwa alat ukur kami valid dan akan menghasilkan pengukuran yang benar; kalau tidak kita harus mencari informasi lebih lanjut dan / atau mengambil jalan untuk melaksanakan penilaian. 2. Uji Reliabilitas Uji reliabilitas adalah tes penting lainnya dari pengukuran suara. Alat ukur dapat diandalkan jika memberikan hasil yang konsisten. Alat ukur yang andal tidak berkontribusi pada validitas, tetapi instrumen yang andal tidak perlu instrumen yang valid. Misalnya, skala yang secara konsisten melebihi objek dengan lima kg., Adalah skala yang dapat diandalkan, tetapi tidak memberikan ukuran berat yang valid. Tetapi cara lain tidak benar yaitu, instrumen yang valid selalu dapat diandalkan. Oleh karena itu, keandalan tidak seberharga validitas, tetapi lebih mudah untuk menilai keandalan dibandingkan dengan validitas. Jika kualitas keandalan dipenuhi oleh instrumen, maka ketika menggunakannya kita dapat yakin bahwa faktor-faktor sementara dan situasional tidak mengganggu.

Pengukuran dan Teknik Scaling 7 5 Dua aspek keandalan yaitu, stabilitas dan kesetaraan pantas disebutkan secara khusus. Aspek stabilitas berkaitan dengan mengamankan hasil yang konsisten dengan pengukuran berulang dari orang yang sama dan dengan instrumen yang sama. Kami biasanya menentukan tingkat stabilitas dengan membandingkan hasil pengukuran berulang. Aspek kesetaraan mempertimbangkan berapa banyak kesalahan yang bisa diperkenalkan oleh peneliti yang berbeda atau sampel yang berbeda dari item yang sedang dipelajari. Cara yang baik untuk menguji kesetaraan pengukuran oleh dua peneliti adalah dengan membandingkan pengamatan mereka terhadap kejadian yang sama. Reliabilitas dapat ditingkatkan dengan dua cara berikut: ] Dengan menstandardisasi kondisi di mana pengukuran berlangsung, kita harus memastikan bahwa sumbersumber eksternal variasi seperti kebosanan, kelelahan, dll, diminimalkan sejauh mungkin. Itu akan meningkatkan aspek stabilitas. ] Dengan arahan yang dirancang secara hati-hati untuk pengukuran tanpa variasi dari kelompok ke kelompok, dengan menggunakan orang yang terlatih dan termotivasi untuk melakukan penelitian dan juga dengan memperluas sampel barang yang digunakan. Ini akan meningkatkan aspek kesetaraan. D Test of Practicality Karakteristik kepraktisan dari suatu alat ukur dapat dinilai dari segi ekonomi, kenyamanan dan interpretabilitas. Dari sudut pandang operasional, alat ukur harus praktis yaitu, harus ekonomis, nyaman dan dapat diinterpretasikan. Pertimbangan ekonomi menunjukkan bahwa beberapa trade-off diperlukan antara proyek penelitian yang ideal dan apa yang dapat dibiayai oleh anggaran. Panjang alat ukur adalah area penting di mana tekanan ekonomi cepat terasa. Meskipun lebih banyak item memberikan keandalan yang lebih besar seperti yang disebutkan sebelumnya, tetapi untuk membatasi wawancara atau waktu observasi, kami hanya perlu mengambil beberapa item untuk tujuan studi kami. Demikian pula, metode pengumpulan data yang akan digunakan juga bergantung pada faktor ekonomi. Tes kenyamanan menunjukkan bahwa alat ukur harus mudah dikelola. Untuk tujuan ini orang harus memberikan perhatian yang tepat untuk tata letak alat ukur yang tepat. Misalnya, kuesioner, dengan instruksi yang jelas (diilustrasikan oleh contoh), tentu lebih efektif dan lebih mudah untuk diselesaikan daripada yang tidak memiliki fitur-fitur ini. Pertimbangan interpretasi secara khusus penting ketika orang-orang selain para perancang tes tersebut menginterpretasikan hasil. Alat ukur, agar dapat ditafsirkan, harus dilengkapi dengan (a) instruksi terperinci untuk mengelola tes; ] kunci penskoran; (C) bukti tentang keandalan dan (d) panduan untuk menggunakan tes dan untuk

menafsirkan hasil.

TEKNIK MENGEMBANGKAN ALAT PENGUKURAN Teknik mengembangkan alat pengukuran melibatkan proses empat tahap, yang terdiri dari berikut: ] Pengembangan konsep; ] Spesifikasi dimensi konsep; ] Pemilihan indikator; dan] Pembentukan indeks. Langkah pertama dan terpenting adalah pengembangan konsep yang berarti bahwa peneliti harus sampai pada pemahaman tentang konsep-konsep utama yang berkaitan dengan studinya. Langkah konsep

7 7Metodologi Penelitian pengembanganlebih jelas dalam studi teoritis daripada dalam penelitian yang lebih pragmatis, di mana konsep-konsep dasar sering sudah ditetapkan. Langkah kedua mengharuskan peneliti untuk menentukan dimensi konsep yang ia kembangkan pada tahap pertama. Tugas ini dapat dicapai dengan deduksi yaitu, dengan mengadopsi pendekatan yang kurang lebih intuitif atau dengan korelasi empiris dari dimensi individual dengan konsep total dan / atau konsep lainnya. Misalnya, seseorang mungkin memikirkan beberapa dimensi seperti reputasi produk, perlakuan pelanggan, kepemimpinan perusahaan, kepedulian terhadap individu, rasa tanggung jawab sosial dan sebagainya ketika seseorang memikirkan citra perusahaan tertentu. Begitu dimensi konsep telah ditentukan, peneliti harus mengembangkan indikator untuk mengukur setiap elemen konsep. Indikator adalah pertanyaan spesifik, skala, atau perangkat lain di mana pengetahuan, opini, harapan, dll. Responden diukur. Karena jarang ada ukuran sempurna dari sebuah konsep, peneliti harus mempertimbangkan beberapa alternatif untuk tujuan tersebut. Penggunaan lebih dari satu indikator memberikan stabilitas pada skor dan juga meningkatkan validitasnya. Langkah terakhir adalah menggabungkan berbagai indikator ke dalam indeks, yaitu pembentukan indeks. Ketika kami memiliki beberapa dimensi konsep atau pengukuran dimensi yang berbeda, kami mungkin perlu menggabungkannya ke dalam satu indeks. Salah satu cara sederhana untuk mendapatkan indeks secara keseluruhan adalah memberikan nilai skala pada respons dan kemudian menjumlahkan skor yang sesuai. Indeks keseluruhan seperti itu akan menyediakan alat pengukuran yang lebih baik daripada indikator tunggal karena fakta bahwa "indikator individu hanya memiliki kemungkinan hubungan dengan apa yang benar-benar ingin kita ketahui." 2 Dengan cara ini kita harus mendapatkan indeks keseluruhan untuk berbagai konsep. mengenai studi penelitian.

Scaling Dalam penelitian kami cukup sering menghadapi masalah pengukuran (karena kami ingin pengukuran yang valid tetapi tidak dapat memperolehnya), khususnya ketika konsep yang diukur bersifat kompleks dan abstrak dan kami tidak memiliki alat pengukuran standar. Atau, kita dapat mengatakan bahwa ketika mengukur sikap dan pendapat, kita menghadapi masalah pengukuran valid mereka. Masalah serupa mungkin dihadapi oleh seorang peneliti, tentu saja dalam tingkat yang lebih rendah, ketika mengukur konsep fisik atau kelembagaan. Karena itu kita harus mempelajari beberapa prosedur yang memungkinkan kita untuk mengukur konsep abstrak dengan lebih akurat. Ini membawa kita pada studi tentang teknik penskalaan.

Arti Scaling Scaling menjelaskan prosedur menetapkan angka ke berbagai derajat pendapat, sikap dan konsep lainnya. Ini dapat dilakukan dengan dua cara yaitu, (i) membuat penilaian tentang beberapa karakteristik individu dan kemudian menempatkannya secara langsung pada skala yang telah didefinisikan dalam hal karakteristik itu dan (ii) membangun kuesioner sedemikian rupa sehingga skor tanggapan individu memberinya tempat dalam skala. Dapat dinyatakan di sini bahwa skala adalah sebuah kontinum, yang terdiri dari titik tertinggi (dalam hal beberapa karakteristik misalnya, preferensi, favorit, dll.) Dan titik terendah bersama dengan beberapa titik antara antara dua titik ekstrim ini. Posisi skala-titik ini sangat terkait satu sama lain sehingga ketika titik pertama terjadi menjadi titik tertinggi, titik kedua menunjukkan tingkat yang lebih tinggi dalam hal karakteristik tertentu dibandingkan dengan yang ketiga ] Lazersfeld, Bukti dan Inferensi, hal. 112.

Pengukuran dan Teknik Scaling 7 7 titik dan titik ketiga menunjukkan tingkat yang lebih tinggi dibandingkan dengan keempat dan seterusnya. Bilangan untuk mengukur perbedaan derajat dalam sikap / pendapat, dengan demikian, diberikan kepada individu yang bersesuaian dengan posisi skala mereka. Semua ini lebih baik dipahami ketika kita berbicara tentang teknik scaling (s). Oleh karena itu istilah 'skala' diterapkan pada prosedur untuk mencoba menentukan ukuran kuantitatif konsep abstrak subjektif. Penskalaan telah didefinisikan sebagai "prosedur untuk penugasan angka (atau simbol lain) untuk properti objek dalam rangka untuk memberikan beberapa karakteristik angka ke properti yang bersangkutan." 3

Klasifikasi Klasifikasi Basa Nomor menugaskan prosedur atau prosedur skala dapat secara luas diklasifikasikan pada satu atau lebih dari basis berikut: (a) orientasi subjek; (b) formulir tanggapan; (c) tingkat subjektivitas; ] sifat skala; (E) jumlah dimensi dan (f) teknik konstruksi skala. Kami mengambil masing -masing secara terpisah. $ Subyek orientasi: Di bawahnya skala dapat dirancang untuk mengukur karakteristik responden yang menyelesaikannya atau untuk menilai objek stimulus yang disajikan kepada responden. Dalam hal yang pertama, kami menganggap bahwa rangsangan yang disajikan cukup homogen sehingga variasi antara rangsangan kecil dibandingkan dengan variasi di antara responden. Dalam pendekatan yang terakhir, kami meminta responden untuk menilai beberapa objek tertentu dalam satu atau lebih dimensi dan kami menganggap bahwa variasi antara-responden akan kecil dibandingkan dengan variasi antara rangsangan yang berbeda yang disajikan kepada responden untuk dinilai. $ Response form: Di bawah ini kami dapat mengklasifikasikan skala sebagai kategori dan komparatif. Skala kategorik juga dikenal sebagai skala penilaian. Skala ini digunakan ketika responden menilai beberapa objek tanpa referensi langsung ke objek lain. Di bawah skala komparatif, yang juga dikenal sebagai skala peringkat, responden diminta untuk membandingkan dua atau lebih objek. Dalam pengertian ini responden dapat menyatakan bahwa satu objek lebih unggul dari yang lain atau bahwa tiga model peringkat pena dalam urutan 1, 2 dan 3. Inti dari peringkat adalah, pada kenyataannya, perbandingan relatif dari properti tertentu dari dua atau lebih objek. Tingkat subjektivitas: Dengan basis ini data skala dapat didasarkan pada apakah kita mengukur preferensi pribadi subjektif atau hanya membuat penilaian non-preferensi. Dalam kasus sebelumnya, responden diminta untuk memilih orang yang dia sukai atau solusi mana yang ingin dia temui, sedangkan dalam kasus terakhir dia hanya diminta untuk menilai orang mana yang lebih efektif dalam beberapa aspek atau solusi mana yang akan mengambil lebih sedikit sumber daya tanpa mencerminkan preferensi pribadi apa pun. Properti skala: Mempertimbangkan sifat skala, seseorang dapat mengklasifikasikan skala sebagai nominal, ordinal, skala interval dan rasio. Skala nominal hanya mengklasifikasikan tanpa menunjukkan urutan, jarak atau asal yang unik. Skala ordinal menunjukkan hubungan magnitudo 'lebih dari' atau 'kurang dari', tetapi tidak menunjukkan jarak atau asal yang unik. Skala interval memiliki baik nilai pesanan dan jarak, tetapi tidak ada asal yang unik. Skala rasio memiliki semua fitur ini. Jumlah dimensi: Sehubungan dengan dasar ini, skala dapat diklasifikasikan sebagai 'unidimensional' dan skala 'multidimensional'. Di bawah yang pertama kita mengukur hanya satu atribut dari responden atau objek, sedangkan skala multidimensi mengakui bahwa suatu objek dapat digambarkan lebih baik dengan menggunakan konsep ruang atribut dari dimensi 'n', daripada sebuah kesatuan dimensi tunggal. Bernard S. Phillips, Strategi dan Taktik Penelitian Sosial, edisi kedua, hal. 205.

78

Metodologi Penelitian

Teknik konstruksi skala: Berikut ini adalah lima teknik utama yang dengannya skala bisa dikembangkan. Pendekatan sewenang-wenang: Ini adalah pendekatan di mana skala dikembangkan secara ad hoc . Ini adalah pendekatan yang paling banyak digunakan. Diperkirakan bahwa timbangan semacam itu mengukur konsep-konsep yang telah mereka rancang, meskipun ada sedikit bukti untuk mendukung asumsi semacam itu.

Pendekatan konsensus: Di sini panel hakim mengevaluasi item yang dipilih untuk dimasukkan dalam instrumen dalam hal apakah mereka relevan dengan area topik dan tidak ambigu dalam implikasinya. Pendekatan analisis item: Di bawahnya sejumlah item individual dikembangkan menjadi tes yang diberikan kepada sekelompok responden. Setelah melakukan tes, total skor dihitung untuk setiap tes. Item individual kemudian dianalisis untuk menentukan item mana yang membedakan antara orang atau objek dengan skor total yang tinggi dan skor rendah.

Skala kumulatif dipilih berdasarkan kesesuaiannya dengan beberapa peringkat item dengan kekuatan diskriminatif naik dan turun. Misalnya, dalam skala sedemikian, pengesahan item yang mewakili posisi ekstrem juga harus menghasilkan dukungan semua item yang menunjukkan posisi yang kurang ekstrem. Faktor timbangan dapat dibangun atas dasar interkorelasi item yang menunjukkan bahwa faktor umum menyumbang hubungan antar item. Hubungan ini biasanya diukur melalui metode analisis faktor.

Teknik Skala Penting Saat ini kami mengambil beberapa teknik skala penting yang sering digunakan dalam konteks penelitian khususnya dalam konteks penelitian sosial atau bisnis. Skala penilaian: Skala penilaian melibatkan deskripsi kualitatif dari sejumlah aspek a hal atau sifat seseorang. Ketika kami menggunakan skala penilaian (atau skala kategorikal), kami menilai suatu objek secara absolut terhadap beberapa kriteria tertentu yaitu, kami menilai properti objek tanpa referensi ke objek serupa lainnya. Peringkat ini mungkin dalam bentuk seperti "suka tidak suka", "di atas rata-rata, rata-rata, di bawah rata-rata", atau klasifikasi lain dengan lebih banyak kategori seperti "sangat suka — seperti apa yang — netral — agak tidak suka — sangat tidak suka" ; "Luar biasa — bagus — rata-rata — di bawah rata-rata — miskin", "selalu — sering — kadang-kadang — jarang — tidak pernah", dan seterusnya. Tidak adakhusus

aturanapakah akan menggunakan skala dua poin, skala tiga poin atau skala dengan lebih banyak poin. Dalam prakteknya, skala tiga hingga tujuh poin umumnya digunakan untuk alasan sederhana bahwa lebih banyak poin pada skala memberikan peluang untuk sensitivitas pengukuran yang lebih besar. Skala penilaian dapat berupa skala peringkat grafis atau skala peringkat yang diperinci.

Skala penilaian grafis cukup sederhana dan umumnya digunakan dalam praktik. Di bawahnya berbagai titik biasanya diletakkan di sepanjang garis untuk membentuk sebuah kontinum dan penilai menunjukkan peringkatnya hanya dengan membuat tanda (seperti

ü)

pada titik yang tepat pada garis yang membentang dari satu ekstrem ke ujung lainnya. Titik skala dengan deskripsi singkat dapat diindikasikan di sepanjang garis, fungsinya adalah untuk membantu penilai dalam melakukan pekerjaannya. Berikut ini adalah contoh skala peringkat lima poin grafis ketika kita ingin memastikan orang menyukai atau tidak menyukai produk apa pun:

Teknik Pengukuran dan Skala

79 Bagaimana Anda menyukai produk? (Silakan periksa)

S e p e r t i

Seperti beberapa

Netral

Dislike beberapa sangat

Dislike

apa apa yang

banyak

s a n g a t

b a n y a k

Gambar. 5.1

Jenis skala memiliki beberapa keterbatasan. Responden dapat memeriksa hampir semua posisi di sepanjang garis yang fakta dapat meningkatkan kesulitan analisis. Arti dari istilah seperti "sangat banyak" dan "beberapa apa" mungkin tergantung pada kerangka acuan responden begitu banyak sehingga pernyataan itu mungkin ditantang dalam hal kesetaraannya. Beberapa varian skala peringkat lainnya (misalnya, kotak menggantikan baris) juga dapat digunakan. Rating diperinci skala (juga dikenal sebagai skala numerik) menyajikan serangkaian pernyataan dari mana responden memilih satu sebagai yang terbaik mencerminkan evaluasinya. Pernyataan-pernyataan ini diperintahkan secara bertahap dalam hal lebih atau kurang dari beberapa properti. Contoh skala terperinci dapat diberikan untuk mengilustrasikannya. Misalkan kita ingin menanyakan seberapa baik seorang pekerja bergaul dengan rekan kerjanya? Dalam situasi seperti itu kita dapat meminta responden untuk memilih satu, untuk menyatakan pendapatnya, dari yang berikut:

Dia hampir selalu terlibat dalam beberapa gesekan dengan sesama pekerja. Dia sering berselisih dengan satu atau lebih rekan kerjanya. Dia kadang terlibat dalam friksi.

Dia jarang terlibat dalam gesekan dengan orang lain. Dia hampir tidak pernah terlibat dalam perselisihan dengan sesama pekerja. Keunggulan utama dari jenis skala ini adalah bahwa ia menyediakan lebih banyak informasi dan arti bagi penilai, dan dengan demikian meningkatkan keandalan. Formulir ini relatif sulit untuk dikembangkan dan pernyataannya mungkin tidak mengatakan dengan tepat apa yang ingin diungkapkan oleh responden. Skala penilaian memiliki poin bagus. Hasil yang diperoleh dari penggunaannya lebih baik dibandingkan dengan metode alternatif. Mereka membutuhkan lebih sedikit waktu, menarik untuk digunakan dan memiliki berbagai aplikasi. Selain itu, mereka juga dapat digunakan dengan sejumlah besar properti atau variabel. Tetapi nilai mereka untuk tujuan pengukuran bergantung pada asumsi bahwa responden dapat dan memang membuat penilaian yang baik. Jika responden tidak terlalu berhati-hati saat memberi peringkat, kesalahan dapat terjadi. Tiga jenis kesalahan yang umum yaitu, kesalahan kelonggaran, kesalahan kecenderungan sentral dan kesalahan efek hallo. Kesalahan kelonggaran terjadi ketika responden tertentu baik penilai mudah atau penilai keras. Ketika penilai enggan memberikan penilaian ekstrem, hasilnya adalah kesalahan tendensi sentral. Kesalahan efek hallo atau bias sistematis terjadi ketika penilai membawa lebih dari kesan umum subjek dari satu peringkat ke yang lain. Kesalahan semacam ini terjadi ketika kita menyimpulkan misalnya, bahwa laporan tertentu baik karena kita menyukai bentuknya atau bahwa seseorang itu cerdas karena dia setuju dengan kita atau memiliki kepribadian yang menyenangkan. Dengan kata lain, efek hallo mungkin muncul ketika penilai diminta untuk menilai banyak faktor, pada sejumlah yang dia tidak memiliki bukti untuk penilaian.

80

Metodologi Penelitian

Skala peringkat: Di bawah skala peringkat (atau timbangan komparatif) kami membuat penilaian relatif terhadap objek serupa lainnya. Para responden di bawah metode ini secara langsung membandingkan dua atau lebih objek dan membuat pilihan di antara mereka. Ada dua pendekatan yang umum digunakan dalam skala peringkat yaitu.

Metode perbandingan berpasangan: Di bawahnya responden dapat mengungkapkan sikapnya dengan membuat a pilihan antara dua benda, katakanlah antara rasa baru minuman ringan dan minuman bermerek. Tapi ketika ada lebih dari dua rangsangan untuk menilai, jumlah penilaian yang diperlukan dalam perbandingan yang dipasangkan diberikan oleh rumus:

= n b n - 1g 2 di

mana

N = jumlah penilaian

n = jumlah rangsangan atau benda yang akan dinilai. Misalnya, jika ada sepuluh saran untuk proposal tawar-menawar yang tersedia bagi serikat pekerja, ada 45 perbandingan berpasangan yang dapat dilakukan dengan mereka. Ketika N menjadi tokoh besar, ada risiko responden memberikan jawaban yang dianggap buruk atau bahkan menolak untuk menjawab. Kita dapat mengurangi jumlah perbandingan per responden baik dengan mempresentasikan kepada masing-masing hanya sampel rangsangan atau dengan memilih beberapa objek yang mencakup berbagai daya tarik pada interval yang sama dan kemudian membandingkan semua rangsangan lain untuk beberapa objek standar ini. Dengan demikian, data pasanganperbandingan dapat diperlakukan dengan beberapa cara. Jika ada konsistensi substansial, kita akan menemukan bahwa jika X lebih disukai untuk Y,dan Y untuk Z,maka X akan secara konsisten lebih disukai untuk Z.Jika ini benar, kita dapat mengambil jumlah total preferensi di antara perbandingan sebagai skor untuk stimulus itu. Harus diingat bahwa perbandingan berpasangan menyediakan data ordinal, tetapi hal yang sama dapat diubah menjadi skala interval dengan metode Hukum Penghakiman Perbandingan yang dikembangkan oleh

Thurstone. Teknik ini melibatkan konversi frekuensi preferensi ke dalam tabel proporsi yang kemudian diubah menjadi Z matriksdengan mengacu pada tabel area di bawah kurva normal. JP Guilford dalam bukunya "Metode Psikometri" telah memberikan prosedur yang relatif lebih mudah. Metode ini dikenal sebagai Metode Standar Komposit dan dapat diilustrasikan sebagai di bawah: Misalkan ada empat proposal yang dipertimbangkan oleh beberapa komite perundingan serikat. Panitia ingin tahu bagaimana keanggotaan serikat menyusun proposal ini. Untuk tujuan ini, sebuah sampel yang terdiri dari 100 anggota dapat mengungkapkan pandangan seperti yang ditunjukkan dalam tabel berikut:

Tabel 5.1:

Pola Respon dari 100 Anggota 'Perbandingan Berpasangan dari 4 Saran untuk Saran Usulan Union Usgaining

Usulan A A B C D

40 45 80 TOTAL :

165

B

C

D

50 20

32 38 98

20 42 70 -

135

168

132

65

*

-

Contd. *

Baca 65 anggota disukai saran B untuk saran A.

8 1

Pengukuran dan Scaling Teknik Ranking rangka

M p

Zj Rj

2

3

1

4

0,53 75

0,462 5

0,54 50

0,4550

0,09

(-). 09

0.11

(-). 11

0,20

0,02

0,22

0.00

Membandingkan jumlah total preferensi untuk masing-masing empat proposal , kami menemukan bahwa C adalah yang paling populer, diikuti oleh A,, B dan D masing-masing dalam popularitas. Urutan peringkat yang ditunjukkan pada tabel di atas menjelaskan semua ini. Dengan mengikuti metode standar gabungan, kita dapat mengembangkan skala interval dari data ordinal perbandingan berpasangan yang diberikan dalam tabel di atas yang tujuannya kita harus mengadopsi langkah-langkah berikut dalam urutan: Dengan menggunakan data dalam tabel di atas, kita mencari tahu kolom artinya dengan bantuan rumus yang diberikan di bawah ini: C+ 165 +

bN

.5

.5

g Mp =

nN

b100 g

=

4 100

= .5375

bg di mana Mp = proporsi rata-rata kolom C = jumlah total pilihan untuk saran yang diberikan n = jumlah rangsangan (proposal dalam masalah yang diberikan) N = jumlah item dalam sampel. Sarana kolom telah ditunjukkan dalam Mp baris dalam tabel di atas. Z Nilai-nilaiuntuk Mp dijamin dari tabel memberikan area di bawah kurva normal. Ketika Mp nilaikurang dari 0,5, Z nilainegatif dan untuk semua Mp nilai lebih tinggi dari

0,5, Z nilai-nilaipositif.* Nilai-nilai Z ini ditampilkan dalam Zj barisdi tabel di atas. Karena Zj nilai-nilaimerepresentasikan skala interval, nol adalah nilai arbitrer. Maka kita dapat menghilangkan nilai skala negatif dengan memberikan nilai nol ke nilai skala terendah (ini adalah (-). 11 dalam contoh kita yang akan kita ambil sama dengan nol) dan kemudian menambahkan nilai absolut dari nilai skala terendah ini ke semua item skala lainnya. Skala ini telah ditunjukkan dalam Rj barisdi tabel di atas. Secara grafis kami dapat menunjukkan skala interval ini yang kami peroleh dari data perbandingan berpasangan menggunakan metode standar komposit sebagai berikut: DB

0, 0

AC

0, 1

0,2

0, 3

0,4

Gambar. 5.2 Untuk menggunakan tabel area kurva normal untuk jenis transformasi ini, kita harus mengurangi 0,5 dari seluruh Mp nilaiyang melebihi

0,5 untuk mengamankan nilai-nilai yang dapat digunakan untuk masuk ke area kurva meja yang normal yang Z nilaidapat diperoleh. Untuk semua Mp nilaikurang dari. 5 kita harus mengurangi semua nilai-nilai tersebut dari 0,5 untuk mengamankan nilai-nilai yang digunakan untuk memasuki tabel area kurva normal yang mana Z nilai-nilaidapat diperoleh tetapi Z nilai-nilaidalam situasi ini akan dengan tanda negatif.

82

Metodologi Penelitian

Metode urutan peringkat: Di bawah metode ini skala komparatif, responden diminta untuk menentukan peringkat pilihan mereka. Metode ini lebih mudah dan lebih cepat daripada metode perbandingan yang dipasangkan di atas. Misalnya, dengan 10 item dibutuhkan 45 pair perbandingan untuk menyelesaikan tugas, sedangkan metode urutan peringkat hanya membutuhkan peringkat 10 item saja. Masalah transitivitas (seperti A lebih memilih B, B to C, tetapi C lebih suka A) juga tidak ada jika kita mengadopsi metode urutan peringkat. Selain itu, peringkat yang lengkap kadang tidak diperlukan dalam hal ini responden mungkin diminta untuk memberi peringkat hanya yang pertama, katakanlah, empat pilihan sementara jumlah keseluruhan item yang terlibat mungkin lebih dari empat, katakanlah, itu mungkin 15 atau 20 atau lebih. Untuk mengamankan peringkat sederhana dari semua item yang terlibat, kami hanya total nilai peringkat yang diterima oleh setiap item. Ada beberapa metode yang dapat kita gunakan untuk mengembangkan skala interval dari data ini. Tetapi ada keterbatasan metode ini. Yang pertama adalah bahwa data yang diperoleh melalui metode ini adalah data ordinal dan karenanya urutan peringkat adalah skala ordinal dengan segala keterbatasannya. Maka mungkin ada masalah responden menjadi ceroboh dalam menetapkan peringkat terutama ketika ada banyak (biasanya lebih dari 10) item.

Teknik Konstruksi Skala Dalam studi ilmu sosial, sementara mengukur sikap orang-orang kita umumnya mengikuti teknik mempersiapkan opinionnaire* (atau skala sikap) sedemikian rupa sehingga skor tanggapan individu memberi dia tempat pada skala. Berdasarkan pendekatan ini, responden menyatakan persetujuan atau ketidaksepakatannya dengan sejumlah pernyataan yang relevan dengan masalah tersebut. Ketika mengembangkan pernyataan seperti itu, peneliti harus mencatat dua poin berikut: Bahwa pernyataan harus mendapatkan tanggapan yang secara psikologis terkait dengan sikap yang diukur; Bahwa pernyataan perlu sedemikian sehingga mereka tidak hanya membedakan antara sikap ekstrim tetapi juga di antara individu yang sedikit berbeda. Para peneliti juga harus menyadari bahwa menyimpulkan sikap dari apa yang telah dicatat dalam opinionnaires memiliki beberapa keterbatasan. Orang dapat menyembunyikan sikap mereka dan mengekspresikan pendapat yang diterima secara sosial. Mereka mungkin tidak benar-benar tahu bagaimana perasaan mereka tentang masalah sosial. Orang mungkin tidak menyadari sikap mereka tentang situasi abstrak; sampai dihadapkan dengan situasi nyata, mereka mungkin tidak dapat memprediksi reaksi mereka. Bahkan perilaku itu sendiri kadang-kadang bukan merupakan indikasi sikap yang sebenarnya. Misalnya, ketika politisi mencium bayi, perilaku mereka mungkin bukan ekspresi kasih sayang yang sebenarnya terhadap bayi. Jadi, tidak ada metode pengukuran sikap yang pasti; kami hanya mencoba mengukur pendapat yang diungkapkan dan kemudian menarik kesimpulan dari itu tentang perasaan atau sikap nyata orang lain.

Dengan semua keterbatasan ini dalam pikiran, psikolog dan sosiolog telah mengembangkan beberapa teknik konstruksi skala untuk tujuan tersebut. Peneliti harus mengetahui teknik-teknik ini sehingga dapat mengembangkan skala yang sesuai untuk studinya sendiri. Beberapa pendekatan penting, bersama dengan skala yang dikembangkan di bawah masing-masing pendekatan untuk mengukur sikap adalah sebagai berikut:

Suatu bentuk informasi yang mencoba mengukur sikap atau keyakinan seorang individu dikenal sebagai opinionnaire.

8 3

Teknik Pengukuran dan Penskalaan Tabel 5.2: Skala yang berbeda untuk Mengukur Sikap Orang Nama pendekatan skala konstruksi

Nama skala yang dikembangkan

1. 2.

Pendekatan Pendekatan skala konsensus Skala

3.

Pendekatan analisis item

4. 5.

Pendekatan skala Pendekatan analisis

arbitrer Skala arbitrer diferensial (sepertiThurstone skala Diferensial) Skala yang dinaikkan (seperti Skala Likert ) kumulatif Skala kumulatif (seperti Skalogram Guttman) faktor Skala faktor (seperti Osgood's Semantic Differential, Multi-dimensi Scaling, dll)

Deskripsi singkat dari masing-masing skala yang tercantum di atas akan sangat membantu. Timbanganwenang Skala Sewenang-arbitrer dikembangkan secara ad hoc dan dirancang sebagian besar melalui pemilihan subyektif para peneliti sendiri. Peneliti pertama mengumpulkan beberapa pernyataan atau item yang menurutnya tidak ambigu dan sesuai dengan topik yang diberikan. Beberapa di antaranya dipilih untuk dimasukkan dalam alat ukur dan kemudian orang diminta untuk memeriksa daftar pernyataan yang mereka setujui. Keunggulan utama dari skala tersebut adalah bahwa mereka dapat dikembangkan dengan sangat mudah, cepat dan dengan biaya yang relatif lebih sedikit. Mereka juga dapat dirancang untuk menjadi sangat spesifik dan memadai. Karena manfaat ini, skala tersebut banyak digunakan dalam praktik. Pada saat yang sama ada beberapa batasan dari timbangan ini. Yang paling penting adalah bahwa kita tidak memiliki bukti objektif bahwa skala semacam itu mengukur konsep yang telah mereka kembangkan. Kami hanya mengandalkan wawasan dan kompetensi peneliti. Timbangan-Timbangan Diferensial (atau Skala-Skala Tipe-Thurstone) Nama LL Thurstone dikaitkan dengan skala-skala diferensial yang telah dikembangkan menggunakan pendekatan skala konsensus. Di bawah pendekatan semacam itu pemilihan item dibuat oleh panel hakim yang mengevaluasi item dalam hal apakah mereka relevan dengan area topik dan tidak ambigu dalam implikasinya. Prosedur rinci adalah sebagai berikut: Peneliti mengumpulkan sejumlah besar pernyataan, biasanya dua puluh atau lebih, yang mengungkapkan berbagai sudut pandang terhadap kelompok, lembaga, ide, atau praktik (yaitu, pernyataan milik bidang topik). Pernyataan-pernyataan ini kemudian diserahkan ke panel hakim, masing-masing mengaturnya dalam sebelas kelompok atau tumpukan mulai dari satu ekstrem ke yang

lain dalam posisi. Masing-masing hakim diminta untuk menempatkan secara umum dalam tumpukan pertama pernyataan yang menurutnya paling tidak menguntungkan untuk masalah ini, di tumpukan kedua untuk menempatkan pernyataan-pernyataan yang menurutnya paling tidak menguntungkan berikutnya dan dia terus melakukannya dengan cara ini sampai di tumpukan kesebelas ia menempatkan pernyataan yang dianggapnya paling menguntungkan. Penyortiran ini oleh masing-masing hakim menghasilkan posisi komposit untuk masingmasing item. Dalam kasus perselisihan yang ditandai antara hakim dalam menetapkan posisi ke suatu item, item tersebut dibuang.

84

Metodologi Penelitian Untuk item yang dipertahankan, masing-masing diberi nilai skala median antara satu dan sebelas sebagaimana ditetapkan oleh panel. Dengan kata lain, nilai skala dari salah satu pernyataan dihitung sebagai posisi 'median' yang ditugaskan oleh kelompok hakim. Pilihan akhir dari pernyataan kemudian dibuat. Untuk tujuan ini, contoh pernyataan, yang skor medannya tersebar secara merata dari satu ekstrem ke ekstrem lainnya diambil. Pernyataan yang dipilih, merupakan skala terakhir yang akan diberikan kepada responden. Posisi setiap pernyataan pada skala sama dengan yang ditentukan oleh hakim.

Setelah mengembangkan skala sebagaimana dinyatakan di atas, responden diminta selama administrasi skala untuk memeriksa pernyataan yang mereka setujui. Nilai tengah dari pernyataan yang mereka periksa berhasil dan ini menetapkan skor mereka atau mengukur pendapat mereka. Dapat dicatat bahwa dalam instrumen sebenarnya, pernyataan disusun dalam urutan acak nilai skala. Jika nilai-nilai valid dan jika daftar pendapat hanya membahas satu dimensi sikap, responden umumnya akan memilih satu atau beberapa butir yang bersebelahan (dalam hal nilai skala) untuk mencerminkan pandangannya. Namun, kadang-kadang penyimpangan dapat terjadi ketika sebuah pernyataan muncul untuk mengetuk dimensi sikap yang berbeda.

Metode Thurstone telah banyak digunakan untuk mengembangkan skala diferensial yang digunakan untuk mengukur sikap terhadap berbagai masalah seperti perang, agama, dll. Skala semacam ini dianggap paling tepat dan dapat diandalkan ketika digunakan untuk mengukur satu sikap. Tetapi pencegah yang penting untuk mereka gunakan adalah biaya dan upaya yang diperlukan untuk mengembangkannya. Kelemahan lain dari skala tersebut adalah bahwa nilainilai yang diberikan untuk berbagai pernyataan oleh para hakim dapat mencerminkan sikap mereka sendiri. Metode ini tidak sepenuhnya obyektif; itu melibatkan proses pengambilan keputusan yang paling subyektif. Kritik terhadap metode ini juga berpendapat bahwa beberapa desain skala lain memberikan lebih banyak informasi tentang sikap responden dibandingkan dengan skala diferensial. Summated Scales (atau Likert-type Scales) Summated scale (atau skala Likert-type) dikembangkan dengan menggunakan pendekatan analisis item dimana item tertentu dievaluasi berdasarkan seberapa baik ia mendiskriminasi orang-orang yang total skornya tinggi dan mereka yang nilainya rendah. Barang-barang atau pernyataan yang paling sesuai dengan tes diskriminasi semacam ini termasuk dalam instrumen akhir. Dengan demikian, skala yang terangkum terdiri dari sejumlah pernyataan yang mengungkapkan sikap yang baik atau tidak baik terhadap objek yang diberikan yang diminta responden untuk bereaksi. Responden menunjukkan persetujuan atau ketidaksepakatannya dengan setiap pernyataan dalam instrumen. Setiap respons diberi skor numerik, yang menunjukkan kemampuannya atau ketidakberdayaan, dan skornya dihitung untuk mengukur sikap responden. Dengan kata lain, skor keseluruhan merepresentasikan posisi responden pada kontinum ketidakberuntungan yang menguntungkan terhadap suatu masalah.

Skala terpanjang yang paling sering digunakan dalam studi tentang sikap sosial mengikuti pola yang dirancang oleh Likert. Untuk alasan ini mereka sering disebut sebagai skala Likerttype. Dalam skala Likert, responden diminta untuk menanggapi setiap pernyataan dalam beberapa derajat, biasanya lima derajat (tetapi pada waktu 3 atau 7 dapat juga digunakan) dari kesepakatan atau ketidaksepakatan. Sebagai contoh, ketika diminta untuk menyatakan pendapat apakah seseorang menganggap pekerjaannya cukup menyenangkan, responden dapat menanggapi dengan salah satu cara berikut: (i) sangat setuju, (ii) setuju, (iii) tidak menentukan, (iv) tidak setuju, ( v) sangat tidak setuju.

Teknik Pengukuran danScaling Techniques)

85

Skala (Kami menemukan bahwa kelima poin ini merupakan skala. Pada satu ekstrim dari skala ada kesepakatan yang kuat dengan pernyataan yang diberikan dan di sisi lain, ketidaksepakatan yang kuat, dan di antara keduanya terdapat titik tengah. Kami dapat mengilustrasikan ini sebagai di bawah:

S Setuju a n(2) Tidak g a t

Tidak Setuju Diputuskan

(4) (3)

s e t u j u

S a n g a t t i d a k s e t u j u

( 1 )

( 5 )

Gambar 5.3

Setiap titik pada skala membawa skor. Tanggapan yang menunjukkan tingkat kepuasan kerja paling rendah diberikan skor paling sedikit (katakanlah 1) dan yang paling disukai diberi skor tertinggi (katakanlah 5). Nilai ini — nilai-nilai biasanya tidak dicetak pada instrumen tetapi ditampilkan di sini hanya untuk menunjukkan pola penilaian. Teknik skala Likert, dengan demikian, menetapkan nilai skala untuk masing-masing dari lima tanggapan. Hal yang sama dilakukan berkenaan dengan masing-masing dan setiap pernyataan dalam instrumen. Dengan cara ini instrumen menghasilkan skor total untuk setiap responden, yang kemudian akan mengukur kesukaan responden terhadap sudut pandang yang diberikan. Jika instrumen terdiri dari, katakan 30 pernyataan, nilai-nilai skor berikut akan mengungkap. 30 × 5 = 150 Respon yang paling menguntungkan mungkin 30 × 3 = 90 Sikap netral 30 × 1 = 30 Sikap yang paling tidak baik.

Skor untuk setiap individu akan jatuh antara 30 dan 150. Jika skor yang terjadi di atas 90, itu menunjukkan pendapat yang menguntungkan ke sudut pandang yang diberikan, skor di bawah 90 akan berarti opini yang tidak menguntungkan dan skor tepat 90 akan sugestif. sikap netral. Prosedur: Prosedur untuk mengembangkan skala Likert-type adalah sebagai berikut: Sebagai langkah pertama, peneliti mengumpulkan sejumlah besar pernyataan yang relevan dengan sikap yang sedang dipelajari dan masing-masing pernyataan mengungkapkan favourableness yang pasti atau ketidakberdayaan ke titik tertentu. pandangan atau sikap dan bahwa jumlah pernyataan yang menguntungkan dan tidak menguntungkan kira-kira sama. Setelah pernyataan dikumpulkan, uji coba harus dilakukan pada sejumlah subjek. Dengan kata lain, sekelompok kecil orang, dari mereka yang akan dipelajari akhirnya, diminta untuk menunjukkan tanggapan mereka terhadap setiap pernyataan dengan memeriksa salah satu kategori kesepakatan atau ketidaksepakatan menggunakan skala lima poin seperti yang disebutkan di atas. Tanggapan terhadap berbagai pernyataan diberi skor sedemikian rupa sehingga tanggapan yang menunjukkan sikap yang paling baik diberikan skor tertinggi 5 dan bahwa dengan sikap yang paling tidak baik diberikan nilai terendah, katakanlah, dari 1. Kemudian total skor setiap responden diperoleh dengan menambahkan skornya yang dia terima untuk pernyataan terpisah. Langkah selanjutnya adalah menyusun skor total ini dan mencari tahu pernyataanpernyataan yang memiliki kekuatan diskriminatif yang tinggi. Untuk tujuan ini, peneliti dapat memilih beberapa bagian dari total skor tertinggi dan terendah, katakanlah 25 persen teratas dan bagian bawah 25 persen. Kedua kelompok ekstrim ini ditafsirkan untuk mewakili sikap yang paling menguntungkan dan paling tidak menguntungkan dan digunakan sebagai kelompok kriteria untuk mengevaluasi pernyataan individu. Ini

86

Metodologi Penelitian carakami menentukan pernyataan yang secara konsisten berkorelasi dengan rendah favourability dan yang dengan kesenangan tinggi. Hanya pernyataan yang berkorelasi dengan tes total yang harus disimpan dalam instrumen terakhir dan semua yang lain harus dibuang dari itu.

Keuntungan: Skala Likert-type memiliki beberapa keunggulan. Sebutkan mungkin terbuat dari yang penting satu. Relatif mudah untuk membangun skala Likert-type dibandingkan dengan skala tipe Thurstone karena skala Likert-type dapat dilakukan tanpa panel hakim. Skala Likert-type dianggap lebih andal karena di bawahnya responden menjawab setiap pernyataan yang termasuk dalam instrumen. Karena itu juga menyediakan lebih banyak informasi dan data daripada skala tipe Thurstone. Setiap pernyataan, termasuk dalam skala tipe Likert, diberikan tes empiris untuk membedakan kemampuan dan dengan demikian, tidak seperti skala tipe Thurstone, skala tipe Likert memungkinkan penggunaan pernyataan yang tidak secara nyata terkait (memiliki hubungan langsung) ) pada sikap yang sedang dipelajari. Skala tipe likert dapat dengan mudah digunakan dalam studi yang berpusat pada responden dan stimulus, yaitu melalui itu kita dapat mempelajari bagaimana tanggapan berbeda antara orang-orang dan bagaimana tanggapan berbeda antara rangsangan. Skala tipe likert membutuhkan waktu yang lebih sedikit untuk membangun, ini sering digunakan oleh mahasiswa penelitian opini. Selain itu, telah dilaporkan dalam berbagai studi penelitian* bahwa ada korelasi tingkat tinggi antara skala Likert-type dan skala tipe Thurstone. Keterbatasan: Ada beberapa batasan skala Likert-type juga. Satu batasan penting adalah bahwa, dengan skala ini, kita dapat dengan mudah memeriksa apakah responden lebih atau kurang menguntungkan untuk suatu topik, tetapi kita tidak dapat mengatakan berapa banyak lebih atau kurang mereka. Tidak ada dasar untuk keyakinan bahwa lima posisi yang ditunjukkan pada skala sama-sama berjarak. Interval antara 'sangat setuju' dan 'setuju', mungkin tidak sama dengan interval antara “setuju” dan “belum diputuskan”. Ini berarti bahwa skala Likert tidak naik ke tingkat yang lebih tinggi daripada skala ordinal, sedangkan para desainer skala Thurstone mengklaim skala Thurstone sebagai skala interval. Satu kerugian lebih lanjut adalah bahwa seringkali skor total responden individu memiliki sedikit makna yang jelas karena skor total yang diberikan dapat dijamin oleh berbagai pola jawaban. Tidak mungkin bahwa responden dapat secara sah bereaksi terhadap pernyataan singkat pada formulir tercetak dalam ketiadaan situasi kualifikasi kehidupan nyata. Selain itu, ada "tetap kemungkinan bahwa orang dapat menjawab sesuai dengan apa yang mereka pikir harus mereka rasakan daripada bagaimana mereka rasakan." 4 Kelemahan khusus skala Likert ini dipenuhi dengan menggunakan skala kumulatif yang akan kita ambil nanti. dalam bab ini.

Terlepas dari semua keterbatasan, skala terukur tipe Likert dianggap sebagai yang paling berguna dalam situasi di mana dimungkinkan untuk membandingkan skor responden dengan distribusi skor dari beberapa kelompok yang didefinisikan dengan baik. Mereka sama-sama berguna ketika kita prihatin dengan program

*

AL Edwards dan KC Kenney, "Perbandingan teknik Thurstone dan Likert dalam skala sikap konstruksi", Journal of Applied Psychology, 30, 72-83, 1946. John W. Best dan James V. Kahn, "Penelitian dalam Pendidikan", 5 ed., Prentice-Hall of India Pvt. Ltd., New Delhi, 1986, hal. 183.

Teknik Pengukuran dan Penskalaan

87

perubahan atau perbaikan dalam hal mana kita dapat menggunakan skala untuk mengukur sikap sebelum dan sesudah program perubahan atau peningkatan untuk menilai apakah upaya kita memiliki efek yang diinginkan. Kita dapat juga menghubungkan skor pada skala dengan ukuran lain tanpa memperhatikan nilai absolut dari apa yang menguntungkan dan apa yang tidak menguntungkan. Semua ini menjelaskan tentang popularitas skala tipe Likert dalam studi sosial yang berkaitan dengan pengukuran sikap. Skala kumulatif: Skala kumulatif atau analisis skalogram Louis Guttman, seperti skala lainnya, terdiri dari serangkaian pernyataan di mana seorang responden menyatakan persetujuan atau ketidaksetujuannya. Fitur khusus dari skala jenis ini adalah bahwa pernyataan di dalamnya membentuk serangkaian kumulatif. Ini, dengan kata lain, berarti bahwa pernyataan-pernyataan tersebut terkait satu sama lain sedemikian rupa sehingga seorang individu, yang menjawab dengan baik untuk mengatakan butir No. 3, juga membalas dengan baik pada butir No. 2 dan 1, dan yang membalas dengan baik untuk item No. 4 juga menjawab baik untuk item No. 3, 2 dan 1, dan seterusnya. Ini menjadi individu yang sikapnya pada titik tertentu dalam skala kumulatif akan menjawab dengan baik semua item di satu sisi titik ini, dan menjawab secara tidak menyenangkan semua item di sisi lain dari titik ini. Nilai individu dikerjakan dengan menghitung jumlah poin mengenai jumlah pernyataan yang dia jawab dengan baik. Jika seseorang tahu skor total ini, seseorang dapat memperkirakan bagaimana responden telah menjawab pernyataan individu yang merupakan skala kumulatif. Skala utama dari skala kumulatif jenis ini adalah skalogram Guttman. Kami mencoba deskripsi singkat yang sama di bawah ini. Teknik yang dikembangkan oleh Louis Guttman dikenal sebagai analisis skalogram, atau kadang-kadang hanya 'analisis skala'. Analisis skalogram mengacu pada prosedur untuk menentukan apakah satu set item membentuk skala unidimensional. Skala dikatakan unidimensional jika tanggapan jatuh ke dalam pola di mana dukungan item yang mencerminkan hasil posisi ekstrim juga mendukung semua item yang kurang ekstrim. Di bawah teknik ini, responden diminta untuk menunjukkan sehubungan dengan setiap item apakah mereka setuju atau tidak setuju dengan itu, dan jika barang-barang ini membentuk skala unidimensional, pola respon akan seperti di bawah: Tabel 5.3:

4

Nomor Item 3 2

X -

X X -

Pola Respon dalamAnalisis Skalogram

responden skor 1 X

X X -

X X X X -

X = Setuju - = Tidak Setuju

4 3 2 1 0

skor 4 berarti bahwa responden dalam perjanjian dengan semua pernyataan yang menunjukkan sikap yang paling baik. Tetapi skor 3 berarti responden tidak setuju dengan item 4, tetapi dia setuju dengan yang lain. Dengan cara yang sama orang dapat menafsirkan nilai-nilai lain dari skor responden. Pola ini menunjukkan bahwa alam semesta konten dapat terukur.

88

Metodologi Penelitian

Prosedur: Prosedur untuk mengembangkan skalogram dapat diuraikan sebagai di bawah: Alam semesta konten harus didefinisikan pertama-tama. Dengan kata lain, kita harus meletakkan secara jelas masalah yang ingin kita hadapi dalam penelitian kita. Langkah selanjutnya adalah mengembangkan sejumlah item yang berkaitan dengan masalah dan untuk menghilangkan dengan memeriksa barang-barang yang tidak jelas, tidak relevan atau barang-barang yang terlalu ekstrim. Langkah ketiga terdiri dari pra-pengujian item untuk menentukan apakah masalah yang sedang ditangani dapat terukur (The pretest, seperti yang disarankan oleh Guttman, harus menyertakan 12 atau lebih item, sementara skala akhir mungkin hanya memiliki 4 hingga 6 item. Demikian pula, jumlah responden dalam pretest mungkin kecil, katakanlah 20 atau 25 tetapi skala akhir harus melibatkan lebih banyak responden, katakanlah 100 atau lebih). Dalam pretest, responden diminta untuk mencatat pendapat mereka tentang semua item yang dipilih menggunakan skala 5 poin Likert-type, mulai dari 'sangat setuju' hingga 'sangat tidak setuju'. Tanggapan menguntungkan terkuat diberi skor 5, sedangkan respon yang kurang baik terkuat sebagai 1. Total skor dapat berkisar, jika ada 15 item, dari 75 untuk yang paling menguntungkan hingga 15 untuk yang paling tidak menguntungkan. Opini responden kemudian disusun berdasarkan skor total untuk analisis dan evaluasi. Jika tanggapan suatu item membentuk skala kumulatif, skor kategori responsnya harus menurun secara teratur seperti yang ditunjukkan dalam tabel di atas. Kegagalan untuk menunjukkan pola menurun berarti bahwa ada tumpang tindih yang menunjukkan bahwa item yang bersangkutan bukan item skala kumulatif yang baik yaitu, item tersebut memiliki lebih dari satu makna. Terkadang, respons kategori yang tumpang tindih dapat dikurangi dengan menggabungkan kategori. Setelah menganalisa hasil pretest, beberapa item, katakan 5 item, dapat dipilih.

Langkah selanjutnya adalah menghitung kembali skor untuk berbagai opini, dan menyusunnya kembali untuk mencerminkan perubahan apa pun dalam urutan, yang dihasilkan dari pengurangan item, katakanlah, dari 15 dalam pretest ke, katakanlah, 5 untuk skala terakhir. Hasil pretest akhir dapat ditabulasikan dalam bentuk tabel yang diberikan pada Tabel 5.4. Hasil Akhir Pretest dalam Analisis Scalogram*

Tabel 5.4: It e m

Jenis Skala 5

1 2

3

Kesal ahan 1 0

7

per

Jumlah kasus kasus

Jumlah kesalahan

5 (sempurna ) 4 (sempurna ) (nonscal e) (nonscal e) 3 (sempurna ) 2 (sempurna ) 1 (sempurna ) (nonscal e) (nonscal e) 0 (sempurna )

X

X

X X

X

0

7

0

-

X

X X

X

0

3

0

-

X

-

X

1

1

1

-

X

X

-

X

1

2

2

-

-

X

X

X

0

5

0

-

-

-

X

X

0

2

0

-

-

-

-

X

0

1

-

-

X

-

-

2

1

2

-

-

X

-

-

2

1

2

-

-

n = 5

0

2

X

-

-

N = 25

0

0

e=7

(Angka dalam tabel adalah arbitrary dan telah digunakan untuk menjelaskan proses tabulasi saja.)

Teknik Pengukuran dan Scaling

89

Tabel ini menunjukkan bahwa lima item (penomoran 5, 12, 3, 10 dan 7) telah dipilih untuk skala terakhir. Jumlah responden adalah 25 yang tanggapannya terhadap berbagai item telah ditabulasikan bersama dengan jumlah kesalahan. Jenis skala sempurna adalah mereka di mana jawaban responden sesuai dengan pola yang akan direproduksi dengan menggunakan skor total seseorang sebagai panduan. Jenis non-skala adalah mereka di mana pola kategori berbeda dari yang diharapkan dari skor total responden yaitu, kasus-kasus nonskala memiliki penyimpangan dari unidimensionality atau kesalahan. Apakah item (atau serangkaian pernyataan) yang dipilih untuk skala akhir dapat dianggap sebagai kumulatif sempurna (atau skala unidimensional), kita harus memeriksa berdasarkan koefisien reproduktifitas. Guttman telah menetapkan 0,9 sebagai tingkat reproduktifitas minimum untuk mengatakan bahwa skala memenuhi uji unidimensionality. Dia telah memberikan rumus berikut untuk mengukur tingkat reproduktifitas:

Koefisien Reproduksi Guttman = 1 - e / n(N) di mana e = jumlah kesalahan n = jumlah item N = jumlah kasus Untuk angka tabel di atas, Koefisien Reproducibility = 1 - 7/5 (25) = .94 Hal ini menunjukkan bahwa item nomor 5, 12, 3, 10 dan 7 dalam urutan ini merupakan skala kumulatif atau unidimensional, dan dengan ini kita dapat mereproduksi tanggapan terhadap setiap item, mengetahui hanya skor total responden yang bersangkutan. Skalogram, analisis, seperti teknik skala lainnya, memiliki beberapa kelebihan serta keterbatasan. Salah satu keuntungannya adalah memastikan bahwa hanya satu dimensi sikap yang diukur. Perkiraan subyektif peneliti tidak diizinkan untuk merayap dalam pengembangan skala karena skala ditentukan oleh jawaban responden. Kemudian, kami hanya memerlukan sejumlah kecil item yang membuat skala tersebut mudah dikelola. Analisis skalogram dapat digunakan secara tepat untuk survei pribadi, telepon atau surat. Kesulitan utama dalam menggunakan teknik penskalaan ini adalah bahwa dalam praktik timbangan kumulatif atau unidimensional sempurna sangat jarang ditemukan dan kita hanya perlu menggunakan pengujian aproksinya melalui koefisien reproduktifitas atau memeriksanya berdasarkan beberapa kriteria lain. Metode ini bukan metode yang sering digunakan karena alasan sederhana bahwa prosedur pengembangannya membosankan dan rumit. Skala semacam itu hampir tidak merupakan dasar yang dapat diandalkan untuk menilai sikap orang terhadap objek yang kompleks untuk memprediksi respon perilaku individu terhadap objek tersebut. Secara konseptual, analisis ini sedikit lebih sulit dibandingkan dengan metode skala lainnya.

Faktor Skala* Faktor skala dikembangkan melalui analisis faktor atau atas dasar interkorelasi item yang menunjukkan bahwa faktor umum menyumbang hubungan antara item. Faktor skala terutama "berguna dalam mengungkap dimensi sikap laten dan pendekatan skala melalui konsep ruang dimensi multi-dimensi." 5 Lebih khusus lagi dua masalah yaitu, bagaimana menangani Sebuah studi rinci tentang skala faktor dan khususnya prosedur statistik yang terlibat dalam mengembangkan skala faktor berada di luar cakupan buku ini. Karena itu hanya gagasan pengantar tentang skala faktor yang disajikan di sini. C. William Emory, Metode Penelitian Bisnis, hal. 264–65.

90

Metodologi Penelitian secara

tepat dengan alam semesta konten yang multi-dimensi dan bagaimana mengungkap dimensi yang mendasari (laten) yang belum teridentifikasi, ditangani melalui skala faktor. Skala faktor penting berdasarkan analisis faktor adalah Semantic Differential (SD) dan yang lainnya adalah Multidimensional Scaling. Kami memberikan penjelasan singkat tentang skala faktor ini. Skala diferensial semantik: Skala diferensial semantik atau skala SD yang dikembangkan oleh Charles E. Osgood, GJ Suci dan PH Tannenbaum (1957), adalah upaya untuk mengukur makna psikologis suatu objek kepada seseorang. Skala ini didasarkan pada anggapan bahwa suatu objek dapat memiliki dimensi makna konotatif yang berbeda yang dapat ditempatkan di ruang properti multidimensi, atau apa yang dapat disebut ruang semantik dalam konteks skala SD. Skala ini terdiri dari serangkaian skala penilaian bipolar, biasanya dari 7 poin, dimana satu atau lebih responden menilai satu atau lebih konsep pada setiap item skala. Misalnya, skala SD item untuk menganalisis kandidat untuk posisi kepemimpinan dapat ditampilkan sebagai di bawah: ( E ) ( P ) ( P ) ( A ) ( E ) ( P ) ( A ) ( A ) ( E ) ( E )

Keberhasila nBerhasil

Tidak

Berat

Lemah

Berat

Ringan

Panas

Dingin

Progresif

Regresi

Kuat

Lemah

Aktif

Pasif

Fast

Slow

Benar

Salah

Sociable

Unsociabl e 3

2

1

0

– 1

– 2

–3

Fig. 5.4

Kandidat untuk posisi kepemimpinan (bersama dengan konsep - kandidat 'ideal') mungkin dibandingkan dan kami dapat menilainya dari +3 hingga –3 berdasarkan skala yang disebutkan di atas. (Huruf, E, P, A menunjukkan faktor yang relevan yaitu, evaluasi, potensi dan kegiatan masing-masing, yang ditulis sepanjang sisi kiri tidak ditulis dalam skala yang sebenarnya.

Demikian pula nilai-nilai numerik yang ditampilkan juga tidak ditulis dalam skala yang sebenarnya.) Osgood dan yang lain menghasilkan daftar beberapa pasang kata sifat untuk tujuan penelitian sikap dan menyimpulkan bahwa ruang semantik adalah multidimensional daripada unidimensional. Mereka melakukan upaya tulus dan akhirnya menemukan bahwa tiga faktor, yaitu, evaluasi, potensi, dan kegiatan, berkontribusi paling banyak pada penilaian yang berarti oleh responden. Dimensi evaluasi umumnya menyumbang 1/2 dan 3/4 dari varians yang dapat diekstrak dan dua faktor lainnya memperhitungkan keseimbangan.

Prosedur: Berbagai langkah yang terlibat dalam pengembangan skala SD adalah sebagai berikut: Pertama-tama konsep yang akan dipelajari dipilih. Konsep biasanya dipilih berdasarkan penilaian pribadi, dengan tetap memperhatikan sifat masalah.

Teknik Pengukuran dan Penskalaan

91

Langkah selanjutnya adalah memilih timbangan yang mengingat kriteria komposisi faktor dan kriteria relevansi skala terhadap konsep yang sedang dinilai (adalah praktik umum untuk menggunakan setidaknya tiga skala untuk setiap faktor dengan bantuan di mana skor faktor rata-rata harus dikerjakan). Satu lagi kriteria yang harus diperhatikan adalah bahwa skala harus stabil di seluruh mata pelajaran dan konsep. Kemudian panel hakim digunakan untuk menilai berbagai rangsangan (atau objek) pada berbagai skala yang dipilih dan tanggapan dari semua hakim kemudian akan digabungkan untuk menentukan skala komposit. Untuk menyimpulkan, “SD memiliki sejumlah keunggulan spesifik. Ini adalah cara yang efisien dan mudah untuk mengamankan sikap dari sampel besar. Sikap-sikap ini dapat diukur dalam dua arah dan intensitas. Set total respons memberikan gambaran komprehensif tentang makna suatu objek, serta ukuran subjek yang melakukan penilaian. Ini adalah teknik standar yang mudah diulang, tetapi lolos banyak masalah distorsi respons yang ditemukan dengan metode yang lebih langsung. ” 6 Skala multidimensional: Skala multidimensi (MDS) relatif lebih rumit perangkat, tetapi dengan skala semacam ini dapat skala objek, individu atau keduanya dengan minimal informasi. Multidimensional scaling (atau MDS) dapat dicirikan sebagai satu set prosedur untuk menggambarkan dimensi perseptual atau afektif dari kepentingan substantif. Ini "memberikan metodologi yang berguna untuk menggambarkan penilaian subjektif dari berbagai jenis." 7 MDS digunakan ketika semua variabel (apakah metrik atau non-metrik) dalam sebuah penelitian harus dianalisis secara bersamaan dan semua variabel tersebut terjadi menjadi independen. Asumsi yang mendasari di MDS adalah bahwa orang (responden) "melihat satu set objek sebagai lebih atau kurang mirip satu sama lain pada sejumlah dimensi (biasanya tidak berkorelasi dengan satu sama lain) daripada hanya satu." 8 Melalui teknik MDS seseorang dapat mewakili secara geometris lokasi dan keterkaitan di antara serangkaian titik. Bahkan, teknik-teknik ini berusaha untuk menemukan titik-titik, mengingat informasi tentang satu set jarak antar titik, dalam ruang satu atau lebih dimensi seperti untuk meringkas informasi yang terkandung dalam jarak antar titik. Jarak di ruang solusi kemudian secara optimal mencerminkan jarak yang terdapat dalam data input. Misalnya, jika objek, katakanlah X dan Y, dianggap oleh responden sebagai yang paling mirip dibandingkan dengan semua pasangan objek yang mungkin, teknik MDS akan memposisikan objek X dan Y sedemikian rupa sehingga jarak antara mereka dalam multidimensional ruang lebih pendek dari itu antara dua benda lainnya. Dua pendekatan, yaitu, pendekatan metrik dan pendekatan non-metrik, biasanya dibicarakan dalam konteks MDS, ketika mencoba untuk membangun ruang yang mengandung m poinsedemikian sehingga m(m jarak antar- 1) / 2 mencerminkan input data. Metrikpendekatan untuk MDS memperlakukan input data sebagai data skala interval dan memecahkan menerapkan metode statistik untuk konstanta aditif* yang Ibid., p. 260. Paul E. Green, " Menganalisis Data Multivarian", hal. 421.

Jagdish N. Sheth, “Revolusi Multivariasi dalam Riset Pemasaran”, dikutip dalam “ Riset Pemasaran” oleh Danny N. Bellenger dan Barnett A. Greenberg, hal. 255. Konstanta aditif mengacu pada konstanta itu dengan mana seseorang dapat, entah dengan mengurangkan atau menambahkan, mengubah skala interval

menjadi skala rasio. Misalnya, anggaplah kita tahu bahwa jarak, misalnya a — b , b — c , c — d di antara rangsangan pada skala rasio masing-masing adalah 7, 6 dan 3. Jika seseorang dikurangi 3 dari masing-masing jarak ini, mereka akan menjadi 4, 3 dan 0 masing-masing. Jarak yang diubah akan berada pada skala pengukuran interval, tetapi tidak pada skala rasio. Tentunya, seseorang dapat menambahkan 3 ke semua jarak yang diubah dan mencapai skala rasio jarak. Jadi 3 akan diambil sebagai konstanta aditif dalam kasus ini. Pendekatan iteratif didefinisikan dengan baik digunakan dalam praktek untuk memperkirakan konstanta aditif yang tepat.

92

Metodologi Penelitian

meminimalkan dimensi dari ruang solusi. Pendekatan ini memanfaatkan semua informasi dalam data dalam memperoleh solusi. Data (yaitu, kesamaan metrik objek) sering diperoleh pada skala kesamaan bipolar di mana pasangan objek dinilai satu per satu. Jika data mencerminkan jarak yang tepat antara objek nyata dalam rruang dimensi-, solusi mereka akan mereproduksi set jarak antar titik. Tetapi karena data yang benar dan nyata jarang tersedia, kami memerlukan prosedur acak dan sistematis untuk mendapatkan solusi. Umumnya, kesamaan yang dinilai di antara sekumpulan objek secara statistik diubah menjadi jarak dengan menempatkan objek-objek itu dalam ruang multidimensional dari beberapa dimensi. Pendekatan non-metrik pertama mengumpulkan kesamaan non-metrik dengan meminta responden untuk memberi peringkat pada urutan semua pasangan yang mungkin yang dapat diperoleh dari sekumpulan objek. Data non-metrik tersebut kemudian diubah menjadi beberapa ruang metrik arbitrer dan kemudian solusi diperoleh dengan mengurangi dimensi. Dengan kata lain, pendekatan non-metrik ini mencari "representasi titik-titik dalam ruang dimensi minimum sedemikian rupa sehingga urutan peringkat jarak antar titik dalam ruang solusi secara maksimal sesuai dengan yang ada pada data. Hal ini dicapai dengan hanya membutuhkan bahwa jarak dalam solusi menjadi monoton dengan data input. ” 9 Pendekatan non-metrik telah menjadi terkenal selama tahun enampuluhan dengan munculnya komputer berkecepatan tinggi untuk menghasilkan solusi metrik untuk data input ordinal. . Pentingnya MDS terletak pada kenyataan bahwa itu memungkinkan peneliti untuk mempelajari "struktur perseptual dari seperangkat rangsangan dan proses kognitif yang mendasari pengembangan struktur ini. Psikolog, misalnya, menggunakan teknik skala multidimensi dalam upaya untuk skala rangsangan psikofisik dan untuk menentukan label yang sesuai untuk dimensi yang rangsangan ini bervariasi. " 10 Teknik MDS, infact, menghilangkan kebutuhan dalam proses pengumpulan data untuk menentukan atribut (s) bersama yang beberapa merek, katakanlah dari suatu produk tertentu, dapat dibandingkan karena pada akhirnya analisis MDS itu sendiri mengungkapkan atribut-atribut yang mungkin mendasari persamaan relatif yang dinyatakan di antara objek-objek. Dengan demikian, MDS adalah alat penting dalam pengukuran sikap dan teknik-teknik yang jatuh di bawah MDS menjanjikan “kemajuan besar dari serangkaian pengukuran unidimensional (misalnya distribusi intensitas perasaan terhadap atribut tunggal seperti warna, rasa atau peringkat preferensi dengan tak tentu) interval), untuk pemetaan perseptual dalam ruang multidimensi objek ... gambar perusahaan, merek iklan, dll. ” 11 Terlepas dari semua kelebihan yang disebutkan di atas, MDS tidak banyak digunakan karena komplikasi perhitungan terlibat di bawahnya. Banyak metodenya yang cukup melelahkan dalam hal pengumpulan data dan analisis selanjutnya. Namun, beberapa kemajuan telah dicapai (karena upaya perintis Paul Green dan rekan-rekannya) selama beberapa tahun terakhir dalam penggunaan MDS non-metrik dalam konteks masalah penelitian pasar. Teknik-teknik telah secara khusus diterapkan dalam "menemukan dimensi perseptual, dan jarak rangsangan sepanjang dimensi-dimensi ini, bahwa orang-orang, menggunakan dalam membuat penilaian tentang kemiripan relatif pasangan Stimuli." 12 Tapi, "dalam jangka panjang, MDS akan ditentukan oleh sejauh mana ia memajukan ilmu perilaku. ” 13

Robert Ferber (ed.), Handbook of Marketing Research, hal. 3–51. Ibid., Hal. 3–52. GB Giles, Pemasaran, hal. 43. Paul E. Green, Menganalisis Data Multivarian, hal. 421.

Jum C. Nunnally, Teori Psikometri, hal. 496.

Teknik Pengukuran dan Penskalaan

93

Pertanyaan Apa arti pengukuran dalam penelitian? Apa bedanya apakah kita mengukur dalam skala nominal, ordinal, interval atau rasio? Jelaskan memberi contoh. Apakah Anda setuju dengan pernyataan berikut? Jika demikian, berikan alasan: Validitas lebih penting untuk pengukuran daripada keandalan. Aspek stabilitas dan ekivalensi keandalan pada dasarnya berarti hal yang sama. Validitas konten adalah jenis validitas yang paling sulit untuk ditentukan. Tidak ada perbedaan antara pengembangan konsep dan spesifikasi konsep. Pengukuran yang andal adalah pengukuran yang valid. Tunjukkan kemungkinan sumber kesalahan dalam pengukuran. Jelaskan tes pengukuran suara. Apakah data nominal, ordinal, interval atau rasio berikut? Jelaskan jawaban Anda. Suhu yang diukur pada skala Kelvin. Jajaran militer. Nomor jaminan sosial. Jumlah penumpang di bus dari Delhi ke Mumbai. Nomor kode yang diberikan kepada agama orang yang mencoba bunuh diri. Diskusikan manfaat dan kerugian relatif dari: Skala Rating vs. Peringkat. Skala Summated vs. Cumulative. Analisis skalogram vs Analisis faktor. Tabel berikut menunjukkan hasil dari uji preferensi berpasangan-perbandingan empat minuman dingin dari sampel 200 orang: Nama

Coca Cola

Limca

Goldspot

thumps

Coca Cola Limca Goldspot thumps

-

60*

105 160-150

75 165

120

145

45 70 40-65 -

Dibaca karena 60 orang lebih suka Limca daripada Coca Cola.

Bagaimana peringkat merek ini dalam preferensi keseluruhan dalam sampel yang diberikan. Kembangkan skala interval untuk empat jenis minuman dingin. (1) Narrate prosedur untuk mengembangkan skalogram dan ilustrasikan hal yang sama dengan sebuah contoh. Berolahraga Koefisien reproduksibilitas Guttman dari informasi berikut: Jumlah kasus (N) = 30

Tulis catatan singkat tentang: Skala diferensial semantik; Analisis skalogram;

94

Metodologi Penelitian

Skala tipe likert; Sisik sewenang-wenang; Multidimensional scaling (MDS). Jelaskan metode yang berbeda dari konstruksi skala, dengan menunjukkan kelebihan dan kekurangan masing-masing. "Penskalaan menggambarkan prosedur dengan mana angka-angka ditugaskan untuk berbagai derajat pendapat, sikap dan konsep lainnya." Diskusikan. Juga tunjukkan basis untuk klasifikasi skala.

Related Documents


More Documents from "Ina Longga Lophy"