SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS DATA SUTANTO PRIYO HASTONO FAKULTAS KESEHATAN MASYARAKAT UNIVERSITAS INDONESIA, 2006
1
SUTANTO PRIYO HASTONO: Analisis Data
PENDAHULUAN
1
STATISTIK dan PENELITIAN
1. Statistik dan Penelitian Statistik dalam arti sempit berarti angka/data. Sedangkan dalam arti luas statistik sebagi suatu prosedur atau metode pengumpulan data, pengolahan data, analisis data dan penyajian data. Sedangkan penelitian adalah cara ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu. Data yang diperoleh melalui penelitian harus akurat, artinya data yang dihasilkan harus
memenuhi
kriteria:
ketepatan/kecermatan
valid,
reliabel
dan
obyektif.
pengukuran,
artinya
ketepatan
Valid
antara
data
artinya yang
sesungguhnya terjadi pada obyek dengan data yang dapat dikumpulkan oleh peneliti. Misalkan data dalam obyek berwarna merah, maka data yang terkumpul oleh peneliti juga berwarna merah. Contoh lain, kita akan mengukur waktu lomba lari cepat, kalau mengukurnya dengan jam tangan tentunya hasilnya tidak valid, untuk lomba lari cepat akan valid bila menggunakan alat Stop watch. Contoh lain, bila survei melakukan wawancara dengan orang pedesaan Cianjur tidak valid kalau wawancaranya menggunakan bahasa batak, akan valid bila menggunakan bahasa sunda. Reliabel menunjukkan kekonsistensian pengukuran, artinya pengukuran diulangulang akan mendapatkan hasil yang sama. Misalkan data yang terkumpul dari obyek kemarin berwarna hijau, maka sekarang atau besuk juga masih tetap berwarna hijau. 2
SUTANTO PRIYO HASTONO: Analisis Data Objektif menunjukkan derajat persamaan persepsi antar orang. Jadi misalkan orang
tertentu melihat bahwa obyek itu bewarna putih, maka orang lainpun
akan menyatakan sama, yaitu putih. 2. Peran Statistik dalam Penelitian Peran statistik dalam suatu penelitian dimulai dari tahap awal sampai dengan akhir penelitian. Adapun perannya: a. Alat untuk menghitung besarnya sampel yang akan diteliti b. Alat untuk menguji validitas dan reliabilitas instrumen c. Alat untuk pengolahan data d. Alat untuk analisis data e. Alat untuk penyajian data 3. Kegunaan statistik/penelitian di Bidang Kesehatan a. Mengukur status kesehatan masyarakat dan mengetahui permaslahan kesehatan b. Membandingkan status kesehatan di satu tempat dengan tempat lain, atau membandingkan status kesehatan waktu lampau dengan saat sekarang c. Evaluasi dan monitoring kegagalan dan keberhasilan program kesehatan yang sedang dilaksanakan d. Keperluan estimasi tentang kebutuhan pelayanan kesehatan e. Perencanaa program kesehatan d. keperluan Research dan publikasi masalah-maslash kesehatan 4. Jenis Data Dalam menggunakan statistik perlu dipahami benar mengenai definisi data dan jenis-jenis data. Data merupakan kumpulan angka/huruf hasil dari penelitian terhadap sfat/karakteristik yang kita teliti. Isi data pada umumnya bervariasi (misalnya data berat badan dalam suatu kelompok orang ada yang beratnya 60 kg, 50 kg, 75 kg dst) sehingga muncul istilah variabel. Jadi variabel merupakan 3
SUTANTO PRIYO HASTONO: Analisis Data karakteristik yang nilai datanya bervariasi dari suatu pengukuran ke pengukuran berikutnya. Menurut skala pengukurannya, variabel dibagi empat jenis, yaitu nominal, ordinal, interval dan rasio. a. Nominal, variabel yang hanya dapat membedakan nilai datanya dan tidak tahu nilai data mana yang lebih tinggi atau rendah. Contoh; jenis kelamin, suku dll. Jenis kelamin laki-laki tidak lebih tinggi dibandingkan perempuan . Suku Jawa tidak dapat dikatakan lebih baik/lebih buruk dari suku sunda. Dengan ilustrasi ini dapat dijelaskan bahwa variabel nominal, nilai datanya sederajat. b. Ordinal, variabel yang dapat membedakan nilai datanya dan juga sudah diketahui tingkatan lebih tinggi atau lebih rendah, tapi belum diketahui besar beda antar nilai datanya. Contoh pendidikan, pangkat, stadium penyakit dll. Pendidikan SD pengetahuannya lebih rendah dibandingkan SMP. Namun demikian, kita tidak dapat tahu besar perbedaan pengetahuan orang SD dengan SMP. c. Interval, variabel yang dapat dibedakan, diketahui tingkatannya dan diketahui juga besar beda antar nilainya, namun pada variabel interval belum diketahui kelipatan suatu nilai terhadap nilai yang lain dan pada skala interval tidak mempunyai titik nol mutlak. Contohnya variabel suhu, misalnya benda A suhunya 40 derajat dan benda B 10 derajat. Benda A lebih panas dari benda B dan beda panas anta benda A dan B 30 derajat, namun kita tidak bisa mengatakan bahwa benda A panasnya 4 kali dari benda B (ini berarti tidak ada kelipatannya!). Selanjutnya, kalau suatu benda suhunya 0 derajat, ini tidak berart bahwa benda tersebut tidak punya panas (tidak mempunyai nilai nol mutlak), d. Rasio, variabel yang paling tinggi skalanya, yaitu bisa dibedakan, ada tingkatan, ada besar beda dan ada kelipatannya serta ada nol mutlak. Contoh berat badan, tinggi badan dll. Misal A beratnya 30 kg dan B beratnya 60 kg. Dalam hal ini dapat dikatakan bahwa A lebih ringan dari B, selisih berat 4
SUTANTO PRIYO HASTONO: Analisis Data antara A dan B adalah 30 kg, berat b dua kali lebih tinggi dari berat A. berat 0 kg, ini berarti tidak ada berat (tidak ada bendanya) sehingga ada nol mutlak. Dalam analisis seringkali digunakan pembagian data/variabel menjadi dua kelompok yaitu; data katagorik dan data numerik. a. Katagorik
(kualitatif),
merupakan
data
hasil
pengklasifikasian/penggolongan suatu data. Cirinya: isisnya berupa kata-kata. Contoh; sex, jenis pekerjaan, pendidikan b. Numerik (kuantitatif), merupakan variabel hasil dari penghitungan dan pengukuran. Cirinya: isi variabel berbentuk angka-angka. Variabel numerik dibagi menjadi dua macam: Diskrit dan Kontinyu. Diskrit merupakan variabel hasil dari penghitungan. Misalnya jumlah anak, jumlah pasien tiap ruang, kontinyu merupakan hasol dari pengukuran, misalkan tekanan darah, Hb dll. Variabel katagorik pada umumnya berisi variabel yang berskala nominal dan ordinal. Sedangkan variabel numerik berisi variabel yang berskala interval dan rasio. Dalam analisis statistik, seringkali data numerik diubah ke dalam data katagorik dengan cara dilakukan pengelompokan/pengklasifikasian. Misalnya variabel berat badan data riilnya merupakan data numeric, namun bila dikelompokkan menjadi kurus (<50 kg), sedang (50-60 kg) dan gemuk (>60 kg) maka jenis variabelnya sudah berubah menjadi katagorik.
5
SUTANTO PRIYO HASTONO: Analisis Data
PENGOLAHAN DATA
2
1. Pengantar Pengolahan Data Pengolahan data merupakan salah satu bagian rangkaian kegiatan penelitian setelah pengumpulan data. Setelah dilakukan pengumpulan data, seringkali orang bingung “mau diapakan data yang telah terkumpul?, Bagaimana menghubungkan data di kuesioner dengan tujuan penelitian?”. Untuk itu data yang masih mentah (raw data) perlu diolah sedemikian rupa sehingga menjadi informasi yang akhirnya dapat digunakan untuk menjawab tujuan penelitian. Agar analisis penelitian menghasilkan informasi yang benar, paling tidak ada empat tahapan dalam pengolahan data yang harus dilalui, yaitu:
1. Editing Merupakan kegiatan untuk melakukan pengecekan isian formulir atau kuesioner apakah jawaban yang ada di kuesioner sudah: a. Lengkap: semua pertanyaan sudah terisi jawabannya b. Jelas: jawaban pertanyaan apakah tulisannya cukup jelas terbaca. c. Relevan: jawaban yang tertulis apakah relevan dengan pertanyaan d. Konsisten: apakah antara beberapa pertanyaan yang berkaitan isi jawabannya
konsisiten,
misalnya
antara
pertanyaan
usia
dengan
pertanyaan jumlah anak. Bila dipertanyaan usia terisi 15 tahun dan di pertanyaan jumlah anak 9, ini berarti tidak konsisten.
2. Coding Coding merupakan kegiatan merubah data berbentuk huruf menjadi data berbentuk angka/bilangan. Misalnya untuk variabel pendidikan dilakukan koding 1 = SD, 2 = SMP, 3 = SMU dan 4 = PT. Jenis kelamin: 1 = laki-laki
6
SUTANTO PRIYO HASTONO: Analisis Data dan 2 = perempuan, dsb. Kegunaan dari coding adalah untuk mempermudah pada saat analisis data dan juga mempercepat pada saat entry data.
3. Processing Setelah semua kuesioner terisi penuh dan benar, serta sudah melewati pengkodean, maka langkah selanjutnya adalah memproses data agar data yang sudah di-entry dapat dianalisis. Pemrosesan data dilakukan dengan cara meng-entry data dari kuesioner ke paket program komputer. Ada bermacammacam paket program yang dapat digunakan untuk pemrosesan data dengan masing-masing mempunyai kelebihan dan kekurangan. Salah satu paket program yang sudah umum digunakan untuk entry
data adalah paket
program SPSS for Window.
4. Cleaning Cleaning (pembersihan data) merupakan kegiatan pengecekan kembali data yang sudah di-entry apakah ada kesalahan atau tidak. Kesalahan tersebut dimungkinkan terjadi pada saat kita meng-entry ke komputer Misalnya untuk variabel pendidikan ada data yang bernilai 7, mestinya berdasarkan coding yang ada pendidikan kodenya hanya antara 1 s.d. 4 (1=SD, 2=SMP, 3=SMU dan 4=PT). Contoh lain misalnya dalam variabel status perkawinan terisi data 1 (misalnya 1=belum kawin) dan dalam variabel jumlah anak terisi nilai . ini berarti ada data yang salah (tidak konsisten) karena statusnya belum kawin tetapi mempunyai anak 5?. Berikut akan diuraikan cara meng-cleaning data: a. Mengetahui Missing Data Cara mendetekdi adanya missing data adalah dengan melakukan list (distribusi frekuensi) dari variabel yang ada. Misalnya data yang diolah 100 responden, kemudoian dikeluarkan variabel jenis kelamin dan pendidikan.
7
SUTANTO PRIYO HASTONO: Analisis Data Tabel 1 Jenis kelamin pasien Jenis Kelamin
Jumlah
Laki-laki
40
Perempuan
60
Total
100
Tabel 2 Jenis pendidikan pasien Pendidikan
Jumlah
SD
40
SMP
10
SMU
30
PT
15
Total
100
Dari kedua tabel di atas memperlihatkan bahwa tabel jenis kelamin tidak ada nilai
yang hilang (missing), sedangkan pada tabel pendidikan ada 5
pasien yang missing, karena total jumlahnya hanya 95 (seharusnya 100). b. Mengetahui variasi data Dengan mengetahui variasi data akan diketahui apakah data yang di-entry benar atau salah. Cara mendeteksi dengan mengeluarkan distribusi frekuensi masing-masing variabel. Dalam entry data biasanya data dimasukkan
dalam
bentuk
kode/coding,
misalnya
untuk
variabel
pendidikan SD kode 1, SMP kode 2, SMU kode 3, dan PT kode 4. Untuk mengetahui kesalahan data berikut ilustrasi keluaran dari variabel pendidikan:
8
SUTANTO PRIYO HASTONO: Analisis Data Tabel 3 Jenis pendidikan pasien Pendidikan
Jumlah
1
40
2
30
3
20
4
6
7
4
Total
100
Dari tampilan di atas kendati jumlah total sudah benar 100, namun terlihat ada data yang salah, yaitu munculnya kode pendidikan angka 7 yang berjumlah 4 pasien. Seharusnya variabel pendidikan variasi angkanya hanya dari angka 1 s.d. 4. c. Mengetahui konsistensi data Cara mendeteksi adanya ketidakkonsistensi data dengan menghubungkan dua variabel. Contoh: 1). membandingkan dua tabel Tabel 4 Keikutsertaan KB KB
Jumlah
Ya
20
Tidak
80
Total
100
9
SUTANTO PRIYO HASTONO: Analisis Data Tabel 5 Jenis Alat Kontrasepsi Yang Dipakai Pendidikan
Jumlah
Suntik
5
Pil
5
Kondom
4
IUD
10
Total
24
Dari kedua tabel tersebut terlihat bahwa ada ketidak konsistenan antara jumlah peserta KB (20 orang) dengan total jenis alat kontrasepsi yang dipakai (24 orang). Seharusnya pada baris total jenis alat kontrasepsi jumlahnya 20 orang. 2). Membuat tabel silang Contoh menghubungkan variabel umur dan jumlah anak Umur Jumlah Anak 0
1
15
1
2
16
1
2
19
2
4
20
3
2
3
4
5
6
7
8
9
10 2*
2
24 25 35 40
Keterangan: * = ada 2 responden dengan umur 15 tahun dan anaknya ada 10 orang (ada kesalahan entry data!!!)
10
SUTANTO PRIYO HASTONO: Analisis Data
2. ENTRY DATA Setelah kita mengetahui langkah-langkah pengolahan data, selanjutnya akan dibahas entry data menggunakan SPSS. Kepanjangan dari SPSS yaitu
Statistical Program For Social Science. SPSS merupakan paket program ststistik yang berguna untuk mengolah dan menganalisis data penelitian. Dengan SPSS semua kebutuhan pengolahan dan analisis data dapat diselesaikan dengan mudah dan cepat. Kemampuan yang dapat diperoleh dari SPSS meliputi pemrosesan segala bentuk file data, modifikasi data, membuat tabulasi berbentuk distribusi frekuensi, analisis statistik deskriptif, analisis lanjut yang sederhana maupun komplek, pembuatan grafik, dsb. Perkembangan program SPSS sangat cepat dimulai dari program SPSS/PC+(masih under DOS) kemudian berkembang menjadi SPSS for Windows dari versi 6 dan berkembang terus sampai sekarang sudah memasuki versi 11. Dan untuk latihan digunakan SPSS for Windows versi 10. a. MEMANGGIL SPSS Pertama kali anda harus pastikan bahwa komputer sudah ter-install program SPSS for Windows. Untuk memanggil program SPSS dapat dilakukan dua cara : Pertama : Bila tampilan pertama komputer sudah muncul Icon SPSS, maka klik dengan mouse icon tersebut dua kali. Kedua : Bila di layar belum ada icon SPSS, maka klik “Start”, pilih “File Program” dan sorot “SPSS” dan klik dua kali. Di dalam operasionalnya, SPSS mengenal 2 jenis jendela (Window) yang utama yaitu: a. SPSS Data Editor
11
SUTANTO PRIYO HASTONO: Analisis Data Jendela ini berisis tampilan data yang kita olah dan analisis dengan tampilan sejenis Spreadsheet (seperti tampilan Program Excel). b. SPSS Output Hasil olahan (hasil analisis) yang anda lakukan akan ditampilkan pada Output window. Window ini merupakan teks editor, artinya dapat mengedit hasil analisis yang ditampilkan.
b. STRUKTUR DATA DI SPSS Agar dapat diolah dengan SPSS, data harus mempunyai struktur, format dan jenis tertentu. Dalam SPSS (dan yang umum terjadi pada program lain), data yang diolah tersususn berdasarkan kolom dan baris. Tiap kolom melambangkan satu variabel (dalam data base dikenal Field), misalnya tiap pertanyaan pada kuesioner menunjukkan satu variabel. Tiap baris data dinamakan case (kasus/responden) sebagaimana istilah record di Data Base. Variabel Cases
Nama
Umur
Berat
Anita
23
40
Bambang
25
56
Dari contoh di atas menunjukkan ada 3 variabel (nama, umur dan berat badan) dan 2 kasus/responden.
TAMPILAN UTAMA SPSS FOR WINDOWS Setelah program SPSS dipanggil di layar akan muncul logo SPSS for Windows, tunggulah sesaat hingga logo tersebut menghilang, maka pada layar monitor akan didapati tampilan utama SPSS sebagai berikut: a. tampilan data
12
SUTANTO PRIYO HASTONO: Analisis Data
b. tampilan variabel
Sistem kerja SPSS for Windows dikendalikan oleh menu (bar menu)./ Bar menu terletak di sebelah atas dengan urutan dari kiri ke kanan sbb: File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help.
File: digunakan untuk membuat file data baru, membuka file data yang telah tersimpan (ekstensi SAV), atau membaca file data dari program lain, seperti dbase, excell dll.
Edit: digunakan untuk memodifikasi, mengcopy, menghapus, mencari, dan mengganti data.
View: digunakan untuk mengatur tampilan font, tampilan kode/label
Data: digunakan untuk membuat/mendefinisikan nama variabel, mengambil/ menganalisis sebagian data, menggabungkan data.
Transform:
digunakan
pengelompokan
untuk
variabel,
transformasi/modifikasi pembuatan
variabel
data baru
seperti dari
perkalian/penjumlahan variabel yang ada dll.
13
SUTANTO PRIYO HASTONO: Analisis Data
Analyze: digunakan untuk memilih berbagai prosedur statistik, dari statistik sederhana (deskriptif) sampai dengan analisis statistik komplek (multivariat).
Graphs: digunakan untuk membuat grafik meliputi grafik Bar, Pie, garis, Histogram, scatter plot dsb.
Utilities: digunakan untuk menampilkan berbagai informasi tentang isi file.
Window: digunakan untuk berpindah-pindah antar jendela, misalnya dari jendela data ke jendela output.
Help: memuat informasi bantuan bagaimana menggunakan berbagai fasilitas pada SPSS.
I. MEMASUKKAN DATA Entry data dapat langsung dilakukan pada data editor. Data editor memiliki bentuk tampilan sejenis spreadsheet (seperti Excel) yang digunakan sebagai fasilitas untuk memasukkan/engisikan data. Ada tiga hal yang harus diperhatikan: Baris menunjukkan kasus/responden Kolom menunjukkan variabel Sel merupakan perpotongan antara kolom dan baris menunjukkan nilai/data Dalam memasukan data ke SPSS, ada 4 hal yang harus dieperhatikan: a. Memberi Nama Variabel Pertama kali yang harus dilakukan pada saat entry data adalah memberi nama variabel. Satu variabel mewakili/melambangkan satu pertanyaan. Agar tidak menemui kesulitan dalam membuat nama variabel, berikut akan diuraikan ketentuan / persyaratan nama variabel: * Nama variabel maksimum berisi 8 huruf/karakter, untuk SPSS versi 13 jumalh karakter dapat lebih dari 8 huruf
14
SUTANTO PRIYO HASTONO: Analisis Data * Nama variabel tidak boleh ada spasi * Nama variabel tidak ada yang sama ( tidak boleh ada 2 atau lebih variabel yang memiliki nama sama) b. Mendefinisikan Tipe Variabel Tipe data harus ditentukan kalau kita akan memasukan data di SPSS, adapun jenis tipenya antara laian: 1. Numerik ------ > untuk data berbentuk angka/nomer 2. String --------Æ untuk data berbentuk huruf 3. Date --------- > untuk data berbentuk date/tanggal 4. dll…. Note: yang sering digunakan adalah tipe Numerik, karena data yang akan kita olah biasanya berbentuk angka. c. Mendefinisakan Adanya Desimal Bila data yang akan dimasukkan berbentuk dsimal, seperti kadar HB, maka perlu ditentukan berapa desimal yang kita inginkan. SPSS secara default/standar memberikan dua angka desimal untuk setiap data yang akan di entry. Kebanyakan data penelitian berbentuk tidak ada desimal, oleh karena itu untuk data yang tidak ada desimal kita harus seting di SPSS isian jumlah desimal diberi angka 0 atau dikosongkan. d. Memberi Label Variabel Nama variabel biasanya tertulis dengan kata/huruf yang singkat, pada bagian ini kita dapat menuliskan keterangan nama variabel sehingga dapat memperjelas arti dari masing-masing variabel. Misalnya nama variabel BWT diberi label “Berat badan bayi pada saat lahir dalam satuan gram”
15
SUTANTO PRIYO HASTONO: Analisis Data e. Memberi Value Label Untuk variabel yang berbentuk koding kita harus memberi keterangan untuk setiap kode yang ada dalam kode tsb, misalnya untuk variabel Sex, 0 = pria dan 1 = wanita. Sekarang kita coba lakukan entry untuk data: Penelitian “Faktor-faktor yang berhubungan dengan perilaku menyusui eksklusif di Daerah X tahun 2001” . Berikut ini instrumen yang digunakan dalam penelitian: POLA MENYUSUI Nomor Responden 1. Berapa umur ibu? …. Tahun 2. pendidikan ibu yang telah ditamatkan? 1. SD 2. SMP 3. SMU 4. PT 3. Apakah ibu bekerja? 0. bekerja 1. Tidak bekerja 4. Berapa berat badan ibu ? … kg 5. Apakah ibu menyusui secara Eksklusif (menyusui sampai usia bayi 4 bulan)? 0. tidak 1. ya 6. a.Kadar Hb ibu pengukuran pertama : …. gr% b.Kadar Hb ibu pengukuran kedua : …. gr% 7. Berat badan bayi ibu? …….gram PERTANYAAN SIKAP 1. Bayi yang baru lahir sesegera mungkin diberi ASI? 1. STS 2. TS 3.KS 4. S 5.SS 2. Bayi yang baru lahir diberi kolostrum 1. STS 2. TS 3.KS 4. S 5.SS 3. Bayi sejak lahir sampai usia 4 bulan hanya diberi ASI saja? 1. STS 2. TS 3.KS 4. S 5.SS 4. ASI diberikan sampai bayi berusia 2 tahun? 1. STS 2. TS 3.KS 4. S 5.SS
16
SUTANTO PRIYO HASTONO: Analisis Data Survei dilakukan dengan jumlah responden sebanyak 50 orang, datanya sbb: no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
umur 23 24 34 35 19 24 22 19 26 25 21 22 19 20 23 26 27 30 31 32 23 24 34 35 19 24 22 19 26 25 21 22 19 20 23 26 27 30 31 32 21 22 19 20 23 26
didik 1 4 4 3 3 2 1 1 3 4 3 4 2 3 1 3 4 2 4 2 2 3 4 3 3 1 2 1 3 3 4 4 2 3 1 2 4 2 4 1 3 4 2 3 1 3
kerja 0 0 1 0 1 1 1 0 0 1 1 0 1 0 1 0 1 1 0 0 0 0 1 0 1 1 1 0 0 1 1 0 1 0 1 0 1 1 0 0 1 0 1 0 1 0
bbibu 46 47 60 50 55 45 47 46 52 65 60 65 50 55 48 68 70 46 47 48 47 56 74 72 60 49 46 48 57 75 64 67 50 63 50 51 53 54 67 46 60 68 67 60 63 64
eksklu 0 1 0 0 1 1 1 0 1 0 0 1 1 0 1 0 1 1 0 0 0 1 0 0 1 1 1 0 1 0 0 1 1 0 1 0 1 1 0 0 0 1 1 0 1 0
Hb1 10.1 9.8 11.1 10.2 10.4 11.2 12.5 11.4 13.2 9.2 10.1 10.1 10.2 10.2 10.2 10.2 10.2 10.2 13.2 13.2 11.1 9.8 10.4 7.2 7.4 8.9 11.2 11.4 12.0 8.8 10.1 10.1 8.1 7.8 9.2 9.4 9.0 8.3 10.2 10.1 10.1 10.2 10.2 10.2 11.2 11.2
Hb2 11.1 10.2 11.5 9.8 10.1 10.0 12.2 11.4 12.3 9.1 11.1 11.1 9.8 9.8 9.8 10.0 10.0 10.0 12.3 12.3 11.1 10.2 11.5 9.8 10.1 10.0 12.2 11.4 12.3 9.1 11.1 11.1 9.8 9.8 9.8 10.0 10.0 10.0 12.3 12.3 11.1 11.1 12.1 11.3 10.2 11.4
bbbayi 2,500 3,000 4,000 3,600 3,500 2,700 2,900 2,600 3,500 4,000 3,300 4,100 2,800 3,600 2,400 3,000 3,900 2,800 3,300 2,100 2,500 3,000 4,000 3,600 3,500 2,700 2,900 2,600 3,500 4,000 3,300 4,100 2,800 3,600 2,400 3,000 3,900 2,800 3,300 2,100 3,300 4,100 2,800 3,600 2,400 3,000
Segera 2 4 1 2 3 5 3 2 3 4 2 2 2 2 1 5 5 5 1 3 2 4 1 2 3 5 1 2 3 4 2 2 2 2 2 5 5 5 1 3 2 2 1 2 2 5
Kolos 1 3 2 3 2 4 4 1 2 4 1 4 1 3 1 4 4 4 1 2 1 3 2 1 4 4 2 1 2 4 1 1 3 3 3 4 4 4 1 2 1 1 1 3 3 4
Lahir 2 3 2 4 4 4 2 1 2 5 2 2 2 4 2 4 4 4 2 4 2 3 2 1 2 4 2 1 1 5 2 2 4 1 4 4 4 4 2 2 2 2 2 4 1 4
sampai 1 4 1 2 3 4 2 2 4 4 1 4 1 4 2 4 4 4 2 4 1 4 1 2 2 4 2 2 1 4 1 1 2 1 2 4 4 4 2 2 1 1 2 2 2 4
17
SUTANTO PRIYO HASTONO: Analisis Data 47 48 49 50
27 30 31 32
4 2 3 1
1 1 0 0
72 49 58 50
1 1 0 1
11.2 11.2 13.2 11.2
10.0 12.4 13.3 12.3
3,900 2,800 3,300 2,100
5 5 3 3
4 4 2 1
4 4 4 1
4 4 2 2
A. Langkah pertama : Memberi/membuat nama variabel: Layar pada tampilan Workshet di menu data SPSS ada 2 jenis, yaitu jendela “Data View” dan “Variabel View”.
Untuk membuat nama variabel, layar/jendela posisikan pada “Variable View”. Sekarang lakukan : klik “Variable View” di bagian kiri bawah, sehingga muncul tampilan layar “Variable View”
Pada tampilan “Variable View” diatas terlihat kolom: Name, Type, Width, Decimals, dst.. Selanjutnya kita dapat membuat nama variabelnya dimulai dari No, umur, didik, dst..sbb: a. Membuat Variabel No Adapun tahapannya sbb: 18
SUTANTO PRIYO HASTONO: Analisis Data 1. Sekarang pada kolom name ketik nama variabel “No”, kemudian 2. Pindahkan kursor ke kolom Type. Jenis variabel yang tersedia ada beberapa jenis meliputi numeric untuk tipe angka, string untuk tipe karakter/huruf dll. Untuk varibel No karena datanya yang akan masuk berbentuk angka berarti anda pilih numeric (secara otomatis SPSS memberikan default Numeric) 3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara standar lebar kolom sudah diatur SPSS lebar kolom (Width) 8 karakter, jadi abaikan saja untuk width nya 4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis memberi ruang untuk 2 desimal, untuk variabel No tentunya berbentuk bilangan bulat(tidak ada desimal) jadi kolom Decimal diberi angka 0 atau dikosongkan. 5. Geser korsor kekanan ke kolom Label, ketik/isikan keterangan untuk memperjelas variabel No, misalnya diketik “Nomor Responden” 6. Langkah selanjutnya harusnya kursor kita geser kekanan mengisi kolom Values, namun kolom Values ini diisi kalau variabel yang kita buat berbentuk variabel koding (atau variabel katagorik) misalnya variabel sex yang isinya ada koding 1=pria dan 2=wanita. Untuk variabel No bukan merupakan variabel koding, maka kolom Value tidak diisi/diabaikan saja, sehingga proses pembuatan variabel No sudah selesai, dan tampilan lengkapnya menjadi sebagai berikut
19
SUTANTO PRIYO HASTONO: Analisis Data b.Membuat Variabel Umur Proses pembuatannya sama dengan ketika membuat variabel No sbb: 1. Sekarang pada kolom name ketik nama variabel Umur, kemudian 2. Pindahkan kursor ke kolom Type.. Untuk variabel Umur karena datanya yang akan masuk berbentuk angka berarti anda pilih numeric (secara otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi kolom Type jangan diubah) 3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara standar lebar kolom sudah diatur SPSS, lebar kolom (Width) 8 karakter, jadi abaikan/biarkan saja untuk width nya 4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis memberi ruang untuk 2 desimal, untuk variabl Umur tentunya berbentuk bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan. 5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk memperjelas variabel Umur, isikan: Umur ibu menyusui 6. Karena variabel umur berjenis numerik (bukan variabel yg isinya koding) maka kolom Values diabaikan saja, dan dengan demikian proses pembuatan variabel umur telah selessai c. Variabel Pendidikan Proses pembuatannya sama dengan ketika membuat variabel No sbb: 1. Sekarang pada kolom name ketik nama variabel Didik, kemudian 2. Pindahkan kursor ke kolom Type.. Untuk variabel Didik karena datanya yang akan masuk berbentuk angka berarti anda pilih numeric (secara otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi kolom Type jangan diubah) 3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara
20
SUTANTO PRIYO HASTONO: Analisis Data standar lebar kolom sudah diatur SPSS, lebar kolom (Width) 8 karakter, jadi abaikan/biarkan saja untuk width nya 4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis memberi ruang untuk 2 desimal, untuk variabl Didik tentunya berbentuk bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan. 5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk memperjelas variabel Didik, isikan: Pendidikan formal ibu menyusui 6. Langkah selanjutnya geser kekanan ke kolom Values, untuk variabel Didik kolom Values ada isinya oleh karena variabel Didik merupakan variabel yang berbentuk koding, yaitu kode 1 = SD, 2=SMP, 3=SMU, 4=PT. Klik kolom Value akan muncul menu:
Klik disini
Pada kotak Value isikan angka 1, lalu klik kotak Value Label isikan: SD,hasilnya nampak sbb:
21
SUTANTO PRIYO HASTONO: Analisis Data
Kemudian klik tombol Add sehinga di kotak bagian bawah akan muncul:
Seterusnya klik kotak Value, isikan angka 2, klik kotak Value Label dan isikan: SMP, kemudian klik tombol Add Seterusnya klik kotak Value, isikan angka 3, klik kotak Value Label dan isikan: SMU, kemudian klik tombol Add Seterusnya klik kotak Value, isikan angka 4, klik kotak Value Label dan isikan: PT, kemudian klik tombol Add sehingga kotak menu akan tertampil sbb:
22
SUTANTO PRIYO HASTONO: Analisis Data
Kemudian, klik tombol OK sehingga selesailah pembuatan variabel Didik. d. Variabel Kerja 1. Pada kolom Name isikan Kerja 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Status pekerjaan ibu 4. Geser kekanan ke kolom Value, isikan koding 0=bekerja 1=tdk kerja Proses pembuatan variabel kerja selesai e. Variabel BBibu 1. Pada kolom Name isikan Bbibu 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Berat badan ibu 4. Kolom Value, abaikan/biarkan aja karena variabel Bbibu berbentuk numerik Proses pembuatan variabel Bbibu selesai f. Variabel Eksklu 1. Pada kolom Name isikan Eksklu 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Status menyusui eksklusive 23
SUTANTO PRIYO HASTONO: Analisis Data 4. Geser kekanan ke kolom Value, isikan koding 0=tdk eksklusive 1=eksklusive Proses pembuatan variabel Eksklu selesai g. Variabel Hb1 1. Pada kolom Name isikan Hb1 2. Geser kekanan ke kolom Decimal, untuk variabel HB1 sesuai dengan datanya, ada satu desimal, maka isikan angka 1 3. Geser ke kolom Label isikan: Hb pengukuran pertama 4. Abaikan kolom Values, karena variabel HB1 berbentuk numerik h. Variabel Hb2 1. Pada kolom Name isikan Hb2 2. Geser kekanan ke kolom Decimal, untuk variabel HB2 sesuai dengan datanya, ada satu desimal, maka isikan angka 1 3. Geser ke kolom Label isikan: Hb pengukuran kedua 4. Abaikan kolom Values, karena variabel HB2 berbentuk numerik i. Variabel BBbayi 1. Pada kolom Name isikan BBbayi 2. Geser kekanan ke kolom Decimal, isikan 0 3. Geser ke kolom Label isikan: Berat badan bayi 4. Abaikan kolom Value, Proses pembuatan variabel bbbayi selesai Dengan cara sama kemudian dapat dibuat untuk variabel: Segera, Kolos, Lahir, Sampai Akhirnya tampilan kseluruhannya sbb:
24
SUTANTO PRIYO HASTONO: Analisis Data
B. Memasukkan/entry Data Setelah semua variabel sudah dibuat, maka langkah selanjutnya adalah memasukkan data hasil survei kedalam format yang telah dibuat diatas. Untuk memasukkan data anda harus berpindah ke layar/jendela Data View, yaitu dengan Klik tombol Data View, nampak tampilannya sbb:
Memasukkan data bisa menyamping satu persatu responden di entry datanya, atau bisa juga perkolom kearah bawah. Coba sekarang masukan data diatas sebanyak 10 responden , dan hasil tampilannya sbb: 25
SUTANTO PRIYO HASTONO: Analisis Data
c. Mengedit Data 1. Menghapus isi sel a. Klik sel yang akan dihapus isinya b. Tekan tombol ‘Delete’ (pada Keyboard)/clear pada edit. Bila kita nggak jadi menghapus, klik Undo Untuk menghapus isi sejumlah sel sekaligus, pilihlah sejumlah sel tersebut dengan drag (menyorot/memblok) dengan mouse.
Dari tampilan di atas berarti kita membuat blok untuk variabel Kerja pada responden no 3 s/d 5 Tekan ‘delete’ untuk menghapusnya.
26
SUTANTO PRIYO HASTONO: Analisis Data 2. Menghapus isi sel satu kolom (menghapus variabel) a. Klik heading kolom (nama variabel) yang akan dihapus isi-isi selnya, misalkan akan dihapus variabel BBibu: klik heading BBibu seperi tampilan sbb:
Klik disini
b. Tekan tombol delete Untuk menghapus isi sel sejumlah kolom sekaligus, pilihlah sejumlah kolom tersebut dengan drag (menyorot dan memblok) dengan mouse pada bagian heading. 3. Menghapus baris (menghapus case/responden) a. klik baris yang akan dihapus, contoh nomer responden 5 akan dihapus
Klik disini b. Tekan tombol delete
27
SUTANTO PRIYO HASTONO: Analisis Data Nomor responden akan terhapus Untuk menghapus beberapa case sekaligus, pilihlah sejumlah case tersebut dengan drag (menyorot dan memblok) pada bagian nomor case. 4. Mengcopy isi sel a. Pilih sel (sejumlah sel dengan mnyorot) yang akan dicopy isinya. b. Tekan ‘Ctrl+C’ c. Pindahkan penunjuk sel ke sel yang akan dituju d. Tekan ‘Ctrl+V’ Hal yang perlu diperhatikan dalam mengcopy isi sel atau sejumlah sel adalah, bahwa format hasil copy akan selalu menyesuaikan dengan format variabel dimana isi sel atau sejumlah sel itu dicopykan. 5. Mengcopy isi satu kolom (mengcopy variabel) a. Klik heading kolom (nama variabel) yang akan dicopy isinya b. Tekan ‘Ctrl+C’ c. Klik Heading kolom yang dituju d. Tekan ‘Ctrl+V’ Hasil
dari instruksi di atas adalah mengcopy kolom sekaligus format
variabelnya (type variabel, lebar kolom, value label dsb), dan sudah pasti tetap tidak merubah nama variabel. Bila dikehendaki tidak ada perubahan format variabel kolom yang dituju, yang dilakukan adalah: a. Klik heading kolom (nama variabel) yang akan dicopy isinya b. Tekan ‘Ctrl+C’ c. Pindahkan penunjuk sel ke baris pertama kolom yang dituju d. Tekan ‘Ctrl+V’ Untuk mengcopy isi sel sejumlah kolom sekaligus, pilihlah sejumlah kolom tsb dengan drag pada bagian heading
28
SUTANTO PRIYO HASTONO: Analisis Data 6. Mengcopy isi satu baris (case/responden) a. Tekan ‘Ctrl+C’ b. Klik nomor case yang akan dituju atau pindahkan penunjuk sel ke kolom Klik nomer Case yang akan dicopy c. pertama baris yang dituju d. Tekan ‘Ctrl+V’ 7. Menyisipkan Kolom a. Pindahkan penunujuk sel pada kolom yang disisipi b. Klik ‘Data’, pilih ‘Insert Variable’, terlihat kolom baru muncul. 8. Menyisipkan Baris a. Pindahkan penunjuk sel pada baris yang akan disisipi b. Klik ’Data’, pilih ‘Insert Case’, terlihat kasus/ responden baru muncul
B. MENYIMPAN FILE DATA Data yang telah dimasukkan dapat disimpan ke berbagai format data. Secara pengaturan dasar, SPSS for Window akan menyimpan data tersebut dengan format SPSS, bentuk formatnya dicirikan dengan ekstensi “.sav” (Nama file.sav). untuk menyimpan data yang telah anda masukkan: 1.Pilihlah “File”, bawa kursor ke “Save”, nampak tampilannya:
29
SUTANTO PRIYO HASTONO: Analisis Data
Pada tampilan di atas terdapat beberapa isian kotak: Save in : Anda dapat memilih direktori (drive A untuk disket) tempat menyimpan file. Bila pada kotak
“Save in” tidak dirubah berarti data
disimpan dalam direktori program SPSS. File name : Anda harus mengetikkan nama file di kotak ini. SPSS akan menambahkan ekstension “.sav”, sehingga anda cukup mengetikkan nama filenya saja dan tidak perlu mengetikkan ekstensionnya. Save as type : data dapat disimpan dalam berbagai format. Untuk data SPSS akan disimpan dengan format “sav”. 2. Misalkan kita akan menyimpan data di drive C direktori my document dan diberi nama “latihan”.
Klik kotak “file name” , isikan “latihan”. Terlihat
tampilannya sbb:
30
SUTANTO PRIYO HASTONO: Analisis Data
] 3. Klik “Save “, data akan tersimpan
C. MENGAKTIFKAN/MEMANGGIL FILE DATA Untuk membuka/mengaktifkan file data yang telah ada: 1. Klik “File”, pilih “Open”, geser ke “Data” akan tampil sbb:
31
SUTANTO PRIYO HASTONO: Analisis Data
Terlihat ada beberapa kotak isian Look in : Anda dapat memilih/mengganti direktori tempat file disimpan. Secara otomatis tampilan pertama akan muncul direktori SPSS. File Name : tempat untuk mengetikkan nama file, atau dapat juga dilakukan dengan meng-klik nama file yang tertampil pada kotak bagian atas file name. File of type : data dapat disimpan dalam berbagai format yang dapat dipilih dalam kotak ini. Secara otomatis akan muncul file format SPSS (.sav) 2. Misalkan sekarang akan diaktifkan file data: “Latihan” dari drive c direktori My Documen, maka caranya klik kotak File name: ketik “latihan”, atau klik “latihan yang terlihat/tertampil pada kotak di atasnya.
32
SUTANTO PRIYO HASTONO: Analisis Data
3. Kemudian klik Open, data akan muncul di layar.
33
SUTANTO PRIYO HASTONO: Analisis Data
3. TRANSFORMASI / MODIFIKASI DATA Setelah semua data di-entry pada dasarnya anda dapat langsung melakukan analisis untuk mengetahui informasi yang diinginkan. Namun seringkali data yang ada tidak semuanya dapat langsung dilakukan analisis. Beberapa data bisa jadi masih perlu dilakukan modifikasi/transformasi, misalnya untuk keperluan analisis kita harus mengelompokkan umur menjadi tiga katagori misalnya < 20 th, 20 – 35 th dan > 35 th. Kasus lain, misalnya kita akan membuat variabel baru hasil dari gabungan beberapa variabel (misalnya variabel sikap diukur oleh 10 pertanyaan/variabel), maka kita harus melakukan aktifitas di SPSS untuk menggabungkan beberapa variabel tersebut. Dari uraian di atas tentunya sekarang menjadi jelas ternyata seringkali kita tidak
dapat
langsung
modifikasi/transformasi
melakukan
data.
Perlu
analisis, tidaknya
kita
modifikasi
harus
melakukan
dilakukan
dapat
dilihat/dicek pada “Definisi Operasional Variabel” dari penelitian/tesis/skripsi kita. Misalkan dalam penelitian anda definisi variabelnya sbb: No Variabel
Definisi Operasional
1
Rentang
Lama tugas
waktu
Hasil Ukur/Skala berkeja
sebagai Tahun/Rasio
petugas puskesmas 2
Umur
Lama waktu hidup yang diukur dari Muda ulang tahun terakhir
3
Sikap
Pernyataan terhadap
tua/
Ordinal
setuju/tidak sistem
dan
pencatatan
setuju Baik dan Buruk/ dan Ordinal
pelaporan yang diukur melalui 10 pertanyaan
Dari contoh definisis operasional di atas dapat diketahui bahwa variabel ‘Lama tugas” dapat langsung dianalisis, sedangkan variabel umur dan sikap masih perlu dilakukan modifikasi/transformasi dengan SPSS. Variabel umur perlu dilakukan 34
SUTANTO PRIYO HASTONO: Analisis Data pengelompokan menjadi umur muda (misalnya ≤ 30 th) dan tua (< 30 th). Variabel sikap perlu dibuat dengan cara menjumlahkan skor 10 pertanyaan sikap, kemudian variabel baru tersebut dilakukan pengelompkkan untuk membuat katagori baik dan buruk (misal menggunakan cut point: mean). Berikut akan diuraikan beberapa jenis modifikasi data yang dapat dilakukan di program SPSS for Window. 1. Mengelompokkan data
#perintah : RECODE Pengelompokan biasanya digunakan untuk mengubah variabel numerik menjadi variabel katagorik. Pengelompokan dapat dilakukan pada variabel yang sama atau ke variabel baru yang berbeda. Dianjurkan kalau melakukan pengelompokan sebaiknya digunakan variabel baru sehingga masih dimiliki nilai yang asli pada file data. Coba aktifkan file data ASI.SAV (file ini berisi data penelitian menyusui eksklusive, yang telah di entry lengkap 50 rsponden) Sebagai contoh kita akan melakukan pengelompokan umur. Umur akan diklasifikasikan menjadi 3 kelompok yaitu: <20, 20-30 th, >30 th. Langkahnya: 1). Pilih “Transform”, sorot “Recode” sorot “Into different variables”
35
SUTANTO PRIYO HASTONO: Analisis Data
Kemudian Klik ‘Into different Variable’
4). Sorot variabel “umur”, lalu klik tanda panah ke kanan sehingga “umur” berpindah di kotak Input variable Æ Output Variable: 5). Pada kotak Output variable, pada bagian Name ketiklah umur1 (nama variabel baru untuk umur yang bentuknya sudah katagorik) 6). Klik change sehingga pada kotak Input Variable Æ Output Variable terlihat umur Æ umur1 36
SUTANTO PRIYO HASTONO: Analisis Data
7). Klik Option “Old and New Value”, nampak kotak Old and New di monitor. Pada kotak dialog tersebut ada beberapa ada beberapa isian yang harus diisi. Secara garis besar ada 2 isian yang harus diisi, yaitu ‘Old Value’ (nilai lama yang akan direcode) dan New Value (nilai baru sebagai hasil ‘recode’ dari nilai lama). Me-recode dapat dilakukan per satu nilai lama atau jangkauan nilai (range). 8). Sekarang kita akan merecode nilai umur < 20 th menjadi kode 1. Umur dibawah 20 th, artinya umur terendah/paling muda sampai dengan umur 19 th. Pindahkan kursor ke kotak Range: ‘lowest through bawa kursor ke bagian kotak
, ketiklah 19 dan
‘new Value’, ketik 1 kemudian klik Add,
hasilnya sbb
37
SUTANTO PRIYO HASTONO: Analisis Data
Langkah 3
Langkah 1 Langkah 4
Langkah 2
9). Pindahkan kursor ke kotak Range:
through
, kita akan
merecode umur 20 s.d 30 th menjadi 2. Pada 2 kotak tersebut isilah 20 dan 30. lalu pindahkan kursor ke kotak ‘New Value’, ketiklah 2, klik ‘Add’.
10). Kita akan melakukan pengkodean berat > 30 th menjadi kode 3. Pada kotak Range:
thrugh highest ketiklah 31. Lalu pindahkan kursor ke
kotak ‘New Value’, ketiklah 3, klik ‘Add’. Langkahnya seperti diatas, dan akhirnya setelah selesai hasilnya sbb:
38
SUTANTO PRIYO HASTONO: Analisis Data
11). Klik “Continoue” 12). Klik “OK”, terlihat variabel baru “umur1” sudah terbentuk berada dikolom paling kanan
nampak variabel baru “umur1” masih menampilkan angka dengan 2 desimal, anda dapat masuk ke “Variable View”, pada kolom decimal ketik “0”, kemudian anda dapat juga memberi value label untuk kode 1= ≤ 20 th, 2 = 21 – 30 th dan 3= ≥ 31 th.
39
SUTANTO PRIYO HASTONO: Analisis Data 2. Membuat variabel baru hasil perhitungan matematik
# perintah : COMPUTE Selain fasilitas me-recode yang sudahkita coba untuk mengelompokkan data, fasilitas SPSS yang lain yaitu membuat variabel baru hasil dari operasi matematik dari beberapa variabel yang sudah dientry, misal melakukan penjumlahan, pengurangan, pembagian dan perkalian dll. Sebagai contoh pada data ASI.SAV ada data berat badan bayi dalam bentuk satuan gram, sekarang anda diminta untuk membuat variabel baru, berat badan bayi dalam satuan kilogram. Adapun caranya: 1). Pastikan anda di posisi tampilan data editor 2). Pilih “Transform” 3). Pilih “Compute”, kemudian muncul kotak dialog ”Compute Variable”.
Pada kotak tersebut terdapat kotak: “Target Variable” : diisi nama variabel yang akan dibuat, dapat merupakan variabel yang lama atau yang baru, sebaiknya nama baru
40
SUTANTO PRIYO HASTONO: Analisis Data “numeric Expression” : diisi rumus yang akan digunakan untuk menghitung nilai baru pada Target Variable. Rumus yang tertulis dapat mengandung nama variabel yang sudah ada, operasi matematik dan fungsi. Adapun operasi matematik yang dapat dilakukan: + = penjumlahan -
= pengurangan
* = perkalian /
= pembagian
** = pangkat (.) = kurung 4). Misalkan akan membuat variabel baru berat bayi, dengan nama “bayikilo”, maka pada kotak ‘Target Variable’, ketiklah “bayikilo” 5). Kemudian klik kotak ‘Numeric Expression’, sorot dan pindahkan variabel Bwt setelah itu bagilah 1000, tampilannya : bbbayi/1000, sehingga terlihat di layar:
6). Klik “OK”, sesaat kemudian variabel “bayikilo” akan muncul dibagian paling kanan.
41
SUTANTO PRIYO HASTONO: Analisis Data
3. Membuat variabel baru dengan kondisi
# perintah : IF Dalam pembuatan variabel baru seringkali dihasilkan dari kondisi beberapa variabel yang ada. Misalnya dalam file “ASI.SAV” terdapat variabel “umur” dan variabel “berat ibu”. Kemudian kita ingin membuat variabel baru yang berisi dua kelompok yaitu: risiko tinggi dan ririko rendah. Misalkan variabel tersebut diberi nama “Risk” dan untuk kelompok risiko rendah (kode 0) dan risiko tinggi (kode 1). Adapun kriteria risiko tinggi adalah bila responden berumur di atas 30 tahun dan berat badan dibawah 50 kg. Selain kondisi tersebut dikelompokkan ke dalam risiko rendah. Dari kasus ini berarti kita diharapkan membuat variabel baru dengan kondisi variabel umur dan hipertensi. Bagaimana cara membuat variabel “Risk” tersebut? Ada dua langkah untuk menyelesaikan kasus ini: Langkah pertama: = membuat variabel RISK yang isinya semuanya 0 (risiko rendah)= 1). Pilih “Transform” 2). Pilih “Compute” 3). Pada kotak “Target Variable”, ketiklah “risk” 4). Pada kotak “Numeric Expression”, ketiklah “0”
42
SUTANTO PRIYO HASTONO: Analisis Data
5). Klik “OK”, terlihat dilayar
variabel “risk” sudah terbentuk dengan semua
selnya berisi angka 0.
Langkah kedua: =membuat kondisi risiko tinggi (kode 1) untuk umur >30 dan bb<50 6). Pilih kembali menu “Transform” 7). Pilih kembali ‘Compute” 8). Pada kotak “Target Variable” biarkan tetap berisi “RISK”. 43
SUTANTO PRIYO HASTONO: Analisis Data 9). Pada kotak “Numeric Expression”, hapus angka 0 dan gantilah dengan angka 1.
10). Klik tombol “If ”, sesaat kemudian muncul dialog “ComputeVariable: If
Cases” 11). Klik tombol berbentuk lingkaran kecil: Include if case satisfies condition. 12). Pada kotak di bawah option include …. : ketiklah: umur > 30 & bbibu < 50
44
SUTANTO PRIYO HASTONO: Analisis Data
13). Klik “Continue” 14). Klik “OK”, akan muncul pesan:
15). Klik “OK”, maka terbentuklah variabel “RISK” pada kolom paling kanan dengan isi 0 dan 1 (0=risiko rendah dan 1= risiko tinggi), kalau menemui data yang berisi umur diatas 30 tahun dan berat ibu dibawah 50 th, maka isi variabel RISK akan berubah dari 0 menjadi 1, coba dicek !!!! Note : setiap kita melakukan perintah : Compute, Recode, atau IF sebaiknya di croscek, apakah hasilnya betul sesuai yang kita kehendaki
45
SUTANTO PRIYO HASTONO: Analisis Data 4. Memilih sebagian data (SUBSET)
# perintah : SELECT Dalam kondisi tertentu seringkali kita hanya menginginkan mengolah dan menganalisis hanya data dari kelompok tertentu saja. Misalkan kita punya data seluruh DKI, tapi kita hanya ingin mengetahui distribusi aktifitas pada ibu hamil yang tinggal di Jakarta Selatan. Di dalam data tentunya ada variabel yang menunjukkan wilayah tempat tinggal ibu hamil. Sebagai contoh kita ingin menganalisis data, hanya untuk ibu yang menyusui saja,(dalam contoh ini kita masih menggunakan file data ASI.SAV). caranya: 1). Pilih menu “Data” 2). Pih “Select Cases” 3). Klik pada tombol : If Conditin is satisfied
4). Klik “If “ 5). Ketiklh/sorot dan pindah pada kotak dan tuliskan kondisinya yaitu: Eksklu=0 Ket: ibu yang menyusui eksklusive kodenya=0
46
SUTANTO PRIYO HASTONO: Analisis Data
6). Klik “Continue” 7). Perhatikan di bagian bawah pada kotak: Unselected cases are: filtered atau
deleted. Pilihlah filtered artinya data yang tidak dianalisis hanya ditandai dengan pencoretan nomor kasus. Sedangkan untuk Deleted, artinya kasus yang tidak terpilih akan dihapus secara permanen. Biasanya digunakan option: filtered. 8). Klik “OK” sehingga anda kembali ke data editor. Perhatikan pada data editor ada beberapa kasus yang tidak terpilih (dimatikan), yang ditandai dengan pencoretan nomor kasusnya. Nomor batang yang dicoret artinya dikeluarkan dari data, sedangkan yang tidak dicoret merupakan data yang aktif (ibu yang menyusui eksklusive)
47
SUTANTO PRIYO HASTONO: Analisis Data 5. MENGGABUNG FILE DATA
# perintah : MERGE Dalam pengolahan data seringkali kita mempunyai tidak satu file data, melainkan beberapa file data yang tentunya harus digabung kalau kita akan melakukan analisis data. Teknik penggabungan data ada dua jenis yaitu penggabungan responden dan penggabungan variabel. a. Penggabungan responden/case Misal: data file pertama, berisi: nomor responden 1 s/d 3 No 1 2 3 Data file kedua, berisi: No 4 5 6 7
Umur 20 23 19
Didik 1 3 2
nomor responden 4 s/d 7 Umur 21 23 20 24
Didik 1 4 2 3
Data hasil gabungan, berisi : nomor rsponden 1 s/d 7 No 1 2 3 4 5 6 7
umur 20 23 19 21 23 20 24
Didik 1 3 2 1 4 2 3 48
SUTANTO PRIYO HASTONO: Analisis Data
Aplikasi di SPSS: Pastikan anda sudah memasukkan data kedua file, misalnya data pertama dengan nama Data1.sav dan data kedua dengan nama Data2.sav. Langkahnya: 1. File ‘data1.sav’ dalam kondisi aktif 2. klik data, sorot Merge Files, sorot Add Cases
3. klik Add Cases 4. Isikan pada kota file name : data2
49
SUTANTO PRIYO HASTONO: Analisis Data
5. klik Open 6. Klik OK, dan akhirnya tergabunglah kedua file data 7. Untuk menyimpan file gabungan, klik Save As isikan nama file baru, misalnya data12 b. Penggabungan variabel Data pertama : berisi variabel : no, umur dan didik no 1 2 3 4 5 6 7
umur 20 23 19 21 23 20 24
Didik 1 3 2 1 4 2 3
Data kedua, berisi variabel : no, sex, kerja dan berat badan 50
SUTANTO PRIYO HASTONO: Analisis Data no 1 2 3 4 5 6 7
sex 2 2 1 2 2 1 2
kerja 1 3 2 1 3 2 3
bb 60 45 56 76 56 60 55
Data gabungan, berisi : no, umur, didik, sex, kerja dan bb no 1 2 3 4 5 6 7
umur 20 23 19 21 23 20 24
Didik 1 3 2 1 4 2 3
sex 2 2 1 2 2 1 24
kerja 1 3 2 1 3 2 3
bb 60 45 56 76 56 60 55
Langkahnya: Aplikasi di SPSS: Pastikan anda sudah memasukkan data kedua file, misalnya data pertama dengan nama Data3.sav dan data kedua dengan nama Data4.sav. Langkahnya: 1. File ‘data3.sav’ dalam kondisi aktif 2. klik data, sorot Merge Files, sorot Add Variables
51
SUTANTO PRIYO HASTONO: Analisis Data
3. klik Add Variables 4. klik Open, Klik OK 5. Tampilan sudah tergabung variabelnya, anda tinggal melakukan penyimpanan “ klik Save As” beri nama file misal namanya Data34 6. Menyimpan hasil olahan/hasil analisis Hasil analisis akan ditampung pada jendela output (output windows) seperti tampak pada gambar di bawah ini. Anda dapat mengedit teks langsung pada windows tersebut. Prosedur yang sering digunakan untuk edit teks, seperti Cut,
Copy dan Paste juga dapat digunakan di jendela output ini. Bila anda akan menyimpan hasil analisis: 1). Pilih “File” 2). Pilih “Save SPSS Output” 3). Ketik/isikan nama file-nya 4). Klik “OK”
52
SUTANTO PRIYO HASTONO: Analisis Data
Frequencies Statistics RISK N Valid Missing
5 0
RISK
Valid
1 2 Total
Frequency 2 3 5
Percent 40.0 60.0 100.0
Valid Percent 40.0 60.0 100.0
Cumulative Percent 40.0 100.0
53
SUTANTO PRIYO HASTONO: Analisis Data
UJI INSTRUMEN
3
A. Uji validitas dan Reliabilitas Kuesioner Salah satu masalah dalam suatu penelitian adalah bagaimana data yang diperoleh adalah akurat dan objektif. Hal ini sangat penting dalam penelitian karena kesimpulan penelitian hanya akan dapat dipercaya (akurat). Data yang kita kumpulkan tidak akan berguna bilamana alat pengukur yang digunakan untuk mengumpulkan data penelitian tidak mempunyai validitas dan reliabilitas yang tinggi. VALIDITAS Validitas berasal dari kata Validity yang mempunyai arti sejauhmana ketepatan suatu alat ukur dalam mengukur suatu data. Misalnya bila seseorang akan mengukur cincin, maka dia harus menggunakan timbangan emas. Dilain pihak bila seseorang ingin menimbang berat badan, maka dia harus menggunakan timbangan berat badan. Jadi dapat disimpulkan bahwa timbangan emas valid untuk mengukur berat cincin, tapi timbangan emas tidak valid untuk menimbang berat badan. RELIABILITAS Realibilitas adalah suatu ukuran yang menunjukkan sejauhmana hasil pengukuran tetap konsisten bila dilakukan pengukuran dua kali atau lebih terhadap gejala yang sama dan dengan alat ukur yang sama. Misalkan seseorang ingin mengukur jarak dari satu tempat ke tempat lain dengan menggunakan dua jenis alat ukur. Alat ukur pertama denganmeteran yang dibuatdari logam, sedangkan alat ukur kedua dengan menghitung langkah kaki. Pengukuran 54
SUTANTO PRIYO HASTONO: Analisis Data dengan
meteran
logam
akan
mendapatkan
hasil
yang
sama
kalau
pengukurannya diulang dua kali atau lebih. Sebaliknya pengukuran yang dilakukan dengan kaki, besar kemungkinan akan didapatkan hasil yang berbeda kalau pengukurannya diulang dua kali atau lebih. Dari ilustrasi ini berarti meteran logam lebih reliable dibandingkan langkah kaki untuk mengukur jarak. CARA MENGUKUR VALIDITAS Untuk mengetahui validitas suatu instrumen (dalam hal ini kuesioner) dilakukan dengan cara melakukan korelasi antar skor masing-masing variabel dengan skor totalnya. Suatu variabel (pertanyaan) dikatakan valid bila skor variabel tersebut berkorelasi secara signifikan dengan skor totalnya. Teknik korelasi yang digunakan korelasi Pearson Product Moment: r=
N (ΣXY)- (ΣXΣY) V[NΣX2 – (ΣX)2][NΣY2 – (ΣY)2]
Keputusan uji: Bila r hitung lebih besar dari r tabel Æ Ho ditolak, artinya variabel valid Bila r hitung lebih kecil dari r tabel Æ Ho gagal ditolak, artinya variabel tidak valid CARA MENGUKUR RELIABILITAS Pertanyaan
dikatakan
reliabel
jika
jawaban
seseorang
terhadap
pertanyaan adalah konsisten atau stabil dari waktu ke waktu. Jadi jika misalnya responden
menjawab
“tidak
setuju”
terhadap
perilaku
merokok
dapat
mempertinggi kepercayaan diri, maka jika beberapa waktu kemudian ia ditanya lagi untuk hal yang sama, maka seharusnya tetap konsisten pada jawabab semula yaitu tidak setuju. Pengukuran reliabilitas pada dasarnya dapat dilakukan dengan dua cara :
55
SUTANTO PRIYO HASTONO: Analisis Data a. Repeated Measure atau ukur ulang. Pertanyaan ditanyakan pada reponden berulang pada waktu yang berbeda (misal sebulan kemudian), dan kemudian dilihat apakah ia tetap konsistendengan jawabannya b. One Shot atau diukur sekali saja. Disini pengukurannya hanya sekali dan kemudian hasilnya dibandingkan dengan pertanyaan lain. Pada umumnya pengukuran dilakukan dengan One Shot dengan beberapa pertanyaan Pengujian reliabilitas dimulai dengan menguji validitas terlebih dahulu. Jadi jika pertanyaan tidak valid, maka pertanyaan tersebut dibuang. Pertanyaanpertanyaan yang sudah valid kemudian baru secara bersama-sama diukur reliabilitasnya.
56
SUTANTO PRIYO HASTONO: Analisis Data
KASUS: UJI VALIDITAS DAN RELIABILITAS KUESIONER Lakukan uji validitas dan reliabilitas kuesioner untuk mengetahui tingkat stress pekerja industri. Untuk mengukur stress digunakan 5 pertanyaan. Uji coba dilakukan pada 15 responden dengan bentuk pertanyaan sbb: 1. Apkah anda sering terpaksa bekerja lembur? 1. tidak pernah
2. jarang
3.kadang-kadang
4. sering
5. selalu
2. Menurut anda, apakah dalam hidup ini perlu bersaing? 1. tidak pernah
2. jarang
3. kadang-kadang
4. perlu 5. sangat perlu
3. Apakah anda mudah marah? 1. tidak
2. jarang
3. kadang-kadang
4. sering
5. Ya
4. sering
5. Ya
4. sering
5. Ya
4. Apakah anda sering terjadi konflik dengan keluarga? 1. tidak
2. jarang
3. kadang-kadang
5. Apakah anda sering terjadi konflik dengan teman kerja? 1. tidak
2. jarang
3. kadang-kadang
Hasil pretest pada 15 responden, sbb: No P1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
P2 4 1 1 4 2 3 4 1 3 2 1 2 4 3 2
P3 3 1 2 4 4 3 1 1 3 3 1 2 2 1 3
P4 4 1 1 3 2 3 4 1 3 2 1 2 4 3 2
P5 4 1 1 4 2 3 4 1 3 2 1 2 3 3 2
4 1 1 4 2 3 4 1 3 2 1 2 4 3 2
57
SUTANTO PRIYO HASTONO: Analisis Data Ujilah kelima pertanyaan diatas apakah sudah valid dan reliabel Penyelesaian: Langkahnya: 1.
Masukkan data tersebut ke SPSS
2.
Klik ‘Analyze’
3.
Pilih ‘Scale’
4.
Pilih ‘Reliability Analysis’
5.
Masukkan semua variabel ke dalam kotak ‘Items’ (ingat variabel yang masuk hanya variabel yang akan diuji saja, yaitu P1, P2, P3, P4 dan P5) bentuknya sbb:
58
SUTANTO PRIYO HASTONO: Analisis Data
6.
Pada ‘Model’, biarkan pilihan pada ‘Alpha’
7.
Klik Option ‘Statistics’
8.
Pada bagian ‘Descriptives for’ klik pilihan ‘ítem’, Scale if Item deleted.
9.
Klik ‘Continue’
10.
Klik ‘OK’., terlihat hasil outputnya sbb : Reliability Statistics
Cronbach's Alpha .928
N of Items 5
Item Statistics sering terpaksa lembur Bersaing dlm hidup Mudah marah konflik keluarga konflik dgn teman
Mean 2.47 2.27 2.40 2.40 2.47
Std. Deviation 1.187 1.100 1.121 1.121 1.187
N 15 15 15 15 15
59
SUTANTO PRIYO HASTONO: Analisis Data
Item-Total Statistics
sering terpaksa lembur Bersaing dlm hidup Mudah marah konflik keluarga konflik dgn teman
Scale Mean if Item Deleted 9.53 9.73 9.60 9.60 9.53
Scale Variance if Item Deleted 15.124 20.924 15.971 15.686 15.124
Corrected Item-Total Correlation .963 .328 .915 .955 .963
Cronbach's Alpha if Item Deleted .881 .993 .892 .884 .881
Interpretasi: Hasil analisis reliability memperlihatkan dua bagian. Bagian utama menunjukkan hasil statistik deskriptif masing-masing variabel dalam bentuk mean, varian dll. Pada bagian kedua memperlihatkan hasil dari proses validitas dan reliabilitas. Kaidah yang berlaku bahwa pengujian dimulai dengan menguji validitas kuesioner baru dilanjutkan uji reliabilitas. a. Uji Validitas Untuk mengetahui validitas kuesioner dilakukan dengan membandingkan nilai r tabel dengan nilai r hitung. *) Menentukan nilai r tabel Nilai r tabel dilihat dengan tabel r (pada lampiran) dengan menggunakan df = n2 Î 15-2=13. Pada tingkat kemaknaan 5%, didapat angka r tabel = 0,514 **) Menentukan nilai r hasil perhitungan Nilai r hasil dapat dilihat pada kolom “Corrected item-Total Correlation” ***) Keputusan Masing-masing pertanyaan/variabel dibandingkan nilai r hasil dengan nilai r tabel, ketentuan: bila r hasil > r tabel, maka pertanyaan tersebut valid. Kesimpulan: Terlihat dari 5 pertanyaan, ada satu pertanyaan yaitu P2 (r=0,3275) yang nilainya lebih rendah dari r tabel (r=0,514). Sehingga pertanyaan P2 tidak valid, sedangkan untuk pertanyaan P1, P3, P4 dan P5 dinyatakan valid. 60
SUTANTO PRIYO HASTONO: Analisis Data Langkah selanjutnya melakukan analisis lagi dengan mengeluarkan pertanyaan yang tidak valid. Lakukan prosedur/langkah seperti di atas yaitu: 1. Klik ‘Analyze’ 2. Pilih ‘Scale’ 3. Pilih ‘Reliability Analysis’ 4. Masukkan keempat variabel ke dalam kotak ‘Items’ (variabel P2 tidak ikut dianalisis) 5. Klik “OK” Kemudian muncul tampilan Output sbb:
Reliability Statistics Cronbach's Alpha .993
N of Items 4
Item Statistics sering terpaksa lembur Mudah marah konflik keluarga konflik dgn teman
Mean 2.47 2.40 2.40 2.47
Std. Deviation 1.187 1.121 1.121 1.187
N 15 15 15 15
Item-Total Statistics
sering terpaksa lembur Mudah marah konflik keluarga konflik dgn teman
Scale Mean if Item Deleted 7.27 7.33 7.33 7.27
Scale Variance if Item Deleted 11.495 12.095 12.095 11.495
Corrected Item-Total Correlation .996 .971 .971 .996
Cronbach's Alpha if Item Deleted .988 .994 .994 .988
Interpretasi: Sekarang terlihat bahwa dari keempat pertanyaan, semua mempunyai nilai r hasil (Corrected item-Total Correlation) berada di atas dari niali r tabel (r=0,514), sehingga dapat disimpulkan keempat pertanyaan tersebut valid. 61
SUTANTO PRIYO HASTONO: Analisis Data
b. Uji Reliabilitas setelah semua pertanyaan valid semua, amnalisis dilanjutkan dengan uji reliabilitas. Untuk mengetahui reliabilitas caranya adalah; membandingkan nialia r hasil dengan r tabel.dalam uji reliabilitas sebagai nilai r hasil adalah nilai “Alpha” (terletak di akhir output). Ketentuannya: bila r Alpha > r tabel, maka pertanyaan tersebut reliabel Dari hasil uji di atas ternyata, nilai r Alpha (0,9935) lebih besar dibandingkan dengan nilai r tabel, maka keempat pertanyaan di atas dinyatakan reliabel.
B. Uji Interrater Reliability Dalam melakukan penelitian dengan metode observasi seringkali antara peneliti dengan numerator (pengumpul data) terjadi perbedaan persepsi terhadap kejadian yang diamati. Agar data yang dihasilkannya valid, maka harus ada penyamaan
persepsi
antara
peneliti
dengan
petugas
pengumpul
data
(numerator). Uji interrater Reliability merupakan jenis uji yang digunakan untuk menyamakan persepsi antara peneliti dengan petugas pengumpul data. Alat yang digunakan untuk uji Interrater adalah uji statistik Kappa. Prinsip ujinya: bila hasil uji Kappa signifikan/bermakna maka persepsi antara peneliti dengan numerator sama, sebaliknya bila hasil uji kappa tidak signifikan/bermakna, maka persepsi antara peneliti dengan numerator terjadi perbedaan. Contoh : Suatu penelitian praktek keperawatan keluarga terdapat instrumen yang berbentuk observasi terhadap perilaku perawat merawat pasien. Pertanyaanya:
62
SUTANTO PRIYO HASTONO: Analisis Data
Apakah dalam melakukan komunikasi dengan pasien bersifat ramah ? 1. ya
2. tidak
Kemudian dilakukan uji coba dengan pengamatan sebanyak 10 pasien, adapun hasilnya sbb: No pasien
peneliti
numerator
1
1
2
2
2
2
3
1
1
4
2
1
5
1
1
6
2
2
7
1
1
8
2
2
9
2
2
10
2
2
Ujilah apakah ada kesepakatan antara peneliti dengan numerator: Langkah: 1. data di entry di SPSS 2. Klik analysis, sorot Descriptif, sorot dan klik Crostab 3. Masukkan variabel ‘peneliti’ ke bagian Row dan masukkan variabel ‘numerator’ ke bagian colom. 4. Klik tombol Statistic, klik Kappa 5. Klik Continue 6. Klik OK, dan hasilnya
63
SUTANTO PRIYO HASTONO: Analisis Data
Symmetric Measures
Measure of Agreement N of Valid Cases
Kappa
Value .583 10
Asymp. a Std. Error .262
b
Approx. T 1.845
Approx. Sig. .065
a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.
Hasil uji didapatkan nilai koefisien kapaa sebesar 0,583 dan p valuenya sebesar 0,065. Dengan hasil ini berarti p value > alpha berarti hasil uji kappa tidak signifikan/bermakna,
sehingga
kesimpulannya:
ada
perbedaan
persepsi
mengenai aspek yang diamati antara peneliti dengan numerator.
64
SUTANTO PRIYO HASTONO: Analisis Data
PENGANTAR
4
ANALISIS DATA
1. Pendahuluan Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya adalah menganalisis data. Data mentah (raw data) yang sudah susah payah kita kumpulkan tidak akan ada artinya jika tidak dianalisis. Analisis data merupakan kegiatan yang sangat penting dalam suatu penelitian, karena dengan analisislah data dapat mempunyai arti/makna yang dapat berguna untuk memecahkan masalah penelitian. Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat langsung memberi jawaban penelitian, untuk itu perlu diketahui bagaimana menginterpretasi
hasil
penelitian
tersebut.
Menginterpretasi
berarti
kita
menjelaskan hasil analisis guna memperoleh makna/arti. Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas. Interpretasi dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya sebatas
pada
masalah
penelitian
yang
diteliti
berdasarkan
data
yang
dikumpulkan dan diolah untuk keperluan penelitian tersebut. Sedangkan interpretasi dalam arti luas (analitik) yaitu interpretasi guna mencari makna data hasil penelitian dengan jalan tidak hanya menjelaskan/menganalisis data hasil penelitian tersebut, tetapi juga melakukan inferensi (generalisasi) dari data yang diperoleh dengan teori-teori yang relevan dengan hasil-hasil penelitian tersebut.
Pada umumnya analisis data bertujuan untuk: a. Memperoleh gambaran/deskripsi masing-masing variabel 65
SUTANTO PRIYO HASTONO: Analisis Data b. Membandingkan dan menguji teori atau konsep dengan informasi yang ditemukan c. Menemukan adanya konsepbaru dari data yang dikumpulkan d. Mencari penjelasan apakah konsep baru yang diuji berlaku umum atau hanya berlaku pada kondisi tertentu Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari: a. Jenis penelitian b. Jenis sampel c. Jenis data/variabel d. Asumsi kenormalan distribusi data
a. Jenis Penelitian Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan survei. Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan kuantitatif.
Namun
bila
kita
menginginkan
untuk
mendapatkan
pendapat/gambaran yang mendalam tentang suatu fenomena, maka data dapat dikumpulkan dengan fokus grup diskusi atau observasi, maka analisisnya menggunakan pendekatan analisis kualitatif.
c. Jenis Sampel Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah kedua sampel independen atau dependen. Misalnya pada penelitian survei yang tidak menggunakan
sampel
yang
sama,
dapat
digunakan
uji
statistik
yang
mengasumsikan sampel yang independen. Misalkan survei untuk mengetahui apakah ada perbedaan berat badan bayi antara bayi-bayi yang dilahirkan dari ibu perokok dengan bayi-bayi dari ibu yang tidak merokok. Disini berarti kelompok ibu perokok dan kelompok ibu bukan perokok bersifat independen.
66
SUTANTO PRIYO HASTONO: Analisis Data Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum dan sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang digunakanadalah uji statistik utnuk data yang dependen. Misalnya, suatu penelitian ingin mengetahui pengaruh penelitian manajemen terhadap kinerja petugas kesehatan. Pertanyaan penelitiannya “Apakah ada perbedaan kinerja petugas kesehatan antara sebelum dan sesudah mendapatkan pelatihan manajemen?”. Dalam penelitian ini sampel kelompok petugas kesehatan bersifat dependen, karena pada kelompok (orang) yang sama diukur dua kali yaitu pada saat sebelum pelatihan (pre test) dan sesudah dilakukan pelatihan (Post Test).
c. Jenis Data/Variabel Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik. Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai contoh, nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk menjelaskan data berjenis katagorik, sedangkan untuk data jenis numerik biasanya dapat menggunakan nilai rata-rata untuk menjelaskan karakteristiknya. Untuk analisis hubungan dua variabel (analsis bivariat), uji kai kuadrat hanya dapat dipakai untuk mengetahui hubungan data katagori dengan data katagori. Sebaliknya untuk mengetahui hubungan numerik dengan numerik digunakan uji korelasi/regresi.
d. Asumsi Kenormalan Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan prosedur uji statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat dipenuhi maka dapat digunakan uji statistik parametrik. Berikut
ini
akan
dijelaskan
langkah-langkah
analisis
(pendekatan
kuantitatif): 1. Analisis Deskriptif (Univariat). 67
SUTANTO PRIYO HASTONO: Analisis Data Tujuan
dari
analisis
ini
adalah
untuk
menjelaskan/mendiskripsikan
karakteristik masing-masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk data numerik digunakan nilai mean (rata-rata), median, standard deviasi dan inter kuartil range, minimal maksimal. 2. Analisis Analitik (Bivariat) Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis lebih lanjut. Apabila diinginkan analisis hubungan antar dua variabel, maka analisis dilanjutkan pada tingkat bivariat. Misalnya ingin diketahui hubungan antara berat badan dengan tekanan darah. Untuk mengetahui hubungan dua variabel tersebut biasanya digunakan pengujian statistik. Jenis uji statistik yang digunakan sangat tergantung jenis data/variabel yang dihubungkan. 3. Analisis Multivariat Merupakan
analisis
yang
menghubungkan
antara
beberapa
variabel
independen dengan satu variabel dependen. Secara lebih khusus/detail analisis univariat, bivariat dan multivariat akan dipelajari pada bab tersendiri yaitu bab 5, 6 dan 7
68
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS UNIVARIAT
5
( DESKTIPTIF)
Tujuan dari analisis ini adalah untuk menjelaskan/mendeskriptifkan karakteristik masing-masing variabel yang diteliti. Dalam analisis data kuantitatif kita dihadapkan pada kumpulan data yang besar/banyak yang belum jelas maknanya. Fungsi analisis sebetulnya adalah menyederhanakan atau meringkas kumpulan data hasil pengukuran sedemikian rupa sehingga kumpulan data tersebut berubah menjadi informasi yang berguna. Peringkasan tersebut berupa ukuran-ukuran statistik, tabel dan juga grafik. Secara teknis pada dasarnya analisis merupakan kegiatan meringkas kumpulan data menjadi ukuran tengah dan ukuran variasi. Selanjutnya membandingkan gambaran-gambaran tersebut antara satu kelompok subyek dan kelompok subyek lain, sesuai dengan tujuan yang ingin dicapai dalam analisis. Berbicara peringkasan data (yang berwujud ukuran tengah dan ukuran variasi) jenis data (apakah numerik atau katagorik) akan sangat menentukan bentuk peringkasan datanya. Berikut akan diuraikan bentuk/cara peringkasan data untuk data numerik dan data katagorik. 1. Peringkasan Data Untuk Data Jenis Numerik a. Ukuran Tengah Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil pengukuran. Berbagai ukuran dikembangkan utnuk mencerminkan ukuran tengah tersebut, dan yang paling sering dipakai adalah mean, median dan mode/modus. 1). Mean
69
SUTANTO PRIYO HASTONO: Analisis Data Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah semua nilai pengukuran dibagioleh banyaknya pengukuran. Secara sederhana perhitungan nilai mean dapat dituliskan dengan rumus : X = Σ Xi / n Keuntungan nilai mean adalah mudah menghitungnyadan sudah melibatkan seluruh data dalam penghitungannya. Namun kelemahan dari nilai mean adalah sangat dipengaruhi oleh nilai ekstrim, baik ekstrim tinggi maupun rendah. Oleh karena itu pada kelompok data yang ada nilai ekstrimnya (sering dikenal dengan ‘distribusi data yang menceng/miring’), Mean tidak dapat mewakili rata-rata kumpulan nilai pengamatan. Sebagai contoh data yang
ada
nilai
ekstrimnya
adalah
data
penghasilan.
Apabila
mean
perndapatan perbulan adalah Rp 10.000.000,- , sebenarnya sebagian besar orang pendapatannya di bawah Rp 10.000.000,- . Mean sebesar Rp 10.000.000,- diperoleh karena tarikan sekelompok kecil orang (misalnya konglomerat)
yang
pendapatannya
sangat
tinggi.
Dengan
demikian
penggunaan mean untuk data yang ada nilai ekstrimnya (data yang distribusinya menceng) kurang tepat. Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90 hr. Mean = (1+3+4+2+90)/5 = 20 hr. Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil ini tendtunya tidak dapat mewakili karena secara visual datanya sebagian besar kurang dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di atas ada nilai ekstrimnya. 2). Median Median adalah nilai dimana setengah banyaknya pengamatan mempunyai nialai di bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda dengan nilai mean, penghitungan median hanya mempertimbangkan urutan nilai dasil pengukuran, besar beda antar
nilai
di
abaikan.
Karena 70
SUTANTO PRIYO HASTONO: Analisis Data mengabaikan besar beda, maka median tidak dipengaruhi oleh nilai ekstrim. Prosedur penghitungan median melalui langkah a). Data diurutkan/di-array dari nilai kecil ke besar b). Hitung posisi median dengan rumus (n+1)/2 c). Hitung nilai mediannya Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th Data diurutkan: 20, 24, 26, 30, 36, 40 Posisi = (6+1)/2 = 3,5 Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28 Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa berumur di atas 28 tahun 3). Mode/Modus Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak. Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th. Dari data tersebut berarti mode-nya adalah 20 tahun
Bentuk Distribusi Data Hubungan nilai mean, median dan mode akan menentukan bentuk distribusi data: -
Bila nilai mean, median dan mode sama, maka bentuk distribusi datanya normal
-
Bila nilai mean > median > mode, maka bentuk distribusi datanya menceng/miring ke kanan
-
Bila nilai mean < median < mode, maka bentuk distribusi datanya menceng /miring ke kiri
71
SUTANTO PRIYO HASTONO: Analisis Data b. Ukuran Variasi Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain atau dengan kata lain hasil pengamatan akan bervariasi. Untuk menegtahui seberapa jauh data bervariasi digunakan ukuran variasi antara lain range, jarak linier kuartil dan standard deviasi. 1). Range Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai ekstrim. Keuntungan penghitungan dapat dilakukan dengan cepat. 2). Jarak Inter Quartil Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian ditentukan kuartil bawah dan atas. Kuartil merupakan pembagiandata menjadi 4 bagian yang dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil II dan kuartil III. Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di atasnya. Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data berada di atasnya. Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya. Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih baik dari range, terutama kalau frekuensi pengamatan banyak dan distribusi sangat menyebar. 3). Standard Deviasi Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai pengamatan terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi terhadap mean disebut varian, yang rumusnya; Varian = Σ(Xi – X)2 n
72
SUTANTO PRIYO HASTONO: Analisis Data Semakin besar nilai varian akan semakin bervariasi, karena satuan varian (kuadrat) yang tidak sama dengan satuan nilai pengamatan, maka dikembangkan suatu ukuran variasi yang mempunyai satuan yang sama dengan satuan pengamatan, yaitu Standard Deviasi. Standard Deviasi merupakan akar dari varian: Standard deviasi (S atau SD = Σ(Xi – X)2 n
Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila tidak ada variasi, maka SD=0 Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan niali mean (rata-rata), median, standard deviasi dan inter quartil range, miinimal dan maksimal. Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal), maka perhituungan nilai mean dan standard deviasi merupakan cara analisis univariat yang tepat. Seddangkan bila dijumpai nilai ekstrim 9distribusi data tidak normal), maka nilai nedian dan inter quartil range (IQR) yang lebih tepat dibandingkan nilai mean. 2. Peringkasan Data Katagorik Berbeda dengan data numerik, peringkasan, (baik ukuran tengah maupun ukuran variasi) tidak beragam jenisnya. Pada data katagorik peringkasan data hanya menggunakan distribusi frekuensi dengan ukuran persentase atau proporsi. Bila data berjenis katagorik, tentunya informasi/peringkasan yang penting disampaikan tidak mungkin/tidak lazim menggunakan ukuran mean atau median. melainkan informasi jumlah dan persentase
yang disajikan. Untuk
ukuran variasi, pada data katagorik variasi maksimal apabila jumlah antar katagori sama.
73
SUTANTO PRIYO HASTONO: Analisis Data Contoh:
Kelas A: mahasiswa 50 dan mahasiswi 50 Kelas B: mahasiswa 90 dan mahasiswi 10
Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50% pria dan 50% wanita. Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria) karena pria 90% dan wanita hanya 10%. 3. Bentuk Penyajian Data Bentuk penyajian analisis univariat dapat berupa tabel atau grafik. Namun perlu diingat bahwa kita dianjurkan hanya memilih salah satu, tidak diperkenankan secara sekaligus menggunakan tabel dan juga grafik dalam m,enyampaikan informasi suatu data/variabel. Contoh penyajian analisis deskriptif: a. Data numerik Tabel 1 Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999 Variabel
Mean
SD
Minimal- Maksimal
10,1
17 – 60
8,9
2 – 60
Median 1. Umur
30,3 31,1
2. Lama hari rawat
10,1 7,0
74
SUTANTO PRIYO HASTONO: Analisis Data
b. Data katagorik Tabel 2 Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X tahun 1999
Pendidikan
Jumlah
Persentase
SD
60
60,0
SMP
30
30,0
SMU
10
10,0
Total
100
100,0
Bagaimana menginterpretasi tabel di atas? “dilihat konsentrasi/jumlah yang terbesar data pada kelompok mana?” Selain untuk mendeskripsikan masing-masing variabel, analisis univariat dapat juga sekaligus untuk mengeksplorasi variabel yang dapat berguna dalam mendiagnosis asumsi statistik lanjut (terutama untuk variabel jenis numerik), misalnya apakah variannya homogen atau heterogen, apakah distribusinya normal atau tidak. Eksplorasi data juga dapat untuk mendeteksi adanya nilai ekstrim/outlier, bila ada nilai ekstrim sangat menentukan analisis selanjutnya (bivariat) apakah nilainya akan berkurang.
75
SUTANTO PRIYO HASTONO: Analisis Data
KASUS : ANALISIS DESKRIPTIF (UNIVARIAT) Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masingmasing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk data numerik digunakan nialai mean (rata-rata), median, standard deviasi dll. Sedangkan untuk data katagorik tentunya hanya dapat menjelaskan angka/nilai jumlah dan persentase masing-masing kelompok. Berikut akan dipelajari cara mengeluarkan analisis deskriptif di SPAA, dimulai untuk variabel katagorik (sebagai latihan digunakan variabel ‘pendidikan’) dan kemudian dilanjutkan variabel numerik (variabel umur). a. Data Katagorik Untuk menampilkan tabulasi data katagorik digunakan tampilan frekuensi. Sebagai contoh kita akan menampilkan tabel distribusi frekuensi untuk variabel pendidikan dari file ‘ASI.SAV’. 1. Dari menu utama SPSS pilih ‘Analyze’, kemudian ‘Descriptive Statistic’ dan pilih ‘Frequencies’, sehingga muncul tampilan:
2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak “Variable (s)”
76
SUTANTO PRIYO HASTONO: Analisis Data
3. Klik ‘OK’, hasil dapat dilihat di jendela output, seperti sbb:
Frequencies Statistics pendidikan formal ibu menyusui N Valid 50 Missing 0 pendidikan formal ibu menyusui
Valid
1 2 3 4 Total
Frequency 10 11 16 13 50
Percent 20.0 22.0 32.0 26.0 100.0
Valid Percent 20.0 22.0 32.0 26.0 100.0
Cumulative Percent 20.0 42.0 74.0 100.0
Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai. Pada contoh di atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang berpendidikan SD, proporsi dapat dilihat pada kolom ‘Percent’, pada contoh di atas ada 20% ibu yang berpendidikan SD. Kolom ‘Valid Percent’ memberi hasil yang sama karena pada data ini tidak ada ’missing cases’. ‘Cumulative Percent’
77
SUTANTO PRIYO HASTONO: Analisis Data menjelaskan tentang persent kumulatif. Pada contoh di atas ada 42,0% ibu yang tingkat pendidikannya SD dan SMP. Dalam menginterpretasikan tabel katagorik dapat dilihat dari variasi dan konsentrasi datanya.
Penyajian dan Interpretasi di Laporan Penelitian Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan penelitian/laporan tesis. Adapun penyajian dan interpretasinya sbb: Tabel … Distribusi Responden Menurut Tingkat Pendidikan Di ………… X tahun …. Pendidikan
Jumlah
Persentase
SD
10
20,0
SMP
11
22,0
SMU
16
32,0
PT
13
26,0
Total
50
100,0
Distribusi tingkat pendidikan responden hampir merata untuk masing-masing tingkat pendidikan. Paling banyak responden berpendidikan SMU yaitu 16 orang (32,0%) sedangkan untuk pendidikan SD, SMP dan PT masing-masing 20,0%, 22,0% dan 26,0%.
b. Data Numerik Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan ukuran tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata, median dan modus. Sedangkan ukuran sebarannya (variasi) yang digunakan adalah range, standard deviasi, minimal dan maksimal. Pada SPSS ada dua cara untuk
mengeluarkan
‘Frequencies’
atau
analisis
perintah
deskriptif ‘Expolre’.
yaitu
Biasanya
dapat yang
melalaui digunakan
perintah adalah 78
SUTANTO PRIYO HASTONO: Analisis Data
Frequencies oleh karena ukuran statistik yang dapat dihasilkan pada menu ‘Frequencies’ sangat lengkap (seperti mean, median, varian dll), selain itu pada perintah ini juga dapat ditampilkan grafik histogram dan kurve normalnya. Berikut akan dicoba mengeluarkan analisis deskriptif untuk variabel umur dengan menggunakan perintah frequencies. 1. Aktifkan data “susu.sav” 2. Pilih ‘Analyze’ 3. Pilih ‘Descriptive Statistic’ 4. Pilih ‘Frequencies’, terlihat kotak frequencies: 5. Sorot
variabel
yang
akan
dianalisis,
sorot
umur,
dan
klik
tanda
panahsehingga umur masuk ke kotak variable (s).
6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya mean, median, standard seviasi, minimum, maximum, SE.
79
SUTANTO PRIYO HASTONO: Analisis Data
7. Klik ‘Continue’ 8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’, lalu klik ‘With Normal Curve’
9. Klik ‘Continue’ 10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran statistik yang diminta dan dibawahnya tampak grafik histogram beserta curve normalnya.
Frequencies Statistics Umur ibu menyusui N Valid Missing
50 0
80
SUTANTO PRIYO HASTONO: Analisis Data
Statistics umur ibu menyusui N Valid Missing Mean Std. Error of Mean Median Mode Std. Deviation Minimum Maximum
50 0 25.10 .686 24.00 19 4.850 19 35
umur ibu menyusui
Valid
19 20 21 22 23 24 25 26 27 30 31 32 34 35 Total
Frequency 7 3 3 5 5 4 2 5 3 3 3 3 2 2 50
Percent 14.0 6.0 6.0 10.0 10.0 8.0 4.0 10.0 6.0 6.0 6.0 6.0 4.0 4.0 100.0
Valid Percent 14.0 6.0 6.0 10.0 10.0 8.0 4.0 10.0 6.0 6.0 6.0 6.0 4.0 4.0 100.0
Cumulative Percent 14.0 20.0 26.0 36.0 46.0 54.0 58.0 68.0 74.0 80.0 86.0 92.0 96.0 100.0
81
SUTANTO PRIYO HASTONO: Analisis Data
Histogram
7
6
Frequency
5
4
3
2
1 Mean = 25.1 Std. Dev. = 4.85 N = 50
0 15
20
25
30
35
umur ibu menyusui
Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan nilai standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas, rata-rata umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi 4,85 tahun dengan umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi frekuensi ditampilkan menurut umur
termuda sampai dengan umur tertua
dengan informasi tentang jumlah dan persentasenya. Bentuk distribusi data dapat diketahui dari grafik histogram dan kurve normalnya. Dari tampilan grafik dapat dilihat bahwa distribusi variabel umur berbentuk normal Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi interval lakukan analisis eksplorasi data dengan perintah ‘Explore’. Adapun caranya sbb: 1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu ‘descriptive Statistics’, lalu pilih ‘Explore’ 82
SUTANTO PRIYO HASTONO: Analisis Data 2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’ dan
‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:
3. Klik tombol ‘Plots’, dan pilih ‘Normality Plots With Test’
4. Klik ‘Continue’ 5. Klik ‘OK’, hasilnya dapat dilihat di layar:
Explore
83
SUTANTO PRIYO HASTONO: Analisis Data
Descriptives umur ibu menyusui
Mean 95% Confidence Interval for Mean
Lower Bound Upper Bound
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis
Statistic 25.10 23.72
Std. Error .686
26.48 24.90 24.00 23.520 4.850 19 35 16 9 .547 -.812
.337 .662
Tests of Normality a
Kolmogorov-Smirnov Statistic df Sig. .130 50 .035
umur ibu menyusui
Shapiro-Wilk Statistic df .920 50
Sig. .002
a. Lilliefors Significance Correction
umur ibu menyusui umur ibu menyusui Stem-and-Leaf Plot Frequency 7.00 20.00 10.00 11.00 2.00 Stem width: Each leaf:
Stem & 1 2 2 3 3
. . . . .
Leaf 9999999 00011122222333334444 5566666777 00011122244 55
10 1 case(s)
84
SUTANTO PRIYO HASTONO: Analisis Data
Normal Q-Q Plot of umur ibu menyusui
2
Expected Normal
1
0
-1
-2 15
20
25
30
35
Observed Value
35
30
25
20
15
umur ibu menyusui
85
SUTANTO PRIYO HASTONO: Analisis Data
Dari hasil analisis ‘Explore’ terlihat juga nilai mean, median dan mode. Namun yang paling penting dari tampilan explore munculnya angka estimasi interval. Dari hasil tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita dapat menghitung 95% confidence interval umur yaitu 23,72 s.d. 26,48. jadi kita 95% yakin bahwa rata-rata umur ibu di populasi berada pada selang 23,72 sampai 26,48 tahun. Uji kenormalan data: Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk mengetahuinya yaitu: 1. Dilihat dari grafik histogram dan kurve normal, bila bentuknya menyerupai bel shape, berarti distribusi normal 2. Menggunakan nilai Skewness dan standar errornya, bila nilai Skewness dibagi standar errornya menghasilkan angka ≤ 2, maka distribusinya normal 3. Uji kolmogorov smirnov, bila hasil uji signifkan (p value < 0,05) maka distribusi normal. Namun uji kolmogorov sangat sensitif dengan jumlah sampel, maksudnya : untuk jumlah sampel yang besar uji kolmogorov cenderung
menghasilkan
uji
yang
signifikan
(yang
artinya
bentuk
distribusinya tidak normal). Atas dasar kelemahan ini dianjurkan untuk mengetahui kenormalan data lebih baik menggunakan angka skewness atau melihat grafik histogram dan kurve normal
86
SUTANTO PRIYO HASTONO: Analisis Data Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat bentuk yang normal, selain itu hasil dari perbandingan skwness dan standar error didapatkan: 0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti distribusi normal. Dari hasil tersebut diatas dengan demikian variabel umur disimpulkan berdistribusi normal. Penyajian dan Interpretasi di Laporan Penelitian Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan penelitian/laporan tesis. Adapun penyajian dan interpretasinya adalah sbb: Tabel 1 Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x Variabel
Mean
SD
Minimal- Maksimal
95% CI
Umur
25,10
4,85
19 - 35
23,72 – 26,48
Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72 – 26,48), dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur tertua 35 tahun. Dari hasil estimasi interval dapat disimpulkan bahwa 95% diyakini bahwa rata-rata umur ibu adalah diantara 23,72 sampai dengan 26,48 tahun.
87
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS BIVARIAT
6
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis pembayaran
berobat
dan
kepuasan
pasien,
kita
hanya
melakukan
pendeskripsian sendiri-sendiri untuk variabel jenis pembayaran dan kepuasan pasien. Untuk variabel jenis pembayaran akan diketahui berapa persen yang berobat dengan biaya sendiri dan berapa persen yang dibiayai askes. Begitu juga untuk variabel kepuasan pasien, akan diketahui berapa persen yang puas dan berapa persen yang tidak puas. Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh diatas berarti kita ingin mengetahui hubungan jenis pembayaran dengan kepuasan pasien, maka analisis dilanjutkan pada tingkat bivariat. Pada analisis bivariat kita dapat mengetahui apakah ada perbedaan kepuasan pasien antara pasien dengan membayar sendiri dengan pasien dengan biaya askes. Kegunaan analisis bivariat bisa untuk mengetahui apakah ada hubungan yang siginifikan antara dua variabel, atau bisa juga digunakan untuk mengetahui apakah ada perbedaan yang signifikan antara dua atau lebih kelompok(sampel).
Perbedaan Substansi/Klinis dan perbedaan Statistik Perlu dipahami/disadari bagi peneliti bahwa berbeda bermakna/signifikan secara statistik tidak berarti (belum tentu) bahwa perbedaan tersebut juga bermakna dipandang dari segi substansi/klinis. Seperti diketahui bahwa semakin besar sampel yang dianalisis akan semakin besar menghasilkan kemungkinan berbeda bermakna. Dengan sampel besar perbedaan-perbedaan sangat kecil, yang sedikit atau bahkan tidak mempunyai manfaat secara substansi/klinis dapat 88
SUTANTO PRIYO HASTONO: Analisis Data berubah menjadi bermakna secara statitik. Oleh karena itu arti kegunaan dari setiap penemuan jangan hanya dilihat dari aspek statistik semata, namun harus juga dinilai/dilihat kegunaannya dari segi klinis/substansi. Sebagai contoh ada studi eksperimen yang akan menguji dua obat (katakanlah obat A dan Obat B) untuk mengathui pengaruhnya terhadap penurunan tekanan darah. Kemudian obat A dan B diujicobakan pada dua kelompok relawan penderita hipertensi. Hasil eksperimen didapatkan bahwa rata-rata penurunan tekanan darah setelah minum obat A adalah 40 mmHg dan pada kelompok yang minum Obat B ratarata penurunannya 39 mmHg. Kemudian dilakukan uji statistik dan hasilnya signifikan/bermakna (p value < alpha), apa yang dapat disimpulkan dari temuan ini? Secara statistik memang terjadi perbedaan bermakna, namun secara substansi tidaklah mempunyai perbedaan yang berarti, oleh karena perbedaan mean penurunan tekanan darah antara obat A dan B hanya 1 mmHg. Dengan hasil ini dapat disimpulkan bahwa sebenarnya antara obat A dan B tidak ada perbedaan (sama saja) kasiatnya.
UJI HIPOTESIS Pengujian hipotesis dapat berguna untuk membantu pengambilan keputusan tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau hubungan, cukup menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini didasarkan pada besarnya peluang untuk memperoleh hubungan tersebut secara kebetulan (by chance). Semakin kecil peluang tersebut (peluang adanya by
chance), semakin besar keyakinan bahwa hubungan tersebut memang ada. Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk memutuskan berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru lebih baik daripada yang sekarang beraedar di pasaran. Untuk menjawab pertanyaan ini maka perlu dilakukan pengujian hipotesis. Dengan pengujian hipotesis akan diperoleh suatu kesimpulan secara probalistik apakah vaksin baru tersebut lebih baik dari yang sekarang beredar di pasaran atau malah sebaliknya. 89
SUTANTO PRIYO HASTONO: Analisis Data Prinsip uji hipotesis adalah melakukan perbandingan antara nilai sampel (data hasil penelitian) dengan nilai hipotesis (nilai populasi) yang diajukan. Peluang untuk diterima atau ditolaknya suatu hipotesis tergantung besar kecilnyanya perbedaan antara nilai sampel dengan nilai hipotesis. Bila perbedaan tersebut cukup besar, maka peluang untuk menolak hipotesis besar pula, sebaliknya bila perbedaan tersebut kecil, maka peluang untuk menolak hipotesis menjadi kecil. Jadi, makin besar perbedaan antara nilai sampel dengan nilai hipotesis, makin besar peluang untuk menolak hipotesis. Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua kemungkinan yaitu menolak hipotesis dan menerima hipotesis (gagal menolak hipotesis). Perlu dipahami bahwa arti menerima hipotesis sebetulnya kurang tepat, yang tepat adalah gagal menolak hipotesis. Dalam uji hipotesis bila kesimpulannya menerima hipotesis, bukan berarti bahwa kita telah membuktikan hipotesis tersebut benar, karena benar atau tidaknya suatui hipotesis hanya dapat dibuktikan dengan mengadakan observasi pada seluruh populasi, dan hal ini sangat sulit bahkan tidak mungkin untuk dilakukan. Jadi menerima hipotesis sebetulnya artinya adalah kita tidak cukup bukti untuk menolak hipotesis, dengan kata lain dapat diartikan kita gagal menolak hipotesis. Untuk memperjelas pengertian kebenaran
bahwa “gagal menolak hipotesis berbeda dengan mengakui hipotesis
(menerima
hipotesis”,
kita
coba
analogkan
proses
persidangan kriminal di pengadilan. Seperti dalam sidang pengadilan, kegagalan membuktikan kesalahan tertuduh bukan berarti si tertudauh tidak bersalah atau sitertuduh benar. Pengadilan memutuskan bahwa si tertuduh tidak dapat dibuktikan bersalah, bukan memutuskan tidak bersalah. Dari uraian tersebut sangatlah jelas bahwa istilah yang tepat dalam kesimpulan uji hipotesis adalah gagal menolak hiopotesis, dan bukan menerima hipotesis. 1. Hipotesis Hipotesis
berasal
dari
kata
hupo
dan
thesis.
Hupo
artinya
sementara/lemah kebenarannya dan thesis artinya pernyataan/teopri. Dengan 90
SUTANTO PRIYO HASTONO: Analisis Data demikian hipotesis berarti pernyataan yang perlu diuji kebenarannya. Untuk menguji kebenaran sebuah hipotesis digunakan pengujian yang disebut pengujian hipotesis. Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis nol (Ho) dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas tentang masing-masing hipotesis tersebut. a. Hipotesis Nol (Ho). Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara variabel satu dengan variabel lainnya Contoh: 1). Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok 2). Tidak ada hubungan antara merokok dengan berat badan bayi b. Hipotesis Alternatif (Ha) Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok. Atau hipotesis yang menyatakan ada hubungan antara variabel satu dengan variabel lainnya Contoh: 1). Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok 2). Ada hubungan antara merokok dengan berat badan bayi 2. Arah dan bentuk hipotesis Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu arah (one tail) atau dua arah (twa tail)
91
SUTANTO PRIYO HASTONO: Analisis Data a. One tail (satu sisi): bila hipotesis alternatifnya menyatakan adanya perbedaan dan ada pernyataan yang mengatakan hal satu lebih tinggi/rendah dari hal lain. Contoh: Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan bayi dari ibu tidak merokok. b. Two tail (dua sisi) merupakan hipotesis alternatif yang hanya menyatakan perbedaan tanpa melihat apakah hal satu lebih tinggi/rendah dari hal lain. Contoh: Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan bayi dari ibu tidak merokok. Atau dengan kata lain: ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dibandingkan dari ibu yang tidak merokok. Contoh penulisan hipotesis: Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan tekanan darah, maka hipotesisnya sbb: Ho : μA = μB Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Tidak ada hubungan antara jenis kelamin dengan tekanan darah. Ho : μA ≠ μB Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Ada hubungan antara jenis kelamin dengan tekanan darah 3. Menentukan Tingkat Kemaknaan (Level of Significance) Tingkat kemaknaan merupakan kesalahan tipe I suatu uji yang biasanya diberi notasi ‘α’. Seperti sudah diketahui bahwa tujuan dari pengujian hipotesis adalah untuk membuat suatu pertimbangan tentang perbedaan antara nilai sampel dengan keadaan populasi sebagai suatu hipotesis. Langkah selanjutnya setelah ktriteria/batasan yang digunakan untuk memutuskan apakah hipotesis nol ditolak atau gagal ditolak yang disebut dengan tingkat kemaknaan (Level of 92
SUTANTO PRIYO HASTONO: Analisis Data
Significance). Tingkat kemakanaan, atau sering disebut dengan nilai α, merupakan nilai yang menunjukkan besarnya peluang salah dalam menolak hipotesis nol. Atau dengan kata lain, nilai α merupakan batas toleransi peluang salah dalam menolak hipotesis nol. Dengan kata-kata yang lebih sederhana, nilai α merupakan batas maksimal kesalahan menolak Ho. Bila kita menolak Ho berarti menyatakan adanya perbedaan/hubungan. Sehingga nilai α dapat diartikan pula sebagai batas maksimal kita salah dalam menyatakan adanya perbedaan. Penentuan nilai α (alpha) tergantung dari tujuan dan kondisi penelitian. Nilai α yang sering digunakan adalah 10%, 5%, atau 1%. Untuk bidang kesehatan masyarakat biasanya digunakan nilai α sebesar 5%. Sedangkan unutuk pengujian obat-obatan digunakan batas toleransi kesalahan yang lebih kecil misalnya 1%, karena mengandung risiko yang fatal. Misalkan
seorang
peneliti yang akan menentukan apakah suatu obat bius berkhasiat akan menentukan nilai α yang kecil sekali, peneliti tersebut tidak akan mau mengambil risiko bahwaketidak berhasilan obat bius besar karena akan berhubungan dengan nyawa seseorang yang akan dibius. 4. Pemilihan Jenis Uji Parametrik atau Non Parametrik Dalam pengujian hipotesis sangat berhubungan dengan distribusi data populasi yang akan diuji. Bila distribusi data populasi yang akan diuji berbentuk normal/simetris/Gauss, maka proses pengujian dapat digunakan dengan pendekatan uji statistik parametrik. Sedangkan bila distribusi data populasinya tidak normal atau tidak diketahuidistribusinya maka dapat digunakan pendekatan uji statistik non parametrik. Kenormalan suatu distribusi data dapat juga dilihat dari jenis variabelnya, bila variabelnya berjenis numerik/kuantitatif biasanya distribusi datanya mendekati normal/simetris, sehingga dapat digunakan uji statistik parametrik. Bila jenis variabelnya katagorik (kualitatif), maka bentuk distribusinya tidak normal, sehingga uji non parametrik dapat digunakan.
93
SUTANTO PRIYO HASTONO: Analisis Data Penentuan jenis uji juga ditentukan oleh jumlah data yang dianalisis, bila jumlah data kecil (<30) cenderung digunakan uji non parametrik. PROSEDUR/LANGKAH UJI HIPOTESIS Menetapkan Hipotesis Hipotesis dalam statistik dikenal dua macam yaitu hipotesis nol (Ho) dan hipotesis alternatif (Ha). 1). Hipotesis nol (Ho) Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua kelompok. Contoh: Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok 2). Hipotesis alternatif (Ha) Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok. Contoh: Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok. Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu arah (one tail) atau dua arah (two tail). Penentuan Uji Statistik Yang Sesuai Ada beragam jenis uji statistik yang dapat digunakan. Setiap uji statistik mempunyai persyaratan tertentu yang harus dipenuhi. Oleh karena itu harus digunakan uji statistik yang tepat sesuai dengan data yang diuji. Jenis uji statistik sangat tergantung dari: 1). Jenis variabel yang akan dianalisis 2). Jenis data apakah dependen atau independen
94
SUTANTO PRIYO HASTONO: Analisis Data 3). Jenis distribusi data populasinya apakah mengikuti distribusi normal atau tidak. Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan mean akan
berbeda
dengan
uji
statistik
untuk
mengetahui
perbedaan
proporsi/persentase. Uji beda mean menggunakan uji t atau inova, sedangkan uji untuk mengetahui perbedaan proporsi digunakan uji Kai kuadrat. Menentukan Batas atau Tingkat Kemaknaan (Level og Significance) Batas/tingkat kemaknaan, sering juga disebut dengan nilai α. Penggunaan nilai alpha tergantung tujuan penelitian yang dilakukan, untuk bidang kesehatan masyarakat biasanya menggunakan nilai alpha 5%. Penghitungan Uji Statitik Penghitungan uji statistik adalah menghitung data sampel ke dalam uji hipotesis yang sesuai. Misalnya kalau ingin menguji perbedaan mean antara dua kelompok, maka data hasil pengukuran dimasukkan ke rumus uji t. Dari hasil dengan nilai populasi untuk mengetahui apakah ada hipotesis ditolak atau gagal menolak hipotesis. Keputusan Uji Statistik Seperti telah disebutkan pada langkah D, bahwa hasil pengujian statistik akan menghasilkan dua kemungkinan keputusan yaitu menolak hipotesis nol (Ho) dan gagal menolak hipotesisi nol. Seiring dengan kemajuan perkembangan komputer maka uji statistik dengan mudah dan cepat dapat dilakukan dengan program-program statistik yang tersedia di pasaran seperti Epi Info, SPSS, SAS dll. Setiap kita melakukan uji statistik melalui program komputer maka yang akan kita cari adalalah nilai p (p value). Dengan nilai p ini kita dapat menggunakan untuk keputusan uji statistik dengan cara membandingkan nilai p dengan α (alpha). Ketentuan yang berlaku adalah: 95
SUTANTO PRIYO HASTONO: Analisis Data a). Bila nilai p ≤ α, maka keputusannya adalah Ho ditolak b). Bila nilai p > α, maka keputusannya adalah Ho gagal ditolak Perlu diketahui bahwa nilai p two tail adalah 2 kali nilai p one tail berarti kalau tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang dilakukan adalah two tail maka nilai p dari tabel harus dikalikan 2. dengan demikian dapat disederhanakan dengan rumus : nilai p two tail = 2 x nilai p one
tail. Pendekatan probabilistik ini sekarang sudah mulai digunakan oleh para ahli statistik dalam pengambilan keputusan uji statistik. Pada modul ini dalam memutuskan uji statistik menggunakan pendekatan ini. Pengertian Nilai P Nilai p merupakan nilai yang menunjukkan besarnya peluang salah menolak Ho dari data penelitian. Nilai P dapat diartikan pula sebagai nilai besarnya peluang hasil penelitian (misal adanya perbedaan mean atau proporsi) terjadi karena faktor kebetulan (by chance). Harapan kita nilai p adalah sekecil mungkin, sebab bila nilai p-nya kecil maka kita yakin bahwa adanya perbedaan pada hasil penelitian menunjukkan pula adanya perbedaan di populasi. Dengan kata lain kalau nilai p-nya kecil maka perbedaan yang ada pada penelitian terjadi bukan karena faktor kebetulan (by chance). Contoh: Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan berat badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa ratarata berat badan bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat badan bayi yang lahir dari ibu yang tidak hipertensi adalah 3000 gram. Perbedaan berat bayi antara ibu yang hipertensi dengan ibu yang tidak hipertensi sebesar 100 gram. Pertanyaan yang timbul adalah apakah perbedaan berat badan bayi tersebut juga berlaku untuk seluruh populasi yang diteliti atau hanya faktor kebetulan saja?. Untuk menjawab pertanyaan tersebut kemudian dilakukan uji statistik yang tepat yaitu uji t. Miisalnya dihasilkan nilai p = 0,0110 96
SUTANTO PRIYO HASTONO: Analisis Data maka berarti peluang adanya perbedaan berat bayi sebesar 1000 gram akibat dari faktor kebetulan (by chance) adalah sebesar 0,0110. oleh karena peluangnya sangat kecil (p=0,0110), maka dapat diartikan bahwa adanya perbedaan tersebut bukan karena faktor kebetulan namun karena memang karena adanya riwayat hipetensi. Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat Variabel I
Variabel II
Jenis
uji
statistik
yang
digunakan Katagorik
Katagorik
Numerik
↔ Katagorik
↔ Numerik
↔ Numerik
-
Kai kuadrat
-
Fisher Exact
-
Uji T
-
ANOVA
-
Korelasi
-
Regresi
97
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS BIVARIAT HUBUNGAN
7
KATAGORIK DENGAN NUMERIK
Uji t Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah parameter dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan tekanan darah penduduk dewasa orang kota dengan orang desa. Atau, apakah ada perbedaan berat badan antar sebelum mengikuti program diet dengan sesudahnya. Uji statistik yang membandingkan mean dua kelompok data ini disebut uji beda dua mean. Pendekatan ujinya dapat menggunakan pendekatan distribusi Z dan distribusi t , sehingga pada uji beda dua mean bisa menggunakan uji Z atau uji t, namun lebih sering digunakan uji t. Sebelum kita melakukan uji statistik dua kelompok data, kita perlu mengetahui apakah dua kelompok data tersebut berasal dari dua kelompok yang
independen
atau
berasal
dari
dua
dependen/pasangan. Dikatakan kelompok independen
kelompok
yang
bila data kelompok
yang satu tidak tergantung dari kelopok kedua, misalnya membandingkan mean tekanan darah
sistolik orang desa dengan orang kota. Tekanan darah orang
kota independen (tidak tergantung) dengan orang desa. Dilain pihak, kedua kelompok
data dikatakan dependen/pasangan bila kelompok data yang
dibandingkan datanya saling mempunyai ketergantungan, misalnya data berat badan sebelum dan sesudah mengikuti program diet berasal dari orang yang sama (data sesudah dependen/tergantung dengan data sebelum).
98
SUTANTO PRIYO HASTONO: Analisis Data Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi dalam dua kelompok, yaitu: uji beda mean independen (uji T independen) dan uji beda mean dependen (uji T dependen).
1. Uji beda dua mean independen Tujuan: untuk mengetahui perbedaan mean dua dua kelompok data independen, syarat yang harus dipenuhi: a. Data berdistribusi normal/simetris. b. Kedua kelompok data independen. c. Variabel yang dihubungkan berbentuk numerik dan katagorik (ket: variabel katagorik hanya dengan dua kelompok). Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi kedua kelompok data. Oleh karena itu dalam pengujian ini diperlukan informasi apakah varian kedua kelompok yang diuji sama atau tidak. Bentuk varian kedua kelompok data akan berpengaruh pada nilai standar error yang akhirnya akan membedakan rumus pengujiannya. a. Uji untuk varian sama Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T. uji Z dapat digunakan bila standar deviasi populasi (σ) diketahui dan jumlah sampel besar (>30). Apabila kedua syarat tersebut tidak terpenuhi maka dilakukan uji . pada umumnya nilai σ sulit diketahui, sehingga uji beda dua mean biasanya menggunakan uji T (T Test). Untuk varian yang sama maka bentuk ujinya sbb: X1 – X2 T= Sp
Sp2 =
(1/n1) + (1/n2)
(n1-1) S12 + (n2 – 1) S22 n1 – n2 - 2 99
SUTANTO PRIYO HASTONO: Analisis Data
df = n1 – n2 - 2 Ket : n1 atau n2 = jumlah sampel kelompok 1 atau 2 S1 atau S2 = standar deviasi sampel kelompok 1 atau 2 b. Uji untuk varian berbeda X1 – X2 T= (S12/n1) + (S22/n2) [(S12/n1) + (S22/n2)]2 df = [(S12/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]
c. Uji homogenitas varian Tujuan dari uji ini adalah untuk mengetahui varian antara kelompok data satu apakah sama dengan kelompok data yang kedua. S12 F= S22
df1 = n1-1 dan df2 = n2-1 Pada perhitungan uji F, varian yang lebih besar sebagai pembilang dan varian yang lebih kecil sebagai penyebut. 2. Uji beda dua mean dependen (Paired sample) Tujuan : Untuk menguji perbedaan mean anatara dua kelompok data yang dependen. Contoh kasus:
100
SUTANTO PRIYO HASTONO: Analisis Data
Apakah ada perbedaan tingkat pengetahuan antara sebelum dan sesudah dilakukan pelatihan.
Apakah ada perbedaan berat badan antara sebelum dan sesudah mengikuti program diet.
Syarat : a. Distribusi data normal b. Kedua kelompok data dependen/pair c. Jenis variabel: numerik dan katagorik (dua kelompok) Formula : d T= S_d /
n
d = rata-rata deviasi/selisih sampel 1 dengan sampel 2 S_d = standar deviasi dari deviasi/selisih sampel sampel 1 dan sampel 2
101
SUTANTO PRIYO HASTONO: Analisis Data
KASUS: UJI t INDEPENDEN DAN UJI t DEPENDEN 1. Uji t independen Sebagai contoh kita gunakan data “ASI.SAV” dengan melakukan uji hubungan perilaku menyusui dengan kadar Hb (misal digunakan variabel Hb1), apakah ada perbedaan kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang menyusuinya tidak eksklusif, caranya: 1. Aktifkan/bukalah file data “ASI.SAV” 2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu “Compare Means’, lalu pilih “Independen-Samples T Test” 3. Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable (s)’I dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel katagoriknya, ingat jangan sampai terbalik. 4. Klik ‘hb1’ dan msukkan ke kotak ‘Test variable’ 5. Klik variabel ‘eksklu’ dan masukkan ke kotak‘Grouping Variable’.
6. Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel ‘menyusui’ ke dalam kedua kotak. Pada contoh ini, kita
102
SUTANTO PRIYO HASTONO: Analisis Data tahu bahwa ‘0’ kode untuk yang tidak eksklusif dan kode ‘1’ untuk Yang eksklusif. Jadi ketiklah 0 pada Group 1” dan 1 pada “Group 2”
7. Klik “Continue” 8. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test Group Statistics
kadar hb pengukuran pertama
status menyusui asi tdk EKSKLUSIVE EKSKLUSIVE
N 24 26
Mean 10.421 10.277
Std. Deviation 1.4712 1.3228
Std. Error Mean .3003 .2594
Independent Samples Test Levene's Test for Equality of Variances
F kadar hb pengukur an pertama
Equal variances assumed Equal variances not assumed
.072
Sig. .790
t-test for Equality of Means
t
df
Sig. (2-taile d)
Mean Differen ce
Std. Error Differe nce
95% Confidence Interval of the Difference Lower Upper
-.364
48
.717
-.1439
.3951
-.9384
.6505
-.363
46.4
.719
-.1439
.3968
-.9425
.6547
Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan standar error kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb ibu yang menyusui ekslusif adalah 10,277 gr% dengan standar deviasi 1,322
103
SUTANTO PRIYO HASTONO: Analisis Data gr%, sedangkan untuk ibu yang menyusui non eksklusif, rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%. Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua uji T, yaitu uji T dengan asumsi varian kedua kelompok sama (equal variances
assumed) dan uji T dengan asumsi varian kedua kelompok tidak sama (equal variances not assumed). Untuk, memilih uji mana yang kita pakai, dapat dilihat uji kesamaan varian melalui uji Levene. Lihat nilai p Levene test, nilai p < alpha (0,05) maka varian berbeda dan bila nilai p > alpha (0,05) maka varian sama (equal). Pada uji Levene di atas menghasilkan nilai p = 0,790 sehingga dapat disimpulkan bahwa pada alpha 5%, didapat tidak ada perbedaan varian (varian kedua kelompok sama). Selanjutnya dicari p value uji t pada bagian varian sama (equal variances) di kolom sig (2 tailed) ,yaitu sebesar p=0,717 artinya tidak ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang menyusui non eksklusif. Penyajian dan Interpretasi di laporan penelitian: Seperti pada analisis deskriptif, print out di atas tidak boleh langsung di copy dan disajikan di laporan penelitian. Pada laporan penelitian kita harus membuat tabel baru untuk menyajikan hasil print out analisis di atas. Adapun bentuk penyajian dan interpretasinya adlah sbb: Tabel … Distribusi Rata-Rata Kadar Hb Responden Menurut Perilaku Menyusui di..th.. Menyusui
Mean
SD
SE
P value
N
Ya Eksklusif
10,277
1,322
0,259
0,717
26
Tdk Eksklusif
10,421
1,471
0,300
24
Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan standar deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%. 104
SUTANTO PRIYO HASTONO: Analisis Data Hasil uji statistik didapatkan nilai p=0,717, berarti pada alpha 5% terlihat tidak ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui secara eksklusif dengan non eksklusif. 2. Uji T Dependen Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji T dependen sering digunakan pada analisis data penelitian eksperimen. Seperti sudah dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau kedua kelompok sampel yang dibandingkan mempunyai subyek yang sama. Dengan kata lain disebut dependen bila responden diukur dua kali/diteliti dua kali, sering orang mengatakan penelitian pre dan post. Misalnya kita ingin membandingkan berat badan antara sebelum dan sesudah mengikuti program diet. Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui apakah ada perbedaan kadar Hb antara pengukuran pertama dengan pengukuran kedua. Disini terlihat sampelnya dependen karena orangnya sama diukur dua kali. Adapun langkahnya: 1. Pastikan anda berada di file “ASI.SAV”, jika belum aktifkan/bukalah file ini. 2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu “Compare Means’, lalu pilih “Paired-Samples T Test”
105
SUTANTO PRIYO HASTONO: Analisis Data 3. Klik ‘hb1’ 4. Klik ‘hb2’ 5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan 6. Klik ‘OK’ hasilnya tampak sbb
T-Test Paired Samples Statistics Mean Pair 1
kadar hb pengukuran pertama kadar hb pengukuran kedua
N
Std. Deviation
Std. Error Mean
10.346
50
1.3835
.1957
10.860
50
1.0558
.1493
Paired Samples Correlations N Pair 1
kadar hb pengukuran pertama & kadar hb pengukuran kedua
Correlation 50
Sig.
.707
.000
Paired Samples Test
Mean Pair 1
kadar hb pengukuran pertama - kadar hb pengukuran kedua
-.5140
Paired Differences 95% Confidence Interval of the Std. Std. Difference Deviati Error on Mean Lower Upper
.9821
.1389
-.7931
-.2349
t
-3.701
df
49
Pada tabel pertama terlihat statistik deskriptif berupa rata-rata dan standar deviasi kadar Hb antara pengukuran pertama dan pengukuran kedua. Rata-rata kadar Hb pada pengukuran pertama (hb1) adalah 10,346 gr% dengan standar deviasi 1,38 gr%. Pada pengukuran kedua (hb2) didapat rata-rata kadar Hb adalah 10,860 gr% dengan standar deviasi 1,05 gr%.
106
Sig. (2-taile d)
.001
SUTANTO PRIYO HASTONO: Analisis Data Uji T berpasangan dilaporkan pada tabel kedua, terlihat nilai mean perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan standar deviasi 0,982. perbedaan ini diuji dengan uji T berpasangan menghasilkan nilai p yang dapat dilihat pada kolom “Sig (2-tailed)”. Pada contoh di atas didapatkan nilai p=0,001, maka dapat disimpulkan ada perbedaan yang signifikan kadar hb antara pengukuran pertama dengan pengukuran kedua. Penyajian dan Interpretasi di laporan penelitian: Dari hasil yang didapat di atas kemudian angka-angka disusun dalam tabel
yang
disajikan
dalam
laporan
penelitian.
Bentuk
penyajian
dan
interpretasinya sbb: Tabel … Distribusi Rata-Rata Kadar Hb Responden Menurut Pengukuran pertama dan Kedua di …. Th…… Mean
SD
SE
P value
N
Pengukuran I
10,346
1,38
0,19
0,001
50
Pengukuran II
10,860
1,05
0,14
Variabel Kadar Hb
Rata-rata kadar Hb pada pengukuran pertama adalah 10,346 gr% dengan standar deviasi 1,38 gr%. Pada pengukuran kedua didapat rata-rata kadar Hb adalah 10,860 gr% dengan standar deviasi 1,05 gr%. Terlihat nilai mean perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan standar deviasi 0,982. hasil uji statistik didapatkan nilai 0,001 maka dapat disimpulkan ada perbedaan yang signifikan antara kadar Hb pengukuran pertama dan kedua.
107
SUTANTO PRIYO HASTONO: Analisis Data
8
ANALISIS HUBUNGAN KATEGORIK DENGAN NUMERIK
UJI ANOVA Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data baik yang independen maupun dependen. Namun seringkali kita jumpai jumlah kelompok yang lebih dari dua, misalnya ingin mengetahui perbedaan mean berat badan bayi untuk daerah Bekasi, Bogor dan Tangerang. Dalam menganalisis data seperti ini (> 2 kelompok) sangat tidak dianjurkan menggunakan uji T. kelemahan menggunakan uji T adalah; pertama kita melakukan uji berulang kali sesuai kombinasi yang mungkin, kedua, bila melakukan uji T berulang kali akan meningkatkan (inflasi) nilai α, artinya akan meningkatkan peluang hasil yang keliru. Perubahan inflasi α sebesar = 1 – (1-α)n Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang tepat) dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji F. Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua sumber variasi yaitu variasi dalam kelompok (within) dan variasi antar kelompok (between). Bila variasi within dan between sama (nilai perbandingan kedua varian sama dengan 1) maka mean-mean yang dibandingkan tidak ada perbedaan, sebaliknya bila hasil perbandingan tersebut menghasilkan lebih dari 1, maka mean yang dibandingkan menunjuk ada perbedaan.
108
SUTANTO PRIYO HASTONO: Analisis Data Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor (one way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas analisis varian satu faktor (one way). Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah: 1. Varian homogen 2. Sampel/kelompok independen 3. Data berdistribusi normal 4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk katagori yang lebih dari 2 kelompok.
Perhitungan uji ANOVA sbb: Sb2
df =
F= 2
Sw
k-1 Æ untuk pembilang n-k Æ untuk penyebut
2
(n1-1)S12 + (n2-1)S22 + ……..+ (nk-1)Sk2
Sw = N-k
Sb2 =
n1(X1-X)2 + n2(X2-X)2 + ………+ nk(Xk-X)2 k-1 n1.X1 + n2.X2 + ……. + nk.Xk
X= N Ket N = jumlah seluruh data (n1 + n2 + ….. + nk) Analisis Multi Comparison (POSTHOC TEST) Analisis ini bertujuam untuk mengetahui lebih lanjut kelompok mana saja yang berbeda mean-nya bilamana pada pengujian ANOVA dihasilkan ada 109
SUTANTO PRIYO HASTONO: Analisis Data perbedaan yang bermakna (Ho ditolak). Ada berbagaijenis analisis multiple comparasion diantaranya adalah Bonferroni, Honestly Significant different (HSD), Scheffe dan lain-lain. Pada modul ini yang akan dibahas adalah metode Bonferroni. Perhitungan Bonfrroni adalah sbb Xi - Xj tij =
Sw2[(1/ni) + (1/nj)]
df = n – k Dengan level of significance (α) sbb:
α* =
α (k2)
110
SUTANTO PRIYO HASTONO: Analisis Data
Kasus: UJI ANOVA Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan berat badan bayi. Variabel pendidikan merupakan variabel katagorik dengan 4 katagori. Variabel berat bayi berbentuk numerik sehingga uji yang digunakan ANOVA. Adapun caranya sbb: 1. Aktifkan/bukalah file data “ASI.SAV” 2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu “Compare Means’, lalu pilih “One-Way ANOVA” sesaat akan muncul menu One Way NOVA 3. Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan kotak Factor perlu diisi variabel. Kotak ‘dependent’ diisi variabel numerik dan kotak ‘factor’ diisi variabel katagoriknya. Pada contoh ini berarti pada kotak Dependen diisi variabel “bbbayi” pada kotak Factor diisi variabel “Didik”.
4. 5. Klik tombol ‘Options” tandai dengan √ pada kotak “Descriptive”
111
SUTANTO PRIYO HASTONO: Analisis Data
6. Klik “Continue” 7. Klik tombol “Post Hoc”, tandai dengan √ pada kotak “Bonferroni”
8. Klik “Continue” 9. Klik “OK”
Oneway Descriptives berat badan bayi 95% Confidence Interval for Mean
SD SMP SMU PT Total
N 10 11 16 13 50
Mean 2470.00 2727.27 3431.25 3761.54 3170.00
Std. Deviation 249.666 241.209 270.108 386.304 584.232
Std. Error 78.951 72.727 67.527 107.141 82.623
Lower Bound 2291.40 2565.23 3287.32 3528.10 3003.96
Upper Bound 2648.60 2889.32 3575.18 3994.98 3336.04
Minim um 2100 2100 3000 3000 2100
Maxim um 2900 3000 4000 4100 4100
112
SUTANTO PRIYO HASTONO: Analisis Data
Test of Homogeneity of Variances berat badan bayi Levene Statistic 2.506
df1
df2 3
Sig. .071
46
ANOVA berat badan bayi
Between Groups Within Groups Total
Sum of Squares 12697038 4027962 16725000
df 3 46 49
Mean Square 4232345.862 87564.400
F 48.334
Sig. .000
Post Hoc Tests Multiple Comparisons Dependent Variable: berat badan bayi Bonferroni (I) (J) pendidika pendidikan Mean n formal formal ibu Difference ibu menyusui (I-J) i SD SMP -257.273
SMP
SMU
PT
SMU PT SD SMU PT SD SMP PT SD SMP SMU
-961.250* -1291.538* 257.273 -703.977* -1034.266* 961.250* 703.977* -330.288* 1291.538* 1034.266* 330.288*
Std. Error 129.294 119.286 124.468 129.294 115.902 121.228 119.286 115.902 110.492 124.468 121.228 110.492
Sig. .315 .000 .000 .315 .000 .000 .000 .000 .027 .000 .000 .027
95% Confidence Interval Lower Bound Upper Bound -613.76 99.21 -1290.14 -632.36 -1634.72 -948.36 -99.21 613.76 -1023.54 -384.42 -1368.51 -700.02 632.36 1290.14 384.42 1023.54 -634.93 -25.64 948.36 1634.72 700.02 1368.51 25.64 634.93
*. The mean difference is significant at the .05 level.
Dari print out ini diperoleh rata-rata berat bayi dan stndar deviasi masing-masing kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat bayinya adalah 2727,2 gram dengan standar deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata berat 113
SUTANTO PRIYO HASTONO: Analisis Data bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan standar deviasi 386,3 gram. Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom “F” dan “Sig”, terlihat p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005), berarti pada alpha 5%, dapat disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan. Pada Box paling bawah terlihat hasil dari uji ‘Multiple Comparisons Bonferroni” yang berguna untuk menelusuri lebih lanjut kelompok mana saja yang berhubungan signifikan. Untuk mengetahui kelompok yang signifikan dapat terlihat dari kolom Sig. Ternyata kelompok signifikan adalah tingkat pendidikan SD dengan SMU, SD dengan PT, SMP dengan SMU, SMP dengan PT dan SMU dengan PT.
Penyajian dan Interpretasi di laporan Penelitian Tabel … Distribusi Rata-Rata berat Bayi Menurut Tingkat pendidikan Mean
SD
95% CI
P value
- SD
2470,0
249,6
2291,4 – 2648,6
0,0005
- SMP
2727,2
241,2
3565,2 – 2889,3
- SMU
3431,2
270,1
3287,3 – 3575,1
- PT
3761,5
386,3
3528,1 – 3994,9
Variabel Pendidikan
Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata berat bayinya adalah 2727,20 gram dengan standar deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka yang 114
SUTANTO PRIYO HASTONO: Analisis Data berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan standar deviasi 386,3 gram. Hasil uji statistik didapat niali p=0,0005, berarti pada alpha 5% dapat disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan. Analisis lebih lanjut membuktikan bahwa kelompok yang berbeda signifikan adalah tingkat pendidikan SD dengan SMU,
SD dengan PT, SMP dengan
SMU,SMP dengan PT dan SMU dengan PT.
115
SUTANTO PRIYO HASTONO: Analisis Data
9
ANALISIS HUBUNGAN KATAGORIK DENGAN KATAGORIK
UJI KAI KUADRAT Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat dinyatakan dalam bentuk angka-angka pengukuran (data numerik). Sebaliknya justru yang kita jumpai adalah data hasil dari menghitung jumlah pengamatan yang diklasifikasikan atas beberapa katagori. Data seperti ini disebut data katagorik (kualitatif), misalnya jenis kelamin yang mempunyai katagori: laki-laki dan perempuan; status merokok yang mempunyai katagori; perokok berat, perokok ringan dan tidak merokok. Dalam penelitian kesehatan seringkali peneliti perlu melakukan analisis hubungan variabel katagorik dengan variabel katagorik. Analisis ii bertujuan untuk menguji perbedaan proporsi dua atau lebih kelompok sampel. Uji statistik yang digunakan untuk menjawab kasus tersbut adalah UJI KAI KUADRAT (CHI SQUARE). Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku menyusui ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif antara ibu yang bekerja dengan ibu yang tidak bekerja. Dari contoh terlihat bahwa variabel jenis pekerjaan (bekerja/tidak bekerja) merupakan variabel katagorik, dan variabel perilaku menyusui (eksklusif/non eksklusif) juga merupakan variabel katagorik. Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita pahami dengan benar apa itu variabel katagorik. Suatu variabel disebut katagorik bila isi variabel tersebut terbentuk dari hasil klasifikasi/penggolongan, misalnya variabel sex, jenis pekerjaan, golongan darah, pendidikan. Di lain pihakvariabel numerik (misalnya berat badan, umur dll) dapat masuk/dapat 116
SUTANTO PRIYO HASTONO: Analisis Data menjadi
variabel
katagorik
bila
variabel
tersebut
sudah
mengalami
pengelompokan. Misalkan kita ambil satu contoh variabel berat badan, berat badan bila nilainyamasih riil (50 kg, 63 kg dst) maka masih termasuk variabel numerik, namun bila sudah dilakukan pengelompokan menjadi (<50 kg (kurus), 50-60 kg (sedang) dan > 60 (gemuk) maka variabel tersebut sudah berjenis katagorik. 1. Tujuan Uji kai Kuadrat Tujuan dari digunakannya uji kai kuadrat adalah untuk untuk menguji perbedaan proporsi/persentase antara beberapa kelompok data. Dilihat dari segi datanya uji kai kuadrat dapat digunakan untuk mengetahui hubungan antara variabel katagorik dengan variabel katagorik. Contoh pertanyaan penelitian untuk kasus yang dapat dipecahkan oleh uji kai kuadrat misalnya: a. Apakah ada perbedaan kejadian hipertensi antara wanita dan pria. Kasus ii berarti akan menguji hubungan variabel hipertensi (katagori dengan klasifikasi ya dan tidak) dengan variabel jenis kelamin (katagori dengan klasisfikasi wanita dan pria) b. Apakah ada perbedaan kejadian anemia antara ibu yang kondisi soseknya tinggi, sedang dan rendah. Pada kasus ini akan menguji hubungan variabel anemia katagori dengan klasifikasi ya dan tidak) dengan variabel Sosek (katagori dengan klasifikasi rendah, sedang dan tinggi). 2. Prinsip dasar Uji Kai Kuadrat Proses pengujian kai kuadrat adalah membandingkan frekuensi yang terjadi (observasi) dengan frekuensi harapan (ekspektasi). Bila nilai frekuensi observasi dengan nilai frekuensi harapan sama, maka dikatakan tidak ada perbedaan yang bermakna (signifikan). Sebaliknya, bila niali frekuensi observasi dan nilai frekuensi harapan berbeda, maka dikatakan ada perbedaan yang bermakna (signifikan). Pembuktian dengan uji kai kuadrat dengan menggunakan formula: (O – E)2 X =Σ 2
E
117
SUTANTO PRIYO HASTONO: Analisis Data
df = (k-1)(n-1) ket : O = nilai observasi E = nilai ekspektasi (harapan) k = jumlah kolom b = jumlah baris Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan dalam bentuk tabel silang:
Variabel 2
Variabel 1
Jumlah
Tinggi
Rendah
Ya
a
b
a+b
Tidak
c
d
c+d
Jumlah
a+c
b+d
n
a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan) masing-masing sel dicari dengan rumus: Total barisnya X total kolomnya E= Jumlah keseluruhan data misalkan untuk mencari nilai ekspektasi (E) untuk sel a adalah: Ea = (a+b) x (a+c) n Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama. Khususnya untuk tabel 2x2, dapat mencari nilai X2 dengan menggunakan rumus: N (ad-bc)2 X2 = (a+c)(b+d)(a+b)(c+d) 118
SUTANTO PRIYO HASTONO: Analisis Data
Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang besar. Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya digunakan uji kai kuadrat yang sudah dikoreksi (Yate Corrected atau Yate’s
Correction). Formula kai kuadrat Yate’s Correction adalah sbb: (|O – E| - 0,5)2 2
X = E atau N {|ad-bc|2 – (N/2)]2 X2 = (a+c)(b+d)(a+b)(c+d)
3. Keterbatasan Kai Kuadrat Seperti
kita
ketahui,
uji
kai
kuadrat
menuntut
frekuensi
harapan/ekspektasi (E) dalam masing-masing sel tidak boleh terlampau kecil. Jika frekuensi sangat kecil, penggunaan uji ini mungkin kurang tepat. Oleh karena itu dalam penggunaan kai kuadrat harus memperhatikan keterbatasanketerbatasan uji ini. Adapun keterbatasan uji kai kuadrat adalah sbb: a. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 1. b. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 5, lebih dari 20% dari jumlah sel. Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat, peneliti harus menggabungkan katagori-katagori yang berdekatan dalam rangka memperbesar frekuensi harapan dari sel-sel tersebut (penggabungan ini dapat dilakukan untuk analisis tabel silang lebih dari 2 x 2, misalnya 3 x 2, 3 x 4 dsb). Penggabungan ini tentunya diharapkan tidak sampai membuat datanya kehilangan makna.
119
SUTANTO PRIYO HASTONO: Analisis Data Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti tidak bisa menggabung katagori-katagorinya lagi), maka dianjurkan menggunakan uji Fisher’s Exact.
ODDS RATIO (OR) dan RISIKO RELATIF (RR) Hasil uji Chi Square hanya dapat menyimpulkan ada tidaknya perbedaan proporsi antar kelompok atau dengan kata lain kita hanya dapat menyimpulkan ada/tidaknya hubungan du variabel katagorik. Dengan demikian uji Chi Square tidak dapat menjelaskan derajat hubungan, dalam hal ini uji Chi Square tidak dapat mengetahui kelompok mana yang memiliki risiko lebioh besar dibanding kelompok lain. Dalam bidang kesehatan untuk mengetahui derajat hubungan, dikenal ukuran Risiko Relatif (RR) dan Odds Rasio (OR). Risiko relatif membandingkan risiko pada kelompok ter-ekspose dengan kelompok tidak terekspose. Sedangkan Odds Rasio membandingkan Odds pada kelompok ter-ekspose dengan Odds kelompok tidak ter-eksp[ose. Ukuuran RR pada umumnya digunakan pada disain Kohort, sedangkan ukuran OR biasanya digunakan pada desain kasus kontrol atau ptong lintang (Cross Sectional).
Pengkodean Variabel : Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hatihati jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada konsistensi antara variabel independen dengan variabel dependen. Untuk variabel independen, kelompok yang berisiko/expose diberi kode tinggi (kode 1) dan kode rendah (kode 0)untuk kelompok yang tidak berisiko/non expose. Pada variabel dependennya, kode tinggi (kode 1) untuk kelompok kasus atau kelompok yang menjadi fokus pembahasan penelitian dan kode rendah (kode 0) untuk kelompok non kasus atau yang bukan menjadi fokus penelitian. Sebagai contoh data di atas pengkodeannya adalah sbb: Ibu tidak bekerja diberi kode 1 120
SUTANTO PRIYO HASTONO: Analisis Data dan bekerja kode 0 dan ibu yang menyusui secara eksklusif diberi kode 1 dan non eksklusif diberi kode 0. Sebetulnya bisa juga kodenya dibalik, tapi harus konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0, tdk eksklusive =1. Tabel … Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pengetahuan Pendidikan
Rendah
Total
Tinggi
N
%
n
%
n
%
SD
25
50,0
25
50,0
50
34,4
SMP
16
40,0
24
60,0
40
27,6
SMU
10
33,3
20
66,7
30
20,7
PT
5
20,0
20
80,0
25
17,3
Jumlah
56
38,7
89
61,3
145
100,0
Pembuatan persentase pada analisis tabel silang harus diperhatikan agar tidak salah dalam menginterpretasi. Pada jenis penelitian survei/Cross sectional atau Kohort, pembuatan persentasenya berdasarkan nilai variabel independen. Contoh di atas jenis penelitiannya Cross Sectional, variabel pendidikan sebagai variabel independen dan pengetahuan sebagai variabel dependen. Dapat dilihat di tabel persentasenya berdasarkan masing-masing kelompok tingkat pendidikan (persentase baris). Contoh di atas dapat di interpretasikan sbb: Dari 50 pasien yang berpendidikan SD, ada sebanyak 25 (50,0%) pasien mempunyai pengetahuan tinggi. Dari 40 pasien yang berpendidikan SMP, ada sebanyak 24
(60,0%) yang berpengetahuan tinggi. Dari 30 pasien yang
berpendidikan SMU ada sebanyak 20 (66,7%) yang berpengetahuan tinggi. Dan dari 25 pasien yang berpendidikan PT, ada sebanyak 20 (80,0%) yang 121
SUTANTO PRIYO HASTONO: Analisis Data berpengetahuan tinggi. Dari data ini terlihat ada kecenderungan bahwa semakin tinggi tingkat pendidikan akan semakin tinggi tingkat pengetahuannya. Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan persentasenya berdasarkan variabel dependennya, misalkan terlihat pada tabel berikut: Tabel … Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin Kanker Paru
Jenis Kelamin
Kasus
Total
Kontrol
n
%
N
%
n
%
Laki-laki
75
75,0
30
30,0
105
52,5
Perempuan
25
25,0
70
70,0
95
47,5
Jumlah
100
50,0
100
50,0
200
100,0
Interpretasinya: Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden berjenis kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita kanker paru, ada sebanyak (30%) responden yang berjenis kelamin laki-laki.
122
SUTANTO PRIYO HASTONO: Analisis Data
KASUS : UJI KAI KUADRAT Suatu penelitian ingin mengetahui hubngan pekerjaan dengan perilaku menyusui. Variabel pekerjaan berisi dua nilai yaitu tidak bekerja dan bekerja, dan variabel menyusui berisi dua nilai yaitu eksklusif dan non eksklusif. Untuk mengerjakan soal ini gunakan data “Susu. SAV”. Adapun prosedur di SPSS sbb: 1. Pastikan anda berada pada data editor ASI.SAV 2. Dari menu SPSS, klik “Analyze”, kemudian pilih “Descriptive statistic”, lalu pilih “Crosstab”, sesaat akan muncul menu Crosstabs 3. Dari menu crosstab, ada dua kotak yang harus diisi, pada kotak “Row(s)’ diisi variabel independen (variabel bebas), dalam contoh ini variabel pekerjaan masuk ke kotak “Row(s)”. 4. pada kotak “Column(s)” diisi variabel dependennya, dalam contoh ini variabel perilaku menyusui masuk ke kotak “Column(s)”.
123
SUTANTO PRIYO HASTONO: Analisis Data 5. Klik option “Statistics..”, klik pilihan “Chi Square” dan klik pilihan “Risk”
6. Klik “Continue” 7. Klik option “Cells”, bawa bagian “Percentages” dan klik “Row”
8. Klik “Continue” 9. Klik “OK” hasilnya tampak sbb:
124
SUTANTO PRIYO HASTONO: Analisis Data
Crosstabs status pekerjaan ibu * status menyusui asi Crosstabulation
status pekerjaan ibu
KERJA
Count % within status pekerjaan ibu Count % within status pekerjaan ibu Count % within status pekerjaan ibu
tidak kerja
Total
status menyusui asi tdk EKSKLUSIVE EKSKLUSIVE 17 8
Total 25
68.0%
32.0%
100.0%
7
18
25
28.0%
72.0%
100.0%
24
26
50
48.0%
52.0%
100.0%
Chi-Square Tests
Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
Value 8.013b 6.490 8.244
7.853
df 1 1 1
Asymp. Sig. (2-sided) .005 .011 .004
1
Exact Sig. (2-sided)
Exact Sig. (1-sided)
.010
.005
.005
50
a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 12. 00. Risk Estimate
Value Odds Ratio for status pekerjaan ibu (TIDAK KERJA / KERJA) For cohort status menyusui asi = YA EKSKLUSIVE For cohort status menyusui asi = TIDAK EKSKLUS N of Valid Cases
95% Confidence Interval Lower Upper
5.464
1.627
18.357
2.250
1.209
4.189
.412
.208
.816
50
125
SUTANTO PRIYO HASTONO: Analisis Data Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola menyusui, dengan angka di masing-masing selnya. Angka yang paling atas adalah jumlah kasus masing-masing sel, angka kedua adalah persentase menurut baris (data yang kita analisis “ASI.SAV, berasal dari penelitian Cross
Sectional sehingga persen yang ditampilkan adalah persentase baris, namun bila junis penelitiannya Case Control angka persentase yang digunakan adalah persentase kolom) Dari analisis data di atas maka interpretasinya: Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara eksklusif. Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui secara eksklusif. Hasil uji Chi Square dapat dilihat pada kotak “Chi Square Test”. Dari print out muncul dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan, “Angka yang mana yang kita pakai?”, apakah Pearson, Continuity Correction,
Likelihood atau Fisher?” Aturan yang berlaku pada Chi Square adalah sbb: a. Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka yang digunakan adalah “Fisher’s Exact Test” b. Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai sebaiknya “Continuity Correction (a)” c. Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka digunakan uji “Pearson Chi Square” d. Uji “Likelihood Ratio” dan “Linear-by-Linear Assciation”, biasanya digunakan untuk keperluan lebih spesifik, misalnya analisis stratifikasi pada bidang epidemiologi dan juga untuk mengetahui hubungan linier dua variabel katagorik, sehingga kedua jenis ini jarang digunakan. Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b dibawah kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti pada tabel silang diatas tidak ditemukan ada nilai E < 5 126
SUTANTO PRIYO HASTONO: Analisis Data
Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan koreksi (Continuity Correction)
dengan p value dapat dilihat pada kolom
“Asymp. Sig” dan terlihat p valuenya = 0,011. berarti kesimpulannya ada perbedaan perilaku menyusui eksklusif antara ibu yang bekerja dengan ibu yang tidak bekerja. Dengan kata lain dapat disimpulkan bahwa ada hubungan status pekerjaan dengan perilaku menyusui eksklusif. Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya hubungan dua variabel, sehingga uji ini tidak dapat untuk mengetahui derajat/kekuatan hubungan dua variabel. Untuk mengetahui besar/kekuatan hubungan banyak metodenya tergantung latar belakangdisiplin keilmuannya, misal untuk ilmu sosial dengan melihat koefisien Phi, koefisien Contingency dan cramer’s V. sedangkan untuk bidang kesehatan terutama kesehatan masyarakat digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis penelitian Cross Sectional dan Case Control, sedangkan nilai RR digunakan bila jenis penelitiannya Kohort. Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464 (95% CI: 1,627 – 18,357). Sedangkan nilai RR terlihat dari baris For Cohort yaitu bearnya 2,250 (95% CI: 1,209 – 4,189). Pada data ini berasal dari penelitian Cross Sectional maka kita dapat menginterpretasikan nialai OR=5,464 sbb: Ibu yang tidak bekerja mempunyai peluang 5,46 kali untuk menyusui eksklusif dibandingkan ibu yang bekerja.. Pada perintah Crosstab nilai OR akan keluar bila tabel silang 2 x 2, bila tabel silang lebih dari 2 x 2, misalnya 3 x 2, 4 x 2 dsb, maka nilai OR dapat diperoleh dengan analisis regresi logistik sederhana dengan cara membuat “Dummy variable”
127
SUTANTO PRIYO HASTONO: Analisis Data
Penyajian dan Interpretasi di Laporan Penelitian: Tabel … Distribusi Responden Menurut Jenis Pekerjaan dan Perilaku menyusui Menyusui
Jenis Pekerjaan
Tdk Eksklusif
Total
Eksklusif
OR
P
(95% CI)
value 0,011
n
%
n
%
n
%
bekerja
17
68,0
8
32,0
25
100
5,464
Tdk Bekerja
7
28,0
18
72,0
25
100
1,6 – 18,3
Jumlah
26
52,0
24
48,0
50
100
Hasil analisis hubungan antara status pekerjaan dengan perilaku menyusui eksklusif diperoleh bahwa ada sebanyak 8 (32%) ibu yang bekerja menyusui bayi secara eksklusif. Sedangkan diantara ibu yang tidak bekerja, ada 18 (72,0%) yang menyusui secara eksklusif. Hasil uji statistik diperoleh nilai p=0,011 maka dapat disimpulkan ada perbedaan proporsi kejadian menyusui eksklusif antara ibu tidak bekerja dengan ibu yang bekerja (ada hubungan yang signifikan antara pekerjaan dengan perilaku menyusui). Dari hasil analisis diperoleh pula nilai OR=5,464, artinya ibu tidak bekerja mempunyai peluang 5,46 kali untuk menyusui eksklusif dibanding ibu yang bekerja.
128
SUTANTO PRIYO HASTONO: Analisis Data
10
ANALISIS HUBUNGAN NUMERIK DENGAN NUMERIK
UJI KORELASI DAN REGRESI LINIER SEDERHANA Seringkali dalam suatu penelitian kita ingin mengetahui hubungan antara dua variabel yang berjenis numerik, misalnya huubungan berat badan dengan tekanan darah, hubungan umur dengan kadar Hb, dsb. Hubungan antara dua variabel numerik dapat dihasilkan dua jenis, yaitu derajat/keeratan hubungan, digunakan korelasi. Sedangkan bila ingin mengetahui bentuk hubungan antara dua variabel digunakan analisis regresi linier. 1. Korelasi Korelasi di samping dapat untuk mengetahui derajat/keeratan hubungan, korelasi dapat juga untuk mengetahui arah hubungan dua variabel numerik. Misalnya, apakah huubungan berat badan dan tekanan darah mempunyai derajat yang kuat atau lemah, dan juga apakah kedua variabel tersebut berpola positif atau negatif. Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik yang menunjukkan titik-titik perpotongan nilai data dari dua variabel (X dan Y). Pada umumnya dalam grafik, variabel independen (X) diletakkan pada garis horizontal sedangkan variabel dependen (Y) pada garis vertikal. Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara dua variabel X dan Y. selain memberi informasi pola hubungan dari kedua
129
SUTANTO PRIYO HASTONO: Analisis Data variabel diagram tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel tersebut.
Derajat keeratan hubungan (kuat lemahnya hubungan) dapat dilihat dari tebaran datanya, semakin rapat tebarannya semakin kuat hubungannya dan sebaliknya semakin melebar tebarannya menunjukkan hubungannya semakin lemah. Untuk mengetahui lebih tepat besar/ derajat hubungan dua variabel Linier Positif Linier Negatif Tak ada hubungan digunakan Koefisien Korelasi Pearson Product Moment. Koefisien korelasi disimbbolkan dengan r (huruf r kecil). Koefisien korelasi (r) dapat diperoleh dari formula berikut: N (Σ XY) – (ΣX ΣY) r= [NΣX2 – (ΣX)2] [NΣY – (ΣY)2
Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya antara –1 s.d. +1. r = 0 Æ tidak ada hubungan linier r = -1 Æ hubungan linier negatif sempurna r = +1 Æ hubungan linier positif sempurna Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan positif terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya semakin bertambah berat badannya (semakin gemuk) semakin tinggi tekanan darahnya. Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel diikuti penurunan variabel yang lain, misalnya semakin bertambah umur (semakin tua) semakin rendah kadar Hb-nya.
130
SUTANTO PRIYO HASTONO: Analisis Data Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat dibagi dalam 4 area, yaitu: r = 0,00 – 0,25 Æ tidak ada hubungan/hubungan lemah r = 0,00 – 0,25 Æ hubungan sedang r = 0,00 – 0,25 Æ hubungan kuat r = 0,00 – 0,25 Æ hubungan sangat kuat / sempurna Uji Hipotesis Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk menjelaskan derajat hubungan derajat hubungan linier anatara dua variabel. Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah hubungan antara dua variabelteradi secara signifikan atau hanya karena faktor kebetulan dari random sample (by chance). Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama: membandingkan nilai r hitung dengan r tabel, kedua: menggunakan pengujian dengan pendekatan distribusi t. Pada modul ini kita gunakan pendekatan distribusi t, dengan formula: n–2 t=r 1 – r2 df = n – 2 n = jumlah sampel 2. Regresi Linier Sederhana Seperti sudah diuraikan di depan bahwa analisis hubungzn dua variabel dapat digunakan untuk mengetahui bentuk hubungan dua variabel, yaitu dengan analisis regresi. Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk mengetahui bentuk hubungan antar dua atau lebih variabel. Tujuan
131
SUTANTO PRIYO HASTONO: Analisis Data analisis regresi adalah untuk membuat perkiraan (prediksi) nilai suatu variabel (variabel dependen) melalui variabel yang lain (variabel independen). Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat badan dan tekanan darah. Dalam kasus ini berarti berat badan sebagai variabel independen dan tekanan darah sebagai variabel dependen, sehingga dengan regresi kita dapat memperkirakan besarnya nilai tekanan darah bila diketahui data berat badan. Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh dengan berbagai cara/metode. Salah satu cara yang sering digunakan oleh peneliti adalah dengan menggunakan metode kuadrat terkecil (least
square). Metode least square merupakan suatu metode pembuatan garis regresi dengan cara meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan Y yang diramalkan oleh garis regresi itu. Secara matematis persamaan garis sbb: Y = a + bx Persamaan di atas merupakan model deterministik yang secara sempurna/tepat dapat digunakan hanya untuk peristiwa alam, misalnya hukum gravitasi bumi, yang ditemukan oleh Issac Newton adalah contoh model deterministik. Variabel kecepatan benda jatuh (variabel dependen) pada keadaan yang ideal adalah fungsi matematik sempurna (bebas dari kesalahan) dari variabel independen berat beda dan gaya gravitasi. Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius dapat dibuat persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat dihitung/diprediksi secara sempurna/tepat (bebas kesalahan) bila suhu Celcius (X) diketahui. Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada kemungkinan kesalahan/penyimpangan (tidak eksak), aretinya untuk beberapa nilai X yang sama kemungkinan diperoleh nilai Y yang berbeda. Misalnya hubungan berat badan dengan tekanan darah, tidak setiap orang yang berat badannya sama memiliki tekanan darah yang sama. Oleh karena hubungan X 132 Y = a + bx + e
SUTANTO PRIYO HASTONO: Analisis Data dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka persamaan garis yang dibentuk menjadi: Y = Variabel Dependen X = Variabel Independen a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0 b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X berubah satu unit pengukuran e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati dengan nilai Y yang sesungguhnya pada titik X tertentu ΣXY – (ΣXΣY)/n a = Y - bX
b= ΣX2 – (ΣX)2/n
Kesalahan Standar Estimasi (Standard Error of Estimate/Se) Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan
estimasi
untuk
menjelaskan
nilai
variabel
dependen
yang
sesungguhnya. Semakin kecil nilai Se, makin tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan niali variabel dependen yang sesungguhnya. Dansebaliknya, semakin besar nilai Se, makin rendah ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel dependen yang sesungguhnya. Untuk mengetahhui besarnya Se dapat dihitung melalui formula sbb: 133
SUTANTO PRIYO HASTONO: Analisis Data
Se =
ΣY2 - aΣY - bΣXY n-2
Koefisien Determinasi (R2) Ukuran yang penting dan sering digunakan dalam analisisregresi adalah koefisien determinasi atau disimbolkan R2 (R Square). Koefisien determinasi dapat dihitung dengan mengkuadratkan nilai r, atau dengan formula R2=r2. Koeifisien determinasi berguna untuk mengetahui seberapa besar variasi variabel dependen (Y) dapat dijelaskan oleh variabel independen (X). atau dengan kata lain R2 menunjukkan seberapa jauh variabel independen dapat memprediksi variabel dependen.Semakin besar nilai R square semakin baik/semakin tepat variabel independen memprediksi variabel dependen. Besarnya nialai R square antara 0 s.d. 1 atau antara 0% s.d. 100%.
134
SUTANTO PRIYO HASTONO: Analisis Data
KASUS : KORELASI DAN REGRESI Sebagai contoh kita akan melakukan analisis korelasi dan regresi menggunakan data ‘ASI.SAV’ dengan mengambil variabel yang bersifat numerik yaitu umur dengan kadar Hb (diambil Hb pengukuran pertama: Hb1). A. Korelasi Untuk mengeluarkan uji korelasi langkahnya adalah sbb: 1. Aktifkan data ‘ASI.SAV’ 2. Dari menu utama SPSS, klik ‘Analyze’, kemudian pilih ‘Correlate’, dan lalu pilih ‘Bivariate’, dan muncullah menu Bivariate Correlations: 3. Sorot
variabel ‘Umur dan Hb1, lalu masukkan ke kotak sebelah kanan
‘variables’.
4. Klik ‘OK” dan terlihat hasilnya sbb:
135
SUTANTO PRIYO HASTONO: Analisis Data
Correlations Correlations
berat badan ibu
berat badan bayi
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
berat badan ibu 1
berat badan bayi .684** .000 50 50 .684** 1 .000 50 50
**. Correlation is significant at the 0.01 level (2-tailed).
Tampilan analisis korelasi berupa matrik antar variabel yang di korelasi, informasi yang muncul terdapat tiga baris, baris pertama berisi nilai korelasi (r), baris kedua menapilkan nilai p (P value), dan baris
ketiga menampilkan N
(jumlah data). Pada hasil di atas diperoleh nilai r = 0,684 dan nilai p = 0,0005. Kesimpulan dari hasil tersebut: hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan yang kuat dan berpola positif artinya semakin bertambah berat badannya semakin tinggi berat bayinya. Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan ibu dengan berat badan bayi (p = 0,0005). B. Regresi Linier Sederhana Berikut akan dilakukan analisis regresi linier dengan menggunakan variabel ‘berat badan ibu’ dan ‘berat badan bayi’ dari data ASI.SAV. dalam analisis regresi kita harus menentukan variabel dependen dan variabel independennya. Dalam kasus ini berarti berat badan ibu sebagai variabel independen dan berat badan bayi sebagai variabel dependen. Adapun caranya: 1. Pastikan tampilan berada pada data editor ASI.SAV, jika belum aktifkan data tersebut. 2. Dari menu SPSS, Klik ‘Analysis’, pilih ‘Regression’, pilih ‘Linear’ 3. Pada tampilan di atas ada beberpa kotak yang harus diisi. Pada kotak ‘Dependen’ isikan variabel yang kita perlakukan sebagai dependen (dalam 136
SUTANTO PRIYO HASTONO: Analisis Data contoh ini berarti berat badan bayi) dan pada kotak Independent isikan variabel independennnya (dalam contoh ini berarti berat badan ibu), caranya 4. klik ‘berat badan bayi’, masukkan ke kotak Dependent 5. Klik ‘berat badan ibu’, masukkan ke kotak Independent
6.
Klik ‘OK’, dan hasilnya sbb:
Regression Model Summary Model 1
R R Square .684a .468
Adjusted R Square .456
Std. Error of the Estimate 430.715
a. Predictors: (Constant), berat badan ibu
137
SUTANTO PRIYO HASTONO: Analisis Data
ANOVAb Model 1
Regression Residual Total
Sum of Squares 7820262 8904738 16725000
df 1 48 49
Mean Square 7820261.965 185515.376
F 42.154
Sig. .000a
a. Predictors: (Constant), berat badan ibu b. Dependent Variable: berat badan bayi Coefficientsa
Model 1
(Constant) berat badan ibu
Unstandardized Coefficients B Std. Error 657.929 391.676 44.383 6.836
Standardized Coefficients Beta .684
t 1.680 6.493
Sig. .099 .000
a. Dependent Variable: berat badan bayi
Dari hasil di atas dapat diinterpretasikan dengan mengkaji nilai-nilai yang penting dalam regresi linier diantaranya: koefisien determinasi, persamaan garis dan p value. Nilai koefisien determinasi dapat dilihat dari nilai R Square (anda dapat lihat pada tabel ‘Model Summary’) yaitu besarnya 0,468 artinya, persamaan garis regresi yang kita peroleh dapat menerangkan 46,8% variasi berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk menjelaskan variabel berat badan bayi. Selanjutnya pada tabel ANOVAb , diperoleh nilai p (di kolom Sig) sebesar 0,0005, berarti pada alpha 5% kita dapat menyimpulkan bahwa regresi sederhana cocok (fit) dengan data yang ada persamaan garis regresi dapat dilihat pada tabel ‘Coefficienta’ yaitu pada kolom B. Dari hasil diatas didapat nilai konstant (nilai ini merupakan nilai intercept atau nilai a) sebesar 657,93 dan nilai b = 44,38, sehingga persamaan regresinya:
Y = a + bX Berat badan bayi = 657,93 + 44,38(berat badan ibu) Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu nilai berat badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada kolom Sig T, dan menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak 138
SUTANTO PRIYO HASTONO: Analisis Data hipotesis nol, berarti ada hubngan linier antara berat badan ibu dengan berat badan bayi. Dari nilai b=44,38 berarti bahwa variabel berat badan bayi akan bertambah sebesar 44,38 gr bila berat badan ibu bertambah setiap satu kilogram.
Penyajian dan Interpretasi Tabel … Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi Variabel
R
R2
Persamaan garis
P value
Umur
0,684
0,468
bbayi =657,93 + 44,38*bbibu
0,0005
Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan kuat (r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu semakin besar berat badan bayinya. Nilai koefisien dengan determinasi 0,468 artinya , persamaan garis regresi yang kita peroleh dapat menerangkan 46,8,6% variasi berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk menjelaskan variabel berat badan bayi. Hasil uji statistik didapatkan ada hubungan yang signifikan antara berat badan ibu dengan berat badan bayi (p=0,005).
Memprediksi variabel Dependen Dari persamaan garis yang didapat tersebut kita dapat memprediksi variabel dependen (berat badan bayi) dengan variabel independen (berat badan ibu). Misalkan kita ingin mengetahui berat badan bayi jika diketahui berat badan ibu sebesar 60 kg, maka: Berat badan bayi =657,93 + 44,38(berat badan ibu) Berat badan bayi= 657,93 + 44,38(60) 139
SUTANTO PRIYO HASTONO: Analisis Data Berat badan bayi = 3320,73 Ingat prediksi regresi tidak dapat menghasil;kan angka yang tepat seperti di atas, namun perkiraannya tergantung dari nilai ‘Std, Error of The estimate’(SEE) yang besarnya adalah 430,715 (lihat di kotak Model Summary). Dengan demikianvariasi variabel dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan tingkat kepercyaan 95% dan didapat nilai Z = 1,96, sehingga variasinya 1,96 * 430,715 = ± 844,201 Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg diprediksikan berat badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr C. Membuat Grafik Prediksi Langkahnya: 1. Klik ‘Graphs, pilih ‘Scatter’ 2. Klik Sampel klik ‘Define’ 3. Pada kotak Y Axis isikan variabel dependennya (masukkan veriabel dependennya (masukkan Hb1) 4. Pada kotak X Axis isikan variabel independennya (masukkan veriabel dependennya (masukkan Umur) 5. Klik ‘OK’ 6. Terlihat di layar grafik scatter plot-nya (garis regresi belum ada?) 7. Untuk mengeluarkan garisnya, klik grafiknya 2 kali 8. klik’Chart’ 9. pada kotak ‘Fit Line, Klik Total 10. klik ‘OK’ maka muncul garis regresi
140
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS MULTIVARIAT
11
Proses analisis multivariat dengan menghubungkan beberapa variabel independen dengan satu variabel dependen pada waktu yang bersamaan. Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden. Dari analisis multivariat kita dapat mengetahui: a. Variabel independen mana yang paling besar pengaruhnya terhadap variabel dependen? b. Apakah variabel independen berhubungan dengan variabel dependen dipengaruhi variabel lain atau tidak? c. Bentuk hubungan beberapa variabel independen dengan variabel dependen, apakah berhubungan langsung atau pengeruh tidak langsung. Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis statistik yang dapat digunakan untuk analisis multivariat: Variabel Independen
Variabel Dependen
Jenis Uji
Numerik
Numerik
Uji Regresi Linier
Katagori
Numerik
ANOVA
Katagori
Katagori
Uji Regresi Logistik
Kontinyu
Katagori
Uji Diskriminan
Numerik/Katgori
Numerik waktu
Uji Regresi Cox
(minimal 1 variabel numerik)
(dapat dengan numerik)
141
SUTANTO PRIYO HASTONO: Analisis Data Dalam melakukan analisis multivariat kita harus mengetahui terlebih dahulu mengenai konsep konfounding dan Interaksi.
a.Konfounding Konfounding
merupakan
kondisi
bias
dalam
mengestimasi
efek
pajanan/expose terhadap kejadian penyakit/masalah kesehatan, akibat dari perbandingan yang tidak seimbang antara kelompok expose dengan kelompok non expose. Masalah ini terjadi dikarenakan pada dasarnya sudah ada perbedaan risiko terjadinya penyakit pada kelompok expose dengan kelompok non expose. Artinya risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun expose dihilangkan pada kedua kelompok tersebut. Satu variabel disebut konfounding bila variabel tersebut merupakan faktor risiko terjadinya penyakit dan memiliki hubungan dengan expose. Seorang ahli statistik menyatkan bahwa suatu variabel dikatakan konfounding jika variabel tersebut merupakan faktor risiko untuk terjadinya penyakit(outcome) dan berhubungan dengan variabel independen tapi tidak merupakan hasil dari variabel independen.
b.Interaksi Interaksi atau efek modifikasi adalah heterogenitas efek dari satu expose Pada tingkat expose yang lain. Jadi efek satu expose pada kejadian penyakit berbeda pada kelompok expose lainnya. Tidak adanya modifikasi efek, berarti efek expose homogen. Modisikasi efek merupakan konsep yang penting dalam analisis karena pada saat analisis kita harus menentukan apakah akan melaporkan efek bersama (yang terkontrol konfounder) atau efek yang terpisah untuk masing-masing strata. Pada analisis multivariat, jika ditemukan adanya interaksi antar variabel expose dengan variabel lainnya, maka nilai koefisien, misalnya OR, harus dilaporkan secarfa terpisah menurut strata dari variabel tersebut. Nilai OR yang tertera pada variabel menjadi tidak berlaku dan nilai OR untuk masing-masing strata harus dihitung 142
SUTANTO PRIYO HASTONO: Analisis Data
12
ANALISIS REGRESI LINIER GANDA Analisis Multiple regression Linear atau sering disebut juga analisis regresi
linier ganda merupakan perluasan analiss Simple Linear Regression (regresi linier sederhana). Dalam analisis Simple Linear Regression hanya ada satu variabel independen (variabel bebas) dihubungkan dengan satu variabel dependen (terikat).. Sedangkan pada Multiple regression Linear merupakan analisis hubugan antara beberapa variabel independen dengan satu variabel dependen. Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan tekanan darah, dilakukan analisis dengan melibatkan variabel independen: umur, berat badan, dan jenis kelamin. Dalam regresi linier ganda variabel dependennya harus numerik sedangkan variabel independen boleh semuanya numerik dan boleh juga campuran numerik dan katagorik. Model persamaan regresi linier ganda merupakan perluasan regresi linier sederhana, yaitu: Y = a + b1X1 + b2X2 + …. + bkXk + e 1. Asumsi Regresi Linier Seperti pada umumnya pengujian statistik, dari analisis regresi linier ganda diharapkan dapat memberikan informasi yang lebih banyak bukan sekedar diskripsi data teramati. Kita tentu ingin menarik inferensi (menggeneralisasi) tentang hubungan variabel-variabel dalam populasi asal dari sampel diambil. Bagaimanakanh hubungan antara umur, berat badan dan jenis kelamin ‘pada semua orang (populasi)’, tidak hanya seperti yang teramati di sejumlah orang pada sampel?. Oleh karena itu agar inferensi kita valid maka dalam analisis regresi dianjurkan untuk mengikuti kaidah-kaidah yang dipersyaratkan dalam analisis regresi. Dengan kata lain, setiap melakukan analisis Multiple regression 143
SUTANTO PRIYO HASTONO: Analisis Data
Linear harus memenuhi asumsi/persyaratan yang ditetapkan. Adapun asumsi yang digunakan dalam Multiple regression Lineari sebagai berikut a. Asumsi Eksistensi (Variabel Random) Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen) adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini, sampel yang diambil harus dilakukan secara random. Cara mengetahui asumsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari model, bila residual menunjukkan adanya mean dan sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. b. Asumsi Independensi Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi, sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi c. Asumsi Linieritas Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value
SUTANTO PRIYO HASTONO: Analisis Data e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas. 2. Kegunaan Analisis Regresi Ganda Tujuan analisis regresi linier ganda adalah untuk menemukan model regresi yang paling sesuai menggambarkan faktor-faktor yang berhubungan dengan variabel dependen. Pada prinsipnya, model regresi ganda dapat berguna untuk dua hal: a. Prediksi, memperkirakan variabel dependen dengan menggunakan informasi yang ada pada sebuah atau beberapa variabel independen. Disini dapat diketahui secara probabilitas nilai variabel dependen bila seseorang/individu mempunyai
suatu set variabel dengan independen tertentu. Misalnya kita
melakukan analisis variabel independen umur, BB dan jenis kelamin dihubungkan dengan variabel dependen tekanan darah. Dari hasil regresi, seseorang iindividu dapat diperkirakantekanan darahnya pada umur, berat badan dan jenis kelamin tertentu. b. Estimasi,
menguantifikasihubungan
sebuah
atau
beberapa
variabel
independen dengan sebuah variabel dependen. Pada fungsi ini regresi dapat digunakan untuk mengetahui variabel indepeden apa saja yang berhubungan dengan variabel dependen. Selain itu kita juga dapat mengetahui seberapa besar hubungan masing-masing independen terhadap variabel independen lainnya. Dari analisis ini dapat diketahui
variabel mana yang paling
besar/dominan mempengaruhi variabel dependen, yang ditunjukkan dari koefisien regresi (b) yang sudah distandardisasi yaitu nilai beta.
145
SUTANTO PRIYO HASTONO: Analisis Data 3. Pemodelan Satu hal yang penting dalam regresi ganda adalah bagaimana memilih variabel independen sehingga terbentuk sebuah model yang paling sesuai menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam (populasi). Dalam pembuatan model seringkali dijumpai pandangan yang kurang tepat yaitu “memasukkan semua/sebanyak mungkin variabel independen ke dalam model”. Alasannya, dengan memasukkan sebanyak mungkin variabel independen ke dalam model, maka variabel dependen diharapkan diprediksi dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping itu, model dengan banyak variabel seringkali malah menyulitkan dalam interpretasi. Berdasarkanpertimbangan
tersebut
pemilihan
variabel
independen
hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen. Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk dalam model, salah satu kriteria yang sering digunakan adalah melihat perubahan R2 (R Square). Namun penggunaan kriteria ini perlu hati-hati, karena setiap penambahan satu variabel independen akan meningkatkan R2 walaupun variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan adalah model dengan nilai R2 yang besar namun variabel independennya dengan jumlah sedikit. Berikut langkah-langkah dalam pemodelan regresi linier ganda: 1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat model. Masing-masing variabel independen dihubungkan dengan variabel 146
SUTANTO PRIYO HASTONO: Analisis Data dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka variabel tersebut masuk dalam model multivariat. Untuk variabel yang p value-nya rel="nofollow"> 0,25 namun secara substansi penting, maka variabel tersebut dapat masuk ke multivariat. 2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk dalam model. Ada beberapa metode untuk melakukan pemilihan variabel independen dalam analisis multivariat regresi linier ganda, yaitu: a). ENTER, memasukkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode
ini
yang tepat/sering digunakan, karena dalam pemodelan kita dapat melakukan pertimbangan aspek substansi. b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke dalam model, sampai semua variabel yang memenuhi kriteria tersebut masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel yang mempunyai korelasi parsial terbesar dengan variabel dependen dan yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi parsial adalah adalah korelasi antara variabel independen dengan dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005 artinya variabel yang dapat masuk model bila variabel tersebut mempunyai nilai P lebih kecil atau sama dengan 0,05. c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi kemudian satu persatu
variabel independen dikeluarkan dari model
berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah 0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama dengan 0,10 dikeluarkan dari model. d). STEPWISE, model ini merupakan kombinasi antara metode backward dan Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa 147
SUTANTO PRIYO HASTONO: Analisis Data variabel
sama
sekali
di
dalam
model.
Lalu
satu
variabel
hasil
pengkorelasian variabel dimasukkan ke dalam model. Lalu satu persatu variabel hasil pengkorelasian dimasukkan ke dalam model
dan
dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama masuk sama dengan metode forward yakni variabel yang mempunyai korelasi parsial terbesar. Selanjutnya setelah masuk, variabel pertama ini diperiksa lagi apakah harus dikeluarkan dari model menurut kriteria pengeluaran seperti metode backward. e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemaknaan statistik tertentu.
3) Melakukan diagnostik regresi linier, a). Melakukan pengujian terhadap kelima asumsi. b). Melakukan pengujian adanya kolinearitas. Kolinearitas terjadi bila antar variabel independen terjadi saling hubungan yang kuat. Untuk mengetahui adanya kolinearitas dapat dilihat dai nilai koefisien korelasi ®, bila nilai r lebih tinggi dari 0,8 maka terjadi kolinearitas. Selain itu dapat diketahui dari nilai VIF atau tolerance, bila nilai VIF > 10, atau tolerance sekitar 1 (satu) maka model terjadi kolinearitas. 4). Melakukan analisis interaksi. Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah selanjutnya adalah memeriksa adanya interaksi antar variabel independen. Interaksi merupakan keadaan dimana hubungan antara satu variabel independen dengan dependen berbeda menurut tingkat variabel independen yang lain. 5). Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok. Untuk masing-masing sampel dibuat model dengan variabel yang sama,
148
SUTANTO PRIYO HASTONO: Analisis Data kemudian bandingkan antara model 1 dan model 2, bila hasilnya sama/hampir sama maka model regresi reliabel. Bila model reliabel maka seluruh sampel dapat digunakan untuk pembuatan model.
149
SUTANTO PRIYO HASTONO: Analisis Data
KASUS: REGRESI LINIER GANDA Sebagai
latihan
kita
melakukan
analisis
penelitian
“faktor-faktor
yang
berhubungan dengan berat badan bayi”. Gunakan/aktifkan file data LBW.SAV. Variabel independennya meliputi berat badan ibu dlm pounds (BWT), umur ibu(AGE), riwayat hipetensi(HT), riwayat merokok(SMOKE), frekuensi mengalami prematur (PTL) dan frekuensi melakukan ANC (FTV). Variabel dependennya berat badan bayi (BWT). Kode variabel pada file data : LBW.SAV Nama
Definisi Operasional
Id
Nomor Identitas
Low
Kondisi bayi dalam klasifikasi BBLR
Hasil Ukur 0 = ≥ 2500 g 1 = < 2500 g
Age
Umur ibu
tahun
Lwt
Berat ibu pada saat menstruasi terakhir
pounds
Race
Suku bangsa/ras
1= putih 2= hitam 3 = lainnya
Smoke
Kebiasaan merokok selama hamil
0 = tidak 1 = ya
Ptl
Riwayat mengalami prematur
0 = tidak 1 = ya
Ht
Riwayat menderita hipertensi
0 = tidak 1 = ya
Ui
Terjadi/mengalami iritability Uterine
0 = tidak 1 = ya
Ftv
Frekuensi periksa hamil pada trimester pertama
0 ,1, 2 dst..
Bwt
Berat badan bayi
gram
150
SUTANTO PRIYO HASTONO: Analisis Data Data selengkapnya ada di lampiran:
A. Langkah pertama pemodelan: SELEKSI BIVARIAT Seleksi bivariat masing-masing variabel independen dengan variabel dependen. Variabel yang dapat masuk model multivariat adalah variabel yang pada analisis bivariatnya mempunyai nilai p (p value) < 0,25. Namun ketentuan p value<0,25 ini tidaklah harus dipenuhi manakala dijumpai ada suatu variabel yang walaupun p value-nya > 0,25 karena secara substansi sangat penting berhubungan dengan variabel dependen, maka variabel tersebut dapat diikutkan dalam model multivariat. Uji yang digunakan pada analisis bivariat tergantung dari variabel yang digunakan, bila : variabel independennya numerik -> uji korelasi, bila independennya katagorik -> uji t atau uji anova. a. Bivariat uji korelasi : melakukan analisis bivariat untuk variabel independen berjenis numerik: variabel berat badan ibu, umur ibu, frekuensi prematur, frekuensi anc : Langkahnya : 1. Klik ‘Analysis’, sorot ke ‘Correlate’, sorot dan klik ‘Bivariate’ 2. Muncul dilayar menu ‘Bivariate Correlations’ 3. Pada kotak Variables, isikan semua variabel numerik baik untuk variabel independen (age,lwt,ptl,ftv) dan dependen (bwt)
151
SUTANTO PRIYO HASTONO: Analisis Data
4. Klik tombol ‘OK’ Muncul dilayar hasil sbb:
Correlations Correlations
Age of mother
Weight of mother (pounds) No physician visits in first trimester
History of premature labor Birth weight (gram)
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
Age of mother 1 189 .180* .013 189 .215** .003
Weight of mother (pounds) .180* .013 189 1 189 .141 .054
189
189
.072 .328 189 .090 .219 189
-.140 .055 189 .186* .010 189
No History of physician prematur visits in first e labor trimester .215** .072 .003 .328 189 189 .141 -.140 .054 .055 189 189 1 -.044 .544 189
189
-.044 .544 189 .058 .426 189
1 189 -.155* .034 189
*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
152
Birth weight (gram) .090 .219 189 .186* .010 189 .058 .426 189 -.155* .034 189 1 189
SUTANTO PRIYO HASTONO: Analisis Data Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur, berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat. Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena secara substansi frekuensi anc merupakan faktor yang sangat penting mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan dalam analisis multivariat.
b. Bivariat uji t: melakukan analisis bivariat untuk variabel independen berjenis katagorik: merokok dan riwayat hipertensi
1. Merokok Langkahnya: 1.Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu “Compare Means’, lalu pilih “Independen-Samples T Test” 2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’
dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel katagoriknya, ingat jangan sampai terbalik. 3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’ 4.Klik variabel ‘smoke’ dan masukkan ke kotak‘Grouping Variable’.
153
SUTANTO PRIYO HASTONO: Analisis Data
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa ‘0’ tidak merokok dan kode ‘1’ untuk Yang merokok. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
9. Klik “Continue” 10. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test Group Statistics
Birth weight (gram)
Smoking status No Yes
N 115 74
Mean 3054.96 2773.24
Std. Deviation 752.409 660.075
Std. Error Mean 70.163 76.732
154
SUTANTO PRIYO HASTONO: Analisis Data
Independent Samples Test Levene's Test for Equality of Variances
F Birth weight (gram)
Equal variances assumed Equal variances not assumed
1.508
Sig. .221
t-test for Equality of Means
t
df
Sig. (2-tail ed)
Mean Differen ce
Std. Error Differenc e
95% Confidence Interval of the Difference Lower Upper
2.634
187
.009
281.713
106.969
70.693
492.7
2.709
170.0
.007
281.713
103.974
76.467
487.0
Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value = 0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok dapat lanjut ke multivariat.
2. Riwayat Hipertensi Langkahnya: 1.Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu “Compare Means’, lalu pilih “Independen-Samples T Test” 2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’
dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel katagoriknya, ingat jangan sampai terbalik. 3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’ 4.Klik variabel ‘ht’ dan masukkan ke kotak‘Grouping Variable’. (variabel yang sebelumnya (variabel smoke) dikeluarkan dahulu baru ‘ht’ dimasukkan
155
SUTANTO PRIYO HASTONO: Analisis Data
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa ‘0’ tidak ada hipertensi dan kode ‘1’ ada hipertensi’. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
6.Klik “Continue” 7.Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb: Group Statistics
Birth weight (gram)
History of hypertension No Yes
N 177 12
Mean 2972.31 2536.75
Std. Deviation 709.226 917.341
Std. Error Mean 53.309 264.813
156
SUTANTO PRIYO HASTONO: Analisis Data
Independent Samples Test Levene's Test for Equality of Variances
F Birth weight (gram)
Equal variances assumed Equal variances not assumed
1.419
Sig. .235
t-test for Equality of Means
t
df
Sig. (2-taile d)
Mean Differe nce
Std. Error Differen ce
95% Confidence Interval of the Difference Lower Upper
2.019
187
.045
435.56
215.709
10.024
861.1
1.612
11.908
.133
435.56
270.126
-153.5
1025
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat Dengan demikian selesailah sudah seleksi semua variabel independen, dari 6 variabel independen semuaanya masuk ke proses berikutnya yaitu ke analisis multivariat.
B. Langkah Kedua : Pemodelan Multivariat Setelah tahap bivariat selesai, tahap berikutnya melakukan analisis multivariat secara bersama-sama. Variabel yang valid dalam model multivariat adalah variabel yang mempunyai p value < 0,05. Bila dalam model multivariat dijumpai variabel yang p value nya > 0,05, maka variabel tersebut harus dikeluarkan dalam model. Pengeluaran variabel dilakukan tidak serempak, melainkan bertahap satu per satu dikeluarkan dimulai dari p value yang terbesar. Adapun proses selengkapnya sbb: 1. Klik ‘Analyisis’, sorot ‘Regression’, sorot dan klik ‘Linier’ lalu muncul menu regresi linier,
a. Pada kotak ‘dependen isikan variabel dependen (dalam hal ini berarti bwt) dan kotak ‘independen’ isikan variabel independennya (dalam hal ini age, lwt, smoke, ht, ptl, ftv) 157
SUTANTO PRIYO HASTONO: Analisis Data
5. Pada kotak ‘Method’, pilih Enter’ 6. Abaikan lainnya 7. Klik ‘OK’, dan hasilnya
Regression Model Summary Model 1
R R Square .340a .116
Adjusted R Square .086
Std. Error of the Estimate 696.829
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds)
158
SUTANTO PRIYO HASTONO: Analisis Data
ANOVAb Model 1
Regression Residual Total
Sum of Squares 11543236 88373817 99917053
df 6 182 188
Mean Square 1923872.611 485570.423
F 3.962
Sig. .001a
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Coefficientsa
Model 1
(Constant) Age of mother Weight of mother (pounds) Smoking status History of premature labor History of hypertension No physician visits in first trimester
Unstandardized Coefficients B Std. Error 2315.862 299.442 7.162 10.022
Standardized Coefficients Beta .052
t 7.734 .715
Sig. .000 .476
4.793
1.777
.201
2.698
.008
-232.253 -154.002 -574.230
105.928 106.574 215.481
-.156 -.104 -.193
-2.193 -1.445 -2.665
.030 .150 .008
-2.847
49.705
-.004
-.057
.954
a. Dependent Variable: Birth weight (gram)
Dari kotak ‘Model Sumarry” didapatkan nilai R Square sebesar 0,116, artinya keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar 11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik (lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model. Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3 variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur (history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba keluarkan adalah frekuensi anc(No physician..). 159
SUTANTO PRIYO HASTONO: Analisis Data
Langkahnya: 1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’ 2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel, namun sekarang anda harus keluarkan variabel ‘no physician’ dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb: Model Summary Model 1
R R Square .340a .116
Adjusted R Square .091
Std. Error of the Estimate 694.929
a. Predictors: (Constant), History of hypertension, Smoking status, Age of mother, History of premature labor, Weight of mother (pounds) Coefficientsa
Model 1
(Constant) Age of mother Weight of mother (pounds) Smoking status History of premature labor History of hypertension
Unstandardized Coefficients B Std. Error 2317.608 297.074 7.051 9.807
Standardized Coefficients Beta .051
t 7.801 .719
Sig. .000 .473
4.781
1.759
.201
2.718
.007
-232.224 -153.747 -573.011
105.638 106.191 213.841
-.156 -.104 -.192
-2.198 -1.448 -2.680
.029 .149 .008
a. Dependent Variable: Birth weight (gram)
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
160
SUTANTO PRIYO HASTONO: Analisis Data berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Variabel
Anc msih ada
Anc dikeluarkan
perubahan Coef.
Age
7,1
7,0
1,4 %
bwt
4,7
4,7
0%
smoke
-232,2
-232,2
0%
ptl
-154,0
153,7
0,1 %
hi
-574,2
573,0
0,1 %
ftv
-2,8
-
Dari perhitungan perubahan nilai coefisien B pada masing-masing variabel, ternyata tidak ada yang berubah lebih dari 10 %, dengan demikian variabel frekuensi anc kita keluarkan dari model. Selankutnya kita lihat kembali bahwa pada model masih ada variabel yang p value > 0,05. Sekarang kita akan keluarkan variabel umur (p value =0,473). Langkah/proses : 1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’ 2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan biarkan saja. Pada kotak Independen juga masih terisi ada 5 variabel, namun sekarang anda harus keluarkan variabel ‘umur (age)’ dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb: Model Summary Model 1
R R Square .336a .113
Adjusted R Square .094
Std. Error of the Estimate 694.016
a. Predictors: (Constant), History of hypertension, Smoking status, History of premature labor, Weight of mother (pounds)
161
SUTANTO PRIYO HASTONO: Analisis Data
Coefficientsa
Model 1
(Constant) Weight of mother (pounds) Smoking status History of premature labor History of hypertension
Unstandardized Coefficients B Std. Error 2449.121 233.779
Standardized Coefficients Beta
t 10.476
Sig. .000
5.035
1.721
.211
2.925
.004
-236.420 -145.412 -582.566
105.338 105.417 213.148
-.159 -.098 -.195
-2.244 -1.379 -2.733
.026 .169 .007
a. Dependent Variable: Birth weight (gram)
Setelah variabel umur
dikeluarkan, nilai R Square ternyata ada sedikit
perunbahan yaitu menjadi 0,113. sedangkan untuk
coefisian B, , hasil
perhitungannya sbb: Variabel
Masih lengkap
umur dikeluarkan
perubahan Coef.
Age
7,1
-
-
bwt
4,7
5,0
6,3 %
smoke
-232,2
-236,4
1,8 %
ptl
-154,0
145,4
6,1 %
hi
-574,2
582,5
1,3 %
ftv
-2,847
-
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %, dengan demikian variabel umur kita keluarkan dari model. Langkah selanjutnya mengeluarkan variabel Riwayat mengalami prematur, Prosesnya/langkahnya sama dengan diatas, Klik Analysis, sorot Regression, ..dst. Pada kotak independen variabel riwayat mengalami prematur dikeluarkan dan dimasukkan ke kotak variable disebelah kiri, dan hasilnya sbb:
162
SUTANTO PRIYO HASTONO: Analisis Data
Model Summary Model 1
R R Square .322a .104
Adjusted R Square .089
Std. Error of the Estimate 695.707
a. Predictors: (Constant), History of hypertension, Smoking status, Weight of mother (pounds) Coefficientsa
Model 1
(Constant) Weight of mother (pounds) Smoking status History of hypertension
Unstandardized Coefficients B Std. Error 2390.105 230.391
Standardized Coefficients Beta
t 10.374
Sig. .000
5.352
1.710
.224
3.130
.002
-263.009 -586.722
103.812 213.646
-.177 -.197
-2.534 -2.746
.012 .007
a. Dependent Variable: Birth weight (gram)
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan perubahan Coef. B dapat dilihat sbb: Variabel
Masih lengkap
Prematur keluar
perubahan Coef.
Age
7,1
-
-
bwt
4,7
5,3
12,3 %
smoke
-232,2
-236,4
1,7 %
ptl
-154,0
-
-
hi
-574,2
582,5
1,3 %
ftv
-2,847
-
Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coefisin B pada variabel beat badan ibu (bwt) beubah sebesar 12,3 % dengan demikian variabel riwayat mengalami prematur tidak jadi dikeluarkan dan tetap dipertahankan dalam model multivariat. Dari hasil analisis ternyata tidak ada lagi yang p valuenya > 0,05 dengan demikian proses pencarian variabel yang masuk dalam model telah selesai dan model yang terakhir adalah sbb: 163
SUTANTO PRIYO HASTONO: Analisis Data
Model Summaryb Model 1
R R Square .336a .113
Adjusted R Square .094
Std. Error of the Estimate 694.016
DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Coefficientsa
Mo de l 1
Unstandardized Coefficients
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
Stand ardize d Coeffi cients
Collinearity Statistics Tolera nce VIF
B 2449.121
Std. Error 233.779
Beta
t 10.476
Sig. .000
5.035
1.721
.211
2.925
.004
.925
1.081
-236.420 -582.566
105.338 213.148
-.159 -.195
-2.244 -2.733
.026 .007
.964 .943
1.037 1.060
-145.412
105.417
-.098
-1.379
.169
.947
1.056
a. Dependent Variable: Birth weight (gram)
Langkah selanjutnya UJI ASUMSI Agar persaman garis yang digunkan untuk memprediksi menghasilkan angka yang valid, maka persamaan yang dihasilkan harus memenuhi asumsi-asumsi yang diersyaratkan uji regresi linier ganda. Adapun uji asumsinya sbb: Langkahnya: 1.Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’ 2. Masukkan dalam kotak Dependen variabel ‘bwt’ 3. Masukan dalam kotak Independen variabel berat badan ibu (lwt), merokok(smoke), riwayat hipertensi (hi) dan variabel riwayat prematur(ptl)
164
SUTANTO PRIYO HASTONO: Analisis Data
4.Klik tombol Statistics 5. Klik kotak ‘Collinearity diagnostic’ dan klik kotak ‘Covariance matrix’ (perintah ini untuk uji asumsi multicoliniarity) 6. Klik kotak ‘Durbin-Watson’ (perintah ini untuk uji asumsi Independensi)
7. Klik Continue 165
SUTANTO PRIYO HASTONO: Analisis Data 8. Klik tombol ‘Plot” 9. Masukkan ‘SRESID’ ke kotak Y, dan masukan ‘ZPRED’ ke kotak X (perintah ini untuk uji asumsi Homoscedasity) 10. Klik kotak ‘histogram’ dan kotak ‘Normal probability plot” (perintah ini untuk uji asumsi Normality)
11. Klik Continue Hasilnya : a. Asumsi Eksistensi (Variabel Random) Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen) adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini, sampel yang diambil harus dilakukan secara random. Cara mengetahui asunsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari model, bila residual menunjukkan adanya mean mendekati nilai nol dan ada sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. Hasil analisis:
166
SUTANTO PRIYO HASTONO: Analisis Data
Residuals Statisticsa Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value
Minimum 2249.77 -2.835
Maximum 3602.03 2.682
Mean 2944.66 .000
Std. Deviation 245.079 1.000
N
67.193
292.804
103.399
45.407
189
1955.43 -2082.610 -3.001 -3.015 -2102.316 -3.084 .768 .000 .004
3616.97 1921.631 2.769 2.782 1940.423 2.835 32.469 .209 .173
2943.73 .000 .000 .001 .923 .000 3.979 .007 .021
251.196 686.593 .989 1.005 708.619 1.010 5.320 .019 .028
189 189 189 189 189 189 189 189 189
189 189
a. Dependent Variable: Birth weight (gram)
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi b. Asumsi Independensi Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi, sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi Model Summaryb Model 1
R R Square .336a .113
Adjusted R Square .094
Std. Error of the Estimate 694.016
DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Dari hasil uji didapatkan koefisien Durbin Watson
0,222, berarti asumsi
independensi terpenuhi. 167
SUTANTO PRIYO HASTONO: Analisis Data
c. Asumsi Linieritas Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value
Regression Residual Total
Sum of Squares 11291987 88625066 99917053
df 4 184 188
Mean Square 2822996.778 481657.965
F 5.861
Sig. .000a
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas terpenuhi
d. Asumsi Homoscedascity Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka diduga variannya terjadi heteroscedasticity. 168
SUTANTO PRIYO HASTONO: Analisis Data
Scatterplot
Dependent Variable: Birth weight (gram)
Regression Studentized Residual
3
2
1
0
-1
-2
-3
-4 -3
-2
-1
0
1
2
3
Regression Standardized Predicted Value
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi homoscedasity terpenuhi e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
169
SUTANTO PRIYO HASTONO: Analisis Data
Histogram
Dependent Variable: Birth weight (gram)
40
Frequency
30
20
10
Mean = -2.53E-16 Std. Dev. = 0.989 N = 189
0 -4
-3
-2
-1
0
1
2
3
Regression Standardized Residual
170
SUTANTO PRIYO HASTONO: Analisis Data
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: Birth weight (gram) 1.0
Expected Cum Prob
0.8
0.6
0.4
0.2
0.0 0.0
0.2
0.4
0.6
0.8
1.0
Observed Cum Prob
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk distribusinya normal, berarti asumsi normality terpenuhi. f.Diagostik Multicollinearity Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka mengindikasikan telah terjadi collinearity.
171
SUTANTO PRIYO HASTONO: Analisis Data
Coefficientsa
Mo de l 1
Unstandardized Coefficients
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
Stand ardize d Coeffi cients
Collinearity Statistics Tolera nce VIF
B 2449.121
Std. Error 233.779
Beta
t 10.476
Sig. .000
5.035
1.721
.211
2.925
.004
.925
1.081
-236.420 -582.566
105.338 213.148
-.159 -.195
-2.244 -2.733
.026 .007
.964 .943
1.037 1.060
-145.412
105.417
-.098
-1.379
.169
.947
1.056
a. Dependent Variable: Birth weight (gram)
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian tidak ada Multicollinearity antara sesama variabel indepeden Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi sehingga model dapat digunakan untuk memprediksi berat badan bayi. Langkah sekanjutnya adalah UJI INTERAKSI, Namun karena secara substansi antar variabel dipandang tidak interaksi maka uji interaksi tidak dilakukan. Sehingga model yang terakhir adalah sbb: Model Summaryb Model 1
R R Square .336a .113
Adjusted R Square .094
Std. Error of the Estimate 694.016
DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
172
SUTANTO PRIYO HASTONO: Analisis Data
Coefficientsa
Mo de l 1
Unstandardized Coefficients
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
Stand ardize d Coeffi cients
Collinearity Statistics Tolera nce VIF
B 2449.121
Std. Error 233.779
Beta
t 10.476
Sig. .000
5.035
1.721
.211
2.925
.004
.925
1.081
-236.420 -582.566
105.338 213.148
-.159 -.195
-2.244 -2.733
.026 .007
.964 .943
1.037 1.060
-145.412
105.417
-.098
-1.379
.169
.947
1.056
a. Dependent Variable: Birth weight (gram)
Interpretasi model: Setelah dilakuikan analisis ,ternyata variabel independen yang masuk model regresi adalah berat badan ibu, ibu merokok, riwayat hipertensi, dan riwayat prematur. Pada tabel ‘Model Summary’ terlihat koefisien determinasi (R square) menunjukkan nilai 0,113 artinya bahwa model regresi yang diperoleh dapat menjelaskan 11,3 % variasi variabel dependen berat bayi. Atau dengan kata lain keempat variabel independen tsb dapat menjelaskan variasi variabel berat bayi sebesar 11,3 %.. Kemudian pada kotak ‘ANOVA’, kita lihat hasil uji F yang menunjukkan nilai P (sig) = 0,000, berarti pada alpha 5% kita dapat menyatakan bahwa model regresi cocok (fit) dengan data yang ada. Atau dapat diartikan kedua variabel tersebut secara signifikan dapat utnuk memprediksi variabel berat bayi. Pada kotak ‘Coefficient’ kita dapat memperoleh persamaaan garisnya, pada kolom B (di bagian Variabel In Equation) di atas, kita dapat mengetahui koefisien regresi masing-masing variabel. Dari hasil di atas, peresamaat regresi yang diperoleh adalah Berat Bayi = 2449,1+5,0 Lwt – 236,4 smoke - 582Hi – 145,4 Ptl
173
SUTANTO PRIYO HASTONO: Analisis Data Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun arti koef. B untuk masing-masing variabel adalah sbb: -
Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi dan prematur
-
Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4 gram setelah dikontrol variabel berat badan, hipertensi dan prematur.
-
Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok dan prematur.
Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap variabel dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..
174
SUTANTO PRIYO HASTONO: Analisis Data
REGRESI LOGISTIK
13
Berbeda dengan regresi linier yang variabel dependennya numerik, regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus, artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak puas dll). A. REGRESI LOGISTIK SEDERHANA 1. Pendahuluan Analisis regresi logistik adalah salah satu pendekatan model matematis yang digunakan untuk menganalisis hubungan satu atau beberapa variabel independen
dengan
sebuah
variabel
dikotom/binary. Variabel katagorik
dependen
katagorik
yang
bersifat
yang dikotom adalah variabel yang
mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal, merokok dan tidak merokok, dan lain-lain Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis variabel dependennya. Regresi linear digunakan apabila variabel dependennya numerik , sedangkan regresi logistik diogunakan pada data yang dependennya berbentuk katagorik yang dikotom. Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh analisis penelitian yang mempelajari hubungan antara variabel umur dengan kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang sampel, didapatkan hasil : No
1
2
3
4
5
6
7
8
9
10
11
…
…
100
Umur 20
22
23
24
25
27
28
29
30
32
33
…
…
70
PJK
0
1
0
0
1
0
1
1
0
0
…
…
1
0
175
SUTANTO PRIYO HASTONO: Analisis Data Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan diberi kode 0 bila mereka tiodak menderita PJK. Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier, misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot), maka hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda. Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan kejadian PJK.
Untuk
mempertajam
analisis
kita,
sekarang
dicoba
untuk
mengelompokkan variabel independen (variabel umur) dan menhitung nilai tengah (dalam hal ini menghitung proporsi) variabel dependen (variabel PJK) untuk setiap kelompok variabel umur dan kejadian jantung dapat dilihat pada tabel berikut:
176
SUTANTO PRIYO HASTONO: Analisis Data
Umur
Jumlah
20 – 29
Proporsi
PJK Tidak
Ya
Kejadian
10
9
1
0,10
30 – 34
15
13
2
0,13
35 – 39
12
9
3
0,25
40 – 44
15
10
5
0,33
45 – 49
13
7
6
0,46
50 – 54
8
3
5
0,63
55 – 59
17
4
13
0,76
60 – 69
10
2
8
0,80
Total
100
57
43
0,43
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut dengan grafik dan hasilnya dapat dilihat pada grafik berikut: 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut menyerupai huruf S. Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada 177
SUTANTO PRIYO HASTONO: Analisis Data sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata (mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai E(Y/x) akan berkisar antara 0 s.d ∞ (0 ≤ E(Y/x) ≤ ∞). Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh karena pada regresi logistik dependennya adalah dikotom maka variabel dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu berada antara nol dan satu (0 ≤ E(Y/x) ≤ 1).
2. Model Logistik f(z) =
1 . 1 + e-z
f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu. Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara -∞ sampai +∞. Bila nilai Z mendekati – ∞ maka f(– ∞) =
1
. =0
1 + e-(– ∞)
178
SUTANTO PRIYO HASTONO: Analisis Data Bila nilai Z mendekati + ∞ maka f(+ ∞) =
1
. =1
1 + e-(+ ∞) Fungsi Logistik dapat digambarkan sbb:
1
-∞
0
+∞
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada ketinggian tertentu garisnya akan mendatar mendekati nilai 1. Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu probabilitas kejadian pada dependen yang dikotom maka model regresi logistik adalah pilihan yang tepat. 3. Model Logistik Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan penjumlahan linear konstanta (α) ditambah
dengan β1X1, ditambah β2X2 dan
seterusnya sampai βiXi. Variabel X adalah variabel Independen. 179
SUTANTO PRIYO HASTONO: Analisis Data Z = α + β1X1
(Regresi logistik sederhana)
Z = α + β1X1 + β2X2 + … + βiXi
(Regresi logistik berganda)
Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah
f(z) =
1
.
1 + e-(α + β1X1 + β2X2 + … + βiXi) 4. Contoh Kasus Contoh studi follow up selama 9 tahun. Dalam studi ini dipelajari mengenai hubungan antara kejadian penyakit jantung koroner (dengan nama vaiabel PJK) dengan tinggi rendahnya kadar katekolamin dalam darah (nama variabel KAT). Pemberian kode nilai variabel adalah sbb: Untuk variabel PJK Æ
1 = timbul penyakit jantung koroner 0 = tidak ada penyakit jantung koroner
Untuk variabel KAT Æ
1 = kadar katekolamin darah tinggi 0 = kadar katekolamin darah rendah
Pertanyaan: a. Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko untuk terjadi PJK? b. Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko untuk terjadi PJK? c. Bandingkan risiko terjadi PJK antara mereka yang kadar katekolaminnya tinggi dengan yang kadar katekolaminnya rendah? Jawab: Dengan model regresi logistik maka pada soal tersebut modelnya adalah: f(z) =
1 . 1 + e-z 180
SUTANTO PRIYO HASTONO: Analisis Data Nilai f(z) dapat diganti dengan P(X), maka rumusnya: P(X) =
1 . 1 + e-z
Bila Z = α + β1KAT, maka modelnya : P(X) =
1 . 1 + e-α + β1KAT
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb: α = -3,911 dan β1 = 0,652, maka: P(X) =
1 . 1 + e-(-3,911 + 0,652KAT)
Dari model tersebut coba kita jawab pertanyaan di atas: a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi. Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai KAT=1 pada model di atas, hasilnya: P(X) =
1
.
= 0,037 atau sekitar 4%
1 + e-(-3,911 + 0,652*1) jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up. b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai KAT=0 pada model di atas, hasilnya: P(X) =
1
.
= 0,019 atau sekitar 2%
1 + e-(-3,911 + 0,652*0) jadi mereka/individu yang kadar katekolaminnya rendah dalam darah mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up. c. Besar risiko kedua kelompok tersebut P1(X) = 0,037 = 1,947 = 2,0 P0(X)
0,019
Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh secara direk. Arti dari angka di atas adalah mereka yang kaadar 181
SUTANTO PRIYO HASTONO: Analisis Data katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi dibandingkan mereka yang kadar katekolaminnya rendah. Model regresi logistik dapat digunakan pada data yang dikumpulkan melalui rancangan kohort, case control maupun cross sectional. Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko individual. Sedangkan pada rancangan case control dan cross sectional tidak dapat digunakan untuk menghitung risiko individual karena β0 pada rancangan ini tidak sahih. Nilai β0 dapat dihitung/diestimasi bila sampling fraction populasi yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket: sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit). Namun dengan memperlakukan rancangan case control dan cross sectional sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan perhitungan eksponensial β dari persamaan garis regresi logistik. Odds Ratio (OR) = exp(β) atau dapat ditulis OR = e(β) Dengan demikian dapat disimpulkan bahwa
Individual Risk (ririko
individu) hanya dapat diperoleh dari rancangan kohor prospektif. Sedangkan pada rancangan case control, cross sectional tidak dapat melakukan prediskis risiko individual. Pada rancangan case control dan cross sectional dan cohort dapat dihitung nilai Odds Ratio (OR), yang merupakan perhitungan RR indirek. Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal) berdasarkan nilai-nilai sejumlah variabel yang diukur padanya. Prediksi dapat digunakan dengan model: P(X) =
1
1+e
.
-(α + β1X1 + β2X2 + … + βiXi
182
SUTANTO PRIYO HASTONO: Analisis Data B. REGRESI LOGISTIK GANDA Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model. Pada regresi logistik, variabel independennya boleh campuran antara variabel katagorik dan numerik. Namun sebaiknya variabel independennya berupa katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah. Kegunaan analisis regresi logistik ganda mencakup dua hal, yaitu: a. Model Prediksi Pemodelan dengan tujuan untuk memperoleh model yang tediri dari beberapa variabel independen yang dianggap terbaik untuk memprediksi kejadian variabel dependen. Pada pemodelan ini semua variabel dianggap penting sehingga estimasi dapat dilakukan estimasi beberapa koefisien regresi logistik sekaligus. Bentuk kerangka konsep model regresi : X1 X2 X3 X4
Y
Prosedur pemodelan: Agar diperoleh model regresi yang hemat dan mampu menjelaskan hubungan variabel independen dan independen dalam populasi, diperlukan prosedur pemilihan variabel sbb: 1). Melakukan analisis bivariat antara masing-masing variabel independen dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p < 0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa saja p value rel="nofollow"> 0,25 tetap diikutkan ke multivariat bila variabel tsb secara substansi penting.
183
SUTANTO PRIYO HASTONO: Analisis Data 2). Memilih variabel yang dianggap penting yang masuk dalam model, dengan cara mempertahankan variabel yang mempunyai p value < 0,05 dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara bertahap dimulai dari variabel yang mempunyai p value terbesar. 3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan apakah variabel numerik dijadikan variabel katagorik atau tetap variabel numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4 kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok menunjukkan
bentuk
garis
lurus,
maka
variabel
numerik
dapat
dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka dapat dipertimbangkan dirubah dalam bentuk katagorik. 4). Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik. Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting dimasukkan dalam model. b. Model Faktor Risiko Pemodelan dengan tujuan mengestimasi secara valid hubungan satu variabel utama dengan variabel dependen dengan mengontrol beberapa variabel konfonding. Bentuk kerangka konsep model faktor risiko: X1
Y
X2 X3 X4 184
SUTANTO PRIYO HASTONO: Analisis Data
Tahapan pemodelan: 1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama dengan semua variabel konfonding). 2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara berurutan satu per satu dari nilai p Wald yang terbesar. 3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel utama antara sebelum dan sesudahvariabel kovariat (X1) dikeluarkan lebih besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding dan harus tetap berada dalam model.
185
SUTANTO PRIYO HASTONO: Analisis Data
KASUS I :
REGRESI LOGISTIK MODEL PREDIKSI Untuk latihan, gunakan file data “LBW.SAV” Suatu penelitian ingin mengetahui hubungan antara UMUR IBU (age) , RAS (race), MENDERITA HIPERTENSI (ht), ADA KELAINAN UTERUS (ui) dan PERIKSA HAMIL (ftv) dengan BBLR (low).
Adapun langkahnya:
A. SELEKSI BIVARIAT Masing-masing variabel independen dilakukan analisis bivariat dengan variabel dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel tersebut langsung masuk tahap multivariat. Untuk variabel independen yang hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting, maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi bivariat menggunakan uji regresi logistik sederhana. 1.Analisis bivariat antara “umur” dengan”bblr” 1. Pilih “Analyze” 2. Pilih “Regression” 3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam hal ini berarti masukkan “low”) dan pada kotak independen isikan variabel independennya (dalam hal ini berarti masukkan “age”). Sehingga tampilannya sbb: 186
SUTANTO PRIYO HASTONO: Analisis Data
5. Klik tombol ‘Options’ , klik ‘CI for Exp(B)’ 6. Klik ‘Continue’ 7. Klik “OK”, dan hasilnya sbb:
Block 1: Method = Enter Omnibus Tests of Model Coefficients Step 1
Step Block Model
Chi-square 2.760 2.760 2.760
df 1 1 1
Sig. .097 .097 .097
Variables in the Equation
Step a 1
age Const ant
B -.051
S.E. .032
Wald 2.635
df 1
Sig. .105
Exp(B) .950
.385
.732
.276
1
.599
1.469
95.0% C.I.for EXP(B) Lower Upper .893 1.011
a. Variable(s) entered on step 1: age.
187
SUTANTO PRIYO HASTONO: Analisis Data
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25 sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI: 0,89-1,01) 2.Analisis bivariat antara “ras” dengan “bblr” 1. Pilih “Analyze” 2. Pilih “Regression” 3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates variabel ‘age’ dikeluarkan dan gantilah dengan mengisikan variabel ‘race’. Tampilannya sbb:
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras 188
SUTANTO PRIYO HASTONO: Analisis Data putih, hitam dan lainnya). Klik tombol Categorical, pindahkan ‘race’ dari kotak covariates ke kotak categorical covariates, klik pilihan ‘first’ pada bagian Reference category, lalu klik Change, dan tampilannya:
6. Klik Continue, layar ke menu logistic 7. Klik OK Categorical Variables Codings
Race
White Black Other
Frequency 96 26 67
Parameter coding (1) (2) .000 .000 1.000 .000 .000 1.000
Omnibus Tests of Model Coefficients Step 1
Step Block Model
Chi-square 5.010 5.010 5.010
df 2 2 2
Sig. .082 .082 .082
189
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
B Stea p1
race race(1) race(2) Constant
.845 .636 -1.155
S.E.
Wald 4.922 3.323 3.345 23.330
.463 .348 .239
df 2 1 1 1
Sig. .085 .068 .067 .000
Exp(B) 2.328 1.889 .315
95.0% C.I.for EXP(B) Lower Upper .939 .955
5.772 3.736
a. Variable(s) entered on step 1: race.
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy, terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih. 3. Analisis bivariat antara “hipertensi” dengan “bblr” 1. Pilih “Analyze” 2. Pilih “Regression” 3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan “ht”. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients Step 1
Step Block Model
Chi-square 4.022 4.022 4.022
df 1 1 1
Sig. .045 .045 .045
190
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
Step a 1
ht Constant
B 1.214 -.877
S.E. .608 .165
Wald 3.979 28.249
df 1 1
Sig. .046 .000
Exp(B) 3.365 .416
95.0% C.I.for EXP(B) Lower Upper 1.021 11.088
a. Variable(s) entered on step 1: ht.
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam multivariat 4. Analisis bivariat antara “kelainan uterus” dengan “bblr” 7. Pilih “Analyze” 8. Pilih “Regression” 9. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 10. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan “ui”. Klik OK, Tampilannya sbb: Omnibus Tests of Model Coefficients Step 1
Step Block Model
Chi-square 5.076 5.076 5.076
df 1 1 1
Sig. .024 .024 .024
Variables in the Equation
Step a 1
ui Constant
B .947 -.947
S.E. .417 .176
Wald 5.162 29.072
df 1 1
Sig. .023 .000
Exp(B) 2.578 .388
95.0% C.I.for EXP(B) Lower Upper 1.139 5.834
a. Variable(s) entered on step 1: ui.
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat lanjut ke multivariat
191
SUTANTO PRIYO HASTONO: Analisis Data 5.Analisis bivariat antara “periksa hamil” dengan “bblr” 1.Pilih “Analyze” 2.Pilih “Regression” 3.Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4.Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan “ftv”. Klik OK, Tampilannya sbb: Omnibus Tests of Model Coefficients Step 1
Step Block Model
Chi-square .773 .773 .773
df 1 1 1
Sig. .379 .379 .379
Variables in the Equation
Step a 1
ftv Constant
B -.135 -.687
S.E. .157 .195
Wald .744 12.427
df 1 1
Sig. .389 .000
Exp(B) .874 .503
95.0% C.I.for EXP(B) Lower Upper .643 1.188
a. Variable(s) entered on step 1: ftv.
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak dapat lanjut ke multivariat, namun karena secara substansi variabel periksa hamil sangat penting, maka variabel ini dapat dianalisis multivariat. 6.Analisis bivariat antara “merokok” dengan “bblr” Omnibus Tests of Model Coefficients Step 1
Step Block Model
Chi-square 4.867 4.867 4.867
df 1 1 1
Sig. .027 .027 .027
192
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
Step a 1
smoke Constant
B .704 -1.087
S.E. .320 .215
Wald 4.852 25.627
df 1 1
Sig. .028 .000
Exp(B) 2.022 .337
95.0% C.I.for EXP(B) Lower Upper 1.081 3.783
a. Variable(s) entered on step 1: smoke.
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian variabel merokok dapat masuk ke multivariat. 7.Analisis bivariat antara “prematur” dengan “bblr” Omnibus Tests of Model Coefficients Step 1
Step Block Model
Chi-square 6.779 6.779 6.779
df 1 1 1
Sig. .009 .009 .009
Variables in the Equation
Step a 1
ptl Constant
B .802 -.964
S.E. .317 .175
Wald 6.391 30.370
df 1 1
Sig. .011 .000
Exp(B) 2.230 .381
95.0% C.I.for EXP(B) Lower Upper 1.197 4.151
a. Variable(s) entered on step 1: ptl.
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel riwayat adanya prematur dapat masuk ke multivariat Hasil seleksi bivariat : Variabel
P value
Umur
0,097
Ras
0,082
Hipertensi
0,045
Kelainan uterus
0,024
Periksa hamil
0,379
Merokok
0,027
Prematur
0,009 193
SUTANTO PRIYO HASTONO: Analisis Data
Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis multivariat oleh karena secara substansi periksa hamil merupakan variabel yang sangat penting berhubungan dengan kejadian bblr.
B. PEMODELAN MULTIVARIAT Selanjutnya dilakukan analisis multivariat keenam variabel tersebut dengan kejadian bblr. 1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel dependen. 1. Pilih “Analyze” 2. Pilih “Regression” 3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy. 5. Klik Option, pilih ‘CI for exp(B)’ 6. Klik ‘Continue’
194
SUTANTO PRIYO HASTONO: Analisis Data
7. Kilik ‘OK’
Logistic Regression Variables in the Equation
Step a 1
age race race(1) race(2) smoke ptl ht ui ftv Constant
B -.041
S.E. .036
1.009 1.003 .964 .630 1.361 .802 .009 -1.183
.502 .426 .391 .340 .631 .458 .161 .919
Wald 1.249 6.783 4.034 5.560 6.090 3.429 4.648 3.066 .003 1.659
df 1 2 1 1 1 1 1 1 1 1
Sig. .264 .034 .045 .018 .014 .064 .031 .080 .954 .198
Exp(B) .960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 .306
95.0% C.I.for EXP(B) Lower Upper .894 1.031 1.025 1.185 1.219 .964 1.132 .909 .736
7.345 6.280 5.639 3.654 13.451 5.468 1.384
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv dikeluarkan dari model. Dengan langkah yang sama akhirnya diperoleh hasil sbb. 195
SUTANTO PRIYO HASTONO: Analisis Data
Logistic Regression Variables in the Equation
Step a 1
age race race(1) race(2) smoke ptl ht ui Constant
B -.040
S.E. .036
1.009 1.002 .963 .629 1.358 .800 -1.184
.503 .425 .390 .340 .629 .457 .919
Wald 1.275 6.781 4.035 5.562 6.086 3.423 4.663 3.063 1.661
df 1 2 1 1 1 1 1 1 1
Sig. .259 .034 .045 .018 .014 .064 .031 .080 .197
Exp(B) .960 2.744 2.723 2.620 1.875 3.889 2.226 .306
95.0% C.I.for EXP(B) Lower Upper .896 1.030 1.025 1.184 1.219 .963 1.134 .908
7.347 6.262 5.632 3.651 13.341 5.454
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui.
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race, smoke, ptl, ht, dan ui. Variabel
OR ftv ada
OR ftv tak ada
perubahan OR
Age
0.960
0.960
0%
Race(1)
2.743
2.744
0%
Race(2)
2.727
2.723
0%
Smoke
2.622
2.620
0%
Ptl
1.877
1.875
0,1 %
Ht
3.902
3.889
0.3 %
ui
2.229
2.226
0,1 %
ftv
1.009
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah umur, dengan demikian dikelurkan dar model dan hasilnya Hasilnyanya :
196
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
B Step a 1
race race(1) race(2) smoke ptl ht ui Constant
S.E.
1.088 1.059 .991 .576 1.364 .855 -2.146
.501 .418 .387 .334 .633 .451 .386
Wald 7.968 4.723 6.422 6.569 2.975 4.640 3.585 30.917
df 2 1 1 1 1 1 1 1
Sig. .019 .030 .011 .010 .085 .031 .058 .000
Exp(B) 2.968 2.883 2.694 1.779 3.912 2.350 .117
95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970
7.916 6.538 5.747 3.422 13.537 5.692
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel yang masih aktif di model. Variabel
OR age ada
OR age tak ada
perubahan OR
Age
0.960
-
Race(1)
2.743
2.968
8,2 %
Race(2)
2.727
2.883
5,7 %
Smoke
2.622
2.694
2,7 %
Ptl
1.877
1.779
5,2 %
Ht
3.902
3.912
0.3 %
ui
2.229
2.350
5,4 %
ftv
1.009
Dari analisis perbandingan OR, ternyata perubahannya < 10 %, dengan demikian variabel umur dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel yang p valuenya > 0,05, variabel ptl dikeluarkan model, hasilnya
197
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
B Step a 1
race race(1) race(2) smoke ht ui Constant
1.064 1.083 1.094 1.359 1.006 -2.092
S.E. .499 .413 .380 .630 .438 .380
Wald 8.245 4.545 6.877 8.299 4.660 5.262 30.307
df 2 1 1 1 1 1 1
Sig. .016 .033 .009 .004 .031 .022 .000
Exp(B) 2.897 2.955 2.986 3.894 2.734 .123
95.0% C.I.for EXP(B) Lower Upper 1.090 1.315 1.419 1.133 1.158
7.704 6.640 6.286 13.379 6.458
a. Variable(s) entered on step 1: race, smoke, ht, ui.
Setelah ptl dikeluarkan, kita lihat perubahan OR nya: Variabel OR ptl ada OR ptl tak ada
perubahan OR
Age
0.960
-
Race(1)
2.743
2.897
5,6 %
Race(2)
2.727
2.955
8,3 %
Smoke
2.622
2.986
13,8 %
Ptl
1.877
-
-
Ht
3.902
3.894
0.2 %
ui
2.229
2.734
22,6 %
ftv
1.009
-
Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus berubah > 10 %, dengan demikian variabel ptl dimasukkan kembali dalam model. Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan hasilnya sbb:
198
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
B Step a 1
race race(1) race(2) smoke ht ptl Constant
1.062 1.085 .996 1.221 .696 -2.025
S.E. .500 .411 .382 .629 .325 .372
Wald 8.286 4.513 6.949 6.794 3.764 4.596 29.586
df 2 1 1 1 1 1 1
Sig. .016 .034 .008 .009 .052 .032 .000
Exp(B) 2.894 2.958 2.707 3.390 2.007 .132
95.0% C.I.for EXP(B) Lower Upper 1.086 1.321 1.280 .988 1.062
7.712 6.626 5.726 11.640 3.793
a. Variable(s) entered on step 1: race, smoke, ht, ptl.
Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan : Variabel OR ui ada OR ui tak ada perubahan OR Age
0.960
-
Race(1)
2.743
2.894
5,5 %
Race(2)
2.727
2.958
8,4 %
Smoke
2.622
2.707
3,2 %
Ptl
1.877
2.007
6,9 %
Ht
3.902
3.390
13.1 %
ui
2.229
-
-
ftv
1.009
-
-
Setelah dilakukan perbandingan OR, ternyata variabel ht berubah > 10 %, dengan demikian variabel ui masuk kembali dalam model. Akhirnya model yang dihasilkan adalah sbb:
199
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
B Step a 1
race race(1) race(2) smoke ptl ht ui Constant
S.E.
1.088 1.059 .991 .576 1.364 .855 -2.146
Wald 7.968 4.723 6.422 6.569 2.975 4.640 3.585 30.917
.501 .418 .387 .334 .633 .451 .386
df 2 1 1 1 1 1 1 1
Sig. .019 .030 .011 .010 .085 .031 .058 .000
Exp(B) 2.968 2.883 2.694 1.779 3.912 2.350 .117
95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970
7.916 6.538 5.747 3.422 13.537 5.692
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
C. UJI INTERAKSI Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi, kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi. Langkahnya: 1. klik analysis, klik regression, klik binary ogistik 2. Kotak dependen isikan low 3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui 4. Klik tombol Next 5. isikan : smoke*ht ke kotak kovariat 6. klik OK lihat hasilnya pada bagian Block 2
Block 2: Method = Enter Omnibus Tests of Model Coefficients
Step 1
Step
Chisquare .000
df
Sig. 1
.994
Block
.000
1
.994
Model
26.560
7
.000
200
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
B Step a 1
race race(1) race(2) smoke ptl ht ui ht by smoke Constant
S.E.
1.088 1.059 .990 .576 1.360 .854 .010 -2.146
.502 .419 .397 .336 .831 .451 1.283 .386
Wald 7.900 4.692 6.387 6.211 2.937 2.680 3.584 .000 30.875
df 2 1 1 1 1 1 1 1 1
Sig. .019 .030 .011 .013 .087 .102 .058 .994 .000
Exp(B)
95.0% C.I.for EXP(B) Lower Upper
2.969 2.883 2.692 1.779 3.896 2.350 1.010 .117
1.109 1.268 1.236 .921 .765 .970 .082
7.946 6.555 5.865 3.438 19.852 5.693 12.491
a. Variable(s) entered on step 1: ht * smoke .
Pada output bagian Block 2:Methode=Enter, terlihat hasil uji omnibusnya memperlihatkan p value = 0,994 (lihat bagian step) berarti lebih besar dari 0,05, berarti : tidak ada interaksi antara merokok dengan hipertensi.
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa ada interaksi:
MODEL TERAKHIR Variables in the Equation
B Step a 1
race race(1) race(2) smoke ptl ht ui Constant
1.088 1.059 .991 .576 1.364 .855 -2.146
S.E. .501 .418 .387 .334 .633 .451 .386
Wald 7.968 4.723 6.422 6.569 2.975 4.640 3.585 30.917
df 2 1 1 1 1 1 1 1
Sig. .019 .030 .011 .010 .085 .031 .058 .000
Exp(B) 2.968 2.883 2.694 1.779 3.912 2.350 .117
95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970
7.916 6.538 5.747 3.422 13.537 5.692
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
201
SUTANTO PRIYO HASTONO: Analisis Data Interpretasi: Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case
control, interpretasi yang dapat dilakukan hanya menjelaskan nilai OR (Exp B) pada masing-masing variabel. Oleh karena analisisnya multivariat/ganda maka nilai OR-nya sudah terkontrol (adjusted) oleh variabel lain yang ada pada model. Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan kejadian BBLR adalah variabel ras, merokok dan hipertensi. Sedangkan variabel riwayat prematur dan kelainan uterus sebagai variabel konfounding. Hasil analisis didapatkan Odds Ratio (OR) dari variabel hipertensi adalah 3,9, artinya Ibu yang menderita hipertensi akan melahirkan bayi BBLR sebesar 4 kali lebih tinggi dibandingkan ibu yang tidak menderita hipertensi setelah dikontrol variabel race, merokok, prematur dan uterus. Secara sama dapat diinterpretasikan untuk variabel yang lain. Untuk melihat variabel mana yang paling besar pengaruhnya terhadap variabel dependen, dilihat dari exp (B) untuk variabel yang signifikan, semakin besar nilai exp (B) berarti semakin besar pengaruhnya terhadap variabel dependen yang dianalisis. Dalam data ini berarti hipertensi yang paling besar pengaruhnya terhadap kejadian bayi BBLR.
202
SUTANTO PRIYO HASTONO: Analisis Data
KASUS KEDUA : REGRESI LOGISTIK MODEL FAKTOR RISIKO Tujuan analisis : Untuk mengetahui hubungan pekerjaan dengan menyusui eksklusive Variabel independen utama : Pkerjaan Variabel dependen : Eksklusive Variabel konfounding : umur, berat badan ibu dan sikap A. Langkah pertama: menyusun model mencakup semua variabel dan variabel interaksi Cara 1. Pilih “Analyze” 2. Pilih “Regression” 3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan Covariat. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam contoh ini berarti eksklu) dan pada kotak Covariat isikan variabel independen utama beserta variabel konfounding dan interaksinya (dalam hal ini berarti: kerja, umur1, bbibu, sikap, kerja*umur1,kerja*bbibu, kerja*sikap) 4. Klik ‘OK’, dan hasilnya sbb:
Logistic Regression Variables in the Equation
Stea p1
kerja umur1 sikap kerja by umur1 kerja by sikap Constant
B -20.275 1.681 -.052 20.279 .148 -1.505
S.E. 28420.722 1.197 .114 28420.722 .159 1.432
Wald .000 1.972 .208 .000 .869 1.105
df 1 1 1 1 1 1
Sig. .999 .160 .648 .999 .351 .293
Exp(B) .000 5.372 .949 6E+008 1.160 .222
95.0% C.I.for EXP(B) Lower Upper .000 . .514 56.109 .760 1.186 .000 . .849 1.583
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .
203
SUTANTO PRIYO HASTONO: Analisis Data
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di atas variabel interaksi ”Pekerjaan by umur” mempunyai nilai p terbesar (p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model menjadi:
Logistic Regression Variables in the Equation
Stea p1
kerja umur1 sikap kerja by sikap Constant
B -.445 2.217 -.060
S.E. 1.718 1.146 .114
Wald .067 3.741 .274
df 1 1 1
Sig. .795 .053 .601
Exp(B) .641 9.177 .942
.175
.156
1.264
1
.261
1.191
-1.881
1.483
1.610
1
.205
.152
95.0% C.I.for EXP(B) Lower Upper .022 18.557 .971 86.749 .753 1.178 .878
1.616
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * sikap .
Dari
output diatas, variabel interaksi ‘kerja by sikap’ harus dikeluarkan dari model
karana p valuenya > 0,05. Setelah dikeluarkan hasilnya: Variables in the Equation
Step a 1
kerja umur1 sikap Consta nt
B 1.376 2.260 .035
S.E. .666 1.157 .076
Wald 4.273 3.812 .212
-2.876
1.239
5.384
df 1 1 1
Sig. .039 .051 .645
Exp(B) 3.959 9.582 1.036
1
.020
.056
95.0% C.I.for EXP(B) Lower Upper 1.074 14.592 .991 92.609 .893 1.202
a. Variable(s) entered on step 1: kerja, umur1, sikap.
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel interasksi, langkah selanjutnya uji konfounding
204
SUTANTO PRIYO HASTONO: Analisis Data
UJI KONFOUNDING Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka varaibel tsb dianggap sebagai variabel konfounding. Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model hasiilnya sbb:’ Variables in the Equation
Stea p1
kerja umur1 Constant
B 1.413 2.378 -2.624
S.E. .660 1.135 1.113
Wald 4.585 4.389 5.555
df 1 1 1
Sig. .032 .036 .018
Exp(B) 4.110 10.783 .073
95.0% C.I.for EXP(B) Lower Upper 1.127 14.985 1.165 99.754
a. Variable(s) entered on step 1: kerja, umur1.
Setelah variabel sikap dikeluarkan terlihat perubahan OR variabel utama kerja sebesar : (4,111 – 3,959)/4,111 =3,6 % . Dengan demikian variabel sikap bukan konfounding, dan harus dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel umur, setelah dikeluarkan hasilnya: Variables in the Equation
Step a 1
kerja Const ant
B 1.698
S.E. .618
Wald 7.545
df 1
Sig. .006
Exp(B) 5.464
-.754
.429
3.091
1
.079
.471
95.0% C.I.for EXP(B) Lower Upper 1.627 18.357
a. Variable(s) entered on step 1: kerja.
Setelah variabel umur dikeluarkan terlihat perubahan OR variabel utama: kerja sebesar : (5,464-4,111)/4,111 =32,9 % . Dengan demikian variabel umur merupakan variabel konfounding. Untuk itu variabel umur harus tetap ikut dalam model sebagai konfounding hubungan kerja dengan menyusui eksklusive.
Model terakhir :
205
SUTANTO PRIYO HASTONO: Analisis Data
Variables in the Equation
Stea p1
kerja umur1 Constant
B 1.413 2.378 -2.624
S.E. .660 1.135 1.113
Wald 4.585 4.389 5.555
df 1 1 1
Sig. .032 .036 .018
Exp(B) 4.110 10.783 .073
95.0% C.I.for EXP(B) Lower Upper 1.127 14.985 1.165 99.754
a. Variable(s) entered on step 1: kerja, umur1.
Interpretasi: Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb: Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah dikontrol variabel ”umur”.
206
SUTANTO PRIYO HASTONO: Analisis Data Lampiran data LBW. SAV.
Id
Low
age
lwt
race
smoke
ptl
ht
ui
ftv
bwt
1
1
28
120
3
1
1
0
1
0
709
2
1
29
130
1
0
0
0
1
2
1021
3
1
34
187
2
1
0
1
0
0
1135
4
1
25
105
3
0
1
1
0
0
1330
5
1
25
85
3
0
0
0
1
0
1474
6
1
27
150
3
0
0
0
0
0
1588
7
1
23
97
3
0
0
0
1
1
1588
8
1
24
128
2
0
1
0
0
1
1701
9
1
24
132
3
0
0
1
0
0
1729
10
1
21
165
1
1
0
1
0
1
1790
11
1
32
105
1
1
0
0
0
0
1818
12
1
19
91
1
1
2
0
1
0
1885
13
1
25
115
3
0
0
0
0
0
1893
14
1
16
130
3
0
0
0
0
1
1899
15
1
25
92
1
1
0
0
0
0
1928
16
1
20
150
1
1
0
0
0
2
1928
17
1
21
200
2
0
0
0
1
2
1928
18
1
24
155
1
1
1
0
0
0
1936
19
1
21
103
3
0
0
0
0
0
1970
20
1
20
125
3
0
0
0
1
0
2055
21
1
25
89
3
0
2
0
0
1
2055
22
1
19
102
1
0
0
0
0
2
2082
23
1
19
112
1
1
0
0
1
0
2084
24
1
26
117
1
1
1
0
0
0
2084
25
1
24
138
1
0
0
0
0
0
2100
26
1
17
130
3
1
1
0
1
0
2125
27
1
20
120
2
1
0
0
0
3
2126
28
1
22
130
1
1
1
0
1
1
2187
29
1
27
130
2
0
0
0
1
0
2187
30
1
20
80
3
1
0
0
1
0
2211
207
SUTANTO PRIYO HASTONO: Analisis Data 31
1
17
110
1
1
0
0
0
0
2225
32
1
25
105
3
0
1
0
0
1
2240
33
1
20
109
3
0
0
0
0
0
2240
34
1
18
148
3
0
0
0
0
0
2282
35
1
18
110
2
1
1
0
0
0
2296
36
1
20
121
1
1
1
0
1
0
2296
37
1
21
100
3
0
1
0
0
4
2301
38
1
26
96
3
0
0
0
0
0
2325
39
1
31
102
1
1
1
0
0
1
2353
40
1
15
110
1
0
0
0
0
0
2353
41
1
23
187
2
1
0
0
0
1
2367
42
1
20
122
2
1
0
0
0
0
2381
43
1
24
105
2
1
0
0
0
0
2381
44
1
15
115
3
0
0
0
1
0
2381
45
1
23
120
3
0
0
0
0
0
2395
46
1
30
142
1
1
1
0
0
0
2410
47
1
22
130
1
1
0
0
0
1
2410
48
1
17
120
1
1
0
0
0
3
2414
49
1
23
110
1
1
1
0
0
0
2424
50
1
17
120
2
0
0
0
0
2
2438
51
1
26
154
3
0
1
1
0
1
2442
52
1
20
105
3
0
0
0
0
3
2450
53
1
26
190
1
1
0
0
0
0
2466
54
1
14
101
3
1
1
0
0
0
2466
55
1
28
95
1
1
0
0
0
2
2466
56
1
14
100
3
0
0
0
0
2
2495
57
1
23
94
3
1
0
0
0
0
2495
58
1
17
142
2
0
0
1
0
0
2495
59
1
21
130
1
1
0
1
0
3
2495
60
0
19
182
2
0
0
0
1
0
2523
61
0
33
155
3
0
0
0
0
3
2551
62
0
20
105
1
1
0
0
0
1
2557
63
0
21
108
1
1
0
0
1
2
2594
64
0
18
107
1
1
0
0
1
0
2600
208
SUTANTO PRIYO HASTONO: Analisis Data 65
0
21
124
3
0
0
0
0
0
2622
66
0
22
118
1
0
0
0
0
1
2637
67
0
17
103
3
0
0
0
0
1
2637
68
0
29
123
1
1
0
0
0
1
2663
69
0
26
113
1
1
0
0
0
0
2665
70
0
19
95
3
0
0
0
0
0
2722
71
0
19
150
3
0
0
0
0
1
2733
72
0
22
95
3
0
0
1
0
0
2750
73
0
30
107
3
0
1
0
1
2
2750
74
0
18
100
1
1
0
0
0
0
2769
75
0
18
100
1
1
0
0
0
0
2769
76
0
15
98
2
0
0
0
0
0
2778
77
0
25
118
1
1
0
0
0
3
2782
78
0
20
120
3
0
0
0
1
0
2807
79
0
28
120
1
1
0
0
0
1
2821
80
0
32
121
3
0
0
0
0
2
2835
81
0
31
100
1
0
0
0
1
3
2835
82
0
36
202
1
0
0
0
0
1
2836
83
0
28
120
3
0
0
0
0
0
2863
84
0
25
120
3
0
0
0
1
2
2877
85
0
28
167
1
0
0
0
0
0
2877
86
0
17
122
1
1
0
0
0
0
2906
87
0
29
150
1
0
0
0
0
2
2920
88
0
26
168
2
1
0
0
0
0
2920
89
0
17
113
2
0
0
0
0
1
2920
90
0
17
113
2
0
0
0
0
1
2920
91
0
24
90
1
1
1
0
0
1
2948
92
0
35
121
2
1
1
0
0
1
2948
93
0
25
155
1
0
0
0
0
1
2977
94
0
25
125
2
0
0
0
0
0
2977
95
0
29
140
1
1
0
0
0
2
2977
96
0
19
138
1
1
0
0
0
2
2977
97
0
27
124
1
1
0
0
0
0
2992
98
0
31
215
1
1
0
0
0
2
3005
209
SUTANTO PRIYO HASTONO: Analisis Data 99
0
33
109
1
1
0
0
0
1
3033
100
0
21
185
2
1
0
0
0
2
3042
101
0
19
189
1
0
0
0
0
2
3062
102
0
23
130
2
0
0
0
0
1
3062
103
0
21
160
1
0
0
0
0
0
3062
104
0
18
90
1
1
0
0
1
0
3076
105
0
18
90
1
1
0
0
1
0
3076
106
0
32
132
1
0
0
0
0
4
3080
107
0
19
132
3
0
0
0
0
0
3090
108
0
24
115
1
0
0
0
0
2
3090
109
0
22
85
3
1
0
0
0
0
3090
110
0
22
120
1
0
0
1
0
1
3100
111
0
23
128
3
0
0
0
0
0
3104
112
0
22
130
1
1
0
0
0
0
3132
113
0
30
95
1
1
0
0
0
2
3147
114
0
19
115
3
0
0
0
0
0
3175
115
0
16
110
3
0
0
0
0
0
3175
116
0
21
110
3
1
0
0
1
0
3203
117
0
30
153
3
0
0
0
0
0
3203
118
0
20
103
3
0
0
0
0
0
3203
119
0
17
119
3
0
0
0
0
0
3225
120
0
17
119
3
0
0
0
0
0
3225
121
0
23
119
3
0
0
0
0
2
3232
122
0
24
110
3
0
0
0
0
0
3232
123
0
28
140
1
0
0
0
0
0
3234
124
0
26
133
3
1
2
0
0
0
3260
125
0
20
169
3
0
1
0
1
1
3274
126
0
24
115
3
0
0
0
0
2
3274
127
0
28
250
3
1
0
0
0
6
3303
128
0
20
141
1
0
2
0
1
1
3317
129
0
22
158
2
0
1
0
0
2
3317
130
0
22
112
1
1
2
0
0
0
3317
131
0
31
150
3
1
0
0
0
2
3321
132
0
23
115
3
1
0
0
0
1
3331
210
SUTANTO PRIYO HASTONO: Analisis Data 133
0
16
112
2
0
0
0
0
0
3374
134
0
16
135
1
1
0
0
0
0
3374
135
0
18
229
2
0
0
0
0
0
3402
136
0
25
140
1
0
0
0
0
1
3416
137
0
32
134
1
1
1
0
0
4
3430
138
0
20
121
2
1
0
0
0
0
3444
139
0
23
190
1
0
0
0
0
0
3459
140
0
22
131
1
0
0
0
0
1
3460
141
0
32
170
1
0
0
0
0
0
3473
142
0
30
110
3
0
0
0
0
0
3475
143
0
20
127
3
0
0
0
0
0
3487
144
0
23
123
3
0
0
0
0
0
3544
145
0
17
120
3
1
0
0
0
0
3572
146
0
19
105
3
0
0
0
0
0
3572
147
0
23
130
1
0
0
0
0
0
3586
148
0
36
175
1
0
0
0
0
0
3600
149
0
22
125
1
0
0
0
0
1
3614
150
0
24
133
1
0
0
0
0
0
3614
151
0
21
134
3
0
0
0
0
2
3629
152
0
19
235
1
1
0
1
0
0
3629
153
0
25
95
1
1
3
0
1
0
3637
154
0
16
135
1
1
0
0
0
0
3643
155
0
29
135
1
0
0
0
0
1
3651
156
0
29
154
1
0
0
0
0
1
3651
157
0
19
147
1
1
0
0
0
0
3651
158
0
19
147
1
1
0
0
0
0
3651
159
0
30
137
1
0
0
0
0
1
3699
160
0
24
110
1
0
0
0
0
1
3728
161
0
19
184
1
1
0
1
0
0
3756
162
0
24
110
3
0
1
0
0
0
3770
163
0
23
110
1
0
0
0
0
1
3770
164
0
20
120
3
0
0
0
0
0
3770
165
0
25
241
2
0
0
1
0
0
3790
166
0
30
112
1
0
0
0
0
1
3799
211
SUTANTO PRIYO HASTONO: Analisis Data 167
0
22
169
1
0
0
0
0
0
3827
168
0
18
120
1
1
0
0
0
2
3856
169
0
16
170
2
0
0
0
0
4
3860
170
0
32
186
1
0
0
0
0
2
3860
171
0
18
120
3
0
0
0
0
1
3884
172
0
29
130
1
1
0
0
0
2
3884
173
0
33
117
1
0
0
0
1
1
3912
174
0
20
170
1
1
0
0
0
0
3940
175
0
28
134
3
0
0
0
0
1
3941
176
0
14
135
1
0
0
0
0
0
3941
177
0
28
130
3
0
0
0
0
0
3969
178
0
25
120
1
0
0
0
0
2
3983
179
0
16
95
3
0
0
0
0
1
3997
180
0
20
158
1
0
0
0
0
1
3997
181
0
26
160
3
0
0
0
0
0
4054
182
0
21
115
1
0
0
0
0
1
4054
183
0
22
129
1
0
0
0
0
0
4111
184
0
25
130
1
0
0
0
0
2
4153
185
0
31
120
1
0
0
0
0
2
4167
186
0
35
170
1
0
1
0
0
1
4174
187
0
19
120
1
1
0
0
0
0
4238
188
0
24
116
1
0
0
0
0
1
4593
189
0
45
123
1
0
0
0
0
1
4990
212