SMQ 5033
APPLIED STATISTICS & COMPUTER APPLICATION TUGASAN KUMPULAN 1 TAJUK : PENGENALAN STATISTIK
PENSYARAH :
DR. ARSAYTHAMBY A/L VELOO Nama ahli kumpulan : HJ HASAN BIN MAT (800477) HJ YAHYA BIN ISMAIL (800945) HJ ABD WAHAB BIN AHMAD (800917) ABDUL LATIF BIN HAT (800918) MOHAMAD AMRAN BIN ISMAIL (800934)
Program: Master Sains Kaunseling
Pengenalan kepada Statistik : 1.1
Apakah Statistik? Perkataan statistik mempunyai berbagai makna di dalam budaya kita. Webster’s
Third New International Dictionary memberikan definasi statistik yang komprehensif sebagai “sains yang berurusan dengan pungutan, analisis, tafsiran dan persembahan data numerik”. Statistik juga merupakan satu cabang matematik, dan banyak daripada sains statistik berdasarkan kepada pemikiran matematik, dan terbitannya. Kepada ahliahli statistik, statistik merupakan satu bidang matematik yang menghasilkan teori dan kaedah untuk menganalisis data. Kesimpulannya, statistik bererti satu set teori dan kaedah yang boleh digunakan untuk memahami data. Banyak daripada bidang-bidang akademik, termasuk perniagaan, menawarkan kursus statistik di dalam disiplinnya. Walau bagaimanapun, statistik telah menjadi satu bidang pengajian. Kepada orang ramai, statistik bermaksud “angka” yang direkodkan mengikut kategori tertentu”. Contohnya, statistik kemalangan jalan raya memberikan kita maklumat tentang kemalangan jalan raya, yang pecahkan kepada beberapa kategori, seperti maut, cedera parah, cedera ringan dan sebagainya. Jabatan Kaji
Cuaca,
misalnya, memberikan statistik hujan/ ramalan hujan setiap bulan. Pihak sekolah pula memberikan statistik pencapaian pelajar, misalnya, bilangan pelajar yang mendapat gred tertentu dalam peperiksaan SPM. Kepada mereka yang menjalankan kajian pula, statistik merupakan kaedah yang boleh digunakan untuk menganalisis data kajian. Dalam bidang pendidikan, statistik boleh diguna untuk menyampaikan maklumat dalam pelbagai situasi
seperti contoh yang diberikan, statistik boleh diguna untuk
menunjukkan taburan pelajar mengikut pencapaian. Maklumat ini boleh dibentangkan dengan menggunakan jadual atau grafik seperti histogram/carta pai. Seterusnya, jika seseorang penyelidik ingin melihat hubungan antara dua pembolehubah, contohnya 2
antara lama masa belajar dengan pencapaian, kaedah statistik kolerasi boleh digunakan untuk mengira kekuatan hubungan ini. Statistik juga boleh digunakan untuk menguji hipotesis tertentu, misalnya menguji sama ada wujud hubungan antara lama masa belajar dengan pencapaian. Selain menguji hubungan, kaedah statistik boleh digunakan untuk menguji perbezaan antara dua min atau lebih, iaitu dengan menggunakan ujian-t atau ANOVA.
3
Menyampaikan maklumat
Menguji hipotesis tertentu
KEGUNAAN STATISTIK
Hubungan antara dua pembolehubah
Perbezaan antara dua min atau lebih
KEGUNAAN STATISTIK
4
Seterusnya, penyelidik memerlukan pengetahuan statistik untuk merekabentuk (design) sesuatu penyelidikan, seperti merekabentuk eksperimen, dan menentukan kaedah analisis data yang sesuai untuk sesuatu rekabentuk. Pengetahuan statistik juga dapat digunakan oleh guru untuk memahami kajian-kajian yang ditulis dalam bentuk empirikal. Dalam bidang pengukuran pula, kaedah statistik digunakan untuk mengira indeks kebolehpercayaan, indeks keesahan atau indeks keesahan ramalan. Terdapat dua jenis statistik yang digunakan dalam bidang pendidikan, iaitu statistik deskriptif yang digunakan untuk menjelaskan sesuatu ukuran (seperti min dan bidang sisihan piawai); dan statistik inferensi yang digunakan untuk menguji hipotesis. Pernyataan statistik adalah digunakan sekurang-kurangnya di dalam dua cara yang penting. Pertama, statistik boleh merupakan pengukuran inferensi yang dikira daripada sampel dan digunakan untuk membuat penerangan terhadap populasi. Kedua, statistik merupakan taburan yang digunakan di dalam analisis data. Berikut merupakan beberapa penggunaan yang biasa bagi perkataan statistik: a.
Sains yang memungut, menganalisis, mentafsir dan mempersembahkan data.
b.
Cabang metematik
c.
Kursus pengajian
d.
Kenyataan dan angka
e.
Pengukuran yang diambil dari sampel
f.
Jenis taburan yang digunakan untuk menganalisis data.
5
1.2
Statistik Inferensi dan Deskriptif: Statistik dikategorikan kepada dua: i)
Statistik Deskriptif : Ia merupakan statistic yang digunakan untuk menghuraikan ciri-ciri variabel . Statistik deskriptif menggunakan petunjuk-petunjuk seperti min, sisihan piawai, median, mod, taburan norma dan skor-z, untuk menyatakan ciri-ciri sesuatu variable.
ii)
Statistik Inferensi Statistik Inferensi, digunakan untuk membuat generalisasi keputusan ujian yang diperoleh daripada sample kajian populasi kajian. Melalui data yang dipungut daripada sample pengkaji menggunakan statistic inferensi untuk membuat kesimpulan tentang ciri-ciri populasi berdasarkan ciri-ciri sample. Statistik inferensi ujian-ujian seperti ujian Khi Kuasa Dua, ujian-T, ujian ANOVA, ujian korelasi Pearson untuk menunjukkan perhubungan antara variable-variable. Untuk memahami perbezaan di antara statistik inferensi dan deskriptif,
definisi populasi dan sampel adalah amat berguna.
Populasi didefinisikan
sebagai pungutan manusia, objek, atau item yang diminati. meluas
menerangkan
kategori
seperti
“semua
Populasi secara
kenderaan”,
atau
boleh
menerangkan secara terperinci sebagai “semua kereta Proton yang dikeluarkan pada tahun 2000”. Populasi boleh juga sebagai kumpulan manusia.
Apabila penyelidik
memungut data dari seluruh populasi bagi sesuatu ukuran yang diminati, ia dipanggil sebagai “bancian”. Sampel adalah sebahagian daripada keseluruhan, jika ia diambil dengan sempurna, ia mewakili keseluruhan.
6
Ukuran inferensi bagi populasi dipanggil sebagai parameter. Parameter biasanya ditandakan menggunakan huruf Greek.
Contoh-contoh parameter
adalah purata populasi (µ), varian populasi (σ2), dan sisihan piawai populasi. Ukuran inferensi bagi sampel dipanggil statistik dan biasanya ditandakan dengan huruf roman. Contoh statistik adalah purata sampel ( X ), varian sampel (S2) dan sisihan piawai sampel (S). Pentadbiran berkaitan parameter adalah dibuat di bawah ketakpastian. Melainkan parameter adalah dikira secara terus daripada populasi, ahli-ahli statistik tidak mengetahui secara pasti sama ada penganggaran atau pentaabiran yang dibuat daripada sampel adalah benar atau tidak. Di dalam usaha untuk menganggar paras keyakinan di dalam proses menghasilkan keputusan, ahli-ahli statistik menggunakan pernyataan kebarangkalian.
7
STATISTIK DESKRIPTIF : Pengiraan Ukuran Memusat Seperti yang dijelaskan, terdapat tiga (3) ukuran memusat yang biasa digunakan, iaitu mod, median dan min seperti dalam Rajah 6.10. Kita akan menentukan/mengira mod, median dan min dengan menggunakan markah ujian mingguan sebagai contoh. Ukuran memusat
Pengiraan mod
Pengiraan median
Pengiraan min
Rajah : Pengiraan ukuran memusat
8
a. Pengiraan Mod Mod ialah skor yang mempunyai kekerapan paling tinggi, misalnya markah yang pelajar paling ramai memperolehinya. Mod mudah ditentukan sekiranya kita telah menyediakan taburan kekerapan skor/markah asal terlebih dahulu. b. Pengiraan median Median ialah skor tengah sesuatu set data/skor, misalnya markah tengah bagi set markah ujian mingguan.Sekiranya sesuatu set data mempunyai dua (2) angka tengah, media data ini ialah purata kedua-dua data tengah tersebut. Median mudah ditentukan sekiranya kita telah menyusun data daripada yang terendah hingga tertinggi atau sebaliknya. c. d. Pengiraan min Min ialah purata sesuatu set data/skor, misalnya markah purata bagi set markah ujian mingguan. Min mudah dikira, sekiranya bilangan data adalah kecil, tetapi agak susah dikira bagi data yang banyak. Bagaimanapun, kita boleh menggunakan komputer untuk mengira min bagi data yang banyak. Untuk mengira sendiri min, kita perlu menjumlahkan semua skor/markah dan kemudian dibahagikan dengan bilangan markah/pelajar. Dalam bentuk symbol matematik, min dikira seperti berikut : n
X = ∑ xi / n, i =1
9
Pengiraan Ukuran Serakan Seperti yang dijelaskan, terdapat tiga (3) ukuran serakan yang biasa digunakan, iaitu julat, varians dan sisihan piawai. Kita akan menentukan/mengira julat, varians dan sisihan piawai ini dengan menggunakan markah ujian mingguan sebagai contoh.
Pengiraan Ukuran Serakan
Pengiraan Julat
Sisihan Piawai
Rajah : Pengiraan ukuran serakan
10
Pengiraan Varians
a. Pengiraan Julat Julat ialah perbezaan skor yang tertinggi dengan yang terendah, misalnya perbezaan markah tertinggi dengan markah terendah pelajar. b. Pengiraan Varians dan Sisihan Piawai Varians (variance) ialah ukuran serakan yang mengambil kira semua data yang ada, berbeza daripada julat yang bergantung kepada dua (2) ukuran sahaja, iaitu yang terendah dan tertinggi. Varians agak sukar dikira sebab ia melibakan jumlah kuasadua (sum of square) bagi semua ukuran, iaitu kita perlu menjumlahkan kuasa-dua perbezaan setiap ukuran daripada min keseluruhan ukuran. Rumus untuk mengira varians ialah: n
2
Varians (s )
∑ [( x i =1
2
i
− x) ] /( n − 1) , di mana x ialah min keseluruhan data.
Sisihan piawai (standard deviation) adalah juga ukuran serakan ia amatlah berkait dengan varians, iaitu sisihan piawai adalah punca ganda-dua varians : Sisihan piawai (s) =
s2
Markah
Perbezaan
Kuasa dua
( xi )
( xi − x)
( xi − x) 2
2
(2 – 4.4) = -2.4
5.76
5
(5 – 4.4) = 0.6
0.36
4
(4 – 4.4) = -0.4
0.16
1
(1 – 4.4) = -3.4
11.56
6
(6 – 4.4) = 1.6
2.56
3
(3 – 4.4) = -1.4
1.96
7
(7 – 4.4) = 2.6
6.76
5
(5 – 4.4) = 0.6
0.36
4
(4 – 4.4) = -0.4
0.16
7 Min = 4.4
(7 – 4.4) = 2.6 Jumlah = 0
6.76 Jumlah=36.4
Jadual : Jumlah Kuasa-dua Perbezaan Markah daripada Min SKOR PIAWAI 11
Biasanya markah ujian/peperiksaan atau ukuran daripada inventori dberi tidak berasaskan kepada markah/skor penuh yang sama. Dengan demikian, kita akan menghadapi masalah apabila kita ingin membuat interprestasi/menilai markah/skor tersebut. Satu kaedah telah digunakan untuk menyeragamkan markah/skor supaya markah/skor ini mempunyai min dan sisihan piawai yang sama. Kaedah ini menghasilkan skor piawai, iaitu skor yang mempunyai min dan sisihan piawai yang tertentu. Skor piawai yang asas ialah skor-z (z-score), yang boleh dikira dengan mengguanakan rumus di bawah: Skor-z = Skor Mentah-Min Sisihan Piawai STATISTIK INFERENSI : 1.
Ujian T : Ciri-ciri ujian T : a.
Menganalisis antara dua kumpulan data selang atau nisbah
b.
Skala Data Selanjar yang merupakan skor-skor dan nilai-nilai yang kontinum
c.
Data kajian perlu bertaburan normal
d.
Subjek-subjek dalam sample harus dipilh daripada populasi secara rawak
Ujian T terbahagi kepada tiga: a.
One sample T Test: Ujian ini digunakan untuk membandingkan skor min sample dengan skor min populasi. Ujian ini digunakan apabila data yang dipungut memenuhi semua cirri ujian T seperti di atas.
12
b.
Paired Sample T Test: Ia digunakan apabila setiap individu dalam sample diukur dua kali dan kedua-dua data pengukuran digunakan unuk dibuat perbandingan. Independent Sample T Test :
c. I 2.
a digunakan untuk mengukur di antara dua kumpulan.
ANOVA: ANOVA adalah kaedah ujian hipotesis bagi mengenalpasti perbezaan min yang wujud dalam dua ataupun lebih sample ujian. Tujuan utama ANOVA adalah menentukan sama ada perbezaan sample disebabkan kesilapan proses sample ataupun kesan rawatan yang sistematik . Terdapat dua jenis ujian ANOVA, iaitu one way ANOVA, yang melibatkan satu variable bebas. Kedua, Two way ANOVA, melibatkan dua variable bebas.
3.
KORELASI : Korelasi merujuk kepada matlamat untuk melihat kaitan atau hubungan antara dua variable.
4.
REGRESI PELBAGAI : Digunakan
mengenalpasti perubahan dalam dua atau lebih factor (variable
bebas) yang meyumbang kepada perubahan dalam satu variable bersandar. 5.
KHI KUASA DUA : Terdapat dua jenis ujian khi kuasa dua iaitu : i)
Ujian Khi Kuasa Dua untuk kebagusan
ii)
Ujian Khi Kuasa Dua untuk kebebasan (test of homogeneity)
13
Penutup: Tajuk ini telah menjelaskan beberapa kaedah asas statistic yang boleh digunakan dalam bidang pengukuran dan penilaian terhadap kajian-kajian ilmiah. Satistik dapat membantu kita untuk merumuskan data yang banyak kepada bentuk lain yang mudah kita faham.
14
Rujukan : Azizi Yahya, Shahrin Hashim, Jamaludin Ramli, Yusof Boon, Abdul Rahim Hamdan (2006).
Menguasai
Penyelidikan
Dalam
Pendidikan.
Kuala
Lumpur,
PTS
Proffessional,. Mohd Nawi Ab. Rahman (1998). Asas Statistik. Serdang, Penerbit Universiti Pertanian Malaysia,. Yap Yee Khiong, Wan Chwee Seng, Ismail Abu Bakar (1985). Pengukuran Dan Penilaian dalam Pendidikan. Kuala Lumpur, Heinemann Asia,. Mohd Majid Konting (2000). Kaedah Penyelidikan Pendidikan. Kuala Lumpur, Percetakan Dewan Bahasa Dan Pusaka. Chua Yan Piaw (2006). Kaedah Dan Statistik Penyelidikan. The McGraw-Hill companies, Malaysia.
15