Ilustrasi Data nilai ujian Statistik Dasar dari 15 mahasiswa Program Studi tertentu semester ganjil tahun 2008: 87 37 59 49 69 95 83 87 39 95 83 76 83 26 46
Statdas, Februari 2009
1.
Populasi dan Sampel
2. Statistik dan Statistika Berapa rata‐ rata nilai ujian?
3. Jenis‐jenis Observasi 4. Statistika Deskriptif •Sari Numerik •Penyajian Data
Statistika deskriptif
© 2008 by USP & UM ; last edited Feb’09
Apakah rata‐rata nilai tahun ini lebih baik daripada tahun lalu?
Seberapa menyebarnya kemampuan dari mahasiswa? Adakah mahasiswa yang perlu perhatian khusus?
Inferensi statistik
© 2008 by UM
Statistik dan Statistika
Jenis‐jenis Statistika 1. Statistika deskriptif: metode yang berkaitan
Statistik : nilai-nilai ukuran data yang mudah dimengerti. Contoh : statistik liga sepak bola Indonesia
dengan pengumpulan dan penyajian data. 2. Statistika inferensi: metode yang berkaitan dengan analisis sampel untuk penarikan kesimpulan tentang karakteristik populasi. (Pokok Bahasan/Bab 9-12)
Statistika : ilmu yang berkaitan dengan cara pengumpulan, pengolahan, analisis dan pernarikan kesimpulan atas data.
© 2008 by UM
2
3
© 2008 by UM
4
1
Populasi dan Sampel
Jenis‐jenis Observasi
Populasi
OBSERVASI / DATA
KUALITATIF
Sampel setiap obyek populasi memiliki kemungkinan/kesempatan yang p sama untuk terpilih
Nominal
Ordinal/Rank
Diskrit
Kontinu
Sampel Acak
hasil pengukuran atau pengamatan
Data
© 2008 by UM
5
Tidak mengenal urutan dan operasi aritmatika
Mengenal urutan dan operasi aritmatika
B h b Berhubungan d dengan ‘proses menghitung’, dan pengamatan atas himpunan terhitung.
Didasarkan pada suatu selang/interval sehingga meliputi semua bilangan riil
Warna batuan (abuabu, hitam, putih, coklat, dll), jenis kelamin , dll
Ukuran baju (S, M, L, XL), ukuran kepuasan (tidak suka sama sekali, tidak suka, biasa saja, suka, sangat suka)
Banyaknya pekerja yang dibutuhkan dalam suatu area pertambangan, jarak yang dilangkahi seseorang (bisa mundur, bisa maju) per 0,5 meter
Berat batuan, luas area pertambangan, jarak tempuh truk pengangkut, suhu, dll 6
© 2008 by UM
Karakteristik Distribusi
Statistika Deskriptif
1. PARAMETER DISTRIBUSI
Metode yang berkaitan dengan pengolahan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna.
Ukuran Pemusatan Ukuran Uk Penyebaran
2. BENTUK DISTRIBUSI
bentuk distribusi data © 2008 by UM
KUANTITATIF
7
Berpuncak Jamak
Berpuncak Tunggal
# modus > 1
# modus = 1
mean, median, modus, kuartil atas, kuartil bawah, dll Range, simpangan baku, variansi, jangkauan antar kuartil, dll
Kemencengan
skewness
Kelancipan
kurtosis
Simetris Menceng/skew Positif Menceng/skew Negatif
mean = median mean > median mean < median
© 2008 by UM
8
2
CONTOH KASUS
Ukuran Pemusatan Data
Berikut adalah data nilai ujian Statistik Dasar dari 15 mahasiswa Program g Studi tertentu. ((n = 15))
1. Mean (rata-rata)
1 x= n
87 37 59 49 69 95 83 87 39 95 83 76 83 26 46 x1 x2
x9
x12
x15
Data yang diurutkan:
x(9)
x(12)
i
i =1
Contoh : x1 + x2 + ... + x15 15 87 + 37 + ... + 46 = = 67, 60 15
x(15) maksimum
minimum
Adakah perbedaan dari penyajian kedua data di atas?
9
© 2008 by UM
26 37 39 46 49awal) 59 ) 69 76 8350% data (akhir 83 83 87 akhir) 87 95 50 % data (awal 50 % data ( 50% data ( ) 95 x(8)
3x
2x
© 2008 by UM
10
4. Kuartil 26 37 39 46 49 25 % 59 69 76 8325 % 83 83 87 87 95 95 25 % 25 %
2x
2. Median Nilai tengah yang membagi dua kelompok data sama banyak.
q1
q3
q2 = med
Kuartil bawah (q1) : q1 = x ⎛ n +1 ⎞
q1 = x⎛ 15+1 ⎞ = x(4) = 46
⎜ ⎟ ⎝ 4 ⎠
med = x(8) = 76
⎜ ⎟ ⎝ 4 ⎠
Kuartil tengah g (q2) : q2 = x⎛ 2(( n +1)) ⎞ = x⎛ n +1 ⎞ ⎜ ⎝
3. Modus Nilai yang paling sering muncul. mod = 83 © 2008 by UM
∑x
x=
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 x(1) x(2)
n
4
⎟ ⎠
⎜ ⎟ ⎝ 2 ⎠
q2 = x⎛ 15+1 ⎞ = x(8) = 76 ⎜ ⎟ ⎝ 2 ⎠
Kuartil atas (q3) : q3 = x⎛ 3( n +1) ⎞
11
© 2008 by UM
⎜ ⎝
4
⎟ ⎠
q3 = x⎛ 3(15+1) ⎞ = x(12) = 87 ⎜ ⎝
4
⎟ ⎠
12
3
5. Persentil
Ukuran Penyebaran Data
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 p25
p75
p50 = med
• Persentil ke-i :
1. Jangkauan data (Range) R = 95 – 26 = 69 R = datamax – datamin 2. Variansi
= x⎛ i ( n +1) ⎞
⎛ 1 n 1 ⎜ 2 s2 = x x − = ( ) ∑ i n − 1 i =1 n − 1 ⎜⎜ ⎝
⎜ ⎟ ⎝ 100 ⎠
• Persentil ke-50 : = x 50( n +1) = x n +1 ⎛ ⎞ ⎛ ⎞ ⎜ ⎝
100
⎟ ⎠
⎜ ⎟ ⎝ 2 ⎠
• Persentil ke-25 dan Persentil ke-75? kuartil bawah
kuartil atas 13
Data Pencilan Data yang nilainya berbeda jauh dari kelompok g lain. yang data y Bagaimana mendeteksi data pencilan ?? 1. Hitung dq
dq = 41
2. Hitung BBP = q1 – k.dq BBP = 46 – (1,5)(41) = -15,5 Pilih nilai k = 3/2 (tidak mutlak) 3. Hitung BAP = q3 + k.dq
BAP = 87 + (1,5)(41) = 148,5
4. Pencilan bawah < BBP
tidak ada pencilan bawah
5. Pencilan atas > BAP © 2008 by UM
2
⎞ ⎟ ⎟ ⎟ ⎠
s2 = 529,2571
JKXX
median
© 2008 by UM
⎛ n ⎞ ⎜ ∑ xi ⎟ n ⎝ i =1 ⎠ 2 x − ∑ i n i =1
tidak ada pencilan atas 15
3. Simpangan Baku (standard deviation) s = 529, 2571 = 23, 01 s = √s2 4. Jangkauan antar kuartil dq = q3 – q1 dq = q3 – q1 = 87 – 46 = 41
© 2008 by UM
SARI NUMERIK Count (banyak data, n) Sum (jumlah data) Average (rata-rata) Median (kuartil tengah) Mode (modus) Minimum Maximum Range Standard Deviation Variance Skewness Kurtosis 25th Percentile (persentil-25) 50th Percentile (persentil-50) 75th Percentile (persentil-75) Interquartile Range (dk) * Perhitungan dengan Mic. Excel © 2008 by UM
15 1014 67.6 76 83 26 95 69 23.01 529.2571 -0.50* -1.23* 46 76 87 41
14
mean < median
Menceng kiri
16
4
Penyajian Data
Pie Chart
1. 1 Pie Chart
9 9% 10%
2. Dot Plot 3. Histogram
23%
58%
4. Diagram Batang – Daun (stem ‐ leaf) 5. Diagram Kotak – Titik (box plot) 6.
y Pie Pi chart h t merupakan k grafik fik yang b berbentuk b t k li lingkaran k yang
dll… Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik. Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
© 2008 by UM
mana setiap potongannya mewakili proporsi atau persentase suatu komponen dari sebuah kelompok data (100%). y Pemakaian pie chart hanya cocok ketika menyatakan data dalam bentuk proporsi dari satu kelompok data. 17
© 2008 by UM
18
Histogram
Dot Plot 3.5 3
frekuensi
2.5 2 1.5 1 0.5 0 0
20
40
60
80
100
nilai
y Cara menggambarkan data dalam bentuk titik, dengan
memperhatikan frekuensi dari data yang bersangkutan y Titik ditumpuk diatas nilai data yang digambarkan. © 2008 by UM
y Histogram adalah gambar berdasarkan distribusi
frekuensi
y Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle). y Daerah setiap rectangle sebanding dengan frekuensinya.
19
© 2008 by UM
20
5
Diagram Batang-Daun (Stem-Leaf)
Diagram Kotak‐Titik (Box‐Plot) 100
max
95
90
85
80
q2
76
70
q3 mean
60 50
47.5
40 30
q1
min
26
20 10
y Stem atau batang, g mirip dengan g g grup data pada histogram, g
0
sedangkan leaf atau daun, mirip dengan frekuensi. y Stem atau batang adalah digit pertama yang terpenting yang ada dalam bilangan yang membentuk harga data, sedangkan digit di belakangnya akan merupakan leaf atau daun. y Melalui stem-Leaf masih dapat dilihat nilai data mentahnya. © 2008 by UM
21
menggunakan grup data seperti pada histogram dan diagram batang daun. y Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan datamax yang disusun secara terurut dengan membentuk kotak. 22 © 2008 by UM
Kelemahan dan Keunggulan
Pencilan pada Box Plot *
y Box B Plot Pl t di digunakan k untuk t k menyelidiki lidiki di distribusi t ib i ttanpa
KELEMAHAN DOT PLOT
pencilan atas
Tidak efektif untuk ukuran data yang besar Lama
max kedua q3 q2
HISTOGRAM
Nilai data tidak nampak
mean BATANG‐DAUN
min ketiga
© 2008 by UM
Nilai data asli dapat diperkirakan Nil i d li d di ki k Histogram peluang dapat memberi gambaran tentang distribusi populasi Tidak menuntut ketelitian dalam mencatat setiap nilai data Cepat
q1
* *
Banyak perhitungan
KEUNGGULAN Cepat
pencilan bawah BOX PLOT
23
© 2008 by UM
Tidak memerlukan perhitungan Menuntut ketelitian mencatat Nilai data asli dapat dilihat p daun Memudahkan perhitungan berbagai parameter Membutuhkan perhitungan yang panjang
Box plot dapat memberi gambaran tentang bentuk distribusi populasi
Terdiri dari parameter‐ parameter dari data yang sudah diurutkan
Efektif untuk membandingkan bentuk distribusi beberapa kelompok data sekaligus 24
6
Bentuk Distribusi Ideal Normal
Transformasi Data y Transformasi dilakukan untuk mendapatkan bentuk
distribusi yang lebih simetris. y Transformasi Tangga Tukey -1/x2 -1/x mean = median
untuk bentuk distribusi : skewness positif
Memiliki bentuk distribusi yang simetris, yaitu : Skewness = 0 Kurtosis = 3, (dalam software tertentu kurtosis normal = 0 © 2008 by UM
25
Transformasi Data Contoh Kasus x
y = x2
87 37 59 49 69 95 83 87 39 95 83 76 83 26 46
7569 9 1369 3481 2401 4761 9025 6889 7569 1521 9025 6889 5776 6889 676 2116
© 2008 by UM
transformasi
Lebih mendekati simetris (skew = 0) dibanding sebelum transformasi (skew = -0,5)
√x
log (x)
x
x2
data awal
x3
10x
untuk bentuk distribusi : skewness negatif
Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x2, x3, dan 10x. © 2008 by UM
26
Referensi y Djauhari, j M.A., 2001, Catatan Kuliah Analisis Data. y Devore, J.L. and Peck, R., Statistics – The Exploration and
Analysis of Data, USA: Duxbury Press, 1997.
y Walpole, Ronald E. dan Myers, Raymond H., Ilmu Peluang dan
skew = -0,18
** Ketika data ditransformasi, maka satuan dari data juga akan berubah 27
Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: Penerbit ITB, 1995. y Walpole, Ronald E. et.al, Probability and Statistics for Engineers and Scientist, 8th Ed., New Jersey: Pearson-Prentice Hall 2007. y Wild, C.J. and Seber, G.A.F., Chance Encounters – A first Course in Data Analysis and Inference, USA: John Wiley&Sons,Inc., 2000. y Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika. © 2008 by UM
28
7