Suryo Guritno
ESTIMASI Salah satu bentuk inferensi statistika (pengambilan kesimpulan) terhadap parameter populasi adalah estimasi. Dalam estimasi yang dilakukan adalah menduga/memperkirakan parameter dengan penduga yang sesuai (“terbaik”). Misalnya : populasi
sampel
mean
µ
x
peny. std
σ
variansi
σ2
s s2
proporsi
p
ESTIMASI
INTERVAL TITIK
x n
Estimasi titik adalah statistik yang sesuai (“baik”) untuk menduga/memperkirakan/mengestimasi parameter Misalnya : parameter statistik/penduga / estimasi mean
µ
x
variansi
σ2
s2
dev.std
σ
s
p
x n
beda mean
µ1- µ2
x1 − x 2
beda proporsi
p1-p2
perbandingan variansi
2 σ 1 2 σ 2
proporsi
x1 x 2 − n1 n 2 s12 s2 2
Estimasi Interval adalah suatu interval tertentu yang memuat parameter dengan probabilitas/keyakinan cukup besar dan ditentukan oleh statistik yang sesuai untuk parameter * Interval yang diharapkan adalah yang terpendek * Misalkan X1, X2, …, Xn adalah sampel random yang diambil dari populasi dengan parameter θ. Interval yang akan dicari adalah a ≤ θ ≤ b dengan
P(a ≤ θ ≤ b) = 1 - α
interval konfidensi (1 – α)
tingkat konfidensi / keyakinan dipilih →100%
a,b harganya ditentukan oleh
biasanya 90%, 95%, 99%
X1, X2, …, Xn
0 < α < 1, α → 0%
dibedakan dua macam estimasi interval, yaitu : * Untuk sampel besar (n ≥ 30) * Untuk sampel kecil (lebih dikenal sebagai estimasi interval untuk parameter populasi dengan /berdistribusi tertentu) ESTIMASI INTERVAL SAMPEL BESAR * Estimasi interval untuk µ (n ≥ 30) Penduga terbaik untuk µ adalah X
X berdistribusi normal dengan µx = µ
dan
2 σ σ2x = n
Interval yang dicari adalah a ≤ µ ≤ b dengan P(a ≤ µ ≤ b) = 1 - α a,b tertentu oleh X1, X2, …, Xn dalam hal ini X
1 =n
(X1 + X2 + … + Xn)
atau
σx =
σ n
c
45 %
µ
50% ←c
50 %
45% µ
47,5% c
x d→
d
x
d
x
47,5% µ
diketahui/dapat dicari interval c ≤ X ≤ d terpendek yang
P(c ≤ X ≤ d) = 95% yaitu
µ
c
d
Jarak µ x ke c harus sama dengan jarak µ x ke d
x
dengan transformasi X − µx σx normal standar z=
X normal biasa
mean = 0 variansi = 1
P(-zo ≤ z ≤ zo) = 95% dari tabel normal -zo
0
zo
zo = 1,96
JADI : P(-1,96 ≤ z ≤ 1,96) = 95% x −µ P(-1,96 ≤ σ ≤ 1,96) = 95% n
P(
x -1,96 . σ ≤ µ ≤ x + 1,96 . σ ) = 95% n
n
Interval konfidensi 95% untuk µ adalah : (n ≥ 30)
x -1,96 . σ
n
≤ µ ≤
x+ 1,96 . σ
n
(1)
jika σ tidak diketahui, diganti dengan s yaitu penyimpangan standar sampel.
Untuk n cukup besar , hampir semua distribusi sampling harga statistik berdistribusi mendekati normal. Dalam hal ini x , s dan X n berdistribusi normal. Apabila anda perhatikan dengan cermat rumus (1), dengan langkah yang sama akan dapat dicari interval konfidensi (1 - α) untuk σ ataupun p. Perhatikan rumus (1) kembali
μ
adalah
parameter yang akan diestimasi
(= P)
X
adalah
(= s)
σ n
Statistik yang digunakan untuk mengestimasi µ
adalah
Penyimpangan standar distribusi sampling harga statistik (dalam hal ini X )
1,96 adalah
(= σ s )
angka dari tabel normal yang sesuai dengan tingkat keyakinan 95% karena X berdistribusi normal
Dengan demikian, jika ukuran sampel cukup besar, tabel berikut dapat digunakan untuk mencari interval konfidensi (1-α) untuk parameter yang dikehendaki Parameter
Statistik
(=P)
(=s)
1
μ
X
2
σ
s
3
p
4
μ1 - μ 2
5
p1 − p 2
σ1 − σ 2
s
σ n σ 2n x x 1 − n n n
X n
σ12 σ 22 − n1 n2
X1 − X 2 X1 n1
6
Peny. Std. Dist. Samp. Harga (= stat σ)
−
X2 n2
s1 − s 2
x1 n1
x1 1 −n 1 n1
x2 n + 2
σ12 σ2 + 2 2n 1 2n 2
x2 1 −n 2 n2
Ket.
Kalau interval konfidensi (1-α) untuk P adalah S − z α .σs ≤ P ≤ S + z α.σs 2
2
Dengan z α adalah harga yang sesuai dengan (1-α) dari tabel distribusi 2
Normal (1,96=z.025 sesuai dengan 95%). maka interval konfidensi 90% untuk σ adalah s – z.05 . σ ≤ σ ≤ s + z.05 . σ 2n 2n s s ≤σ≤ z z 1 + .05 1 + .05 2n 2n
dan Interval konfidensi 90% untuk σ 2 adalah 2
s s ≤ σ2 ≤ z.05 z.05 1+ 1+ 2 n 2 n
2
Estimasi parameter jika sampel berukuran kecil sangat bergantung pada distribusi populasi dan juga parameter yang akan diestimasi Sebagai contoh, untuk ,mengestimasi µ, σ , µ1- µ2 , 2
σ12 σ22
populasi harus berdistribusi normal, tetapi estimasi untuk µ atau µ1- µ2 ditentukan oleh
distribusi
t
σ2 atau µ1- µ2 ditentukan oleh
distribusi
χ2
σ12 σ22
distribusi
F
atau µ1- µ2 ditentukan oleh
Untuk mengestimasi p tidak diperlukan asumsi populasi berdistribusi normal. Estimasi dapat dilakukan menggunakan distribusi binomial.
ESTIMASI INTERVAL SAMPEL DARI POPULASI NORMAL Interval konfidensi (1-α) untuk µ adalah : jika σ diketahui : X − zα . 2
σ σ ≤ µ ≤ X + zα . n n 2
σ2 karena X ~ N µ, n
jika σ tidak diketahui : X − tα 2
tα 2
= persentil
; ( n −1)
.
s s ≤ µ ≤ X + tα . ; ( n −1) n n 2
α 1 − 2
untuk distribusi t dengan
derajat bebas (n-1) (dicari dengan tabel t) X−µ karena : s n
~ tn-1 distribusi t dengan der. bebas (n-
Interval konfidensi (1-α) untuk µ1-µ2 adalah : jika σ1 dan σ2 diketahui : σ 12 σ 22 σ 12 σ 22 ( x1 − x 2 ) − z α . + ≤ µ 1 − µ 2 ≤ ( x1 − x 2 ) + z α . + n1 n 2 n1 n 2 2 2
karena :
x1 − x 2
~ N( µ x − x , σ x − x 2
1
2
1
2
)
µ x1 − x 2 = µ 1 − µ 2 σ x1 − x 2
σ 12 σ 22 = + n1 n 2
jika σ1 dan σ2 tidak diketahui : σ1 diganti s1 dan σ2 diganti s2 jika σ1 = σ2 = σ , σ diganti sp dengan sp =
sehingga
( n1 − 1) s12 + ( n 2 − 1) s 22 n1 + n 2 − 2
( x 1 − x 2 ) − t α ;( n + n − 2 ) . s p 2
1
2
1 1 + ≤ µ1 − µ 2 n1 n 2
≤ ( x1 − x 2 ) + t α 2
;( n1 + n 2 − 2 )
.sp
1 1 + n1 n 2
( x1 − x 2 ) − ( x1 − x 2 )
karena =
1 1 + n1 n 2
sp
~ tn +n 1
2
−2
, σ1 diganti s1 dan σ2 diganti s2
jika σ1 ≠ σ2
s12 s 22 s12 s 22 ( x 1 − x 2 ) − t α;γ . + ≤ µ1 − µ2 ≤ ( x 1 − x 2 ) + t α . + ;γ n n n n2 1 2 1 2 2
dengan ν=
s12 s 22 + n n 2 1 2
2
s12 s 22 n 1 + n2 n1 n2
karena :
2
( x1 − x 2 ) − ( µ 1 − µ 2 ) 2 1
2 2
s s + n1 n 2
~ tν
* Untuk estimasi σ2, digunakan s2 tetapi jika sampel berukuran kecil distribusi sampling harga-harga s2 tidak diketahui bentuknya. Jalan keluarnya usahakan transformasi ke variabel baru yang distribusinya sudah dikenal. * Jika populasi berdistribusi normal,
( n − 1) s 2 σ2
berdistribusi x2 dengan derajat bebas (n - 1)
* distribusi x2 dengan derajat bebas (n-1) adalah distribusi Gamma dengan
α=
n −1 dan β = 2 2
Sayangnya distribusi x2 bukan distribusi yang simetri, sehingga kriteria interval terpendek akan sulit untuk diperoleh.
α 2
α 2
(1-α) χ2
χ2α
α 1− ;( n −1) 2
2
;( n −1)
Sebagai pengganti interval terpendek, interval yang dikehendaki ditentukan oleh pembagian luas daerah di bawah kurva menjadi 3 bagian α α masing-masng dengan luas , (1-α) dan 2
sehingga dari
2
2 ( n − 1) s 2 2 =1− α P χ α ≤ ≤ χα 2 1− ; ( n −1) ; ( n −1) σ 2 2
didapat Interval konfidensi (1-α) untuk σ2 adalah
( n − 1) s 2 ≤ σ 2 ≤ ( n − 1) s 2 χ 2α
2
;( n − 1)
χ 2
α 1− ;( n − 1) 2
α 2
α 2
(1-α) χ2
χ2α
α 1− ;( n −1) 2
2
;( n −1)
2 2 ( ) n − 1 s 2 P χ α ≤ ≤ χ α = (1 − α ) 2 1− σ 2 2
( n − 1) s 2 χ
2 α 2
≤σ
2
( n − 1) s 2 ≤ χ 2
α 1− 2