สรุปบทที่ 4-6
1
บทที่ 4 ตัวแปรสุมและการแจกแจงของตัวแปรสุม การแจกแจงความนาจะเปนของตัวแปรสุม (Probability distribution of random variable) p.d.f = probability density function ⇒ P(X=x) หรือ f(x) ตัวแปรสุมตอเนื่อง (continuous) 1. f(x) ≥ 0
ตัวแปรสุมไมตอ เนื่อง (discrete) 1. P(X=x) ≥ 0 2.
∞
∑ P(X = x) = 1
2.
∀x
∫ f(x)dx = 1
−∞
คาคาดหมาย (Expected Value) E(x) = ∑ xP(X = x) = ∑ xf(x) = ∫ xf(x)dx
คุณสมบัติ 1. E(aX+b) = aE(X) + b 2. E(X±Y) = E(X) ± E(Y) 3. E(XY) = E(X)E(Y)
เมื่อ X,Y เปนอิสระตอกัน
ความแปรปรวน (Variance) Var(X) = σ2X = E[X − E(X)]2 = E(X 2 ) − [E(X)]2 โดย E(X 2 ) = ∑ x 2P(X = x) = ∫ x 2 f(x)dx
คุณสมบัติ 1. Var(aX) = a2Var(X) 2. Var(X+b) = Var(X) 3. Var(aX+b) = a2Var(X) 4. Var(X±Y) = Var(X) + Var(Y) 5. Var(aX±bY) = a2Var(X) + b2Var(Y)
เมื่อ X,Y เปนอิสระตอกัน เมื่อ X,Y เปนอิสระตอกัน
การแจกแจงความนาจะเปนของตัวแปรสุม ไมตอเนื่อง 1. ฺBernoulli, X~Ber(p) 2. Binomial, X~B(n,p) 3. Hypergeometric, X~h(N,n,k) 4. Poisson, X~Poi(λ)
ตอเนื่อง 1. Normal, X~N(μ,σ2)
สรุปบทที่ 4-6
2
Bernoulli Distribution: X~Ber(p) P(X=x) = px(1-p)1-x เมื่อ x = 0,1 • • • • • •
ทดลอง 1 ครั้ง ผลที่ไดมี 2 ทางคือ X = 0 หรือ X = 1 โอกาสที่ X = 1 คือ p → P(X=1) = p โอกาสที่ X = 0 คือ 1-p → P(X=0) = 1-p E(X) = p Var(X) = p(1-p)
Binomial Distribution: X~B(n,p)
⎛n⎞ P(X = x) = ⎜ ⎟ p x (1 − p)n − x เมื่อ x = 0, 1, 2 …, n ⎝x⎠ • • • •
ทดลอง Bernoulli ซ้ํา ๆ n ครัง้ X = จํานวนครัง้ เกิดเหตุการณที่สนใจ E(X) = np Var(X) = np(1-p)
Hypergeometric Distribution: X~h(N,n,k) ⎛ k ⎞ ⎛N − k ⎞ ⎜ ⎟⎜ ⎟ x n − x⎠ P(X = x) = ⎝ ⎠ ⎝ ⎛N⎞ ⎜ ⎟ ⎝n⎠
• • • • • • Poisson Distribution: X~Poi(λ) P(X = x) =
• • • •
e −λ λ x เมื่อ x = 0, 1, 2. 3, … x!
λ = คาเฉลีย ่ เหตุการณที่เปนไปไดแบงออกเปน 2 พวก E(X) = λ Var(X) = λ
N = จํานวนทั้งหมด n = จํานวนทีส ่ ม ุ หยิบ k = จํานวนทีส ่ นใจทั้งหมด x = จํานวนที่สนใจทีส ่ ุมหยิบได nk E(X) = N k⎛ k ⎞⎛N − n⎞ Var(X) = n ⎜ 1 − ⎟ ⎜ N⎝ N ⎠ ⎝ N − 1 ⎟⎠
สรุปบทที่ 4-6
3
Normal Distribution: X~N(μ,σ2)
• • •
การแจกแจงแบบปกติ พ.ท. ใตกราฟรวม = 1 กราฟสมมาตร ที่กึ่งกลาง X = μ หรือ Z = 0 x−μ Z= σ เปดตาราง Z
• • •
f(x) =
1 σ 2π
e
1 ⎛ x −μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠
2
บทที่ 5 การสุม ตัวอยางเบือ ้ งตนและการแจกแจงของคาสถิติ
คาพารามิเตอร
คาสถิติ
คาเฉลี่ยเลขคณิตของประชากร
คาเฉลี่ยเลขคณิตของตัวอยาง
N
μ=
∑x i =1
n
i
x=
N
คาความแปรปรวนของประชากร 2
σ =
i =1
N N
=
∑X i =1
N
2 i
i =1
n
n
2
s =
∑ (X i =1
=
∑X i =1
σ = σ2
− X)2
2 i
( )
−n X
2
n −1
⎛ n ⎞ n∑ X i2 − ⎜ ∑ X i ⎟ i =1 ⎝ i=1 ⎠ = n(n − 1) n
คาสวนเบีย ่ งเบนมาตรฐานของประชากร
i
n −1 n
− μ2
i
คาความแปรปรวนของตัวอยาง
N
∑ (Xi − μ)2
∑x
2
คาสวนเบีย ่ งเบนมาตรฐานของตัวอยาง s = s2
สรุปบทที่ 4-6
4
การสํารวจขอมูลทางสถิติ • การสํามะโน (Census) • การสํารวจดวยตัวอยาง (Sample survey) วิธก ี ารสุมตัวอยาง (Random sampling) • การสุมตัวอยางแบบงาย • การสุมตัวอยางแบบเปนระบบ, i = N/n เมื่อ N = จํานวนประชากร n = จํานวนตัวอยาง i = ความกวางชวงในการสุม • การสุมตัวอยางแบบชั้นภูมิ • การสุมตัวอยางแบบแบงกลุม • การสุมตัวอยางแบบหลายชั้น การแจกแจงคาสถิติ • คาสถิตท ิ ี่ไดจากการสุมตัวอยางเปนตัวแปรสุม การแจกแจงคา X ของตัวอยาง
•
ประชากรแจกแจงแบบปกติและรูค า σ2
สุมแบบคืนที่ (ไมรูคา N) 1. E(X) = μ X = μ
2. Var(X) = σ2X =
3. σ X =
สุมแบบไมคืนที่ (รูคา N) 1. E(X) = μ X = μ
σ2 n
2. Var(X) = σ2X =
σ
3. σ X =
n
Z=
σ
σ2 ⎛ N − n ⎞ n ⎜⎝ N − 1 ⎟⎠
N−n N −1
n
X−μ σ
n
•
ประชากรแจกแจงแบบไมปกติ รูคา σ2 และ n > 30 (Central limit theorem) o ใหประมาณคาเทากับแจกแจงแบบปกติ
•
ประชากรแจกแจงปกติแตไมรู σ2 และ n ≥ 30 o
•
คิดแบบแจกแจงปกติโดยใช s แทน σ ดังนั้น Z =
ประชากรแจกแจงปกติแตไมรู σ2 และ n < 30 o t-distribution o degree of freedom = n-1 X−μ o Tα ,n −1 = s n o เปดตาราง t
X−μ s
n
สรุปบทที่ 4-6
5
การแจกแจงของสัดสวน (p) ตัวอยาง ประชากรสนใจ = สัดสวนประชากร (Population proportion) n ต.ย.สนใจ = สัดสวนของตัวอยาง (Sample proportion) p= N π=
•
p แจกแจงแบบปกติ p ~ N(μp , σp2 ) = N(π,
•
Z=
π(1 − π) ) n
p−π π(1 − π) n
การแจกแจง s2 ของตัวอยาง
• • • • •
ประชากรแจกแจงแบบปกติ s2 จะได แจกแจงลักษณะเบขวา ใช Chi-Square distribution Degree of freedom = n-1 เปดตาราง χ2 (n − 1)s 2 χ2 = σ2
บทที่ 6 การประมาณคาและการทดสอบสมมติฐาน การอนุมานทางสถิติ
1. การประมาณคา (Estimation) 2. การทดสอบสมมติฐาน (Test of Hypothesis)
การประมาณคาพารามิเตอรของประชากรกลุมเดียว
1. แบบจุด (Point Estimation) • μX •
πp
• σ2 s 2 2. แบบชวง (Interval Estimation) คุณสมบัตบ ิ างประการของตัวประมาณคาทีด ่ ี 1. ความไมเอนเอียง (Unbiasedness) • ˆ θ เปนตัวประมาณคาแบบจุดของ θ • E(ˆ θ) = θ
2. ความมีประสิทธิภาพ (Efficiency) • ˆ θ1 , ˆ θ2 เปนตัวประมาณคาไมเอนเอียงของ θ •
ถา Var(ˆ θ1 ) < Var(ˆ θ2 ) แลว ˆ θ1 มีประสิทธิภาพมากกวา ˆ θ2
θ1 วา “ตัวประมาณคาที่ไมเอนเอียงและมีความแปรปรวนต่าํ สุด” (MVUE) • เรียก ˆ 3. ความสอดคลอง (Consistency) lim E X = μ •
( ) lim Var ( X ) = 0
n →∞
•
n →∞
สรุปบทที่ 4-6
6
การประมาณคาแบบชวงของพารามิเตอรของประชากรกลุมเดียว การหาขอบเขตที่เชื่อมั่นไดของคาเฉลี่ยประชากรกลุมเดียว (μ) แบงเปน 3 กรณี
α คือ ความนาจะเปนของความคลาดเคลื่อน (1-α)100% คือ ขอบเขตที่เชื่อมั่นได
•
รูคา σ2 σ
X ± Zα
n
2
•
ไมรู σ2 และ n ≥ 30 s X ± Zα n 2
•
ไมรู σ2 และ n < 30 (ใชการกระจาย t, degree of freedom = n-1) s X ± tα ,n −1 n 2
การประมาณคาแบบชวงของพารามิเตอรของประชากรกลุมเดียว การหาขอบเขตที่เชื่อมั่นไดของความแปรปรวนประชากรกลุมเดียว (σ2)
( n − 1) s 2 χ2 α 2
< σ2 <
χ2 α 2
,n −1
χ2
α 1 − ,n −1 2
,n −1
( n − 1) s 2
( n − 1) s 2
<σ<
( n − 1) s 2 χ2
α 1 − ,n −1 2
สรุปบทที่ 4-6
7
การประมาณคาแบบชวงของพารามิเตอรของประชากรกลุมเดียว การหาขอบเขตที่เชื่อมั่นไดของคาสัดสวนประชากรกลุมเดียว (π) π(1 − π) ) n
•
ถา n มีขนาดใหญ p ~ N(μp , σp2 ) = N(π,
•
ขอบเขตที่เชื่อมั่นได (1-α)100% ของ π คือ p ± Z α 2
p(1 − p) n
การกําหนดขนาดตัวอยาง • การกําหนดขนาดตัวอยางในการประมาณคาเฉลี่ยประชากร (μ) 2
2
⎛ Zαs ⎞ ⎛ Zασ ⎞ ⎜ ⎟ ⎜ 2 ⎟ n≥⎜ หรือ n ≥ ⎜ 2 ⎟ เมื่อ e แทนความคลาดเคลื่อนในการประมาณคา ⎟ ⎜ e ⎟ ⎜ e ⎟ ⎝ ⎠ ⎝ ⎠
•
การกําหนดขนาดตัวอยางในการประมาณคาสัดสวนประชากร (π) ⎛ Zα ⎜ n≥⎜ 2 ⎜ e ⎝
2
⎞ ⎟ ⎟ p(1 − p) ⎟ ⎠
การทดสอบสมมติฐานเกี่ยวกับพารามิเตอรของประชากรกลุมเดียว
สมมติฐาน
1. สมมติฐานหลัก หรือ สมมติฐานวาง (Null Hypothesis), H0 2. สมมติฐานเลือก หรือ สมมติฐานแยง (Alternative Hypothesis), H1, Ha
ขอสังเกต • H0 คือ สมมติฐานที่ตองการทดสอบ ตองมีเครื่องหมาย “=” เสมอ • H0 กับ H1 เปนดานตรงขามของกันและกัน • สมมติฐานจึงมี 3 รูปแบบ แบบที่ 1
แบบที่ 2
แบบที่ 3
H0 : θ ≤ θ0
H0 : θ ≥ θ0
H0 : θ = θ0
H1 : θ > θ0
H1 : θ < θ0
H1 : θ ≠ θ0
เมื่อ θ = พารามิเตอรทต ี่ องการทดสอบ θ0 = คาคงทีท ่ ต ี่ องการทดสอบ
สรุปบทที่ 4-6
8
ประเภทของการทดสอบสมมติฐาน 1. การทดสอบแบบหางเดียว (One-tailed test) • ขนาดของบริเวณวิกฤตมีคา เทากับ α (ระดับนัยสําคัญ) • บริเวณวิกฤตจะอยูที่หางดานใดดานหนึ่งเพียงดานเดียว
หางเดียวทางขวา คือ H1 : θ > θ0 • บริเวณวิกฤตอยูที่ปลายทางดานขวา
หางเดียวทางซาย คือ H1 : θ < θ0 • บริเวณวิกฤตอยูที่ปลายทางดานซาย
2. การทดสอบแบบสองหาก (Two-tailed test) • บริเวณวิกฤตจะอยูที่หางทั้ง 2 ดาน • H1 : θ ≠ θ0
หลักการ • ถาคาสถิตท ิ ี่คํานวณตกอยูในบริเวณวิกฤต → ไมยอมรับ H0 การทดสอบสมมติฐานเกี่ยวกับคาเฉลี่ยของประชากรกลุมเดียว (μ) แบงออกได 3 กรณี • รูคา σ2 X − μ0 Z cal = σ n 2 • ไมรู σ และ n ≥ 30 X − μ0 Z cal = s n สมมติฐานเลือก H1 H1 : μ > μ0 H1 : μ < μ0 H1 : μ ≠ μ0
บริเวณวิกฤต Z cal > Z α Z cal < −Z α Z cal > Z α หรือ Z cal < −Z α 2
•
2
ไมรู σ2 และ n < 30 (ใชการแจกแจง t) X − μ0 t cal = s n
สมมติฐานเลือก H1 H1 : μ > μ0 H1 : μ < μ0 H1 : μ ≠ μ0
บริเวณวิกฤต t cal > t α ,n −1
t cal < −t α ,n −1 t cal > t α 2
,n −1
หรือ t cal < −t α 2
,n −1
สรุปบทที่ 4-6
9
การทดสอบสมมติฐานเกี่ยวกับคาความแปรปรวนของประชากรกลุม เดียว (σ2)
•
χ2cal =
(n − 1)s 2 σ20
สมมติฐานเลือก H1 H1 : σ2 > σ20
บริเวณวิกฤต χ2cal > χ2α ,n−1
H1 : σ2 < σ20
χ2cal < χ12−α ,n−1
H1 : σ2 ≠ σ20
χ2cal > χ2α 2
,n −1
หรือ χ2cal < χ2
α 1 − ,n −1 2
การทดสอบสมมติฐานเกี่ยวกับคาสัดสวนของประชากรกลุมเดียว (π)
•
Z cal =
p − π0 π0 (1 − π0 ) n
สมมติฐานเลือก H1 H1 : π > π0 H1 : π < π0 H1 : π ≠ π0
บริเวณวิกฤต Z cal > Z α Z cal < −Z α Z cal > Z α หรือ Z cal < −Z α 2
2
ความคลาดเคลื่อนในการทดสอบสมมติฐาน 1. Type I error • α = P(ปฏิเสธ H0| H0 เปนจริง) 2. Type II error • β = P(ยอมรับ H0| H0 เปนเท็จ) • 1-β = P(ปฏิเสธ H0| H0 เปนเท็จ) = อํานาจการทดสอบ (Power of the test)
ความเปนจริง
การตัดสินใจ ยอมรับ H0 ปฏิเสธ H0
H0 เปนจริง การตัดสินใจถูกตอง α
H0 เปนเท็จ β การตัดสินใจถูกตอง