Random Variable

  • Uploaded by: catcher-in-the-mist
  • 0
  • 0
  • October 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Random Variable as PDF for free.

More details

  • Words: 1,545
  • Pages: 9
สรุปบทที่ 4-6

1

บทที่ 4 ตัวแปรสุมและการแจกแจงของตัวแปรสุม การแจกแจงความนาจะเปนของตัวแปรสุม (Probability distribution of random variable) p.d.f = probability density function ⇒ P(X=x) หรือ f(x) ตัวแปรสุมตอเนื่อง (continuous) 1. f(x) ≥ 0

ตัวแปรสุมไมตอ  เนื่อง (discrete) 1. P(X=x) ≥ 0 2.



∑ P(X = x) = 1

2.

∀x

∫ f(x)dx = 1

−∞

คาคาดหมาย (Expected Value) E(x) = ∑ xP(X = x) = ∑ xf(x) = ∫ xf(x)dx

คุณสมบัติ 1. E(aX+b) = aE(X) + b 2. E(X±Y) = E(X) ± E(Y) 3. E(XY) = E(X)E(Y)

เมื่อ X,Y เปนอิสระตอกัน

ความแปรปรวน (Variance) Var(X) = σ2X = E[X − E(X)]2 = E(X 2 ) − [E(X)]2 โดย E(X 2 ) = ∑ x 2P(X = x) = ∫ x 2 f(x)dx

คุณสมบัติ 1. Var(aX) = a2Var(X) 2. Var(X+b) = Var(X) 3. Var(aX+b) = a2Var(X) 4. Var(X±Y) = Var(X) + Var(Y) 5. Var(aX±bY) = a2Var(X) + b2Var(Y)

เมื่อ X,Y เปนอิสระตอกัน เมื่อ X,Y เปนอิสระตอกัน

การแจกแจงความนาจะเปนของตัวแปรสุม ไมตอเนื่อง 1. ฺBernoulli, X~Ber(p) 2. Binomial, X~B(n,p) 3. Hypergeometric, X~h(N,n,k) 4. Poisson, X~Poi(λ)

ตอเนื่อง 1. Normal, X~N(μ,σ2)

สรุปบทที่ 4-6

2

Bernoulli Distribution: X~Ber(p) P(X=x) = px(1-p)1-x เมื่อ x = 0,1 • • • • • •

ทดลอง 1 ครั้ง ผลที่ไดมี 2 ทางคือ X = 0 หรือ X = 1 โอกาสที่ X = 1 คือ p → P(X=1) = p โอกาสที่ X = 0 คือ 1-p → P(X=0) = 1-p E(X) = p Var(X) = p(1-p)

Binomial Distribution: X~B(n,p)

⎛n⎞ P(X = x) = ⎜ ⎟ p x (1 − p)n − x เมื่อ x = 0, 1, 2 …, n ⎝x⎠ • • • •

ทดลอง Bernoulli ซ้ํา ๆ n ครัง้ X = จํานวนครัง้ เกิดเหตุการณที่สนใจ E(X) = np Var(X) = np(1-p)

Hypergeometric Distribution: X~h(N,n,k) ⎛ k ⎞ ⎛N − k ⎞ ⎜ ⎟⎜ ⎟ x n − x⎠ P(X = x) = ⎝ ⎠ ⎝ ⎛N⎞ ⎜ ⎟ ⎝n⎠

• • • • • • Poisson Distribution: X~Poi(λ) P(X = x) =

• • • •

e −λ λ x เมื่อ x = 0, 1, 2. 3, … x!

λ = คาเฉลีย ่ เหตุการณที่เปนไปไดแบงออกเปน 2 พวก E(X) = λ Var(X) = λ

N = จํานวนทั้งหมด n = จํานวนทีส ่ ม ุ หยิบ k = จํานวนทีส ่ นใจทั้งหมด x = จํานวนที่สนใจทีส ่ ุมหยิบได nk E(X) = N k⎛ k ⎞⎛N − n⎞ Var(X) = n ⎜ 1 − ⎟ ⎜ N⎝ N ⎠ ⎝ N − 1 ⎟⎠

สรุปบทที่ 4-6

3

Normal Distribution: X~N(μ,σ2)

• • •

การแจกแจงแบบปกติ พ.ท. ใตกราฟรวม = 1 กราฟสมมาตร ที่กึ่งกลาง X = μ หรือ Z = 0 x−μ Z= σ เปดตาราง Z

• • •

f(x) =

1 σ 2π

e

1 ⎛ x −μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠

2

บทที่ 5 การสุม  ตัวอยางเบือ ้ งตนและการแจกแจงของคาสถิติ

คาพารามิเตอร

คาสถิติ

คาเฉลี่ยเลขคณิตของประชากร

คาเฉลี่ยเลขคณิตของตัวอยาง

N

μ=

∑x i =1

n

i

x=

N

คาความแปรปรวนของประชากร 2

σ =

i =1

N N

=

∑X i =1

N

2 i

i =1

n

n

2

s =

∑ (X i =1

=

∑X i =1

σ = σ2

− X)2

2 i

( )

−n X

2

n −1

⎛ n ⎞ n∑ X i2 − ⎜ ∑ X i ⎟ i =1 ⎝ i=1 ⎠ = n(n − 1) n

คาสวนเบีย ่ งเบนมาตรฐานของประชากร

i

n −1 n

− μ2

i

คาความแปรปรวนของตัวอยาง

N

∑ (Xi − μ)2

∑x

2

คาสวนเบีย ่ งเบนมาตรฐานของตัวอยาง s = s2

สรุปบทที่ 4-6

4

การสํารวจขอมูลทางสถิติ • การสํามะโน (Census) • การสํารวจดวยตัวอยาง (Sample survey) วิธก ี ารสุมตัวอยาง (Random sampling) • การสุมตัวอยางแบบงาย • การสุมตัวอยางแบบเปนระบบ, i = N/n เมื่อ N = จํานวนประชากร n = จํานวนตัวอยาง i = ความกวางชวงในการสุม • การสุมตัวอยางแบบชั้นภูมิ • การสุมตัวอยางแบบแบงกลุม • การสุมตัวอยางแบบหลายชั้น การแจกแจงคาสถิติ • คาสถิตท ิ ี่ไดจากการสุมตัวอยางเปนตัวแปรสุม การแจกแจงคา X ของตัวอยาง



ประชากรแจกแจงแบบปกติและรูค  า σ2

สุมแบบคืนที่ (ไมรูคา  N) 1. E(X) = μ X = μ

2. Var(X) = σ2X =

3. σ X =

สุมแบบไมคืนที่ (รูคา  N) 1. E(X) = μ X = μ

σ2 n

2. Var(X) = σ2X =

σ

3. σ X =

n

Z=

σ

σ2 ⎛ N − n ⎞ n ⎜⎝ N − 1 ⎟⎠

N−n N −1

n

X−μ σ

n



ประชากรแจกแจงแบบไมปกติ รูคา  σ2 และ n > 30 (Central limit theorem) o ใหประมาณคาเทากับแจกแจงแบบปกติ



ประชากรแจกแจงปกติแตไมรู σ2 และ n ≥ 30 o



คิดแบบแจกแจงปกติโดยใช s แทน σ ดังนั้น Z =

ประชากรแจกแจงปกติแตไมรู σ2 และ n < 30 o t-distribution o degree of freedom = n-1 X−μ o Tα ,n −1 = s n o เปดตาราง t

X−μ s

n

สรุปบทที่ 4-6

5

การแจกแจงของสัดสวน (p) ตัวอยาง ประชากรสนใจ = สัดสวนประชากร (Population proportion) n ต.ย.สนใจ = สัดสวนของตัวอยาง (Sample proportion) p= N π=



p แจกแจงแบบปกติ p ~ N(μp , σp2 ) = N(π,



Z=

π(1 − π) ) n

p−π π(1 − π) n

การแจกแจง s2 ของตัวอยาง

• • • • •

ประชากรแจกแจงแบบปกติ s2 จะได แจกแจงลักษณะเบขวา ใช Chi-Square distribution Degree of freedom = n-1 เปดตาราง χ2 (n − 1)s 2 χ2 = σ2

บทที่ 6 การประมาณคาและการทดสอบสมมติฐาน การอนุมานทางสถิติ

1. การประมาณคา (Estimation) 2. การทดสอบสมมติฐาน (Test of Hypothesis)

การประมาณคาพารามิเตอรของประชากรกลุมเดียว

1. แบบจุด (Point Estimation) • μX •

πp

• σ2  s 2 2. แบบชวง (Interval Estimation) คุณสมบัตบ ิ างประการของตัวประมาณคาทีด ่ ี 1. ความไมเอนเอียง (Unbiasedness) • ˆ θ เปนตัวประมาณคาแบบจุดของ θ • E(ˆ θ) = θ

2. ความมีประสิทธิภาพ (Efficiency) • ˆ θ1 , ˆ θ2 เปนตัวประมาณคาไมเอนเอียงของ θ •

ถา Var(ˆ θ1 ) < Var(ˆ θ2 ) แลว ˆ θ1 มีประสิทธิภาพมากกวา ˆ θ2

θ1 วา “ตัวประมาณคาที่ไมเอนเอียงและมีความแปรปรวนต่าํ สุด” (MVUE) • เรียก ˆ 3. ความสอดคลอง (Consistency) lim E X = μ •

( ) lim Var ( X ) = 0

n →∞



n →∞

สรุปบทที่ 4-6

6

การประมาณคาแบบชวงของพารามิเตอรของประชากรกลุมเดียว การหาขอบเขตที่เชื่อมั่นไดของคาเฉลี่ยประชากรกลุมเดียว (μ) แบงเปน 3 กรณี

α คือ ความนาจะเปนของความคลาดเคลื่อน (1-α)100% คือ ขอบเขตที่เชื่อมั่นได



รูคา σ2 σ

X ± Zα

n

2



ไมรู σ2 และ n ≥ 30 s X ± Zα n 2



ไมรู σ2 และ n < 30 (ใชการกระจาย t, degree of freedom = n-1) s X ± tα ,n −1 n 2

การประมาณคาแบบชวงของพารามิเตอรของประชากรกลุมเดียว การหาขอบเขตที่เชื่อมั่นไดของความแปรปรวนประชากรกลุมเดียว (σ2)

( n − 1) s 2 χ2 α 2

< σ2 <

χ2 α 2

,n −1

χ2

α 1 − ,n −1 2

,n −1

( n − 1) s 2

( n − 1) s 2

<σ<

( n − 1) s 2 χ2

α 1 − ,n −1 2

สรุปบทที่ 4-6

7

การประมาณคาแบบชวงของพารามิเตอรของประชากรกลุมเดียว การหาขอบเขตที่เชื่อมั่นไดของคาสัดสวนประชากรกลุมเดียว (π) π(1 − π) ) n



ถา n มีขนาดใหญ p ~ N(μp , σp2 ) = N(π,



ขอบเขตที่เชื่อมั่นได (1-α)100% ของ π คือ p ± Z α 2

p(1 − p) n

การกําหนดขนาดตัวอยาง • การกําหนดขนาดตัวอยางในการประมาณคาเฉลี่ยประชากร (μ) 2

2

⎛ Zαs ⎞ ⎛ Zασ ⎞ ⎜ ⎟ ⎜ 2 ⎟ n≥⎜ หรือ n ≥ ⎜ 2 ⎟ เมื่อ e แทนความคลาดเคลื่อนในการประมาณคา ⎟ ⎜ e ⎟ ⎜ e ⎟ ⎝ ⎠ ⎝ ⎠



การกําหนดขนาดตัวอยางในการประมาณคาสัดสวนประชากร (π) ⎛ Zα ⎜ n≥⎜ 2 ⎜ e ⎝

2

⎞ ⎟ ⎟ p(1 − p) ⎟ ⎠

การทดสอบสมมติฐานเกี่ยวกับพารามิเตอรของประชากรกลุมเดียว

สมมติฐาน

1. สมมติฐานหลัก หรือ สมมติฐานวาง (Null Hypothesis), H0 2. สมมติฐานเลือก หรือ สมมติฐานแยง (Alternative Hypothesis), H1, Ha

ขอสังเกต • H0 คือ สมมติฐานที่ตองการทดสอบ ตองมีเครื่องหมาย “=” เสมอ • H0 กับ H1 เปนดานตรงขามของกันและกัน • สมมติฐานจึงมี 3 รูปแบบ แบบที่ 1

แบบที่ 2

แบบที่ 3

H0 : θ ≤ θ0

H0 : θ ≥ θ0

H0 : θ = θ0

H1 : θ > θ0

H1 : θ < θ0

H1 : θ ≠ θ0

เมื่อ θ = พารามิเตอรทต ี่ องการทดสอบ θ0 = คาคงทีท ่ ต ี่ องการทดสอบ

สรุปบทที่ 4-6

8

ประเภทของการทดสอบสมมติฐาน 1. การทดสอบแบบหางเดียว (One-tailed test) • ขนาดของบริเวณวิกฤตมีคา เทากับ α (ระดับนัยสําคัญ) • บริเวณวิกฤตจะอยูที่หางดานใดดานหนึ่งเพียงดานเดียว

หางเดียวทางขวา คือ H1 : θ > θ0 • บริเวณวิกฤตอยูที่ปลายทางดานขวา

หางเดียวทางซาย คือ H1 : θ < θ0 • บริเวณวิกฤตอยูที่ปลายทางดานซาย

2. การทดสอบแบบสองหาก (Two-tailed test) • บริเวณวิกฤตจะอยูที่หางทั้ง 2 ดาน • H1 : θ ≠ θ0

หลักการ • ถาคาสถิตท ิ ี่คํานวณตกอยูในบริเวณวิกฤต → ไมยอมรับ H0 การทดสอบสมมติฐานเกี่ยวกับคาเฉลี่ยของประชากรกลุมเดียว (μ) แบงออกได 3 กรณี • รูคา σ2 X − μ0 Z cal = σ n 2 • ไมรู σ และ n ≥ 30 X − μ0 Z cal = s n สมมติฐานเลือก H1 H1 : μ > μ0 H1 : μ < μ0 H1 : μ ≠ μ0

บริเวณวิกฤต Z cal > Z α Z cal < −Z α Z cal > Z α หรือ Z cal < −Z α 2



2

ไมรู σ2 และ n < 30 (ใชการแจกแจง t) X − μ0 t cal = s n

สมมติฐานเลือก H1 H1 : μ > μ0 H1 : μ < μ0 H1 : μ ≠ μ0

บริเวณวิกฤต t cal > t α ,n −1

t cal < −t α ,n −1 t cal > t α 2

,n −1

หรือ t cal < −t α 2

,n −1

สรุปบทที่ 4-6

9

การทดสอบสมมติฐานเกี่ยวกับคาความแปรปรวนของประชากรกลุม  เดียว (σ2)



χ2cal =

(n − 1)s 2 σ20

สมมติฐานเลือก H1 H1 : σ2 > σ20

บริเวณวิกฤต χ2cal > χ2α ,n−1

H1 : σ2 < σ20

χ2cal < χ12−α ,n−1

H1 : σ2 ≠ σ20

χ2cal > χ2α 2

,n −1

หรือ χ2cal < χ2

α 1 − ,n −1 2

การทดสอบสมมติฐานเกี่ยวกับคาสัดสวนของประชากรกลุมเดียว (π)



Z cal =

p − π0 π0 (1 − π0 ) n

สมมติฐานเลือก H1 H1 : π > π0 H1 : π < π0 H1 : π ≠ π0

บริเวณวิกฤต Z cal > Z α Z cal < −Z α Z cal > Z α หรือ Z cal < −Z α 2

2

ความคลาดเคลื่อนในการทดสอบสมมติฐาน 1. Type I error • α = P(ปฏิเสธ H0| H0 เปนจริง) 2. Type II error • β = P(ยอมรับ H0| H0 เปนเท็จ) • 1-β = P(ปฏิเสธ H0| H0 เปนเท็จ) = อํานาจการทดสอบ (Power of the test)

ความเปนจริง

การตัดสินใจ ยอมรับ H0 ปฏิเสธ H0

H0 เปนจริง การตัดสินใจถูกตอง α

H0 เปนเท็จ β การตัดสินใจถูกตอง

Related Documents

Random Variable
October 2019 38
Random Variable
May 2020 16
Random
December 2019 55
Variable
June 2020 27
Variable
November 2019 47