1
מכון לב
מבוא לסטטיסטיקה
מאת
ד"ר אלכסנדר קליין
2
מבוא :סולמות מדידה )1משתנה שמי :הערכים השונים הם מזהים בלבד ,ויתכן שלא יהיו מספרים אלא מלים בלבד .דוגמה :שמות של אנשים ,מספרי טלפון. )2משתנה סידורי :הערכים השונים הם מספריים ,והם מצביעים אך ורק על סדר מסויים .דוגמה :תוארים אקדמאיים (ראשון ,שני ,שלישי). )3משתנה רווחי :יש חשיבות לרווחים שבין שני ערכים שונים ,אבל לא לערכים עצמם .דוגמה :טמפרטורה. )4משתנה מנה :לערכים המספרים יש משמעות .דוגמה :גובה המשכורת.
פרק ראשון :הצגת נתונים בטבלאות ועקומות )1דוגמה מספרית :מדגם של 31יום ,הטמפרטורה בחודש אוגוסט בשעה :12.00 30,29,28,27,29,30,30,27,26,26,25,26,30,32,30,30,30,31,34,33,27,28,29,3 0,30,29,30,31,27,29,29 השאלה :איך לארגן ולהציג את הנתונים ,כך שנוציא מהם את המידע המרבי? )1הגדרות משתנה :גודל העשוי לקבל ערכים שונים .דוגמה :טמפרטורהבשעה 12.00באשקלון. שכיחות :כמות ערכים של משתנה הנמצאים בטווח נתון .דוגמה:השכיחות של הטמפרטורה 30היא .10מסמנים אותה על ידי )f(x .)(frequency ניתן להציג את התפלגות השכיחויות ,כדלהלן: )f(x 1 3 4 2 6 10 2 1 1 1
x 25 26 27 28 29 30 31 32 33 34
3
או תוך שימוש בנתונים מקובצים: x 26-25 28-27 30-29 32-31 34-33
)f(x 4 6 16 3 2
לשם כך ,יש להקפיד על שני תנאים הכרחיים: המחלקות חייבות להיות זרותהחלוקה חייבת להיות ממצהבבניית טבלת שכיחויות עלינו למצוא את שביל הזהב בין הקיבוץ המזערי ,בו ריבוי הפרטים מקשה עדיין על ההתרשמות ,לבין הקיבוץ המרבי ,בו ניטשטשו רוב הפרטים החשובים.
לכל מחלקה יש גבול עליון וגבול תחתוןגבולות מדומים :מדובר בגבולות מדומים כאשר הגבול העליון שלמחלקה איננו מתלכד עם הגבול התחתון של המחלקה שמתחתיה .אם זה כן מתלכד ,מדובר בגבולות אמיתיים. מטבלה בעלת גבולות מדומים ניתן לקבל טבלה בעלת גבולות אמיתיים ,על ידי חלוקת הרווח בין המחלקות לשניים. דוגמה: )f(x 4 6 16 3 2
x 26.5-24.5 28.5-26.5 30.5-28.5 32.5-30.5 34.5-30.5
אין סתירה לכלל הראשון ,כאשר הגבול המשותף איננו מופיע בנתונים. נקודת אמצע של מחלקה :ערך הממוצע בין הגבול העליון לבין הגבולהתחתון שלה .דוגמה 33.5 :עבור המחלקה העליונה. רוחב המחלקה :ההפרש בין גבול עליון אמיתי לבין גבול תחתון אמיתי.דוגמה.2 : בדרך כלל ,נהוג לקבוע רוחב אחיד לכל המחלקות ,אך אין זה הכרחי .דוגמה :מספר שעות שהסטודנטים מקדישים ללימודים כל שבוע:
4
x >9 12-9 16-13 20-17 <20
f(x 1 3 11 29 2
)2שכיחות יחסית ומצטברת )F ( x )f ( x ,שכיחות מצטברת . F ( x) = ∑ f (t ) :שכיחות יחסית מצטברת: שכיחות יחסית: t≤x n n
דוגמה: )F(x 4 10 26 29 31
F(x)/n 4/31 10/31 26/31 29/31 1
)f(x 4 6 16 3 2
f(x)/n 4/31 6/31 16/31 3/31 2/31
x 26.5-24.5 28.5-26.5 30.5-28.5 32.5-30.5 34.5-32.5
פלט :SPSS groupe d Cumulative Percent 12.9 32.3 83.9 93.5 100.0
Valid Percent 12.9 19.4 51.6 9.7 6.5 100.0
Percent 12.9 19.4 51.6 9.7 6.5 100.0
Frequency 4 6 16 3 2 31
25.5 27.5 29.5 31.5 33.5 Total
Valid
)3דיאגרמת מקלות ומצולע דיאגרמת מקלות הוא תרשים במערכת צירים ,בו הציר האופקי מייצגאת ציר המשתנה ( ,xלוקחים את אמצעי המחלקות) ,ואילו הציר האנכי מייצג את ציר השכיחויות ( )f(xאו שכיחות יחסית ,וכו').
5
20
15
t n u o10 C
5
0 31.5
33.5
27.5
29.5
25.5
grouped
-
מצולע מתקבל מדיאגרמת מקלות על ידי מתיחת קווים בין ראשיהמקלות השונים. דוגמה: 16
14
12
10
8
t n u o C
6
4
2 33.5
31.5
29.5
27.5
25.5
grouped
)2הסטוגרמה יש לעבור לגבולות אמיתיים כדי לבנות הסטוגרמה ,כדלהלן:
6
20
15
y c n e u q er10 F
5
Mean = 29.048 Std. Dev. = 2.0468 N = 31 0 34.0
32.0
30.0
28.0
26.0
grouped
אם רוחב המחלקה איננו אחיד ,גובה כל מלבן נקבע על ידי חילוק השכיחות ברוחב המחלקה. רוחב המלבן הוא בכל מקרה רוחב המחלקה. דוגמה: גובה 2 4 4 2
רוחב 1 3 2 1 3
xf(x 4-3 2 7-4 12 9-7 12 10-9 4 13-10 6
7
פרק שני :מדדים למיקום מרכזי )1ערכים בודדים שכיח ( :)Modeאותו ערך המופיע בשכיחות הגבוהה ביותר .דוגמה.30 : אמצע הטווח ( :)Midrangeהממוצע בין התצפית הגדולה ביותר והקטנה ביותר. 34 + 25 דוגמה= 29.5 : 2
חציון ( :)Medianכאשר נתונה רשימת תצפיות שסודרו בסדר עולה ,זה ערך התצפית המרכזית אם מספר התצפיות אי-זוגי .אם מספרם זוגי ,הוא ממוצע ערכיהן של שתי התצפיות המרכזיות. דוגמה.29 : n
ממוצע ( ∑ x :)Mean .דוגמה29.09 : =x i
i =1
n
)2נתונים מקובצים שכיח :בתנאי שרוחב המחלקה אחיד ,הוא נקודת האמצע של המחלקה השכיחה ביותר .יתכן מספר שכיחים .דוגמה.29.5 : אמצע הטווח :הוא הממוצע בין הגבול העליון של המחלקה העליונה לבין הגבול התחתון של המחלקה התחתונה. 24.5 + 34.5 דוגמה= 29.5 : 2
חציון: ) n / 2 - F( xm−1 ⋅ ( L1 − L0 ) + L0 ) f ( xm
כאשר: :nמספרם הכולל של התצפיות. : xmהמחלקה בה נמצא החציון. : xm−1המחלקה הקודמת לxm - ) : F ( xm−1השכיחות המצטברת עד למחלקה xm−1 ) : f ( xmשכיחות המחלקה xm : L0גבול תחתון אמיתי של המחלקה שבה נמצא החציון
= Md
8
: L1גבול עליון אמיתי של המחלקה שבה נמצא החציון
9
דוגמה:
31 / 2 − 10 ⋅ (30.5 − 28.5) + 28.5 = 29.1875 16
= Md
הערה :אם מספר התצפיות הינו זוגי ושתי תצפיות המרכזיות נמצאות בשתי מחלקות נפרדות ,אזי החציון הוא הגבול המשותף לשתי המחלקות. ממוצע:
)∑ x ⋅ f ( x x
n
=x
כאשר xהוא האמצע של כל מחלקה .דוגמה29.048 : Statistics טמפרטורה 31 0 29.10 29.00 30
grouped 31 0 29.048 29.500 29.5
Valid Missing
N Mean Median Mode
הערה :החציון של הנתונים המקובצים איננו מדויק. )3השוואה בין המדדים השונים אמצע הטווח (במידה גדולה) והממוצע (במידה פחותה) מושפעים מערכים קיצוניים, ואילו השכיח והחציון אינם מושפעים מהם. השכיח והחציון נשענים יותר על שכיחות התצפיות השונות ,ואילו הממוצע ואמצע הטווח יותר על ערכיהן. הממוצע הוא בדרך כלל ומן הסתם המדד המשקף ביותר ולכן הוא המדד השימושי ביותר.
10
פרק שלישי :מדדים לפיזור אין כאן הבחנה בין ערכים בודדים לנתונים מקובצים. אחוז השגיאות :אחוז מספר התצפיות שאינן השכיח ,או שאינן במחלקה השכיחה. 100 *15 דוגמה :בנתונים מקובצים= 48.38% : 31
.
טווח ( :)Rangeההפרש בין הערך הגבוה ביותר והערך הנמוך ביותר .דוגמה :בערכים הבודדים: 9=34-25 ממוצע הסטיות המוחלטות מהממוצע: |−x
n
∑| x
i
i =1
n
הגיוני ,אבל לא נוח ,ולכן לא שימושי. שונות ( :)Variance )1ערכים בודדים: − x )2
n
∑ (x
i
n
i =1
= s2
דוגמה.4.29 : )2נתונים מקובצים: )⋅ f ( x
2
)∑ (x − x x
n
= s
דוגמה.4.05 : סטיית תקן( s = s 2 :)Standard Deviation Statistics 31 0 2.071 4.290 9
Valid Missing
טמפרטורה N Std. Deviation Variance Range
2
11
פרק רביעי :אמידה נקודתית .1דגימה מקרית: .1מושגים בסיסיים )1אוכלוסיה :כלל הפריטים לגביהם אנו שואלים שאלה מסוימת )2פרמטר :גודל קבוע המאפיין את האוכלוסייה (למשלρ, , )σ, μ )3מדגם מקרי :תת-אוכלוסיה שעליה בודקים את נושא השאלה ,כאשר יש הסתברות שווה לכל איבר באוכלוסיה להופיע במדגם )4אמידה :על סמך תוצאות המדגם ,חישוב ערך משוער לפרמטר המבוקש. .2ייצוג מתמטי של המדגם ()X1,...,Xn •לכל Xiאותה פונקצית הסתברות •כל ה Xi-הם בלתי תלויים
.2אמידה: ) θˆ = f ( X 1 ,..., X n
.1סטטיסטי: n
i
דוגמה:
∑X i =1
n
= µˆ = X
.2אומד ( θˆ :)Estimatorבתור משתנה מקרי: .3אומדן ( :)Estimationתצפית של ˆ: θ
i
i
∑x n
∑X n
על סמך מדגם מסוים
.3הטייה: E (θˆ) − θ
.1הגדרה: האומד ˆ θהינו חסר הטייה אם E (θˆ) = θ .2אומד חסר הטייה עבור התוחלת: n
משפט:
i
∑X i =1
n
= ˆµ
הוא אומד חסר הטייה עבור .μ
12 n ∑ X i = E ( µˆ ) = E i =1 n
.ל.ש.מ
n
∑ E( X i =1
i
n
∑µ
) =
n
i =1
n
= µ :הוכחה
:אומד חסר הטייה עבור השונות.3
n
.σ2 ˆ הוא אומד חסר הטייה עבור2 ∑ σ = i =1 n 2 ∑ ( X i − µ) = E (σˆ 2 ) = E i =1 n
.ל.ש.מ
n
.σ2 ˆ הוא אומד חסר הטייה עבור2 ∑ σ = i =1
( X i − µ)2
אזי, ידועμ אם:משפט
n
n
n
∑ E( X i − µ)2
=
i =1
n
(X i − X )2
∑σ
2
= σ 2 :הוכחה
i =1
n
אזי, אינו ידועμ אם:משפט
n −1 2
:הוכחה
[
]
a = ∑ ( X i − X ) 2 = ∑ [( X i − µ ) − ( X − µ ) ] = ∑ ( X i − µ ) + ( X − µ ) − 2( X i − µ ) ( X − µ ) = n
n
i =1
i =1
n
i =1
2
2
= ∑ ( X i − µ ) + n( X − µ ) − 2( X − µ ) ∑ ( X i − µ ) = ∑ ( X i − µ ) + n( X − µ ) − 2n( X − µ ) = n
2
2
i =1
= ∑ ( X i − µ ) − n( X − µ ) n
2
n
n
i =1
i =1
2
2
2
i =1
⇒ E (a) = nσ 2 − nV ( X ) n ∑ Xi V ( X ) = V i =1 n
=
n
∑σ i =1
n2
2
=
⇒ E (a) = nσ − σ = (n − 1)σ 2
2
σ2 n 2
2 a (n − 1)σ ⇒ E = =σ2 n −1 n −1
.ל.ש.מ σˆ 2 =
1 n −1
(∑ X
2 i
)
−nX 2 :הערה
: של התפלגות בינומיתp אומד חסר הטייה עבור הפרמטר.4 – מספר הצלחותk :נתון – מספר ניסוייםn
2
13 k אם כן ,האומד המתקבל על הדעת הוא: n
= ˆ , pכאשר ). k ~ B(n, p k E ( k ) np = E ( pˆ ) = E = =p n n n
לכן k nהוא אומד חסר הטייה. .5אומד חסר הטייה עבור הפרמטר θשל התפלגות אחידה: נניח ) X ~ U (0, θ θ = ) θˆ1 = 2 X ⇐ E ( X 2 ˆ ניקח עכשיו. θ 2 = max( X i ) : n
n x ˆ Fθˆ ( X ) = P (θ 2 < x ) = ∏ P ( X i < x) = 2 θ i =1 n −1 nx ⇒ f θˆ (n) = n 2 θ
θ
ˆ n +1 ⇐ θ2 n
θ θ xnx n −1 dx nx n dx n x n +1 n θ n +1 nθ ∫ = ) ⇒ E (θˆ2 = = = ⋅ = n n n n ∫ θ θ n + 1 0 θ n + 1 n + 1 0 0 θ
= θˆ3הוא אומד חסר הטייה.
.6אומד חסר הטייה בצורה אסימפטוטית: א) הגדרהlim E (θˆ) = θ : ∞→ n
ב) דוגמה: 2
)− X
i
∑(X
= σˆ 2
n (n − 1)σ 2 σ2 2 2 = ˆE σ =σ − n n 2 σ = σ 2 lim σ 2 − ∞→ n n
) (
.4שיטת הנראות המרבית: n
.1נראות של המדגם ()X1,...,Xn
) L( X 1 ,..., X n ;θ ) = ∏ f ( xi , θ i =1
(במקרה בדיד ,לוקחים עבור ) ) Pθ ( X = xi ) : f ( xi ,θ
14
.2שיטת הנראות המרבית
הגדרה :אומדן בעל נראות מרבית ˆ θמקיים את התנאי הבא: ) L x, θˆ ≥ L( x, θ
) (
דרך החישוב:
∀θ ∈ Θ
θ ∈Θ
•בעקרון ,צריכים לבדוק שהנגזרת השנייה שלילית. e − λ λk !k
) X ~ P (λ
דוגמה:
) (
) L x,θˆ = max L( x,θ ) ∂ ln L( x, θ =0 ∂θ
= ) P( X = k e − λ λki e − nλ λ∑ ki = ! ki ! ∏ ki
i
⇒
n
∏ = ) L ( x, λ i =1
)! ln L = − nλ + ∑ k i ln λ − ln ( ∏ k i
∑k
= ˆλ
n
⇒
∂ ln L ∑ ki = 0 = −n + ∂λ λ ∂ 2 ln L ∑ ki =− 2 <0 2 ∂λ λ
.5אומד מתכנס: הגדרה :אומד נקרא מתכנס אם השונות שלו שואפת לאפס דוגמה:
) X ~ N (µ ,σ 2
i
∑X n
lim V (θˆ) = 0 ∞→ n
= X
σ2 lim =0 n →∞ n
σ2 = ) V (X n
.6השוואה בין אומדים שונים: יהיו נתונים שני אומדים חסרי הטייה .נעדיף את האומד בעל השונות הנמוכה מביניהם.
15
:דוגמה µˆ 1 = X
µˆ 2 = X 1
V ( µˆ 1 ) = V ( X ) = ∀n > 1
σ2 n
V ( µˆ 2 ) = V ( X 1 ) = σ 2
σ2 <σ2 n
. X 1 עדיף על פניX לכן
16
פרק חמישי :רווחי סמך .1רווח-סמך עבור μכאשר σידוע: משפט :אם ) X ~ N ( µ , σ 2או , n > 30אזי : ∀α 0 ≤ α ≤ 1
הוכחה :אם X~Nאו , n > 30אזי
2
1−α
α
2 2
zα
2
− zα
α 0
σ σ ⋅ P X − zα ⋅ < µ < X + zα = 1 − α 2 2 n n σ2 . X ~ N µ , n
) n ⋅( X − µ < ⇒ P − zα < zα = 1 − α 2 2 σ σ σ ⋅ ⇒ P − zα ⋅ < X − µ < zα = 1 − α 2 2 n n σ σ ⋅ ⇒ P X − zα ⋅ < µ < X + zα = 1 − α 2 2 n n .מ.ש.ל
דוגמה . X ~ N ( µ ,4) :בנה רווח של 95%עבור ,μכאשר התקבל .n=10 , X = 12 φ zα = 0.975 ⇒ zα = 1.96 2 2 σ 2 ⋅ ⇒ X − zα × = 12 − 1.96 = 10.76 2 n 10 σ 2 ⋅ X + zα × = 12 + 1.96 = 13.24 2 n 10 ⇒ P (10.76 < µ < 13.24) = 0.95
.2רווח-סמך עבור μכאשר σאינו ידוע: n.1גדול ( :) n > 30
)
אז אפשר להחליף את σב ,s-כאשר −nx 2
2 i
(∑ x
1 n −1
= , sולהשתמש בנוסחה
הנ"ל: s s ⋅ P X − zα ⋅ < µ < X + zα = 1 − α 2 2 n n
n.2קטן ( :) n ≤ 30 X)1אינו מתפלג נורמלית :אין פתרון. X)2מתפלג נורמלית .אזי:
17
)3 n
s = 2
⇒
∑(X i =1
i
− X )2
n Xi − X ( n − 1) s 2 = ∑ 2 σ σ i =1
⇒
n −1
( X − µ) n ⋅ n −1 ⋅σ
σ ⋅ s ⋅ n −1
=
2
~ χ n2−1
X −µ
σ
n
~ N (0,1)
(X − µ) n ~ t ( n −1) s
( X − µ) n ⇒ P − tα < < tα = 1 − α 2 2 s s s ⇒ P X − tα ⋅ < µ < X + tα ⋅ = 1 − α 2 2 n n
: α = 0.1 , n = 25 , s = 10 , X = 5 :דוגמה ⇒ t 0.05 ( 24) = 1.71 ⇒ µ = 5±
1.71 × 10 25
= 5 ± 3.42
:סמך עבור פרופורציה-רווח.3 p אומד עבור.1 pˆ = E ( pˆ ) =
V ( pˆ ) = pˆ − p pq
E (Y ) np = =p n n
Y n
Y ~ B (n, p )
הוא חסר הטייהpˆ ובכן
V (Y ) npq pq = 2 = n n2 n
: לפי משפט הגבול המרכזי, גדולn אם,ובכן ~ N (0,1)
n
) np, nq ≥ 5 למעשה, גדולn (אםp רווח סמך עבור.2 P pˆ − zα ⋅ 2
pˆ qˆ < p < pˆ + zα ⋅ 2 n
pˆ qˆ =1−α n
18
:)סמך עבור השונות (דרושה התפלגות נורמלית-רווח.4
∑(X n
s2 =
i =1
i
− X)
2
n −1 (n − 1) s 2 ~ χ n2−1 2 σ
(n − 1) s 2 ⇒ P χ 12−α < < χ α2 = 1 − α 2 2 2 σ 2 (n − 1) s 2 (n − 1) s 2 ⇒ P <σ < = 1−α 2 χ 12−α χα 2 2 α 2
1− α
α
- ש,אנחנו ראינו
2
19
פרק שישי :בדיקת השערות .1מבוא: דוגמה :מוכר נורות טוען שבממוצע ,משך חיים של נורותיו הינו 200שעות .אגודת הצרכנים רוצה לבדוק אם טענתו נכונה :היא מוציאה מדגם של 25נורות ומחשבת את הממוצע של המדגם .היא תחליט שלא לקבל טענתו של המוכר אם יש מרחק רב בין הממוצע שהתקבל לבין .200אבל מה הגבול?
.2הגדרות יסודיות:
µ = 200
•השערת אפס :H0הטענה שדנים עליה •השערה אלטרנטיבית :H1 µ < 200
ההשערה האלטרנטיבית יכולה להיות או חד-צדדית ,או דו-צדדית. •סוגי טעויות: ההחלטה H1
H0
I
אין טעות
H0
אין טעות
II
H1
המצב האמיתי
:αהסתברות לטעות מסוג I :βהסתברות לטעות מסוג II
:β-1עוצמת המבחן •אזור קריטי (או אזור הדחייה) :האזור שאם בו נופל הערך שהתקבל ע"י המדגם ,מחליטים לדחות את .H0ובכן α ,הוא ההסתברות של האזור הקריטי ,בתנאי שH0 -היא נכונה. •מובהקות ( :)P-Valueההסתברות לקבל ערך "קיצוני" יותר מהסטטיסטי שהתקבל בפועל ,בהנחה שהשערת האפס היא נכונה. אם המובהקות קטנה מרמת המובהקות שהחליטו עליה ,אזי דוחים את השערת האפס.
.3הפעלת הבדיקה:
•קביעת ההשערות H0וH1 - •קביעת המקרה שבו נמצאים •קביעת האזור הקריטי •חישוב הסטטיסטי •בדיקת מיקום הסטטיסטי ומסקנה
µ0
20
.4סוגים שונים של מקרים: .1מבחן על μ , Xמתפלג נורמלית או n>30 , σידוע x − µ0
n
σ
=z
µ > µ0
µ ≠ µ0 z > zα
z > zα
µ = µ0
H0 :
µ < µ0
H1 :
z < − zα
אזור קריטי: דוגמה :דיקן האוניברסיטה טוען שרמת הסטודנטים בלשון העברית היא .67.5 אגודת הסטודנטים טוענת שאין פרט זה נכון .לשם בדיקת טענתו ,נלקח מדגם של 100 סטודנטים ,והתקבל ממוצע של .68.5ידועה סטיית התקן ,על-פי ניסיון העבר ,והיא שווה .5מה ניתן להסיק ברמת מובהקות של ?0.05 2
H 0 : µ = 67.5 H 1 : µ ≠ 67.5
zα = 1.96 2
68.5 − 67.5 =2 5 10
n = 100 α = 0.05 x = 68.5 σ =5
=z
מסקנה :דוחים את .H0 .2מבחן על μ , Xמתפלג נורמלית σ ,אינו ידוע )1אם , n > 30כמו ב4-א' ,רק מחליפים σב.s - )2אם , n ≤ 30פועלים כדלהלן: x − µ0
n
s
=t
µ > µ0
µ ≠ µ0 t > tα
t > tα
µ = µ0
H0 :
µ < µ0
H1 :
t < −t α
אזור קריטי: דוגמה :יצרן תמרוקים רוצה לבדוק אם משקלן של השפופרות הממולאות במפעלו הוא אמנם 103גרם בממוצע .התקבלו הנתונים הבאים (ניתן להניח התפלגות נורמלית) .100 ,98 ,104 ,102 ,98 ,102 ,96 :מה ניתן להסיק ,ברמת מובהקות ?0.02 2
H 0 : µ = 103 H 1 : µ ≠ 103
tα (6) = 3.143
n=7 α = 0.02 x = 100
2
100 − 103 = −2.8 2.83 7
=t 2
= 2.83
מסקנה :לא דוחים את .H0
)− X
i
∑( X
n −1
=s
21
.3מבחן על X1 , µ1 − µ 2ו X2-מתפלגים נורמלית או σ 2 , σ 1 , n 2 , n1 > 30
ידועים (מדגמים בלתי תלויים)
x1 − x 2 − d 0
σ 12 σ 22 + n1 n2 µ1 − µ 2 ≠ d 0
=z
µ1 − µ 2 > d 0
z > zα
z > zα
µ1 − µ 2 = d 0
H0 :
µ1 − µ 2 < d 0
H1 :
z < − zα
אזור קריטי: דוגמה :חוקר מעוניין לבדוק אם יש הבדל בין יכולתם של גברים ליכולתן של נשים במבחן "יצירת מילים" .הוא נתן שש אותיות שונות לקבוצה המונה 114גברים ו 175-נשים ,וכל נבדק נתבקש להרכיב במשך 5דקות מילים רבות ככל האפשר מאותיות אלו .נניח שמניסיון קודם ידוע שסטיית התקן של היכולת במבחנים כאלה היא 6אצל הגברים ו 5-אצל הנשים .ממוצע מספר המילים של הנשים היה 21ושל הגברים ( 19.7 .) α = 0.01 2
H 0 : µ1 − µ 2 = 0
zα = 2.58
H 1 : µ1 − µ 2 ≠ 0
2
= 1.91
(21 − 19.7) − 0 25 36 + 175 114
σ1 = 5 σ2 = 6 n1 = 175 n2 = 114 α = 0.01
=z
מסקנה :לא דוחים את .H0
.4מבחן על X1 , µ1 − µ 2ו X2-מתפלגים נורמלית σ 2 = σ 1 ,לא ידועים )1אם , n > 30כמו ב4-ג' ,רק מחליפים σב.s - )2אם , n ≤ 30פועלים כדלהלן: ( x1 − x 2 ) − d 0
1 1 + n1 n 2
µ1 − µ 2 ≠ d 0
אזור קריטי:
2
t > tα
=t
⋅ sp
µ1 − µ 2 > d 0 t > tα
(n1 − 1) s12 + (n 2 − 1) s 22 = s n1 + n2 − 2 2 p
µ1 − µ 2 = d 0
H0 :
µ1 − µ 2 < d 0
H1 :
t < −t α
ν = n1 + n 2 − 2
דוגמה :חוקר רוצה לבדוק את השפעתם של סמי-הרגעה חדשים על כושר נהיגה. 10נבדקים קיבלו סם הרגעה ,נבחנו מבחן נהיגה וקיבלו ציון ממוצע של ,35עם סטיית תקן של 15 . 15נבדקים אחרים קיבלו דמה (תרופה מדומה ,חסרת כל השפעה) ואף הם נבחנו באותו מבחן .הממוצע בקבוצה זו היה ,40וסטיית התקן הייתה . 10ידוע שציוני מבחן נהיגה מתפלגים נורמלית .השאלה היא ,אם יש לסמי-הרגעה השפעה כלשהי על כושר הנהיגה (מניחים שסטיות התקן שוות.) α = 0.05 ,
22 H 0 : µ1 − µ 2 = 0
t 0.025 (23) = 2.069
H 1 : µ1 − µ 2 ≠ 0
9 × 15 + 14 × 10 = 11.95 23 35 − 40 =t = −3.542 1.412 3.542 > 2.069 = s 2p
n1 = 10 n 2 = 15
α = 0.05 x1 = 35 x 2 = 40 s12 = 15 s 22 = 10
מסקנה :דוחים את .H0 .5מבחן על X1 , µ1 − µ 2ו X2-מזווגים X 1 − X 2 ,מתפלג נורמלית D = X1 − X 2 מגדירים משתנה חדש •אם ) σ (Dידוע ,אנו נמצאים במקרה של סעיף א' •אם , n > 30כמו בסעיף א'
µ1 − µ 2 ≠ d 0
אזור קריטי: i
µ1 − µ 2 > d 0
t > tα
i =1
n
t < −t α
d i = x1i − x 2i
= d d − d0 sd n
µ1 − µ 2 < d 0
H1 :
t > tα
2 n
∑d
µ1 − µ 2 = d 0
H0 :
2
=t
)
ν = n −1 −d
∑ (d n
i
i =1
n −1
= s d2
דוגמה :לקבוצת נבדקים נמסר שאלות לשם הבהרת עמדותיהם בנושא מסוים .לאחר מכן הוקרן לפניהם סרט ,שהציג את הנושא בצורה חיובית ,ושוב נתבקשו הנבדקים למלא שאלון זה .האם הגביר הסרט את האהדה לנושא? נתוני הנבדקים מוצגים להלן ( , α = 0.05ניתן להניח כי ההפרש מתפלג נורמלית). 9
8
7
6
5
4
3
2
1
11
1 0 8
1 2 8 0 1 1 2 0 8 4 t 0.05 (10) = 1.812
1 8 2 2
2 0 2 4
2 2 2 0
2 4 3 0
2 4 2 8
2 0 2 4
1 8 2 0
1 6 2 4
d = −3.27 s d2 = 23.42 t = −2.24 מסקנה :דוחים את .H0
H 0 : µ1 − µ 2 = 0 H 1 : µ1 − µ 2 < 0
α = 0.05
X1 X2
23
.6מבחן על npˆ ≥ 5 ,pוגם n(1 − pˆ ) ≥ 5 pˆ − p 0
) p 0 (1 − p 0 n
p ≠ p0
אזור קריטי:
2
=z
p > p0
z > zα
p = p0
H0 :
p < p0
H1 :
z < − zα
z > zα
דוגמה :שחקן טוען שהסתברות להוציא " "6על קובייה מסוימת קטנה מ. 1 6 - התקבל " "6שמונה פעמים ב 100-הטלות .מי צודק ,ברמת מובהקות ?0.05 = −2.325
− 16
8 100
× 56 100 6
1
6
=z
1
= H0 : p
1
< H1 : p
6
− z 0.05 = −1.65
מסקנה :דוחים את .H0 .7מבחן על הפרש פרופורציות5 ≤ n2 qˆ 2 , n2 pˆ 2 , n1qˆ1 , n1 pˆ 1 ,
p1 − p 2 ≠ d 0
אזור קריטי:
2
p1 − p 2 > d 0
z > zα
z > zα
p1 − p 2 = d 0
H0 :
p1 − p 2 < d 0
H1 :
z < − zα
pˆ 1 − pˆ 2 − d 0 pˆ 1 qˆ1 pˆ 2 qˆ 2 + n1 n2
=z
1 1 אם , d 0 = 0אזי לוקחים כמכנהpˆ qˆ + : n1 n 2
x1 + x 2 ,כאשר n1 + n 2
= ˆ. p
דוגמה :בסקר דעת קהל על תוכנית טלוויזיה מסוימת נמצא שאחוז הצופים בתוכנית באופן קבוע מבין 200הנשים שנשאלו היה ,20%ומבין 300 הגברים שנשאלו – .30%האם ההבדל הזה מובהק? ( ) α = 0.01 0.8 × 200 = 160
0.7 × 300 = 210
pˆ 1 = 0.2 0.2 × 200 = 40 pˆ 2 = 0.3 0.3 × 300 = 90 40 + 90 130 = ˆp = = 0.26 200 + 300 500 = −2.5
מסקנה :לא דוחים את .H0
H 0 : p1 − p 2 = 0 n1 = 200 H 1 : p1 − p 2 ≠ 0 n 2 = 300 z 0.005 = 2.58 0.2 − 0.3
1 1 0.26 × 0.74 × + 200 300
=z
24
ח .מבחן על σ2, Xמתפלג נורמלית
2 0
σ ≠σ
2 0
2
χ 2 < χ 12−α 2 אזור קריטי: χ 2 > χ α2 2
σ >σ 2
σ <σ
H1 :
2 0
χ 2 > χ α2
ν = n −1
σ 2 = σ 02
H0 :
2
χ 2 < χ 12−α
(n − 1) s 2 σ 02
= χ2
דוגמה :כמו בסעיף ב' .מנהל העבודה טוען שהשונות שווה ל 10-והיצרן טוען שהיא נמוכה מ .10-מי צודק ,ברמת מובהקות ?0.05 n=7
H 0 : σ 2 = 10
s2 = 8
H 1 : σ < 10 6×8 = χ2 = 4.8 10 2
χ 02.95 = 1.64
מסקנה :לא דוחים את .H0 ט .מבחן על הפרש שונויות X1 ,ו X2-מתפלגים נורמלית σ 12 = σ 22
σ ≠σ F < F1−α (ν 1 ,ν 2 ) 2 F > Fα (ν 1 ,ν 2 ) 2 2 2
אזור קריטי:
2 1
2 2
H0 :
σ >σ 2 1
H1 :
) F > Fα (ν 1 ,ν 2 s12 F= 2 s2
הערה :אם המבחן חד-צדדי ,לוקחים כ X 1 -את המשתנה בעל השונות המירבית לפי . H 1 דוגמה :בדוגמה שבסעיף ד' ,בכוונתנו לבחון אם אמנם ניתן להניח שאין הבדל מובהק בין שתי השונויות ,או לחילופין אם השונות בקרב אלה שלקחו סמי-הרגעה גדולה יותר. H 0 : σ 12 = σ 22 F0.05 (9, 14) ≈ 3.02 15 = 1.5 10
=F
H 1 : σ 12 > σ 22
α = 0.05 s = 15 s = 10 2 2
2 1
n1 = 10 n2 = 15
מסקנה :לא דוחים את .H0 הערה:
1
) F1−α (ν2 ,ν1
= ) Fα (ν1 ,ν2
25
סיכום בדיקת השערות ורווחי סמך רווח סמך : µ של zα 2
σ n
: µ של tα 2
s n
אזור דחייה
H1
z < − zα
µ < µ0
z > zα
µ > µ0
z > zα
2
µ ≠ µ0
t < −tα
µ < µ0
t > tα
µ > µ0
t > tα
µ ≠ µ0
n ≤ 30 - וX ~ N , לא ידועσ
z < − zα
µ1 < µ 2
z=
2
: µ 1 − µ 2 של
− x2 ± z α 2
2
σ1 n1
+
2
σ2 n2
z > zα
µ1 > µ 2
z > zα
µ1 ≠ µ 2
t < −tα
µ1 − µ 2 < d 0
t > tα
µ1 − µ 2 > d 0
2
: µ 1 − µ 2 של
− x2 ± tα s p 2
1 n1
+ n12
מבחן/סטטיסטי z=
t=
2
σ
n
1
µ = µ0
2
µ1 = µ 2
3
µ1 − µ 2 = d 0
4
µ1 − µ 2 = d 0
5
p = p0
6
n
x1 − x 2 2
σ1 n1
.
X ~ N ידוע וσ n > 30 או
x − µ0 s
µ = µ0
2
+ σn22
.
.
ידועיםσ 1 , σ 2 n1 , n2 > 30 אוX 1 , X 2 ~ N t=
( x1 − x 2 ) − d 0 sp ⋅
1 1 + n1 n 2
.
לא ידועיםσ 1 = σ 2
2
t > tα
x − µ0
H0
sp =
( n1 − 1) s1 2 + ( n 2 − 1) s 2 2 n1 + n 2 − 2
µ1 − µ 2 ≠ d 0
וכןX 1 , X 2 ~ N n1 ≤ 30 or n2 ≤ 30
: µ d של tα 2
sd n
t < −tα
µ1 − µ 2 < d 0
t > tα
µ1 − µ 2 > d 0
t > tα
µ1 − µ 2 ≠ d 0
2
: p של zα 2
pˆ ( 1− pˆ ) n
.
מדגמים מזווגים D ~ N , n ≤ 30
z < − zα
p < p0
z > zα
p > p0
z > zα
p ≠ p0
2
d − d0 sd n ν = n −1
t=
z=
pˆ − p 0 p 0 ( 1− p 0 ) n
npˆ , n(1 − pˆ ) ≥ 5
.
26
רווח סמך : p1 − p 2 של pˆ 2 ± z α
2
pˆ 1 qˆ1 n1
+
χα
: σ 2 של 2
בין
2
2
− 1) s 2
z > zα
p1 − p 2 > d 0
z > zα
p1 − p 2 ≠ d 0
σ 2 < σ 02
χ 2 > χα
σ 2 >σ0
2
2
χ > χα 2
2
z=
pˆ 1 − pˆ 2 − d 0 pˆ 1qˆ1 n1
+
σ1
2
σ2
2
1 Fα (ν 2 ,ν 1 )
של
לבין Fα (ν1 ,ν2 ) 2
p1 − p 2 = d 0
F > Fα (ν 1 , ν 2 )
.
pˆ 2 qˆ 2 n2
n1 pˆ 1 , n1 (1 − pˆ 1 ) ≥ 5 n 2 pˆ 2 , n 2 (1 − pˆ 2 ) ≥ 5
χ2 =
( n − 1) s 2
σ0 ν = n −1
σ 2 = σ 02
2
σ1 >σ 2 2
2
F=
s1
σ1 =σ 2 2
2 2
s2 ν1 = n 1 − 1 ν2 = n2 −1
או
F < F1− α 2 (ν 1 , ν 2 )
σ 12 ≠ σ 2 2
F > Fα 2 (ν 1 , ν 2 )
,צדדי-אם המבחן חד אתX 1 -לוקחים כ המשתנה בעל השונות H 1 המירבית לפי X 1, X 2 ~ N
Fα (ν1 ,ν2 ) =
7
8
.
X ~N
בין
2
H0
σ 2 ≠ σ 02
או
2
2
מבחן/סטטיסטי
2
:
2 1 2 2
χ 2 < χ 12−α
χ 2 < χ 12− α
לבין
χ 1− α 2
2
z < − zα
pˆ 2 qˆ 2 n2
2
− 1) s
2
H1 p1 − p 2 < d 0
אזור דחייה
1
F1−α (ν2 ,ν1 )
2
9
.
27
פרק שמיני :מבחן לבדיקת טיב התאמה .1התאמה להתפלגות: המטרה :לבדוק אם אוכלוסיה מסוימת מתפלגת לפי התפלגות נתונה: • : Oiמספר תצפיות ששויכו לטווח i • : Eiמספר תצפיות אמורות להשתייך לאותו טווח אם ההשערה נכונה • kטווחים n ,תצפיות בסך הכל. Oi2 −n Ei
k
∑=
2
i =1
) − Ei Ei
( Oi
k
∑ = χ2 i =1
הערה Ei :חייב להיות גדול או שווה ל ,5-אחרת מחברים טווחים. אם ) , χ 2 > χ α2 ( k −tדוחים את ההשערה. • : tמספר הכמויות שצריכים להסיק מן הנתונים כדי לחשב את הEi- דוגמה :הטלת קובייה 120פעם .רוצים לבחון אם הקובייה מאוזנת. 34 = 1.7 20 ]t = 1 [ n χ 02.05 (5) = 11.07
Oi
= χ2
Ei
( Oi − Ei ) 2 ( Oi − Ei ) 2
מסקנה :לא דוחים את ההשערה
Ei
6 5 4 3 2 1 24 19 18 17 22 20 20 20 20 20 20 20 16 1 4 9 4 0 0
4 20
9 20
4 20
1 20
.2לוחות תלות הדדית: המטרה :לבדוק אם קיימת תלות בין שני משתנים מקריים איכותיים .השערת האפס היא שאין תלות בין המשתנים. 2
) − E ij
E ij
(O
ij
c
r
∑∑ = χ 2
i =1 j =1
אם )] , χ 2 > χ α2 ([r − 1] ⋅ [c − 1מסיקים שיש תלות )t = 1 + (r − 1) + (c − 1 הסבר:
)⇒ rc − [1 + (r − 1) + (c − 1)] = (r − 1)(c − 1
16 20
28
דוגמה :האם קיים קשר בין דת ואזור מגורים בארצות הברית? פרוטסטנטים קתוליים יהודים סה"כ ()187 ()211 ()202 חוף מזרחי 600 חוף מערבי סה"כ
182
215
203
()134
()140
()126
154 336
136 351
110 313
400 1000 ni ⋅ ⋅ n⋅ j
⇐
= Eij
n (182 − 202) 2 (215 − 211) 2 (203 − 187) 2 = χ2 + + + 202 211 187 (154 − 134) 2 (136 − 140) 2 (110 − 126) 2 + + + = 8.556 134 140 126 χ 02.05 (2) = 5.991
מסיקים שיש תלות.
29
פרק תשיעי :ניתוח שונות .1מבוא: נתונות kאוכלוסיות .רוצים לבחון אם הן זהות מבחינה מסוימת .ז"א אם למשתנה מסוים יש אותה תוחלת בכל kהאוכלוסיות: H 0 : µ1 = µ 2 = ... = µ k ∃i ≠ jכך שH 1 : µ i ≠ µ j -
דוגמאות: •השוואת יבול של חיטה מסוגים שונים •השוואת שיטות הוראה שונות •השוואה בין טיפולים שונים הנתונים: 1≤ i ≤ k 1≤ j ≤ n
) (Yijמספר אחיד ( )nשל תצפיות בכל אוכלוסיה.
.2המודל: µi = µ + α i
⇔
Yij =µ+αi +εij
) ∀i, j : ε ij ~ N (0, σ 2
ולכן אפשר לכתוב:
נסמן:
H 0 : i = 1...k α i = 0 H 1 : ∃i α i ≠ 0 T = ∑ Yij i, j
Ti = ∑ Yij
∑Y
j
ij
i, j
nk
∑Y
ij
j
= Y
n
= Yi
) (Yij − Y ) = (Yij − Yi ) + (Yi − Y − Y ) 2 = ∑ (Yij − Yi ) 2 + ∑ (Yi − Y ) 2 i, j
SSB
i, j
∑ (Y
ij
i, j
SST = SSW +
)(Between
)(Within
)(Total
⇒
30 )SSB (k − 1 אם H0נכונה ,אזי: )SSW k (n − 1 ודוחים את H0אםF > Fα ( k − 1, k (n − 1) ) :
= Fמתפלג לפי ) ). F ( k − 1, k (n − 1
.3נוסחאות לחישוב: 2
T kn
SST = ∑ Yij2 − i, j
Ti 2 T 2 ∑ = SSB − kn i =1 n SSW = SST − SSB k
.4דוגמה: כדי לבחון את התועלת של 4דשנים שונים ,השתמשו בכל אחד ב 5-חלקות, והתקבלו היבולים הבאים (בק"ג) .האם יש הבדל בין הדשנים השונים? חלק 5סה"כ 4 3 2 1 דשן 374 80 75 64 73 82 A 340 60 76 63 84 57 B 338 75 70 65 45 83 C 371 80 74 75 74 68 D 1423 = 103,089
∑Y
2 ij
1423 2 SST = 103,089 − = 1842.55 20 374 2 + 340 2 + 338 2 + 3712 1423 2 = SSB − = 225.75 5 20 SSW = 1842.55 − 225.75 = 1616.8 225.75 3 = 0.74 =F F0.05 (3,16) = 3.24 1616.8 16
⇐ אין הבדל מובהק בין הדשנים השונים.
31
.5הכללה: אם אין מספר אחיד של תצפיות בכל אוכלוסיה ,אלא n1 , n2 ,....., nk k
N = ∑ ni i =1
k T2 T2 SSB = ∑ i − n N i =1 i
T2 N SSW = SST − SSB SSB )( k − 1 =F SSW )(N − k
k ni
SST = ∑ ∑ Yij2 − i =1 j =1
אם ) , F > Fα ( k − 1, N − kאזי דוחים את השערת האפס ,היינו מסיקים שקיים הבדל מובהק בין תוחלות הקבוצות השונות.
32
פרק עשירי :רגרסיה .1מבוא: משמעותו של קשר סטטיסטי מחפשים דרך לחשב את העוצמה ואת הכוון של הקשר בין שני משתנים כמותיים. דוגמאות: טמפרטורה ממוצעת – תנובת עצי פרי.מנת משכל של האב – מנת משכל של הבןמספר רופאים – מספר ימי מחלהאם מתגלה קשר בין שני המשתנים Xו ,Y-אזי קיימות שלוש אפשרויות: Xמשפיע על Y Yמשפיע על Xמשתנה שלישי משפיע על Xו.Y-מקדם המתאם של פירסון ( Pearson Coefficient of )Correlation ) − x )( yi − y
n
∑ (x
i
i =1
n ⋅ sx ⋅ s y − n⋅ x ⋅ y
= ) r( X ,Y
n
i
∑x ⋅ y i
i =1
n
n
i =1
i =1
) (∑ xi2 − n ⋅ x 2 )(∑ yi2 − n ⋅ y 2
= ) r( X ,Y
תכונות: מתקיים מקרה, בכל גבוהה. הקשר עוצמת כי סימן זה , 1 ל- קרוב | r | אם )1 − 1 ≤ r ≤ +1 . )2אם rחיובי ,הקשר ישר ,ולא ,הקשר הפוך. דוגמה: גובהX : משקלY :
160 75
200 120 160 75 60 90 600 = 0.5 3200 ⋅ 450
=
48,600 − 4 ⋅ 160 ⋅ 75 ) (105,600 − 4 ⋅ 160 2 )(22,950 − 4 ⋅ 752
מטרות הרגרסיה: •קשר סטטיסטי בין שני משתנים (באיזו מידה " Xמסביר" את .)Y •חיזוי משתנה אחד על סמך משתנה אחר. דוגמה :משקל וגובה.
= ) r( X ,Y
33
.2רגרסיה ליניארית פשוטה: Y = aX + b + ε
המודל:
) ε ~ N (0, σ 2
כדי לאמוד את aואת ,bמגדירים:
n
n
i =1
i =1
S = ∑ ei 2 = ∑ ( Yi − [axi + b]) 2
ומחפשים aו b-כך ש S-יהיה מזערי. נסמן:
( ∑ xi ) 2
S x = S xx
n
n
S xx = ∑ xi 2 − i =1
( ∑ yi ) 2
S y = S yy
) ( ∑ xi )( ∑ yi n
n
n
S yy = ∑ yi 2 − i =1
n
S xy = ∑ xi yi − i =1
מתקבלות הנוסחאות הבאות:
S xy
bˆ = y − aˆ ⋅ x
S xx
r ⋅Sy
= ˆa
= ˆa
Sx
כאשר rהוא מקדם המתאם של פירסון בין Xלבין .Y דוגמה :ציון במתמטיקה ובסטטיסטיקה 60 40
( ∑ x ) = 50, 625 ∑ x = 225
= 280
i
225 ⋅ 280 = 450 4
i
450 = 0.67 668.75
.3בדיקת מובהקות הרגרסיה: ) (Yi − Y ) = (Yi − Yˆi ) + (Yˆi − Y
)
(
)
i
S xy = 16, 200 −
⇒ bˆ = 70 − 0.67 ⋅ 56.25 = 32.31
⇒ Yˆ = 0.67 x + 32.31
2 i
i
∑y
80 60
∑ x = 13, 325 ∑ x y = 16, 200
2
S xx = 668.75 i
60 50
80 75
Y X
(
2 2 = ∑ Yi − Yˆi + ∑ Yˆi − Y = SSE + SSR
2
) ∑ (Yi − Y SST
⇒
= ˆ⇒ a
34
:)SST (Total :)SSE (Error :)SSR (Regression
סה"כ הפיזור. הפיזור הבלתי מוסבר ע"י הרגרסיה. הפיזור המוסבר ע"י הרגרסיה. H0 : a = 0 H1 : a ≠ 0 ( n − 2) ⋅ SSR =F SSE
נוסחאות לחישוב: 2
) (∑ y i
n
n
SST = S yy = ∑ yi2 − i =1
SSR = aˆ 2 ⋅ S xx = aˆ ⋅ S xy SSE = SST − SSR
דוגמה (הנ"ל): 2
280 = 400 4 SSR = 0.67 ⋅ 450 = 301.5 ⇒ SSE = 98.5 2 ⋅ 301.5 =⇒F = 6.12 98.5 F0.05 (1,2) = 18.51 ⇒ אין רגרסיה SST = 20000 −
שימוש בR 2 - הפיזור המוסבר SSR = סך הכל הפיזור SST
דוגמה:
301.5 = 0.75 400
= R2
= R2
35
Table of the Normal Distribution Probability Content from - ∞ to z Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 ----+---------------------------------------------------------------------0.0 | 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 | 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 | 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 | 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 | 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 | 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 | 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 | 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 | 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 | 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 | 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 | 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 | 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 | 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 | 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 | 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 | 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 | 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 | 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 | 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 | 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 | 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 | 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 | 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 | 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 | 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 | 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 | 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 | 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 | 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 | 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
36
Student's t Table df\p
0.40
0.25
0.10
0.05
0.025
0.01
0.005
0.0005
1
0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674
2
0.288675 0.816497 1.885618 2.919986
4.30265
6.96456
9.92484
31.5991
3
0.276671 0.764892 1.637744 2.353363
3.18245
4.54070
5.84091
12.9240
4
0.270722 0.740697 1.533206 2.131847
2.77645
3.74695
4.60409
8.6103
5
0.267181 0.726687 1.475884 2.015048
2.57058
3.36493
4.03214
6.8688
6
0.264835 0.717558 1.439756 1.943180
2.44691
3.14267
3.70743
5.9588
7
0.263167 0.711142 1.414924 1.894579
2.36462
2.99795
3.49948
5.4079
8
0.261921 0.706387 1.396815 1.859548
2.30600
2.89646
3.35539
5.0413
9
0.260955 0.702722 1.383029 1.833113
2.26216
2.82144
3.24984
4.7809
10
0.260185 0.699812 1.372184 1.812461
2.22814
2.76377
3.16927
4.5869
11
0.259556 0.697445 1.363430 1.795885
2.20099
2.71808
3.10581
4.4370
12
0.259033 0.695483 1.356217 1.782288
2.17881
2.68100
3.05454
4.3178
13
0.258591 0.693829 1.350171 1.770933
2.16037
2.65031
3.01228
4.2208
14
0.258213 0.692417 1.345030 1.761310
2.14479
2.62449
2.97684
4.1405
15
0.257885 0.691197 1.340606 1.753050
2.13145
2.60248
2.94671
4.0728
16
0.257599 0.690132 1.336757 1.745884
2.11991
2.58349
2.92078
4.0150
17
0.257347 0.689195 1.333379 1.739607
2.10982
2.56693
2.89823
3.9651
18
0.257123 0.688364 1.330391 1.734064
2.10092
2.55238
2.87844
3.9216
19
0.256923 0.687621 1.327728 1.729133
2.09302
2.53948
2.86093
3.8834
20
0.256743 0.686954 1.325341 1.724718
2.08596
2.52798
2.84534
3.8495
21
0.256580 0.686352 1.323188 1.720743
2.07961
2.51765
2.83136
3.8193
22
0.256432 0.685805 1.321237 1.717144
2.07387
2.50832
2.81876
3.7921
23
0.256297 0.685306 1.319460 1.713872
2.06866
2.49987
2.80734
3.7676
24
0.256173 0.684850 1.317836 1.710882
2.06390
2.49216
2.79694
3.7454
25
0.256060 0.684430 1.316345 1.708141
2.05954
2.48511
2.78744
3.7251
26
0.255955 0.684043 1.314972 1.705618
2.05553
2.47863
2.77871
3.7066
27
0.255858 0.683685 1.313703 1.703288
2.05183
2.47266
2.77068
3.6896
28
0.255768 0.683353 1.312527 1.701131
2.04841
2.46714
2.76326
3.6739
29
0.255684 0.683044 1.311434 1.699127
2.04523
2.46202
2.75639
3.6594
30
0.255605 0.682756 1.310415 1.697261
2.04227
2.45726
2.75000
3.6460
Inf
0.253347 0.674490 1.281552 1.644854
1.95996
2.32635
2.57583
3.2905
df 0.995 0.99 0.975 1 ----- 0.001 2 0.010 0.020 0.051 3 0.072 0.115 0.216
Table: Chi-Square Probabilities 0.95 0.90 0.10 0.05 0.004 0.016 2.706 3.841 0.103 0.211 4.605 5.991 0.352 0.584 6.251 7.815
636.6192
0.025 0.01 0.005 5.024 6.635 7.879 7.378 9.210 10.597 9.348 11.345 12.838
37 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 13.787
0.297 0.554 0.872 1.239 1.646 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.879 13.565 14.256 14.953
0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791
0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493
1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.042 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599
7.779 9.236 10.645 12.017 13.362 14.684 15.987 17.275 18.549 19.812 21.064 22.307 23.542 24.769 25.989 27.204 28.412 29.615 30.813 32.007 33.196 34.382 35.563 36.741 37.916 39.087 40.256
9.488 11.070 12.592 14.067 15.507 16.919 18.307 19.675 21.026 22.362 23.685 24.996 26.296 27.587 28.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773
11.143 12.833 14.449 16.013 17.535 19.023 20.483 21.920 23.337 24.736 26.119 27.488 28.845 30.191 31.526 32.852 34.170 35.479 36.781 38.076 39.364 40.646 41.923 43.195 44.461 45.722 46.979
13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 27.688 29.141 30.578 32.000 33.409 34.805 36.191 37.566 38.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 49.588 50.892
14.860 16.750 18.548 20.278 21.955 23.589 25.188 26.757 28.300 29.819 31.319 32.801 34.267 35.718 37.156 38.582 39.997 41.401 42.796 44.181 45.559 46.928 48.290 49.645 50.993 52.336 53.672
38
1 2 3 4 5 6 7 8 9 10 20 30 40 50 60 70 80 100 200 400 1000 Inf
.05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01
Table of the Upper Percentage Points of the F distribution 1 2 3 4 5 6 7 8 9 10 11 161 200 216 225 230 234 237 239 241 242 243 4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 6082 18.51 19.00 19.16 19.25 19.39 19.33 19.36 19.37 19.38 19.39 19.4 98.49 99.01 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.40 99.4 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 8.76 34.12 30.81 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.93 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.54 14.95 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74 4.70 16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.05 9.96 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63 3.60 12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.62 6.54 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34 3.31 11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.82 5.74 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97 2.94 10.04 7.56 6.55 5.99 5.64 5.39 5.21 5.06 4.95 4.85 4.78 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.31 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.12 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.90 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.98 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.62 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.01 1.97 1.93 7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59 2.51 3.96 3.11 2.72 2.48 2.33 2.21 2.12 2.05 1.99 1.95 1.91 6.96 4.88 4.04 3.56 3.25 3.04 2.87 2.74 2.64 2.55 2.48 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.88 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.43 3.89 3.04 2.65 2.42 2.26 2.14 2.06 1.98 1.93 1.88 1.83 6.76 4.71 3.88 3.41 3.11 2.89 2.73 2.60 2.50 2.41 2.34 3.86 3.02 2.62 2.39 2.23 2.12 2.03 1.96 1.90 1.85 1.81 6.70 4.66 3.83 3.36 3.06 2.85 2.69 2.55 2.46 2.37 2.29 3.85 3.00 2.61 2.38 2.22 2.11 2.02 1.95 1.89 1.84 1.80 6.66 4.63 3.80 3.34 3.04 2.82 2.66 2.53 2.43 2.34 2.26 3.85 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83 1.79 6.64 4.60 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.24
12 244 6106 19.4 99.4 8.74 27.05 5.91 14.37 4.68 9.89 4.00 7.72 3.57 6.47 3.28 5.67 3.07 5.11 2.91 4.71 2.28 3.23 2.09 2.84 2.00 2.66 1.95 2.56 1.92 2.50 1.89 2.45 1.88 2.41 1.85 2.36 1.80 2.28 1.78 2.23 1.76 2.20 1.75 2.18
15 246 6157 19.4 99.4 8.70 26.87 5.86 14.2 4.62 9.72 3.94 7.56 3.51 6.31 3.22 5.52 3.01 4.96 2.85 4.56 2.20 3.09 2.01 2.70 1.92 2.52 1.87 2.42 1.84 2.35 1.82 2.32 1.80 2.28 1.77 2.22 1.72 2.13 1.70 2.08 1.68 2.06 1.66 2.03