Stats-lev Machon Lev Statistics

  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Stats-lev Machon Lev Statistics as PDF for free.

More details

  • Words: 8,737
  • Pages: 38
‫‪1‬‬

‫מכון לב‬

‫מבוא‬ ‫לסטטיסטיקה‬

‫מאת‬

‫ד"ר אלכסנדר קליין‬

‫‪2‬‬

‫מבוא‪ :‬סולמות מדידה‬ ‫‪)1‬משתנה שמי‪ :‬הערכים השונים הם מזהים בלבד‪ ,‬ויתכן שלא יהיו מספרים אלא‬ ‫מלים בלבד‪ .‬דוגמה‪ :‬שמות של אנשים‪ ,‬מספרי טלפון‪.‬‬ ‫‪)2‬משתנה סידורי‪ :‬הערכים השונים הם מספריים‪ ,‬והם מצביעים אך ורק על סדר‬ ‫מסויים‪ .‬דוגמה‪ :‬תוארים אקדמאיים (ראשון‪ ,‬שני‪ ,‬שלישי)‪.‬‬ ‫‪)3‬משתנה רווחי‪ :‬יש חשיבות לרווחים שבין שני ערכים שונים‪ ,‬אבל לא לערכים‬ ‫עצמם‪ .‬דוגמה‪ :‬טמפרטורה‪.‬‬ ‫‪)4‬משתנה מנה‪ :‬לערכים המספרים יש משמעות‪ .‬דוגמה‪ :‬גובה המשכורת‪.‬‬

‫פרק ראשון‪ :‬הצגת נתונים בטבלאות ועקומות‬ ‫‪)1‬דוגמה מספרית‪ :‬מדגם של ‪ 31‬יום‪ ,‬הטמפרטורה בחודש אוגוסט בשעה‬ ‫‪:12.00‬‬ ‫‪30,29,28,27,29,30,30,27,26,26,25,26,30,32,30,30,30,31,34,33,27,28,29,3‬‬ ‫‪0,30,29,30,31,27,29,29‬‬ ‫השאלה‪ :‬איך לארגן ולהציג את הנתונים‪ ,‬כך שנוציא מהם את המידע המרבי?‬ ‫‪)1‬הגדרות‬ ‫משתנה‪ :‬גודל העשוי לקבל ערכים שונים‪ .‬דוגמה‪ :‬טמפרטורה‬‫בשעה ‪ 12.00‬באשקלון‪.‬‬ ‫שכיחות‪ :‬כמות ערכים של משתנה הנמצאים בטווח נתון‪ .‬דוגמה‪:‬‬‫השכיחות של הטמפרטורה ‪ 30‬היא ‪ .10‬מסמנים אותה על ידי )‪f(x‬‬ ‫‪.)(frequency‬‬ ‫ניתן להציג את התפלגות השכיחויות‪ ,‬כדלהלן‪:‬‬ ‫‪)f(x‬‬ ‫‪1‬‬ ‫‪3‬‬ ‫‪4‬‬ ‫‪2‬‬ ‫‪6‬‬ ‫‪10‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬

‫‪x‬‬ ‫‪25‬‬ ‫‪26‬‬ ‫‪27‬‬ ‫‪28‬‬ ‫‪29‬‬ ‫‪30‬‬ ‫‪31‬‬ ‫‪32‬‬ ‫‪33‬‬ ‫‪34‬‬

‫‪3‬‬

‫או תוך שימוש בנתונים מקובצים‪:‬‬ ‫‪x‬‬ ‫‪26-25‬‬ ‫‪28-27‬‬ ‫‪30-29‬‬ ‫‪32-31‬‬ ‫‪34-33‬‬

‫‪)f(x‬‬ ‫‪4‬‬ ‫‪6‬‬ ‫‪16‬‬ ‫‪3‬‬ ‫‪2‬‬

‫לשם כך‪ ,‬יש להקפיד על שני תנאים הכרחיים‪:‬‬ ‫המחלקות חייבות להיות זרות‬‫החלוקה חייבת להיות ממצה‬‫בבניית טבלת שכיחויות עלינו למצוא את שביל הזהב בין הקיבוץ המזערי‪ ,‬בו ריבוי‬ ‫הפרטים מקשה עדיין על ההתרשמות‪ ,‬לבין הקיבוץ המרבי‪ ,‬בו ניטשטשו רוב הפרטים‬ ‫החשובים‪.‬‬

‫לכל מחלקה יש גבול עליון וגבול תחתון‬‫גבולות מדומים‪ :‬מדובר בגבולות מדומים כאשר הגבול העליון של‬‫מחלקה איננו מתלכד עם הגבול התחתון של המחלקה שמתחתיה‪ .‬אם‬ ‫זה כן מתלכד‪ ,‬מדובר בגבולות אמיתיים‪.‬‬ ‫מטבלה בעלת גבולות מדומים ניתן לקבל טבלה בעלת גבולות אמיתיים‪ ,‬על ידי חלוקת הרווח בין‬ ‫המחלקות לשניים‪.‬‬ ‫דוגמה‪:‬‬ ‫‪)f(x‬‬ ‫‪4‬‬ ‫‪6‬‬ ‫‪16‬‬ ‫‪3‬‬ ‫‪2‬‬

‫‪x‬‬ ‫‪26.5-24.5‬‬ ‫‪28.5-26.5‬‬ ‫‪30.5-28.5‬‬ ‫‪32.5-30.5‬‬ ‫‪34.5-30.5‬‬

‫אין סתירה לכלל הראשון‪ ,‬כאשר הגבול המשותף איננו מופיע בנתונים‪.‬‬ ‫נקודת אמצע של מחלקה‪ :‬ערך הממוצע בין הגבול העליון לבין הגבול‬‫התחתון שלה‪ .‬דוגמה‪ 33.5 :‬עבור המחלקה העליונה‪.‬‬ ‫רוחב המחלקה‪ :‬ההפרש בין גבול עליון אמיתי לבין גבול תחתון אמיתי‪.‬‬‫דוגמה‪.2 :‬‬ ‫בדרך כלל‪ ,‬נהוג לקבוע רוחב אחיד לכל המחלקות‪ ,‬אך אין זה הכרחי‪ .‬דוגמה‪ :‬מספר שעות‬ ‫שהסטודנטים מקדישים ללימודים כל שבוע‪:‬‬

‫‪4‬‬

‫‪x‬‬ ‫‪>9‬‬ ‫‪12-9‬‬ ‫‪16-13‬‬ ‫‪20-17‬‬ ‫‪<20‬‬

‫‪f(x‬‬ ‫‪1‬‬ ‫‪3‬‬ ‫‪11‬‬ ‫‪29‬‬ ‫‪2‬‬

‫‪)2‬שכיחות יחסית ומצטברת‬ ‫)‪F ( x‬‬ ‫)‪f ( x‬‬ ‫‪ ,‬שכיחות מצטברת‪ . F ( x) = ∑ f (t ) :‬שכיחות יחסית מצטברת‪:‬‬ ‫שכיחות יחסית‪:‬‬ ‫‪t≤x‬‬ ‫‪n‬‬ ‫‪n‬‬

‫דוגמה‪:‬‬ ‫‪)F(x‬‬ ‫‪4‬‬ ‫‪10‬‬ ‫‪26‬‬ ‫‪29‬‬ ‫‪31‬‬

‫‪F(x)/n‬‬ ‫‪4/31‬‬ ‫‪10/31‬‬ ‫‪26/31‬‬ ‫‪29/31‬‬ ‫‪1‬‬

‫‪)f(x‬‬ ‫‪4‬‬ ‫‪6‬‬ ‫‪16‬‬ ‫‪3‬‬ ‫‪2‬‬

‫‪f(x)/n‬‬ ‫‪4/31‬‬ ‫‪6/31‬‬ ‫‪16/31‬‬ ‫‪3/31‬‬ ‫‪2/31‬‬

‫‪x‬‬ ‫‪26.5-24.5‬‬ ‫‪28.5-26.5‬‬ ‫‪30.5-28.5‬‬ ‫‪32.5-30.5‬‬ ‫‪34.5-32.5‬‬

‫פלט ‪:SPSS‬‬ ‫‪groupe d‬‬ ‫‪Cumulative‬‬ ‫‪Percent‬‬ ‫‪12.9‬‬ ‫‪32.3‬‬ ‫‪83.9‬‬ ‫‪93.5‬‬ ‫‪100.0‬‬

‫‪Valid Percent‬‬ ‫‪12.9‬‬ ‫‪19.4‬‬ ‫‪51.6‬‬ ‫‪9.7‬‬ ‫‪6.5‬‬ ‫‪100.0‬‬

‫‪Percent‬‬ ‫‪12.9‬‬ ‫‪19.4‬‬ ‫‪51.6‬‬ ‫‪9.7‬‬ ‫‪6.5‬‬ ‫‪100.0‬‬

‫‪Frequency‬‬ ‫‪4‬‬ ‫‪6‬‬ ‫‪16‬‬ ‫‪3‬‬ ‫‪2‬‬ ‫‪31‬‬

‫‪25.5‬‬ ‫‪27.5‬‬ ‫‪29.5‬‬ ‫‪31.5‬‬ ‫‪33.5‬‬ ‫‪Total‬‬

‫‪Valid‬‬

‫‪)3‬דיאגרמת מקלות ומצולע‬ ‫דיאגרמת מקלות הוא תרשים במערכת צירים‪ ,‬בו הציר האופקי מייצג‬‫את ציר המשתנה ‪( ,x‬לוקחים את אמצעי המחלקות)‪ ,‬ואילו הציר האנכי‬ ‫מייצג את ציר השכיחויות ‪( )f(x‬או שכיחות יחסית‪ ,‬וכו')‪.‬‬

‫‪5‬‬

‫‪20‬‬

‫‪15‬‬

‫‪t‬‬ ‫‪n‬‬ ‫‪u‬‬ ‫‪o10‬‬ ‫‪C‬‬

‫‪5‬‬

‫‪0‬‬ ‫‪31.5‬‬

‫‪33.5‬‬

‫‪27.5‬‬

‫‪29.5‬‬

‫‪25.5‬‬

‫‪grouped‬‬

‫‪-‬‬

‫מצולע מתקבל מדיאגרמת מקלות על ידי מתיחת קווים בין ראשי‬‫המקלות השונים‪.‬‬ ‫דוגמה‪:‬‬ ‫‪16‬‬

‫‪14‬‬

‫‪12‬‬

‫‪10‬‬

‫‪8‬‬

‫‪t‬‬ ‫‪n‬‬ ‫‪u‬‬ ‫‪o‬‬ ‫‪C‬‬

‫‪6‬‬

‫‪4‬‬

‫‪2‬‬ ‫‪33.5‬‬

‫‪31.5‬‬

‫‪29.5‬‬

‫‪27.5‬‬

‫‪25.5‬‬

‫‪grouped‬‬

‫‪)2‬הסטוגרמה‬ ‫יש לעבור לגבולות אמיתיים כדי לבנות הסטוגרמה‪ ,‬כדלהלן‪:‬‬

‫‪6‬‬

‫‪20‬‬

‫‪15‬‬

‫‪y‬‬ ‫‪c‬‬ ‫‪n‬‬ ‫‪e‬‬ ‫‪u‬‬ ‫‪q‬‬ ‫‪er10‬‬ ‫‪F‬‬

‫‪5‬‬

‫‪Mean = 29.048‬‬ ‫‪Std. Dev. = 2.0468‬‬ ‫‪N = 31‬‬ ‫‪0‬‬ ‫‪34.0‬‬

‫‪32.0‬‬

‫‪30.0‬‬

‫‪28.0‬‬

‫‪26.0‬‬

‫‪grouped‬‬

‫אם רוחב המחלקה איננו אחיד‪ ,‬גובה כל מלבן נקבע על ידי חילוק השכיחות ברוחב המחלקה‪.‬‬ ‫רוחב המלבן הוא בכל מקרה רוחב המחלקה‪.‬‬ ‫דוגמה‪:‬‬ ‫גובה‬ ‫‪2‬‬ ‫‪4‬‬ ‫‪4‬‬ ‫‪2‬‬

‫רוחב‬ ‫‪1‬‬ ‫‪3‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪3‬‬

‫‪xf(x‬‬ ‫‪4-3‬‬ ‫‪2‬‬ ‫‪7-4 12‬‬ ‫‪9-7 12‬‬ ‫‪10-9‬‬ ‫‪4‬‬ ‫‪13-10‬‬ ‫‪6‬‬

‫‪7‬‬

‫פרק שני‪ :‬מדדים למיקום מרכזי‬ ‫‪)1‬ערכים בודדים‬ ‫שכיח ( ‪ :)Mode‬אותו ערך המופיע בשכיחות הגבוהה ביותר‪ .‬דוגמה‪.30 :‬‬ ‫אמצע הטווח ( ‪ :)Midrange‬הממוצע בין התצפית הגדולה ביותר והקטנה ביותר‪.‬‬ ‫‪34 + 25‬‬ ‫דוגמה‪= 29.5 :‬‬ ‫‪2‬‬

‫חציון ( ‪ :)Median‬כאשר נתונה רשימת תצפיות שסודרו בסדר עולה‪ ,‬זה ערך התצפית המרכזית‬ ‫אם מספר התצפיות אי‪-‬זוגי‪ .‬אם מספרם זוגי‪ ,‬הוא ממוצע ערכיהן של שתי התצפיות המרכזיות‪.‬‬ ‫דוגמה‪.29 :‬‬ ‫‪n‬‬

‫ממוצע ( ‪∑ x :)Mean‬‬ ‫‪ .‬דוגמה‪29.09 :‬‬ ‫=‪x‬‬ ‫‪i‬‬

‫‪i =1‬‬

‫‪n‬‬

‫‪)2‬נתונים מקובצים‬ ‫שכיח‪ :‬בתנאי שרוחב המחלקה אחיד‪ ,‬הוא נקודת האמצע של המחלקה השכיחה ביותר‪ .‬יתכן‬ ‫מספר שכיחים‪ .‬דוגמה‪.29.5 :‬‬ ‫אמצע הטווח‪ :‬הוא הממוצע בין הגבול העליון של המחלקה העליונה לבין הגבול התחתון של‬ ‫המחלקה התחתונה‪.‬‬ ‫‪24.5 + 34.5‬‬ ‫דוגמה‪= 29.5 :‬‬ ‫‪2‬‬

‫חציון‪:‬‬ ‫) ‪n / 2 - F( xm−1‬‬ ‫‪⋅ ( L1 − L0 ) + L0‬‬ ‫) ‪f ( xm‬‬

‫כאשר‪:‬‬ ‫‪ :n‬מספרם הכולל של התצפיות‪.‬‬ ‫‪ : xm‬המחלקה בה נמצא החציון‪.‬‬ ‫‪ : xm−1‬המחלקה הקודמת ל‪xm -‬‬ ‫) ‪ : F ( xm−1‬השכיחות המצטברת עד למחלקה ‪xm−1‬‬ ‫) ‪ : f ( xm‬שכיחות המחלקה ‪xm‬‬ ‫‪ : L0‬גבול תחתון אמיתי של המחלקה שבה נמצא החציון‬

‫= ‪Md‬‬

‫‪8‬‬

‫‪ : L1‬גבול עליון אמיתי של המחלקה שבה נמצא החציון‬

‫‪9‬‬

‫דוגמה‪:‬‬

‫‪31 / 2 − 10‬‬ ‫‪⋅ (30.5 − 28.5) + 28.5 = 29.1875‬‬ ‫‪16‬‬

‫= ‪Md‬‬

‫הערה‪ :‬אם מספר התצפיות הינו זוגי ושתי תצפיות המרכזיות נמצאות בשתי מחלקות‬ ‫נפרדות‪ ,‬אזי החציון הוא הגבול המשותף לשתי המחלקות‪.‬‬ ‫ממוצע‪:‬‬

‫)‪∑ x ⋅ f ( x‬‬ ‫‪x‬‬

‫‪n‬‬

‫=‪x‬‬

‫כאשר ‪ x‬הוא האמצע של כל מחלקה‪ .‬דוגמה‪29.048 :‬‬ ‫‪Statistics‬‬ ‫טמפרטורה‬ ‫‪31‬‬ ‫‪0‬‬ ‫‪29.10‬‬ ‫‪29.00‬‬ ‫‪30‬‬

‫‪grouped‬‬ ‫‪31‬‬ ‫‪0‬‬ ‫‪29.048‬‬ ‫‪29.500‬‬ ‫‪29.5‬‬

‫‪Valid‬‬ ‫‪Missing‬‬

‫‪N‬‬ ‫‪Mean‬‬ ‫‪Median‬‬ ‫‪Mode‬‬

‫הערה‪ :‬החציון של הנתונים המקובצים איננו מדויק‪.‬‬ ‫‪)3‬השוואה בין המדדים השונים‬ ‫אמצע הטווח (במידה גדולה) והממוצע (במידה פחותה) מושפעים מערכים קיצוניים‪,‬‬ ‫ואילו השכיח והחציון אינם מושפעים מהם‪.‬‬ ‫השכיח והחציון נשענים יותר על שכיחות התצפיות השונות‪ ,‬ואילו הממוצע ואמצע‬ ‫הטווח יותר על ערכיהן‪.‬‬ ‫הממוצע הוא בדרך כלל ומן הסתם המדד המשקף ביותר ולכן הוא המדד השימושי‬ ‫ביותר‪.‬‬

‫‪10‬‬

‫פרק שלישי‪ :‬מדדים לפיזור‬ ‫אין כאן הבחנה בין ערכים בודדים לנתונים מקובצים‪.‬‬ ‫אחוז השגיאות‪ :‬אחוז מספר התצפיות שאינן השכיח‪ ,‬או שאינן במחלקה השכיחה‪.‬‬ ‫‪100 *15‬‬ ‫דוגמה‪ :‬בנתונים מקובצים‪= 48.38% :‬‬ ‫‪31‬‬

‫‪.‬‬

‫טווח ( ‪ :)Range‬ההפרש בין הערך הגבוה ביותר והערך הנמוך ביותר‪ .‬דוגמה‪ :‬בערכים הבודדים‪:‬‬ ‫‪9=34-25‬‬ ‫ממוצע הסטיות המוחלטות מהממוצע‪:‬‬ ‫|‪−x‬‬

‫‪n‬‬

‫‪∑| x‬‬

‫‪i‬‬

‫‪i =1‬‬

‫‪n‬‬

‫הגיוני‪ ,‬אבל לא נוח‪ ,‬ולכן לא שימושי‪.‬‬ ‫שונות ( ‪:)Variance‬‬ ‫‪)1‬ערכים בודדים‪:‬‬ ‫‪− x )2‬‬

‫‪n‬‬

‫‪∑ (x‬‬

‫‪i‬‬

‫‪n‬‬

‫‪i =1‬‬

‫= ‪s2‬‬

‫דוגמה‪.4.29 :‬‬ ‫‪)2‬נתונים מקובצים‪:‬‬ ‫)‪⋅ f ( x‬‬

‫‪2‬‬

‫)‪∑ (x − x‬‬ ‫‪x‬‬

‫‪n‬‬

‫= ‪s‬‬

‫דוגמה‪.4.05 :‬‬ ‫סטיית תקן( ‪s = s 2 :)Standard Deviation‬‬ ‫‪Statistics‬‬ ‫‪31‬‬ ‫‪0‬‬ ‫‪2.071‬‬ ‫‪4.290‬‬ ‫‪9‬‬

‫‪Valid‬‬ ‫‪Missing‬‬

‫טמפרטורה‬ ‫‪N‬‬ ‫‪Std. Deviation‬‬ ‫‪Variance‬‬ ‫‪Range‬‬

‫‪2‬‬

‫‪11‬‬

‫פרק רביעי‪ :‬אמידה נקודתית‬ ‫‪.1‬דגימה מקרית‪:‬‬ ‫‪.1‬מושגים בסיסיים‬ ‫‪)1‬אוכלוסיה‪ :‬כלל הפריטים לגביהם אנו שואלים שאלה‬ ‫מסוימת‬ ‫‪)2‬פרמטר‪ :‬גודל קבוע המאפיין את האוכלוסייה (למשל‪ρ, ,‬‬ ‫‪)σ, μ‬‬ ‫‪)3‬מדגם מקרי‪ :‬תת‪-‬אוכלוסיה שעליה בודקים את נושא‬ ‫השאלה‪ ,‬כאשר יש הסתברות שווה לכל איבר‬ ‫באוכלוסיה להופיע במדגם‬ ‫‪)4‬אמידה‪ :‬על סמך תוצאות המדגם‪ ,‬חישוב ערך משוער‬ ‫לפרמטר המבוקש‪.‬‬ ‫‪.2‬ייצוג מתמטי של המדגם (‪)X1,...,Xn‬‬ ‫•לכל ‪ Xi‬אותה פונקצית הסתברות‬ ‫•כל ה‪ Xi-‬הם בלתי תלויים‬

‫‪.2‬אמידה‪:‬‬ ‫) ‪θˆ = f ( X 1 ,..., X n‬‬

‫‪.1‬סטטיסטי‪:‬‬ ‫‪n‬‬

‫‪i‬‬

‫דוגמה‪:‬‬

‫‪∑X‬‬ ‫‪i =1‬‬

‫‪n‬‬

‫= ‪µˆ = X‬‬

‫‪.2‬אומד (‪ θˆ :)Estimator‬בתור משתנה מקרי‪:‬‬ ‫‪.3‬אומדן (‪ :)Estimation‬תצפית של ˆ‪: θ‬‬

‫‪i‬‬

‫‪i‬‬

‫‪∑x‬‬ ‫‪n‬‬

‫‪∑X‬‬ ‫‪n‬‬

‫על סמך מדגם מסוים‬

‫‪.3‬הטייה‪:‬‬ ‫‪E (θˆ) − θ‬‬

‫‪.1‬הגדרה‪:‬‬ ‫האומד ˆ‪ θ‬הינו חסר הטייה אם ‪E (θˆ) = θ‬‬ ‫‪.2‬אומד חסר הטייה עבור התוחלת‪:‬‬ ‫‪n‬‬

‫משפט‪:‬‬

‫‪i‬‬

‫‪∑X‬‬ ‫‪i =1‬‬

‫‪n‬‬

‫= ˆ‪µ‬‬

‫הוא אומד חסר הטייה עבור ‪.μ‬‬

12  n  ∑ X i  = E ( µˆ ) = E  i =1  n   

.‫ל‬.‫ש‬.‫מ‬

n

∑ E( X i =1

i

n

∑µ

) =

n

i =1

n

= µ :‫הוכחה‬

:‫אומד חסר הטייה עבור השונות‬.3

n

.σ2 ‫ ˆ הוא אומד חסר הטייה עבור‬2 ∑ σ = i =1  n 2  ∑ ( X i − µ)  = E (σˆ 2 ) = E  i =1 n    

.‫ל‬.‫ש‬.‫מ‬

n

.σ2 ‫ ˆ הוא אומד חסר הטייה עבור‬2 ∑ σ = i =1

( X i − µ)2

‫ אזי‬,‫ ידוע‬μ ‫ אם‬:‫משפט‬

n

n

n

∑ E( X i − µ)2

=

i =1

n

(X i − X )2

∑σ

2

= σ 2 :‫הוכחה‬

i =1

n

‫אזי‬,‫ אינו ידוע‬μ ‫ אם‬:‫משפט‬

n −1 2

:‫הוכחה‬

[

]

a = ∑ ( X i − X ) 2 = ∑ [( X i − µ ) − ( X − µ ) ] = ∑ ( X i − µ ) + ( X − µ ) − 2( X i − µ ) ( X − µ ) = n

n

i =1

i =1

n

i =1

2

2

= ∑ ( X i − µ ) + n( X − µ ) − 2( X − µ ) ∑ ( X i − µ ) = ∑ ( X i − µ ) + n( X − µ ) − 2n( X − µ ) = n

2

2

i =1

= ∑ ( X i − µ ) − n( X − µ ) n

2

n

n

i =1

i =1

2

2

2

i =1

⇒ E (a) = nσ 2 − nV ( X )  n  ∑ Xi V ( X ) = V  i =1  n  

  =   

n

∑σ i =1

n2

2

=

⇒ E (a) = nσ − σ = (n − 1)σ 2

2

σ2 n 2

2  a  (n − 1)σ ⇒ E = =σ2  n −1  n −1

.‫ל‬.‫ש‬.‫מ‬ σˆ 2 =

1 n −1

(∑ X

2 i

)

−nX 2 :‫הערה‬

:‫ של התפלגות בינומית‬p ‫אומד חסר הטייה עבור הפרמטר‬.4 ‫ – מספר הצלחות‬k :‫נתון‬ ‫ – מספר ניסויים‬n

2

‫‪13‬‬ ‫‪k‬‬ ‫אם כן‪ ,‬האומד המתקבל על הדעת הוא‪:‬‬ ‫‪n‬‬

‫= ˆ‪ , p‬כאשר )‪. k ~ B(n, p‬‬ ‫‪ k  E ( k ) np‬‬ ‫= ‪E ( pˆ ) = E  ‬‬ ‫=‬ ‫‪=p‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪n‬‬

‫לכן ‪ k n‬הוא אומד חסר הטייה‪.‬‬ ‫‪.5‬אומד חסר הטייה עבור הפרמטר ‪ θ‬של התפלגות אחידה‪:‬‬ ‫נניח ) ‪X ~ U (0, θ‬‬ ‫‪θ‬‬ ‫= ) ‪θˆ1 = 2 X ⇐ E ( X‬‬ ‫‪2‬‬ ‫ˆ‬ ‫ניקח עכשיו‪. θ 2 = max( X i ) :‬‬ ‫‪n‬‬

‫‪n‬‬ ‫‪x‬‬ ‫ˆ‬ ‫‪Fθˆ ( X ) = P (θ 2 < x ) = ∏ P ( X i < x) =  ‬‬ ‫‪2‬‬ ‫‪θ ‬‬ ‫‪i =1‬‬ ‫‪n −1‬‬ ‫‪nx‬‬ ‫‪⇒ f θˆ (n) = n‬‬ ‫‪2‬‬ ‫‪θ‬‬

‫‪θ‬‬

‫ˆ ‪n +1‬‬ ‫⇐ ‪θ2‬‬ ‫‪n‬‬

‫‪θ‬‬ ‫‪θ‬‬ ‫‪xnx n −1 dx‬‬ ‫‪nx n dx‬‬ ‫‪n  x n +1 ‬‬ ‫‪n θ n +1‬‬ ‫‪nθ‬‬ ‫∫ = ) ‪⇒ E (θˆ2‬‬ ‫=‬ ‫=‬ ‫=‬ ‫⋅‬ ‫=‬ ‫‪‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪n ‬‬ ‫‪n‬‬ ‫∫‬ ‫‪θ‬‬ ‫‪θ  n + 1 0 θ n + 1 n + 1‬‬ ‫‪0‬‬ ‫‪0 θ‬‬

‫= ‪ θˆ3‬הוא אומד חסר הטייה‪.‬‬

‫‪.6‬אומד חסר הטייה בצורה אסימפטוטית‪:‬‬ ‫א) הגדרה‪lim E (θˆ) = θ :‬‬ ‫∞→ ‪n‬‬

‫ב) דוגמה‪:‬‬ ‫‪2‬‬

‫)‪− X‬‬

‫‪i‬‬

‫‪∑(X‬‬

‫= ‪σˆ 2‬‬

‫‪n‬‬ ‫‪(n − 1)σ 2‬‬ ‫‪σ2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫= ˆ‪E σ‬‬ ‫‪=σ −‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪2‬‬ ‫‪‬‬ ‫‪σ ‬‬ ‫‪ = σ 2‬‬ ‫‪lim σ 2 −‬‬ ‫∞→ ‪n‬‬ ‫‪n ‬‬ ‫‪‬‬

‫) (‬

‫‪.4‬שיטת הנראות המרבית‪:‬‬ ‫‪n‬‬

‫‪.1‬נראות של המדגם (‪)X1,...,Xn‬‬

‫) ‪L( X 1 ,..., X n ;θ ) = ∏ f ( xi , θ‬‬ ‫‪i =1‬‬

‫(במקרה בדיד‪ ,‬לוקחים עבור ) ‪) Pθ ( X = xi ) : f ( xi ,θ‬‬

‫‪14‬‬

‫‪.2‬שיטת הנראות המרבית‬

‫הגדרה‪ :‬אומדן בעל נראות מרבית ˆ‪ θ‬מקיים את התנאי הבא‪:‬‬ ‫) ‪L x, θˆ ≥ L( x, θ‬‬

‫) (‬

‫דרך החישוב‪:‬‬

‫‪∀θ ∈ Θ‬‬

‫‪θ ∈Θ‬‬

‫•בעקרון‪ ,‬צריכים לבדוק שהנגזרת השנייה שלילית‪.‬‬ ‫‪e − λ λk‬‬ ‫!‪k‬‬

‫) ‪X ~ P (λ‬‬

‫דוגמה‪:‬‬

‫) (‬

‫) ‪L x,θˆ = max L( x,θ‬‬ ‫) ‪∂ ln L( x, θ‬‬ ‫‪=0‬‬ ‫‪∂θ‬‬

‫= ) ‪P( X = k‬‬ ‫‪e − λ λki e − nλ λ∑ ki‬‬ ‫=‬ ‫! ‪ki‬‬ ‫! ‪∏ ki‬‬

‫‪i‬‬

‫⇒‬

‫‪n‬‬

‫∏ = ) ‪L ( x, λ‬‬ ‫‪i =1‬‬

‫)! ‪ln L = − nλ + ∑ k i ln λ − ln ( ∏ k i‬‬

‫‪∑k‬‬

‫= ˆ‪λ‬‬

‫‪n‬‬

‫⇒‬

‫‪∂ ln L‬‬ ‫‪∑ ki = 0‬‬ ‫‪= −n +‬‬ ‫‪∂λ‬‬ ‫‪λ‬‬ ‫‪∂ 2 ln L‬‬ ‫‪∑ ki‬‬ ‫‪=− 2 <0‬‬ ‫‪2‬‬ ‫‪∂λ‬‬ ‫‪λ‬‬

‫‪.5‬אומד מתכנס‪:‬‬ ‫הגדרה‪ :‬אומד נקרא מתכנס אם השונות שלו שואפת לאפס‬ ‫דוגמה‪:‬‬

‫) ‪X ~ N (µ ,σ 2‬‬

‫‪i‬‬

‫‪∑X‬‬ ‫‪n‬‬

‫‪lim V (θˆ) = 0‬‬ ‫∞→ ‪n‬‬

‫= ‪X‬‬

‫‪σ2‬‬ ‫‪lim‬‬ ‫‪=0‬‬ ‫‪n →∞ n‬‬

‫‪σ2‬‬ ‫= ) ‪V (X‬‬ ‫‪n‬‬

‫‪.6‬השוואה בין אומדים שונים‪:‬‬ ‫יהיו נתונים שני אומדים חסרי הטייה‪ .‬נעדיף את האומד בעל השונות הנמוכה‬ ‫מביניהם‪.‬‬

15

:‫דוגמה‬ µˆ 1 = X

µˆ 2 = X 1

V ( µˆ 1 ) = V ( X ) = ∀n > 1

σ2 n

V ( µˆ 2 ) = V ( X 1 ) = σ 2

σ2 <σ2 n

. X 1 ‫ עדיף על פני‬X ‫לכן‬

‫‪16‬‬

‫פרק חמישי‪ :‬רווחי סמך‬ ‫‪.1‬רווח‪-‬סמך עבור ‪ μ‬כאשר ‪ σ‬ידוע‪:‬‬ ‫משפט‪ :‬אם ) ‪ X ~ N ( µ , σ 2‬או ‪ , n > 30‬אזי ‪: ∀α 0 ≤ α ≤ 1‬‬

‫‪‬‬ ‫הוכחה‪ :‬אם ‪ X~N‬או ‪ , n > 30‬אזי ‪‬‬ ‫‪‬‬

‫‪2‬‬

‫‪1−α‬‬

‫‪α‬‬

‫‪2‬‬ ‫‪2‬‬

‫‪zα‬‬

‫‪2‬‬

‫‪− zα‬‬

‫‪α‬‬ ‫‪0‬‬

‫‪‬‬ ‫‪σ‬‬ ‫‪σ ‬‬ ‫⋅ ‪P X − zα‬‬ ‫⋅ ‪< µ < X + zα‬‬ ‫‪ = 1 − α‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪‬‬ ‫‪ σ2‬‬ ‫‪. X ~ N  µ ,‬‬ ‫‪n‬‬ ‫‪‬‬

‫‪‬‬ ‫‪‬‬ ‫) ‪n ⋅( X − µ‬‬ ‫< ‪⇒ P − zα‬‬ ‫‪< zα  = 1 − α‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪σ‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪σ‬‬ ‫‪σ ‬‬ ‫⋅ ‪⇒ P − zα‬‬ ‫⋅ ‪< X − µ < zα‬‬ ‫‪ = 1 − α‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪σ‬‬ ‫‪σ ‬‬ ‫⋅ ‪⇒ P X − zα‬‬ ‫⋅ ‪< µ < X + zα‬‬ ‫‪ = 1 − α‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪‬‬ ‫‪.‬מ‪.‬ש‪.‬ל‬

‫דוגמה‪ . X ~ N ( µ ,4) :‬בנה רווח של ‪ 95%‬עבור ‪ ,μ‬כאשר התקבל ‪.n=10 , X = 12‬‬ ‫‪φ  zα  = 0.975‬‬ ‫‪⇒ zα = 1.96‬‬ ‫‪2‬‬ ‫‪ 2‬‬ ‫‪σ‬‬ ‫‪2‬‬ ‫⋅ ‪⇒ X − zα‬‬ ‫× ‪= 12 − 1.96‬‬ ‫‪= 10.76‬‬ ‫‪2‬‬ ‫‪n‬‬ ‫‪10‬‬ ‫‪σ‬‬ ‫‪2‬‬ ‫⋅ ‪X + zα‬‬ ‫× ‪= 12 + 1.96‬‬ ‫‪= 13.24‬‬ ‫‪2‬‬ ‫‪n‬‬ ‫‪10‬‬ ‫‪⇒ P (10.76 < µ < 13.24) = 0.95‬‬

‫‪.2‬רווח‪-‬סמך עבור ‪ μ‬כאשר ‪ σ‬אינו ידוע‪:‬‬ ‫‪ n.1‬גדול ( ‪:) n > 30‬‬

‫)‬

‫אז אפשר להחליף את ‪ σ‬ב‪ ,s-‬כאשר ‪−nx 2‬‬

‫‪2‬‬ ‫‪i‬‬

‫‪(∑ x‬‬

‫‪1‬‬ ‫‪n −1‬‬

‫= ‪ , s‬ולהשתמש בנוסחה‬

‫הנ"ל‪:‬‬ ‫‪‬‬ ‫‪s‬‬ ‫‪s ‬‬ ‫⋅ ‪P X − zα‬‬ ‫⋅ ‪< µ < X + zα‬‬ ‫‪ = 1 − α‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪‬‬

‫‪ n.2‬קטן ( ‪:) n ≤ 30‬‬ ‫‪ X)1‬אינו מתפלג נורמלית‪ :‬אין פתרון‪.‬‬ ‫‪ X)2‬מתפלג נורמלית‪ .‬אזי‪:‬‬

17

)3 n

s = 2



∑(X i =1

i

− X )2

n  Xi − X ( n − 1) s 2  = ∑ 2 σ σ i =1 



n −1

( X − µ) n ⋅ n −1 ⋅σ

σ ⋅ s ⋅ n −1

=

2

  ~ χ n2−1 

X −µ

σ

n

~ N (0,1)

(X − µ) n ~ t ( n −1) s

  ( X − µ) n ⇒ P − tα < < tα  = 1 − α 2 2 s    s s  ⇒ P X − tα ⋅ < µ < X + tα ⋅  = 1 − α 2 2 n n 

: α = 0.1 , n = 25 , s = 10 , X = 5 :‫דוגמה‬ ⇒ t 0.05 ( 24) = 1.71 ⇒ µ = 5±

1.71 × 10 25

= 5 ± 3.42

:‫סמך עבור פרופורציה‬-‫רווח‬.3 p ‫אומד עבור‬.1 pˆ = E ( pˆ ) =

V ( pˆ ) = pˆ − p pq

E (Y ) np = =p n n

Y n

Y ~ B (n, p )

‫ הוא חסר הטייה‬pˆ ‫ובכן‬

V (Y ) npq pq = 2 = n n2 n

:‫ לפי משפט הגבול המרכזי‬,‫ גדול‬n ‫ אם‬,‫ובכן‬ ~ N (0,1)

n

) np, nq ≥ 5 ‫ למעשה‬,‫ גדול‬n ‫ (אם‬p ‫רווח סמך עבור‬.2  P pˆ − zα ⋅ 2 

pˆ qˆ < p < pˆ + zα ⋅ 2 n

pˆ qˆ   =1−α n 

18

:)‫סמך עבור השונות (דרושה התפלגות נורמלית‬-‫רווח‬.4

∑(X n

s2 =

i =1

i

− X)

2

n −1 (n − 1) s 2 ~ χ n2−1 2 σ

  (n − 1) s 2 ⇒ P χ 12−α < < χ α2  = 1 − α 2 2 2 σ     2 (n − 1) s 2   (n − 1) s 2 ⇒ P <σ < = 1−α 2 χ 12−α   χα 2 2   α 2

1− α

α

-‫ ש‬,‫אנחנו ראינו‬

2

‫‪19‬‬

‫פרק שישי‪ :‬בדיקת השערות‬ ‫‪.1‬מבוא‪:‬‬ ‫דוגמה‪ :‬מוכר נורות טוען שבממוצע‪ ,‬משך חיים של נורותיו הינו ‪ 200‬שעות‪ .‬אגודת‬ ‫הצרכנים רוצה לבדוק אם טענתו נכונה‪ :‬היא מוציאה מדגם של ‪ 25‬נורות‬ ‫ומחשבת את הממוצע של המדגם‪ .‬היא תחליט שלא לקבל טענתו של המוכר‬ ‫אם יש מרחק רב בין הממוצע שהתקבל לבין ‪ .200‬אבל מה הגבול?‬

‫‪.2‬הגדרות יסודיות‪:‬‬

‫‪µ = 200‬‬

‫•השערת אפס ‪ :H0‬הטענה שדנים עליה‬ ‫•השערה אלטרנטיבית ‪:H1‬‬ ‫‪µ < 200‬‬

‫ההשערה האלטרנטיבית יכולה להיות או חד‪-‬צדדית‪ ,‬או דו‪-‬צדדית‪.‬‬ ‫•סוגי טעויות‪:‬‬ ‫ההחלטה‬ ‫‪H1‬‬

‫‪H0‬‬

‫‪I‬‬

‫אין‬ ‫טעות‬

‫‪H0‬‬

‫אין‬ ‫טעות‬

‫‪II‬‬

‫‪H1‬‬

‫המצב‬ ‫האמיתי‬

‫‪ :α‬הסתברות לטעות מסוג ‪I‬‬ ‫‪ :β‬הסתברות לטעות מסוג ‪II‬‬

‫‪ :β-1‬עוצמת המבחן‬ ‫•אזור קריטי (או אזור הדחייה)‪ :‬האזור שאם בו נופל הערך‬ ‫שהתקבל ע"י המדגם‪ ,‬מחליטים לדחות את ‪ .H0‬ובכן‪ α ,‬הוא‬ ‫ההסתברות של האזור הקריטי‪ ,‬בתנאי ש‪H0 -‬היא נכונה‪.‬‬ ‫•מובהקות (‪ :)P-Value‬ההסתברות לקבל ערך "קיצוני" יותר‬ ‫מהסטטיסטי שהתקבל בפועל‪ ,‬בהנחה שהשערת האפס היא נכונה‪.‬‬ ‫אם המובהקות קטנה מרמת המובהקות שהחליטו עליה‪ ,‬אזי דוחים‬ ‫את השערת האפס‪.‬‬

‫‪.3‬הפעלת הבדיקה‪:‬‬

‫•קביעת ההשערות ‪ H0‬ו‪H1 -‬‬ ‫•קביעת המקרה שבו נמצאים‬ ‫•קביעת האזור הקריטי‬ ‫•חישוב הסטטיסטי‬ ‫•בדיקת מיקום הסטטיסטי ומסקנה‬

‫‪µ0‬‬

‫‪‬‬

‫‪20‬‬

‫‪ .4‬סוגים שונים של מקרים‪:‬‬ ‫‪.1‬מבחן על ‪ μ , X‬מתפלג נורמלית או ‪ n>30 , σ‬ידוע‬ ‫‪x − µ0‬‬

‫‪‬‬

‫‪n‬‬

‫‪σ‬‬

‫=‪z‬‬

‫‪µ > µ0‬‬

‫‪µ ≠ µ0‬‬ ‫‪z > zα‬‬

‫‪z > zα‬‬

‫‪µ = µ0‬‬

‫‪H0 :‬‬

‫‪µ < µ0‬‬

‫‪H1 :‬‬

‫‪z < − zα‬‬

‫אזור קריטי‪:‬‬ ‫דוגמה‪ :‬דיקן האוניברסיטה טוען שרמת הסטודנטים בלשון העברית היא ‪.67.5‬‬ ‫אגודת הסטודנטים טוענת שאין פרט זה נכון‪ .‬לשם בדיקת טענתו‪ ,‬נלקח מדגם של ‪100‬‬ ‫סטודנטים‪ ,‬והתקבל ממוצע של ‪ .68.5‬ידועה סטיית התקן‪ ,‬על‪-‬פי ניסיון העבר‪ ,‬והיא‬ ‫שווה ‪ .5‬מה ניתן להסיק ברמת מובהקות של ‪?0.05‬‬ ‫‪2‬‬

‫‪H 0 : µ = 67.5‬‬ ‫‪H 1 : µ ≠ 67.5‬‬

‫‪zα = 1.96‬‬ ‫‪2‬‬

‫‪68.5 − 67.5‬‬ ‫‪=2‬‬ ‫‪5‬‬ ‫‪10‬‬

‫‪n = 100‬‬ ‫‪α = 0.05‬‬ ‫‪x = 68.5‬‬ ‫‪σ =5‬‬

‫=‪z‬‬

‫מסקנה‪ :‬דוחים את ‪.H0‬‬ ‫‪.2‬מבחן על ‪ μ , X‬מתפלג נורמלית‪ σ ,‬אינו ידוע‬ ‫‪)1‬אם ‪ , n > 30‬כמו ב‪4-‬א'‪ ,‬רק מחליפים ‪ σ‬ב‪.s -‬‬ ‫‪)2‬אם ‪ , n ≤ 30‬פועלים כדלהלן‪:‬‬ ‫‪x − µ0‬‬

‫‪‬‬

‫‪n‬‬

‫‪s‬‬

‫=‪t‬‬

‫‪µ > µ0‬‬

‫‪µ ≠ µ0‬‬ ‫‪t > tα‬‬

‫‪t > tα‬‬

‫‪µ = µ0‬‬

‫‪H0 :‬‬

‫‪µ < µ0‬‬

‫‪H1 :‬‬

‫‪t < −t α‬‬

‫אזור קריטי‪:‬‬ ‫דוגמה‪ :‬יצרן תמרוקים רוצה לבדוק אם משקלן של השפופרות הממולאות‬ ‫במפעלו הוא אמנם ‪ 103‬גרם בממוצע‪ .‬התקבלו הנתונים הבאים (ניתן‬ ‫להניח התפלגות נורמלית)‪ .100 ,98 ,104 ,102 ,98 ,102 ,96 :‬מה ניתן‬ ‫להסיק‪ ,‬ברמת מובהקות ‪?0.02‬‬ ‫‪2‬‬

‫‪H 0 : µ = 103‬‬ ‫‪H 1 : µ ≠ 103‬‬

‫‪tα (6) = 3.143‬‬

‫‪n=7‬‬ ‫‪α = 0.02‬‬ ‫‪x = 100‬‬

‫‪2‬‬

‫‪100 − 103‬‬ ‫‪= −2.8‬‬ ‫‪2.83‬‬ ‫‪7‬‬

‫=‪t‬‬ ‫‪2‬‬

‫‪= 2.83‬‬

‫מסקנה‪ :‬לא דוחים את ‪.H0‬‬

‫)‪− X‬‬

‫‪i‬‬

‫‪∑( X‬‬

‫‪n −1‬‬

‫=‪s‬‬

‫‪21‬‬

‫‪.3‬מבחן על ‪ X1 , µ1 − µ 2‬ו‪ X2-‬מתפלגים נורמלית או ‪σ 2 , σ 1 , n 2 , n1 > 30‬‬

‫ידועים (מדגמים בלתי תלויים)‬

‫‪x1 − x 2 − d 0‬‬

‫‪‬‬

‫‪σ 12 σ 22‬‬ ‫‪+‬‬ ‫‪n1‬‬ ‫‪n2‬‬ ‫‪µ1 − µ 2 ≠ d 0‬‬

‫=‪z‬‬

‫‪µ1 − µ 2 > d 0‬‬

‫‪z > zα‬‬

‫‪z > zα‬‬

‫‪µ1 − µ 2 = d 0‬‬

‫‪H0 :‬‬

‫‪µ1 − µ 2 < d 0‬‬

‫‪H1 :‬‬

‫‪z < − zα‬‬

‫אזור קריטי‪:‬‬ ‫דוגמה‪ :‬חוקר מעוניין לבדוק אם יש הבדל בין יכולתם של גברים ליכולתן של‬ ‫נשים במבחן "יצירת מילים"‪ .‬הוא נתן שש אותיות שונות לקבוצה‬ ‫המונה ‪ 114‬גברים ו‪ 175-‬נשים‪ ,‬וכל נבדק נתבקש להרכיב במשך ‪ 5‬דקות‬ ‫מילים רבות ככל האפשר מאותיות אלו‪ .‬נניח שמניסיון קודם ידוע‬ ‫שסטיית התקן של היכולת במבחנים כאלה היא ‪ 6‬אצל הגברים ו‪ 5-‬אצל‬ ‫הנשים‪ .‬ממוצע מספר המילים של הנשים היה ‪ 21‬ושל הגברים ‪( 19.7‬‬ ‫‪.) α = 0.01‬‬ ‫‪2‬‬

‫‪H 0 : µ1 − µ 2 = 0‬‬

‫‪zα = 2.58‬‬

‫‪H 1 : µ1 − µ 2 ≠ 0‬‬

‫‪2‬‬

‫‪= 1.91‬‬

‫‪(21 − 19.7) − 0‬‬ ‫‪25 36‬‬ ‫‪+‬‬ ‫‪175 114‬‬

‫‪σ1 = 5‬‬ ‫‪σ2 = 6‬‬ ‫‪n1 = 175 n2 = 114‬‬ ‫‪α = 0.01‬‬

‫=‪z‬‬

‫מסקנה‪ :‬לא דוחים את ‪.H0‬‬

‫‪.4‬מבחן על ‪ X1 , µ1 − µ 2‬ו‪ X2-‬מתפלגים נורמלית‪ σ 2 = σ 1 ,‬לא ידועים‬ ‫‪)1‬אם ‪ , n > 30‬כמו ב‪4-‬ג'‪ ,‬רק מחליפים ‪ σ‬ב‪.s -‬‬ ‫‪)2‬אם ‪ , n ≤ 30‬פועלים כדלהלן‪:‬‬ ‫‪( x1 − x 2 ) − d 0‬‬

‫‪‬‬

‫‪1‬‬ ‫‪1‬‬ ‫‪+‬‬ ‫‪n1 n 2‬‬

‫‪µ1 − µ 2 ≠ d 0‬‬

‫אזור קריטי‪:‬‬

‫‪2‬‬

‫‪t > tα‬‬

‫=‪t‬‬

‫⋅ ‪sp‬‬

‫‪µ1 − µ 2 > d 0‬‬ ‫‪t > tα‬‬

‫‪(n1 − 1) s12 + (n 2 − 1) s 22‬‬ ‫= ‪s‬‬ ‫‪n1 + n2 − 2‬‬ ‫‪2‬‬ ‫‪p‬‬

‫‪µ1 − µ 2 = d 0‬‬

‫‪H0 :‬‬

‫‪µ1 − µ 2 < d 0‬‬

‫‪H1 :‬‬

‫‪t < −t α‬‬

‫‪ν = n1 + n 2 − 2‬‬

‫דוגמה‪ :‬חוקר רוצה לבדוק את השפעתם של סמי‪-‬הרגעה חדשים על כושר נהיגה‪.‬‬ ‫‪ 10‬נבדקים קיבלו סם הרגעה‪ ,‬נבחנו מבחן נהיגה וקיבלו ציון ממוצע של‬ ‫‪ ,35‬עם סטיית תקן של ‪ 15 . 15‬נבדקים אחרים קיבלו דמה (תרופה‬ ‫מדומה‪ ,‬חסרת כל השפעה) ואף הם נבחנו באותו מבחן‪ .‬הממוצע בקבוצה‬ ‫זו היה ‪ ,40‬וסטיית התקן הייתה ‪ . 10‬ידוע שציוני מבחן נהיגה מתפלגים‬ ‫נורמלית‪ .‬השאלה היא‪ ,‬אם יש לסמי‪-‬הרגעה השפעה כלשהי על כושר‬ ‫הנהיגה (מניחים שסטיות התקן שוות‪.) α = 0.05 ,‬‬

‫‪22‬‬ ‫‪H 0 : µ1 − µ 2 = 0‬‬

‫‪t 0.025 (23) = 2.069‬‬

‫‪H 1 : µ1 − µ 2 ≠ 0‬‬

‫‪9 × 15 + 14 × 10‬‬ ‫‪= 11.95‬‬ ‫‪23‬‬ ‫‪35 − 40‬‬ ‫=‪t‬‬ ‫‪= −3.542‬‬ ‫‪1.412‬‬ ‫‪3.542 > 2.069‬‬ ‫= ‪s 2p‬‬

‫‪n1 = 10 n 2 = 15‬‬

‫‪α = 0.05‬‬ ‫‪x1 = 35 x 2 = 40‬‬ ‫‪s12 = 15 s 22 = 10‬‬

‫מסקנה‪ :‬דוחים את ‪.H0‬‬ ‫‪.5‬מבחן על ‪ X1 , µ1 − µ 2‬ו‪ X2-‬מזווגים‪ X 1 − X 2 ,‬מתפלג נורמלית‬ ‫‪D = X1 − X 2‬‬ ‫מגדירים משתנה חדש‬ ‫•אם )‪ σ (D‬ידוע‪ ,‬אנו נמצאים במקרה של סעיף א'‬ ‫•אם ‪ , n > 30‬כמו בסעיף א'‬

‫‪‬‬

‫‪µ1 − µ 2 ≠ d 0‬‬

‫אזור קריטי‪:‬‬ ‫‪i‬‬

‫‪µ1 − µ 2 > d 0‬‬

‫‪t > tα‬‬

‫‪i =1‬‬

‫‪n‬‬

‫‪t < −t α‬‬

‫‪d i = x1i − x 2i‬‬

‫= ‪d‬‬ ‫‪d − d0‬‬ ‫‪sd‬‬ ‫‪n‬‬

‫‪µ1 − µ 2 < d 0‬‬

‫‪H1 :‬‬

‫‪t > tα‬‬

‫‪2‬‬ ‫‪n‬‬

‫‪∑d‬‬

‫‪µ1 − µ 2 = d 0‬‬

‫‪H0 :‬‬

‫‪2‬‬

‫=‪t‬‬

‫)‬

‫‪ν = n −1‬‬ ‫‪−d‬‬

‫‪∑ (d‬‬ ‫‪n‬‬

‫‪i‬‬

‫‪i =1‬‬

‫‪n −1‬‬

‫= ‪s d2‬‬

‫דוגמה‪ :‬לקבוצת נבדקים נמסר שאלות לשם הבהרת עמדותיהם בנושא מסוים‪ .‬לאחר‬ ‫מכן הוקרן לפניהם סרט‪ ,‬שהציג את הנושא בצורה חיובית‪ ,‬ושוב נתבקשו‬ ‫הנבדקים למלא שאלון זה‪ .‬האם הגביר הסרט את האהדה לנושא? נתוני‬ ‫הנבדקים מוצגים להלן ( ‪ , α = 0.05‬ניתן להניח כי ההפרש מתפלג נורמלית)‪.‬‬ ‫‪9‬‬

‫‪8‬‬

‫‪7‬‬

‫‪6‬‬

‫‪5‬‬

‫‪4‬‬

‫‪3‬‬

‫‪2‬‬

‫‪1‬‬

‫‪11‬‬

‫‪1‬‬ ‫‪0‬‬ ‫‪8‬‬

‫‪1‬‬ ‫‪2‬‬ ‫‪8‬‬ ‫‪0‬‬ ‫‪1 1 2‬‬ ‫‪0 8 4‬‬ ‫‪t 0.05 (10) = 1.812‬‬

‫‪1‬‬ ‫‪8‬‬ ‫‪2‬‬ ‫‪2‬‬

‫‪2‬‬ ‫‪0‬‬ ‫‪2‬‬ ‫‪4‬‬

‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪0‬‬

‫‪2‬‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪0‬‬

‫‪2‬‬ ‫‪4‬‬ ‫‪2‬‬ ‫‪8‬‬

‫‪2‬‬ ‫‪0‬‬ ‫‪2‬‬ ‫‪4‬‬

‫‪1‬‬ ‫‪8‬‬ ‫‪2‬‬ ‫‪0‬‬

‫‪1‬‬ ‫‪6‬‬ ‫‪2‬‬ ‫‪4‬‬

‫‪d = −3.27‬‬ ‫‪s d2 = 23.42‬‬ ‫‪t = −2.24‬‬ ‫מסקנה‪ :‬דוחים את ‪.H0‬‬

‫‪H 0 : µ1 − µ 2 = 0‬‬ ‫‪H 1 : µ1 − µ 2 < 0‬‬

‫‪α = 0.05‬‬

‫‪X1‬‬ ‫‪X2‬‬

‫‪23‬‬

‫‪.6‬מבחן על ‪ npˆ ≥ 5 ,p‬וגם ‪n(1 − pˆ ) ≥ 5‬‬ ‫‪pˆ − p 0‬‬

‫) ‪p 0 (1 − p 0‬‬ ‫‪n‬‬

‫‪‬‬

‫‪p ≠ p0‬‬

‫אזור קריטי‪:‬‬

‫‪2‬‬

‫=‪z‬‬

‫‪p > p0‬‬

‫‪z > zα‬‬

‫‪p = p0‬‬

‫‪H0 :‬‬

‫‪p < p0‬‬

‫‪H1 :‬‬

‫‪z < − zα‬‬

‫‪z > zα‬‬

‫דוגמה‪ :‬שחקן טוען שהסתברות להוציא "‪ "6‬על קובייה מסוימת קטנה מ‪. 1 6 -‬‬ ‫התקבל "‪ "6‬שמונה פעמים ב‪ 100-‬הטלות‪ .‬מי צודק‪ ,‬ברמת מובהקות ‪?0.05‬‬ ‫‪= −2.325‬‬

‫‪− 16‬‬

‫‪8‬‬ ‫‪100‬‬

‫‪× 56‬‬ ‫‪100‬‬ ‫‪6‬‬

‫‪1‬‬

‫‪6‬‬

‫=‪z‬‬

‫‪1‬‬

‫= ‪H0 : p‬‬

‫‪1‬‬

‫< ‪H1 : p‬‬

‫‪6‬‬

‫‪− z 0.05 = −1.65‬‬

‫מסקנה‪ :‬דוחים את ‪.H0‬‬ ‫‪.7‬מבחן על הפרש פרופורציות‪5 ≤ n2 qˆ 2 , n2 pˆ 2 , n1qˆ1 , n1 pˆ 1 ,‬‬

‫‪‬‬

‫‪p1 − p 2 ≠ d 0‬‬

‫אזור קריטי‪:‬‬

‫‪2‬‬

‫‪p1 − p 2 > d 0‬‬

‫‪z > zα‬‬

‫‪z > zα‬‬

‫‪p1 − p 2 = d 0‬‬

‫‪H0 :‬‬

‫‪p1 − p 2 < d 0‬‬

‫‪H1 :‬‬

‫‪z < − zα‬‬

‫‪pˆ 1 − pˆ 2 − d 0‬‬ ‫‪pˆ 1 qˆ1 pˆ 2 qˆ 2‬‬ ‫‪+‬‬ ‫‪n1‬‬ ‫‪n2‬‬

‫=‪z‬‬

‫‪1‬‬ ‫‪1 ‬‬ ‫אם ‪ , d 0 = 0‬אזי לוקחים כמכנה‪pˆ qˆ  +  :‬‬ ‫‪ n1 n 2 ‬‬

‫‪x1 + x 2‬‬ ‫‪ ,‬כאשר‬ ‫‪n1 + n 2‬‬

‫= ˆ‪. p‬‬

‫דוגמה‪ :‬בסקר דעת קהל על תוכנית טלוויזיה מסוימת נמצא שאחוז הצופים‬ ‫בתוכנית באופן קבוע מבין ‪ 200‬הנשים שנשאלו היה ‪ ,20%‬ומבין ‪300‬‬ ‫הגברים שנשאלו – ‪ .30%‬האם ההבדל הזה מובהק? ( ‪) α = 0.01‬‬ ‫‪0.8 × 200 = 160‬‬

‫‪0.7 × 300 = 210‬‬

‫‪pˆ 1 = 0.2‬‬ ‫‪0.2 × 200 = 40‬‬ ‫‪pˆ 2 = 0.3‬‬ ‫‪0.3 × 300 = 90‬‬ ‫‪40 + 90‬‬ ‫‪130‬‬ ‫= ˆ‪p‬‬ ‫=‬ ‫‪= 0.26‬‬ ‫‪200 + 300 500‬‬ ‫‪= −2.5‬‬

‫מסקנה‪ :‬לא דוחים את ‪.H0‬‬

‫‪H 0 : p1 − p 2 = 0 n1 = 200‬‬ ‫‪H 1 : p1 − p 2 ≠ 0 n 2 = 300‬‬ ‫‪z 0.005 = 2.58‬‬ ‫‪0.2 − 0.3‬‬

‫‪1 ‬‬ ‫‪ 1‬‬ ‫‪0.26 × 0.74 × ‬‬ ‫‪+‬‬ ‫‪‬‬ ‫‪ 200 300 ‬‬

‫=‪z‬‬

‫‪24‬‬

‫ח‪ .‬מבחן על ‪ σ2, X‬מתפלג נורמלית‬

‫‪‬‬ ‫‪2‬‬ ‫‪0‬‬

‫‪σ ≠σ‬‬

‫‪2‬‬ ‫‪0‬‬

‫‪2‬‬

‫‪ χ 2 < χ 12−α ‬‬ ‫‪2‬‬ ‫‪‬‬ ‫אזור קריטי‪:‬‬ ‫‪ χ 2 > χ α2 ‬‬ ‫‪‬‬ ‫‪2 ‬‬

‫‪σ >σ‬‬ ‫‪2‬‬

‫‪σ <σ‬‬

‫‪H1 :‬‬

‫‪2‬‬ ‫‪0‬‬

‫‪χ 2 > χ α2‬‬

‫‪ν = n −1‬‬

‫‪σ 2 = σ 02‬‬

‫‪H0 :‬‬

‫‪2‬‬

‫‪χ 2 < χ 12−α‬‬

‫‪(n − 1) s 2‬‬ ‫‪σ 02‬‬

‫= ‪χ2‬‬

‫דוגמה‪ :‬כמו בסעיף ב'‪ .‬מנהל העבודה טוען שהשונות שווה ל‪ 10-‬והיצרן טוען‬ ‫שהיא נמוכה מ‪ .10-‬מי צודק‪ ,‬ברמת מובהקות ‪?0.05‬‬ ‫‪n=7‬‬

‫‪H 0 : σ 2 = 10‬‬

‫‪s2 = 8‬‬

‫‪H 1 : σ < 10‬‬ ‫‪6×8‬‬ ‫= ‪χ2‬‬ ‫‪= 4.8‬‬ ‫‪10‬‬ ‫‪2‬‬

‫‪χ 02.95 = 1.64‬‬

‫מסקנה‪ :‬לא דוחים את ‪.H0‬‬ ‫ט‪ .‬מבחן על הפרש שונויות‪ X1 ,‬ו‪ X2-‬מתפלגים נורמלית‬ ‫‪σ 12 = σ 22‬‬

‫‪‬‬ ‫‪σ ≠σ‬‬ ‫‪ F < F1−α (ν 1 ,ν 2 )‬‬ ‫‪2‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪ F > Fα (ν 1 ,ν 2 ) ‬‬ ‫‪2‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪2‬‬ ‫‪2‬‬

‫אזור קריטי‪:‬‬

‫‪2‬‬ ‫‪1‬‬

‫‪2‬‬ ‫‪2‬‬

‫‪H0 :‬‬

‫‪σ >σ‬‬ ‫‪2‬‬ ‫‪1‬‬

‫‪H1 :‬‬

‫) ‪F > Fα (ν 1 ,ν 2‬‬ ‫‪s12‬‬ ‫‪F= 2‬‬ ‫‪s2‬‬

‫הערה‪ :‬אם המבחן חד‪-‬צדדי‪ ,‬לוקחים כ‪ X 1 -‬את המשתנה בעל השונות המירבית לפי ‪. H 1‬‬ ‫דוגמה‪ :‬בדוגמה שבסעיף ד'‪ ,‬בכוונתנו לבחון אם אמנם ניתן להניח שאין הבדל מובהק‬ ‫בין שתי השונויות‪ ,‬או לחילופין אם השונות בקרב אלה שלקחו סמי‪-‬הרגעה‬ ‫גדולה יותר‪.‬‬ ‫‪H 0 : σ 12 = σ 22‬‬ ‫‪F0.05 (9, 14) ≈ 3.02‬‬ ‫‪15‬‬ ‫‪= 1.5‬‬ ‫‪10‬‬

‫=‪F‬‬

‫‪H 1 : σ 12 > σ 22‬‬

‫‪α = 0.05‬‬ ‫‪s = 15 s = 10‬‬ ‫‪2‬‬ ‫‪2‬‬

‫‪2‬‬ ‫‪1‬‬

‫‪n1 = 10 n2 = 15‬‬

‫מסקנה‪ :‬לא דוחים את ‪.H0‬‬ ‫הערה‪:‬‬

‫‪1‬‬

‫) ‪F1−α (ν2 ,ν1‬‬

‫= ) ‪Fα (ν1 ,ν2‬‬

25

‫סיכום בדיקת השערות ורווחי סמך‬ ‫רווח סמך‬ : µ ‫של‬ zα 2

σ n

: µ ‫של‬ tα 2

s n

‫אזור דחייה‬

H1

z < − zα

µ < µ0

z > zα

µ > µ0

z > zα

2

µ ≠ µ0

t < −tα

µ < µ0

t > tα

µ > µ0

t > tα

µ ≠ µ0

n ≤ 30 -‫ ו‬X ~ N ,‫ לא ידוע‬σ

z < − zα

µ1 < µ 2

z=

2

: µ 1 − µ 2 ‫של‬

− x2 ± z α 2

2

σ1 n1

+

2

σ2 n2

z > zα

µ1 > µ 2

z > zα

µ1 ≠ µ 2

t < −tα

µ1 − µ 2 < d 0

t > tα

µ1 − µ 2 > d 0

2

: µ 1 − µ 2 ‫של‬

− x2 ± tα s p 2

1 n1

+ n12

‫מבחן‬/‫סטטיסטי‬ z=

t=

2

σ

n

1

µ = µ0

2

µ1 = µ 2

3

µ1 − µ 2 = d 0

4

µ1 − µ 2 = d 0

5

p = p0

6

n

x1 − x 2 2

σ1 n1

.

X ~ N ‫ ידוע ו‬σ n > 30 ‫או‬

x − µ0 s

µ = µ0

2

+ σn22

.

.

‫ ידועים‬σ 1 , σ 2 n1 , n2 > 30 ‫ או‬X 1 , X 2 ~ N t=

( x1 − x 2 ) − d 0 sp ⋅

1 1 + n1 n 2

.

‫ לא ידועים‬σ 1 = σ 2

2

t > tα

x − µ0

H0

sp =

( n1 − 1) s1 2 + ( n 2 − 1) s 2 2 n1 + n 2 − 2

µ1 − µ 2 ≠ d 0

‫ וכן‬X 1 , X 2 ~ N n1 ≤ 30 or n2 ≤ 30

: µ d ‫של‬ tα 2

sd n

t < −tα

µ1 − µ 2 < d 0

t > tα

µ1 − µ 2 > d 0

t > tα

µ1 − µ 2 ≠ d 0

2

: p ‫של‬ zα 2

pˆ ( 1− pˆ ) n

.

‫מדגמים מזווגים‬ D ~ N , n ≤ 30

z < − zα

p < p0

z > zα

p > p0

z > zα

p ≠ p0

2

d − d0 sd n ν = n −1

t=

z=

pˆ − p 0 p 0 ( 1− p 0 ) n

npˆ , n(1 − pˆ ) ≥ 5

.

26

‫רווח סמך‬ : p1 − p 2 ‫של‬ pˆ 2 ± z α

2

pˆ 1 qˆ1 n1

+

χα

: σ 2 ‫של‬ 2

‫בין‬

2

2

− 1) s 2

z > zα

p1 − p 2 > d 0

z > zα

p1 − p 2 ≠ d 0

σ 2 < σ 02

χ 2 > χα

σ 2 >σ0

2

2

χ > χα 2

2

z=

pˆ 1 − pˆ 2 − d 0 pˆ 1qˆ1 n1

+

σ1

2

σ2

2

1 Fα (ν 2 ,ν 1 )

‫של‬

‫לבין‬ Fα (ν1 ,ν2 ) 2

p1 − p 2 = d 0

F > Fα (ν 1 , ν 2 )

.

pˆ 2 qˆ 2 n2

n1 pˆ 1 , n1 (1 − pˆ 1 ) ≥ 5 n 2 pˆ 2 , n 2 (1 − pˆ 2 ) ≥ 5

χ2 =

( n − 1) s 2

σ0 ν = n −1

σ 2 = σ 02

2

σ1 >σ 2 2

2

F=

s1

σ1 =σ 2 2

2 2

s2 ν1 = n 1 − 1 ν2 = n2 −1

‫או‬

F < F1− α 2 (ν 1 , ν 2 )

σ 12 ≠ σ 2 2

F > Fα 2 (ν 1 , ν 2 )

,‫צדדי‬-‫אם המבחן חד‬ ‫ את‬X 1 -‫לוקחים כ‬ ‫המשתנה בעל השונות‬ H 1 ‫המירבית לפי‬ X 1, X 2 ~ N

Fα (ν1 ,ν2 ) =

7

8

.

X ~N

‫בין‬

2

H0

σ 2 ≠ σ 02

‫או‬

2

2

‫מבחן‬/‫סטטיסטי‬

2

:

2 1 2 2

χ 2 < χ 12−α

χ 2 < χ 12− α

‫לבין‬

χ 1− α 2

2

z < − zα

pˆ 2 qˆ 2 n2

2

− 1) s

2

H1 p1 − p 2 < d 0

‫אזור דחייה‬

1

F1−α (ν2 ,ν1 )

2

9

.

‫‪27‬‬

‫פרק שמיני‪ :‬מבחן לבדיקת טיב התאמה‬ ‫‪.1‬התאמה להתפלגות‪:‬‬ ‫המטרה‪ :‬לבדוק אם אוכלוסיה מסוימת מתפלגת לפי התפלגות נתונה‪:‬‬ ‫•‪ : Oi‬מספר תצפיות ששויכו לטווח ‪i‬‬ ‫•‪ : Ei‬מספר תצפיות אמורות להשתייך לאותו טווח אם ההשערה נכונה‬ ‫• ‪ k‬טווחים‪ n ,‬תצפיות בסך הכל‪.‬‬ ‫‪Oi2‬‬ ‫‪−n‬‬ ‫‪Ei‬‬

‫‪k‬‬

‫∑=‬

‫‪2‬‬

‫‪i =1‬‬

‫) ‪− Ei‬‬ ‫‪Ei‬‬

‫‪( Oi‬‬

‫‪k‬‬

‫∑ = ‪χ2‬‬ ‫‪i =1‬‬

‫הערה‪ Ei :‬חייב להיות גדול או שווה ל‪ ,5-‬אחרת מחברים טווחים‪.‬‬ ‫אם ) ‪ , χ 2 > χ α2 ( k −t‬דוחים את ההשערה‪.‬‬ ‫• ‪ : t‬מספר הכמויות שצריכים להסיק מן הנתונים כדי לחשב את ה‪Ei-‬‬ ‫דוגמה‪ :‬הטלת קובייה ‪ 120‬פעם‪ .‬רוצים לבחון אם הקובייה מאוזנת‪.‬‬ ‫‪34‬‬ ‫‪= 1.7‬‬ ‫‪20‬‬ ‫]‪t = 1 [ n‬‬ ‫‪χ 02.05 (5) = 11.07‬‬

‫‪Oi‬‬

‫= ‪χ2‬‬

‫‪Ei‬‬

‫‪( Oi − Ei ) 2‬‬ ‫‪( Oi − Ei ) 2‬‬

‫מסקנה‪ :‬לא דוחים את ההשערה‬

‫‪Ei‬‬

‫‪6 5 4 3 2 1‬‬ ‫‪24 19 18 17 22 20‬‬ ‫‪20 20 20 20 20 20‬‬ ‫‪16 1 4 9 4 0‬‬ ‫‪0‬‬

‫‪4‬‬ ‫‪20‬‬

‫‪9‬‬ ‫‪20‬‬

‫‪4‬‬ ‫‪20‬‬

‫‪1‬‬ ‫‪20‬‬

‫‪.2‬לוחות תלות הדדית‪:‬‬ ‫המטרה‪ :‬לבדוק אם קיימת תלות בין שני משתנים מקריים איכותיים‪ .‬השערת‬ ‫האפס היא שאין תלות בין המשתנים‪.‬‬ ‫‪2‬‬

‫) ‪− E ij‬‬

‫‪E ij‬‬

‫‪(O‬‬

‫‪ij‬‬

‫‪c‬‬

‫‪r‬‬

‫∑∑ = ‪χ‬‬ ‫‪2‬‬

‫‪i =1 j =1‬‬

‫אם )]‪ , χ 2 > χ α2 ([r − 1] ⋅ [c − 1‬מסיקים שיש תלות‬ ‫)‪t = 1 + (r − 1) + (c − 1‬‬ ‫הסבר‪:‬‬

‫)‪⇒ rc − [1 + (r − 1) + (c − 1)] = (r − 1)(c − 1‬‬

‫‪16‬‬ ‫‪20‬‬

‫‪28‬‬

‫דוגמה‪ :‬האם קיים קשר בין דת ואזור מגורים בארצות הברית?‬ ‫פרוטסטנטים קתוליים יהודים סה"כ‬ ‫(‪)187‬‬ ‫(‪)211‬‬ ‫(‪)202‬‬ ‫חוף מזרחי‬ ‫‪600‬‬ ‫חוף מערבי‬ ‫סה"כ‬

‫‪182‬‬

‫‪215‬‬

‫‪203‬‬

‫(‪)134‬‬

‫(‪)140‬‬

‫(‪)126‬‬

‫‪154‬‬ ‫‪336‬‬

‫‪136‬‬ ‫‪351‬‬

‫‪110‬‬ ‫‪313‬‬

‫‪400‬‬ ‫‪1000‬‬ ‫‪ni ⋅ ⋅ n⋅ j‬‬

‫⇐‬

‫= ‪Eij‬‬

‫‪n‬‬ ‫‪(182 − 202) 2 (215 − 211) 2 (203 − 187) 2‬‬ ‫= ‪χ2‬‬ ‫‪+‬‬ ‫‪+‬‬ ‫‪+‬‬ ‫‪202‬‬ ‫‪211‬‬ ‫‪187‬‬ ‫‪(154 − 134) 2 (136 − 140) 2 (110 − 126) 2‬‬ ‫‪+‬‬ ‫‪+‬‬ ‫‪+‬‬ ‫‪= 8.556‬‬ ‫‪134‬‬ ‫‪140‬‬ ‫‪126‬‬ ‫‪χ 02.05 (2) = 5.991‬‬

‫מסיקים שיש תלות‪.‬‬

‫‪29‬‬

‫פרק תשיעי‪ :‬ניתוח שונות‬ ‫‪.1‬מבוא‪:‬‬ ‫נתונות ‪ k‬אוכלוסיות‪ .‬רוצים לבחון אם הן זהות מבחינה מסוימת‪ .‬ז"א אם למשתנה‬ ‫מסוים יש אותה תוחלת בכל ‪ k‬האוכלוסיות‪:‬‬ ‫‪H 0 : µ1 = µ 2 = ... = µ k‬‬ ‫‪ ∃i ≠ j‬כך ש‪H 1 : µ i ≠ µ j -‬‬

‫דוגמאות‪:‬‬ ‫•השוואת יבול של חיטה מסוגים שונים‬ ‫•השוואת שיטות הוראה שונות‬ ‫•השוואה בין טיפולים שונים‬ ‫הנתונים‪:‬‬ ‫‪1≤ i ≤ k‬‬ ‫‪1≤ j ≤ n‬‬

‫) ‪ (Yij‬מספר אחיד (‪ )n‬של תצפיות בכל אוכלוסיה‪.‬‬

‫‪.2‬המודל‪:‬‬ ‫‪µi = µ + α i‬‬

‫⇔‬

‫‪Yij =µ+αi +εij‬‬

‫) ‪∀i, j : ε ij ~ N (0, σ 2‬‬

‫ולכן אפשר לכתוב‪:‬‬

‫נסמן‪:‬‬

‫‪H 0 : i = 1...k α i = 0‬‬ ‫‪H 1 : ∃i α i ≠ 0‬‬ ‫‪T = ∑ Yij‬‬ ‫‪i, j‬‬

‫‪Ti = ∑ Yij‬‬

‫‪∑Y‬‬

‫‪j‬‬

‫‪ij‬‬

‫‪i, j‬‬

‫‪nk‬‬

‫‪∑Y‬‬

‫‪ij‬‬

‫‪j‬‬

‫= ‪Y‬‬

‫‪n‬‬

‫= ‪Yi‬‬

‫) ‪(Yij − Y ) = (Yij − Yi ) + (Yi − Y‬‬ ‫‪− Y ) 2 = ∑ (Yij − Yi ) 2 + ∑ (Yi − Y ) 2‬‬ ‫‪i, j‬‬

‫‪SSB‬‬

‫‪i, j‬‬

‫‪∑ (Y‬‬

‫‪ij‬‬

‫‪i, j‬‬

‫‪SST = SSW +‬‬

‫)‪(Between‬‬

‫)‪(Within‬‬

‫)‪(Total‬‬

‫⇒‬

‫‪30‬‬ ‫)‪SSB (k − 1‬‬ ‫אם ‪ H0‬נכונה‪ ,‬אזי‪:‬‬ ‫)‪SSW k (n − 1‬‬ ‫ודוחים את ‪ H0‬אם‪F > Fα ( k − 1, k (n − 1) ) :‬‬

‫= ‪ F‬מתפלג לפי ) )‪. F ( k − 1, k (n − 1‬‬

‫‪.3‬נוסחאות לחישוב‪:‬‬ ‫‪2‬‬

‫‪T‬‬ ‫‪kn‬‬

‫‪SST = ∑ Yij2 −‬‬ ‫‪i, j‬‬

‫‪Ti 2 T 2‬‬ ‫∑ = ‪SSB‬‬ ‫‪−‬‬ ‫‪kn‬‬ ‫‪i =1 n‬‬ ‫‪SSW = SST − SSB‬‬ ‫‪k‬‬

‫‪.4‬דוגמה‪:‬‬ ‫כדי לבחון את התועלת של ‪ 4‬דשנים שונים‪ ,‬השתמשו בכל אחד ב‪ 5-‬חלקות‪,‬‬ ‫והתקבלו היבולים הבאים (בק"ג)‪ .‬האם יש הבדל בין הדשנים השונים?‬ ‫חלק‬ ‫‪ 5‬סה"כ‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫דשן‬ ‫‪374‬‬ ‫‪80‬‬ ‫‪75‬‬ ‫‪64‬‬ ‫‪73‬‬ ‫‪82‬‬ ‫‪A‬‬ ‫‪340‬‬ ‫‪60‬‬ ‫‪76‬‬ ‫‪63‬‬ ‫‪84‬‬ ‫‪57‬‬ ‫‪B‬‬ ‫‪338‬‬ ‫‪75‬‬ ‫‪70‬‬ ‫‪65‬‬ ‫‪45‬‬ ‫‪83‬‬ ‫‪C‬‬ ‫‪371‬‬ ‫‪80‬‬ ‫‪74‬‬ ‫‪75‬‬ ‫‪74‬‬ ‫‪68‬‬ ‫‪D‬‬ ‫‪1423‬‬ ‫‪= 103,089‬‬

‫‪∑Y‬‬

‫‪2‬‬ ‫‪ij‬‬

‫‪1423 2‬‬ ‫‪SST = 103,089 −‬‬ ‫‪= 1842.55‬‬ ‫‪20‬‬ ‫‪374 2 + 340 2 + 338 2 + 3712 1423 2‬‬ ‫= ‪SSB‬‬ ‫‪−‬‬ ‫‪= 225.75‬‬ ‫‪5‬‬ ‫‪20‬‬ ‫‪SSW = 1842.55 − 225.75 = 1616.8‬‬ ‫‪225.75‬‬ ‫‪3 = 0.74‬‬ ‫=‪F‬‬ ‫‪F0.05 (3,16) = 3.24‬‬ ‫‪1616.8‬‬ ‫‪16‬‬

‫⇐ אין הבדל מובהק בין הדשנים השונים‪.‬‬

‫‪31‬‬

‫‪.5‬הכללה‪:‬‬ ‫אם אין מספר אחיד של תצפיות בכל אוכלוסיה‪ ,‬אלא ‪n1 , n2 ,....., nk‬‬ ‫‪k‬‬

‫‪N = ∑ ni‬‬ ‫‪i =1‬‬

‫‪k T2‬‬ ‫‪T2‬‬ ‫‪SSB = ∑ i −‬‬ ‫‪n‬‬ ‫‪N‬‬ ‫‪i =1 i‬‬

‫‪T2‬‬ ‫‪N‬‬ ‫‪SSW = SST − SSB‬‬ ‫‪SSB‬‬ ‫)‪( k − 1‬‬ ‫=‪F‬‬ ‫‪SSW‬‬ ‫)‪(N − k‬‬

‫‪k ni‬‬

‫‪SST = ∑ ∑ Yij2 −‬‬ ‫‪i =1 j =1‬‬

‫אם ) ‪ , F > Fα ( k − 1, N − k‬אזי דוחים את השערת האפס‪ ,‬היינו מסיקים שקיים‬ ‫הבדל מובהק בין תוחלות הקבוצות השונות‪.‬‬

‫‪32‬‬

‫פרק עשירי‪ :‬רגרסיה‬ ‫‪.1‬מבוא‪:‬‬ ‫משמעותו של קשר סטטיסטי‬ ‫מחפשים דרך לחשב את העוצמה ואת הכוון של הקשר בין שני משתנים כמותיים‪.‬‬ ‫דוגמאות‪:‬‬ ‫טמפרטורה ממוצעת – תנובת עצי פרי‪.‬‬‫מנת משכל של האב – מנת משכל של הבן‬‫מספר רופאים – מספר ימי מחלה‬‫אם מתגלה קשר בין שני המשתנים ‪ X‬ו‪ ,Y-‬אזי קיימות שלוש אפשרויות‪:‬‬ ‫‪ X‬משפיע על ‪Y‬‬‫‪ Y‬משפיע על ‪X‬‬‫משתנה שלישי משפיע על ‪ X‬ו‪.Y-‬‬‫מקדם המתאם של פירסון (‬ ‫‪Pearson Coefficient of‬‬ ‫‪)Correlation‬‬ ‫) ‪− x )( yi − y‬‬

‫‪n‬‬

‫‪∑ (x‬‬

‫‪i‬‬

‫‪i =1‬‬

‫‪n ⋅ sx ⋅ s y‬‬ ‫‪− n⋅ x ⋅ y‬‬

‫= ) ‪r( X ,Y‬‬

‫‪n‬‬

‫‪i‬‬

‫‪∑x ⋅ y‬‬ ‫‪i‬‬

‫‪i =1‬‬

‫‪n‬‬

‫‪n‬‬

‫‪i =1‬‬

‫‪i =1‬‬

‫) ‪(∑ xi2 − n ⋅ x 2 )(∑ yi2 − n ⋅ y 2‬‬

‫= ) ‪r( X ,Y‬‬

‫תכונות‪:‬‬ ‫מתקיים‬ ‫מקרה‪,‬‬ ‫בכל‬ ‫גבוהה‪.‬‬ ‫הקשר‬ ‫עוצמת‬ ‫כי‬ ‫סימן‬ ‫זה‬ ‫‪,‬‬ ‫‪1‬‬ ‫ל‪-‬‬ ‫קרוב‬ ‫|‬ ‫‪r‬‬ ‫|‬ ‫אם‬ ‫‪)1‬‬ ‫‪− 1 ≤ r ≤ +1‬‬ ‫‪.‬‬ ‫‪)2‬אם ‪ r‬חיובי‪ ,‬הקשר ישר‪ ,‬ולא‪ ,‬הקשר הפוך‪.‬‬ ‫דוגמה‪:‬‬ ‫גובה‪X :‬‬ ‫משקל‪Y :‬‬

‫‪160‬‬ ‫‪75‬‬

‫‪200 120 160‬‬ ‫‪75 60 90‬‬ ‫‪600‬‬ ‫‪= 0.5‬‬ ‫‪3200 ⋅ 450‬‬

‫=‬

‫‪48,600 − 4 ⋅ 160 ⋅ 75‬‬ ‫) ‪(105,600 − 4 ⋅ 160 2 )(22,950 − 4 ⋅ 752‬‬

‫מטרות הרגרסיה‪:‬‬ ‫•קשר סטטיסטי בין שני משתנים (באיזו מידה ‪" X‬מסביר" את ‪.)Y‬‬ ‫•חיזוי משתנה אחד על סמך משתנה אחר‪.‬‬ ‫דוגמה‪ :‬משקל וגובה‪.‬‬

‫= ) ‪r( X ,Y‬‬

‫‪33‬‬

‫‪.2‬רגרסיה ליניארית פשוטה‪:‬‬ ‫‪Y = aX + b + ε‬‬

‫המודל‪:‬‬

‫) ‪ε ~ N (0, σ 2‬‬

‫כדי לאמוד את ‪ a‬ואת ‪ ,b‬מגדירים‪:‬‬

‫‪n‬‬

‫‪n‬‬

‫‪i =1‬‬

‫‪i =1‬‬

‫‪S = ∑ ei 2 = ∑ ( Yi − [axi + b]) 2‬‬

‫ומחפשים ‪ a‬ו‪ b-‬כך ש‪ S-‬יהיה מזערי‪.‬‬ ‫נסמן‪:‬‬

‫‪( ∑ xi ) 2‬‬

‫‪S x = S xx‬‬

‫‪n‬‬

‫‪n‬‬

‫‪S xx = ∑ xi 2 −‬‬ ‫‪i =1‬‬

‫‪( ∑ yi ) 2‬‬

‫‪S y = S yy‬‬

‫) ‪( ∑ xi )( ∑ yi‬‬ ‫‪n‬‬

‫‪n‬‬

‫‪n‬‬

‫‪S yy = ∑ yi 2 −‬‬ ‫‪i =1‬‬

‫‪n‬‬

‫‪S xy = ∑ xi yi −‬‬ ‫‪i =1‬‬

‫מתקבלות הנוסחאות הבאות‪:‬‬

‫‪S xy‬‬

‫‪bˆ = y − aˆ ⋅ x‬‬

‫‪S xx‬‬

‫‪r ⋅Sy‬‬

‫= ˆ‪a‬‬

‫= ˆ‪a‬‬

‫‪Sx‬‬

‫כאשר ‪ r‬הוא מקדם המתאם של פירסון בין ‪ X‬לבין ‪.Y‬‬ ‫דוגמה‪ :‬ציון במתמטיקה ובסטטיסטיקה‬ ‫‪60‬‬ ‫‪40‬‬

‫‪( ∑ x ) = 50, 625‬‬ ‫‪∑ x = 225‬‬

‫‪= 280‬‬

‫‪i‬‬

‫‪225 ⋅ 280‬‬ ‫‪= 450‬‬ ‫‪4‬‬

‫‪i‬‬

‫‪450‬‬ ‫‪= 0.67‬‬ ‫‪668.75‬‬

‫‪.3‬בדיקת מובהקות הרגרסיה‪:‬‬ ‫) ‪(Yi − Y ) = (Yi − Yˆi ) + (Yˆi − Y‬‬

‫)‬

‫(‬

‫)‬

‫‪i‬‬

‫‪S xy = 16, 200 −‬‬

‫‪⇒ bˆ = 70 − 0.67 ⋅ 56.25 = 32.31‬‬

‫‪⇒ Yˆ = 0.67 x + 32.31‬‬

‫‪2‬‬ ‫‪i‬‬

‫‪i‬‬

‫‪∑y‬‬

‫‪80‬‬ ‫‪60‬‬

‫‪∑ x = 13, 325‬‬ ‫‪∑ x y = 16, 200‬‬

‫‪2‬‬

‫‪S xx = 668.75‬‬ ‫‪i‬‬

‫‪60‬‬ ‫‪50‬‬

‫‪80‬‬ ‫‪75‬‬

‫‪Y‬‬ ‫‪X‬‬

‫(‬

‫‪2‬‬ ‫‪2‬‬ ‫‪= ∑ Yi − Yˆi + ∑ Yˆi − Y‬‬ ‫=‬ ‫‪SSE‬‬ ‫‪+‬‬ ‫‪SSR‬‬

‫‪2‬‬

‫) ‪∑ (Yi − Y‬‬ ‫‪SST‬‬

‫⇒‬

‫= ˆ‪⇒ a‬‬

‫‪34‬‬

‫‪:)SST (Total‬‬ ‫‪:)SSE (Error‬‬ ‫‪:)SSR (Regression‬‬

‫סה"כ הפיזור‪.‬‬ ‫הפיזור הבלתי מוסבר ע"י הרגרסיה‪.‬‬ ‫הפיזור המוסבר ע"י הרגרסיה‪.‬‬ ‫‪H0 : a = 0‬‬ ‫‪H1 : a ≠ 0‬‬ ‫‪( n − 2) ⋅ SSR‬‬ ‫=‪F‬‬ ‫‪SSE‬‬

‫נוסחאות לחישוב‪:‬‬ ‫‪2‬‬

‫) ‪(∑ y‬‬ ‫‪i‬‬

‫‪n‬‬

‫‪n‬‬

‫‪SST = S yy = ∑ yi2 −‬‬ ‫‪i =1‬‬

‫‪SSR = aˆ 2 ⋅ S xx = aˆ ⋅ S xy‬‬ ‫‪SSE = SST − SSR‬‬

‫דוגמה (הנ"ל)‪:‬‬ ‫‪2‬‬

‫‪280‬‬ ‫‪= 400‬‬ ‫‪4‬‬ ‫‪SSR = 0.67 ⋅ 450 = 301.5‬‬ ‫‪⇒ SSE = 98.5‬‬ ‫‪2 ⋅ 301.5‬‬ ‫=‪⇒F‬‬ ‫‪= 6.12‬‬ ‫‪98.5‬‬ ‫‪F0.05 (1,2) = 18.51‬‬ ‫⇒‬ ‫אין רגרסיה‬ ‫‪SST = 20000 −‬‬

‫שימוש ב‪R 2 -‬‬ ‫הפיזור המוסבר ‪SSR‬‬ ‫=‬ ‫סך הכל הפיזור ‪SST‬‬

‫דוגמה‪:‬‬

‫‪301.5‬‬ ‫‪= 0.75‬‬ ‫‪400‬‬

‫= ‪R2‬‬

‫= ‪R2‬‬

35

Table of the Normal Distribution Probability Content from - ∞ to z Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 ----+---------------------------------------------------------------------0.0 | 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 | 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 | 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 | 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 | 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 | 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 | 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 | 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 | 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 | 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 | 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 | 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 | 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 | 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 | 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 | 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 | 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 | 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 | 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 | 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 | 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 | 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 | 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 | 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 | 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 | 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 | 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 | 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 | 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 | 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 | 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

36

Student's t Table df\p

0.40

0.25

0.10

0.05

0.025

0.01

0.005

0.0005

1

0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674

2

0.288675 0.816497 1.885618 2.919986

4.30265

6.96456

9.92484

31.5991

3

0.276671 0.764892 1.637744 2.353363

3.18245

4.54070

5.84091

12.9240

4

0.270722 0.740697 1.533206 2.131847

2.77645

3.74695

4.60409

8.6103

5

0.267181 0.726687 1.475884 2.015048

2.57058

3.36493

4.03214

6.8688

6

0.264835 0.717558 1.439756 1.943180

2.44691

3.14267

3.70743

5.9588

7

0.263167 0.711142 1.414924 1.894579

2.36462

2.99795

3.49948

5.4079

8

0.261921 0.706387 1.396815 1.859548

2.30600

2.89646

3.35539

5.0413

9

0.260955 0.702722 1.383029 1.833113

2.26216

2.82144

3.24984

4.7809

10

0.260185 0.699812 1.372184 1.812461

2.22814

2.76377

3.16927

4.5869

11

0.259556 0.697445 1.363430 1.795885

2.20099

2.71808

3.10581

4.4370

12

0.259033 0.695483 1.356217 1.782288

2.17881

2.68100

3.05454

4.3178

13

0.258591 0.693829 1.350171 1.770933

2.16037

2.65031

3.01228

4.2208

14

0.258213 0.692417 1.345030 1.761310

2.14479

2.62449

2.97684

4.1405

15

0.257885 0.691197 1.340606 1.753050

2.13145

2.60248

2.94671

4.0728

16

0.257599 0.690132 1.336757 1.745884

2.11991

2.58349

2.92078

4.0150

17

0.257347 0.689195 1.333379 1.739607

2.10982

2.56693

2.89823

3.9651

18

0.257123 0.688364 1.330391 1.734064

2.10092

2.55238

2.87844

3.9216

19

0.256923 0.687621 1.327728 1.729133

2.09302

2.53948

2.86093

3.8834

20

0.256743 0.686954 1.325341 1.724718

2.08596

2.52798

2.84534

3.8495

21

0.256580 0.686352 1.323188 1.720743

2.07961

2.51765

2.83136

3.8193

22

0.256432 0.685805 1.321237 1.717144

2.07387

2.50832

2.81876

3.7921

23

0.256297 0.685306 1.319460 1.713872

2.06866

2.49987

2.80734

3.7676

24

0.256173 0.684850 1.317836 1.710882

2.06390

2.49216

2.79694

3.7454

25

0.256060 0.684430 1.316345 1.708141

2.05954

2.48511

2.78744

3.7251

26

0.255955 0.684043 1.314972 1.705618

2.05553

2.47863

2.77871

3.7066

27

0.255858 0.683685 1.313703 1.703288

2.05183

2.47266

2.77068

3.6896

28

0.255768 0.683353 1.312527 1.701131

2.04841

2.46714

2.76326

3.6739

29

0.255684 0.683044 1.311434 1.699127

2.04523

2.46202

2.75639

3.6594

30

0.255605 0.682756 1.310415 1.697261

2.04227

2.45726

2.75000

3.6460

Inf

0.253347 0.674490 1.281552 1.644854

1.95996

2.32635

2.57583

3.2905

df 0.995 0.99 0.975 1 ----- 0.001 2 0.010 0.020 0.051 3 0.072 0.115 0.216

Table: Chi-Square Probabilities 0.95 0.90 0.10 0.05 0.004 0.016 2.706 3.841 0.103 0.211 4.605 5.991 0.352 0.584 6.251 7.815

636.6192

0.025 0.01 0.005 5.024 6.635 7.879 7.378 9.210 10.597 9.348 11.345 12.838

37 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 13.787

0.297 0.554 0.872 1.239 1.646 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.879 13.565 14.256 14.953

0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791

0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493

1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.042 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599

7.779 9.236 10.645 12.017 13.362 14.684 15.987 17.275 18.549 19.812 21.064 22.307 23.542 24.769 25.989 27.204 28.412 29.615 30.813 32.007 33.196 34.382 35.563 36.741 37.916 39.087 40.256

9.488 11.070 12.592 14.067 15.507 16.919 18.307 19.675 21.026 22.362 23.685 24.996 26.296 27.587 28.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773

11.143 12.833 14.449 16.013 17.535 19.023 20.483 21.920 23.337 24.736 26.119 27.488 28.845 30.191 31.526 32.852 34.170 35.479 36.781 38.076 39.364 40.646 41.923 43.195 44.461 45.722 46.979

13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 27.688 29.141 30.578 32.000 33.409 34.805 36.191 37.566 38.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 49.588 50.892

14.860 16.750 18.548 20.278 21.955 23.589 25.188 26.757 28.300 29.819 31.319 32.801 34.267 35.718 37.156 38.582 39.997 41.401 42.796 44.181 45.559 46.928 48.290 49.645 50.993 52.336 53.672

38

1 2 3 4 5 6 7 8 9 10 20 30 40 50 60 70 80 100 200 400 1000 Inf

.05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01 .05 .01

Table of the Upper Percentage Points of the F distribution 1 2 3 4 5 6 7 8 9 10 11 161 200 216 225 230 234 237 239 241 242 243 4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 6082 18.51 19.00 19.16 19.25 19.39 19.33 19.36 19.37 19.38 19.39 19.4 98.49 99.01 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.40 99.4 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 8.76 34.12 30.81 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.93 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.54 14.95 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74 4.70 16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.05 9.96 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63 3.60 12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.62 6.54 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34 3.31 11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.82 5.74 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97 2.94 10.04 7.56 6.55 5.99 5.64 5.39 5.21 5.06 4.95 4.85 4.78 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.31 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.12 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.90 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.98 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.62 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.01 1.97 1.93 7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59 2.51 3.96 3.11 2.72 2.48 2.33 2.21 2.12 2.05 1.99 1.95 1.91 6.96 4.88 4.04 3.56 3.25 3.04 2.87 2.74 2.64 2.55 2.48 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.88 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.43 3.89 3.04 2.65 2.42 2.26 2.14 2.06 1.98 1.93 1.88 1.83 6.76 4.71 3.88 3.41 3.11 2.89 2.73 2.60 2.50 2.41 2.34 3.86 3.02 2.62 2.39 2.23 2.12 2.03 1.96 1.90 1.85 1.81 6.70 4.66 3.83 3.36 3.06 2.85 2.69 2.55 2.46 2.37 2.29 3.85 3.00 2.61 2.38 2.22 2.11 2.02 1.95 1.89 1.84 1.80 6.66 4.63 3.80 3.34 3.04 2.82 2.66 2.53 2.43 2.34 2.26 3.85 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83 1.79 6.64 4.60 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.24

12 244 6106 19.4 99.4 8.74 27.05 5.91 14.37 4.68 9.89 4.00 7.72 3.57 6.47 3.28 5.67 3.07 5.11 2.91 4.71 2.28 3.23 2.09 2.84 2.00 2.66 1.95 2.56 1.92 2.50 1.89 2.45 1.88 2.41 1.85 2.36 1.80 2.28 1.78 2.23 1.76 2.20 1.75 2.18

15 246 6157 19.4 99.4 8.70 26.87 5.86 14.2 4.62 9.72 3.94 7.56 3.51 6.31 3.22 5.52 3.01 4.96 2.85 4.56 2.20 3.09 2.01 2.70 1.92 2.52 1.87 2.42 1.84 2.35 1.82 2.32 1.80 2.28 1.77 2.22 1.72 2.13 1.70 2.08 1.68 2.06 1.66 2.03

Related Documents