התפלגות בינומית
מוטיבציה
התפלגות היא כאמור פשוט כינוי לפונקציית ההסתברות.
התפלגות בינומית מתארת את ההסתברות שאם נחזור
n
פעמים על ניסוי כלשהו, שבו תתכן הצלחה בהסתברות
p
,
תהיינה
k
הצלחות.
ראינו בעבר ניסויים שהיו מורכבים מחזרה על ניסוי פשוט , כמו לדוגמא הטלת מטבע פעמיים.
ניתחנו ניסויים כאלה באמצעות עץ שמתאר את כל התוצאות האפשריות בניסוי.
הבעיה בשימוש בעץ, היא שהוא הופך להיות לא פרקטי כאשר מספר החזרות גבוה, מאחר ואז העץ
המתאר את כל התוצאות האפשריות יהיה גדול מדי.
בפרק זה נפתח את נוסחת ההתפלגות הבינומית (שמכונה לעיתים נוסחת ברנולי)
המאפשרת לחשב הסתברויות עבור כל מספר חזרות ללא שימוש בעץ.
נוסחת ברנולי
ראשית נגדיר באופן מדוייק מהם הניסויים עליהם אנחנו מדברים.
אנחנו נעסוק בניסויים
המורכבים מחזרה על ניסוי בודד
n
פעמים.
בכל ניסוי בודד נגדיר מאורע מסויים בתור הצלחה ואת המאורע המשלים שלו בתור כשלון.
נסמן את ההסתברות להצלחה בתור
p
,
מה שאומר כמובן שההסתברות
לכישלון היא
(1-p)
.
המטרה שלנו תהיה לחשב את ההסתברות לקבל בדיוק
k
הצלחות.
שימו לב שאנחנו מתעניינים רק במצב בו הניסויים הבודדים אינם תלויים האחד בשני.
כלומר ההסתברות להצלחה בכל ניסוי בודד היא
p
ללא כל תלות במה שהתרחש בניסויים קודמים.
חשוב להדגיש שלמרות שאנחנו מדברים רק על הצלחה או כישלון אין זה אומר שלניסוי הבודד יש רק שתי תוצאות
אפשריות.
לא משנה כמה הניסוי מורכב תמיד ניתן להגדיר מאורע מסויים בתור הצלחה ואת המאורע המשלים בתור כישלון.
נתחיל בתהליך של פיתוח הנוסחא באמצעות דוגמא פשוטה.
דוגמא
מטילים מטבע לא הוגן 3 פעמים. ההסתברות לקבל פלי היא 0.6, וההסתברות לקבל עץ היא 0.4. מהי ההסתברות שנקבל פעמיים פלי?
פתרון:
העץ המתאר את הניסוי יראה כך:
חישבנו בתחתית העץ את ההסתברות של כל אפשרות בה מקבלים פעמיים פלי. שימו לב שההסתברות של כל אחת מהאפשרויות הללו זהה, ושלא מדובר בצירוף מקרים. כשאנחנו מחשבים את ההסתברות אנחנו עושים זאת על ידי מכפלה של ההסתברויות לאורך העץ. כל פעם שנבחר פלי אנחנו כופלים ב-0.6 וכל פעם שנבחר עץ ב-0.4 . קיבלנו פעמיים פלי אז נכפול ב-0.6 פעמיים, וקיבלנו עץ פעם אחת אז נכפול ב-0.4 פעם אחת. לכן ההסתברות של כל אפשרות חייבת להיות: $$ P = 0.6^2 \cdot 0.4 = 0.144$$ מאחר והניסויים בלתי תלויים, אז ההסתברויות אינן משתנות משלב לשלב והדבר היחיד שיקבע את ההסתברות הוא מספר הפעמים בה מקבלים פלי.
בשביל לחשב את ההסתברות של פעמיים פלי נצטרך כמובן לכפול את ההסתברות במספר האפשרויות הנכללות במאורע. קל לראות מהעץ שישנן שלוש תוצאות אפשריות בהן מקבלים פעמיים פלי ולכן ההסתברות תהיה: $$ P_3(2) = 3 \cdot 0.6^2 \cdot 0.4 = 3 \cdot 0.144 = 0.432 $$ כלומר ההסתברות לקבל פעמיים פלי מתוך שלוש הטלות היא 0.432.
באופן כללי, המאורע "קיבלנו k הצלחות", תמיד יהיה מורכב ממספר תוצאות שההסתברות של כל אחת מהן זהה. לפיכך חישוב ההסתברות של המאורע יהיה פשוט מכפלה של ההסתברות של תוצאה אחת במספר התוצאות במאורע. כלומר, בשביל לכתוב נוסחא כללית נצטרך לגלות איך מחשבים את כל אחד משני הרכיבים הללו.
מאחר והגבלנו את עצמנו רק למצבים בהם הניסויים בלתי תלויים אזי שתמיד נוכל לחשב את ההסתברות של כל
תוצאה
בה קיבלנו
k
הצלחות
באופן הבא:
$$ p^k \cdot (1-p)^{n-k} $$
כאשר
p
היא ההסתברות להצלחה בניסוי,
n
מייצג את מספר הניסיונות ו-
k
מייצג את מספר ההצלחות.
במקרה שלנו, אם נגדיר קבלת פלי בתור הצלחה אז הפרמטרים יהיו:
$$ p = 0.6 $$
$$ k=2 $$
$$ n = 3 $$
ואם נציב בנוסחא נקבל:
$$ p^k \cdot (1-p)^{n-k} = 0.6^2 \cdot (1-0.4)^{3-2} = 0.6^2 \cdot 0.4 $$
בכל תוצאה אפשרית, נבחרות הטלות שונות להיות בין שתי ההצלחות.
מאחר וישנן 3 דרכים לבחור 2 הצלחות מתוך 3 ניסיונות אזי שישנן שלוש תוצאות אפשריות במאורע.
באופן כללי, על מנת למצוא את מספר התוצאות האפשריות יהיה עלינו
לחשב את מספר הדרכים לבחור
k
הצלחות מתוך
n
ניסיונות.
התחום שעוסק בשאלות כאלה של ספירת קומבינציות נקרא קומבינטוריקה.
תוצאה ידועה מתחום זה שמספר האפשרויות במקרה שלנו יהיה:
$$ {{n}\choose{k}} = \frac{n!}{k! \cdot (n-k)!} $$
שימו לב שסימן הקריאה-!
מכונה עצרת ומשמעותו:
$$ n! = n \cdot (n-1) \cdot (n-2) \cdot ... \cdot 2 \cdot 1 $$
ההסתברות תהיה מכפלה של מספר התוצאות בהסתברות של כל תוצאה. לפיכך, ההסתברות ל-k הצלחות מתוך n ניסיונות יהיה נתון בנוסחה: $$ P_n(k) = {{n}\choose{k}} \cdot P^k \cdot (1-P)^{n-k}$$ זוהי ההתפלגות הבינומית או כפי שמכנים אותה לעיתים נוסחת ברנולי.
מקרי קצה
לנוסחת ברנולי יש שני מקרי קצה: רק הצלחות או רק כשלונות.
רק הצלחות משמע
$ k=n $
ואז נקבל:
$$ P_n(n) = {{n}\choose{n}} \cdot P^n \cdot (1-P)^{n-n} $$
$$ P_n(n) = P^n $$
אם יש רק כשלונות אז
$ k=0 $
,
ואם נציב נקבל
:
$$ P_n(0) = {{n}\choose{0}} \cdot P^0 \cdot (1-P)^{n-0} $$
$$ P_n(n) = (1-p)^n $$
שימו לב שיש רק אפשרות אחת לקבל רק כשלונות או רק הצלחות ולכן ההסתברות היא פשוט
ההסתברות לכשלון או הצלחה בניסיון בודד בחזקת מספר הניסיונות.
כאשר אתם צריכים לחשב מקרי קצה ניתן להשתמש ישירות בנוסחאות שקיבלנו כאן ולחסוך את
הזמן של הצבה בנוסחת ברנולי המקורית.
דוגמא פשוטה
צלף יורה למטרה 5 פעמים. ההסתברות שלו לפגוע במטרה בירייה בודדת היא 0.9.
- מהי ההסתברות שהוא יפספס את כל היריות?
- מהי ההסתברות שיפגע בשתי יריות בדיוק?
- מהי ההסתברות שיפגע ב-4 יריות?
- מהי ההסתברות שיפגע בכל היריות?
פתרון:
מספר הניסיונות הוא 5, וההסתברות להצלחה בניסוי בודד הוא 0.9. הערכים הללו זהים עבור כל הסעיפים. הפרמטר היחידי שמשתנה בין הסעיפים הוא מספר ההצלחות (k) .
- הצלף מפספס את כל היריות, כלומר מספר ההצלחות הוא אפס. נציב בנוסחת ברנולי $ k=0 $ ונקבל: $$ P_5(0) = { {5}\choose{0} } \cdot 0.9^{0} \cdot 0.1^{5} = 0.1^5 = \frac{1}{100,000} $$
- נציב $ k=2 $ ונקבל: $$ P_5(2) = { {5}\choose{2} } \cdot 0.9^{2} \cdot 0.1^{3} $$ $$ P_5(2) = 10 \cdot \frac{81}{100,000} = \frac{81}{10,000} $$
- נציב $ k=4 $ ונקבל: $$ P_5(4) = { {5}\choose{4} } \cdot 0.9^{4} \cdot 0.1^{1} $$ $$ P_5(4) = 5 \cdot 0.06561 = 0.32805 $$
- נציב $ k=5 $ ונקבל: $$ P_5(5) = { {5}\choose{5} } \cdot 0.9^{5} \cdot 0.1^{0} = 0.9^5 = 0.59049 $$
הסתברות של איחוד מאורעות
עד עכשיו חישבנו את ההסתברות לקבל בדיוק מספר הצלחות מסויים.
אך כיצד, לדוגמא, נוכל לחשב את ההסתברות של לקבל לפחות 4 הצלחות מתוך 5 ניסיונות?
מאורעות כאלה מכילים מספר אפשרויות, במקרה הספציפי הזה המאורע מכיל את האפשרויות של ארבע או חמש
הצלחות.
נסמן את המאורעות בתור
A-
חמש הצלחות
,
B-
ארבע הצלחות
,
ואז ההסתברות ללפחות ארבע הצלחות תהיה ההסתברות של האיחוד
$ P(A \cup B) $
.
נוכל לחשב את ההסתברות של האיחוד באמצעות הנוסחא המוכרת:
$$ P(A \cup B) = P(A) + P(B) - P(A \cap B) $$
המאורעות זרים מאחר ולא תתכן תוצאה שיש בה גם ארבע הצלחות בדיוק וגם חמש הצלחות בדיוק.
לפיכך:
$$ P(A \cup B) = P(A) + P(B) $$
ומכאן שכל שעלינו לעשות על מנת לחשב את ההסתברות של החיתוך, זה לחשב את ההסתברות של כל אחד מהמאורעות
בנפרד ולחבר ביניהם.
שימו לב שהעיקרון יעבוד גם עבור איחוד של יותר משני מאורעות.
דוגמא
ההסתברות לעבור מבחן נהיגה היא 0.7. חמישה אנשים ניגשים למבחן.
- מהי ההסתברות שבדיוק שניים יעברו?
- מהי ההסתברות שלכל היותר אחד מהם יצליח?
- מהי ההסתברות שלפחות ארבעה יעברו?
- מהי ההסתברות שלכל היותר ארבעה יעברו?
פתרון:
- נציב בנוסחא ונקבל: $$ P_5(2) = { {5}\choose{2} } \cdot 0.7^{2} \cdot 0.3^{3} = 0.1323 $$
- בסעיף זה אנחנו לא מתבקשים לחשב הסתברות של מספר מסויים של הצלחות אלא של איחוד של כמה אפשרויות. המאורע "לכל היותר אחד עובר" כולל שתי אפשרויות: אף אחד אינו עובר או אחד עובר. כלומר כל מה שצריך לעשות זה לחשב את ההסתברות שכולם נכשלים, את ההסתברות שאחד יצליח ולחבר ביניהן. ההסתברות שכולם נכשלים תהיה: $$ P_5(0) = 0.3^5 = \frac{243}{100,000} $$ ההסתברות שאחד יעבור: $$ P_5(1) = { {5}\choose{1} } \cdot 0.7^1 \cdot 0.3^4 = 0.02835 $$ וההתסברות שלכל היותר אחד יעבור תהיה: $$ P = P_5(0) + P_5(1) = \frac{243}{100,000} + 0.02835 = 0.03078$$
-
במאורע זה נכללות שתי אפשריות ארבעה או חמישה עוברים.
נחשב את ההסתברות של כל אחת מהאפשרויות ונחבר ביניהן.
ההסתברות שארבעה עוברים: $$ P_5(4) = { {5}\choose{4} } \cdot 0.7^4 \cdot 0.3^1 = 0.36015 $$ ההסתברות שחמישה עוברים: $$ P_5(5) = 0.7^5 = 0.16807 $$ ולכן ההסתברות שלפחות ארבעה יעברו היא: $$ P = P_5(4) + P_5(5) = 0.52822 $$ -
במאורע זה נכללות האפשרויות:
כולם נכשלים, אחד עובר, שניים עוברים, שלושה עוברים וארבעה עוברים.
ניתן לחשב את ההסתברות של כל אחת מהאפשרויות הללו בנפרד ולסכום אותן, אך דרך יעילה יותר תהיה לחשב את ההסתברות של המאורע המשלים- חמישה עוברים.
כאשר אתם צריכים לחשב את ההסתברות של אפשרויות רבות תמיד כדאי לבדוק אם לא יהיה קל יותר לחשב את ההסתברות של המאורע המשלים.
ההסתברות שכולם עוברים היא: $$ P_5(5) = 0.7^5 = 0.16807 $$ ולכן ההסתברות שלכל היותר 4 יעברו הינה: $$ P = 1 - P_5(5) = 0.83193 $$