בעיית מונטי הול
בעיית מונטי הול או בעיית "עשינו עסק" היא בעיה בתורת ההסתברות שפתרונה אינו אינטואיטיבי. הבעיה מכונה גם "הפרדוקס של מונטי הול".
הבעיה
[עריכת קוד מקור | עריכה]הבעיה קרויה על שם שעשועון הטלוויזיה האמריקאי המצליח "Let's Make a Deal (אנ')" בהנחיית מונטי הול. בסוף התוכנית מציגים בפני השחקן שלוש דלתות. מאחורי אחת מהן מצוי פרס יקר ערך - מכונית - ומאחורי שתי הדלתות האחרות - עזים. השחקן מעדיף כמובן את המכונית, אבל הוא אינו יודע איזו דלת מסתירה אותה, ונאלץ לבחור באקראי. אם יבחר בדלת הנכונה, יזכה בפרס; אחרת, לא יקבל דבר.
וזוהי הבעיה:
- לאחר שהשחקן הצביע על אחת הדלתות, נניח דלת מס׳ 1, המנחה, היודע מהי הדלת הנכונה, פותח אחת משתי הדלתות האחרות, נניח דלת מס׳ 3, ומגלה מאחוריה עז. כעת מאפשרים לשחקן להחליט האם לדבוק בבחירה המקורית שלו, או לשנות את ההחלטה ולהעדיף במקומה את הדלת האחרונה שנותרה סגורה - דלת מס׳ 2.
ניתוח פשטני של הסיטואציה מציג בפנינו את הדילמה הבאה: מצד אחד, הסיכוי שהשחקן בחר בדלת הנכונה היה 1/3, וברגע הבחירה ברור לו שמבין שתי הדלתות האחרות לפחות אחת מסתירה עז. אם כך, המנחה שפתח דלת לא גילה לשחקן שום דבר שלא ידע מראש, ולכן הסיכוי שהדלת שבחר היא הנכונה צריך, לכאורה, להישאר שליש, כשהיה. מצד שני, לאחר שהמנחה פתח את הדלת שלו, נותרו שתי דלתות סגורות, ורק אחת מהן מסתירה את הפרס. לכן (אפילו מנקודת המבט של צופה חיצוני, שאינו יודע באיזו דלת בחר השחקן), הסיכויים שהפרס נמצא מאחורי הדלת הנותרת הם 1/2. גישה שלישית טוענת שעל הדלת שהמנחה לא פתח לא למדנו דבר - כך שהסיכוי שלה להסתיר את הפרס היה ונשאר 1/3, והסיכוי של הדלת עליה הצבענו אמור להיות 2/3.
כפי שיוסבר בהמשך, בניסוח הזה אין שום דרך לחשב את הסיכויים הנכונים, ועל כן נתגלו אי-הסכמות בין מי שניסו לחשב אותם בכל זאת. נתבונן בניסוח מדוקדק יותר של הבעיה[1]:
- לאחר שהשחקן הצביע על אחת הדלתות, המנחה, היודע מהי הדלת הנכונה, מחויב על-פי כללי המשחק לפתוח אחת משתי הדלתות האחרות ולגלות מאחוריה עז. כמקודם, השחקן צריך להחליט האם להישאר עם אותה דלת, או להחליף אותה באחרת.
בניסוח הקודם של הבעיה המנחה פותח דלת ומגלה מאחוריה עז, ובניסוח השני מתברר שהוא לא פעל סתם כך, אלא היה מחויב לעשות כן לפי כללי המשחק. מתברר שאבחנה עדינה זו מספיקה כדי שאפשר יהיה לחשב באופן מדויק את הסיכויים לכך שהפרס מסתתר מאחורי הדלת שלא נפתחה: 2/3. בתנאים אלה, בוודאי שעדיף לעבור לדלת השנייה. לכאורה נדמה שזו תוצאה אבסורדית, שכן (כאמור לעיל) על עצם הקיום של דלת מסתירת-עז שלא בחרנו בה, ידענו ממילא, ואם כך מה חידש המנחה? ומה היתרון של השחקן על-פני אורח שהזדמן לאולפן אחרי שהדלת נפתחה (ומבחינתו הסיכויים לכל אחת משתי הדלתות הסגורות שווים)? הסיבה לכדאיות ההחלפה תוסבר בהמשך.
מקורה של הבעיה
[עריכת קוד מקור | עריכה]גרסה מוקדמת של הבעיה הופיעה לראשונה עוד בשנת 1889, בספרו של ז'וזף ברטראן Calcul des probabilités.
השם "הבעיה של מונטי הול" ניתן לבעיה זו על ידי סטיב סלווין (אנ'), לאחר שהציג אותה במאמר שפורסם בפברואר 1975 בכתב העת American Statistician (אנ'), אף שבשעשועון המקורי אין בחירה חוזרת - לאחר שהשחקן בחר באחת משלוש הדלתות, מסתיים הסיפור.
הבעיה הוצגה עוד קודם לכן, בשנת 1959, על ידי מרטין גרדנר, בטורו בירחון Scientific American. אצל גארדנר היא קרויה "בעיית שלושת האסירים" וניסוחה:
- שלושה אסירים, א', ב' וג' נידונו למוות. המושל בחר באופן אקראי אחד מהם והחליט להעניק לו חנינה, ואת בחירתו גילה רק לסוהר. הסוהר מסרב לגלות לא' מה יהיה גורלו, אך מוכן לגלות לו מי מבין שני האסירים האחרים יצא להורג בתנאים הבאים:
- אם ב' זכה בחנינה יאמר הסוהר את שמו של ג', אם ג' זכה בחנינה יאמר הסוהר את שמו של ב', אם א' זכה בחנינה יבחר הסוהר באקראי בין ב' לג'.
- הסוהר אומר שב' יוצא להורג כך שהזוכה בחנינה הוא א' או ג'. מה ההסתברות שהזוכה בחנינה הוא א'? קל לראות ששתי הבעיות שקולות זו לזו, למרות שבמבט ראשון נראה שהסיכוי של א' וג' שווה זה לזה, הסיכוי של א' לזכות בחנינה נותר 1/3 וסיכויו של ג' עלה ל2/3.
ב-1990 התפרסמה הבעיה מחדש בגרסתה הרגילה כאשר היא נשאלה במדור 'שאל את מרילין' בעיתון Parade מרילין ווס סוואנט ענתה את התשובה הנכונה והוצפה באלפי פניות בחלקם גם מאת מתמטיקאים שטענו שמרילין טועה והפתרון הנכון הוא שההסתברות למכונית בשתי הדלתות היא 1/2, מרילין השיבה לטענות נגדה והציעה לפונים לערוך ניסוי בעצמם ולבחון את תוצאותיו.
ניתוח הגרסה הראשונה
[עריכת קוד מקור | עריכה]התשובה הנכונה לשאלה בגרסה הראשונה היא שאי אפשר לדעת מה עדיף. כפי שהבעיה מנוסחת שם, המנחה יכול היה שלא לפתוח אף דלת, ואולי אפילו יכול היה לפתוח את הדלת עם הפרס. מכיוון שכך, המנחה יכול להיות משתף פעולה ולהמליץ על החלפה רק אם השחקן טועה (עם מנחה כזה, הסיכויים להצליח בהחלפה הם 100%), או רודף סנסציות שממליץ על החלפה רק אם השחקן צודק (ואז הסיכויים להצליח בהחלפה הם 0).
על ידי מיזוג שתי התכונות האלה, אפשר "לחשב" שהסיכויים להצליח בהחלפת הדלתות הם כל מספר שנרצה. גם כאן, הבעיה הופכת להיות סוגיה בפסיכולוגיה של מנחי טלוויזיה, ולא בהסתברות.
ניתוח הגרסה השנייה
[עריכת קוד מקור | עריכה]נקודת המפתח בגרסה זו היא מחויבות המנחה לפתיחת דלת שמאחוריה מסתתרת עז, מה שמשאיר במשחק שתי דלתות. אם השחקן צודק בניחוש הראשון ובוחר במכונית (הסיכוי לכך הוא 1/3), החלפת הדלת תגרום לו להפסיד. ואם טעה ובחר בעז, המנחה פותח את הדלת השגויה האחרת, ומשאיר סגורה את הדלת הנכונה; במקרה כזה ההחלפה תבטיח לשחקן את הפרס, וזה קורה בסיכוי של 2/3.
היתרון של השחקן על-פני האורח שנכנס אחרי פתיחת הדלת הוא באינפורמציה שאינה ידועה לו: השחקן בחר את הדלת שלו כשהיא הייתה אחת משלוש, ולכן הסיכוי שלה להסתיר את הפרס הוא 1/3. מבחינת האורח, דלת זו היא אחת משתיים, והסיכוי שלה להסתיר את הפרס הוא 1/2. האבחנה הזו (איזו דלת נכונה בסיכוי 1/3 ואיזו נכונה בסיכוי 2/3) היא הדבר שהשחקן יודע והאורח אינו יודע. הסיכוי תלוי בנקודת המבט. נאמר שהאורח מצביע על אחת הדלתות. מבחינתו, הסיכוי שזוהי הדלת הנכונה הוא חצי. השחקן יודע שהסיכוי הוא שליש או שני שלישים (תלוי כמובן באיזו דלת מדובר). באותה עת, מבחינת המנחה הכל-יודע, הסיכוי הוא אפס או אחת.
ההסבר הוא פשוט: אם בחרת מראש מכונית, שינוי הבחירה תמיד יגרום לך לקבל עז. אם בחרת מראש בעז, הרי שינוי הבחירה שלך יגרום לך תמיד לקבל מכונית. אבל מה ההסתברות שבחרת מראש בעז? מכיוון שיש 2 עיזים ומכונית אחת, הסיכוי שבחרת בהתחלה עז גדול פי שניים מזה שבחרת מכונית (2/3). לכן שינוי הבחירה יזכה אותך במכונית בהסתברות כפולה, קרי 2/3.
במבט ראשון פתרון הבעיה נראה מנוגד לאינטואציה, ניתן גם להציג את הבעיה בצורה מעט אחרת, שהופכת את הפתרון לקל יותר להבנה:
- אם אחרי בחירת הדלת היה המנחה מציע (תמיד) לנטוש אותה ולבחור במקומה בשתי הדלתות האחרות, כך שאם מסתתרת מכונית מעברו השני של אחת מהן - נזכה בה, היה ברור שכדאי לקבל את ההצעה. אבל בכך שהוא פותח רק אחת משתי הדלתות האחרות, וחושף את העז, המנחה מציע לשחקן בדיוק את ההצעה הזו: לקבל את שתי הדלתות שלא בחרנו, שידוע כי באחת מהן נמצאת עז. כאן קל יותר להשתכנע שהסיכויים לזכות בפרס אחרי החלפה הם 2/3.
- דרך אחרת להסביר את הפתרון היא בניתוח אסטרטגי. האסטרטגיה "הצמד למה שבחרת בהתחלה" מבטיחה לשחקן הסתברות זכייה של 1/3, משום שזו הייתה ההסתברות מרגע הבחירה הראשון. האסטרטגיה "החלף בכל מקרה" היא האסטרטגיה המשלימה (המנחה השאיר רק שתי דלתות), ולכן ההסתברות להצליח בעזרתה היא 2/3.
- נניח שמתקיים אותו משחק עם אלף דלתות, כאשר בצידה השני של אחת מהן מסתתר פרס, ומאחורי 999 הדלתות הנוספות נמצאות עזים. בתחילה נבחר דלת, והמנחה יפתח עוד 998 דלתות נוספות, שבצידן השני עזים. האם כדאי יהיה לשחקן להחליף את הבחירה המקורית שלו? כמובן. ההסבר לכך הוא השאלה: מתי ההחלפה תגרום להפסד? זה יקרה אך ורק כאשר הדלת הנכונה היא זו שנבחרה בהתחלה, אירוע שהסיכוי לו הוא 0.1%. בכל בחירה אחרת השחקן ישפר את מצבו ויזכה.
פתרון הסתברותי לגרסה השנייה
[עריכת קוד מקור | עריכה]- מאורע X: המכונית מאחורי וילון 1.
- מאורע Y: המכונית מאחורי וילון 2.
- מאורע Z: המכונית מאחורי וילון 3.
- מאורע B: המנחה פותח את וילון 2 שמאחוריו עז.
נבחין כי בתחילת השעשועון כאשר המשתתף יבחר את הווילון באופן שרירותי (נניח כי הבחירה שלו היא X) ההסתברות לבחירה שווה ולכן - P(X)=P(Y)=P(Z)=1/3
כעת נחשב את ההסתברות לזכייה במכונית כאשר המשתתף החליף וילון, וכאשר הוא לא החליף וילון.
מקרה ראשון - המשתתף לא החליף וילון - P(X|B):
נחשב את ההסתברות שהמכונית תהייה מאחורי הוילון הראשון בהינתן שהיא לא מאחורי הוילון השני.
P(X ∩ B) = P(B|X)xP(X)=1/2 x 1/3=1/6
1/2=P(B)=P(B|X)xP(X)+P(B|Y)xP(Y)+P(B|Z)xP(Z)=1/6+0 x 1/3 +1 x 1/3
P(X|B)=P(X ∩ B) / P(B) =(1/6)/(1/2)=1/3
הסיכוי לזכייה במכונית נשמר והוא 1/3.
מקרה שני - המשתתף החליף וילון - P(Z|B):
נחשב את ההסתברות שהמכונית תהייה מאחורי הוילון השלישי בהינתן שהיא לא מאחורי הוילון השני.
P(Z|B)=P(Z ∩ B) / P(B)=(P(B|Z)xP(Z))/P(B)=(1/3)/(1/2)=2/3
הסיכוי לזכייה במכונית הוא 2/3.
נבחין כי הסיכויים לזכות במכונית לאחר החלפת הוילון אכן גדולים יותר מהסיכויים לזכות במכונית ללא החלפת הוילון הנבחר בתחילת השעשועון.
P(Z|B) = 2/3 > 1/3 = P(X|B).
סימולציה
[עריכת קוד מקור | עריכה]הקוד הבא בפייתון מבצע סימולציה של המשחק:
import numpy as np
N_ROUNDS = 10000
wins_with_switch = 0
wins_without_switch = 0
for i in range(N_ROUNDS):
doors = [0, 1, 2]
true_door = np.random.randint(3)
# Intial guess of the contender
initial_choice = np.random.randint(3)
print(f"True door is {true_door}, guess is {initial_choice}.")
# Now the host opens an empty door and offers you to switch your selection to the remaining closed door.
if initial_choice == true_door:
wins_with_switch += 0
wins_without_switch += 1
if initial_choice != true_door:
wins_with_switch += 1
wins_without_switch += 0
print(f"For {N_ROUNDS} games, here are the results.")
print(f"With switch success rate: {wins_with_switch/N_ROUNDS}")
print(f"Without switch success rate: {wins_without_switch/N_ROUNDS}")
בתרבות
[עריכת קוד מקור | עריכה]- בספר "המקרה המוזר של הכלב בשעת לילה", מובאת החידה וההד האקדמי שהיא עוררה כהוכחה לכך שמתמטיקה היא דבר שאיננו ברור ואינטואיטיבי. בספר גם מופיע חישוב הסתברותי פשוט (באמצעות הסתברות מותנית) שממחיש את פתרון החידה בצורה מתמטית.
- בסרט "21", המספר את סיפורו של גאון מתמטי אשר מנצל את כישוריו בתחום המספרים על-מנת לזכות בהימורים בלאס וגאס. מארגן קבוצת המהמרים הוא מרצה באוניברסיטה, והוא מציג לתלמידו את בעיית מונטי הול כמבחן ליכולת החשיבה ההסתברותית שלו. בסרט מוצגת הגרסה הפתירה של הבעיה (המופיעה כאן שנייה). לאחר שהתלמיד מסביר מדוע כדאי להחליף את הבחירה ולהגדיל את הסיכוי ל-2/3, הוא עובר את המבחן בהצלחה ומגויס לצוות ההימורים שהרכיב המרצה.
- ברומן "דברי מתיקה" מאת איאן מקיואן מציגה גיבורת הרומן, סרינה פרום, בעלת תואר ראשון במתמטיקה, את בעיית מונטי הול לאהובהּ, הסופר טום היילי. הוא מחבר סיפור קצר שבמרכזו בעיית מונטי הול כבסיס להחלטה בחיים האמיתיים, אך בגרסתו יש טעות בהצגת הבעיה, הנובעת מחוסר בקיאותו בתורת ההסתברות. סרינה מזהה את הטעות ומציעה גרסה מתוקנת לסיפור. טום מקבל את הצעתה, ומתקן את סיפורו.
- בסדרה "סמוך על סול", עונה 2 פרק 4, הוזכרה הבעיה.
ראו גם
[עריכת קוד מקור | עריכה]לקריאה נוספת
[עריכת קוד מקור | עריכה]- Eosenhouse, Jason. The monty hall problem. Oxford University Press, 2009. ISBN 0199709904
קישורים חיצוניים
[עריכת קוד מקור | עריכה]- יוסי לוי, המכונית והעזים, באתר "נסיכת המדעים"
- הפסיכולוגיה של בעיית מונטי הול, פוסט בבלוג של גיל גרינגרוז
- ניסוי מחשב (אורכב 23.10.2007 בארכיון Wayback Machine), המראה שמי שתמיד נשאר עם הדלת שלו זוכה בשליש מהפעמים, מי שתמיד מחליף דלת זוכה בשני שלישים מהפעמים, ומי שמגריל מחדש את הדלת שהוא בוחר אחרי שהמנחה פתח דלת אחת זוכה בממוצע בחצי מהנסיונות.
- הדמיית מחשב המאפשרת להריץ את המשחק מספר רב של פעמים
- גדי אלכסנדרוביץ', הבעיה של מונטי הול, באתר "לא מדויק", 23 בפברואר 2008
- סרטון המתאר את התופעה מערוץ AsapSIENCE ביוטיוב.
- פרדוקס מונטי הול(הקישור אינו פעיל, 10.7.2019)
- בעיית מונטי הול, באתר MathWorld (באנגלית)
- [1]
הערות שוליים
[עריכת קוד מקור | עריכה]- ^ כפי שהוא מופיע למשל ב-Understanding Probability, Henk Tijms, Cambridge University Press, 2004, בעיה 1.11; וראו ניתוח מפורט בסעיף 6.1.