Geburtstagsparadoxon

Musteraufgabe zur Wahrscheinlichkeitsrechnung

Das Geburtstagsparadoxon, manchmal auch als Geburtstagsproblem bezeichnet, ist ein Beispiel dafür, dass bestimmte Wahrscheinlichkeiten (und auch Zufälle) intuitiv häufig falsch geschätzt werden, beispielsweise liegt die tatsächliche Zahl von 23 Personen meist unterhalb der intuitiven Schätzung:

„Befinden sich in einem Raum mindestens 23 Personen, dann ist die Chance, dass zwei oder mehr dieser Personen am gleichen Tag (ohne Beachtung des Jahrganges) Geburtstag haben, größer als 50 %.“[1]

Zum falschen Schätzen der Wahrscheinlichkeit kommt es, weil im Geburtstagsparadoxon danach gefragt wird, wie wahrscheinlich es ist, dass zwei beliebige Personen aus einer Gruppe an ein und demselben beliebigen Tag im Jahr Geburtstag haben. Fälschlich wird das Problem oft interpretiert als „wie wahrscheinlich es ist, dass eine bestimmte Person aus einer Gruppe an einem bestimmten Tag im Jahr Geburtstag hat“ (z. B. Übereinstimmung mit dem Geburtstag einer anderen Person der Gruppe), und diese Wahrscheinlichkeit ist tatsächlich deutlich kleiner.

Das Paradoxon ist Richard von Mises zugeschrieben worden, z. B. von Persi Diaconis und Frederick Mosteller.[2] Donald E. Knuth schrieb 1973, Mathematiker hätten das Geburtstagsparadoxon schon in den 1930er Jahren diskutiert; der Urheber sei unbekannt.[3]

Eingrenzung

Bearbeiten

Frage: Wie hoch ist die Wahrscheinlichkeit, dass bei 23 Personen mindestens zwei am gleichen Tag im Jahr Geburtstag haben?

Die Antwort ist für die meisten Menschen verblüffend und wird als paradox wahrgenommen. Die meisten Menschen, die sich dafür interessieren, schätzen die Wahrscheinlichkeit um eine Zehnerpotenz falsch ein. Sie liegt nicht (wie zumeist geschätzt) zwischen 1 % und 5 %, sondern über 50 %, bei 50 Personen sogar bei über 97 %.

Im Unterschied dazu steht die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag (ohne Beachtung des Jahrgangs) Geburtstag hat: Ist durch den Geburtstag einer der anwesenden Personen der bestimmte Tag festgelegt, sind weitere 253 Personen (also insgesamt 254 Personen) notwendig, um eine Wahrscheinlichkeit von 50 % zu erreichen (siehe den Artikel Binomialverteilung – Gemeinsamer Geburtstag im Jahr und weiter unten den Abschnitt Wahrscheinlichkeit für einen bestimmten Tag).

Der Grund für diesen großen Unterschied liegt darin, dass aus   Personen   verschiedene Paare gebildet werden können; die Zahl der möglichen Paare steigt daher mit wachsender Zahl der Personen in der Gruppe immer schneller an – wenn die  te Person dazukommt, steigt die Zahl der Paare um  . Die Bedingung für das in Frage stehende Ereignis ist schon erfüllt, wenn ein einziges dieser Paare am gleichen Tag Geburtstag hat. Da die Wahrscheinlichkeit, am gleichen Tag Geburtstag zu haben, für jedes Paar gleich groß ist und die Anzahl der Paare mit wachsender Zahl an Personen immer schneller ansteigt, steigt auch die Wahrscheinlichkeit, dass zwei Personen in der Gruppe am gleichen Tag Geburtstag haben, mit wachsender Gruppengröße deutlich schneller an als bei der Variante, wenn ein Geburtsdatum durch eine vorher bestimmte Person fixiert wird.

Ungleichmäßig verteilte Geburtstage

Bearbeiten

In der Realität sind nicht alle Geburtstermine gleich wahrscheinlich, so werden z. B. im Sommer mehr Kinder geboren als im Winter.[4] Dadurch nimmt die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, leicht zu.[5][6] Simulationen zeigen, dass auch für echte Daten die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, nach wie vor bei 23 Personen 50 % übersteigt.[7] Auch die Berücksichtigung des in der Herleitung vernachlässigten Schalttags ändert daran nichts.

Bedeutung in der Kryptographie

Bearbeiten

Dieser Effekt hat eine Bedeutung bei kryptographischen Hashfunktionen, die einen eindeutigen Prüfwert aus einem Text ergeben sollen. Es ist dabei viel einfacher, zwei zufällige Texte zu finden, die denselben Prüfwert haben, als zu einem vorgegebenen Text einen weiteren zu finden, der denselben Prüfwert aufweist (siehe Kollisionsangriff).

Mathematische Herleitungen

Bearbeiten

Im Folgenden wird der 29. Februar vernachlässigt und angenommen, dass die Geburtstage der   Personen unabhängige, identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung auf der 365-elementigen Menge   sind. Diese Annahme ist beispielsweise dann nicht erfüllt, wenn sich unter den   anwesenden Personen Zwillinge befinden.

Im Urnenmodell entspricht diese Annahme einer Ziehung von   Kugeln mit Zurücklegen aus einer Urne, die 365 Kugeln mit der Beschriftung „1. Januar“, „2. Januar“ usw. bis „31. Dezember“ enthält.

Alle folgenden Berechnungen gelten nur für die Beschränkung auf weniger als 366 Personen, also  . Nach dem Schubfachprinzip ist (unter Vernachlässigung des 29. Februars) für alle   die Wahrscheinlichkeit gleich 1, es gibt also mit Sicherheit zwei Personen mit gleichem Geburtstag. Wenn der 29. Februar als Geburtstag nicht vernachlässigt wird, dann gilt dies erst ab  .

Wahrscheinlichkeit, dass mindestens zwei Personen am gleichen Tag Geburtstag haben

Bearbeiten
 
Die rote Kurve zeigt die Wahrscheinlichkeit, dass mindestens zwei Personen am gleichen Tag Geburtstag haben. Die blaue Kurve zeigt die Wahrscheinlichkeit, dass alle Personen an verschiedenen Tagen Geburtstag haben.
 
Die schwarze Kurve zeigt die exakte Wahrscheinlichkeit, dass mindestens zwei Personen am gleichen Tag Geburtstag haben. Die rote Kurve zeigt die Approximation  .

Die Anzahl aller möglichen Variationen ist für   Personen  , wobei alle Fälle gleich wahrscheinlich sind. Zum Beispiel ergeben sich für zwei Personen   mögliche Fälle von Geburtstagsvariationen.

Von diesen möglichen Fällen beinhalten

 

nur unterschiedliche Geburtstage. Für die erste Person kann der Geburtstag frei gewählt werden, für die zweite gibt es dann 364 Tage, an denen die erste nicht Geburtstag hat etc.

Damit ergibt sich nach der Formel von Laplace die Wahrscheinlichkeit von

 

dass alle   Personen an unterschiedlichen Tagen Geburtstag haben.

Die Wahrscheinlichkeit für mindestens einen doppelten Geburtstag im Verlauf eines Jahres ist somit:

 

Mithilfe der Ungleichung   der Exponentialfunktion für   ergibt sich

 

Wenn diese Wahrscheinlichkeit größer als 50 % ist, folgt daraus:

 

Aus dieser quadratischen Ungleichung folgt  . Weil   eine ganze Zahl ist, gilt  .

Für   ergibt sich:

 

Eine Approximation

Der Ausdruck für P kann weiter umgeformt werden:

 

Mit der Stirlingformel lässt sich dies gut nähern zu

 

was man leicht mit einem Taschenrechner auswerten kann.

In einer Gruppe von 23 Personen muss man   verschiedene Vergleiche anstellen, um einen vollständigen Überblick zu bekommen, ob es gemeinsame Geburtstage gibt, und wenn ja, wie viele.

Wahrscheinlichkeit für einen bestimmten Tag

Bearbeiten
 
  = Wahrscheinlichkeit für mindestens einen doppelten Geburtstag
  = Wahrscheinlichkeit, dass mindestens ein Geburtstag mit deinem zusammenfällt

Eine andere Frage liegt vor, wenn man nicht nach beliebigen Übereinstimmungen der Geburtstage sucht, sondern nach Übereinstimmung mit einem fest ausgewählten Tag im Jahr.

Ignoriert man wie bisher den 29. Februar, so ist die Wahrscheinlichkeit für eine Person, an einem solchen bestimmten Tag Geburtstag zu haben, gleich 1/365 ≈ 0,27 %.

Die Wahrscheinlichkeit für das Gegenteil, also die Wahrscheinlichkeit, an einem bestimmten Tag nicht Geburtstag zu haben, ist damit

 

Bei zwei Personen ist die Wahrscheinlichkeit, dass an dem vorher ausgewählten Tag keine von beiden Geburtstag hat, gleich   (wie bisher nehmen wir an, dass die Geburtstage der Personen unabhängig sind).

Dabei mindestens einen Treffer zu haben (mindestens eine Person von zweien hat an einem bestimmten Tag Geburtstag), ist wieder die Gegenwahrscheinlichkeit:

 

So fortfahrend für größere Anzahlen von Personen erhält man: Die Wahrscheinlichkeit  , dass mindestens eine Person von   anwesenden Personen an einem bestimmten Tag Geburtstag hat, ist

 

Damit lässt sich ausrechnen, wie viele Personen   man braucht, um eine bestimmte Wahrscheinlichkeit   zu erreichen, dass mindestens eine Person an einem bestimmten Tag Geburtstag hat:

 

Für eine Wahrscheinlichkeit von 50 % benötigt man[8]

 

Personen. Wie beim vorigen Problem sind auch hier bei 253 Personen 253 Vergleiche mit dem bestimmten Datum erforderlich, um einen vollständigen Überblick über die Situation zu haben.

Allgemein gilt für eine Auswahl aus einem Zeitraum mit   Tagen:

 

und

 

Schließlich errechnet sich für den Fall, dass eine der   anwesenden Personen Geburtstag hat, die Wahrscheinlichkeit, dass von den übrigen   Personen mindestens eine am gleichen Tag Geburtstag hat, zu  .

Im Unterschied zur Wahrscheinlichkeit, dass mindestens zwei Personen an einem Tag Geburtstag haben (siehe oben), gibt es hier kein   für das man eine sichere Aussage treffen kann: Für jede Personenzahl gibt es die Möglichkeit, dass der ausgewählte Tag nicht als Geburtstag vorkommt (das Schubfachprinzip ist nicht anwendbar). Für alle   gilt  .

Wahrscheinlichkeit, dass genau zwei Personen am selben Tag Geburtstag haben

Bearbeiten

Bei diesem Problem lautet das konkrete Ereignis: „2 Personen haben am gleichen Tag Geburtstag, alle anderen an unterschiedlichen Tagen.“

Es gibt 365 Möglichkeiten für den Tag des Doppelgeburtstags. Die beiden Personen lassen sich auf   Arten auswählen. Die verbleibenden   Personen werden nacheinander auf die restlichen 364 Tage verteilt, und zwar so, dass es keine weitere Mehrfachbelegung gibt. Dafür gibt es   Möglichkeiten. Danach bleiben noch   Tage des Jahres übrig, an denen niemand Geburtstag hat. Insgesamt erhält man für das Eintreten des Ereignisses   günstige Fälle. Die gesuchte Wahrscheinlichkeit für das Eintreten des Ereignisses beträgt  , da wieder alle 365 Tage des Jahres als gleich wahrscheinlich angenommen werden.

Die Wahrscheinlichkeiten stellen eine Zahlenfolge in Abhängigkeit von   dar, die streng monoton bis   wächst. Dort beträgt die Wahrscheinlichkeit rund 38,6 %. Danach fällt die Folge streng monoton. Ab   ist die Wahrscheinlichkeit 0, da das Ereignis in diesen Fällen nicht mehr eintreten kann, weil es dann Mehrfachgeburtstage oder mehrere Doppelgeburtstage gibt.

Mehr als zwei Personen mit gleichem Geburtstag

Bearbeiten

Eine Verallgemeinerung der Fragestellung ist, aus wie vielen Personen eine Gruppe bestehen muss, damit die Wahrscheinlichkeit, dass mindestens   Personen am selben Tag Geburtstag haben, größer als 50 % ist. Die folgende Tabelle zeigt die Mindestanzahl der Personen für  :[9]

Mindestanzahl n von Personen
m n
2 23
3 88
4 187
5 313
6 460
7 623
8 798
9 985
10 1181

Beispielhafte Erläuterung zum Auftreten des scheinbaren Paradoxons

Bearbeiten

Wie bei vielen Problemen der Kombinatorik und Wahrscheinlichkeit kommt es auch hier auf den genauen Kontext bzw. den Ablauf des Experimentes an. Denken wir uns folgende Experimente. Zur Vereinfachung habe ein Jahr immer exakt 365 Tage.

Eine bestimmte Person an einem bestimmten Tag

Bearbeiten

Peter hat am 19. Januar Geburtstag. Peter hat 365 Freunde, die alle an einem unterschiedlichen Tag Geburtstag haben. Die Wahrscheinlichkeit, dass ein bestimmter, ausgewählter Freund ebenfalls am 19. Januar Geburtstag hat, beträgt  . Bei zwei ausgewählten Freunden beträgt diese Wahrscheinlichkeit schon  . Mit jedem weiteren Freund erhöht sich die Wahrscheinlichkeit um  , bis schließlich bei 365 Freunden die Wahrscheinlichkeit   beträgt.

Beliebige Personen an einem beliebigen Tag

Bearbeiten

Ändern wir das Experiment dahingehend, dass nicht der bestimmte Geburtstag (hier: 19. Januar) einer bestimmten Person (hier: Peter) gefragt ist. Diesmal sei Peters Geburtstag und der seiner Freunde an einem beliebigen Tag. In diesem Experiment fragen wir nach der Wahrscheinlichkeit, dass beliebige Personen in einem Raum an einem beliebigen Tag zusammen Geburtstag haben. Dazu werden wir die Wahrscheinlichkeit zunächst nur in einer Überschlagsrechnung bestimmen. Nacheinander werden wir Peters Freunde zum Experiment hinzuziehen. Die Wahrscheinlichkeit, dass sein Freund Ulf am selben Tag Geburtstag feiert, beträgt  . Beim weiteren hinzugezogenen Freund namens Rainer beträgt die approximierte Wahrscheinlichkeit schon  . Die Wahrscheinlichkeit erhöht sich um  , weil Rainer zusammen mit Peter oder Ulf Geburtstag haben könnte. Bei der nächsten hinzugezogenen Person namens Robert beträgt die überschlagene Wahrscheinlichkeit dementsprechend schon  . Die Wahrscheinlichkeit steigt hier im Vergleich zum vorherigen Experiment rapide an. Das scheinbare Paradoxon entsteht dadurch, dass mit jeder weiteren Person auch die Anzahl potentieller Paare mit gemeinsamem Geburtstag steigt.

Allerdings handelt es sich hierbei um Überschlagswerte. Es wurde nämlich bisher nicht die Möglichkeit berücksichtigt, dass bei der Personengruppe evtl. schon einige Personen zusammen Geburtstag haben könnten. Wird Rainer zum Experiment hinzugezogen, erhöht sich die Wahrscheinlichkeit nicht um  , da wir berücksichtigen müssen, dass Ulf und Peter evtl. schon gemeinsam Geburtstag feiern. Die gesuchte Wahrscheinlichkeit ist somit etwas kleiner als  . Mit Robert liegt die Wahrscheinlichkeit auch wieder etwas unter dem Wert von  , da auch hier evtl. schon einige der anwesenden Personen (Peter, Ulf und Rainer) zusammen Geburtstag haben.

Verwandte Fragen

Bearbeiten

Bei dem Spiel Memory sind die Paare unter   Karten (bestehend aus   Paaren) aufzudecken. Zu Beginn des Spiels liegen alle Karten verdeckt, und solange nur verschiedene Karten aufgedeckt werden, haben die Spieler nur zufällig die Möglichkeit, ein Paar zu finden. Deshalb stellt sich die Frage – ähnlich wie beim Geburtstagsparadoxon – wie viele Karten man aufdecken muss, um mit einer gewissen Wahrscheinlichkeit (z. B. 50 %) mindestens ein Paar zu bekommen.

Die Anzahl   der verschiedenen Motive entspricht hier der Anzahl der Tage im Jahr (365) im Geburtstagsparadoxon. Üblicherweise wird Memory mit 32 Paaren gespielt, es gibt aber auch andere Varianten, sodass es sinnvoll ist, die Zahl   variabel zu halten.

Setzt man   für die Wahrscheinlichkeit, durch Aufdecken von   Karten nur verschiedene Karten aufzudecken, so gilt:

 

Als Ergebnis bekommt man für   Bei Aufdecken von 10 Karten ist die Wahrscheinlichkeit größer als 50 %, mindestens ein Paar zu erhalten   Für   liegt die Grenze bei 12 Karten. Bei einem hypothetischen Memory mit 183 Paaren muss man 23 Karten aufdecken, bei 365 Paaren sind 32 Karten notwendig.[10]

Dieses Ergebnis hat wichtige praktische Auswirkungen auf das Spiel, da die Spieler die Lust verlieren würden, wenn es zu lange dauert, bis das erste Paar aufgedeckt wird.

Siehe auch

Bearbeiten
  • Das Sammelbilderproblem behandelt eine ähnliche Frage. Hier geht es – übertragen auf die Beobachtung von Geburtstagen in einer Gruppe von Menschen – darum, wie viele Personen ausgewählt werden müssen, damit jeder Tag des Jahres als Geburtstag einer der Personen vorkommt.
  • Das Ziegenproblem wird oft als Beispiel dafür herangezogen, dass der menschliche Verstand zu Trugschlüssen neigt, wenn es um das Bestimmen von Wahrscheinlichkeiten geht.
  • Auch das Lincoln-Kennedy-Mysterium ist ein Phänomen, das mit der Übereinstimmung von biographischen Daten zu tun hat.
Bearbeiten
Wiktionary: Geburtstagsparadoxon – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

Bearbeiten
  1. Richard von Mises: Über Aufteilungs- und Besetzungswahrscheinlichkeiten. Revue de la Faculté de Sciences de l’Université d’Istanbul N.S., 4. 1938–39, S. 145–163.
  2. P. Diaconis, F. Mosteller: Methods for Studying Coincidences. In: Journal of the American Statistical Association. 84, 4, S. 853–861.
  3. Donald E. Knuth: The Art of Computer Programming. Bd. 3: Sorting and Searching. zweite Auflage, ISBN 0-201-89685-0. S. 513.
  4. Emma Hawe, Alison Macfarlane and John Bithell: Daily and seasonal variation in live births, stillbirths and infant mortality in England and Wales, 1979–96. In: Health Statistics Quarterly. 9 Spring 2001 (PDF; 180 kB), S. 7: „There was a clear seasonal pattern in the number of daily live births throughout the entire period, with lower numbers of births in the winter than the summer months.“
  5. D. Bloom (1973): A birthday problem. American Mathematical Monthly, Bd. 80, S. 1141–1142 enthält einen Beweis mit Lagrange-Multiplikatoren, dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am gleichen Tag Geburtstag haben.
  6. Stefan Kirchner in de.sci.mathematik, 3. November 2005.
  7. Hugo Pfoertner in de.sci.mathematik, 22. Januar 2005.
  8. Im Folgenden wird die sog. Ceil-Funktion verwendet:
      ist für jede reelle Zahl   die kleinste ganze Zahl, die nicht kleiner als   ist, z. B.  
  9. Folge A014088 in OEIS
  10. Dass man bei 183 (≈ 365/2) die gleiche Zahl   bekommt wie beim Geburtstagsparadoxon, ist kein Zufall: Die Produktdarstellung für die Wahrscheinlichkeit zeigt (zumindest für die ersten Faktoren) eine große Ähnlichkeit.