Paradoks dnia urodzin
Z Wikipedii
Pytanie stawiane w paradoksie dnia urodzin brzmi: Ile osób należy wybrać, żeby prawdopodobieństwo, że co najmniej dwie z nich mają urodziny tego samego dnia w roku, było większe od 0,5.
Odpowiedzią jest zaskakująco niskie 23. Wynik ten został obliczony bez uwzględniania osób urodzonych 29 lutego, bliźniaków, które zaburzają statystyczną niezależność dat urodzeń oraz sezonowości rocznej w urodzeniach. Uwzględnienie tych (stosunkowo drobnych) poprawek nie zmieniłoby jednak rzędu wielkości odpowiedzi.
Spis treści |
[edytuj] Wyprowadzenie
Jeśli losowo przyporządkujemy każdemu z n obiektów jedną z k etykietek, to prawdopodobieństwo, że każda etykietka będzie inna, wyniesie:
-
(1)
Jeśli chcemy obliczyć dla jakiego n prawdopodobieństwo tego, że przynajmniej dwa obiekty będą miały tę samą etykietkę przekroczy 50%, wystarczy sprawdzić, kiedy:
czyli
-
(2)
[edytuj] Metoda numeryczna
Najprostszą metodą sprawdzenia, że 23 osoby są wystarczające, a 22 nie, jest po prostu numeryczne wyliczenie z powyższych wzorów:
Metoda ta nie pozwala jednak zaobserwować ogólnej zależności.
[edytuj] Metoda analityczna
Można udowodnić, że dla każdego rzeczywistego x:
Wystarczy w tym celu znaleźć minimum funkcji f(x) = ex − (1 + x)
Podstawiając do powyższego wzoru uzyskujemy:
Teraz możemy podać górne oszacowanie wielkości (1):
Nierówność (2) będzie tym bardziej spełniona, gdy będzie spełniona nierówność z górnym oszacowaniem podstawionym zamiast :
co prowadzi do warunku:
czyli
Rozwiązując tę nierówność kwadratową dla n > 0 uzyskujemy górne oszacowanie minimalnej wartości n:
Po podstawieniu k = 365 uzyskujemy:
Stąd na pewno wystarczą 23 osoby.
[edytuj] Zastosowanie w kryptografii
Paradoks dnia urodzin ma znaczenie w kryptografii i jest podstawą działania tzw. ataku urodzinowego; np. jeśli funkcje haszujące zwracają 2k możliwych odpowiedzi, to znalezienie kolizji, czyli dwóch takich wiadomości m1 i m2, że H(m1) = H(m2) wymaga sprawdzenia stosunkowo niewielkiej liczby kombinacji (c2k / 2, gdzie c jest stałą).