Проблема дня рождения - Birthday problem

Вычисленная вероятность того, что по крайней мере два человека разделяют день рождения, по сравнению с количеством людей.

В теория вероятности, то проблема дня рождения или парадокс дня рождения касается вероятность что в наборе п случайно выбранных людей, у некоторых из них будет такой же день рождения. Посредством принцип голубятни, вероятность достигает 100%, когда количество людей достигает 367 (поскольку существует всего 366 возможных дней рождения, включая 29 февраля ). Однако вероятность 99,9% достигается всего с 70 людьми, а вероятность 50% - с 23 людьми. Эти выводы основаны на предположении, что каждый день в году (кроме 29 февраля) одинаково вероятен для дня рождения.

Фактические записи о рождении показывают, что в разные дни рождается разное количество людей. В этом случае можно показать, что количество людей, необходимое для достижения 50% -ного порога, составляет 23 человека. или меньше.[1] Например, если половина людей родилась в один день, а другая половина - в другой, то любой два у людей будет 50% шанс разделить день рождения.

Может показаться удивительным, что группа всего из 23 человек требуется для достижения 50% вероятности того, что по крайней мере два человека в группе имеют один и тот же день рождения: этот результат, возможно, будет более правдоподобным, если учесть, что сравнение дней рождения действительно будет между каждой возможной парой индивидуумов = 23 × 22/2 = 253 сравнений, что намного больше половины количества дней в году (не более 183), в отличие от одного человека и сравнения его или ее дня рождения с все остальные. Проблема дня рождения не в "парадокс "в буквальном логическом смысле противоречиво, но на первый взгляд просто не интуитивно понятно.

Реальные приложения для решения проблемы дня рождения включают криптографическую атаку, называемую атака на день рождения, который использует эту вероятностную модель, чтобы уменьшить сложность нахождения столкновение для хэш-функция, а также вычисление приблизительного риска столкновения хэшей, существующего в хэшах заданного размера совокупности.

История проблемы неясна. Результат был приписан Гарольд Давенпорт;[2] однако версия того, что сегодня считается проблемой дня рождения, была предложена ранее Рихард фон Мизес.[3]

Расчет вероятности

Проблема состоит в том, чтобы вычислить приблизительную вероятность того, что в группе п люди по крайней мере двое имеют одинаковый день рождения. Для простоты варианты распределения, такие как високосные годы, двойняшки, сезонные колебания или вариации дня недели не принимаются во внимание, и предполагается, что все 365 возможных дней рождения одинаково вероятны. (Распределение дней рождения в реальной жизни не является равномерным, поскольку не все даты одинаково вероятны, но эти отклонения мало влияют на анализ.[nb 1] Собственно, равномерное распределение дат рождения - худший случай.[5])

Цель состоит в том, чтобы вычислить п(А), вероятность того, что по крайней мере два человека в комнате имеют одинаковый день рождения. Однако проще вычислить п(А′), вероятность того, что у двух человек в комнате нет одного дня рождения. Тогда, потому что А и А единственные две возможности, а также взаимоисключающий, п(А) = 1 − п(А′).

Из уважения к широко опубликованным решениям[который? ] придя к выводу, что 23 - это минимальное количество людей, необходимое для п(А) что больше 50%, следующий расчет п(А) буду использовать 23 человека в качестве примера. Если пронумеровать 23 человека от 1 до 23, то мероприятие то, что у всех 23 человек разные дни рождения, это то же самое, что случай, когда у человека 2 не тот же день рождения, что у человека 1, и у этого человека 3 не тот же день рождения, что у человека 1 или человека 2, и так далее, и, наконец, этот человек 23 не имеет того же дня рождения, что и любой из лиц с 1 по 22. Пусть эти события соответственно будут называться «Событие 2», «Событие 3» и так далее. Можно также добавить «Событие 1», соответствующее событию дня рождения человека 1, которое происходит с вероятностью 1. Это сочетание событий может быть вычислено с использованием условная возможность: вероятность События 2 составляет 364/365, поскольку у человека 2 может быть любой день рождения, кроме дня рождения человека 1. Точно так же вероятность События 3 с учетом того, что Событие 2 произошло, составляет 363/365, так как человек 3 может иметь любой из дни рождения, которые еще не зарегистрированы лицами 1 и 2. Это продолжается до тех пор, пока, наконец, вероятность события 23, учитывая, что все предшествующие события произошли, составляет 343/365. Наконец, принцип условной вероятности подразумевает, что п(А′) равна произведению этих индивидуальных вероятностей:

 

 

 

 

(1)

Члены уравнения (1) можно собрать, чтобы получить:

 

 

 

 

(2)

Вычисляя уравнение (2) дает п(А′) ≈ 0.492703

Следовательно, п(А) ≈ 1 − 0.492703 = 0.507297 (50.7297%).

Этот процесс можно обобщить на группу п люди, где п(п) вероятность как минимум двух из п люди, разделяющие день рождения. Проще сначала рассчитать вероятность п(п) это все п дни рождения другой. Согласно принцип голубятни, п(п) равно нулю, когда п > 365. Когда п ≤ 365:

где ! это факториал оператор (365
п
)
это биномиальный коэффициент и kпр обозначает перестановка.

Уравнение выражает тот факт, что у первого человека нет никого, у кого есть день рождения, у второго человека не может быть того же дня рождения, что и у первого (364/365), у третьего не может быть того же дня рождения, что и у первых двух (363/365), и в целом пдень рождения не может совпадать с любым из п − 1 предшествующие дни рождения.

В мероприятие по крайней мере двух из п лиц, имеющих один день рождения дополнительный все п дни рождения разные. Следовательно, его вероятность п(п) является

В следующей таблице показана вероятность для некоторых других значений п (для этой таблицы наличие високосных лет игнорируется, и предполагается, что каждый день рождения является одинаково вероятным):

Вероятность того, что в группе из двух человек не бывает одного дня рождения. п люди. Обратите внимание, что вертикальная шкала логарифмическая (каждый шаг вниз - 1020 раз реже).
пп(п)
100.0%
502.7%
1011.7%
2041.1%
2350.7%
3070.6%
4089.1%
5097.0%
6099.4%
7099.9%
7599.97%
10099.99997%
20099.9999999999999999999999999998%
300(100 − 6×10−80)%
350(100 − 3×10−129)%
365(100 − 1.45×10−155)%
≥ 366100%

Високосные годы. Если мы заменим 366 на 365 в формуле для аналогичный расчет показывает, что для високосных лет количество человек, необходимое для вероятности совпадения более 50%, также равно 23; вероятность совпадения в этом случае составляет 50,6%.

Приближения

Графики, показывающие приблизительную вероятность того, что по крайней мере два человека разделят день рождения (красный) и его дополнительное событие (синий)
График, показывающий точность приближения 1 − е−​п2730 (красный)

В Серия Тейлор расширение экспоненциальная функция (постоянная е2.718281828)

обеспечивает приближение первого порядка для еИкс для :

Чтобы применить это приближение к первому выражению, полученному для п(п), набор Икс = −а/365. Таким образом,

Затем замените а с неотрицательными целыми числами для каждого члена в формуле п(п) до тех пор а = п − 1, например, когда а = 1,

Первое выражение, полученное для п(п) можно аппроксимировать как

Следовательно,

Еще более грубое приближение дается формулой

что, как показывает график, по-прежнему достаточно точное.

Согласно приближению, тот же подход можно применить к любому количеству «людей» и «дней». Если вместо 365 дней есть d, если есть п лиц, а если пd, то, используя тот же подход, что и выше, мы достигаем результата, что если п(п, d) это вероятность того, что по крайней мере два из п люди разделяют один и тот же день рождения из набора d доступные дни, затем:

Простое возведение в степень

Вероятность того, что у любых двух людей не один день рождения, равна 364/365. В комнате, содержащей п люди, есть (п
2
) = п(п − 1)/2
пары людей, т.е. (п
2
)
События. Вероятность того, что у двух людей не будет один и тот же день рождения, можно приблизительно оценить, предположив, что эти события независимы, и, следовательно, умножив их вероятность вместе. Короче 364/365 можно умножить на себя (п
2
)
раз, что дает нам

Так как это вероятность того, что ни у кого нет одного дня рождения, то вероятность того, что кто-то разделит день рождения, равна

Пуассоновское приближение

Применяя Пуассон аппроксимация бинома на группу из 23 человек,

так

Результат более 50%, как и в предыдущих описаниях. Это приближение такое же, как и приведенное выше, основанное на разложении Тейлора, в котором используется .

Квадратное приближение

Хороший практическое правило который можно использовать для мысленный расчет это отношение

который также можно записать как

который хорошо работает для вероятностей, меньших или равных 1/2. В этих уравнениях м это количество дней в году.

Например, чтобы оценить количество людей, необходимое для 1/2 шанс общего дня рождения, мы получаем

Что не так уж далеко от правильного ответа 23.

Примерное количество человек

Это также можно приблизительно оценить, используя следующую формулу для количество людей необходимо иметь хотя бы 1/2 шанс совпадения:

Это результат хорошего приближения того, что событие с 1/k вероятность будет иметь 1/2 вероятность появления хотя бы один раз при повторении k пер. 2 раз.[6]

Таблица вероятностей

длина
шестнадцатеричная строка
нет. из
биты
(б)
хеш-пространство
размер
(2б)
Количество хешированных элементов таких, что вероятность хотя бы одного хеш-коллизии ≥п
п = 10−18п = 10−15п = 10−12п = 10−9п = 10−6п = 0.001п = 0.01п = 0.25п = 0.50п = 0.75
8324.3×1092222.9932.9×1039.3×1035.0×1047.7×1041.1×105
(10)(40)(1.1×1012)222471.5×1034.7×1041.5×1058.0×1051.2×1061.7×106
(12)(48)(2.8×1014)22247.5×1022.4×1047.5×1052.4×1061.3×1072.0×1072.8×107
16641.8×10196.11.9×1026.1×1031.9×1056.1×1061.9×1086.1×1083.3×1095.1×1097.2×109
(24)(96)(7.9×1028)4.0×1051.3×1074.0×1081.3×10104.0×10111.3×10134.0×10132.1×10143.3×10144.7×1014
321283.4×10382.6×10108.2×10112.6×10138.2×10142.6×10168.3×10172.6×10181.4×10192.2×10193.1×1019
(48)(192)(6.3×1057)1.1×10203.5×10211.1×10233.5×10241.1×10263.5×10271.1×10286.0×10289.3×10281.3×1029
642561.2×10774.8×10291.5×10314.8×10321.5×10344.8×10351.5×10374.8×10372.6×10384.0×10385.7×1038
(96)(384)(3.9×10115)8.9×10482.8×10508.9×10512.8×10538.9×10542.8×10568.9×10564.8×10577.4×10571.0×1058
1285121.3×101541.6×10685.2×10691.6×10715.2×10721.6×10745.2×10751.6×10768.8×10761.4×10771.9×1077

Более светлые поля в этой таблице показывают количество хешей, необходимых для достижения заданной вероятности коллизии (столбец) с учетом хеш-пространства определенного размера в битах (строка). Используя аналогию с днем ​​рождения: «размер хеш-пространства» похож на «доступные дни», «вероятность столкновения» похожа на «вероятность общего дня рождения», а «необходимое количество хешированных элементов» похоже на «требуемое количество людей в группа". Можно также использовать эту диаграмму для определения минимального требуемого размера хэша (с учетом верхних границ хешей и вероятности ошибки) или вероятности коллизии (для фиксированного количества хешей и вероятности ошибки).

Для сравнения, 10−18 к 10−15 - это уровень неисправимых битовых ошибок типичного жесткого диска.[7] Теоретически 128-битные хеш-функции, такие как MD5, должен оставаться в этом диапазоне примерно до 8.2×1011 документы, даже если его возможных выходов намного больше.

Верхняя граница вероятности и нижняя граница количества людей

Приведенный ниже аргумент адаптирован из аргумента Пол Халмос.[nb 2]

Как указано выше, вероятность того, что никакие два дня рождения не совпадают, равна

Как и в предыдущих параграфах, интерес представляют самые маленькие п такой, что п(п) > 1/2; или, что то же самое, наименьшее п такой, что п(п) < 1/2.

Используя неравенство 1 − Икс < еИкс в приведенном выше выражении мы заменяем 1 − k/365 с участием еk365. Это дает

Поэтому приведенное выше выражение является не только приближением, но и верхняя граница из п(п). Неравенство

подразумевает п(п) < 1/2. Решение для п дает

Сейчас же, 730 лин 2 составляет приблизительно 505,997, что чуть ниже 506, значение п2п достигнуто, когда п = 23. Следовательно, достаточно 23 человек. Кстати, решая п2п = 730 лн 2 для п дает приближенную формулу Фрэнка Х. Мэтиса, процитированную выше.

Этот вывод показывает только, что в большинстве 23 человека нужны, чтобы обеспечить совпадение в день рождения с равными шансами; это оставляет возможность, что п 22 или меньше тоже может работать.

Обобщения

Обобщенная проблема дня рождения

Учитывая год с d дней, общая проблема дня рождения запрашивает минимальное количество п(d) так что в наборе п случайно выбранных людей, вероятность совпадения дня рождения не менее 50%. Другими словами, п(d) это минимальное целое число п такой, что

Таким образом, классическая задача дня рождения соответствует определению п(365). Первые 99 значений п(d) приведены здесь (последовательность A033810 в OEIS ):

d1–23–56–910–1617–2324–3233–4243–5455–6869–8283–99
п(d)23456789101112

Аналогичный расчет показывает, что п(d) = 23, когда d находится в диапазоне 341–372.

Ряд оценок и формул для п(d) были опубликованы.[8]Для любого d ≥ 1, число п(d) удовлетворяет[9]

Эти оценки оптимальны в том смысле, что последовательность п(d) − 2d пер. 2становится произвольно близко к

пока у него есть

как максимум, взятый за d = 43.

Оценки достаточно жесткие, чтобы дать точное значение п(d) в 99% случаев, например п(365) = 23. В общем случае из этих оценок следует, что п(d) всегда равно либо

где ⌈ · ⌉ обозначает функция потолка.Формула

выполняется для 73% всех целых чисел d.[10] Формула

держится для почти все d, т.е. для набора целых чисел d с участием асимптотическая плотность 1.[10]

Формула

относится ко всем d1018, но предполагается, что контрпримеров к этой формуле бесконечно много.[11]

Формула

относится ко всем d1018, и предполагается, что эта формула верна для всех d.[11]

Более 2-х человек

Можно расширить задачу, задав вопрос, сколько человек в группе необходимо для того, чтобы с вероятностью более 50% было не менее 3/4/5 и т. Д. группы имеют один день рождения.

Первые несколько значений следующие:> 50% вероятность того, что 3 человека разделяют день рождения - 88 человек; > 50% вероятность того, что 4 человека разделят день рождения - 187 человек. Полный список можно найти как последовательность A014088 в Интернет-энциклопедии целочисленных последовательностей.[12]

Cast как проблема столкновения

Задачу дня рождения можно обобщить следующим образом:

Данный п случайные целые числа, взятые из дискретное равномерное распределение с диапазоном [1,d], какова вероятность п(п; d) что как минимум два числа совпадают? (d = 365 дает обычную задачу дня рождения.)[13]

Общие результаты могут быть получены с использованием тех же аргументов, которые приведены выше.

Наоборот, если п(п; d) обозначает количество случайных целых чисел, взятых из [1,d] получить вероятность п что как минимум два числа совпадают, тогда

Проблема дня рождения в этом более общем смысле относится к хэш-функции: ожидаемое количество N-немного хэши, которые могут быть сгенерированы до столкновения, не 2N, а скорее только 2N2. Это используется нападки на день рождения на криптографические хеш-функции и является причиной того, что небольшое количество столкновений в хеш-таблица для всех практических целей неизбежны.

Теория проблемы дня рождения была использована Зои Шнабель.[14] под названием захват-повторный захват статистика для оценки численности рыбной популяции в озерах.

Обобщение на несколько типов

График вероятности хотя бы одного общего дня рождения хотя бы у одного мужчины и одной женщины

В основной задаче все испытания считаются однотипными. Задача дня рождения была обобщена для рассмотрения произвольного числа типов.[15] В простейшем расширении есть два типа людей, скажем м мужчины и п женщины, и проблема становится характеристикой вероятности общего дня рождения хотя бы у одного мужчины и одной женщины. (Общие дни рождения двух мужчин или двух женщин не учитываются.) Вероятность отсутствия общих дней рождения здесь равна

где d = 365 и S2 находятся Числа Стирлинга второго рода. Следовательно, искомая вероятность равна 1 − п0.

Этот вариант задачи о дне рождения интересен тем, что не существует однозначного решения для общего количества людей. м + п. Например, обычное значение вероятности 50% реализуется как для группы из 32 человек, состоящей из 16 мужчин и 16 женщин, так и для группы из 49 человек, состоящей из 43 женщин и 6 мужчин.

Другие проблемы с днем ​​рождения

Первый матч

Связанный с этим вопрос: когда люди входят в комнату по одному, у кого из них, скорее всего, будет тот же день рождения, что и у кого-то, кто уже находится в комнате? То есть для чего п является п(п) − п(п − 1) максимум? Ответ - 20 - если есть приз за первый матч, лучшая позиция в очереди - 20-е.[нужна цитата ]

В тот же день рождения, что и ты

Сравнение п(п) = вероятность совпадения дня рождения с q(п) = вероятность совпадения ваш день рождения

В задаче о дне рождения ни один из двух человек заранее не выбран. Напротив, вероятность q(п) что кто-то в комнате п у других людей тот же день рождения, что и у конкретный человек (например, вы) дается

и для общего d от

В стандартном случае d = 365, заменяя п = 23 дает около 6,1%, что составляет менее 1 шанса из 16. С вероятностью более 50%, что один человек в комнате, заполненной п у людей такой же день рождения как ты, п должно быть не менее 253. Это число значительно выше, чем 365/2 = 182.5: причина в том, что, вероятно, есть совпадения в день рождения среди других людей в комнате.

Ближайшие матчи

Другое обобщение - спросить о вероятности нахождения хотя бы одной пары в группе п люди с днями рождения внутри k календарных дней друг друга, если есть d одинаково вероятны дни рождения.[16]

Количество людей, необходимое для того, чтобы вероятность того, что у какой-то пары будет день рождения, разделена k дней или меньше будет выше 50%, как указано в следующей таблице:

kп
для d = 365
023
114
211
39
48
58
67
77

Таким образом, в группе из семи случайных людей более вероятно, что у двоих из них будет день рождения в пределах недели друг от друга.[16]

Подсчет столкновений

Вероятность того, что kое целое число, случайно выбранное из [1,d] будет повторять хотя бы один предыдущий выбор равно q(k − 1; d) над. Ожидаемое общее количество раз, когда выбор будет повторять предыдущий выбор как п такие целые числа выбираются равными[17]

Среднее количество человек

В альтернативной формулировке задачи о дне рождения задают вопрос: средний количество людей, необходимое для того, чтобы найти пару с одним днем ​​рождения. Если рассматривать функцию вероятности Pr [п у людей хотя бы один общий день рождения], это средний определяет значить распределения, в отличие от обычной формулировки, которая требует медиана. Проблема актуальна для нескольких алгоритмы хеширования проанализирован Дональд Кнут в его книге Искусство программирования. Это может быть показано[18][19] что если взять единообразную выборку с заменой из большой популяции M, количество испытаний, необходимое для первого повторного отбора проб немного человек имеет ожидаемое значение п = 1 + Q(M), где

Функция

был изучен Шриниваса Рамануджан и имеет асимптотическое разложение:

С участием M = 365 дней в году, среднее количество людей, необходимое для того, чтобы найти пару с одинаковым днем ​​рождения, составляет п = 1 + Q(M) ≈ 24.61659, несколько больше 23, число, необходимое для 50% вероятности. В лучшем случае хватит двух человек; в худшем случае максимально возможное количество M + 1 = 366 люди нужны; но в среднем требуется всего 25 человек

Анализ с использованием индикаторных случайных величин может дать более простой, но приблизительный анализ этой проблемы.[20] Для каждой пары (i, j) на k человек в комнате определим индикаторную случайную величину Xij, для , от

Пусть X - случайная величина, считающая пары людей с одним днем ​​рождения.

Для п = 365, если k = 28, ожидаемое число с таким же днем ​​рождения равно Таким образом, мы можем ожидать хотя бы одну подходящую пару, по крайней мере, из 28 человек.

Неформальную демонстрацию проблемы можно сделать из список премьер-министров Австралии, из которых на 2017 год - 29, в котором Пол Китинг, 24-й премьер-министр, и Эдмунд Бартон У первого премьер-министра один день рождения, 18 января.

в 2014 Чемпионат мира по футболу, в каждом из 32 отрядов было по 23 игрока. Анализ официальных списков команд показал, что у 16 ​​команд были пары игроков, у которых были дни рождения, и из этих 5 команд было две пары: Аргентина, Франция, Иран, Южная Корея и Швейцария имели по две пары, а Австралия, Босния и Герцеговина, Бразилия. , Камерун, Колумбия, Гондурас, Нидерланды, Нигерия, Россия, Испания и США - каждая по одной паре.[21]

Ворачек, Тран и Formann показали, что большинство людей заметно переоценивают количество людей, необходимое для достижения заданной вероятности того, что у людей будет один и тот же день рождения, и заметно недооценивают вероятность того, что люди будут иметь один и тот же день рождения, при заданном размере выборки.[22] Дальнейшие результаты показали, что студенты-психологи и женщины справились с задачей лучше, чем посетители / персонал казино или мужчины, но были менее уверены в своих оценках.

Обратная задача

Обратная задача - найти для фиксированной вероятности п,величайший п для которого вероятность п(п) меньше заданного п, или самый маленький п для которого вероятность п(п) больше заданного п.[нужна цитата ]

Принимая приведенную выше формулу для d = 365, надо

В следующей таблице приведены некоторые примеры расчетов.

пппп(п↓)пп(п↑)
0.010.14178365 = 2.7086420.0027430.00820
0.050.32029365 = 6.1191660.0404670.05624
0.10.45904365 = 8.7700280.0743490.09462
0.20.66805365 = 12.76302120.16702130.19441
0.30.84460365 = 16.13607160.28360170.31501
0.51.17741365 = 22.49439220.47570230.50730
0.71.55176365 = 29.64625290.68097300.70632
0.81.79412365 = 34.27666340.79532350.81438
0.92.14597365 = 40.99862400.89123410.90315
0.952.44775365 = 46.76414460.94825470.95477
0.993.03485365 = 57.98081570.99012580.99166

Некоторые значения, выходящие за границы, были цветной чтобы показать, что приближение не всегда точное.

Проблема с разделом

Связанная проблема - это проблема раздела, вариант проблема с рюкзаком из исследования операций. Некоторые веса ставятся на шкала баланса; каждый вес представляет собой целое число граммов, случайно выбранных от одного грамма до одного миллиона граммов (один тонна ). Вопрос в том, можно ли обычно (то есть с вероятностью, близкой к 1) переносить веса между левой и правой рукой, чтобы сбалансировать весы. (В случае, если сумма всех весов - нечетное количество граммов, допускается отклонение в один грамм.) Если есть только два или три веса, ответ, безусловно, отрицательный; хотя есть некоторые комбинации, которые работают, большинство случайно выбранных комбинаций трех весов не работают. Если весов очень много, ответ однозначно положительный. Вопрос в том, сколько всего достаточно? То есть, какое количество весов такое, что их можно будет уравновесить с равной вероятностью, поскольку это невозможно?

Часто интуиция подсказывает, что ответ выше. 100000. Интуиция большинства людей подсказывает, что их исчисляются тысячами или десятками тысяч, в то время как другие считают, что их должны быть как минимум сотни. Правильный ответ - 23.[нужна цитата ]

Причина в том, что правильное сравнение заключается в количестве разделений весов на левую и правую. Есть 2N − 1 разные перегородки для N веса, а левую сумму за вычетом правой суммы можно рассматривать как новую случайную величину для каждого раздела. Распределение суммы весов приблизительно Гауссовский, с пиком на 1000000N и ширина 1000000N, так что когда 2N − 1 примерно равно 1000000N переход происходит. 223 − 1 составляет около 4 миллионов, а ширина раздачи всего 5 миллионов.[23]

В художественной литературе

Артур Кларк роман Падение лунной пыли, опубликованный в 1961 году, содержит раздел, в котором главные герои, оказавшиеся в ловушке под землей на неопределенное время, празднуют день рождения и обсуждают актуальность проблемы дня рождения. Как заявил пассажир-физик: «Если у вас группа из более чем двадцати четырех человек, шансы даже выше, чем даже у двоих из них в один день рождения». В конце концов, из 22 присутствующих выясняется, что у двух персонажей один день рождения, 23 мая.

Заметки

  1. ^ На самом деле дни рождения распределяются в течение года неравномерно; в одни сезоны рождается больше детей в день, чем в другие, но для решения этой проблемы распределение считается равномерным. В частности, многие дети рождаются летом, особенно в августе и сентябре (для северного полушария). [1], а в США было отмечено, что многие дети рождаются в праздничные дни Рождество и Новый год.[1] Кроме того, потому что в больницах редко кесарево сечение и индуцированные роды в выходные дни между вторником и пятницей рождается больше людей, чем в выходные дни;[1] когда у многих людей общий год рождения (например, в классе в школе), это создает тенденцию к определенным датам. В Швеции 9,3% населения рождается в марте и 7,3% в ноябре, когда равномерное распределение дает 8,3%. Шведский статистический совет. Смотрите также:
    • Мерфи, Рон. «Анализ распределения дней рождения в календарном году». Получено 2011-12-27.
    • Mathers, C D; Р. С. Харрис (1983). «Сезонное распределение рождений в Австралии». Международный журнал эпидемиологии. 12 (3): 326–331. Дои:10.1093 / ije / 12.3.326. PMID  6629621. Получено 2011-12-27.
    Эти факторы, как правило, увеличивают вероятность идентичных дат рождения, поскольку более плотное подмножество имеет больше возможных пар (в крайнем случае, когда все родились в три дня, очевидно, будет много одинаковых дней рождения). Проблема неравномерного количества рождений, происходящих в каждый день года, впервые была понята Мюррей Кламкин в 1967 г.[4] Формальное доказательство того, что вероятность двух совпадающих дней рождения наименьшая для равномерного распределения дней рождения, было дано Блумом (Блум 1973 ).
  2. ^ В своей автобиографии Халмос раскритиковал форму, в которой часто изображается парадокс дня рождения, с точки зрения числовых вычислений. Он считал, что это следует использовать как пример использования более абстрактных математических понятий. Он написал:

    Рассуждения основаны на важных инструментах, к которым все студенты-математики должны иметь свободный доступ. Проблема дня рождения была великолепной иллюстрацией преимуществ чистого мышления перед механическими манипуляциями; неравенства могут быть получены за минуту или две, тогда как умножение займет гораздо больше времени и будет гораздо более подвержено ошибкам, независимо от того, является ли инструмент карандашом или старомодным настольным компьютером. Что калькуляторы не поддаются пониманию, математическим возможностям или прочной основе для более продвинутых обобщенных теорий.

использованная литература

  1. ^ а б c Марио Кортина Борха; Джон Хей (сентябрь 2007 г.). «Проблема дня рождения». Значение. Королевское статистическое общество. 4 (3): 124–127. Дои:10.1111 / j.1740-9713.2007.00246.x.
  2. ^ У. В. Роуз Болл и H.S.M. Coxeter, "Mathematical Recreations and Essays, 13th edition", Dover Publications, New York, 1987, p 45.
  3. ^ Frank, P .; Goldstein, S .; Kac, M .; Prager, W .; Szegö, G .; Биркгоф, Г., ред. (1964). Избранные статьи Рихарда фон Мизеса. 2. Провиденс, Род-Айленд: амер. Математика. Soc. С. 313–334.
  4. ^ Кламкин и Ньюман 1967.
  5. ^ Стил, Дж. Майкл (2004). Мастер-класс Коши-Шварца. Кембридж: Издательство Кембриджского университета. стр.206, 277. ISBN  9780521546775.
  6. ^ Матис, Фрэнк Х. (июнь 1991 г.). «Общая проблема дня рождения». SIAM Обзор. 33 (2): 265–270. Дои:10.1137/1033051. ISSN  0036-1445. JSTOR  2031144. OCLC  37699182.
  7. ^ Джим Грей, Кэтрин ван Инген. Эмпирические измерения частоты отказов дисков и ошибок
  8. ^ Д. Бринк, (вероятно) точное решение проблемы дней рождения, Ramanujan Journal, 2012, [2].
  9. ^ Brink2012, Теорема 2
  10. ^ а б Brink2012, Теорема 3
  11. ^ а б Brink2012, Таблица 3, Гипотеза 1
  12. ^ «Минимальное количество людей, дающее 50% вероятность иметь хотя бы n совпадающих дней рождения в течение одного года». Он-лайн энциклопедия целочисленных последовательностей. OEIS. Получено 17 февраля 2020.
  13. ^ Сузуки, К .; Tonien, D .; и другие. (2006). «Парадокс дня рождения для множественных столкновений». В Rhee M.S., Lee B. (ed.). Конспект лекций по информатике, том 4296. Берлин: Springer. Дои:10.1007/11927587_5. Информационная безопасность и криптология - ICISC 2006.
  14. ^ З. Э. Шнабель (1938) Оценка общей численности рыб в озере., Американский математический ежемесячный журнал 45, 348–352.
  15. ^ М. К. Вендл (2003) Вероятность столкновения между множествами случайных величин, Статистика и вероятностные письма 64(3), 249–254.
  16. ^ а б М. Абрамсон и У. О. Дж. Мозер (1970) Еще сюрпризы на день рождения, Американский математический ежемесячный журнал 77, 856–858
  17. ^ Могу, Мэтт. "Столкновение хеш-коллизий с парадоксом дня рождения". Блог Мэтта Мая. Получено 17 июля 2015.
  18. ^ Кнут, Д. Э. (1973). Искусство программирования. Vol. 3, Сортировка и поиск. Ридинг, Массачусетс: Эддисон-Уэсли. ISBN  978-0-201-03803-3.
  19. ^ Flajolet, P .; Grabner, P.J .; Kirschenhofer, P .; Продингер, Х. (1995). «О Q-функции Рамануджана». Журнал вычислительной и прикладной математики. 58: 103–116. Дои:10.1016 / 0377-0427 (93) E0258-N.
  20. ^ Кормен; и другие. Введение в алгоритмы.
  21. ^ Флетчер, Джеймс (16 июня 2014 г.). «Парадокс дня рождения на чемпионате мира». bbc.com. BBC. Получено 27 августа 2015.
  22. ^ Voracek, M .; Tran, U. S .; Форманн, А. К. (2008). "День рождения и проблемы с партнером по рождению: неправильные представления о вероятности среди студентов-психологов, посетителей и персонала казино". Перцептивные и моторные навыки. 106 (1): 91–103. Дои:10,2466 / пмс.106.1.91-103. PMID  18459359. S2CID  22046399.
  23. ^ Borgs, C .; Chayes, J .; Питтель, Б. (2001). «Фазовый переход и масштабирование конечного размера в задаче целочисленного разбиения». Случайные структуры и алгоритмы. 19 (3–4): 247–288. Дои:10.1002 / RS.10004. S2CID  6819493.

Список используемой литературы

внешние ссылки