Математические байки – Telegram
Математические байки
4.3K subscribers
1.44K photos
15 videos
27 files
914 links
Рассказы про разную математику.

Архив: http://dev.mccme.ru/~merzon/mirror/mathtabletalks/
Download Telegram
В правой части написано совместная плотность для двух независимых случайных величин; одна с плотностью (1/Г(a)) x^{a-1} e^{-x},
другая — с такой же с заменой a на b. Да — такие распределения (логично) называются гамма-распределениями.
Так вот, когда мы этот интеграл считали, мы нарезали всё на отрезки x+y=s. И оказывалось, что интеграл по одному такому отрезку — это
s^{a+b-1}*B(a,b)/(Г(a)Г(b)).
А второе интегрирование тогда даёт
Г(a+b)*B(a,b)/(Г(a)Г(b)),
и из равенства 1 и получается искомый ответ.
Так вот, на вероятностном языке это переговаривается так:
1) свёртка двух гамма-распределений (a.k.a. распределение суммы независимых случайных величин с такими распределениями) — это гамма-распределение с суммой параметров. Потому что мы, собственно, и получили плотность для s=x+y как гамма-распределение с параметром a+b.
2) условное распределение x при условии x+y=s — это растянутое в s раз одно и то же бета-распределение на отрезке [0,1]: распределение на отрезке [0,1] с плотностью
1/B(a,b) x^{a-1} (1-x).
Математические байки
Вот мы ответ на первый вопрос и получили: (1/n!) x^n e^{-x} это плотность распределения n+1-й точки для пуассоновского процесса единичной интенсивности — и поэтому (полная вероятность!) совершенно естественно, что интеграл от неё равен 1. Кстати — если мы…
Но тогда s=x+y и впрямь распределено как m+n+2-я точка; и чему бы ни равнялось s — условное распределение первых m+n+1-й точки, как мы уже видели, такое же, как при "равномерном бросании" (только нужно упорядочить набор).
Математические байки
С другой стороны, все случайные величины x,\xi_1,...,\xi_m,\eta_1,...,\eta_n — совершенно равноправны. А мы хотим, чтобы раскраска "первые m по величине в красный цвет, m+1-я в чёрный, оставшиеся n в синий" совпала бы с раскраской "x в чёрный цвет, \xi_i в…
И вот ответ на второй вопрос о том, как связаны два взгляда: в классическом подходе тот интеграл, который возникает после замены и перехода на отрезок [0,1] — это (спасибо пуассоновскому взгляду) интеграл от плотности, которую мы получаем для распределения m+1-й по возрастанию точки из m+n+1 равномерно и независимо выбираемых. А эта плотность пропорциональна x^m*(1-x)^n, с коэффициентом пропорциональности, равном числу вариантов "меньшие m точек, m+1-я, большие n",
(m+n+1)!/(m! n!) —
и это и есть наше исходное вероятностное рассуждение.
P.S. Ссылки к этому рассказу — https://math.stackexchange.com/a/3540 + https://math.stackexchange.com/a/3498 ; за них ещё раз спасибо Александру Шпилькину.

Ещё пара замечаний в заключение. Во-первых, пуассоновский процесс (по конечной мере μ на любом множестве X) можно строить ещё так: сначала решить, сколько всего M точек будет, "кинув пуассоновский кубик" с параметром μ(X), а потом выбрать в X равномерно по нормированной мере (1/μ(X))μ эти M точек независимо друг от друга.

А если мера только локально-конечная (как мера Лебега на прямой или на луче [0,\infty)), то можно разрезать пространство на кусочки конечной меры и применить эту конструкцию в них по отдельности. (Кстати, не-атомарность меры тут уже не требуется, если мы готовы для атомов говорить, что в них выбирается больше одной точки.)

И — история, за которую спасибо @qtasep. Вообще, если мы возьмём квадрат [0,1]^2 и накидаем в него довольно точек (можно сказать, запустив пуассоновский процесс, а можно — сначала решить, сколько именно их будет, а потом просто выбрать такое количество точек независимо и равномерно) — они будут расположены, "на глаз", довольно неравномерно (просто потому, что где-нибудь да будет зона, где выпало побольше, а где-то поменьше; это, наоборот, идеальная равномерность пуассоновскому вытаскиванию противоречила бы). Вот пример такого "накидывания равномерно-независимых точек" (здесь их 100) :
А вот ещё один (опять 100 точек).
Математические байки
Photo
Так вот — представьте себе примерно такую картину — но наложенную на карту Лондона. И представьте себе, что на дворе 1944-й год, а точки — это места падения (и взрыва!) "Фау". И явно видны, то здесь, то там, кластеры из близких попаданий. А у вас спрашивают — "эти кластеры, это немцы туда целятся [и, возможно, их ракеты умеют донаводиться на финальном участке траектории?], или это случайность?"

Статья R. D. Clarke 1946 года (одностраничная!) — как раз о том, как они проводили такой анализ (кстати, об этом есть рассказ в Britannica). Наложили на Лондон разумно-мелкую сетку — разделили область 12x12 км на 576=24^2 квадратов со стороной 0.5 км. И посмотрели, сколько из 537 бомб попали в какой квадрат — и сколько квадратов с 1, 2, 3, ... попаданиями. После чего оказалось, что соответствующие количества очень похожи на те, которые получались бы для пуассоновского распределения (то есть для равномерно-случайной стрельбы).
И вот таблица (как раз из той самой статьи Clarke).
И последнее — ещё пара картинок в заключение ко вчерашнему рассказу:
1) http://www.empiricalzeal.com/wp-content/uploads/2012/12/pinker-glow-worms-and-stars-plot.jpg : слева — случайно раскиданные точки, справа — положения светящихся glowworms на своде пещеры Waitomo в Новой Зеландии (источник — "What does randomness look like?", Wired). Последние светом приманивают пищу — так что им прямой резон располагаться подальше друг от друга, чтобы не мешать друг другу охотиться.
2) картинка из статьи "Determinantal Processes and Independence", J. Ben Hough, Manjunath Krishnapur, Yuval Peres, Bálint Virág: слева-сверху пуассоновский процесс ( = случайное распределение точек), справа-сверху — детерминантный (точки "отталкиваются" друг от друга), снизу в центре — перманентный (точки "комкуются"); спасибо @qtasep за ссылку!
На витрине ювелирного магазина лежат 15 бриллиантов. Рядом с ними стоят таблички с указанием масс, на которых написано 1, 2, ..., 15 карат. У продавца есть чашечные весы и четыре гирьки массами 1, 2, 4 и 8 карат. Покупателю разрешается только один тип взвешиваний: положить один из бриллиантов на одну чашу весов, а гирьки — на другую и убедиться, что масса на соответствующей табличке указана верно. Однако за каждую взятую гирьку нужно заплатить продавцу 100 монет. Если гирька снимается с весов и в следующем взвешивании не участвует, продавец забирает её. Какую наименьшую сумму придётся заплатить, чтобы проверить массы всех бриллиантов?

вот такую, например, задачу А.В.Грибалко с сегодняшнего МатПраздника предлагается решить

(потом можно также прочитать в брошюре небольшой комментарий про контекст)
Это, конечно, оффтопик для этого канала — но поздравляю всех с первым аппаратом тяжелее атмосферы, аэродинамически поднявшимся в воздух на другой планете!

Формулировка про "тяжелее воздуха" тут точная — в атмосфере Венеры летали (надувавшиеся прямо в атмосфере после торможения) аэростатные зонды советских АМС Вега-1 и Вега-2. А без слова "аэродинамически" формально-верно из-за слова "планета", но всё-таки тогда стоило было бы вспомнить про Луну (откуда взлетали как Apollo, так и советские Луна-16, Луна-20, Луна-24, недавний китайский Чанъэ-5), да и с астероидов тоже были взлёты — можно вспомнить японские Хаябусу и Хаябусу-2, летящий сейчас OSIRIS-REx...

А ещё этот вертолётик несёт на себе микроскопический кусочек ткани с того самого самолёта братьев Райт; жест совершенно символический — но очень красивый.

Кадр из только что закончившейся прямой трансляции NASA : показания альтиметра (взлёт, зависание, посадка) + см. новость N+1.

Момент полёта — https://youtu.be/p1KolyCqICI?t=2524
Напишу немного про проклятье размерности. Это термин, которым, в частности, называют странности многомерных пространств, от которых человеческая интуиция начинает давать сбои.

Один популярный пример выглядит так: возьмём квадрат на плоскости и впишем в него круг. Ясно, что круг закроет большую часть площади квадрата. Дальше, возьмём куб и впишем в него шар. Опять же, шар займёт большую часть объёма куба. Но вот в четырёхмерном случае гиперсфера займёт меньше трети объёма гиперкуба, а при дальнейшем повышении размерности отношение их объёмов сходится к нулю. При этом евклидово расстояние от центра n-мерного куба до любого из его 2^n углов растёт как sqrt(n), т.е. неограниченно; а основной объём пространства (т.е., например, основная часть равномерно случайно взятых точек) внутри такого куба оказывается на расстоянии от центра с матожиданием sqrt(n/3) и с убывающей к нулю дисперсией. Короче, n-мерный куб — это очень странное место, с кучей углов и пустым центром.

Другой пример — гипотеза Борсука о возможности разбиения n-мерного тела диаметром 1 на n+1 тел диаметром меньше 1. Она доказана для n<=3 и опровергнута для n>=64. Посредине — томящая неизвестность.

Всё это обычно выглядит как игры разума, не отягощённого бытовыми мелочами, однако бум нейросетей принес нам популярность всяких многомерных эмбеддингов и представлений — слов, текстов или картинок, и там такие пакости случаются регулярно. Недавно, в одной из задач мне пришлось столкнуться с такой штукой:

Возьмём, скажем, 100-мерное пространство и выберем в нём равномерно случайно из единичного гиперкуба 42 точки. Пронумеруем их в некотором случайном, но фиксированном порядке, от 1 до 42. Какова вероятность, что в нашем пространстве найдётся такая ось, в проекции на которую наши точки выстроятся в нужном порядке? Ответ: больше 99%. Кому интересно, можете посмотреть мой скрипт на питоне, которым это эмпирически можно проверить (работает довольно долго, решает системы линейных неравенств, пересекая полупространства для каждой пары точек).
Математические байки
Photo
(+Иллюстрация к поведению куба)
В ответ на мой вчерашний пост в личку пришло сразу несколько бдительных математиков с разумными комментариями, которые я выношу в этот мини пост.

Конечно, число 42 я взял с потолка (ведь уже скоро день Полотенца), и вместо него могло быть другое число. И действительно, если немного подумать, то можно аналитически показать, что в n-мерном пространстве такую ось можно провести для любых n невырожденных точек (доказывается, например, построением базиса из векторов к этим точкам, а потом построением нужной оси в этом базисе).

Спасибо, Федя, Витя и все остальные, кто пишет мне уточнения и комментарии к моим постам :)
===
Один из самых классических объектов в комбинаторике — это число разбиений p(n): сколькими способами число n можно представить в виде суммы натуральных слагаемых, если мы не различаем способы, отличающиеся только порядком слагаемых (или, что то же самое, предполагаем, что слагаемые упорядочены по неубыванию).
Так,
p(1)=1,
p(2)=2 (потому что 2=1+1),
p(3)=3 (потому что 3=2+1=1+1+1),
p(4)=5 (потому что 4=3+1=2+2=2+1+1=1+1+1+1),
p(5)=7 (упражнение),
и так далее.

Разбиению числа n можно сопоставить диаграмму Юнга: фигуру из клеток в первом квадранте, у которой число клеток в k-й строке это k-е слагаемое. Например, вот диаграмма Юнга для разбиения 15=6+5+3+1: