Biostatistics on the Table – Telegram
Biostatistics on the Table
258 subscribers
91 photos
5 videos
1 file
102 links
Место, где ML расшифровывается как Maximum Likelihood
Download Telegram
С нетерпением жду выхода новых видео на канале ritvikmath, с тех пор как на него наткнулся. Честно говоря, я никогда не задумывался, что доказательство валидности* функции плотности вероятности стандартного нормального распределения – нетривиальная задача.

* валидная функция плотности вероятности (pdf) должна интегрироваться в 1, но существуют функции не обладающие таким свойством, но которые можно использовать вместо настоящих pdf в качестве априорных распределений в байесовском статистическом выводе. Очень известный пример –конъюгированное априорное распределение Джеффриса для биномиального распределения (Beta(1/2, 1/2)).
🔥2👍1
Forwarded from Maksim Kuznetsov
Симпатичная задчака по генетике/терверу. Xh - аллель гемофилии, вопрос: какова вероятность того, что женщина обведенная окружностью является носителем?
🔥2
Человек анализом данных занимается, говорит, что профессионально, пишет пост, утверждения в котором можно элементарно проверить, для этого не нужно знать математику.
Forwarded from статИИстик
Как можно сравнить группы по тем или иным количественным переменным, чтобы исключить влияние других ковариат, например, пола и возраста? Читайте на statshots.ru
статИИстик
Как можно сравнить группы по тем или иным количественным переменным, чтобы исключить влияние других ковариат, например, пола и возраста? Читайте на statshots.ru
y <- swiss$Agriculture
x <- swiss$Education
z <- swiss$Examination

resid_y_on_z <- residuals( lm(y ~ z) )
resid_x_on_z <- residuals( lm(x ~ z) )

## Adjusted coefficient x on y
coef( lm(y ~ x + z) )[[2]]
#> [1] -0.7379441

## То что предлагается в публикации
coef( lm(resid_y_on_z ~ x) )[[2]]
#> [1] -0.3779868

## То как это работает на самом деле
coef( lm(resid_y_on_z ~ resid_x_on_z) )[[2]]
#> [1] -0.7379441

## И так тоже работает
coef( lm(y ~ resid_x_on_z) )[[2]]
#> [1] -0.7379441

## NB! стандартные ошибки для оценок
## будут недооцененными и число степеней свободы
🤗2
Порядковые переменные мне представляются очень сложными как с точки зрения анализа, так и с точки зрения визуализации, поэтому всегда радуюсь, когда встречаю что-то простое и элегантное, связанное с ними.
Сегодня наткнулся на простой и красивый подход к визуализации связанных порядковых переменных, сам я часто для этих целей часто использовал alluvial plots, но теперь кажется это в прошлом.
🔥5
Обожаю курсеру, конечно
👍2
Biostatistics on the Table
Блуждал по интернету и наткнулся на такое: курс по причинно-следственному выводу от Нобелевского лауреата 2021 года https://mru.org/courses/mastering-econometrics/path-cause-effect
Сам не смотрел, но промо курса нельзя не оценить высоко )
На фото собственно автор курса и лауреат НП по экономике Джошуа Ангрист
#методы #сausal #inference #учебники #публикации

Ведущий научный сотрудник ЛССИ Борис Соколов недавно выложил в публичный доступ черновую версию своего обзора основных целевых величин (эстимандов), использующихся в статистическом каузальном анализе: АТЕ, АТТ, АТС и прочие тыквенные LATE с CATE. Хотя это ещё не полноценная статья, прошедшая рецензирование, данный текст может оказаться полезным как студентам, так и "взрослым" исследователям или прикладным аналитикам, применяющим соответствующие методы на практике - благо на русском языке литературы по теме откровенно мало.

P.S. Если вы найдёте в рукописи ошибки, неточности, упущения и т.д., или у вас будут иные идеи насчёт того, как её улучшить, можно написать напрямую автору на электронную почту - он открыт к обратной связи и конструктивной критике.
👍21🔥1
Уже давно заметил, что январь очень хороший месяц с точки зрения появления новых образовательных проектов. Хочу поделиться двумя, за которыми обязательно буду следить.

- Gavin Simpson выложил первое видео из серии, которая будет посвящена постпроцессингу обобщенных аддитивных моделей (GAM) с использованием пакета {{gratia}}

- Стартовал полноценный курс от Jonathan Templin по пропущенным значениям, основанный на книге Applied missing data analysis (с реализацией методов в R c использованием пакетов {{mice}} и {{Amelia}} и даже JAGS и Stan обещаны). Здесь стоит добавить, что хороших видео-материалов по пропускам очень мало и к тому же в них часто используется "неконвенциональное" ПО вроде Mplus (как в серии семинаров Craig Enders, автора указанной выше книги часть 1, часть 2) или IVEware (как в серии семинаров Trivellore Raghunathan часть 1, часть 2, часть 3, часть 4)
🔥7👍21
This media is not supported in your browser
VIEW IN TELEGRAM
Раздумываю над темой для первого длинного текста на около(био)статистическую тему, а пока решил сделать небольшую рубрику, которую буду периодически наполнять содержанием.

Если вы думаете, что лекции и семинары по статистике от статистиков и (особенно) для статистиков - это скучно, то я с вами согласен 🙂, мой опыт именно такой, в среде профессиональных статистиков как-то очень немного талантливых рассказчиков, наблюдается даже странная ситуация, когда текст автора очень увлекательный, а к прослушиванию доклада по той же теме в исполнении того же самого автора такой эпитет применить совсем нельзя.

Но бывают исключения, одно из ярких открытий для меня - выступления Эндрю Гелмана, я иногда включаю их буквально для того, чтобы расслабиться. Особенно интересен контраст, тексты Гелмана всегда очень, иногда даже кажется, что чрезмерно, серьезные.
3
Вот ещё
Еще, кстати, хочу поделиться случайной находкой, которая меня крайне удивила
👍3🔥1😱1
Симпатичная заметка под названием «Why Model?»
(не только про статистические модели)
https://www.cs.unm.edu/~joel/cs4all/WhyModel.pdf
👍3
Решил поделиться ссылкой на недавнее видео Andrej Karpathy.

Вообще, если честно, мне приходится буквально заставлять себя интересоваться DL и LLM в частности, ну как-то не очень мне заходят эти темы, ассистентами и чатботами я практически не пользуюсь.

Но вот подход к изложению автора видео (это, на всякий случай, один из известных специалистов по DL, сооснователь OpenAI и т.д.) оказался не только довольно занимательным и было нисколько не скучно смотреть 3.5 часа подряд, но даже как будто появился интерес глубже погрузиться в тему (у него на канале, кстати, есть и технические туториалы, думаю, что они тоже очень полезные).
3👍1🔥1
Forwarded from Bioinformatics Institute
Институт биоинформатики запускает серию открытых лекций «Разрушители статистических мифов»!
Регистрация |12, 19 и 26 марта в 19:00 МСК, онлайн

Преподаватели трека по биостатистике Института биоинформатики подготовили для вас серию лекций, которые разрушат самые популярные статистические мифы!
Почему нельзя пользоваться простыми алгоритмами для выбора статистического теста? Что же такое p-value, и чем оно не является? Нужно ли проводить проверку на нормальность, или это ничего не изменит? Эти, а также другие вопросы, вызывающие бурные споры как у новичков, так и у мастодонтов, мы обсудим на лектории!

🦖 12 марта, 19:00 МСК | Евгений Бакин
Миф №1: Статистика – наука точная, и в ней нет места мифам

🦖 19 марта, 19:00 МСК | Ольга Мироненко
Миф №2: Доверительные интервалы и р-значения – это то, чем они кажутся

🦖 26 марта, 19:00 МСК | Матвей Славенко
Миф №3: Ненормальное распределение требует ненормальных решений

Регистрация открыта до 26 марта 17:00 МСК: bioinf.me/stat_myths (если вы не получили письмо после регистрации – проверьте, пожалуйста, спам)

До встречи!

P.S.: Слушатели лектория больше никогда не будут ошибаться в вопросах статистики! Или будут. Всё как с динозаврами – 50/50!

#bioinf_education #bioinf_online @bioinformatics_institute
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥21