Forwarded from Maksim Kuznetsov
Вдохновился работой Артемия
Сделал немного другой вариант, надеюсь в арифметике не ошибся, что маловероятно, конечно, поэтому если кто-то увидет ошибку, прошу маякнуть
Сделал немного другой вариант, надеюсь в арифметике не ошибся, что маловероятно, конечно, поэтому если кто-то увидет ошибку, прошу маякнуть
🔥1🥰1
Sample size calculations in randomised trials: mandatory and mystical
Clinically relevant difference: used in the theory of clinical trials as opposed to cynically relevant difference, which is used in practice.
(c) Stephen Senn
Clinically relevant difference: used in the theory of clinical trials as opposed to cynically relevant difference, which is used in practice.
(c) Stephen Senn
👍1💘1
Решил опубликовать хоть что-то, что может оказаться для кого-то полезным.
Я считаю, что отличным ресурсом для изучения прикладной статистики и анализа данных являются блоги. Некоторые из них по своей содержательности, качеству изложения и другим параметрам многократно превосходят большинство методологических статей, недавно вот и плагиат из такого блога в статью случился, что неудивительно.
Привожу список блогов, за которыми стараюсь следить или, как минимум, время от времени обращаться к публикациям в них. Этот список отражает мои личные интересы, даже не то, какие задачи мне приходится решать, поэтому он получился сильно смещенным, но все равно некоторые блоги рекомендую посмотреть хотя бы ради эстетического удовольствия.
Andrew Heiss ведет потрясающе красивый и очень полезный блог с акцентом на причинно-следственный вывод и байесовский анализ.
Solomon Kurz публикует блогпосты про байесовский анализ и смешанные модели, а также он проделал невероятную работу по переводу примеров из книг на tidyverse и brms.
Noah Greifer является разработчиком нескольких пакетов, благодаря которым, в том числе, R сложно с чем-то сравнить, а исключительно из его комментариев на stackoverflow и crossvalidated можно составить отличный полноценный учебник.
Gavin Simpson ведет блог с акцентом на обобщенные аддитивные модели, если вам неуютно находиться в линейном мире, но не хочется уходить из мира интерпретируемого, очень рекомендую к прочтению.
Darren Dahly ведет блог по биостатистике, общий замысел которого можно обозначить названием одной из его публикаций I’m not a real statistician, and you can be one too (NB! это блог не из разряда "статистика – это просто").
Demetri Pananos является уже real statistician, но по-моему очень понятно пишет про сложные байесовские модели.
Matthew Jané ведет блог с говорящим названием Meta-Analysis Magic, это как раз он подвергся плагиату, если вам кажется, что нет ничего круче методологии Cochrane, то советую заглянуть, чтобы убедиться в обратном.
Vincent Arel-Bundock является автором пакета {{marginaleffects}}, только ради которого стоит изучать R.
Wolfgang Viechtbauer ведет блог, который одновременно является расширенной документацией {{metafor}} – другого пакета, только ради которого стоит изучать R.
Jonathan Bartlett ведет блог, посвященный, в том числе, одной из незаслуженно игнорируемых тем – статистический вывод в условиях пропущенных значений.
Stephen Wild и Tristan Mahr публикуют классные примеры прикладного байесовского анализа с использованием R, Stan и Turing.jl.
Mattan Ben-Shachar является соавтором мета-пакета {{easystats}}, который я, честно говоря, почти не использую, но блог очень содержательный и охватывает много интересных и сложных тем.
Наконец блоги «классиков»: Frank Harrell и Andrew Gelman, которого, так совпало, можно сегодня поздравить с 20-летием блогинга! )
Я считаю, что отличным ресурсом для изучения прикладной статистики и анализа данных являются блоги. Некоторые из них по своей содержательности, качеству изложения и другим параметрам многократно превосходят большинство методологических статей, недавно вот и плагиат из такого блога в статью случился, что неудивительно.
Привожу список блогов, за которыми стараюсь следить или, как минимум, время от времени обращаться к публикациям в них. Этот список отражает мои личные интересы, даже не то, какие задачи мне приходится решать, поэтому он получился сильно смещенным, но все равно некоторые блоги рекомендую посмотреть хотя бы ради эстетического удовольствия.
Andrew Heiss ведет потрясающе красивый и очень полезный блог с акцентом на причинно-следственный вывод и байесовский анализ.
Solomon Kurz публикует блогпосты про байесовский анализ и смешанные модели, а также он проделал невероятную работу по переводу примеров из книг на tidyverse и brms.
Noah Greifer является разработчиком нескольких пакетов, благодаря которым, в том числе, R сложно с чем-то сравнить, а исключительно из его комментариев на stackoverflow и crossvalidated можно составить отличный полноценный учебник.
Gavin Simpson ведет блог с акцентом на обобщенные аддитивные модели, если вам неуютно находиться в линейном мире, но не хочется уходить из мира интерпретируемого, очень рекомендую к прочтению.
Darren Dahly ведет блог по биостатистике, общий замысел которого можно обозначить названием одной из его публикаций I’m not a real statistician, and you can be one too (NB! это блог не из разряда "статистика – это просто").
Demetri Pananos является уже real statistician, но по-моему очень понятно пишет про сложные байесовские модели.
Matthew Jané ведет блог с говорящим названием Meta-Analysis Magic, это как раз он подвергся плагиату, если вам кажется, что нет ничего круче методологии Cochrane, то советую заглянуть, чтобы убедиться в обратном.
Vincent Arel-Bundock является автором пакета {{marginaleffects}}, только ради которого стоит изучать R.
Wolfgang Viechtbauer ведет блог, который одновременно является расширенной документацией {{metafor}} – другого пакета, только ради которого стоит изучать R.
Jonathan Bartlett ведет блог, посвященный, в том числе, одной из незаслуженно игнорируемых тем – статистический вывод в условиях пропущенных значений.
Stephen Wild и Tristan Mahr публикуют классные примеры прикладного байесовского анализа с использованием R, Stan и Turing.jl.
Mattan Ben-Shachar является соавтором мета-пакета {{easystats}}, который я, честно говоря, почти не использую, но блог очень содержательный и охватывает много интересных и сложных тем.
Наконец блоги «классиков»: Frank Harrell и Andrew Gelman, которого, так совпало, можно сегодня поздравить с 20-летием блогинга! )
🔥7👍3❤2🆒1
Forwarded from Maksim Kuznetsov
Вчера вечером наткнулся на учебник по статистике для экологов, решил полистать перед сном, в итоге листал до трех ночи. В итоге понял, что именно такого учебника мне всегда не хватало.
fw8051statistics4ecologists.netlify.app
Statistics for Ecologists
🔥6
Часто стало получаться так, что у меня в библиотеке есть книги Нобелевских лауреатов по экономике
Forwarded from Совет молодых учёных ЭФ МГУ (СМУч)
Нобелевские лауреаты 2024: Дарон Аджемоглу, Джеймс Робинсон, Саймон Джонсон за изучение формирования институтов и их роли в процветании. Ура!
Biostatistics on the Table
Часто стало получаться так, что у меня в библиотеке есть книги Нобелевских лауреатов по экономике
Если про Why nations fail, думаю, знают многие, ещё вот такая книга переведена на русский язык
🔥4
Forwarded from Maksim Kuznetsov
Автор пакет marginaleffects драфт новой книги опубликовал
https://marginaleffects.com/
https://marginaleffects.com/
❤2
С нетерпением жду выхода новых видео на канале ritvikmath, с тех пор как на него наткнулся. Честно говоря, я никогда не задумывался, что доказательство валидности* функции плотности вероятности стандартного нормального распределения – нетривиальная задача.
* валидная функция плотности вероятности (pdf) должна интегрироваться в 1, но существуют функции не обладающие таким свойством, но которые можно использовать вместо настоящих pdf в качестве априорных распределений в байесовском статистическом выводе. Очень известный пример –конъюгированное априорное распределение Джеффриса для биномиального распределения (Beta(1/2, 1/2)).
* валидная функция плотности вероятности (pdf) должна интегрироваться в 1, но существуют функции не обладающие таким свойством, но которые можно использовать вместо настоящих pdf в качестве априорных распределений в байесовском статистическом выводе. Очень известный пример –конъюгированное априорное распределение Джеффриса для биномиального распределения (Beta(1/2, 1/2)).
YouTube
You Can't Solve This Integral Without Making It Harder
The coolest integral I've ever seen!
0:00 First Attempt
2:34 The Solution
10:34 Data Science Connection
0:00 First Attempt
2:34 The Solution
10:34 Data Science Connection
🔥2👍1
Forwarded from Maksim Kuznetsov
Симпатичная задчака по генетике/терверу. Xh - аллель гемофилии, вопрос: какова вероятность того, что женщина обведенная окружностью является носителем?
🔥2
Человек анализом данных занимается, говорит, что профессионально, пишет пост, утверждения в котором можно элементарно проверить, для этого не нужно знать математику.
Forwarded from статИИстик
Как можно сравнить группы по тем или иным количественным переменным, чтобы исключить влияние других ковариат, например, пола и возраста? Читайте на statshots.ru
статИИстик
Как можно сравнить группы по тем или иным количественным переменным, чтобы исключить влияние других ковариат, например, пола и возраста? Читайте на statshots.ru
y <- swiss$Agriculture
x <- swiss$Education
z <- swiss$Examination
resid_y_on_z <- residuals( lm(y ~ z) )
resid_x_on_z <- residuals( lm(x ~ z) )
## Adjusted coefficient x on y
coef( lm(y ~ x + z) )[[2]]
#> [1] -0.7379441
## То что предлагается в публикации
coef( lm(resid_y_on_z ~ x) )[[2]]
#> [1] -0.3779868
## То как это работает на самом деле
coef( lm(resid_y_on_z ~ resid_x_on_z) )[[2]]
#> [1] -0.7379441
## И так тоже работает
coef( lm(y ~ resid_x_on_z) )[[2]]
#> [1] -0.7379441
## NB! стандартные ошибки для оценок
## будут недооцененными и число степеней свободы
🤗2
Порядковые переменные мне представляются очень сложными как с точки зрения анализа, так и с точки зрения визуализации, поэтому всегда радуюсь, когда встречаю что-то простое и элегантное, связанное с ними.
Сегодня наткнулся на простой и красивый подход к визуализации связанных порядковых переменных, сам я часто для этих целей часто использовал alluvial plots, но теперь кажется это в прошлом.
Сегодня наткнулся на простой и красивый подход к визуализации связанных порядковых переменных, сам я часто для этих целей часто использовал alluvial plots, но теперь кажется это в прошлом.
🔥5
Блуждал по интернету и наткнулся на такое:
курс по причинно-следственному выводу от Нобелевского лауреата 2021 года
https://mru.org/courses/mastering-econometrics/path-cause-effect
курс по причинно-следственному выводу от Нобелевского лауреата 2021 года
https://mru.org/courses/mastering-econometrics/path-cause-effect
Marginal Revolution University
The Path from Cause to Effect | Marginal Revolution University
If you're looking to untangle cause and effect in a complex world, then econometrics is what you seek. Join MIT professor Josh Angrist, aka Master Joshway, and learn to master the econometrics
🔥2
Biostatistics on the Table
Блуждал по интернету и наткнулся на такое: курс по причинно-следственному выводу от Нобелевского лауреата 2021 года https://mru.org/courses/mastering-econometrics/path-cause-effect
Сам не смотрел, но промо курса нельзя не оценить высоко )
На фото собственно автор курса и лауреат НП по экономике Джошуа Ангрист
На фото собственно автор курса и лауреат НП по экономике Джошуа Ангрист
Forwarded from ЦенСИБ (ex-ЛССИ)
#методы #сausal #inference #учебники #публикации
Ведущий научный сотрудник ЛССИ Борис Соколов недавно выложил в публичный доступ черновую версию своего обзора основных целевых величин (эстимандов), использующихся в статистическом каузальном анализе: АТЕ, АТТ, АТС и прочиетыквенные LATE с CATE. Хотя это ещё не полноценная статья, прошедшая рецензирование, данный текст может оказаться полезным как студентам, так и "взрослым" исследователям или прикладным аналитикам, применяющим соответствующие методы на практике - благо на русском языке литературы по теме откровенно мало.
P.S. Если вы найдёте в рукописи ошибки, неточности, упущения и т.д., или у вас будут иные идеи насчёт того, как её улучшить, можно написать напрямую автору на электронную почту - он открыт к обратной связи и конструктивной критике.
Ведущий научный сотрудник ЛССИ Борис Соколов недавно выложил в публичный доступ черновую версию своего обзора основных целевых величин (эстимандов), использующихся в статистическом каузальном анализе: АТЕ, АТТ, АТС и прочие
P.S. Если вы найдёте в рукописи ошибки, неточности, упущения и т.д., или у вас будут иные идеи насчёт того, как её улучшить, можно написать напрямую автору на электронную почту - он открыт к обратной связи и конструктивной критике.
👍2❤1🔥1
Уже давно заметил, что январь очень хороший месяц с точки зрения появления новых образовательных проектов. Хочу поделиться двумя, за которыми обязательно буду следить.
- Gavin Simpson выложил первое видео из серии, которая будет посвящена постпроцессингу обобщенных аддитивных моделей (GAM) с использованием пакета
- Стартовал полноценный курс от Jonathan Templin по пропущенным значениям, основанный на книге Applied missing data analysis (с реализацией методов в R c использованием пакетов
- Gavin Simpson выложил первое видео из серии, которая будет посвящена постпроцессингу обобщенных аддитивных моделей (GAM) с использованием пакета
{{gratia}}- Стартовал полноценный курс от Jonathan Templin по пропущенным значениям, основанный на книге Applied missing data analysis (с реализацией методов в R c использованием пакетов
{{mice}} и {{Amelia}} и даже JAGS и Stan обещаны). Здесь стоит добавить, что хороших видео-материалов по пропускам очень мало и к тому же в них часто используется "неконвенциональное" ПО вроде Mplus (как в серии семинаров Craig Enders, автора указанной выше книги часть 1, часть 2) или IVEware (как в серии семинаров Trivellore Raghunathan часть 1, часть 2, часть 3, часть 4)YouTube
FtBotH: Generalized Additive Models (GAMs)
Bottom of the Heap videos on Generalized Additive Models (GAMs)
🔥7👍2❤1