С Дамиром Ильдаровичем знаком, плохие каналы не посоветует (я тоже рекомендую на них подписаться). Предложенные советы тоже считаю нужными 👍
P.S. правда у меня иногда токсичненько, но уж такой я 😁
P.P.S. если интересны нормальные посты (не мемы и шутки), то они все в закреплённых
P.S. правда у меня иногда токсичненько, но уж такой я 😁
P.P.S. если интересны нормальные посты (не мемы и шутки), то они все в закреплённых
🔥2
Forwarded from medstatistic (Damir Marapov)
В первый раз присоединились к статистическому чату и не знаете, как здесь принято себя вести? Прочитали посты, полные сарказма и постметаиронии, и теперь боитесь задать вопрос? Есть желание получить признание среди участников сообщества? А может, вы сами завели блог на научную тему и теперь раздумываете, как привлечь в него других учёных?
Вам помогут наши рекомендации! Когда-то они были подготовлены для новых участников, желающих влиться в не самую простую среду научных чатов, но какое-то время пролежали на полке неопубликованных заметок. А ведь хорошо получилось! Главное, что сейчас, похоже, есть запрос на такие правила, учитывая плотность общения в чатах о статистике, становящегося иногда весьма эмоциональным.
В рекомендациях, доступных по ссылке к этому посту, 3 небольших раздела:
1️⃣ Что вызывает позитивную реакцию в научном сообществе?
2️⃣ Рекомендации по общению в научных блогах для подписчиков.
3️⃣ Рекомендации по содержанию постов для авторов научных блогов.
Буду рад, если эти рекомендации помогут выбрать правильный настрой на активное присутствие в чатах и блогах: @medstatistic_chat,
@nkonnadm,
@chat_biostat_R,
@ebm_base,
@clinresearch,
@stats_for_science,
@choking_data,
@tabulated_stats и других.
Хотя это всего лишь мое мнение, но оно основано на многолетних наблюдениях за общением их участников.
А свои мнения, дополнения и замечания не стесняйтесь оставлять в комментариях🤗
Читать рекомендации
Вам помогут наши рекомендации! Когда-то они были подготовлены для новых участников, желающих влиться в не самую простую среду научных чатов, но какое-то время пролежали на полке неопубликованных заметок. А ведь хорошо получилось! Главное, что сейчас, похоже, есть запрос на такие правила, учитывая плотность общения в чатах о статистике, становящегося иногда весьма эмоциональным.
В рекомендациях, доступных по ссылке к этому посту, 3 небольших раздела:
1️⃣ Что вызывает позитивную реакцию в научном сообществе?
2️⃣ Рекомендации по общению в научных блогах для подписчиков.
3️⃣ Рекомендации по содержанию постов для авторов научных блогов.
Буду рад, если эти рекомендации помогут выбрать правильный настрой на активное присутствие в чатах и блогах: @medstatistic_chat,
@nkonnadm,
@chat_biostat_R,
@ebm_base,
@clinresearch,
@stats_for_science,
@choking_data,
@tabulated_stats и других.
Хотя это всего лишь мое мнение, но оно основано на многолетних наблюдениях за общением их участников.
А свои мнения, дополнения и замечания не стесняйтесь оставлять в комментариях🤗
Читать рекомендации
❤13
Как думаете, можно ли выполнить корреляционный анализ между двумя бинарными переменными?
🤔4
ЭТО НЕ НА ВАС РАССЧИТАНО И ВООБЩЕ НЕВОЗМОЖНО
Читая книги, статьи, смотря видео по статистике, я понял, что лучше избегать категоричных фраз. Или, на крайний случай, иметь в кармане пару ссылок для подтверждение мнения.
В общем, как обычно "это зависит..."
Чисто технически можно посчитать что угодно и практически как угодно. Отчасти я это пытался показать здесь.
Но за (а точнее перед) технической частью должно быть осмысленное обоснование. Какой вопрос у нас, зачем мы пытаемся его решить, какой метод и почему он поможет нам его решить, какие допущение есть у нас при решении и т.д.
Помимо этого есть несколько уже понятных и устоявшихся принципов. Например, каузация и прогнозирование - разные задачи; ассоциация не означает причинность; отсутствие доказательств не является доказательством отсутствия и прочие (думаю, кому-то они известны, и мысль понятна).
И вот в одном блоге понимающий автор пояснил 95% неучам, что
По контексту поста это была попытка сказать, что термин "корреляция" лучше использовать тогда, когда это было методом анализа, а в остальных ограничиться термином "ассоциация" (правда почему-то
)
Но в посте есть следующий абзац:
Я согласен здесь только с первым предложением. Остальное, извините, чушь.
1) помимо Пирсона и Спирмена, есть другие фамилии (как минимум Кендалл)
2) корреляцию (здесь можно подискутировать, что мы под этим подразумеваем) можно посчитать между любыми сочетаниями переменных (Phi, Point-biserial, Polychoric и другие)
3) уровни чего-то, как и дни не обязательно будут (или рассматривать как) количественные
4) как быть с баллами шкал, где единица измерения - попугай? 😁
5) возможно, есть рассчитанные на это
В связи с этим я и задал вопрос в своём канале, где один из первых был комментарий Ольги "определиться с понятием корреляция", с которым я полностью согласен. Максим уточнил, что в известной фразе под термином "correlation" имеется в виду ассоциация. Так же в комментариях поделился своим постом Матвей и магистерским дипломом (осторожно, математика). Так же Ольга затем прикрепила ссылку на сводные статистики для таблиц сопряженности.
Возможно автор действительно пытался сказать, что-то другое (не про методы корреляции, а про использование термина). Возможно я оказался в числе тех 95% неучей врачей-исследователей, которые мало о чем знают. А возможно необходимо более точнее изъяснять свои мысли (вроде бы знание и использование научного подхода, написание публикаций помогает этому), чтобы большинству было понятно.
#бурловдушнила
Читая книги, статьи, смотря видео по статистике, я понял, что лучше избегать категоричных фраз. Или, на крайний случай, иметь в кармане пару ссылок для подтверждение мнения.
В общем, как обычно "это зависит..."
Чисто технически можно посчитать что угодно и практически как угодно. Отчасти я это пытался показать здесь.
Но за (а точнее перед) технической частью должно быть осмысленное обоснование. Какой вопрос у нас, зачем мы пытаемся его решить, какой метод и почему он поможет нам его решить, какие допущение есть у нас при решении и т.д.
Помимо этого есть несколько уже понятных и устоявшихся принципов. Например, каузация и прогнозирование - разные задачи; ассоциация не означает причинность; отсутствие доказательств не является доказательством отсутствия и прочие (думаю, кому-то они известны, и мысль понятна).
И вот в одном блоге понимающий автор пояснил 95% неучам, что
искать корреляцию можно только между двумя количественными параметрами
По контексту поста это была попытка сказать, что термин "корреляция" лучше использовать тогда, когда это было методом анализа, а в остальных ограничиться термином "ассоциация" (правда почему-то
это уже немножко по бытовому
)
Но в посте есть следующий абзац:
Корреляция - это вполне конкретный и понятный метод статистического анализа. Когда вы считаете коэффициент корреляции, простихоспади, Спирмена или Пирсона. И, главное: искать корреляцию можно только между двумя количественными параметрами. Это могут быть уровни чего-то в чем-то, количество дней, дозировка препарата и т.д. Т.е. все то, что имеет единицы измерения. Искать корреляцию между бинарным и количественным параметром, или двумя бинарными параметрами невозможно. Метод корреляции на это не рассчитан.
Я согласен здесь только с первым предложением. Остальное, извините, чушь.
1) помимо Пирсона и Спирмена, есть другие фамилии (как минимум Кендалл)
2) корреляцию (здесь можно подискутировать, что мы под этим подразумеваем) можно посчитать между любыми сочетаниями переменных (Phi, Point-biserial, Polychoric и другие)
3) уровни чего-то, как и дни не обязательно будут (или рассматривать как) количественные
4) как быть с баллами шкал, где единица измерения - попугай? 😁
5) возможно, есть рассчитанные на это
В связи с этим я и задал вопрос в своём канале, где один из первых был комментарий Ольги "определиться с понятием корреляция", с которым я полностью согласен. Максим уточнил, что в известной фразе под термином "correlation" имеется в виду ассоциация. Так же в комментариях поделился своим постом Матвей и магистерским дипломом (осторожно, математика). Так же Ольга затем прикрепила ссылку на сводные статистики для таблиц сопряженности.
Возможно автор действительно пытался сказать, что-то другое (не про методы корреляции, а про использование термина). Возможно я оказался в числе тех 95% неучей врачей-исследователей, которые мало о чем знают. А возможно необходимо более точнее изъяснять свои мысли (вроде бы знание и использование научного подхода, написание публикаций помогает этому), чтобы большинству было понятно.
#бурловдушнила
3❤14👍5
Forwarded from Школа Химиотерапевтов
Что мы будем делать в это воскресенье?
Обсуждать с Никитой исследования MATTERHORN и Keynote-585. Скучно, нудно, долго 🫠 Но это не точно…😅
There are three kinds of lies: lies, damned lies, and statistics
26.10 в 17:00 по Москве.
Регистрация по ссылке: https://my.mts-link.ru/j/20600430/1906102850
#эфир #чтосказалбыникитабурлов #бурловдушнила #СТАТИСТИКА_ПРОСТО
Обсуждать с Никитой исследования MATTERHORN и Keynote-585. Скучно, нудно, долго 🫠 Но это не точно…😅
There are three kinds of lies: lies, damned lies, and statistics
26.10 в 17:00 по Москве.
Регистрация по ссылке: https://my.mts-link.ru/j/20600430/1906102850
#эфир #чтосказалбыникитабурлов #бурловдушнила #СТАТИСТИКА_ПРОСТО
🔥10❤4👍3
Forwarded from Борзило
SUTVA
(Stable Unit Treatment Value Assumption). Стабильность воздействия на экспериментальный объект. Один из важных принципов честного АБ тестирования.
Этот принцип предполагает, что поведение одного участника эксперимента не зависит от поведения других участников эксперимента. Чтобы понять лучше давайте посмотрим примеры
🗂 Сервис для заполнения бухгалтерской отчетности
Вы развиваете такой сервис и решили провести АБ тест. Половине пользователей показываете старую версию интерфейса, а половине новую. Вроде все нормально, но могут быть проблемы.
Представьте, компании в которых несколько бухгалтеров - пользователей сервиса и все они сидят в одном кабинете.
Кто-то из них получил старый интерфейс, а кто-то новый. И вот уже Галя кричит: Тамара Ивановна посмотри, куда у меня делись все кнопки (она получила тестовую версию), Тамара Ивановна смотрит на новый интерфейс Галины и говорит, а у меня все по старому (она в контрольной группе).
Через 5 минут они уже звонят в тех поддержку, чтобы выяснить что за фигня. Короче эксперимент сломался, пользователи повлияли друг на друга и увидели оба варианта.
🚕 Сервис вызова такси
Предположим у нас мобильное приложение по заказу такси и мы хотим протестировать новый алгоритм назначения цены поездок.
В среднем стоимость поездки будет выше в тестовой версии, чем в контрольной версии. Как обычно делим пользователей на 2 группы тест и контроль, но могут быть проблемы.
У нас ведь есть водители, которым интересно брать наиболее прибыльные заказы, а так как у пользователей тестовой группы цены в среднем выше, то и больше водителей будет откликаться на эти заказы.
Может сложиться ситуация, что свободных водителей готовых браться за заказы от контрольной группы останется совсем мало и пользователи контрольной группы не смогут вызвать такси из-за этого. Т.е. воздействие на тестовую группу опосредовано через водителей повлияло и на контрольную группу.
💰 Кэшбек в банке
Предположим вы банк и вы вводите супер клевый кэшбек 5% на все. Решаете протестировать и делаете классический АБ тест. Одной группе не даете новый кэшбек, другой даете.
Согласитесь, что кэшбек 5% - классно и вы скорее всего расскажите о нем своим родственникам и друзьям, которые также могут быть клиентами банка, но если они попадут в контрольную группу, то такого классного кэшбека у них не будет и они расстроятся. Т.е. экспериментальное воздействие неявно повлияло на поведение контрольной группы.
Что делать в таких ситуациях? Если знаете - пишите в комменты. Если хотите узнать, то поставьте 👍 и я расскажу в следующих постах о подходах для работы с экспериментами в подобных ситуациях.
(Stable Unit Treatment Value Assumption). Стабильность воздействия на экспериментальный объект. Один из важных принципов честного АБ тестирования.
Этот принцип предполагает, что поведение одного участника эксперимента не зависит от поведения других участников эксперимента. Чтобы понять лучше давайте посмотрим примеры
🗂 Сервис для заполнения бухгалтерской отчетности
Вы развиваете такой сервис и решили провести АБ тест. Половине пользователей показываете старую версию интерфейса, а половине новую. Вроде все нормально, но могут быть проблемы.
Представьте, компании в которых несколько бухгалтеров - пользователей сервиса и все они сидят в одном кабинете.
Кто-то из них получил старый интерфейс, а кто-то новый. И вот уже Галя кричит: Тамара Ивановна посмотри, куда у меня делись все кнопки (она получила тестовую версию), Тамара Ивановна смотрит на новый интерфейс Галины и говорит, а у меня все по старому (она в контрольной группе).
Через 5 минут они уже звонят в тех поддержку, чтобы выяснить что за фигня. Короче эксперимент сломался, пользователи повлияли друг на друга и увидели оба варианта.
🚕 Сервис вызова такси
Предположим у нас мобильное приложение по заказу такси и мы хотим протестировать новый алгоритм назначения цены поездок.
В среднем стоимость поездки будет выше в тестовой версии, чем в контрольной версии. Как обычно делим пользователей на 2 группы тест и контроль, но могут быть проблемы.
У нас ведь есть водители, которым интересно брать наиболее прибыльные заказы, а так как у пользователей тестовой группы цены в среднем выше, то и больше водителей будет откликаться на эти заказы.
Может сложиться ситуация, что свободных водителей готовых браться за заказы от контрольной группы останется совсем мало и пользователи контрольной группы не смогут вызвать такси из-за этого. Т.е. воздействие на тестовую группу опосредовано через водителей повлияло и на контрольную группу.
Предположим вы банк и вы вводите супер клевый кэшбек 5% на все. Решаете протестировать и делаете классический АБ тест. Одной группе не даете новый кэшбек, другой даете.
Согласитесь, что кэшбек 5% - классно и вы скорее всего расскажите о нем своим родственникам и друзьям, которые также могут быть клиентами банка, но если они попадут в контрольную группу, то такого классного кэшбека у них не будет и они расстроятся. Т.е. экспериментальное воздействие неявно повлияло на поведение контрольной группы.
Что делать в таких ситуациях? Если знаете - пишите в комменты. Если хотите узнать, то поставьте 👍 и я расскажу в следующих постах о подходах для работы с экспериментами в подобных ситуациях.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17
Forwarded from Школа Химиотерапевтов
⚡️ Меньше часа до эфира ⚡️
Подключение в 17:00 🕔 здесь https://my.mts-link.ru/j/20600430/1906102850
А тем временем ИИ сгенерировал нам баннер 😅
#эфир #СТАТИСТИКА_ПРОСТО
Подключение в 17:00 🕔 здесь https://my.mts-link.ru/j/20600430/1906102850
А тем временем ИИ сгенерировал нам баннер 😅
#эфир #СТАТИСТИКА_ПРОСТО
🔥6👍1
Когда увидите в КР FLOT+дурвалумаб, то вспоминайте этот слайд 😁
😁3🌚3💅2
Речь об одном препарате, но думаю в описание канала тоже смотрелось бы неплохо)))
У кого-нибудь ещё есть предложения по подходящим характеристикам канала?
У кого-нибудь ещё есть предложения по подходящим характеристикам канала?
❤4💅2
Forwarded from Школа Химиотерапевтов
Эфир уже на нашем RUTUBE канале
⬇️ ⬇️ ⬇️
https://rutube.ru/video/9f40f123394e08d6f75e0eddc65a7de8/?r=plwm
#эфир
https://rutube.ru/video/9f40f123394e08d6f75e0eddc65a7de8/?r=plwm
#эфир
Please open Telegram to view this post
VIEW IN TELEGRAM
RUTUBE
MATTERHORN vs KEYNOTE-585
Занимательная статистика или разоблачение года?
Два эпохальных исследования для рака желудка, но абсолютно разные финальные результаты... почему так? Разбираемся в эфире вместе с Никитой Бурловым. Интрига эфира - что все таки не так с MATTERHORN и сколько…
Два эпохальных исследования для рака желудка, но абсолютно разные финальные результаты... почему так? Разбираемся в эфире вместе с Никитой Бурловым. Интрига эфира - что все таки не так с MATTERHORN и сколько…
6🔥14❤3👍3💅1
Интересно и наглядно.
1 таблица - как ведут себя разные тесты (конкретно p-value) при нарушении пропорциональности рисков (non-PH or crossing hazards).
2 таблица - при сохранении PH (точнее не отклонено допущение о PH).
Очень часто используют log-rank test в онкологических трайлах. Но в случаях нарушения PH лучше бы использовать альтернативы. Полезно посмотреть статью (как минимум), чтобы узнать, что анализ выживаемости - это не только кривые КМ, лог-ранг и регрессия Кокса.
1 таблица - как ведут себя разные тесты (конкретно p-value) при нарушении пропорциональности рисков (non-PH or crossing hazards).
2 таблица - при сохранении PH (точнее не отклонено допущение о PH).
Очень часто используют log-rank test в онкологических трайлах. Но в случаях нарушения PH лучше бы использовать альтернативы. Полезно посмотреть статью (как минимум), чтобы узнать, что анализ выживаемости - это не только кривые КМ, лог-ранг и регрессия Кокса.
5👍7❤4💅1
Forwarded from Olga Mironenko
Вообще тут же сложность еще с непропорциональными рисками в том, что их бы заранее, на этапе планирования исследования, выбора экстиманда и, соответственно, теста/ модели, предвидеть. Причем не просто предвидеть их наличие, но и то, как эта непропорциональность может быть устроена - от этого (т.е. того, как устроена альтернатива нулевой гипотезе о равенстве выживаемости/ хазардов в группах) зависит и мощность теста, а значит, и его выбор. Все логранги, включая MaхCombo, теряют мощность при пересекающихся хазардах (именно хазардах, что может происходить и без пересечения кривых выживаемости, просто пересечение последних - это самый крайний вариант).
Вот в этой статье как раз показано, как разные тесты работают в зависимости от того, как устроен эффект. Соответственно, нужно как-то заранее предположить, как он может быть устроен - исходя, из клинических соображений (например, в зависит от различий в механизме действия, если речь о сравнении разных опций терапии). Но. Даже если клинически мы будем предполагать, что риски пропорциональны, они потом могут оказаться непропорциональными из-за интеркуррентных событий или модификатора эффекта (эффект сильно разный в подгруппах), а такое предугадать бывает сложнее... Поэтому прежде чем бросаться подбирать подходящий тест (если мы его заранее не запланировали), я бы попробовала найти причину непропорциональности, особенно если она является "неожиданной" и необъяснимой клинически. Поскольку бороться с некоторыми причинами видимой непропорциональности нужно не с помощью альтернативных тестов или моделей выживаемости.
Если же про тесты говорить, то в той же статье есть и про их недостатки. Например, при отложенном эффекте, если мы используем взвешенный логранг с большим весом более поздним событиям, мы практически не штрафуем за ранние события, т.е. как бы цена одного и того же события получается разная, что тоже вызывает вопросы, в том числе с точки зрения этики.
И там же еще одна важная мысль, что тесты тестами, но вопрос об оценке эффекта остается. Например, даже если мы посчитаем какой-нибудь взвешенный HR, то мы его интерпретировать должны уже в привязке к тому периоду, по которому мы выживаемость сравнивали + и взвешенный, и невзвешенный HR в случае непропорциональности зависят от распределения времени до цензурирования, что как бы мешает делать вывод в отношении времени до события.
Вот в этой статье как раз показано, как разные тесты работают в зависимости от того, как устроен эффект. Соответственно, нужно как-то заранее предположить, как он может быть устроен - исходя, из клинических соображений (например, в зависит от различий в механизме действия, если речь о сравнении разных опций терапии). Но. Даже если клинически мы будем предполагать, что риски пропорциональны, они потом могут оказаться непропорциональными из-за интеркуррентных событий или модификатора эффекта (эффект сильно разный в подгруппах), а такое предугадать бывает сложнее... Поэтому прежде чем бросаться подбирать подходящий тест (если мы его заранее не запланировали), я бы попробовала найти причину непропорциональности, особенно если она является "неожиданной" и необъяснимой клинически. Поскольку бороться с некоторыми причинами видимой непропорциональности нужно не с помощью альтернативных тестов или моделей выживаемости.
Если же про тесты говорить, то в той же статье есть и про их недостатки. Например, при отложенном эффекте, если мы используем взвешенный логранг с большим весом более поздним событиям, мы практически не штрафуем за ранние события, т.е. как бы цена одного и того же события получается разная, что тоже вызывает вопросы, в том числе с точки зрения этики.
И там же еще одна важная мысль, что тесты тестами, но вопрос об оценке эффекта остается. Например, даже если мы посчитаем какой-нибудь взвешенный HR, то мы его интерпретировать должны уже в привязке к тому периоду, по которому мы выживаемость сравнивали + и взвешенный, и невзвешенный HR в случае непропорциональности зависят от распределения времени до цензурирования, что как бы мешает делать вывод в отношении времени до события.
1❤5👍1💅1
Forwarded from Olga Mironenko
Кстати, в FDA есть рабочая группа по непропорциональным рискам (Cross-Pharma Non-proportional Hazards Working Group) - можно почитать их рекомендации (нет, у них нет своей странички в интернете, я нашла их случайно, есть несколько публикаций и презентаций) - например, https://ww2.amstat.org/meetings/biop/2020/onlineprogram/handouts/SC5-Handouts.pdf или https://doi.org/10.1080/19466315.2021.1874507. Не знаю, насколько они на практике являются устоявшимся в FDA, но статьи с критикой этого подхода (рекомендуемого этой группой MaxCombo теста, в частности) тоже есть (например, https://doi.org/10.1080/19466315.2021.2008485).
1❤4💅1
Forwarded from Olga Mironenko
ответ на эту критику от этой группы тоже есть - https://doi.org/10.1080/19466315.2022.2103180, но я не нашла его полностью )) хотя очень любопытно было бы почитать его весь
1💅2