Пытался через нейросеть сделать образ ситха и джедая-отступника))
🔥10
ВАШИ АРГУМЕНТЫ НЕСОСТОЯТЕЛЬНЫ
⠀
В комментариях под постом про смещение оценки Матвей напомнил, что еще бывает её состоятельность ☝🏻
⠀
❗Состоятельность/согласованность оценщика (consistent of estimator) - свойство метода получения оценок, характеризующее, что при увеличении выборки вероятность оценки сходИтся к истинной равна 1❗
⠀
Запутанно? Будем разматывать🕵🏻♂️
⠀
Мы хотим измерить рост людей страны. Мы знаем, что нам удобно посчитать среднее арифметическое. И этот показатель (среднее арифметическое) - это оценщик (т.е. метод получения оценки, т.е. конкретного значения). При этом взять всю популяцию достаточно сложно (но нам бы очень хотелось). И мы знаем, что у популяции есть точечное значение (т.е. истинное среднее значение роста) 🙃
По своим возможностям мы собираем выборку из популяции (представим, что репрезентативную). Рассчитываем среднее значение роста в выборке (оно навряд ли будет такое же как в популяции из-за смещения, т.е. наша оценка смещенная). Но если мы будем увеличивать размер выборки (вдруг нам дадут на это ресурсы), то наша оценка будет постепенно становится все более похожей на истинное значение среднего роста в популяции. Т.е. вероятность получить разницу между истинной и нашей оценками равной 0 приближается к 1 😱
⠀
Постарался показать как это выглядит на графике (рис.1). Формулой это обозначается как на рис.2 🫠
⠀
Такой оценщик мы называет состоятельным (или согласованным, consistent estimator)💪🏻
⠀
Зачем это знать? Чтобы понимать, нужно ли нам стремиться к увеличению выборки, чтобы увеличить точность (грубо) своей оценки.
⠀
Характеристики (не/смещение и не/состоятельность) есть у каждого оценщика (среднее, доверительные интервалы и т.д.)
Он может быть смещенным, но состоятельным; а может наоборот😶🌫️
⠀
Я попытался найти примеры несостоятельных оценщиков в медицине, но кроме совпадения значения(-ий) одного (или группы) пациента(-ов) с истинной оценкой (E(x1) = µ), продолжительности заболевания и показателей опросников, ничего не нашел (возможно в комментариях помогут и смогут привести примеры таких оценщиков) 👋🏻
#ebm_statistica #consistent
@ebm_base
⠀
В комментариях под постом про смещение оценки Матвей напомнил, что еще бывает её состоятельность ☝🏻
⠀
❗Состоятельность/согласованность оценщика (consistent of estimator) - свойство метода получения оценок, характеризующее, что при увеличении выборки вероятность оценки сходИтся к истинной равна 1❗
⠀
Запутанно? Будем разматывать🕵🏻♂️
⠀
Мы хотим измерить рост людей страны. Мы знаем, что нам удобно посчитать среднее арифметическое. И этот показатель (среднее арифметическое) - это оценщик (т.е. метод получения оценки, т.е. конкретного значения). При этом взять всю популяцию достаточно сложно (но нам бы очень хотелось). И мы знаем, что у популяции есть точечное значение (т.е. истинное среднее значение роста) 🙃
По своим возможностям мы собираем выборку из популяции (представим, что репрезентативную). Рассчитываем среднее значение роста в выборке (оно навряд ли будет такое же как в популяции из-за смещения, т.е. наша оценка смещенная). Но если мы будем увеличивать размер выборки (вдруг нам дадут на это ресурсы), то наша оценка будет постепенно становится все более похожей на истинное значение среднего роста в популяции. Т.е. вероятность получить разницу между истинной и нашей оценками равной 0 приближается к 1 😱
⠀
Постарался показать как это выглядит на графике (рис.1). Формулой это обозначается как на рис.2 🫠
⠀
Такой оценщик мы называет состоятельным (или согласованным, consistent estimator)💪🏻
⠀
Зачем это знать? Чтобы понимать, нужно ли нам стремиться к увеличению выборки, чтобы увеличить точность (грубо) своей оценки.
⠀
Характеристики (не/смещение и не/состоятельность) есть у каждого оценщика (среднее, доверительные интервалы и т.д.)
Он может быть смещенным, но состоятельным; а может наоборот😶🌫️
⠀
Я попытался найти примеры несостоятельных оценщиков в медицине, но кроме совпадения значения(-ий) одного (или группы) пациента(-ов) с истинной оценкой (E(x1) = µ), продолжительности заболевания и показателей опросников, ничего не нашел (возможно в комментариях помогут и смогут привести примеры таких оценщиков) 👋🏻
#ebm_statistica #consistent
@ebm_base
🔥5🤯5👍2💩1
Forwarded from Matt
Второе. Состоятельностей вообще три главных: сильная (aka сходимость почти наверняка), слабая (сходимость в вероятности) и Lp (без комментариев). Но это все глубокая теория, на практике все довольствуются слабой состоятельностью.Это ключевое свойство, без него не о чем на практике говорить. Несостоятельная оценка для клинициста = просто шум и рандомное число. В медицинской литературе обычно именно несостоятельные оценки называют biased. С точки зрения труЪ матстата это некорректно, но этот поезд мы уже не развернем.
Зафиксируем: для клиницистов biased estimate = хреновая оценка, которое оценивает вообще не то, что надо, а что-то другое, поэтому их надо избегать.
Зафиксируем: для клиницистов biased estimate = хреновая оценка, которое оценивает вообще не то, что надо, а что-то другое, поэтому их надо избегать.
👍2🔥2🤔1
Forwarded from Matt
Как понять, что такое состоятельность, и зачем она вообще нужна?
Итак, у нас есть популяция, в этой популяции есть среднее -- например, средний рост. Померять всех людей мы не можем, поэтому мы берем выборку из популяции и на основании этой выборки пытаемся оценить среднее во всей популяции. Конкретный способ как из n измерений в выборке получаем одно число -- оценку параметра -- называется estimator или, как называет его Ник, оценщик. В случае со средним это обычно среднее арифметическое. Но могут быть и другие: например, trimmed среднее, когда вы удалили из выборки выбросы.
В чем проблема: поскольку измерения в выборке -- случайные величины, то и результат, который нам выдает оценщик -- собственно сама оценка -- тоже случайная величина. Внимание: случайная величина не значит "левая, рандомная хрень; шум". Это значит, что у нас есть некоторая "ошибка измерения". Среднее в выборке не будет равно среднему в популяции (я гарантирую это).
Все последующие танцы сводятся к тому, как ведет себя вот эта "ошибка измерения", разница между реальным значением в популяции и тем, что вам говорит ваш оценщик.
Итак, у нас есть популяция, в этой популяции есть среднее -- например, средний рост. Померять всех людей мы не можем, поэтому мы берем выборку из популяции и на основании этой выборки пытаемся оценить среднее во всей популяции. Конкретный способ как из n измерений в выборке получаем одно число -- оценку параметра -- называется estimator или, как называет его Ник, оценщик. В случае со средним это обычно среднее арифметическое. Но могут быть и другие: например, trimmed среднее, когда вы удалили из выборки выбросы.
В чем проблема: поскольку измерения в выборке -- случайные величины, то и результат, который нам выдает оценщик -- собственно сама оценка -- тоже случайная величина. Внимание: случайная величина не значит "левая, рандомная хрень; шум". Это значит, что у нас есть некоторая "ошибка измерения". Среднее в выборке не будет равно среднему в популяции (я гарантирую это).
Все последующие танцы сводятся к тому, как ведет себя вот эта "ошибка измерения", разница между реальным значением в популяции и тем, что вам говорит ваш оценщик.
👍3
Forwarded from Matt
Мы можем задаться вопросом: а как ведет себя ошибка измерения при увеличении размера выборки? С какой вероятностью она будет "большой"? Суть (слабой) состоятельности в том, что с увеличением объема выборки вероятность того, что ошибка будет "большой" сходится к нулю. То есть, на достаточно большой выборке вероятность того, что оценка достаточно близка к реальному значению, достаточно высока. Состоятельность важна потому, что для нас на практике это значит, что точечным оценкам можно верить; если оценщик состоятельный, то точечные оценки с большой вероятностью близки к правде -- ну или их можно туда затолкать, увеличив выборку.
Иными словами, состоятельность говорит о том, что между тем, что делает оценщик, и реальным параметром есть какая-то связь, что оценщик хотя бы пытается попасть в реальный параметр. Состоятельность -- это то, что делает оценку оценкой в клиническом смысле.
Иными словами, состоятельность говорит о том, что между тем, что делает оценщик, и реальным параметром есть какая-то связь, что оценщик хотя бы пытается попасть в реальный параметр. Состоятельность -- это то, что делает оценку оценкой в клиническом смысле.
👍3
Вчера под постом о состоятельности мне указали на мое место неточности (я сам попросил, т.к. не был уверен, что верно понял)
Получилось очень продуктивно
Спасибо!
А если вы хотите прочитать полную версию, что переходите в чат (там продолжение)
Получилось очень продуктивно
Спасибо!
А если вы хотите прочитать полную версию, что переходите в чат (там продолжение)
❤2
Ну а кто говорил, что задача ChatGPT искать правду 😁
Ее цель, чтобы слова подходили (ни хорошо, ни плохо, просто это особенность)
Ее цель, чтобы слова подходили (ни хорошо, ни плохо, просто это особенность)
"Правды больше нет, нам она и не нужна"
❤7
Forwarded from People Analytics (Юрий)
🤖💩 ChatGPT -- полный бред
На днях одна компания (гуглите, не буду рекламировать ) громко заявила о том, что для анализа результатов опроса вовлеченности используется LMM. Я посмотрел и прочитал примеры отчётов. На мой взгляд, тексты от LMM на уровне "Капитан Oчевидность", но я хотел бы обратить внимание на другое.
Недавно опубликованная статья в журнале "Ethics and Information Technology" под заголовком "ChatGPT is bullshit" авторства Майкла Тонсена Хикса, Джеймса Хамфриса и Джо Слейтера утверждает, что большие языковые модели, такие как ChatGPT, производят контент, который часто содержит неточности, известные как "галлюцинации ИИ". Авторы статьи используют термин "bullshit" (по Фрэнкуфорту) для описания таких моделей, отмечая, что они в значительной степени характеризуются безрассудным пренебрежением к истине. Они рассматривают, как и почему модели могут считаться "bullshitters", и утверждают, что это описание лучше помогает понять и обсуждать поведение таких систем. В другом исследовании показано, что большие языковые модели склонны к "галлюцинациям" (от 17 до 33% времени) или созданию недостоверной информации, что делает их использование рискованным в областях с высокими ставками. Я как-то попросил GPT рассказать мне об исследованиях психологического благополучия. Получил "прекрасный" правдоподобный текст ... с выдуманными исследованиями и ссылками на несуществующие статьи. В отличие от прямой лжи чушь звучит весьма правдоподобно, поэтому рекомендую книжку "Полный бред! Скептицизм в мире больших данных".
#AI #ИИ #chatGPT #HR #LLM
На днях одна компания (
Недавно опубликованная статья в журнале "Ethics and Information Technology" под заголовком "ChatGPT is bullshit" авторства Майкла Тонсена Хикса, Джеймса Хамфриса и Джо Слейтера утверждает, что большие языковые модели, такие как ChatGPT, производят контент, который часто содержит неточности, известные как "галлюцинации ИИ". Авторы статьи используют термин "bullshit" (по Фрэнкуфорту) для описания таких моделей, отмечая, что они в значительной степени характеризуются безрассудным пренебрежением к истине. Они рассматривают, как и почему модели могут считаться "bullshitters", и утверждают, что это описание лучше помогает понять и обсуждать поведение таких систем. В другом исследовании показано, что большие языковые модели склонны к "галлюцинациям" (от 17 до 33% времени) или созданию недостоверной информации, что делает их использование рискованным в областях с высокими ставками. Я как-то попросил GPT рассказать мне об исследованиях психологического благополучия. Получил "прекрасный" правдоподобный текст ... с выдуманными исследованиями и ссылками на несуществующие статьи. В отличие от прямой лжи чушь звучит весьма правдоподобно, поэтому рекомендую книжку "Полный бред! Скептицизм в мире больших данных".
#AI #ИИ #chatGPT #HR #LLM
SpringerLink
ChatGPT is bullshit
Ethics and Information Technology - Recently, there has been considerable interest in large language models: machine learning systems which produce human-like text and dialogue. Applications of...
🔥12🤯2
Побуду немного цитатником ВК
Автор цитат Оскар Уайльд
Люди в своем большинстве живо интересуются всем на свете, за исключением того, что действительно стоит знать.
Будь собой. Прочие роли уже заняты.
Общественное мнение торжествует там, где дремлет мысль.
Тому, что действительно нужно знать, никто не научит.
Я слышал столько клеветы в ваш адрес, что у меня нет сомнений: вы прекрасный человек!
Автор цитат Оскар Уайльд
🔥13💅9🤡2💯2