Психометрика и психоскептика – Telegram
Психометрика и психоскептика
606 subscribers
33 photos
208 links
Канал создан для обсуждения публикаций, исследований, измерений и теорий в
психологии и других социальных науках. Канал ведут Юлия Тюменева и Юлия Кузьмина
Download Telegram
Цитата 2:

It is tentatively concluded from the present study that memory is not a single unitary mental function or trait which is independent of intelligence, but that the intercorrelations between the memory tests are due to overlapping general or group factors in the variables measured by the tests. The reliable residual correlations between some of the memory tests after the intelligence factors measured by the two intelligence tests are controlled indicate that there may be certain memory functions which are largely independent of intelligence.
Цитата 3:

the experimental study of episodic memory has focused not on the correlations of summary measures across tasks but on developing a detailed understanding of the cognitive processes at work within particular tasks. This work has provided a set of sophisticated measures of recall dynamics, which have only recently begun to inform the individual difference literature. Here we examine individual differences in recall dynamics in an effort to illuminate the correlation between memory and intelligence. We begin by reviewing the dynamics of memory search.

Конечно, существенно расширился математический аппарат, появились новые термины и понятия, но означает ли это, что в научной психологии есть прогресс? Сегодня пост отчасти посвящен этому вопросу.
решила добавить голосование по цитатам. Только просьба пока не смотреть в ответы!:) Итак, как вы думаете, к какому году какая цитата относится? Цитата 1
Anonymous Poll
41%
1931
35%
1952
24%
2014
Предсказание без теории

Недавно у нас был пост про учебную аналитику, где я хотела показать, что анализ поведения с целью предсказания может существовать как самодостаточный, без того, чтобы притягивать за уши какие-то теории. Сейчас встретилась статья Franco и др. (2025), где авторы при помощи обработки естественного языка (NLP) как раз делают полезные предсказания безо всяких теорий.

Статья: Franco, V. R., Baptista, M. N., & Leopoldino, G. A. (2025). Predicting Suicide Using Natural Language Processing of Autobiographical Memory. Archives of Suicide Research, 1–15.

Основная идея авторов - создать объективный и масштабируемый инструмент для оценки риска суицида, основанный на семантическом и эмоциональном анализе автобиографических текстов.

Про автобиографическую память известно, что она объединяет личные эпизодические и семантические воспоминания. При депрессии она часто становится слишком обобщённой и негативной - человек вспоминает не конкретные события, а смутные, безличные эпизоды. Это затрудняет решение проблем, снижает надежду и усиливает риск суицида.

Суицидальное поведение обычно развивается через стадии:
- психическая боль и безнадёжность вызывают мысли о суициде;
- недостаток социальных связей усиливает мысли о суициде;
- появляется тенденция к самоповреждению, переходящая к суицидальному поведению.

NLP может выявлять лингвистические маркеры этих состояний: эмоциональную валентность, уровень конкретности, направленность на будущее и т. д.
В исследовании участвовало 915 человек (55,7% женщин, 18–69 лет, средний возраст 29,8 лет): 39% имели клинический диагноз депрессии, 78% сообщали о суицидальных мыслях, 38% совершали попытки суицида.

Из психометрических инструментов использовался опросник RISC (Suicide Risk Scale), оценивающий разные аспекты суицидальных мыслей и поведения.

Участников просили описать самые важные воспоминания из жизни. Эти автобиографические тексты затем анализировались. Кроме того, авторы сравнили результаты анализа текстов и ответы на вопросы RISC.

С процедурой анализа можно познакомиться в самой статье. Кстати, сами данные и сгенерированный код есть в открытом доступе: https://osf.io/7u2dr/. Я же перейду к результатам.

Модель точно определяла валентность текста (AUC ≈ 0.97), т.е. LLM адекватно различает эмоциональный тон воспоминаний.

Что касается предсказания психических состояний, то депрессия предсказывалась с точностью 63%, суицидальные мысли с точностью 78% и попытки суицида 66%. Совмещение текстовых данных и психометрической шкалы повышало точность предсказаний во всех случаях.

Валентность текста (по LLM) положительно коррелировала со всеми факторами RISC, но наиболее сильно с “отсутствием социальных связей”.

Главный вывод: негативный эмоциональный тон воспоминаний и низкая связанность с другими людьми предсказывают повышенный риск суицида.

Авторы подчеркивают, что NLP позволяет объективно зафиксировать эмоциональные и когнитивные искажения, которые трудно заметить при обычном интервью, а LLM-эмбеддинги (векторы) выявляют скрытые смысловые паттерны, «психологические сигналы», без человеческой интерпретации, уменьшая субъективные ошибки.

Очевидно, что в будущем возможно использование записей интервью или речи, чтобы в реальном времени оценивать риск суицида.

Авторы уверены, что хотя эта технология не заменяет клинициста, но она может подсказать скрытые признаки безнадёжности, социальной изоляции и суицидального поведения.

P.S. Недавно нам пришла рецензия на статью, где рецензент просил буквально «добавить теории». То есть, сама статья по постановке вопроса, дизайну, анализу, практической значимости результатов сомнений не вызвала, но вот теории было маловато.

В итоге в статье не поменялось НИЧЕГО, но были добавлены три теории, в рамках которых «можно объяснить происходящее». Это рецензентов полностью удовлетворило.

Не то, чтобы я насмехалась над этой практикой, но просто…. Ну вот зачем это нужно?
🔥11🤨1
Сегодня наш пост посвящен относительно недавней статье «How Well Can an AI Chatbot Infer Personality? Examining Psychometric Properties of Machine-Inferred Personality Scores» (Fan et al., 2023). В этом исследовании Fan и коллеги пытались ответить на вопрос, могут ли быть оценены личностные черты по итогам беседы с чат-ботом. Точнее, авторы статьи решили проверить, может ли чат-бот воспроизвести структуру классической модели «Большой пятерки» и предсказать индивидуальные различия в чертах личности также, как опросник. Что из этого вышло, читайте в нашем полном посте https://telegra.ph/Mozhet-li-beseda-s-chat-botom-zamenit-testy-11-05
🔥5👍3🤔1
Кот Шредингера в психологии и что с этим делать

На нашем канале мы частенько критикуем психологические теории за их “слабость”, тавтологичность или нефальсифицируемость. Однако есть еще одна особенность психологических теорий — это их способность конструировать феномены, о которых эта теория говорит. Вообще, эту тему мы тоже часто поднимали, только не в отношении теорий, а в отношении психологических конструктов. И откровенно говоря, я совсем не представляла, как с этой проблемой быть: если в процессе изучения (измерения), это изучение само меняет реальность, то как мы можем про эту реальность что-то узнать?

Недавно в журнале “Theory and Psychology” была опубликована статья, которая описывает довольно интересный подход к этой шрёдингеровской проблеме.

Авторы статьи “Петлевой эффект психологических теорий: от аномалии к возможности” (“The looping effects of psychological theories: From anomaly to opportunity”) — Алекс Гиллеспи и Брэди Вагонер — развивают идею философа Иэна Хакинга о “петлевых эффектах” (looping effects): когда научные категории и теории взаимно влияют на тех, кого они описывают.

Собственно с этого начинается статья: “психологические теории не просто отражают поведение — они его изменяют”. Когда люди узнают о теории, она начинает менять их поведение, превращаясь в фактор, формирующий тот самый феномен, который теория описывает. Например, знание о когнитивных искажениях помогает людям их контролировать; знание о техниках убеждения делает нас менее внушаемыми;
знание о метакогнитивных стратегиях повышает эффективность обучения.
Таким образом, теория становится “причиной поведения”, а не только его объяснением.

Вместо того чтобы рассматривать такие эффекты как проблему (аналог «ошибки отражения»), авторы предлагают “встроить петлевые эффекты в само теоретизирование”, превращая их из аномалии в источник возможностей для науки.

Авторы противопоставляют две линии в развитии психологии: естественно-научную (экспериментальную) — стремящуюся к универсальным законам;
и “Völkerpsychologie” Вильгельма Вундта — изучающую психические функции в их историко-культурной изменчивости.

Современная психология, утверждают Гиллеспи и Вагонер, подавила культурно-историческое измерение, тем самым превратив петлевые эффекты в “аномалию”. Но именно они показывают, что психология — не чистая наука о природе, а наука о человеческом становлении во времени.

Авторы предлагают заменить метафору “зеркала” (теория отражает мир) на метафору “инструмента” (теория изменяет мир). С этой точки зрения, хорошие психологические теории — это действенные инструменты, которые: создают новые способы мышления и действия; трансформируют социальную реальность; открывают новые формы саморегуляции, обучения, коммуникации.

Описывая петлевые эффекты психологических теорий авторы вводят 2×2 типологию, располагая эффекты по двум осям:

1. Ослабление теории - Усиление теории. Теория слабеет при распространении (напр., прайминг, внушение); теория усиливается, когда люди начинают ею пользоваться (напр., когнитивная терапия, диагностика, метапознание)

2. Непреднамеренные эффекты теории - Преднамеренные эффекты

В итоге возможны четрые варианта того, как работает петлевой эффект:

Непреднамеренное ослабление:
Люди, узнав о тактиках убеждения, сопротивляются им; пациенты, зная о критериях диагностики, меняют симптомы.

Непреднамеренное усиление:
Знание о когнитивно-поведенческой терапии повышает её эффективность; осознание симптомов способствует их проявлению.

Преднамеренное ослабление:
Обучение распознаванию когнитивных искажений снижает их влияние.

Преднамеренное усиление:
Осознанное использование теорий (метапознание, благодарность, майндфулнесс) улучшает когнитивные и эмоциональные функции.

Ключевой механизм любого из этих эффектов — это осознание теории субъектом, которое запускает рефлексию, агентность и выбор.

Так, человек (группа людей) может принять или отвергнуть теорию, использовать или сопротивляться, распространять теорию или игнорировать. Например, теории, дающие людям инструменты самопонимания и самоконтроля, будут приниматься,
🔥74
использоваться и распространяться, и тем самым укрепляться.

Что такой взгляд меняет для психологическго исследования?

Во-первых, если принять петлевой эффект как источник вариативности, то это объясняет многие методологические проблемы, например, репликационный кризис в психологии.

Во-вторых, в исторической перспективе психология может рассматриваться как динамическая система, где теории и феномены эволюционируют вместе — в непрерывном круге обратных связей.

В-третьих, в исследованиях нужно учитывать осведомлённость участников о теории; предвидеть будет ли эта осведомленность усиливать или ослаблять изучаемый феномен; включать участников в со-творчество знаний (диалогическая методология).

С точки зрения авторов, игнорирование петлевых эффектов делает теории хрупкими и недолговечными. С другой стороны, признание и включение этих эффектов в само теоретизирование позволит создавать более устойчивые, «саморазвивающиеся» теории; усиливать общественную значимость психологии; и двигаться от науки о “предсказании и контроле” к науке о “развитии и расширении человеческой агентности”.

Конечно, статья слишком общая для каких-то конкретных рекомендаций исследователям, она описывает именно новую перспективу, но не тактику действий. И эта перспектива мне нравится.

Единственное, я боюсь, что именно из-за того, что нет “быстрых” тактических рекомендаций, эта перспектива не будет воспринята и канет в лету, как это случалось со многими далекими от практики идеями в психологии. Что вы думате?


Alex Gillespie & Brady Wagoner (2025). “The looping effects of psychological theories: From anomaly to opportunity”, опубликованной в *Theory & Psychology (DOI: 10.1177/09593543251381278) .
🔥75👍4
Сегодня мы продолжим тему использования ИИ в психологии, но немного под другим углом: есть ли польза от психологических моделей и знаний о закономерностях работы мышления, восприятия, внимания для моделирования алгоритмов работы ИИ? Именно такими вопросами задался Gerd Gigerenzer в своей статье «Psychological AI: Designing Algorithms Informed by Human Psychology», вышедшей в 2024 году в журнале “Perspectives on Psychological Science”. Он показывает, что современные сложные алгоритмы, лежащие в основе многих инструментов ИИ, не используют психологические знания (за редким исключением), хотя это может принести пользу. На примерах он демонстрирует как использование знаний о некоторых особенностях человеческого мышления и восприятия (например, эвристика недавности (recency) - тенденция в большей степени опираться на недавние знания при принятии решения), позволяет создавать более простые и точные модели. Подробнее читайте по ссылке
🔥32👍2
Сегодня день преподавателя высшей школы! Поздравляем всех причастных! Держитесь, друзья - вас ждут в аудитории!
🔥13👍3
Критические дебаты о количественной психологии

Полгода назад вышла коллективная монография «Критические дебаты о количественной психологии и измерениях: возрожденные и новые взгляды на фундаментальные проблемы» под редакцией Яны Уер (Jana Uher).

Сначала о редакторе

На нашем канале мы не раз обращались к работам Яны Уер - одной из самых радикальных критиков современной психологии и, особенно, психометрики.

Центральный тезис Уер заключается в том, что психологи не измеряют психические явления в прямом смысле этого слова, а имеют дело с «прокси-данными».
Число, получаемое из ответов опросника — это не «уровень экстраверсии», например, а лишь числовой код для определенного вербального поведения (ответа на вопрос) в конкретной ситуации.
Так что статистический анализ имеет дело не с данными измерений, а с символическими кодами, присвоенными поведению.
Это ставит под вопрос валидность всех выводов, основанных на таких «измерениях».

Уер предлагает исследователям уходить от бесконечных измерений абстрактных черт, а изучать конкретные процессы поведения и их временную структуры.
Например, вместо того, чтобы спрашивать: «Насколько Иван общителен», нужно задавать другие вопросы:
- Как именно проявляется его общительность? (качественное описание поведения)
- В каких ситуациях и как часто это происходит? (контекст и временные параметры)
- С кем он общается и как меняется его поведение с течением времени? (динамика и паттерны)

В общем, Яна Уер призывает психологов-исследователей к тщательному и контекстуальному изучению конкретных поведенческих процессов у реальных людей (и я лично с ней полностью солидарна).

О книге

Ключевая идея этой книги заключается в том, что широко обсуждаемые сегодня недостатки количественных практик в психологии — лишь поверхностные симптомы, тогда как фундаментальные проблемы (например, неприменимость статистических допущений к психическим феноменам) и подлинные первопричины кризисов психологии и споров о ее научном статусе до сих пор почти не затрагивались.

Именно этой теме должны дать новый импульс тексты, собранные в этом издании, включая проблемы неэргодичности и подгонки психометриками результатов под статистические теории, а также идеи о том, психические феномены вообще могут не обладать количественными свойствами, или, что психометрические структуры, выявленные из утверждений опросников, могут быть воспроизведены семантическими алгоритмами без сбора каких-либо эмпирических данных.
8🔥6🥴1
(Продолжение)

Помимо уже известных нам проблем, в книге есть и совсем новые темы и имена.

Например, Christof Kuhbandner и Roland Mayrhofer обсуждают ограничения (как принципиальные, так и практические) получения психологических знаний экспериментальным методом. Они показывают, что базовое допущение экспериментального подхода о снижении сложности явления в экспериментальных условиях и вытекающей отсюда возможности увидеть скрытые закономерности, не выполняется для многих явлений, изучаемых в фундаментальной экспериментальной психологии.

Alex Scharaschkin (нет, не из России, хотя фамилия намекает😊) рассматривает применение нечеткой (fuzzy) логики и математической теории порядка как альтернативу типичным измерениям на примере оценки владения учащимися какой-то предметной областью.

Hanfstingl Barbara, Sandra Oberleiter и др. предлагают способы обнаружения ошибок типа jingle and jangle fallacies - это когда различные психологические феномены ошибочно обозначаются одним и тем же термином, или когда для описания одного и того же феномена используются разные термины, - с помощью технологий обработки естественного языка (NLP).

В общем, книгу можно использовать как своеобразный справочник по основным проблемам количественной психологии и идеям их преодоления.

Если честно, мне было немножко грустно узнать об этом издании – я начала сама писать нечто похожее, но слишком долго раскачивалась 😭.
Теперь вот приходится читать и завидовать.

Книжка есть в открытом доступе:
Uher, J., Arnulf, J. K., & Hanfstingl, B. (2025). Critical debates on quantitative psychology and measurement: Revived and novel perspectives on fundamental problems. Frontiers in Psychology, 16, 1661765.

Я планирую в скором времени написать пост по отдельным ее главам.
14🔥9
Сегодня наш пост вдохновлен другим постом в блоге известного статистика Andrew Gelman (мы уже не раз на него ссылались в наших постах). История, которая обсуждается там, достаточно интересная с разных точек зрения. И с точки зрения подходов к анализу данных, и с точки зрения организации образовательного тестирования, и с точки зрения policymakers.
Это пост посвящен обсуждению так называемого «Чуда в Миссисипи» - достаточно резкого роста баллов школьников этого штата по результатам теста NAEP (National Assessment of Educational Progress) по чтению. Одни исследователи объясняют такое улучшение результатов внедрением новой образовательной политики на уровне штата, другие связывают улучшение результатов с изменением политики отбора в выборку тестируемых, третьи считают, что возрастание может быть связано с изменением содержания школьных тестов, которые тренируют решать определенный тип заданий, включенных в NAEP.
Сегодня мы рассмотрим эту историю подробнее. Кажется, что она выходит за рамки и обсуждения результатов теста в одном конкретном штате другой страны. Это история о том, в какой степени можно доверять результатам образовательных тестов и о том, что необходимо учитывать при интерпретации результатов. А еще об ответственности, которая лежит на исследователях и статистиках при анализе и публичном обсуждении результатов. Подробности читайте в нашем полном посте.
🔥8
Сегодня мы продолжим обсуждать некоторые парадоксы и любопытные эффекты, возникающие в процессе анализа данных. Вообще, в статистике известно немало парадоксов: ситуаций, когда интуитивные ожидания или привычные методы приводят к, казалось бы, противоречивым выводам. В предыдущих материалах мы уже обсуждали, например, парадокс Симпсона, когда агрегированные данные демонстрируют противоположный эффект по сравнению с тем, который наблюдается при анализе отдельных групп.

Еще один важный пример — Jeffreys–Lindley paradox. Он показывает фундаментальное расхождение между двумя парадигмами: частотной (той самой, где мы обычно полагаемся на p-value при проверке статистических гипотез) и байесовской. Формальная формулировка парадокса появилась в 1957 году, когда Деннис Линдли опубликовал в журнале Biometrika статью “A statistical paradox”. В ней он показал, что по мере увеличения размера выборки частотный анализ может уверенно отвергать нулевую гипотезу (p-value стремится к нулю), тогда как Bayes factor, рассчитанный на тех же данных, начинает все сильнее поддерживать эту самую нулевую гипотезу.

Однако, как показывает новая статья в журнале Biometrika (2025) под названием The Bayes factor reversal paradox (Miodrag M. Lovric), парадоксальность статистических выводов не ограничивается различиями между парадигмами. Автор работы описывает другой парадокс, называемый Bayes Factor Reversal (BFR) paradox. В этом случае противоречие возникает уже внутри самой байесовской парадигмы, причем при полностью реалистичных размерах выборки.

Суть нового парадокса такова: при проверке гипотезы о среднем нормального распределения с известной дисперсией существует особое значение дисперсии априорного распределения, называемое flip point. До этой точки Bayes factor поддерживает альтернативную гипотезу, а после нее поддерживает нулевую. При этом данные и модель остаются неизменными. Меняется только масштаб априорного распределения, и этого достаточно, чтобы вывод байесовского анализа развернулся в противоположную сторону.

Подробнее читайте в нашем посте.
🔥54👍4
Некоторые наблюдения над некоторыми авторами…

На нашем канале мы уже упоминали Дэвида Трафимова (David Trafimow) – главного редактора журнала Basic and Applied Social Psychology, который в свое время запретил использовать в этом журнале p-value в качестве статистики для поддержки гипотезы.
Статьи этого исследователя часто касаются вспомогательных допущений и того, что их необходимо эксплицитно формулировать и учитывать при планировании эмпирических исследований и интерпретации их результатов.
На примерах из реальных исследований Трафимов показывает, как эти допущения встраиваются в исследовательский процесс и влияют на оценку эмпирических данных.

Вспомогательное допущение связывает ненаблюдаемый конструкт и эмпирически фиксируемое поведение. Например, вы предполагаете, что, если изменить отношение человека к курению, он, возможно, бросит курить. Для изменения отношения вы хотите использовать определенный фильм, а для оценки поведения - частоту курения. В результате вы хотите, чтобы после просмотра “анти-табачного” фильма частота курения уменьшилась. В этом случае вам необходимо еще как-то удостовериться, что после просмотра фильма поменялось отношение к курению, а не просто человек начал курить меньше.

Кроме того, фильм может повлиять не только на отношение человека к курению, но и на его настроение, и именно оно, а не отношение к курению, может в итоге повлиять на поведение человека. Так что вам нужно еще как-то оценить изменение в настроении. Помимо этого, нужно иметь в виду, что опросник может не уловить изменение отношения, что сам опросник может повлиять на поведение, и т.д.

Недавно мне на рецензию прислали статью, основанную на этих работах Трафимова. Это дало мне повод их перечитать, и в результате у меня возникло два вопроса.


Первый вопрос: чем все эти «вспомогательные допущения» отличаются от классической проблемы эмпирических исследований – так называемого третьего фактора и альтернативного объяснения? Экспериментатору нужно убедиться, что манипуляция воздействует на независимую переменную и только на нее, что связь независимой и зависимой переменной не опосредуется какими-то другими, неконтролируемыми переменными, что измерение достаточно чувствительно к тому, к чему должно быть чувствительно, и не чувствительно ко всему остальному, и пр.

По сути, Трафимов пишет именно об этих проблемах, но только называет их «вспомогательными допущениями» и настаивает на том, что многие результаты в психологии можно было бы интерпретировать по-другому, учти исследователи эти допущения.

Я вовсе не против того, чтобы напоминать исследователям о необходимости тщательного продумывания экспериментов.
Но почему это нужно подавать как новую мысль, давать этому отдельное название, писать об этом статьи, а не в учебники, например, где полноценному обсуждению этой проблемы самое место?
Почему сам Трафимов не упоминает сходство его «вспомогательных допущений» с «третьими факторами» и «альтернативными объяснениями»? Почему при большом количестве цитирований его работ никто не указывает на другие, более известные названия тех же проблем?
3🔥2
Второй вопрос, возникший у меня после прочтения статей о «вспомогательных допущениях», касается невозможности их проверки в психологии и, вообще, в социальных науках. Невозможность проверки обусловлена не только отсутствием у социальных исследователей возможностей контроля над миллионом шумящих «третьих факторов» (об этом очень хорошо написано у Густава Трендлера; мы тоже как-то упоминали его), но еще и тем, что мы не можем узнать о психологическом (установках, тревожности, мотивах и пр.) никаким иным образом, кроме как спросив так или иначе об этом самого человека.

Без независимого доступа к проверяемым объектам, мы можем проверять допущения только через другие допущения. Изменение отношения к курению узнаем через опросник, опросник проверим через другой опросник или через интервью, и т.д.

Об этом написано уже немало, и мой вопрос связан именно с этим: если автор (а тем более редактор!) пишет о проблемах методологии в психологии, почему он не рассматривает свои вопросы в контексте более широкой дискуссии? Ни Trendler, ни Michell, ни Uher, ни Borsboom, ни Molenaar, ни Lamiell не упоминаются…

Я помню, что вопросы о связи своих идей с идеями других авторов (так называемый «более широкий контекст») – это самые частые вопросы, которые я получала от рецензентов, когда публиковала свои статьи. Но в случае Трафимова, почему-то, этого нет.

В общем, такие мысли.

P.S. Один вариант ответа мне подсказали: Трафимов так себя ведет, потому что он опытный и известный. И ему все можно:)

Но в это как-то грустно верить; тем более, что в переписке он показал себя с хорошей стороны.

Поэтому может есть другие варианты? Что думаете?
🔥81
Чужая душа - потемки, или как заставить респондентов понимать вас “правильно”


Этот пост посвящен работе группе авторов M. Panayiotou, J. Razum, G. Eisele, и др. “Проблемы интерпретации инструкции опросника Patient Health Questionnaire” недавно опубликованной в журнале JAMA Psychiatry. Эта работа будет особенно интересна коллегам, которые занимаются разработкой или адаптацией опросников, т.е. работают на стыке между психометрикой и психологией.

Цель, которую преследуют авторы - выяснить, что отражают ответы на вопросы одного из самых популярных опросников по депрессии - Patient Health Questionnaire (PHQ): частоту симптомов или степень того, насколько симптомы беспокоят человека.

Дело в том, что в этом опроснике инструкция апеллирует к «беспокойству, вызываемому симптомами», а варианты ответов сфокусированы на частоте симптомов. Согласитесь, это довольно распространенная ситуация для психологических опросников.

В этом исследовании участники (выборка из общей популяции взрослых, а также клиническая выборка пациентов с умеренной и высокой выраженностью депрессии) заполняли PHQ-8, после чего оценивалась их интерпретация опросника при его заполнении. Для оценки интерпретации исследователи задавали три вопроса респондентам:
(1) как они ответили бы на утверждение PHQ о сне в гипотетической ситуации, когда они бы спали очень долго почти каждый день, но при этом чувствовали бы себя комфортно;
(2) основывались ли их предыдущие ответы в PHQ на частоте симптомов, на том, насколько симптомы их беспокоили, или на обоих этих аспектах;
(3) как они отвечали бы на PHQ в будущем, исходя из тех же трёх вариантов.

Результаты показали, что в гипотетическом сценарии с избытком сна лишь половина участников из общей популяции, и 15% из клинической выборки интерпретировали PHQ в соответствии с инструкциями (то есть как частоту, с которой проблемы их беспокоили).
На вопрос о том, как они фактически отвечали на PHQ, только пятая часть участников из общей популяции и 11% из клинической выборки участников интерпретировали инструкции так, как задумывали авторы опросника; и лишь 22% (общая популяция)) и 10% (клиническая выборка) сообщили, что стали бы отвечать так, как задумывалось авторами опросника, в будущем, что указывает на стабильность их личной интерпретации. Кроме того, текущее исследование показало, что валидность PHQ-8 варьирует в зависимости от того, как участники интерпретируют его инструкции.

Выводы исследователей ставят под сомнение валидность PHQ как для научных исследований, так и для клинического принятия решений.

От себя я добавила разбор типичных примеров утверждений для всех версий PHQ и мой анализ источников проблемы, о которой пишут авторы. Также я сравнила PHQ с его альтернативами (BDI-II, CES-D, PROMIS), просто, чтобы понять, есть ли “беспроблемные” шкалы депрессии (спойлер: нет).

Ссылка на статью: Panayiotou, M., Razum, J., Eisele, G., Wang, S. B., Fried, E. I., & Cohen, Z. D. (2025). Interpretation Issues With the Patient Health Questionnaire Instructions. JAMA psychiatry.
5🔥3
Дорогие подписчики и читатели нашего канала!

Сегодня последний пост в этом году, и по традиции мы подводим итоги уходящего года.

Этот год был для канала временем изменений. У нас стало меньше авторов, но больше подписчиков, что, конечно, очень радует (увеличение подписчиков, а не сокращение числа создателей контента). Канал сменил название, чтобы лучше отражать изменения в содержании. Теперь мы называемся «Психометрика и психоскептика».

За год на канале вышло 47 публикаций. В реальности их было немного больше, но несколько постов, объединённых общей темой, мы считали за один.

Перед Новым годом принято не только оглядываться назад, но и смотреть вперёд, ставить цели и давать себе обещания. То, что в англоязычной традиции называют New Year resolutions. Вот и мы хотим пообещать самим себе продолжать делать интересные посты, искать хорошие исследования и рассказывать вам о них. Надеемся, что в следующем году сможем сделать больше публикаций и привлечь новых читателей и подписчиков.

Кстати, о новогодних обещаниях! Вопреки распространённому скепсису, они вовсе не бессмысленны. Это показывают и данные исследований.
Например, в статье Oscarsson, Carlbring, Andersson и Rozental (2020) представлены результаты масштабного лонгитюдного исследования, в котором приняли участие более 1000 человек (Oscarsson, M., Carlbring, P., Andersson, G., & Rozental, A. (2020). A large-scale experiment on New Year’s resolutions: Approach-oriented goals are more successful than avoidance-oriented goals. PLoS One, 15(12), e0234097).

Авторы изучали, какие новогодние обещания люди дают себе и как они оценивают успешность их выполнения в конце года. Интересно, что чаще всего в новогодних обещаниях люди говорили о довольно “приземлённых” вещах. На первом месте были обещания, связанные с физическим здоровьем (около трети всех целей). Это были обещания больше двигаться, заниматься спортом и улучшить общее самочувствие. Далее шли цели, связанные со снижением веса и питанием. Чуть реже участники упоминали личностный рост, психическое здоровье и сон, а также изменения в работе, учёбе и повседневных привычках. При этом тематика цели сама по себе почти не влияла на то, насколько вероятным считает человек ее достижение.

Участников случайным образом распределяли в три группы, которые различались уровнем поддержки.

Первая группа получала только краткую общую информацию о традиции новогодних обещаний и проходила три контрольных замера за год, в конце января, в июне и в декабре. На этих этапах участников просили оценить, в какой степени они придерживаются своих обещаний.

Вторая группа получала умеренную поддержку. Участникам объясняли роль социальной поддержки и просили назвать одного конкретного человека, друга, партнёра или родственника, который будет поддерживать их в достижении цели в течение года. Кроме того, участники проходили ежемесячные follow-up-опросы, всего 12 раз в течение года. Эти опросы представляли собой короткие самоотчёты, где участников просили оценить, насколько они придерживаются своего новогоднего обещания, по шкале от 0 до 100 процентов, а также, за исключением последнего замера, насколько они верят в свой будущий успех. Один раз участникам также присылали письмо с информацией и упражнениями о том, как справляться с трудностями и временными срывами.

Третья группа получала всё то же самое, что и вторая, но дополнительно участников обучали более четкой постановке целей. Их просили формулировать цели конкретно и измеримо, с временными рамками и в позитивном, направленном на достижение формате. Также их просили разбивать цели на промежуточные шаги и они получали несколько дополнительных писем и упражнений, посвящённых мотивации, самоконтролю и работе с негативными мыслями.
4🔥3👍1
Через год около 55% участников считали себя успешными в следовании своим новогодним обещаниям. Однако важнее оказался не сам факт обещания, а то, как именно была сформулирована цель. Люди, которые формулировали цели в позитивном формате, через то, к чему они хотят прийти, например «чаще заниматься спортом» или «регулярно писать тексты», оценивали себя значительно успешнее тех, кто формулировал цели через запреты и избегание, например «не прокрастинировать» или «не есть сладкое».
Не менее интересным оказался и эффект поддержки. Лучше всего оценивали эффективность следованию своим новогодним обещаниям участники из группы с умеренной поддержкой, где были ежемесячные напоминания в виде самоотчётов и хотя бы один поддерживающий человек, но не было жесткой структуризации целей. А вот в третьей группе (с дополнительной структуризацией целей, подробными инструкциями и усиленным контролем) результаты не отличались от группы без поддержки. Похоже, что слишком много контроля и требований «делать правильно» может мешать, а не помогать.
Если подводить итог, то вывод получается довольно обнадёживающим. Новогодние обещания могут работать (по крайней мере, с точки зрения самих участников)!
Так что давайте писать новогодние обещания, опираясь на данные научных исследований: формулировать цели в позитивном ключе, не заморачиваться с излишней их конкретикой, а потом следить, чтобы никто на нас излишне не давил и не контролировал. И тогда все должно получиться!😊

Спасибо, что читаете нас и остаётесь с нами.
Увидимся в новом году! Счастливого Нового года!
16🤗3🎄1