ComputAgeChannel – Telegram
ComputAgeChannel
393 subscribers
28 photos
2 videos
20 files
36 links
The community of computational aging researchers.

A channel for sharing seminars, materials and thoughts of ComputAge participants.

Link to a big chat: https://news.1rj.ru/str/agingmath
Our website: https://computage.org
Download Telegram
Post::
by Dmitrii Kriukov


Тернистый путь к теории старения.

Много было сломано копий в попытке написать единую теорию старения, в результате чего наплодилось их свыше нескольких сотен. Такое их разнообразие, по видимому, оказалось возможно, потому что разные авторы используют различные критерии того что они бы назвали «хорошей» теорией. Под «хорошей», в рамках этого текста, будем понимать такую теорию, которая бы могла объяснить некоторый набор, важных для этой науки, экспериментальных (или натуралистических) наблюдений. Следовательно, то, какие эксперименты решает объяснить ученый в рамках своей теории, а какие считает несущественными, решает он сам. Это не означает, что консенсусу не бывать. Если на секунду предположить, что старение является универсальным феноменом единообразно действующим на 100% людей или даже 100% млекопитающих (а при более широком рассмотрении и на 100% хордовых), то легко предложить критерий «хорошести» теории:

Способность объяснять различия в продолжительности жизни различных видов.


Из современной литературы мы, в общем, действительно можем видеть, что этот критерий является до некоторого рода консенсусом среди ученых. Есть статьи по сравнительной биологии старения различных животных. Успехи в некоторых интервенциях против старения: ограничение калорий, рапамицин и т.д. до некоторой степени транслируемы между различными видами. Я думаю найдется мало ученых готовых всерьез утверждать, что старение мыши не имеет ничего общего со старением человека - такое предположение было бы весьма маргинальным и потребовало бы сверхусилий по его обоснованию. Поэтому договоримся, хотя бы в рамках этого поста, считать этот критерий справедливым. Но тогда мы немедленно приходим к следующему довольно хорошо (даже математически строго) поставленному вопросу: какие биологические признаки (или биомаркеры), обнаруживаемые в разных видах, могли бы объяснить их различия в продолжительности жизни?

Короткий жест над поисковой строкой немедля принес в мои руки следующую публикацию «A genomic predictor of lifespan in vertebrates» []. Сейчас поведаю ее суть.

Наши австралийские коллеги сделали крайне простую вещь:
- Выгрузили данные о максимальной продолжительности жизни (МПЖ) различных видов из AnAge.
- Скачали собранные геномы 252 различных хордовых из NCBI.
- Выравняли эти геномы на человеческие промоторы генов из Eukaryotic Promoter Database (EPD) с помощью BLAST.
- На 42 хорошо выравнявшихся промоторах посчитали плотность CpG динуклеотидов (в окне -500..100 вокруг TSS).
- Обучили линейную регрессию на CpG-плотности промоторов предсказывать МПЖ.
- Получили R2 = 0.76 на тестовой выборке (см. первую картинку).


Чего? А так можно было? 76% дисперсии кросс-видовой МПЖ объясняется… плотностью CpG в консервативных промоторах???
Вот это да!

Лично у меня отвисла челюсть. У нас тут десятилетиями разгорается дискуссия о том что такое старение, а коллеги берут и делают работу, которую за 4 месяца с нуля способен сделать первокурсник магистратуры ФББ МГУ или Сколтеха и объясняют 76% дисперсии МПЖ. Гениально!

Здесь хотел бы донести некоторую глубину того что на самом деле произошло. Некоторое время назад было высказано коллективное мнение, что нам необходима феноменологическая теория старения. Ну так вот она: линейная регрессия на 42 промоторах объясняющая 76% МПЖ - чем вам не феноменологическая теория? А может какая-то другая теория сделать также? Но кроме того, если удалить из датасета все виды кроме млекопитающих, то этот процент вырастает до 91%.
👍4🔥1
Разумеется с моей стороны было бы преступным не пойти и не посмотреть, а что это там за гены такие, промоторы которых оказываются столь важными для предсказания МПЖ? (Специально для вас препроцессировал табличку с этими генами и корреляцией Пирсона между плотностью CpG в промоторах и МПЖ.) Сходу ничего не понятно. Попытка вставить в GO enrichment или StringDb тоже не приводит к каким-то значимым обогащениям. Небольшой раунд общения с o3 показал, что некоторые из генов отвечают за репарацию ДНК, некоторые за аутофагию, некоторые за подавление раков - единой картины нет. Что ж, тогда надо гуглить дальше, а кто цитирует эту статью? Оказалось, что попытка объяснить явление механистически уже была дана в другой статье 2020 года: Is CpG Density the Link between Epigenetic Aging and Lifespan? - которая является коротенькой но довольно внятной.
Сейчас поведаю ее суть.

Наши американские коллеги, некоторое время вдохновлявшись сиртуинами, поликомбами и (пресловутыми) эпигенетическими часами, поведали следующее:
- Все эти гены с богатыми на CpG промоторами на самом деле являются так называемыми «генами развития», очень важными для жизни клетки.
- Вокруг CpG богатых регионов часто тусят дислоцируются комплексы ремоделирования хроматина. Они включают в себя белки поликомба и сиртуины (и еще кучу всего).
- Если в ДНК клетки происходит двухцепочечный разрыв, то вся эта компания рекрутируется в место разрыва, оставляя CpG регионы открытыми для метилтрансфераз (и деметилаз). После устранения разрыва, компания возвращается.
- Однако, метилтрансферазы имеют ограниченную "мощность" и успевают поменять метилирование лишь на небольшом количестве CpG сайтов, не успевая поменять их все до возвращения поликомба и его друзей.
- Поэтому чем больше у гена CpG сайтов в промоторе, тем сложнее ему навалить шума изменить экспрессию, посредством изменения эпигенетического контекста в промоторе (см. вторую картинку).
- В итоге оказывается, что чем больше у данного вида CpG сайтов в промоторах генов важных для развития, тем более устойчив этот вид к, так называемому, «эпигенетическому шуму» (хотя этот термин мне не нравится).

Итог.
Небольшое расследование выше приводит нас к довольно интересному и даже, осторожно замечу, оптимистичному выводу. У нас прямо под носом уже 5 лет лежит весьма неплохая феноменологическая теория старения, объясняющая 76% межвидового МПЖ. Эта теория уже даже и не особо феноменологическая, поскольку имеет неплохую механистическую интерпретацию через гены развития и ремоделеры хроматина. Никакие мои попытки нагуглить набор биомаркеров, способный столь же хорошо объяснять МПЖ в разных видах не привели к успеху. (Была только статья Хорвата про связь среднего метилирования CpG и МПЖ, но это в ту же степь и я еще не до конца разобрался с ней.) Конечно, нужно помнить, что есть и другие критерии, которым должна удовлетворять «хорошая» теория старения. Полный перечень этих критериев потребует еще десятки часов холиваров в чатах или воркшопов на научных конференциях. Но пока фиксируем то что есть. Межвидовой МПЖ лучше всего объясняется эпигенетикой. Других столь же успешных теорий в свете объявленного выше критерия нет.
3👍3
Критика.
Куда без нее… В целом этот результат не противоречит накопленной интуиции, хотя авторы первой статьи не выложили исходные данные для воспроизведения результата. Письмо авторам уже направленно. Немного напрягает, что статья попала в Scientific Reports, хотя явно достойна Nat. Com. - впрочем, не мне судить. Жаль, что мы не видим комментариев рецензентов. В пользу результатов статьи говорит и результат вскользь упомянутой уже статьи Хорвата, которая в некотором смысле воспроизводит исходный. Биологическая трактовка данная во второй статье тоже не без вопросов. Сказано про увеличение плотности CpG в генах развития, но среди упомянутых 42 генов есть не только гены развития (см. табличку), но и многие другие с не очень понятной функцией, у трети из них плотность CpG наоборот падает с увеличением МПЖ - это явно нужно до-объяснить. Также нужно до-объяснить как именно метилтрансферазы и деметилазы буйствуют в отсутствие поликомба и его друзей - механизм не раскрыт. 76% дисперсии это очень хорошо, но не идеально. Жаль авторы не завели в качестве признака массу или скорость метаболизма животных, хорошо известно коррелирующих с МПЖ.
👍1
Первая картинка
Вторая картинка
processed_tableS2.xlsx
22.6 KB
Табличка для искушенных темой
Channel photo updated
Post::
by Dmitrii Kriukov


Продолжаем искать теорию старения - теперь в метилировании.

Предсказывать максимальную продолжительность жизни (МПЖ) животных можно не только на основе характеристик генома. В предыдущем посте я упоминал [статью] Стива Хорвата про связь среднего уровня метилирования CpG сайтов и МПЖ. Я наконец разобрался с ней и хочу поведать о том что увидел. Хорват конечно противоречивая фигура. Имея Хирш 151 (scholar), он умудряется соединять в себе: 1) потрясающий организаторский гений, проводя масштабные геномные исследования, объединяя людей в консорциумы для сбора датасетов и создания публикаций; 2) преступную халатность в отношении биоинформатических подходов к анализу данных, порождая антинаучные спекуляции, и манипулируя результатами анализа - начиная со времен эпигенетических часов (часов Хорвата), я бы сказал, его методология это пример того как делать не нужно. Новая статья не стала исключением. Разберемся подробнее.

Датасет.
Он прекрасен, но это не заслуга этой статьи, это заслуга [Mammalyan Methylation Consortium] - множества ученых объединенных идеей оцифровки эпигенетики млекопитающих. 15 тысяч образцов, 36 тысяч консервативных сайтов метилирования, 348 млекопитающих (25 таксономических порядков), 59 типов тканей. Все это хорошо предобработано, и лежит в открытом [доступе]. Качается за 30 минут, при помощи пары команд. Одним словом, прелесть. Преклоняюсь перед организаторским гением, который смог убедить такое количество людей внести вклад в open science.
3🔥1
Результаты (часть 1).
Статья начинается с интересного, хотя и довольно ожидаемого результата: точность предсказания пола животного по метилому = 98.5%. Это неудивительно, если вспомнить, что обогащение метильными метками на X хромосоме само по себе хорошо разделяет классы и не требует сложной классификационной модели под капотом. Тоже самое авторы проделали с видом животного, типом ткани, из которой клетки шли на секвенирование и таксономическим порядком - везде точность оказалась >98%. Увы, на этом хорошие результаты заканчиваются и начинаются странные вещи. Далее авторы предсказывают собственно МПЖ, сообщая нам коэффициент корреляции, в качестве метрики точности r=0.89 (рис. 1), посчитанный методом Leave-One-Species-Out (тоже что LOO, если вы знаете что это). Сам по себе этот результат позволяет довольно однозначно заключить:
паттерн метилирования ДНК действительно содержит информацию о максимальной продолжительности жизни.

Вот только не понятно, это потому что метилирование ДНК кодирует также филогенетические расстояния между видами или это независимый признак? Казалось бы, естественным продолжением было бы включить филогению в анализ, как ковариат или как предположение о неравномерном сэмплировании. Последнее можно сделать с помощью метода под названием [PGLS regression] - настолько известного в эволюционной биологии, что не знать о нем кто-либо из 17 авторов статьи просто не мог. Однако, авторы этого не сделали. Зато авторы дискредитировали свой результат показав картинку (рис. 2), на которой явно видно, что предсказывать МПЖ вида, можно просто по ближайшему, по эволюционному древу, соседу (1-NN) с практически той же точностью. В итоге, этот момент мне остался не понятен. Действительно ли метилирование CpG сайтов предсказывает МПЖ и может служить (при некотором уровне наглости высказывания) детерминантом МПЖ у животных, или же это просто новый способ «закодировать» филогению? (пишите в комментарии если что-то про это думаете, отныне они открыты).
🔥21
Результаты (часть 2).
Прежде чем обсудить оставшиеся полстатьи результатов. Прошу обратить внимание на Рис. 3. Вы видите синие точки, через которые проходит плоскость. Эта плоскость - простой пример той самой модели множественной линейной регрессии для случая двух ковариат. Видим что модель хорошо обучена и позволяет предсказывать значение y для синих точек визуально неплохо. Однако, в этом же пространстве я нанес красную точку, которая явно не принадлежит распределению синих точек, то есть Out-Of-Distribution или просто OOD. Как видно, корректно предсказать значение y этой красной точки у модели не получится В современном машинном обучении с примерами OOD предсказаний многие из нас, я надеюсь, уже сталкивались. Галлюцинации больших языковых моделей хороший пример OOD предсказаний. Когда модель пытается предсказывать значение для чего-то сильно отличающегося от ее тренировочной выборки, доверять такому предсказанию решительно нельзя, поскольку такое предсказания будет ненадежным (мы про это даже [статью] написали). Инженерам машинного обучения это понятно издревле. Хорват и его коллеги не могут прийти к этой идее как минимум уже 12 лет (да, это было даже в первой статье про часы Хорвата).

Последующие результаты, охватывающие половину текста статьи в журнале Science Advances, к моему горькому сожалению, OOD предсказания. Что ж, давайте вкратце пробежимся по ним.
- Рис 4. Различия в МПЖ разных полов. Исходно модель не имела информации о различиях в МПЖ полов и сгенерировала результаты с большой дисперсией, каждому из которых доверять не приходится в силу описанных выше причин. И хотя формально проверить точность предсказаний можно на основе опубликованных данных - авторы этого не делают.
- Рис 5. Различия в МПЖ мышей под различными интервенциями. Исходно модель не имела информации о каких-либо различиях в МПЖ мышей. Например, модель предсказала, что мыши с нокаутом рецептора гормона роста живут дольше, хотя не метилирование не во всех тканях указывает на это консистентно. И хотя результаты на самом деле можно было проверить, сопоставив предсказанный эффект с наблюдаемым, такого сопоставления проведено не было. Но хотя отрицательный результат не спрятали.
- Рис 6. Различия в МПЖ репрограммирующихся фибробластов человека. Как раз в нашей [статье] мы детально объясняли на этом же примере, почему такие «предсказания» - фуфло. Предсказывать что-то в репрограммировании с помощью каких-либо часов старения или часов МПЖ, вопиющий пример спекуляций на OOD предсказаниях. Доверия к этому никакого. Хуже всего то, что в данном случае правильность предсказаний еще и никак не проверить - результат нефальсифицируем и, следовательно, не является научным.
- Рис 7. Различия в МПЖ для людей из различных когортных исследований. Та же история, что с мышами, модель не учила никакой вариации на ПЖ людей, ожидать, что она будет давать научные находки - наивно. К слову, на рисунке можно видеть ситуацию, что человек, которому 46 лет имеет МПЖ 22 года - абсурд. Кстати, между полами и расами различий в МПЖ также не нашлось. Возмущает еще то, что в этих датасетах присутствует информация о смертности людей и, строго говоря, можно было посчитать точность предсказания в формате ROC AUC или Concordance Index. Авторы этого не сделали.
- Рис 8. Различия в МПЖ у собак различных пород. История похожая на людей и мышей, модель не учила вариацию на собак, но от модели ожидается, что модель эту вариацию «поймает». Известно что породы крупных собак живут в среднем меньше чем маленькие собаки, однако даже эту зависимость поймать не удалось (r=0.03).
3🔥1
Итог.
- Вторая половина статьи - бессмысленна, методологически некорректна.
- Первая половина статьи спорна, но интересна для обсуждения. Действительно ли уровень метилирование в консервативных среди млекопитающих CpG может служить детерминантом максимальной продолжительности жизни или это хитрый способ закодировать филогенетические расстояния?
- Совершенно ясно одно, метилирование ДНК действительно коррелирует с МПЖ, и проходить мимо этого нельзя, нужно разбираться.

Статья вполне претендует на хрестоматийный пример того, как нельзя заниматься биоинформатическими исследованиями, генерируя OOD предсказания и спекулируя над пустыми результатами.
🍌1
Рис 3
Рис 4-8
Ну наконец, наш Бенчмарк эпичасов закрепился зазернился в катарсисе и получил DOI сборника конференции KDD2025 (A*), то есть, официально опубликован!

ComputAgeBench: Epigenetic Aging Clocks Benchmark
doi: https://doi.org/10.1145/3711896.3737382
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥223
Neurophysiologically Realistic Environment for Comparing Adaptive Deep Brain Stimulation Algorithms in Parkinson's Disease

Our team’s latest paper, presented at the top-tier KDD 2025 (A*) conference, focuses on Parkinson’s disease and developing stimulation algorithms to mitigate symptoms such as tremor, bradykinesia, and freezing of gait.
Parkinson’s symptoms can be effectively reduced with deep brain stimulation (DBS) — an electrode implanted in the basal ganglia delivering ~150 Hz pulses.
Adaptive DBS (aDBS) goes a step further by adjusting the stimulation pattern in real time for greater effectiveness 🌝

Insights:
📍 Current state-of-the-art aDBS algorithms are overly simple. Novel machine learning methods are rarely applied, and clinicians seldom use aDBS in practice due to the lack of testing tools.
📍 The dynamics of pathological neural activity can be approximated by a simple coupled-oscillator model — the Kuramoto model — which can be used to train machine-learning-based aDBS algorithms.
📍 Brain activity is highly non-linear, stochastic, and non-stationary — advanced ML methods must account for this complexity.
📍 Reinforcement learning (RL), which optimizes a reward function through interaction with the environment, is well-suited for mitigating PD symptoms. To support RL research, we developed our model as an easy-to-use Gymnasium environment, called DBS-Gym.

🧠 Thoughts:
Although Parkinson’s disease is not a normal part of aging, but the same tools could be applied to modulate brain dynamics in healthy aging. Brain stimulation is a broad and promising area of neuroscience that can potentially support cognitive function in the aging brain.

📜paper

🖥code
💬community
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥61