ComputAgeChannel – Telegram
ComputAgeChannel
393 subscribers
28 photos
2 videos
20 files
36 links
The community of computational aging researchers.

A channel for sharing seminars, materials and thoughts of ComputAge participants.

Link to a big chat: https://news.1rj.ru/str/agingmath
Our website: https://computage.org
Download Telegram
Если вы, как и я, знали что-то о часах старения и считаете это довольно занимательной безделушкой в руках учёных, которые (лишь иногда) могут принести пользу, то настоятельно рекомендую вам окунуться в статью 2006 года: A new approach to the concept and computation of biological age за авторством Petr Klemera & Stanislav Doubal.

Статья эта стала для меня внезапной отрезвляющей пощёчиной, относительно моих наивных представлений относительно того, что (действительно) серьёзные ученые называют биологическим возрастом. Читая более современных авторов вы в лучшем случае увидите что-то типа biological age refers to epigenetic alteration and DNA methylation which express on how able and functioning a person is and whether a person has diseases related to old age [link]), а чаще всего не увидите определения вовсе [link]. В обсуждаемой же статье обсуждается несколько определений биологического возраста:

Биологический возраст - мера, выражающая "глобальное состояние" стареющего организма лучше чем это делает его хронологический возраст.

Биологический возраст - возраст, соответствующий (или предсказывающий) "ожидаемой продолжительности жизни" лучше чем ей соответствует хронологический возраст.

Авторы, ссылаясь на критику приведенных выше определений, сходятся на следующем более осторожном и более общем определении, которое будет рабочим в этой статье:

Биологический возраст - число, которое получается при применении некоторого алгоритма к множеству возраст-зависимых переменных (биомаркеров). - Данное определение немного удивляет своей абстрактностью, но вполне отражает техническую суть происходящего.

Далее приводятся 4 общих предположения, из которых следует вполне конкретная математическая модель биологического возраста

1) Старение - естественный процесс проявляющий себя в изменении многих свойств живых организмов. Скорость этого процесса заметно различается между видами и куда менее различается внутри вида.
2) Различия в биологическом возрасте индивидов соответствуют их различиям в уровне старости. При этом мат. ожидание биологического возраста по возрастному срезу популяции (например всех 60-летних) равно хронологическому возрасту среза (60 лет). При этом дисперсия биологического возраста вполне может расти с ростом хронологического возраста.
3) Любое измеримый параметр человеческого организма, который систематически изменяется с хронологическим возрастом, подвержен влиянию на него процесса старения, и, потому, может служить биомаркером старения.
4) Траектория изменения биомаркера старения изменяется не только под действием биологического возраста индивидуума, но и под действием иных случайных факторов.

Происходящее далее может показаться бездушным математическим монологом на тему линейных регрессий. На самом же деле, это сдвиг парадигмы в машинном обучении! А именно, это что-то вроде нового способа ансамблирования одномерных моделей. Если вкратце, то алгоритм можно описать так: Пусть дан датасет X, y, где X из m фичей и n наблюдений (например общий анализ крови), а y - наблюдаемый хронологический возраст. Тогда:

1) Обучите m линейных моделей, каждую для каждой фичи в датасете, где каждая линейная модель будет предсказывать свою фичу X_j как функцию от y.
2) Для каждого нового сэмпла X_i (вектор, где значения это параметры крови) решите следующую задачу оптимизации: Sum_j (X_ij - f_j(y))
Чтобы лучше понять происходящее - внизу картинка из статьи с геометрической интерпретацией: все фичи в датасете параметризуются параметром y (на картинке y=t) (да, да, он же возраст, но он же и параметр). Далее для каждого нового сэмпла, являющегося точкой (X_i) в пространстве фичей, нужно найти кратчайшее расстояние до прямой линии, запараметризованной через y. Точка где перпендикуляр от X_i коснётся прямой и является ответом (на картинке y=t). Ну и наконец вот вам биологическая интуиция происходящего: вам нужно найти такой возраст y, который бы лучше всего объяснил возрастные изменения в наблюдаемых фичах.

Что меня ещё более поразило, так это то, что уже абстракте статьи автор достаточно чётко объясняет почему многомерные линейные модели - в частности пресловутый ElasticNet, который суют почти во все статьи про метиломные часы - не лучший вариант для предсказания биологического возраста. Объяснение этому может вас удивить, если вы находитесь в обычной ML парадигме: потому что мы не можем использовать хронологический возраст как предиктор... Что? А так можно было? В статье приводится объяснение этому необычному трюку. Дело в том, что хронологический возраст как и прочие биомаркеры (включая метилирование ДНК) просто является ещё одной фичей, которую можно включить в модель. Но если для биологических маркеров, вроде уровня альбумина или среднего числа пройденных шагов за день, вам требуется построить линейную модель, то для биологического возраста модель уже построена БиоВозраст = ХроноВозраст + СлучайныйШум; последняя формула напрямую вытекает из предположения (2) выше.

Удивительно, что никто из последователей секты ElasticNet (включая меня до недавнего времени) не обнаружил это дикое интересное рассуждение. Ещё более удивительно, что Steve Horvath в своих многочисленных статьях даже не пытается сравниваться с упомянутым алгоритмом (по крайней мере я не нашёл), а также не отвечает на предположения относительно определения биологического возраста. Всё это заставляет думать, что область часов старения сильно профанировала относительно своего предмета исследования, что в итоге вылилось в виде предсказаний омоложения в эмбриогенезе или репрограммировании, подтвердить или опровергнуть которые невозможно средствами существующей методологии.

В заключение добавлю, что биологический возраст в представлении Клемеры и Дюбаля является довольно строгой математической абстракцией, которая, несмотря на всю свою строгость определения остаётся метафизичной, поскольку невозможно померить биологический возраст напрямую. Кто-то может возразить мне, что "...ну ведь и далеко не все физические величины можно померить напрямую, взять хотя бы энергию или энтропию..." - всё так, но есть существенное отличие. Считая энергию, мы работаем с детерминированными величинами (например, перемножаем ток, напряжение и время) - теми, что поддаются измерению, таким образом мат.ожидание энергии пропорционально мат. ожиданию произведения входящих в расчёт измеримых величин, и, таким образом, энергия приобретает субстанциональность (да простят меня позитивисты за этот термин) и отражает конкретную величину, хоть и ненаблюдаемую напрямую. С биологическим возрастом проблема в том, что согласно определению это Хронологический возраст минус Случайный Шум. И если "проматожидать" обе части равенства с обоих сторон получается хронологический возраст. Это создаёт уникальную ситуацию в науке, когда ученые придают серьёзность понятию Случайный Шум, называя его "ускорением" или "замедлением" старения. Доверять шуму измерений как показателю состояния организма - хм... questionable. Хотя, миллионы долларов уже потрачены, стартапы созданы, сотни статей опубликованы.
[Digest] of longevity/bionformatics papers for April 2024:
Prepared by: @StDeadRa
1. MammalMethylClock R package: Software for DNA Methylation-Based epigenetic clocks in mammals [link] – This article delves into the development and application of epigenetic clocks, which utilize DNA methylation levels to predict age and mortality risk across various mammalian species. The introduction of the MammalMethylClock R package provides a comprehensive toolset for constructing and evaluating these clocks, offering significant implications for species conservation and preclinical research.
2. Databases of ligand-binding pockets and protein-ligand interactions [link] – This review provides a thorough examination of the dynamic landscape of protein-ligand binding databases, offering insights into variations in data definition, identification methodologies, and utility across 53 platforms. It highlights sustainability challenges, redundancy issues, and offers practical recommendations for database creators. Bioinformaticians stand to benefit from this article as it offers a comprehensive understanding of available resources, addressing critical aspects of database accessibility, usability, and longevity, essential for informed research decisions in the field.
3. Differential gene expression analysis pipelines and bioinformatic tools for the identification of specific biomarkers: A review [link] – In recent years, the intersection of bioinformatics, omics techniques, and trannoscriptomics has become increasingly pivotal in biomedicine and healthcare, particularly for biomarker identification and drug discovery. This review focuses on the crucial role of bioinformatic techniques, especially differential gene expression (DGE) analysis, in RNA-seq data processing, enabling the identification of differentially expressed genes across sample sets. By integrating functional enrichment analyses, these studies offer insights into disease mechanisms and potential therapeutic targets. Despite methodological challenges, ongoing advancements in computational biology promise more accurate and reproducible analyses, propelling biomarker discovery forward. Anticipated improvements in sequencing technologies and analysis algorithms hold the potential to revolutionize personalized medicine, enhancing diagnosis, prognosis, and treatment tailored to individual patients' needs.
4. Identification of Mitophagy-Related Genes in Sepsis [link] – In the realm of sepsis research, this article stands as a beacon illuminating the intricate relationship between mitochondrial health and inflammatory responses. By delving into the genetic underpinnings of mitophagy, the process by which cells rid themselves of dysfunctional mitochondria, it uncovers crucial insights into the mechanisms driving sepsis pathology. Through meticulous data mining and analysis, the study unveils four key genes—TOMM20, TOMM22, TOMM40, and MFN1—linking mitophagy to sepsis progression. These findings not only expand our understanding of sepsis pathophysiology but also pave the way for targeted therapeutic interventions aimed at mitigating the devastating consequences of this systemic inflammatory syndrome.
👍1
5. AagingBase: a comprehensive database of anti-aging peptides [link] – In the realm of anti-aging research, AagingBase emerges as a groundbreaking resource, poised to revolutionize the landscape of geriatric medicine. By consolidating a vast array of experimentally validated anti-aging peptides, this database serves as a treasure trove for researchers seeking novel therapeutic interventions. Through meticulous curation and state-of-the-art computational analyses, AagingBase offers invaluable insights into the physicochemical properties and biological functions of anti-aging peptides. With its user-friendly interface and advanced search functionalities, the database allows to efficiently identify and prioritize potential candidates for further investigation. AagingBase catalyzes the development of targeted interventions to combat age-related ailments, holding immense promise for the advancement of geriatric medicine and longevity science.
6. SyntenyViewer: a comparative genomics-driven translational research tool [link] – In the realm of genomics and translational research, SyntenyViewer emerges as a pivotal platform, poised to reshape our understanding of evolutionary dynamics and trait inheritance across angiosperm species. By harnessing a vast reservoir of comparative genomics data, this web-based tool facilitates both fundamental inquiries into evolutionary pathways and practical applications in crop improvement. With access to data from seven major botanical families and a catalog of over 100,000 conserved genes spanning 44 species, SyntenyViewer enables researchers to unravel the intricate evolutionary trajectories of genes and genomic regions. Furthermore, its utility extends to translational research, offering a pathway for the identification and exploration of trait-related genes from model species to crops. Through its intuitive interface and comprehensive functionalities, SyntenyViewer not only accelerates scientific discovery but also invites collaboration by offering to host additional comparative genomics data, thereby fostering a community-driven approach to genomic exploration and innovation.
7. Drug mechanism enrichment analysis improves prioritization of therapeutics for repurposing [link] – In the realm of drug discovery and repurposing, Drug Mechanism Enrichment Analysis (DMEA) presents a pragmatic approach to enhancing the prioritization of potential therapeutics. By adopting a methodology that groups drugs according to shared mechanisms of action (MOAs), DMEA offers a nuanced perspective on drug efficacy, minimizing the impact of off-target effects inherent in individual drug evaluations. Through rigorous validation on simulated and real-world datasets, DMEA showcases its utility in identifying enriched drug MOAs with sensitivity and robustness. Moreover, in experimental settings, DMEA facilitates the exploration of potential therapeutic candidates, exemplified by the discovery of senolytic effects of EGFR inhibitors. This versatile bioinformatic tool holds promise in refining drug repurposing strategies, marking a step forward in optimizing therapeutic interventions without overstating its achievements.
8. Cross-platform proteomics signatures of extreme old age [link] – In the realm of proteomics and longevity research, the study on Cross-platform proteomics signatures of extreme old age offers insights into serum protein patterns associated with centenarians. By comparing data from two platforms, the research identifies proteins linked to extreme longevity, highlighting pathways such as blood coagulation and IGF signaling. This investigation enhances our understanding of age-related adjustments, providing valuable clues to distinguish centenarians from younger individuals.
Channel photo updated
ComputAgeBench — Epigenetic Aging Clocks Benchmark

We present the first open benchmark of the epigenetic aging clocks to test their ability to predict biological age!

Insights:
- Mathematically tractable definition of biological age is formulated;
- Collected 66 datasets across 19 aging-accelerating conditions and compared 13 published aging clocks;
- everything is free to download and reproduce;
- PhenoAge clocks turned out to be the best in prediction biological age;
- Horvath clocks are best in prediction chronological age;

📜 paper
🖥 code
🤗 dataset
💬 community
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Epistemic uncertainty challenges aging clock reliability in predicting rejuvenation effects

We finally published our paper about the role of epistemic uncertainty in aging clocks predictions (biological age predictions actually)!

Insights:
- Rejuvenation by cell reprogramming can not be reliably predicted with aging clocks;
- Ground zero of epigenetic age in embryogenesis can not be reliably predicted with aging clocks;
- Any clinically relevant aging clocks must be equipped with uncertainty estimation of its predictions;
- Covariate shift between training and testing datasets is a huge problem that you have to remember.

Thoughts:
It's been a while since the preprint came out. Since then, I've changed my attitude towards the aging clock a lot, which can be summarized in the following simple thought. The aging clock is not about machine learning and data science - the aging clock is about the methodology and philosophy of science. If you don't like the combination of words methodology and philosophy, you'll most likely produce another useless aging clock research, sorry.

📜paper
🖥code
💬community
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
This Monday we for the first time arranged at Skoltech the real British-Parlament-Style Scientific Debates between teams of students (two Governments vs two Oppositions). The topic of debates was: "Whether The Extracellular Matrix damage is the main root cause of aging?". The Government side tried to convince juries that it it true whilst the opposition team objected this defending the position that matrix is rather the "passenger" than the "driver". Teams proposed their arguments in a form of written documents and then defended their positions in a form of public speaks.

Here I attach the documents with teams' reasoning:

I want to thank the juries: Alexey Alekseev, Ilia Pletenev, Margarita Sidorova, and Evgeniy Efimov for their participate as juries and for the convergence to the final verdict which I consider to be fair - the opposition-2 team has won.
👍1
I also aggregated main arguments of sides with chatGPT for easier reading:
👍2
ComputAgeBench - v2 — Epigenetic Aging Clocks Benchmark

We present our GLOBAL UPDATE of the first open benchmark of the epigenetic aging clocks to test their ability to predict biological age! Now it is equipped with the Training Split suitable for training 1-st generation aging clocks on 7k+ blood samples of healthy people.

What was added?
- 46 additional datasets (see table above) of healthy blood samples suitable for training 1-st generation aging clocks;
- everything is easy to download in a couple of minutes from our huggingface repo;
- our preprint was improved with a new figure A3 explaining the new Training split internals;
- some bugs were fixed and, as always, everything is accessible from our ComputAge repo;
- a notebook exemplifying the training procedure.

Useful links:
📜 paper-v2
🖥 code
🤗 dataset
💬 community
🤩 notebook
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8