Discussion.png
1.9 MB
Article::
Наконец и ваш покорный слуга изошёл на дебютный препринт об исследовании сходства и различий между репрограммированием, интервенциями продлевающими жизнь и старением. Препринт получился увесистый с кучей цветных картинок внутри, но понимая, как сложно бывает читать всё и вся в калейдоскопе aging domain, мы подготовили для вас Fig. 6 - Summary plot - его я дам (см. закреп).
О чём статья?
1) Проанализировали много транскриптомов репрограммирования (bulk), старения и омолаживающих интервенций (типа рапамицина) - посчитали их сигнатуры и сравнили. Получилось ожидаемо, репрограммирование ведет себя омолаживающе.
2) Посмотрели на функциональную интерпретацию этих сигнатур. Получили DNA repair upregulation, но Apoptosis downregulation у репрограммирования - хм, интересно.
3) Зафитили незыблемый ElasticNet на транскриптомы старения (спасибо Саше Тышковскому) и сделали model.predict на репрограммировании. Получилось омоложение (правда не во всех датасетах), довольно консистентное.
Наконец и ваш покорный слуга изошёл на дебютный препринт об исследовании сходства и различий между репрограммированием, интервенциями продлевающими жизнь и старением. Препринт получился увесистый с кучей цветных картинок внутри, но понимая, как сложно бывает читать всё и вся в калейдоскопе aging domain, мы подготовили для вас Fig. 6 - Summary plot - его я дам (см. закреп).
О чём статья?
1) Проанализировали много транскриптомов репрограммирования (bulk), старения и омолаживающих интервенций (типа рапамицина) - посчитали их сигнатуры и сравнили. Получилось ожидаемо, репрограммирование ведет себя омолаживающе.
2) Посмотрели на функциональную интерпретацию этих сигнатур. Получили DNA repair upregulation, но Apoptosis downregulation у репрограммирования - хм, интересно.
3) Зафитили незыблемый ElasticNet на транскриптомы старения (спасибо Саше Тышковскому) и сделали model.predict на репрограммировании. Получилось омоложение (правда не во всех датасетах), довольно консистентное.
4) Попытались объединить пункты (1) и (3) и попредсказывать молекул продлевающих жизнь на CMAP. Получилось, на мой взгляд, эзотерично, но многообещающе.
5) Сделали глобальный вывод о том, что Репрограммирование таки МОЖЕТ быть отвязано от потери соматической идентичности, которой все боятся. Вывод мы такой делаем не первые, но впервые предлагаем подход, как их можно отделить численно (ждите в будущих исследованиях).
Итог:
Большая статья, показывающая глубинную связь между репрограммированием и омоложением. Очередной фит часов старения (куда без них) и попытка в drug design. Но главное, на мой взгляд, сделали вывод о возможности Decoupling-а между омоложением и уходом в плюрипотентность - вот на это я бы поставил деньги.
5) Сделали глобальный вывод о том, что Репрограммирование таки МОЖЕТ быть отвязано от потери соматической идентичности, которой все боятся. Вывод мы такой делаем не первые, но впервые предлагаем подход, как их можно отделить численно (ждите в будущих исследованиях).
Итог:
Большая статья, показывающая глубинную связь между репрограммированием и омоложением. Очередной фит часов старения (куда без них) и попытка в drug design. Но главное, на мой взгляд, сделали вывод о возможности Decoupling-а между омоложением и уходом в плюрипотентность - вот на это я бы поставил деньги.
Прочел известную статью De Magalhães, 2009, ставшую пожалуй классическим примером мета-анализа генной экспрессии данных старения. Статья старенькая, но написана скромным грамотным языком, через который мне удалось увидеть несколько проблем в уже современной биологии старения.
О чём статья?
По сути это просто анализ дифференциальной экспрессии генов с функциональным обогащением. Важный момент тут это методология, которая позволяет объединить большое число датасетов (всего их было проанализировано 27, правда в основном мыши и крысы) и получить результаты с высоким sensitivity. Мета-анализ показал, что апрегуляцию генов связанных с воспалением и имунным ответом, дерегуляцию митохондриальных генов, апрегуляцию генов связанных с лизосомой - в общем, то что мы сегодня итак знаем.
Почему статья важна сегодня?
На протяжении всей статьи чувствуется скромность и настороженность авторов относительно тех данных, которые они анализируют и которая вызывает моё подлинное уважение. Действительно, оверэкспрессия гена ещё не означает его функциональную оверэкспрессию. То есть то что мы можем называть "функционально-значимой оверэкспрессией", может быть просто совокупностью компенсаторных механизмов, например: скорость деградации данной мРНК снизилась, но в единицу времени производится то же число транскриптов, что и раньше. Напротив, число свободно плавающих транскриптов может измениться при неизменном темпе их деградации. Ситуация становится ещё сложнее, если предположить, что изменилась и скорость трансляции и тогда вообще не понятно, насколько изменение наблюдаемого уровня экспрессии влияет функционально вообще хоть на что-нибудь. К слову, авторы действительно докладывают, о *negative regulation of transcription (GO:0045892), suggesting that transcriptional activity decreases with age.* От себя добавлю, что изменение объёма клеточного ядра, а также клеточный состав (клональная экспансия?) также могут влиять на наблюдаемый уровень экспрессии отдельного куска ткани берущегося в анализ. Часть этих проблем снимаются благодаря известным сегодня single-cell методам, однако, привносящим свои проблемы...
В итоге даже сегодня, наблюдая за тем как некоторые авторы публикуют диф. экспрессионный анализ, выдавая up/down-regulated genes за нечто функционально значимое, можно умозаключить, что коммюнити немного застопорилось. Нет, я не отговариваю кого либо делать мета-анализы сегодня и мне кажется это хороший первый шаг перед созданием крутых динамических моделей старения. Проблема в том, что статье почти исполнилось 14 лет и крутых динамических моделей всё ещё не появилось. Да, появились hallmarks of aging, и даже недавно обновились. Но повторюсь, не возникло динамической модели генной экспрессии стареющего организма, то есть мы не понимаем как именно и что именно там меняется, довольствуясь лишь ассоциациями.
Вывод
Статья хорошая. У авторов светлая голова и чистые помыслы, есть чему поучиться. Но читая её, невольно приходишь к мысли, что... кажется мы немного запутались в хитросплетении гипотез о старении и нужно прежде всего разобраться, что из того что мы знаем устарело и следовательно должно быть выброшено на свалку, а с чем мы сможем продолжить работать.
О чём статья?
По сути это просто анализ дифференциальной экспрессии генов с функциональным обогащением. Важный момент тут это методология, которая позволяет объединить большое число датасетов (всего их было проанализировано 27, правда в основном мыши и крысы) и получить результаты с высоким sensitivity. Мета-анализ показал, что апрегуляцию генов связанных с воспалением и имунным ответом, дерегуляцию митохондриальных генов, апрегуляцию генов связанных с лизосомой - в общем, то что мы сегодня итак знаем.
Почему статья важна сегодня?
На протяжении всей статьи чувствуется скромность и настороженность авторов относительно тех данных, которые они анализируют и которая вызывает моё подлинное уважение. Действительно, оверэкспрессия гена ещё не означает его функциональную оверэкспрессию. То есть то что мы можем называть "функционально-значимой оверэкспрессией", может быть просто совокупностью компенсаторных механизмов, например: скорость деградации данной мРНК снизилась, но в единицу времени производится то же число транскриптов, что и раньше. Напротив, число свободно плавающих транскриптов может измениться при неизменном темпе их деградации. Ситуация становится ещё сложнее, если предположить, что изменилась и скорость трансляции и тогда вообще не понятно, насколько изменение наблюдаемого уровня экспрессии влияет функционально вообще хоть на что-нибудь. К слову, авторы действительно докладывают, о *negative regulation of transcription (GO:0045892), suggesting that transcriptional activity decreases with age.* От себя добавлю, что изменение объёма клеточного ядра, а также клеточный состав (клональная экспансия?) также могут влиять на наблюдаемый уровень экспрессии отдельного куска ткани берущегося в анализ. Часть этих проблем снимаются благодаря известным сегодня single-cell методам, однако, привносящим свои проблемы...
В итоге даже сегодня, наблюдая за тем как некоторые авторы публикуют диф. экспрессионный анализ, выдавая up/down-regulated genes за нечто функционально значимое, можно умозаключить, что коммюнити немного застопорилось. Нет, я не отговариваю кого либо делать мета-анализы сегодня и мне кажется это хороший первый шаг перед созданием крутых динамических моделей старения. Проблема в том, что статье почти исполнилось 14 лет и крутых динамических моделей всё ещё не появилось. Да, появились hallmarks of aging, и даже недавно обновились. Но повторюсь, не возникло динамической модели генной экспрессии стареющего организма, то есть мы не понимаем как именно и что именно там меняется, довольствуясь лишь ассоциациями.
Вывод
Статья хорошая. У авторов светлая голова и чистые помыслы, есть чему поучиться. Но читая её, невольно приходишь к мысли, что... кажется мы немного запутались в хитросплетении гипотез о старении и нужно прежде всего разобраться, что из того что мы знаем устарело и следовательно должно быть выброшено на свалку, а с чем мы сможем продолжить работать.
PubMed Central (PMC)
Meta-analysis of age-related gene expression profiles identifies common signatures of aging
Motivation: Numerous microarray studies of aging have been conducted, yet given the noisy nature of gene expression changes with age, elucidating the transcriptional features of aging and how these relate to physiological, biochemical and pathological ...
Добрый друг прислал статью, в которой (наконец-то) конструктивно критикуют книгу Дэвида Синклера "Lifespan". Хотя немного анекдотично критиковать критика, всё же нужно внести ясность в некоторые моменты, приведенные в его критике.
Итак, статья разделена на две части, которые как-будто бы не особо связаны между собой. В первой автор аппелирует к наиболее общим фактам (а порой предположениям), о старении. Во второй же он критикует некоторые частные рекомендации и гипотезы Синклера в самой книге. Начнём с первой, автор приводит следующие три базовых факта о старении, которые упускаются в книге (ну, о них действительно не говорится слишком уж подчеркнуто):
1) First, all vertebrate animal species have a distribution of natural lifespans that are limited by their gene sets—human longevity appears top out at about 120 years (Gavrilova and Gavrilov, 2020). - и попал в ловушку тру биолога без математического бэкграунда, процитировав очень частную модель старения, основанную на бородатой теории надежности - очень недальновидный ход, есть более продвинутые модели старения и они, как это характерно для макроскопических феноменологических моделей, всё объясняют, но пользы от таких объяснений мало. Да, действительно, нам не удалось зафиксировать людей старше 122 (вроде бы), но и говорить слово limited можно довольно условно, поскольку нет, опять же, физического закона блокирующего нам жизнь 200+.
2) Second, animal gene sets evolved to allow individuals to acquire food, avoid predation, find mates and successfully reproduce. Long-lived species like humans also provide a substantial investment in caretaking of offspring until they can obtain food, avoid predation and reproduce for themselves. The advantages conferred to youth by parents mean that genetic selections for parental health are extant in caretaking species. Such genetic selections for post-reproductive health are not extant in non-caretaking species (Brenner, 2022a). - кратко логика: если животное заботится о потомстве -> отбор благоволит его здоровью в старости. А обратное как он утверждает не наблюдается в природе. Я бы не был так категоричен в этом отношении, вполне возможно, что забота о потомстве в старости это побочный эффект долголетия, который в свою очередь благоволит отбору, который закрепляет данный признак. Но можно также запросто представить и существо, которое живёт долго и не заботится о потомстве - я не понимаю почему последнее невозможно.
3) Third, for animals that can mate multiple times, longevity is an emergent property of the ability to continue to do all the things required to reproduce and promote the success of offspring. Animal gene sets have been subject to genetic selections for guile, strength and famine-resistance but haven’t been directly selected for longevity because, as a rule, animals are able to successfully reproduce when they are relatively young (Rose, 1994). - с этим согласен.
В итоге все три факта выглядят правильными или, по крайней мере, дискуссионными, но никакого удара по книге не наносят. Идём дальше:
Is aging a disease? Age is clearly a risk factor for a wide variety of diseases but aging is not itself a disease - здесь автор допускает методическую ошибку, не приводя определения болезни, а споря с некоторым интуитивным пониманием этого термина читателем. Определения имеют свойство меняться и проделана большая работа, чтобы включить старение в список болезней, что позволит лучше финансировать область бюрократическими институтами, для которых точные определения священны.
Indeed, Sinclair has voiced support for the idea that aging begins shortly after the fertilization of eggs. Thus, to say that aging is a disease is to pathologize life itself. - с этим согласен - бред, не нужно смешивать развитие и старение. Идея такого смешивания произрастает скорее всего из epigenetic aging clocks, которые просто почему-то коррелируют с временем прошедшим от рождения индивида.
Итак, статья разделена на две части, которые как-будто бы не особо связаны между собой. В первой автор аппелирует к наиболее общим фактам (а порой предположениям), о старении. Во второй же он критикует некоторые частные рекомендации и гипотезы Синклера в самой книге. Начнём с первой, автор приводит следующие три базовых факта о старении, которые упускаются в книге (ну, о них действительно не говорится слишком уж подчеркнуто):
1) First, all vertebrate animal species have a distribution of natural lifespans that are limited by their gene sets—human longevity appears top out at about 120 years (Gavrilova and Gavrilov, 2020). - и попал в ловушку тру биолога без математического бэкграунда, процитировав очень частную модель старения, основанную на бородатой теории надежности - очень недальновидный ход, есть более продвинутые модели старения и они, как это характерно для макроскопических феноменологических моделей, всё объясняют, но пользы от таких объяснений мало. Да, действительно, нам не удалось зафиксировать людей старше 122 (вроде бы), но и говорить слово limited можно довольно условно, поскольку нет, опять же, физического закона блокирующего нам жизнь 200+.
2) Second, animal gene sets evolved to allow individuals to acquire food, avoid predation, find mates and successfully reproduce. Long-lived species like humans also provide a substantial investment in caretaking of offspring until they can obtain food, avoid predation and reproduce for themselves. The advantages conferred to youth by parents mean that genetic selections for parental health are extant in caretaking species. Such genetic selections for post-reproductive health are not extant in non-caretaking species (Brenner, 2022a). - кратко логика: если животное заботится о потомстве -> отбор благоволит его здоровью в старости. А обратное как он утверждает не наблюдается в природе. Я бы не был так категоричен в этом отношении, вполне возможно, что забота о потомстве в старости это побочный эффект долголетия, который в свою очередь благоволит отбору, который закрепляет данный признак. Но можно также запросто представить и существо, которое живёт долго и не заботится о потомстве - я не понимаю почему последнее невозможно.
3) Third, for animals that can mate multiple times, longevity is an emergent property of the ability to continue to do all the things required to reproduce and promote the success of offspring. Animal gene sets have been subject to genetic selections for guile, strength and famine-resistance but haven’t been directly selected for longevity because, as a rule, animals are able to successfully reproduce when they are relatively young (Rose, 1994). - с этим согласен.
В итоге все три факта выглядят правильными или, по крайней мере, дискуссионными, но никакого удара по книге не наносят. Идём дальше:
Is aging a disease? Age is clearly a risk factor for a wide variety of diseases but aging is not itself a disease - здесь автор допускает методическую ошибку, не приводя определения болезни, а споря с некоторым интуитивным пониманием этого термина читателем. Определения имеют свойство меняться и проделана большая работа, чтобы включить старение в список болезней, что позволит лучше финансировать область бюрократическими институтами, для которых точные определения священны.
Indeed, Sinclair has voiced support for the idea that aging begins shortly after the fertilization of eggs. Thus, to say that aging is a disease is to pathologize life itself. - с этим согласен - бред, не нужно смешивать развитие и старение. Идея такого смешивания произрастает скорее всего из epigenetic aging clocks, которые просто почему-то коррелируют с временем прошедшим от рождения индивида.
PubMed Central (PMC)
A Science-Based Review of the World’s Best-Selling Book on Aging
PMC Disclaimer
Do sirtuins extend lifespan in yeast, invertebrates and vertebrates? Has Sinclair discovered sirtuin activators? Based on 25 years of work by academic and industrial investigators, the clear answer to both questions is no (Brenner, 2022b). - могу только согласиться. Вся эта история с сиртуинами действительно очень странная, и в книге подробно история сиртуинового провала не приводится.
Lifespan does not tell us that when these treatments are performed on cells in the laboratory, one gets tumors and teratomas (Friedmann-Morvinski and Verma, 2014) and that there is no published study in which even 20 mice have been examined carefully for safety after trying these types of techniques. - нет. Автор неправильно понял что такое tumors и teratomas и откуда они там берутся. К моменту публикации, уже были свидетельства что мышам можно безопасно давать факторы яманаки, это легко гуглится.
Итог:
По совокупности упомянутых сюжетов охарактеризую критику как слабую. Она сильно бьёт только по сиртуиновой истории, но все остальные сюжеты остаются без должного внимания. Если бы я взялся критиковать Синклера, то сосредоточился бы прежде всего на его информационной теории старения. По сравнению с ней, всё остальное это просто мириады экспериментов со спорной методологией, иногда удачные, иногда нет. Не знаю, почему автор подошёл так малодушно к критике довольно заметной фигуры в Longevity science... Ну, зато по гранту отчитался :)
Lifespan does not tell us that when these treatments are performed on cells in the laboratory, one gets tumors and teratomas (Friedmann-Morvinski and Verma, 2014) and that there is no published study in which even 20 mice have been examined carefully for safety after trying these types of techniques. - нет. Автор неправильно понял что такое tumors и teratomas и откуда они там берутся. К моменту публикации, уже были свидетельства что мышам можно безопасно давать факторы яманаки, это легко гуглится.
Итог:
По совокупности упомянутых сюжетов охарактеризую критику как слабую. Она сильно бьёт только по сиртуиновой истории, но все остальные сюжеты остаются без должного внимания. Если бы я взялся критиковать Синклера, то сосредоточился бы прежде всего на его информационной теории старения. По сравнению с ней, всё остальное это просто мириады экспериментов со спорной методологией, иногда удачные, иногда нет. Не знаю, почему автор подошёл так малодушно к критике довольно заметной фигуры в Longevity science... Ну, зато по гранту отчитался :)
Если вы, как и я, знали что-то о часах старения и считаете это довольно занимательной безделушкой в руках учёных, которые (лишь иногда) могут принести пользу, то настоятельно рекомендую вам окунуться в статью 2006 года: A new approach to the concept and computation of biological age за авторством Petr Klemera & Stanislav Doubal.
Статья эта стала для меня внезапной отрезвляющей пощёчиной, относительно моих наивных представлений относительно того, что (действительно) серьёзные ученые называют биологическим возрастом. Читая более современных авторов вы в лучшем случае увидите что-то типа biological age refers to epigenetic alteration and DNA methylation which express on how able and functioning a person is and whether a person has diseases related to old age [link]), а чаще всего не увидите определения вовсе [link]. В обсуждаемой же статье обсуждается несколько определений биологического возраста:
Биологический возраст - мера, выражающая "глобальное состояние" стареющего организма лучше чем это делает его хронологический возраст.
Биологический возраст - возраст, соответствующий (или предсказывающий) "ожидаемой продолжительности жизни" лучше чем ей соответствует хронологический возраст.
Авторы, ссылаясь на критику приведенных выше определений, сходятся на следующем более осторожном и более общем определении, которое будет рабочим в этой статье:
Биологический возраст - число, которое получается при применении некоторого алгоритма к множеству возраст-зависимых переменных (биомаркеров). - Данное определение немного удивляет своей абстрактностью, но вполне отражает техническую суть происходящего.
Далее приводятся 4 общих предположения, из которых следует вполне конкретная математическая модель биологического возраста
1) Старение - естественный процесс проявляющий себя в изменении многих свойств живых организмов. Скорость этого процесса заметно различается между видами и куда менее различается внутри вида.
2) Различия в биологическом возрасте индивидов соответствуют их различиям в уровне старости. При этом мат. ожидание биологического возраста по возрастному срезу популяции (например всех 60-летних) равно хронологическому возрасту среза (60 лет). При этом дисперсия биологического возраста вполне может расти с ростом хронологического возраста.
3) Любое измеримый параметр человеческого организма, который систематически изменяется с хронологическим возрастом, подвержен влиянию на него процесса старения, и, потому, может служить биомаркером старения.
4) Траектория изменения биомаркера старения изменяется не только под действием биологического возраста индивидуума, но и под действием иных случайных факторов.
Происходящее далее может показаться бездушным математическим монологом на тему линейных регрессий. На самом же деле, это сдвиг парадигмы в машинном обучении! А именно, это что-то вроде нового способа ансамблирования одномерных моделей. Если вкратце, то алгоритм можно описать так: Пусть дан датасет
1) Обучите
2) Для каждого нового сэмпла
Статья эта стала для меня внезапной отрезвляющей пощёчиной, относительно моих наивных представлений относительно того, что (действительно) серьёзные ученые называют биологическим возрастом. Читая более современных авторов вы в лучшем случае увидите что-то типа biological age refers to epigenetic alteration and DNA methylation which express on how able and functioning a person is and whether a person has diseases related to old age [link]), а чаще всего не увидите определения вовсе [link]. В обсуждаемой же статье обсуждается несколько определений биологического возраста:
Биологический возраст - мера, выражающая "глобальное состояние" стареющего организма лучше чем это делает его хронологический возраст.
Биологический возраст - возраст, соответствующий (или предсказывающий) "ожидаемой продолжительности жизни" лучше чем ей соответствует хронологический возраст.
Авторы, ссылаясь на критику приведенных выше определений, сходятся на следующем более осторожном и более общем определении, которое будет рабочим в этой статье:
Биологический возраст - число, которое получается при применении некоторого алгоритма к множеству возраст-зависимых переменных (биомаркеров). - Данное определение немного удивляет своей абстрактностью, но вполне отражает техническую суть происходящего.
Далее приводятся 4 общих предположения, из которых следует вполне конкретная математическая модель биологического возраста
1) Старение - естественный процесс проявляющий себя в изменении многих свойств живых организмов. Скорость этого процесса заметно различается между видами и куда менее различается внутри вида.
2) Различия в биологическом возрасте индивидов соответствуют их различиям в уровне старости. При этом мат. ожидание биологического возраста по возрастному срезу популяции (например всех 60-летних) равно хронологическому возрасту среза (60 лет). При этом дисперсия биологического возраста вполне может расти с ростом хронологического возраста.
3) Любое измеримый параметр человеческого организма, который систематически изменяется с хронологическим возрастом, подвержен влиянию на него процесса старения, и, потому, может служить биомаркером старения.
4) Траектория изменения биомаркера старения изменяется не только под действием биологического возраста индивидуума, но и под действием иных случайных факторов.
Происходящее далее может показаться бездушным математическим монологом на тему линейных регрессий. На самом же деле, это сдвиг парадигмы в машинном обучении! А именно, это что-то вроде нового способа ансамблирования одномерных моделей. Если вкратце, то алгоритм можно описать так: Пусть дан датасет
X, y
, где X
из m
фичей и n
наблюдений (например общий анализ крови), а y
- наблюдаемый хронологический возраст. Тогда:1) Обучите
m
линейных моделей, каждую для каждой фичи в датасете, где каждая линейная модель будет предсказывать свою фичу X_j
как функцию от y
. 2) Для каждого нового сэмпла
X_i
(вектор, где значения это параметры крови) решите следующую задачу оптимизации: Sum_j (X_ij - f_j(y))
PubMed
A new approach to the concept and computation of biological age - PubMed
The lack of exact definition of the concept of biological age (BA) is a typical feature of works concerning BA. That is why comparison of results of various published methods makes little sense and eventual proof of their optimality is impossible. Based on…
Чтобы лучше понять происходящее - внизу картинка из статьи с геометрической интерпретацией: все фичи в датасете параметризуются параметром
Что меня ещё более поразило, так это то, что уже абстракте статьи автор достаточно чётко объясняет почему многомерные линейные модели - в частности пресловутый ElasticNet, который суют почти во все статьи про метиломные часы - не лучший вариант для предсказания биологического возраста. Объяснение этому может вас удивить, если вы находитесь в обычной ML парадигме: потому что мы не можем использовать хронологический возраст как предиктор... Что? А так можно было? В статье приводится объяснение этому необычному трюку. Дело в том, что хронологический возраст как и прочие биомаркеры (включая метилирование ДНК) просто является ещё одной фичей, которую можно включить в модель. Но если для биологических маркеров, вроде уровня альбумина или среднего числа пройденных шагов за день, вам требуется построить линейную модель, то для биологического возраста модель уже построена БиоВозраст = ХроноВозраст + СлучайныйШум; последняя формула напрямую вытекает из предположения (2) выше.
Удивительно, что никто из последователей секты ElasticNet (включая меня до недавнего времени) не обнаружил это дикое интересное рассуждение. Ещё более удивительно, что Steve Horvath в своих многочисленных статьях даже не пытается сравниваться с упомянутым алгоритмом (по крайней мере я не нашёл), а также не отвечает на предположения относительно определения биологического возраста. Всё это заставляет думать, что область часов старения сильно профанировала относительно своего предмета исследования, что в итоге вылилось в виде предсказаний омоложения в эмбриогенезе или репрограммировании, подтвердить или опровергнуть которые невозможно средствами существующей методологии.
В заключение добавлю, что биологический возраст в представлении Клемеры и Дюбаля является довольно строгой математической абстракцией, которая, несмотря на всю свою строгость определения остаётся метафизичной, поскольку невозможно померить биологический возраст напрямую. Кто-то может возразить мне, что "...ну ведь и далеко не все физические величины можно померить напрямую, взять хотя бы энергию или энтропию..." - всё так, но есть существенное отличие. Считая энергию, мы работаем с детерминированными величинами (например, перемножаем ток, напряжение и время) - теми, что поддаются измерению, таким образом мат.ожидание энергии пропорционально мат. ожиданию произведения входящих в расчёт измеримых величин, и, таким образом, энергия приобретает субстанциональность (да простят меня позитивисты за этот термин) и отражает конкретную величину, хоть и ненаблюдаемую напрямую. С биологическим возрастом проблема в том, что согласно определению это Хронологический возраст минус Случайный Шум. И если "проматожидать" обе части равенства с обоих сторон получается хронологический возраст. Это создаёт уникальную ситуацию в науке, когда ученые придают серьёзность понятию Случайный Шум, называя его "ускорением" или "замедлением" старения. Доверять шуму измерений как показателю состояния организма - хм... questionable. Хотя, миллионы долларов уже потрачены, стартапы созданы, сотни статей опубликованы.
y
(на картинке y=t
) (да, да, он же возраст, но он же и параметр). Далее для каждого нового сэмпла, являющегося точкой (X_i
) в пространстве фичей, нужно найти кратчайшее расстояние до прямой линии, запараметризованной через y
. Точка где перпендикуляр от X_i
коснётся прямой и является ответом (на картинке y=t
). Ну и наконец вот вам биологическая интуиция происходящего: вам нужно найти такой возраст y
, который бы лучше всего объяснил возрастные изменения в наблюдаемых фичах.Что меня ещё более поразило, так это то, что уже абстракте статьи автор достаточно чётко объясняет почему многомерные линейные модели - в частности пресловутый ElasticNet, который суют почти во все статьи про метиломные часы - не лучший вариант для предсказания биологического возраста. Объяснение этому может вас удивить, если вы находитесь в обычной ML парадигме: потому что мы не можем использовать хронологический возраст как предиктор... Что? А так можно было? В статье приводится объяснение этому необычному трюку. Дело в том, что хронологический возраст как и прочие биомаркеры (включая метилирование ДНК) просто является ещё одной фичей, которую можно включить в модель. Но если для биологических маркеров, вроде уровня альбумина или среднего числа пройденных шагов за день, вам требуется построить линейную модель, то для биологического возраста модель уже построена БиоВозраст = ХроноВозраст + СлучайныйШум; последняя формула напрямую вытекает из предположения (2) выше.
Удивительно, что никто из последователей секты ElasticNet (включая меня до недавнего времени) не обнаружил это дикое интересное рассуждение. Ещё более удивительно, что Steve Horvath в своих многочисленных статьях даже не пытается сравниваться с упомянутым алгоритмом (по крайней мере я не нашёл), а также не отвечает на предположения относительно определения биологического возраста. Всё это заставляет думать, что область часов старения сильно профанировала относительно своего предмета исследования, что в итоге вылилось в виде предсказаний омоложения в эмбриогенезе или репрограммировании, подтвердить или опровергнуть которые невозможно средствами существующей методологии.
В заключение добавлю, что биологический возраст в представлении Клемеры и Дюбаля является довольно строгой математической абстракцией, которая, несмотря на всю свою строгость определения остаётся метафизичной, поскольку невозможно померить биологический возраст напрямую. Кто-то может возразить мне, что "...ну ведь и далеко не все физические величины можно померить напрямую, взять хотя бы энергию или энтропию..." - всё так, но есть существенное отличие. Считая энергию, мы работаем с детерминированными величинами (например, перемножаем ток, напряжение и время) - теми, что поддаются измерению, таким образом мат.ожидание энергии пропорционально мат. ожиданию произведения входящих в расчёт измеримых величин, и, таким образом, энергия приобретает субстанциональность (да простят меня позитивисты за этот термин) и отражает конкретную величину, хоть и ненаблюдаемую напрямую. С биологическим возрастом проблема в том, что согласно определению это Хронологический возраст минус Случайный Шум. И если "проматожидать" обе части равенства с обоих сторон получается хронологический возраст. Это создаёт уникальную ситуацию в науке, когда ученые придают серьёзность понятию Случайный Шум, называя его "ускорением" или "замедлением" старения. Доверять шуму измерений как показателю состояния организма - хм... questionable. Хотя, миллионы долларов уже потрачены, стартапы созданы, сотни статей опубликованы.
[Digest] of longevity/bionformatics papers for April 2024:
Prepared by: @StDeadRa
1. MammalMethylClock R package: Software for DNA Methylation-Based epigenetic clocks in mammals [link] – This article delves into the development and application of epigenetic clocks, which utilize DNA methylation levels to predict age and mortality risk across various mammalian species. The introduction of the MammalMethylClock R package provides a comprehensive toolset for constructing and evaluating these clocks, offering significant implications for species conservation and preclinical research.
2. Databases of ligand-binding pockets and protein-ligand interactions [link] – This review provides a thorough examination of the dynamic landscape of protein-ligand binding databases, offering insights into variations in data definition, identification methodologies, and utility across 53 platforms. It highlights sustainability challenges, redundancy issues, and offers practical recommendations for database creators. Bioinformaticians stand to benefit from this article as it offers a comprehensive understanding of available resources, addressing critical aspects of database accessibility, usability, and longevity, essential for informed research decisions in the field.
3. Differential gene expression analysis pipelines and bioinformatic tools for the identification of specific biomarkers: A review [link] – In recent years, the intersection of bioinformatics, omics techniques, and transcriptomics has become increasingly pivotal in biomedicine and healthcare, particularly for biomarker identification and drug discovery. This review focuses on the crucial role of bioinformatic techniques, especially differential gene expression (DGE) analysis, in RNA-seq data processing, enabling the identification of differentially expressed genes across sample sets. By integrating functional enrichment analyses, these studies offer insights into disease mechanisms and potential therapeutic targets. Despite methodological challenges, ongoing advancements in computational biology promise more accurate and reproducible analyses, propelling biomarker discovery forward. Anticipated improvements in sequencing technologies and analysis algorithms hold the potential to revolutionize personalized medicine, enhancing diagnosis, prognosis, and treatment tailored to individual patients' needs.
4. Identification of Mitophagy-Related Genes in Sepsis [link] – In the realm of sepsis research, this article stands as a beacon illuminating the intricate relationship between mitochondrial health and inflammatory responses. By delving into the genetic underpinnings of mitophagy, the process by which cells rid themselves of dysfunctional mitochondria, it uncovers crucial insights into the mechanisms driving sepsis pathology. Through meticulous data mining and analysis, the study unveils four key genes—TOMM20, TOMM22, TOMM40, and MFN1—linking mitophagy to sepsis progression. These findings not only expand our understanding of sepsis pathophysiology but also pave the way for targeted therapeutic interventions aimed at mitigating the devastating consequences of this systemic inflammatory syndrome.
Prepared by: @StDeadRa
1. MammalMethylClock R package: Software for DNA Methylation-Based epigenetic clocks in mammals [link] – This article delves into the development and application of epigenetic clocks, which utilize DNA methylation levels to predict age and mortality risk across various mammalian species. The introduction of the MammalMethylClock R package provides a comprehensive toolset for constructing and evaluating these clocks, offering significant implications for species conservation and preclinical research.
2. Databases of ligand-binding pockets and protein-ligand interactions [link] – This review provides a thorough examination of the dynamic landscape of protein-ligand binding databases, offering insights into variations in data definition, identification methodologies, and utility across 53 platforms. It highlights sustainability challenges, redundancy issues, and offers practical recommendations for database creators. Bioinformaticians stand to benefit from this article as it offers a comprehensive understanding of available resources, addressing critical aspects of database accessibility, usability, and longevity, essential for informed research decisions in the field.
3. Differential gene expression analysis pipelines and bioinformatic tools for the identification of specific biomarkers: A review [link] – In recent years, the intersection of bioinformatics, omics techniques, and transcriptomics has become increasingly pivotal in biomedicine and healthcare, particularly for biomarker identification and drug discovery. This review focuses on the crucial role of bioinformatic techniques, especially differential gene expression (DGE) analysis, in RNA-seq data processing, enabling the identification of differentially expressed genes across sample sets. By integrating functional enrichment analyses, these studies offer insights into disease mechanisms and potential therapeutic targets. Despite methodological challenges, ongoing advancements in computational biology promise more accurate and reproducible analyses, propelling biomarker discovery forward. Anticipated improvements in sequencing technologies and analysis algorithms hold the potential to revolutionize personalized medicine, enhancing diagnosis, prognosis, and treatment tailored to individual patients' needs.
4. Identification of Mitophagy-Related Genes in Sepsis [link] – In the realm of sepsis research, this article stands as a beacon illuminating the intricate relationship between mitochondrial health and inflammatory responses. By delving into the genetic underpinnings of mitophagy, the process by which cells rid themselves of dysfunctional mitochondria, it uncovers crucial insights into the mechanisms driving sepsis pathology. Through meticulous data mining and analysis, the study unveils four key genes—TOMM20, TOMM22, TOMM40, and MFN1—linking mitophagy to sepsis progression. These findings not only expand our understanding of sepsis pathophysiology but also pave the way for targeted therapeutic interventions aimed at mitigating the devastating consequences of this systemic inflammatory syndrome.
OUP Academic
MammalMethylClock R package: software for DNA methylation-based epigenetic clocks in mammals
AbstractMotivation. Epigenetic clocks are prediction methods based on DNA methylation levels in a given species or set of species. Defined as multivariate
5. AagingBase: a comprehensive database of anti-aging peptides [link] – In the realm of anti-aging research, AagingBase emerges as a groundbreaking resource, poised to revolutionize the landscape of geriatric medicine. By consolidating a vast array of experimentally validated anti-aging peptides, this database serves as a treasure trove for researchers seeking novel therapeutic interventions. Through meticulous curation and state-of-the-art computational analyses, AagingBase offers invaluable insights into the physicochemical properties and biological functions of anti-aging peptides. With its user-friendly interface and advanced search functionalities, the database allows to efficiently identify and prioritize potential candidates for further investigation. AagingBase catalyzes the development of targeted interventions to combat age-related ailments, holding immense promise for the advancement of geriatric medicine and longevity science.
6. SyntenyViewer: a comparative genomics-driven translational research tool [link] – In the realm of genomics and translational research, SyntenyViewer emerges as a pivotal platform, poised to reshape our understanding of evolutionary dynamics and trait inheritance across angiosperm species. By harnessing a vast reservoir of comparative genomics data, this web-based tool facilitates both fundamental inquiries into evolutionary pathways and practical applications in crop improvement. With access to data from seven major botanical families and a catalog of over 100,000 conserved genes spanning 44 species, SyntenyViewer enables researchers to unravel the intricate evolutionary trajectories of genes and genomic regions. Furthermore, its utility extends to translational research, offering a pathway for the identification and exploration of trait-related genes from model species to crops. Through its intuitive interface and comprehensive functionalities, SyntenyViewer not only accelerates scientific discovery but also invites collaboration by offering to host additional comparative genomics data, thereby fostering a community-driven approach to genomic exploration and innovation.
7. Drug mechanism enrichment analysis improves prioritization of therapeutics for repurposing [link] – In the realm of drug discovery and repurposing, Drug Mechanism Enrichment Analysis (DMEA) presents a pragmatic approach to enhancing the prioritization of potential therapeutics. By adopting a methodology that groups drugs according to shared mechanisms of action (MOAs), DMEA offers a nuanced perspective on drug efficacy, minimizing the impact of off-target effects inherent in individual drug evaluations. Through rigorous validation on simulated and real-world datasets, DMEA showcases its utility in identifying enriched drug MOAs with sensitivity and robustness. Moreover, in experimental settings, DMEA facilitates the exploration of potential therapeutic candidates, exemplified by the discovery of senolytic effects of EGFR inhibitors. This versatile bioinformatic tool holds promise in refining drug repurposing strategies, marking a step forward in optimizing therapeutic interventions without overstating its achievements.
8. Cross-platform proteomics signatures of extreme old age [link] – In the realm of proteomics and longevity research, the study on Cross-platform proteomics signatures of extreme old age offers insights into serum protein patterns associated with centenarians. By comparing data from two platforms, the research identifies proteins linked to extreme longevity, highlighting pathways such as blood coagulation and IGF signaling. This investigation enhances our understanding of age-related adjustments, providing valuable clues to distinguish centenarians from younger individuals.
6. SyntenyViewer: a comparative genomics-driven translational research tool [link] – In the realm of genomics and translational research, SyntenyViewer emerges as a pivotal platform, poised to reshape our understanding of evolutionary dynamics and trait inheritance across angiosperm species. By harnessing a vast reservoir of comparative genomics data, this web-based tool facilitates both fundamental inquiries into evolutionary pathways and practical applications in crop improvement. With access to data from seven major botanical families and a catalog of over 100,000 conserved genes spanning 44 species, SyntenyViewer enables researchers to unravel the intricate evolutionary trajectories of genes and genomic regions. Furthermore, its utility extends to translational research, offering a pathway for the identification and exploration of trait-related genes from model species to crops. Through its intuitive interface and comprehensive functionalities, SyntenyViewer not only accelerates scientific discovery but also invites collaboration by offering to host additional comparative genomics data, thereby fostering a community-driven approach to genomic exploration and innovation.
7. Drug mechanism enrichment analysis improves prioritization of therapeutics for repurposing [link] – In the realm of drug discovery and repurposing, Drug Mechanism Enrichment Analysis (DMEA) presents a pragmatic approach to enhancing the prioritization of potential therapeutics. By adopting a methodology that groups drugs according to shared mechanisms of action (MOAs), DMEA offers a nuanced perspective on drug efficacy, minimizing the impact of off-target effects inherent in individual drug evaluations. Through rigorous validation on simulated and real-world datasets, DMEA showcases its utility in identifying enriched drug MOAs with sensitivity and robustness. Moreover, in experimental settings, DMEA facilitates the exploration of potential therapeutic candidates, exemplified by the discovery of senolytic effects of EGFR inhibitors. This versatile bioinformatic tool holds promise in refining drug repurposing strategies, marking a step forward in optimizing therapeutic interventions without overstating its achievements.
8. Cross-platform proteomics signatures of extreme old age [link] – In the realm of proteomics and longevity research, the study on Cross-platform proteomics signatures of extreme old age offers insights into serum protein patterns associated with centenarians. By comparing data from two platforms, the research identifies proteins linked to extreme longevity, highlighting pathways such as blood coagulation and IGF signaling. This investigation enhances our understanding of age-related adjustments, providing valuable clues to distinguish centenarians from younger individuals.
OUP Academic
AagingBase: a comprehensive database of anti-aging peptides
Abstract. The process of aging is an intrinsic and inevitable aspect of life that impacts every living organism. As biotechnological advancements continue
We present the first open benchmark of the epigenetic aging clocks to test their ability to predict biological age!
Insights:
- Mathematically tractable definition of biological age is formulated;
- Collected 66 datasets across 19 aging-accelerating conditions and compared 13 published aging clocks;
- everything is free to download and reproduce;
- PhenoAge clocks turned out to be the best in prediction biological age;
- Horvath clocks are best in prediction chronological age;
📜 paper
🤗 dataset
💬 community
Please open Telegram to view this post
VIEW IN TELEGRAM
We finally published our paper about the role of epistemic uncertainty in aging clocks predictions (biological age predictions actually)!
Insights:
- Rejuvenation by cell reprogramming can not be reliably predicted with aging clocks;
- Ground zero of epigenetic age in embryogenesis can not be reliably predicted with aging clocks;
- Any clinically relevant aging clocks must be equipped with uncertainty estimation of its predictions;
- Covariate shift between training and testing datasets is a huge problem that you have to remember.
Thoughts:
It's been a while since the preprint came out. Since then, I've changed my attitude towards the aging clock a lot, which can be summarized in the following simple thought. The aging clock is not about machine learning and data science - the aging clock is about the methodology and philosophy of science. If you don't like the combination of words methodology and philosophy, you'll most likely produce another useless aging clock research, sorry.
📜paper
💬community
Please open Telegram to view this post
VIEW IN TELEGRAM