Стручалин Максим КБ
273 subscribers
76 photos
5 videos
1 file
34 links
Это канал про биоинформатику, генетику и мои проекты.

По любым вопросом пишите на @MaksimStruchalin либо или maksim@computebio.pro.
Download Telegram
Поздравляю всех с наступающим новым годом 🚗 и желаю отличного праздничного настроения 🔔!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1510👍1
Благодарность от британской короны

Несколько лет назад, при подготовки к проекту с компанией Мираторг, прочитал я шикарную книгу по геномной селекции под названием “Linear Models for the Prediction of Animal Breeding Values”. Книга написана известным британским ученым Raphael Mrode. Выделил на нее две недели. Прочитал от корки до корки, аккуратно помечая карандашом все непонятные места. Многие такие места оказались ошибками в формулах. Дал себе обещание обязательно написать автору. Сделал я это только спустя несколько лет в начале прошлого 2023 года. Raphael с радостью откликнулся на мой емайл и рассказал, что как раз на прошлой неделе получил запрос от издательства написать новую четвертую редакцию книги и мои правки как раз кстати (предыдущая редакция вышла в 2014 году). Отличное совпадение, подумал я 🙂! Оформил все ошибки в красивую таблицу и выслал ему. У меня появилась идея воспользоваться этой ситуацией для небольшой рекламы моей компании ComputeBio, которой я как раз на днях придумал имя, но еще, кажется, даже не зарегистрировал. В голову пришла мысль, что хорошо было бы, если бы мое имя и название компании попало бы в главу “Благодарности” 😀. Я набрался наглости и написал автору с просьбой поблагодарить 🙄 меня в книге. Raphael согласился и, вот так, легко, мое имя и название компании появилось в одной из самых известных в мире книг по геномной селекции 🔝!

P.S. Raphael указал мою страну как Новая Зеландия, хотя, я просил, чтобы была Россия. Наверное, побоялся всей этой нездоровой международной обстановки.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍82
Головной офис моей компании (стол, стул и компьютер 🤣) находится в самом красивом здании Новосибирска на последнем этаже Технопарка. Шикарный вид на город, море и лес. Заехал я туда через бизнес-ускоритель АСТАРТ. Последнии лет 10 хотел пройти эту программу с идеей генетических тестов, но все откладывал. В прошлом году после того как мои зарубежные заказчики попрощались со мной я подумал, что самое время бизнес-ускориться 🙂. АСТАРТ состоит из лекций и работы над своим проектом с помощью трекера. В конце - защита проекта и питч перед экспертами. Прослушал лекции с огромным интересом. Обучали экономике, развитию продукта, поиску денег, ораторскому мастерству, продажам и многому другому. Лекторы рассказывали с энтузиазмом, юмором и желанием донести материал до слушателей. Также трекеры персонально помогали с проектом, рассказали с кем связаться, встретиться и тд. Очень благодарен Марии Галямовой и Ксении Ивановой за это.

После победы на конкурсе я стал резидентом бизнес-инкубатора и получил возможность заехать на последний этаж технопарка (тот, что на фото). Это особенное место со своим комьюнити. Администрация много помогает с продвижением. Большое спасибо Ане Айриянц, Роману Базарову и остальным! Недавно бесплатно поставили наш стенд на Новосибирском агропродовольственном форуме. Немного забавная ситуация приключилась. Послал заявку на этот форум. Через пару дней мне позвонила женщина из министерства сельского хозяйства и строгим голосом спросила: “По чьей протекции вы хотите попасть на форум?”. Я рассказал, что я из технопарка и позже она сказал, что все ок. Протекция оказалась сильная 😀. Узнал здесь о так называемой программе СибБиоНоц. Презентовал там свой проект. В программу не попал, но человек из комиссии познакомил меня с контактом из института животноводства, который познакомил с директором а он - с человеком из Томска. Поработали над проектом. Заработали денег.

P.S. На видео - мое интервью с АСТАРТ новосибирскому телеканалу.
🔥311
Как отличить понимание от непонимания

Около года назад на АСТАРТе познакомился я с Андреем Гунько. Андрей развивает свой продукт (www.everest-soft.pro), который позволят обучать сотрудников транспортной безопасности через виртуальную реальность. Как-то в перерыве между лекциями Андрей начал мне рассказывать про вещи далекие от генетики и всего того с чем я обычно имею дело. Разговор был про некие логические единицы, законы логики, Аристотеля, разницу между восточной и западной философией и как все это связано с процессами “понимания” и “непонимания”. В следующий год мы много раз встречались и за чашкой чая обсуждали его идеи. В результате на свет появилась наша совместная статья “Введение в безымянную логику”, которую мы опубликовали (https://habr.com/ru/articles/796227/) на Хабре.

Самое простое приложений этой работы в повседневной жизни - это формализованный инструмент для определения наличия у человека понимания (или не понимания) сути чего-либо. Определение наличия понимания - это то, что большинство из нас умеет делать на интуитивном уровне. Здесь же мы формально описали этот процесс.

В качестве примера обнаружения непонимания, возьмем такую простую сущность из геометрии как “окружность”. Окружность – это множество всех точек, равноудаленных от заданной точки на плоскости. Давайте в этом определении опустим одну часть, например, “на плоскости”. Получится, окружность – это множество всех точек, равноудаленных от заданной точки. Если руководствоваться последним определением окружности, то у одного человека возникнет картинка окружности на плоскости, а у другого - сфера в трехмерном пространстве так как сфера - это тоже множество точек равноудаленных от центра только в трехмерном пространстве. Также у одного и того же человека не будет однозначной картинки того, что же это есть окружность или сфера: в одном контексте будет окружностью, в другом - сфера. Этот пример показывает, что множественное трактование одной и той же сущности однозначно указывает на отсутствие понимания этой сущности.

Еще одно следствие нашей теории - это однозначный ответ на вопрос будет ли когда-нибудь искусственный интеллект (ИИ) настолько хорош, чтобы представлять угрозу человечеству. Безымянная логика показывает, что человеческий разум всегда будет лучше ИИ. Причина в том, что компьютеры могут оперировать только целостными логическим единицами (сущностями для, которых все части известны). Выполнение любой компьютерной программы завершиться аварийной остановкой, если на вход процессора приходит байт с отсутствующим битом (нецелостная логическая единица). Человек же в отличие от ИИ с легкостью оперирует как целостными так и с нецелостными логическим единицам. Например, возьмем нецелостную логическую единицу под названием “свобода”. Сегодня люди вкладывают разные смыслы в это слово потому, что у них отсутствует целостное понимание. Это приводит к множественному трактованию одного и того же как в примере с окружностью выше. Из-за этого понятие “свободы” в том виде, в котором оно используется сегодня невозможно запрограммировать. Однако, человек часто использует эту сущность. Это говорит о том, что человек всегда будет “лучше” ИИ.
🔥11👍91
Немного про геном

Геном человека состоит из последовательности 3 мрд нуклеотидов. Нуклеотиды - это такие молекулы, которые в геноме встречается четырех видов: аденин, гуанин, цитозин и тимин или кратко A, T, G и C. Геном записывается как последовательность этих букв, например, короткий сегмент может выглядеть так AAATGGGGCGCGCGCG. Примечательно, что геном на 99.9% одинаковый у всех людей и отличаемся мы друг от друга только лишь 3-5 млн нуклеотидами. Такие нуклеотиды называется полиморфными. По английский - Single-nucleotide polymorphism (SNP или снип по-русски). При поиске генетических факторов, влияющих на заболевания или признаки, исследуют как раз снипы так как только они варьируются в популяции и, соответственно, изменяют риск. Такое малое генетическое различие между людьми всего в 0.1% объясняется тем, что, вероятно, большая часть генома отвечает за базовые функции организма.

Есть один примечательный факт. На гены, в которых кодируется информация о белках (а белок - это основа жизни) приходится всего 1% всего генома. Остальную часть в прошлом веке назвали мусорной ДНК из-за того, что функция ее была малоизучена. Однако в 2022 году при изучении роста человека (https://www.nature.com/articles/s41586-022-05275-y) показали, что 21% генома покрыт снипами (нуклиотидами) влияющими на рост. Это означает, что снипы в так называемой мусорной области ДНК влияют на признак человека и мусорная ДНК важна также как и сами гены (и не какая она на самом деле не мусорная). Кстати, при общении с генетиками и биоинформатики я часто вижу, что у них почему-то сидит в голове эта концепция бесполезной “мусорной ДНК”.
👍23
Генетическая дистанция

Как писал в прошлом посте геном человека записывается в виде простой последовательности четырех букв A, T, G, C и выглядит это как AAATGGGGCGCGCGCG. Однако это запись только для одной хромосомы. У человека каждая хромосома идет в паре. Одна хромосома приходит от мамы, а вторая - от папы. Поэтому запись для генома человека нужно записывать в виде пары последовательностей и эти последовательности могут различаться, например:

AAATGGGGCGCGCGCG <- от папы
AGATGGGGCGCGCGCG <- от мамы

В примере выше жирным отмечен нуклеотид (второй слева), который в материнской хромосоме принимает значение G, а в отцовской - A. Этот нуклеотид полиморфный (снип). В генетике для поиска генетических маркеров ассоциированных с болезнями исследуют как правило снипы потому, что было показано, что именно снипы отвечают за большую часть фенотипической вариабельности. Для для каждого снипа выбирают так называемый “кодирующий” аллель (буковку). Например, выберем А для нашего снипа. Далее каждом снипу в геноме присвоим значение 0, 1 или 2 по количеству кодирующих аллелей. В нашем примере, у нас от папы пришел аллель (буковка) А, а от мамы - G. Таким образом у нас один кодирующий аллель А и следовательно, присваиваем этому снипу значение 1. Если была бы ситуация АА, то присвоили бы значение 2, если GG - то значение 0. Теперь, мы можем записать все снипы в геноме в качестве последовательности из нулей, единиц и двоек, например: 010202220100020.

Далее посмотрим на геном двух близнецов. Так как близнецы генетически идентичны, то мы будем наблюдать у одного близнеца, например, последовательность …010202220100020… и у второго такую же последовательность …010202220100020… . Если посмотрим на корреляцию между двумя этими последовательностями цифр, то увидим, что она будет равняться 100%. Корреляция между двумя геномами называется коэффициент родства (kinship). Он говорит о том какая часть генома у двух индивидуумов совпадает. У близнецов 100% генома одинаковое и, соответственно, коэффициент родства равен 100%. Если посмотрим на эту же самую метрику для двух братьев с общим родителями, то увидим, что коэффициент родства равен 50%, для братьев с одним общим родителем - 25%, для пары ребенок-родитель - 50%, для пары ребенок-дедушка - 25%. Чем дальше родство, тем меньше коэффициент. Для математической строгости нужно сказать, что перед тем как считать корреляцию нужно каждый снип нормировать: вычесть среднее значение и поделить на дисперсию снипа. Также надо сказать, что эти значения - среднии величины (мат. ожидания), а реальные варьируются. Коэффициент родства показывает генетическую дистанцию между двумя индивидуумами. Чем ближе коэффициент к 100%, тем меньше генетическая дистанция между парой людей.
👍15
Генетическая дистанция совпадает с географической

В исследовании за 2008 год взяли 3000 европейцев, посчитали для всех коэффициенты родства и, используя метод под названием Principle Component Analysis (PCA) построили график, который изображен на рисунке выше. Здесь каждая точка соответствует одному человеку. Абсолютные координаты имеют мало смысла, главное - это расстояние между точками. Чем оно больше, тем генетическая дистанция больше. В правом верхнем углу изображена карта Европы. Сравнивая график для генетических дистанций с этой картой видно, что они почти идеально накладывается друг на друга. Этот поразительный факт объясняется тем, что все человечество вышло из Африки и чем дальше от нее, тем генетически люди становились все меньше похоже на своих предков. Это и видно на графике.

Ваш геном также можно включить в этот анализ, поставить точку на график и увидить к какой популяции вы ближе.
👍8
Геномная селекция

Для начала о классической селекции. К началу 18 века люди поняли, что, если для размножения выбирать всякий раз более производительных животных и растения, то производительность в каждом поколении будет расти. Так в начале 18 века содержание сахара в сахарной свекле было 1.3% - 1.6%. Спустя сто лет селекции достигло 5%-6%. А в наше время это примерно 20%. Вес быка в начале 18 века был 168 кг, спустя 100 лет - 381 кг, а сейчас - 750 кг. Этот подход называется селекция основанная на измерении собственного фенотипа индивидуума.

Однако такой подход не работает для признаков сцепленных с полом. Признак сцепленный с полом - это тот, который возможно измерить только у животного одного пола. Например, мы можем измерить количества молока, которое приносит корова, но бык молока не приносит и померить его молочность невозможно. Для этого случая придумали так называемое тестирование по потомству. Чтобы измерить “молочность” быка измеряют среднюю молочность, например, 100 его дочерей. Такая оценка позволяет отбирать для размножения быков с высокой молочностью его будущих дочерей. Измеренный таким образом фенотип стали называеть племенной ценностью животного.

Тестирование по потомству занимает 4-5 лет. Примерно год после рождения бычок достигает половой зрелости, еще через год у него родятся дочери, еще через два дочери забеременеют, еще через год они родят и начнут доиться и потом спустя еще один год дойки мы сможем измерить производительности его дочерей. Все это время быка нужно содержать, что очень дорого.

Чтобы минимизировать расходы на содержание бычка, появилась необходимость не только измерять, но и предсказывать будущие фенотипы. Мы знаем, что родители передают своим потомками половину своего генетического материала. Это означает, что мы можем предсказать будущий фенотип быка как среднее фенотипов родителей. То есть, если папа-бык весит 600кг, а мама-корова весит 500 кг, то ожидаемый вес их ребенка будет (600+500)/2 = 550кг. Таким образом можно предсказать будущий фенотип используя фенотипы родителей. Кстати, в работе 2009 года мы исследовали предсказательную способность снипов и показали для человека, что средний рост родителей объясняет 40% (дисперсии) роста ребенка.

Дальше селекционеры (а конкретно Charles Henderson) догадались, что фенотип потомка можно предсказывать не только по фенотипу его родителей, но и по фенотипу всех его родственников (мамы, папы, дедушек, бабушек, прабабушек, племянников и тд). Charles Henderson в середине прошлого века разработал математический аппарат под названием BLUP (best linear unbiased prediction). Этот метод принимает на входе родословную животного и все доступные фенотипы, а на выходе предсказывает племенную ценность. Он объединяет в себе все предыдущие подходы в измерении племенной ценности животного: измерении собственного фенотипа, тестирование по потомству и использование родительского среднего. BLUP использует один простой феномен для предсказания будущих фенотипов, который можно выразить так: фенотипическая схожесть двух индивидуумов - это результат их генетической схожести. Таким образом племенная ценность животного (его будущий фенотип) предсказывается на основе генетической дистанции между им и другими животными и их фенотипами. А генетическая дистанция измеряется как дистанция между двумя индивидуумами в родословной.

И наконец каких-то 10-15 лет назад появилась так называемая геномная селекция ☄️. Геномная селекция отличается от классического BLUP только лишь тем, что генетическая дистанция между животными измеряется не по родословной, а с использованием снипов. Когда говорю “измеряется по родословной”, имею ввиду то, что измеряется математическое ожидание родства. Например, известно, что у детей с обоими общими родителями в среднем 50% генома совпадает. Значение 50% здесь - это математическое ожидание. В реальности величина общего генома находится в промежутке от ~37% до ~62% как было показано в 2006 году. Таким образом использование снипов для измерения генетической дистанции в BLUP существенно повышает точность предсказания будущего фенотипа.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10
Министр экономического развития РФ и губернатор НСО у нас в гостях

В прошлую субботу к нам в технопарк приезжал министр экономического развития РФ Максим Решетников и губернатор новосибирской области Андрей Травников. Я и Алексей рассказывали о нашем проекте строительства генетического центра в Новосибирске для племенного разведения утки и производства родительского стада. Передали им бизнес-план нашего уткацентра. Сейчас производство мяса утки в России на 100% зависит от импорта родительского стада, а с начала 2022 года поставки затруднились. Полное отсутствие возможности закупать родительское стадо приведет к кратному росту себестоимости производства мяса утки в России. Чтобы закрыть эту потребность, мы планируем построить генетический центр - репродуктор первого порядка для селекции утки. Основная продукция центра – это утята родительского стада, которые будут использоваться на птицефабриках для производства товарного стада.

Вспомнился мне один момент из Голландии. За некоторое время до церемонии защиты кандидатской диссертации сидел я дома и думал как бы мне сделать так, чтобы у меня была железобетонная уверенность, что все пройдет гладко. Даже после того как дата и время церемонии были утверждены, я хотел, чтобы ни у одного злопыхателя не появилось бы даже малейшего желания помешать моей защите. И я придумал гениальный план! Приглашу нашего президента ко мне на церемонию. Тогда уж точно все пройдет гладко. Никому же не нужны неприятности с президентами :-). Ходил я ходил с этой мыслью, но так все это и осталось на уровне идеи. Защита прошла гладко и так. До сих немного жалею, что не осуществил идею. Ситуация была идеальная: 2013 год был объявлен годом России и Голландии, как раз в это время в Голландию приезжал наш президент, моя защита проходила в день открытия нового корпуса университета и его посетила голландская королева. Да и, как я позже узнал, в самой Голландии принято приглашать первых лиц на подобные мероприятия. Может на открытие нашего нового генетического центра пригласить?
🔥26👍6
Занял второе место на конкурсе журнала Биомолекула

В прошлую субботу 20 апреля 2024 прошло награждение победителей конкурса «Био/Мол/Текст» в музее БИОТЕХ на ВДНХ. Моя статья “Настоящее и будущее генетических тестов” заняла второе призовое место в номинации “Свободная тема”! Приз 20 тыс руб отправляется аккуратно мне в карман 😁! Очень рад!
🔥21👍74