Автономная офтальмохирургия: следующий шаг после «тремор-режима»
Интраокулярная микроманипуляция упирается в две вечные вещи: ограниченное «понимание сцены» и глубину (на сколько микрон вы реально вошли). Цена ошибки разрыв, кровотечение, отслойка и еще что-нибудь. Поэтому автономная интраокулярная хирургия интересна не как шоу, а как попытка купить повторяемость и безопасность. Появилась работа, в которой авторы прямо заявляют ставку на более стабильный результат, сокращение обучения и потенциал для работы там, где человеческих рук не хватает.
Это китайцы. Команда описывает систему ARISE, автономного железного микрохирурга, который совмещает в себе макронаведение инструмента в глазу и микропозиционирование иглы у цели. Самый концентрат результата звучит почти буднично: «positioning errors were reduced by 79.87% and 54.61%» - по сравнению с ручной и телеманипулируемой роботической хирургией соответственно. Неприятно для самолюбия, но полезно для пациента, лол.
ARISE выполнял субретинальные инъекции и инъекции в центральную вену на фантомах, ex vivo свиных глаз и in vivo на животных. В ex vivo авторы заявляют 100% успеха для субретинальных (n=20), CRV (n=20) и BRV (n=20) инъекций, и в in vivo тоже 100% успеха (по n=16 в каждой группе). Если коротко, то игла приходит туда, куда её попросили, и делает это одинаково много раз подряд без «сегодня рука так, а завтра - сяк».
Пока это доклиническая демонстрация. До клиники нужно доказать безопасность на вариабельной анатомии, встроить систему в операционную и пройти регуляторный путь для автономного режима.
Работа важна не тем, что «робот сделал укол», а тем, что автономная витреоретинальная микроманипуляция собирается из проверяемых модулей, типа восприятие, калибровка, контроль траектории, критерии остановки. И главный вопрос тут теперь не «может ли робот», а «какую цену ошибки мы готовы принять и как её измеряем». Почему так? потому что в глазной хирургии иллюзии заканчиваются быстро - на сетчатке.
Вывод такой, что ARISE можно рассматривать как сигнал, что автономность подбирается к самым деликатным задачам в офтальмологии и если точность удастся перевести в клинику со всеми стоп-словами (правилами), то тогда мы получим не замену хирургу, а новый стандарт воспроизводимости.
#ИИ #Робот #Сетчатка #Наука #Демчинский
Интраокулярная микроманипуляция упирается в две вечные вещи: ограниченное «понимание сцены» и глубину (на сколько микрон вы реально вошли). Цена ошибки разрыв, кровотечение, отслойка и еще что-нибудь. Поэтому автономная интраокулярная хирургия интересна не как шоу, а как попытка купить повторяемость и безопасность. Появилась работа, в которой авторы прямо заявляют ставку на более стабильный результат, сокращение обучения и потенциал для работы там, где человеческих рук не хватает.
Это китайцы. Команда описывает систему ARISE, автономного железного микрохирурга, который совмещает в себе макронаведение инструмента в глазу и микропозиционирование иглы у цели. Самый концентрат результата звучит почти буднично: «positioning errors were reduced by 79.87% and 54.61%» - по сравнению с ручной и телеманипулируемой роботической хирургией соответственно. Неприятно для самолюбия, но полезно для пациента, лол.
ARISE выполнял субретинальные инъекции и инъекции в центральную вену на фантомах, ex vivo свиных глаз и in vivo на животных. В ex vivo авторы заявляют 100% успеха для субретинальных (n=20), CRV (n=20) и BRV (n=20) инъекций, и в in vivo тоже 100% успеха (по n=16 в каждой группе). Если коротко, то игла приходит туда, куда её попросили, и делает это одинаково много раз подряд без «сегодня рука так, а завтра - сяк».
Пока это доклиническая демонстрация. До клиники нужно доказать безопасность на вариабельной анатомии, встроить систему в операционную и пройти регуляторный путь для автономного режима.
Работа важна не тем, что «робот сделал укол», а тем, что автономная витреоретинальная микроманипуляция собирается из проверяемых модулей, типа восприятие, калибровка, контроль траектории, критерии остановки. И главный вопрос тут теперь не «может ли робот», а «какую цену ошибки мы готовы принять и как её измеряем». Почему так? потому что в глазной хирургии иллюзии заканчиваются быстро - на сетчатке.
Вывод такой, что ARISE можно рассматривать как сигнал, что автономность подбирается к самым деликатным задачам в офтальмологии и если точность удастся перевести в клинику со всеми стоп-словами (правилами), то тогда мы получим не замену хирургу, а новый стандарт воспроизводимости.
#ИИ #Робот #Сетчатка #Наука #Демчинский
👍10🔥7❤1👀1
Немного офтальмологических генераций, раз уж праздничек
🔥27❤🔥8❤6⚡3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🤷♀5🤔4👾3🤓2
Прикинь, миопия это не «слишком много экранов», а слишком мало света в тот момент, когда глаз изо всех сил пытается навести резкость. Тогда виноват не смартфон, а сценарий.
SUNY Optometry: миопия может ускоряться из-за длительной «ближней работы» в помещении при низкой освещенности, когда зрачок сужается не от яркости, а от аккомодации, и до сетчатки доходит меньше света. В работе показывали не «почему растёт миопия», а физиологию: у 34 взрослых (22-31 год) измеряли конвергенцию и размер зрачка при наведении фокуса на цель через -5 D дефокус. Авторы честно пишут о своих минусах, типа мало испытуемых и нет прямого измерения аккомодации (класс); а механизм «меньше света на сетчатке, когда ретинальная активность слабее - глаз растёт в длину» остаётся гипотезой.
Глянец начинается там, где гипотезу продают как приговор. Пока причинность не доказана: физиология «зрачок как диафрагма камеры» не равна прогрессии миопии у детей. Но она неплохо стыкуется с тем, что уже известно: близкая работа статистически связана с миопией (мета-анализ 78 исследований), время на улице ассоциировано с меньшей распространённостью, да и в обзоре IMI это подчёркивается как защитный фактор.
Маяк для не докторов и некоторых докторов: если ты ищешь «одного злодея», то будешь воевать со стеклом экрана, а если ищешь управляемые причины, то смотри на свет и на режим ближней нагрузки - там возможно и скрыта цена комфорта.
Про теорию саму - вроде как было про такое, да, но тут немного под другим углом и как будто бы ближе к механизму, хотя хочется еще докрутить до нормального уровня, да хотя бы с аккомадографом для объективности и людей побольше действительно.
#миопия #теория #Демчинский
SUNY Optometry: миопия может ускоряться из-за длительной «ближней работы» в помещении при низкой освещенности, когда зрачок сужается не от яркости, а от аккомодации, и до сетчатки доходит меньше света. В работе показывали не «почему растёт миопия», а физиологию: у 34 взрослых (22-31 год) измеряли конвергенцию и размер зрачка при наведении фокуса на цель через -5 D дефокус. Авторы честно пишут о своих минусах, типа мало испытуемых и нет прямого измерения аккомодации (класс); а механизм «меньше света на сетчатке, когда ретинальная активность слабее - глаз растёт в длину» остаётся гипотезой.
Глянец начинается там, где гипотезу продают как приговор. Пока причинность не доказана: физиология «зрачок как диафрагма камеры» не равна прогрессии миопии у детей. Но она неплохо стыкуется с тем, что уже известно: близкая работа статистически связана с миопией (мета-анализ 78 исследований), время на улице ассоциировано с меньшей распространённостью, да и в обзоре IMI это подчёркивается как защитный фактор.
Маяк для не докторов и некоторых докторов: если ты ищешь «одного злодея», то будешь воевать со стеклом экрана, а если ищешь управляемые причины, то смотри на свет и на режим ближней нагрузки - там возможно и скрыта цена комфорта.
Про теорию саму - вроде как было про такое, да, но тут немного под другим углом и как будто бы ближе к механизму, хотя хочется еще докрутить до нормального уровня, да хотя бы с аккомадографом для объективности и людей побольше действительно.
#миопия #теория #Демчинский
👍14❤9🐳4🤓3👨💻1
ChatGPT пропускает половину экстренных случаев!
Заголовок, который продает адреналин и на который, конечно же, сразу клюют доктора, потому что ИИ вдруг так элементарно стал удобно тупым. Но не все так просто.
В абстракте публикации Nature Medicine по сути заявляется, что LLM даёт неровную точность триажа, и на "краях" (остаться дома против немедленной госпитализации) возможны систематические промахи. Это звучит как готовая сенсация и многие, конечно же, цепляются именно за эту фразу с вкусными процентами, потому что удобно, быстро и цитируемо. Проблема в том, что полная методология по основной ссылке закрыта, поэтому предлагаю сделать скучную, но взрослую вещь: зайти не в заголовок, а под капот через официальные приложения издателя.
Дополнительная информация, в которой виден каркас дизайна: 60 клинических виньеток, 16 условий, всего 960 прогонов, фиксированные правила выбора A/B/C/D и критичная для интерпретации деталь - тестирование происходило 9–11 января 2026, то есть вопрос “какая именно версия модели использовалась" не риторический, а методологический. Почему? Да потому что 11 числа автоматически стала использоваться современная модель 5.2, а до этого была предыдущая - 5.1 и уже тут появляется грубое нарушение в сравнении.
Есть еще файл ревью, в котором авторы дают ссылку на гитхаб с воспроизводящими файлами рукописи.
А теперь где может прятаться желтизна даже при честных авторах. Во-первых, используется один шаблон промпта без анализа чувствительности, в итоге результат легко становится свойством формулировки, а не качества LLM. Во-вторых, структура кейсов: громкий процент может держаться на узком наборе сценариев (в рецензиях это обычно и разбирают и здесь это как раз тот документ, который стоит читать). В-третьих, принудительный дискретный выход (A/B/C/D без уточняющих вопросов) - это валидный стресс-тест интерфейса, но слабая модель реального взаимодействия врача с инструментом.
Короче маяк простой: если мы хотим спорить не эмоциями, а ответственностью, то спор надо вести по воспроизводимым данным и там станет видно, это проблема “LLM как такового” или проблема “как люди (в том числе врачи) им пользуются” (через одно место).
#LLM #ИИ #Демчинский
Заголовок, который продает адреналин и на который, конечно же, сразу клюют доктора, потому что ИИ вдруг так элементарно стал удобно тупым. Но не все так просто.
В абстракте публикации Nature Medicine по сути заявляется, что LLM даёт неровную точность триажа, и на "краях" (остаться дома против немедленной госпитализации) возможны систематические промахи. Это звучит как готовая сенсация и многие, конечно же, цепляются именно за эту фразу с вкусными процентами, потому что удобно, быстро и цитируемо. Проблема в том, что полная методология по основной ссылке закрыта, поэтому предлагаю сделать скучную, но взрослую вещь: зайти не в заголовок, а под капот через официальные приложения издателя.
Дополнительная информация, в которой виден каркас дизайна: 60 клинических виньеток, 16 условий, всего 960 прогонов, фиксированные правила выбора A/B/C/D и критичная для интерпретации деталь - тестирование происходило 9–11 января 2026, то есть вопрос “какая именно версия модели использовалась" не риторический, а методологический. Почему? Да потому что 11 числа автоматически стала использоваться современная модель 5.2, а до этого была предыдущая - 5.1 и уже тут появляется грубое нарушение в сравнении.
Есть еще файл ревью, в котором авторы дают ссылку на гитхаб с воспроизводящими файлами рукописи.
А теперь где может прятаться желтизна даже при честных авторах. Во-первых, используется один шаблон промпта без анализа чувствительности, в итоге результат легко становится свойством формулировки, а не качества LLM. Во-вторых, структура кейсов: громкий процент может держаться на узком наборе сценариев (в рецензиях это обычно и разбирают и здесь это как раз тот документ, который стоит читать). В-третьих, принудительный дискретный выход (A/B/C/D без уточняющих вопросов) - это валидный стресс-тест интерфейса, но слабая модель реального взаимодействия врача с инструментом.
Короче маяк простой: если мы хотим спорить не эмоциями, а ответственностью, то спор надо вести по воспроизводимым данным и там станет видно, это проблема “LLM как такового” или проблема “как люди (в том числе врачи) им пользуются” (через одно место).
#LLM #ИИ #Демчинский
❤9🔥4💯3🏆2
Инженерный путь нейроимпланта: от компьютерной модели до пациента
https://engineer.yadro.com/article/kak-razrabativayut-neiroimplanti-dlya-zreniya/
https://engineer.yadro.com/article/kak-razrabativayut-neiroimplanti-dlya-zreniya/
1🔥11🍾4👍3❤1
Новость, которая выглядит нишевой, а на деле может сильно сдвинуть офтальмологический ИИ (не про LLM).
Команда Johns Hopkins выложила на arXiv препринт о генерации синтетических ОКТ-сканов роговицы на основе физической модели. Авторы собирают пятислойную геометрию роговицы, задают оптические свойства тканей и прогоняют моделирование света методом Монте-Карло, чтобы получать не только изображения, но и пиксельно точные маски слоев. В наборе более 10 000 пар «скан + разметка» размером 1024x1024, включая здоровые и кератоконус подобные случаи и я считаю это круто.
Почему это важно. Узкое место здесь не только в моделях, а в данных: клинические ОКТ датасеты трудно собирать, они чувствительны с точки зрения приватности, а качественная послойная разметка стоит дорого. А здесь ставка сделана на управляемую синтетику, где можно отдельно менять кривизну, толщину слоев, шум и затухание сигнала по глубине. Иначе говоря, это не просто красивые картинки, а нормальный стенд для проверки алгоритмов.
Важно то, что пока это проверяли в основном на здоровых примерах, то есть перенос на реальную клинику авторы еще не делали, оставили на следующий этап.
Вывод здесь довольно спокойный. Рынок медизображений все чаще выигрывает не от самой громкой архитектуры, а от данных, у которых есть физика с математикой, контроль и нормальная разметка. Если эта линия дойдет до реальных клинических ОКТ и хирургической навигации, то ценность будет в предсказуемости результата, красота.
#ОКТ #ИИ #Демчинский
Команда Johns Hopkins выложила на arXiv препринт о генерации синтетических ОКТ-сканов роговицы на основе физической модели. Авторы собирают пятислойную геометрию роговицы, задают оптические свойства тканей и прогоняют моделирование света методом Монте-Карло, чтобы получать не только изображения, но и пиксельно точные маски слоев. В наборе более 10 000 пар «скан + разметка» размером 1024x1024, включая здоровые и кератоконус подобные случаи и я считаю это круто.
Почему это важно. Узкое место здесь не только в моделях, а в данных: клинические ОКТ датасеты трудно собирать, они чувствительны с точки зрения приватности, а качественная послойная разметка стоит дорого. А здесь ставка сделана на управляемую синтетику, где можно отдельно менять кривизну, толщину слоев, шум и затухание сигнала по глубине. Иначе говоря, это не просто красивые картинки, а нормальный стенд для проверки алгоритмов.
Важно то, что пока это проверяли в основном на здоровых примерах, то есть перенос на реальную клинику авторы еще не делали, оставили на следующий этап.
Вывод здесь довольно спокойный. Рынок медизображений все чаще выигрывает не от самой громкой архитектуры, а от данных, у которых есть физика с математикой, контроль и нормальная разметка. Если эта линия дойдет до реальных клинических ОКТ и хирургической навигации, то ценность будет в предсказуемости результата, красота.
#ОКТ #ИИ #Демчинский
1❤11👍5😱2🔥1
Сделай мне красиво и быстро: как цифровой комфорт тихо отключает критическое мышление
Одним из страхов при использовании больших языковых моделей является возможное отупление. Может быть, иногда это и так. Но мой опыт часто показывает обратное: при хорошем сценарии такие системы ускоряют вход в тему, помогают увидеть структуру задачи и быстрее замечать слабые места. Поэтому возникает нормальный вопрос: как именно это работает, и в каких случаях это полезно, а когда - вредно. Пополняем копилочку.
Свежие рандомизированные контролируемые эксперименты дают неприятный, но важный ответ. Сам по себе быстрый и гладкий ответ машины ещё не означает, что человек стал сильнее. В исследовании компании Антропик разработчики, изучавшие новую библиотеку (речь о программировании) с помощью помощника на основе искусственного интеллекта, почти не выиграли во времени, зато хуже усвоили материал: итоговый результат теста оказался ниже на 17%, а особенно просела отладка, именно там, где потом приходится думать самому 😒
Попытка сделать педагогического помощника тоже не стала чудом. В эксперименте помощник, построенный на сократическом диалоге, действительно усиливал рефлексию и метапознание, но не улучшил точность ответов и не сделал поиск информации качественнее. Более того, участники заметно тянулись к быстрым утвердительным ответам вместо проверки оснований 😞
Ещё один важный результат: когда людям показывают не только совет системы, но и первичные основания, то они чаще опираются на доказательства, а не на кайфовые объяснения. В работе Уоррена, например, участники в большинстве случаев принимали решение именно по доказательствам, а не по сопроводительному объяснению. Это важный сигнал для проектирования: красивое объяснение не равно хорошему мышлению, если пользователь не видит, на чём оно стоит. Не случайно сами разработчики ллм уже начали выносить отдельные учебные режимы, где цель не только ответ, но и понимание.
Короче пока что так:
❌ Плохо, когда система превращает человека в оператора кнопки «сделай за меня».
✅ Хорошо, когда система сначала удерживает человека в мысли, потом показывает основание и только после этого ускоряет. Тогда это не костыль для ума, а тренажёр с усилителем.
#LLM #Образование #Демчинский
Одним из страхов при использовании больших языковых моделей является возможное отупление. Может быть, иногда это и так. Но мой опыт часто показывает обратное: при хорошем сценарии такие системы ускоряют вход в тему, помогают увидеть структуру задачи и быстрее замечать слабые места. Поэтому возникает нормальный вопрос: как именно это работает, и в каких случаях это полезно, а когда - вредно. Пополняем копилочку.
Свежие рандомизированные контролируемые эксперименты дают неприятный, но важный ответ. Сам по себе быстрый и гладкий ответ машины ещё не означает, что человек стал сильнее. В исследовании компании Антропик разработчики, изучавшие новую библиотеку (речь о программировании) с помощью помощника на основе искусственного интеллекта, почти не выиграли во времени, зато хуже усвоили материал: итоговый результат теста оказался ниже на 17%, а особенно просела отладка, именно там, где потом приходится думать самому 😒
Попытка сделать педагогического помощника тоже не стала чудом. В эксперименте помощник, построенный на сократическом диалоге, действительно усиливал рефлексию и метапознание, но не улучшил точность ответов и не сделал поиск информации качественнее. Более того, участники заметно тянулись к быстрым утвердительным ответам вместо проверки оснований 😞
Ещё один важный результат: когда людям показывают не только совет системы, но и первичные основания, то они чаще опираются на доказательства, а не на кайфовые объяснения. В работе Уоррена, например, участники в большинстве случаев принимали решение именно по доказательствам, а не по сопроводительному объяснению. Это важный сигнал для проектирования: красивое объяснение не равно хорошему мышлению, если пользователь не видит, на чём оно стоит. Не случайно сами разработчики ллм уже начали выносить отдельные учебные режимы, где цель не только ответ, но и понимание.
Короче пока что так:
#LLM #Образование #Демчинский
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥3❤1
Трёхдневный AI-кэмп для лидеров в AI, ML & Data Science. Тех, кто управляет продуктами и технологиями в мире данных и двигает индустрию вперёд.
Мощная программа, сильные спикеры, а с меня ночное выступление на тему киборгов.
http://aspectum.tech/tpost/e7tnnu73f1-snowbase
Мощная программа, сильные спикеры, а с меня ночное выступление на тему киборгов.
http://aspectum.tech/tpost/e7tnnu73f1-snowbase
🔥6❤3
Напридумывали разных ИОЛ и теперь их надо как-то сравнивать. Обычно как это происходит: пациент жалуется на ореолы, блики, засветы вокруг фар и фонарей, врач это фиксирует, а дальше начинаются какие-то интерпретации. Клево, конечно, но научности тут не так много, поскольку слишком многое зависит от восприятия, адаптации и даже от того, как человек вообще описывает дискомфорт. Поэтому испанцы такие: "А давайте сначала измерим эти засветы объективно, на стенде и в цифрах" - и сделали стенд.
В работе ИОЛ ставили в модель глаза, использовали точечный источник света, собирали серию снимков в HDR и считали радиус ореолов с их яркостью. Получилось довольно наглядно:
🔻 у монофокальных ИОЛ ореол около 0,4°,
🔻 у недифракционных EDOF примерно 0,45-0,63°,
🔻 у дифракционных трифокальных уже 0,84-1,22°, и он не только больше, но и ярче.
То есть сама оптическая схема действительно оставляет разный световой след, и это уже не разговор на уровне ощущений, а измеряемый факт.
Интересно еще сравнить с тем, что в клинике получают в плане ощущений пациентами. Мета-анализ сравнений трифокальных и гибридных EDOF показал, что трифокалы чаще связаны с ореолами, хотя при этом обычно дают лучший результат вблизи. В то же время большой обзор Cochrane предлагает не драматизировать, потому что по субъективным жалобам разница между группами не всегда выглядит убедительно, потому что стенд измеряет оптику, а пациент живет уже на стыке оптики, нейроадаптации и условий освещения (вот в чем проблема оценки со стороны пользователей линз).
Такое бы еще для разных алгоритмов лазерной коррекции замутить, а может использовать моделирование на роговичных ОКТ, о которых я писал тут, хз. Знаю некоторые приборы моделируют рассеивание точки, но это немного не то, как минимум в этой функции нет сравнения алгоритмов.
Короче в чем прикол работы: она не переворачивает клинику и не создает вау, она дает ЛИНЕЙКУ. Раньше мы в основном слушали, что человек говорит про свет ночью, а с этой штукенцией теперь появляется шанс сначала понять, что именно делает сама линза, а уже потом спорить, насколько это почувствует конкретный пациент.
#ИОЛ #Демчинский
В работе ИОЛ ставили в модель глаза, использовали точечный источник света, собирали серию снимков в HDR и считали радиус ореолов с их яркостью. Получилось довольно наглядно:
То есть сама оптическая схема действительно оставляет разный световой след, и это уже не разговор на уровне ощущений, а измеряемый факт.
Интересно еще сравнить с тем, что в клинике получают в плане ощущений пациентами. Мета-анализ сравнений трифокальных и гибридных EDOF показал, что трифокалы чаще связаны с ореолами, хотя при этом обычно дают лучший результат вблизи. В то же время большой обзор Cochrane предлагает не драматизировать, потому что по субъективным жалобам разница между группами не всегда выглядит убедительно, потому что стенд измеряет оптику, а пациент живет уже на стыке оптики, нейроадаптации и условий освещения (вот в чем проблема оценки со стороны пользователей линз).
Такое бы еще для разных алгоритмов лазерной коррекции замутить, а может использовать моделирование на роговичных ОКТ, о которых я писал тут, хз. Знаю некоторые приборы моделируют рассеивание точки, но это немного не то, как минимум в этой функции нет сравнения алгоритмов.
Короче в чем прикол работы: она не переворачивает клинику и не создает вау, она дает ЛИНЕЙКУ. Раньше мы в основном слушали, что человек говорит про свет ночью, а с этой штукенцией теперь появляется шанс сначала понять, что именно делает сама линза, а уже потом спорить, насколько это почувствует конкретный пациент.
#ИОЛ #Демчинский
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2❤1