CES2026: Gemini на Google TV
На CES2026 Google показал прокачанный Gemini для телевизоров, добавив Nano Banana и Veo — теперь можно генерить картинки и видео прямо на экране.
Поиск по Google Photos, стилизованные слайдшоу, визуальные ответы со спортивными обновлениями в реальном времени.
Ещё из интересного — голосовое управление настройками:
говоришь - «экран тусклый» → яркость увеличится,
скажешь - «не слышу диалоги» → голосав голове станут громче.
Скоро будем как те шарообразные жители в креслах из мультика Wall-E :)
#Gemini #GoogleTV #CES2026
———
@tsingular
На CES2026 Google показал прокачанный Gemini для телевизоров, добавив Nano Banana и Veo — теперь можно генерить картинки и видео прямо на экране.
Поиск по Google Photos, стилизованные слайдшоу, визуальные ответы со спортивными обновлениями в реальном времени.
Ещё из интересного — голосовое управление настройками:
говоришь - «экран тусклый» → яркость увеличится,
скажешь - «не слышу диалоги» → голоса
Скоро будем как те шарообразные жители в креслах из мультика Wall-E :)
#Gemini #GoogleTV #CES2026
———
@tsingular
😁15❤3🆒3🗿1
Media is too big
VIEW IN TELEGRAM
А вот и новый Atlas от Boston Dynamics подъехал.
Может работать, может танцевать.
Сам меняет батареи.
Работает под управлением Gemini.
- батареи хватает на 4 часа
- вес 76 кг
- рост 188 см
- 56 степеней свободы
- алюминий+титан
- максимальный груз 50кг, при длительной нагрузке - 30кг
Как вам такой работничек?
#BostonDynamics #Atlas #роботы
———
@tsingular
Может работать, может танцевать.
Сам меняет батареи.
Работает под управлением Gemini.
- батареи хватает на 4 часа
- вес 76 кг
- рост 188 см
- 56 степеней свободы
- алюминий+титан
- максимальный груз 50кг, при длительной нагрузке - 30кг
Как вам такой работничек?
#BostonDynamics #Atlas #роботы
———
@tsingular
⚡15🤯4👾4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё шоурил по Атласу. Тут, понятно, рендер, но показывает сценарии применимости.
#Atlas #BostonDynamics #роботы
———
@tsingular
#Atlas #BostonDynamics #роботы
———
@tsingular
✍6👾4⚡2
AMD на CES 2026: новые чипы Ryzen AI 400 и геймерский 9850X3D
AMD анонсировала Ryzen AI 400 — обновление прошлогодних чипов с небольшим разгоном (+100 МГц до 5.2 ГГц) и поддержкой памяти до 8533 МТ/с.
Обещают 1.3× по многозадачности и 1.7× по генерации контента в равнении с Intel Core Ultra 9 288V (Lunar Lake).
Для геймеров — Ryzen 7 9850X3D с 104 МБ кэша и бустом 5.6 ГГц. Плюс обновленная технология трассировки лучей Redstone.
Сравнивают с поколением Intel 2024 года, хотя новый Core Ultra Series 3 (Panther Lake) уже вышел.
#AMD #Ryzen #CES2026
———
@tsingular
AMD анонсировала Ryzen AI 400 — обновление прошлогодних чипов с небольшим разгоном (+100 МГц до 5.2 ГГц) и поддержкой памяти до 8533 МТ/с.
Обещают 1.3× по многозадачности и 1.7× по генерации контента в равнении с Intel Core Ultra 9 288V (Lunar Lake).
Для геймеров — Ryzen 7 9850X3D с 104 МБ кэша и бустом 5.6 ГГц. Плюс обновленная технология трассировки лучей Redstone.
Сравнивают с поколением Intel 2024 года, хотя новый Core Ultra Series 3 (Panther Lake) уже вышел.
#AMD #Ryzen #CES2026
———
@tsingular
👍5🔥2
Nvidia показала «рассуждающий» ИИ для беспилотных автомобилей
Дженсен Хуанг представил Alpamayo-R1 — систему для автономного вождения с рассуждениями.
Вместо чёрного ящика модель генерирует цепочки причинно-следственных объяснений перед каждым манёвром.
Архитектура:
- Cosmos-Reason обрабатывает камеры через структурированную токенизацию
- Диффузионный декодер строит траекторию за 8.75 мс
- Полный цикл решения: 99 мс на RTX 6000 Pro Blackwell
Результаты в симуляции AlpaSim:
- Потеря дороги снизились на 35% (с 17% до 11%)
- Опасные сближения сократились на 25%
- Точность планирования выросла на 12% в сложных сценариях
Железо: DRIVE AGX Thor — 1000 INT8 TOPS, 350 Вт, сертификация ISO 26262 ASIL-D.
Обучение: 700K аннотированных примеров с цепочками рассуждений плюс RL-дообучение.
Мерседес и другие партнёры уже тестируют платформу на дорогах.
#Nvidia #Alpamayo #CES2026
———
@tsingular
Дженсен Хуанг представил Alpamayo-R1 — систему для автономного вождения с рассуждениями.
Вместо чёрного ящика модель генерирует цепочки причинно-следственных объяснений перед каждым манёвром.
Архитектура:
- Cosmos-Reason обрабатывает камеры через структурированную токенизацию
- Диффузионный декодер строит траекторию за 8.75 мс
- Полный цикл решения: 99 мс на RTX 6000 Pro Blackwell
Результаты в симуляции AlpaSim:
- Потеря дороги снизились на 35% (с 17% до 11%)
- Опасные сближения сократились на 25%
- Точность планирования выросла на 12% в сложных сценариях
Железо: DRIVE AGX Thor — 1000 INT8 TOPS, 350 Вт, сертификация ISO 26262 ASIL-D.
Обучение: 700K аннотированных примеров с цепочками рассуждений плюс RL-дообучение.
Мерседес и другие партнёры уже тестируют платформу на дорогах.
#Nvidia #Alpamayo #CES2026
———
@tsingular
🔥8👍3⚡2❤1😢1
Intel Core Ultra Series 3 — первые чипы на Intel 18A
Intel на CES 2026 представила Core Ultra Series 3 (Panther Lake) — первую платформу на техпроцессе Intel 18A, полностью разработанную и произведённую в США.
Что внутри топовых X9/X7:
- До 16 CPU-ядер + 12 Xe-ядер (интегрированная Arc)
- 50 NPU TOPS для AI-задач
- +60% скорость в многопоточных задачах по сравнению с Lunar Lake
- +77% в играх vs Lunar Lake
- До 27 часов автономности (Netflix, 1080p)
Главное изменение — впервые процессоры сертифицированы для edge-применений: робототехника, умные города, автоматизация, медицина. Работа 24/7, расширенный температурный диапазон.
Edge-бенчмарки vs NVIDIA Jetson Orin AGX 64GB:
1.9× быстрее на LLM (вывод первого токена)
2.3× лучше производительность/ватт/доллар на видеоаналитике
4.5× выше обработка на VLA-моделях
Доступность:
- Предзаказ: 6 января 2026
- Продажи: 27 января 2026
- Edge-системы: Q2 2026
200+ дизайнов ноутбуков от партнёров в первом полугодии.
#Intel #CES2026 #PantherLake
———
@tsingular
Intel на CES 2026 представила Core Ultra Series 3 (Panther Lake) — первую платформу на техпроцессе Intel 18A, полностью разработанную и произведённую в США.
Что внутри топовых X9/X7:
- До 16 CPU-ядер + 12 Xe-ядер (интегрированная Arc)
- 50 NPU TOPS для AI-задач
- +60% скорость в многопоточных задачах по сравнению с Lunar Lake
- +77% в играх vs Lunar Lake
- До 27 часов автономности (Netflix, 1080p)
Главное изменение — впервые процессоры сертифицированы для edge-применений: робототехника, умные города, автоматизация, медицина. Работа 24/7, расширенный температурный диапазон.
Edge-бенчмарки vs NVIDIA Jetson Orin AGX 64GB:
1.9× быстрее на LLM (вывод первого токена)
2.3× лучше производительность/ватт/доллар на видеоаналитике
4.5× выше обработка на VLA-моделях
Доступность:
- Предзаказ: 6 января 2026
- Продажи: 27 января 2026
- Edge-системы: Q2 2026
200+ дизайнов ноутбуков от партнёров в первом полугодии.
#Intel #CES2026 #PantherLake
———
@tsingular
👍8🔥4⚡2🤔2
Пекин нацелился на триллион юаней в ИИ-индустрии за два года
Пекин запустил план развития ИИ-отрасли с целью превысить 1 трлн юаней ($142 млрд) к 2028 году.
В рамках девяти инициатив власти планируют построить вычислительный кластер на 100 тысячах отечественных чипов, вывести на биржу 10+ ИИ-компаний и вырастить 20+ единорогов.
Интересно, что сам core ИИ-рынок Китая уже перевалил за триллион юаней в 2025-м, на год раньше плана. Прорыв обеспечили софт и сервисы.
Китай строит экосистему через привлечение талантов, долгосрочный капитал и поддержку опенсорса.
На сентябрь 2025-го в стране 5300+ ИИ-компаний - 15% от мирового числа.
#Китай #планы
———
@tsingular
Пекин запустил план развития ИИ-отрасли с целью превысить 1 трлн юаней ($142 млрд) к 2028 году.
В рамках девяти инициатив власти планируют построить вычислительный кластер на 100 тысячах отечественных чипов, вывести на биржу 10+ ИИ-компаний и вырастить 20+ единорогов.
Интересно, что сам core ИИ-рынок Китая уже перевалил за триллион юаней в 2025-м, на год раньше плана. Прорыв обеспечили софт и сервисы.
Китай строит экосистему через привлечение талантов, долгосрочный капитал и поддержку опенсорса.
На сентябрь 2025-го в стране 5300+ ИИ-компаний - 15% от мирового числа.
#Китай #планы
———
@tsingular
⚡8🔥6✍1
Покупка Manus за $2 млрд Метой* может забуксовать
Meta* выкупила сингапурскийкитайский стартап Manus за $2 млрд, но китайские товарищи против.
Вашингтон сделку одобрил — несмотря на то, что ранее Казначейство разбиралось с инвестициями Benchmark в китайские ИИ-компании.
Пекин же начал проверку: не нарушил ли Manus экспортные ограничения, переехав из Китая в Сингапур.
Такие переезды уже окрестили «Singapore washing» (Сингапурская мойка :) ), - способ обойти китайский экспортный контроль технологий.
И теперь КНР может применить механизм, похожий на блокировку продажи TikTok: запретить экспорт технологий без лицензии.
По китайским законам основатели Manus могут попасть под уголовную ответственность, если вывезли запрещённые алгоритмы без разрешения.
А сама сделка может затянуться на 6–18 месяцев из-за расследования.
Meta - запрещенная в РФ организация, признанная террористической
#Meta #Manus #Singapore
———
@tsingular
Meta* выкупила сингапурский
Вашингтон сделку одобрил — несмотря на то, что ранее Казначейство разбиралось с инвестициями Benchmark в китайские ИИ-компании.
Пекин же начал проверку: не нарушил ли Manus экспортные ограничения, переехав из Китая в Сингапур.
Такие переезды уже окрестили «Singapore washing» (Сингапурская мойка :) ), - способ обойти китайский экспортный контроль технологий.
И теперь КНР может применить механизм, похожий на блокировку продажи TikTok: запретить экспорт технологий без лицензии.
По китайским законам основатели Manus могут попасть под уголовную ответственность, если вывезли запрещённые алгоритмы без разрешения.
А сама сделка может затянуться на 6–18 месяцев из-за расследования.
Meta - запрещенная в РФ организация, признанная террористической
#Meta #Manus #Singapore
———
@tsingular
👍11✍3⚡3❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
EngineAI T800 на CES2026
В режиме боя работает 30 минут, потом перегрев актуаторов.
#FigureAI #T800 #CES2026
------
@tsingular
В режиме боя работает 30 минут, потом перегрев актуаторов.
#FigureAI #T800 #CES2026
------
@tsingular
🔥11👾3❤1⚡1
Cursor: динамический контекст
Обновление Cursor позволило сэкономить до 47% на токенах.
Вместо того, чтобы пихать в статический промпт всё сразу, агент теперь через динамическое обнаружение контекста сам определяет чего не хватает и достаёт нужный контекст по запросу.
Пять сценариев:
- Длинные ответы команд при использовании инструментов сначала пишутся в файл, а потом уже агент смотрит через tail и если нужно больше информации - дочитывает и работает только с нужным блоком.
- История чата тоже сохраняется в файл. При саммаризации агент может вернуться и найти забытые детали
- Поддержка Agent Skills - специализированные навыки тоже работают через файлы (в самом Крусоре Скиллы пока в бете)
- Описания MCP-инструментов тоже теперь хранятся в папке, а не в промпте. В память подгружаются только базовые названия и описания тулов, а детали хранятся в файле и подтягиваются при вызове инструмента. Это позволило снизить расход токенов на 47%.
- логи терминальных сессий теперь тоже синхронизируются с файловой системой по примеру CLI агентов, так что теперь можно спросить "почему упало?" без копирования из терминала.
#Cursor #dev #DynamicContext
———
@tsingular
Обновление Cursor позволило сэкономить до 47% на токенах.
Вместо того, чтобы пихать в статический промпт всё сразу, агент теперь через динамическое обнаружение контекста сам определяет чего не хватает и достаёт нужный контекст по запросу.
Пять сценариев:
- Длинные ответы команд при использовании инструментов сначала пишутся в файл, а потом уже агент смотрит через tail и если нужно больше информации - дочитывает и работает только с нужным блоком.
- История чата тоже сохраняется в файл. При саммаризации агент может вернуться и найти забытые детали
- Поддержка Agent Skills - специализированные навыки тоже работают через файлы (в самом Крусоре Скиллы пока в бете)
- Описания MCP-инструментов тоже теперь хранятся в папке, а не в промпте. В память подгружаются только базовые названия и описания тулов, а детали хранятся в файле и подтягиваются при вызове инструмента. Это позволило снизить расход токенов на 47%.
- логи терминальных сессий теперь тоже синхронизируются с файловой системой по примеру CLI агентов, так что теперь можно спросить "почему упало?" без копирования из терминала.
#Cursor #dev #DynamicContext
———
@tsingular
🔥6✍5⚡4❤2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Продолжу за интересные ништяки с CES 2026.
ИИ обождет пока, там кроме LTX-2, пока затишье.
Вот такой Леново ноут #ябвзял.
Нажатием одной кнопки, дисплей из 16 дюймов превращается в 21 и даже в 24 дюйма.
Остаётся понять, сколько весит эта шняга.
@cgevent
ИИ обождет пока, там кроме LTX-2, пока затишье.
Вот такой Леново ноут #ябвзял.
Нажатием одной кнопки, дисплей из 16 дюймов превращается в 21 и даже в 24 дюйма.
Остаётся понять, сколько весит эта шняга.
@cgevent
🔥20👍10
🏥 Первый пошёл: AI начал выписывать рецепты в США
Штат Юта через Office of AI Policy запустил пилот с Doctronic — AI-платформой, которая самостоятельно продлевает рецепты на хронические заболевания. Без участия врача.
Это первая в США официально разрешённая программа, где ИИ принимает медицинские решения по назначению лекарств.
Как работает:
- Пациент заходит на сайт, подтверждает геолокацию (Юта)
- Система подтягивает историю рецептов
- AI задаёт те же клинические вопросы, что и врач
- Если всё ок — рецепт уходит напрямую в аптеку
Цена: $4 за продление
Ограничения проекта:
- 190 базовых препаратов для хроников
- Исключены: обезболивающие, ADHD-препараты, инъекции
- Работает в рамках "регуляторной песочницы" — до года
Цифры Doctronic:
- 99.2% совпадение с назначениями врачей (500 кейсов)
- Компания застрахована по тем же стандартам, что и врачи
Реакция:
AMA (Американская медицинская ассоциация) предупреждает о рисках. FDA пока молчит — говорят, это вне их юрисдикции.
Параллельно в Конгрессе лежит законопроект H.R.238, который хочет признать AI "практикующим специалистом" на федеральном уровне.
Почему важно:
- 80% всей активности с лекарствами, - это продления рецептов
- Несоблюдение режима приёма, - одна из главных причин госпитализаций
- Юта тестирует модель, которую уже копируют Аризона, Техас, Вайоминг
Надо еще персонального ИИ агента, который будет следить за приёмом лекарств дома.
А то наберут рецептов, накупят лекарств даже, а потом не принимают и говорят, - что то ваше лечение не работает :)
#Healthcare #Doctronic #медицина #США
———
@tsingular
Штат Юта через Office of AI Policy запустил пилот с Doctronic — AI-платформой, которая самостоятельно продлевает рецепты на хронические заболевания. Без участия врача.
Это первая в США официально разрешённая программа, где ИИ принимает медицинские решения по назначению лекарств.
Как работает:
- Пациент заходит на сайт, подтверждает геолокацию (Юта)
- Система подтягивает историю рецептов
- AI задаёт те же клинические вопросы, что и врач
- Если всё ок — рецепт уходит напрямую в аптеку
Цена: $4 за продление
Ограничения проекта:
- 190 базовых препаратов для хроников
- Исключены: обезболивающие, ADHD-препараты, инъекции
- Работает в рамках "регуляторной песочницы" — до года
Цифры Doctronic:
- 99.2% совпадение с назначениями врачей (500 кейсов)
- Компания застрахована по тем же стандартам, что и врачи
Реакция:
AMA (Американская медицинская ассоциация) предупреждает о рисках. FDA пока молчит — говорят, это вне их юрисдикции.
Параллельно в Конгрессе лежит законопроект H.R.238, который хочет признать AI "практикующим специалистом" на федеральном уровне.
Почему важно:
- 80% всей активности с лекарствами, - это продления рецептов
- Несоблюдение режима приёма, - одна из главных причин госпитализаций
- Юта тестирует модель, которую уже копируют Аризона, Техас, Вайоминг
Надо еще персонального ИИ агента, который будет следить за приёмом лекарств дома.
А то наберут рецептов, накупят лекарств даже, а потом не принимают и говорят, - что то ваше лечение не работает :)
#Healthcare #Doctronic #медицина #США
———
@tsingular
🔥10 6❤5⚡2👍1 1
Media is too big
VIEW IN TELEGRAM
OpenAI запустил ChatGPT Health
OpenAI выкатил отдельное пространство внутри ChatGPT для медицинских данных - ChatGPT Health. Подключаются анализы, записи врачей через b.well, Apple Health, MyFitnessPal.
Система изолирована от основного чата - отдельное шифрование, раздельная память. Данные из Health никогда не попадут в обычные диалоги, но контекст оттуда может использоваться внутри медицинского раздела.
Разрабатывали совместно с 260 врачами из 60 стран - собрали 600 тысяч оценок ответов по 30 клиническим направлениям.
Создали HealthBench - фреймворк для оценки безопасности медицинских ответов.
Обещают не использовать медицинские диалоги для обучения моделей. Но данные уходят на мониторинг безопасности и детекцию злоупотреблений - сколько там хранятся и как технически реализована изоляция от тренировочных пайплайнов, OpenAI не раскрывает.
Отдельный вопрос, - будут ли злоупотребления автоматом отсылаться в органы правопорядка.
Доступ по вейтлисту для всех планов кроме Европы, Швейцарии, UK и подсанкционных стран.
#ChatGPT #Health
———
@tsingular
OpenAI выкатил отдельное пространство внутри ChatGPT для медицинских данных - ChatGPT Health. Подключаются анализы, записи врачей через b.well, Apple Health, MyFitnessPal.
Система изолирована от основного чата - отдельное шифрование, раздельная память. Данные из Health никогда не попадут в обычные диалоги, но контекст оттуда может использоваться внутри медицинского раздела.
Разрабатывали совместно с 260 врачами из 60 стран - собрали 600 тысяч оценок ответов по 30 клиническим направлениям.
Создали HealthBench - фреймворк для оценки безопасности медицинских ответов.
Обещают не использовать медицинские диалоги для обучения моделей. Но данные уходят на мониторинг безопасности и детекцию злоупотреблений - сколько там хранятся и как технически реализована изоляция от тренировочных пайплайнов, OpenAI не раскрывает.
Отдельный вопрос, - будут ли злоупотребления автоматом отсылаться в органы правопорядка.
Доступ по вейтлисту для всех планов кроме Европы, Швейцарии, UK и подсанкционных стран.
#ChatGPT #Health
———
@tsingular
✍4👍2🔥2⚡1
Razer выпустила рабочую станцию для разработчиков ИИ
Razer анонсировала Forge, - рабочую станцию для обучения моделей, которая умещает до четырёх профессиональных видеокарт от AMD или Nvidia.
Станция построена на процессоре AMD Ryzen Threadripper Pro, поддерживает блок питания до 2000W, восемь слотов DDR5 и два 10Gb Ethernet-порта.
Дизайн позволяет собирать несколько башен в кластер в стойку.
Цены пока нет.
Попутно компания переименовала мощный ноутбук Blade 18 и внешний GPU-бокс Core X V2 в «железо для разработки ИИ».
Последний тренд: после персонального суперкомпьютера Nvidia Digits с прошлогоднего CES, игровые производители массово переквалифицируются в поставщиков оборудования для машинного обучения.
Продавать ИИ железо интереснее, чем тупо Игровое :)
#Razer #Forge #Threadripper
———
@tsingular
Razer анонсировала Forge, - рабочую станцию для обучения моделей, которая умещает до четырёх профессиональных видеокарт от AMD или Nvidia.
Станция построена на процессоре AMD Ryzen Threadripper Pro, поддерживает блок питания до 2000W, восемь слотов DDR5 и два 10Gb Ethernet-порта.
Дизайн позволяет собирать несколько башен в кластер в стойку.
Цены пока нет.
Попутно компания переименовала мощный ноутбук Blade 18 и внешний GPU-бокс Core X V2 в «железо для разработки ИИ».
Последний тренд: после персонального суперкомпьютера Nvidia Digits с прошлогоднего CES, игровые производители массово переквалифицируются в поставщиков оборудования для машинного обучения.
Продавать ИИ железо интереснее, чем тупо Игровое :)
#Razer #Forge #Threadripper
———
@tsingular
✍6🔥4❤2⚡2
Ni8mare: критическая уязвимость в n8n позволяет полностью захватить сервер
В n8n обнаружена уязвимость CVE-2026-21858 с максимальным рейтингом 10 из 10.
Исследователи из Cyera нашли баг в обработке веб-форм — при отправке запроса с типом application/json вместо multipart/form-data можно обойти проверки и прочитать любые файлы на сервере.
Атакующий может прочитать всю базу данных n8n, достать оттуда учётки и секреты, подделать и перехватить сессию администратора и получить полный доступ с возможностью выполнения команд.
Под ударом более 100 000 серверов.
Особенно критично для AI-проектов — в n8n хранятся ключи API, токены OAuth, креды к базам и облачным хранилищам.
Патч вышел в версии 1.121.0.
Временная защита — отключить публичные вебхуки и формы.
Срочно обновляемся. кто еще не успел.
Надеюсь все уже перешли на 2ю версию? :)
#n8n #Ni8mare #cybersecurity
———
@tsingular
В n8n обнаружена уязвимость CVE-2026-21858 с максимальным рейтингом 10 из 10.
Исследователи из Cyera нашли баг в обработке веб-форм — при отправке запроса с типом application/json вместо multipart/form-data можно обойти проверки и прочитать любые файлы на сервере.
Атакующий может прочитать всю базу данных n8n, достать оттуда учётки и секреты, подделать и перехватить сессию администратора и получить полный доступ с возможностью выполнения команд.
Под ударом более 100 000 серверов.
Особенно критично для AI-проектов — в n8n хранятся ключи API, токены OAuth, креды к базам и облачным хранилищам.
Патч вышел в версии 1.121.0.
Временная защита — отключить публичные вебхуки и формы.
Срочно обновляемся. кто еще не успел.
Надеюсь все уже перешли на 2ю версию? :)
#n8n #Ni8mare #cybersecurity
———
@tsingular
✍9⚡4👨💻2❤1😁1
ИИ впервые выиграл турнир по программированию у 804 человек
Японский стартап Sakana AI с оценкой в $2.65 млрд, создал агента ALE-Agent, который занял первое место на турнире среди 800 программистов AtCoder Heuristic Contest 058.
Sakana AI развивает концепцию распределенного интеллекта — множество небольших моделей работают как рой (косяк рыб), а не одна монолитная система.
Задачи на AHC058 моделировали сложный процесс иерархического производства, где требовалось оптимизировать план выпуска машин, которые, в свою очередь, производят другие машины.
Агент придумал нестандартный алгоритм «виртуальной мощности» — оценивает эффективность машин, которые еще не запущены.
Авторы задачи такого не ожидали.
Победа обошлась в $1300 на вызовы API к GPT-5.2 и Gemini 3 Pro. Агент начал отправлять решения через два часа после старта и сразу вышел в лидеры.
Детальный разбор в блоге SakanaAI
#SakanaAI #contest #Coding
———
@tsingular
Японский стартап Sakana AI с оценкой в $2.65 млрд, создал агента ALE-Agent, который занял первое место на турнире среди 800 программистов AtCoder Heuristic Contest 058.
Sakana AI развивает концепцию распределенного интеллекта — множество небольших моделей работают как рой (косяк рыб), а не одна монолитная система.
Задачи на AHC058 моделировали сложный процесс иерархического производства, где требовалось оптимизировать план выпуска машин, которые, в свою очередь, производят другие машины.
Агент придумал нестандартный алгоритм «виртуальной мощности» — оценивает эффективность машин, которые еще не запущены.
Авторы задачи такого не ожидали.
Победа обошлась в $1300 на вызовы API к GPT-5.2 и Gemini 3 Pro. Агент начал отправлять решения через два часа после старта и сразу вышел в лидеры.
Детальный разбор в блоге SakanaAI
#SakanaAI #contest #Coding
———
@tsingular
👍16🔥11⚡7❤1
Forwarded from Machinelearning
Стэнфордский университет натренировал SleepFM — фундаментальную модель для прогноза целого спектра патологий: от мерцательной аритмии и инфаркта миокарда до деменции и болезни Паркинсона.
Полисомнография — «золотой стандарт» изучения сна: человека обвешивают датчиками (ЭЭГ, ЭКГ, дыхание, мышцы) и пишут гигабайты сырых сигналов.
Но в ML-мире эти данные используются бездарно. Существующие модели тренировались на мелких датасетах сугубо под узкие задачи (найти апноэ, определить фазу сна).
Огромный пласт физиологической информации о здоровье пациента просто игнорировался, потому что размечать вручную сотни часов записи под каждую болячку — невозможно.
К тому же, если в одной клинике датчик ЭЭГ повесили чуть иначе или он отвалился, обычная модель ломалась.
В университете поняли, что врачи-разметчики не нужны, нужны объемы. Они собрали огромный датасет из 585 тыс. часов записей сна более 65 тыс. пациентов и придумали уникальный алгоритм обучения SSL для будущей модели.
Вместо того чтобы учить модель предсказывать диагноз, еt заставили решать пазл: система получает на вход сигналы от 3-x модальностей (сердце, мышцы, дыхание) и должна предсказать эмбеддинг четвертой (мозговые волны).
Это заставляет нейросеть на базе 1D CNN и Transformers выучивать глубокие, скрытые связи между физиологическими процессами.
Модели все равно, какие именно датчики подключены и в каком порядке. Если канал отвалился или отсутствует, attention pooling просто перераспределяет веса, и инференс продолжается.
Получив на вход 1 ночь записи, модель предсказывает риск 130 заболеваний, причем она делает это точнее, чем специализированные модели, обученные с учителем: риск болезни Паркинсона выявляется в 89% случаев, деменции — в 85%, а вероятность сердечного приступа — в 81%.
Авторы работы полагают, что с развитием носимой электроники такая диагностика может перекочевать из лабораторий в умные часы, а тесты модели доказали, что что в шуме сигналов сна может быть скрыта полная медкарта пациента.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20⚡5
AWS: Как SLM может победить LLM в управлении инструментами
Исследователи AWS натренировали OPT-350M (всего 350 миллионов параметров) на датасете ToolBench и получили 77.55% успешных вызовов API.
Для сравнения - ChatGPT-CoT показал только 26%, а ToolLLaMA-DFS - 30%. При этом у базовых моделей от 7 до 175 миллиардов параметров.
Обучали в 1 эпоху на Amazon SageMaker через SFTTrainer (Hugging Face TRL). Модель научилась генерировать структурированные цепочки Thought-Action-Action Input для вызова API.
Образец примера:
Типы сценариев
- I1 (single-tool): один инструмент, один API
- I2 (intra-category): несколько инструментов одной категории
- I3 (intra-collection): инструменты из разных категорий
Хороший пример, чего можно добиться, сфокусировав модель на одной задаче, - вся ёмкость модели работает только на управление инструментами.
Это, кстати, может быть очень полезно для роя агентов.
Дособрать еще пайплайн, где SLM сами спавнятся и дообучаются под задачу роя.
Или, допустим, SLM под каждый MCP, если у него много методов.
paper
#ToolBench #SLM #FineTuning
———
@tsingular
Исследователи AWS натренировали OPT-350M (всего 350 миллионов параметров) на датасете ToolBench и получили 77.55% успешных вызовов API.
Для сравнения - ChatGPT-CoT показал только 26%, а ToolLLaMA-DFS - 30%. При этом у базовых моделей от 7 до 175 миллиардов параметров.
Обучали в 1 эпоху на Amazon SageMaker через SFTTrainer (Hugging Face TRL). Модель научилась генерировать структурированные цепочки Thought-Action-Action Input для вызова API.
Образец примера:
Instruction: "Найди фильмы с Бэтменом и покажи рейтинги"
↓
Solution Path:
1. <thought>: нужен API поиска фильмов
2. <api_call>: GET /search/title?title=batman
3. <response>: {type:"movie", title:"Batman"...}
4. <thought>: теперь нужны рейтинги
5. <api_call>: GET /ratings?id=tt0096895
6. <response>: {rating: 7.5...}
Типы сценариев
- I1 (single-tool): один инструмент, один API
- I2 (intra-category): несколько инструментов одной категории
- I3 (intra-collection): инструменты из разных категорий
Хороший пример, чего можно добиться, сфокусировав модель на одной задаче, - вся ёмкость модели работает только на управление инструментами.
Это, кстати, может быть очень полезно для роя агентов.
Дособрать еще пайплайн, где SLM сами спавнятся и дообучаются под задачу роя.
Или, допустим, SLM под каждый MCP, если у него много методов.
paper
#ToolBench #SLM #FineTuning
———
@tsingular
❤5🔥5⚡2👍1
Коллекции субагентов и скиллов для Claudecode
Нашел тут пару полезных коллекций:
1. ClaudeCode Templates
удобный каталог с поиском, собранный из разных источников, в том числе из официальных от Антропика и разных других курируемых списков.
2. Claude Code Subagents Collection
тут самописные агенты, они чуть попроще, но удобно разбиты по 10 доменам и в основном фокус на разработке.
Очень понравилось почитать официальные примеры от Антропика
там есть ссылка на пример Skills Notion -
т.е. можно прям настроить CC сохранять знания в базе Notion дополняя страницы и сущности (наверняка такое же можно провернуть и с Obsidian, кому не нравится отдавать свои заметки в облако)
Так вот, берём, например, файл notion-knowledge-capture.zip - качаем, ставим в скиллы и в нём читаем как именно эти скиллы создаются не любителями, а профессиональными командами. Есть чему поучиться. :)
Ну и самое вкусное, что все эти скиллы и субагенты поддерживаются, например, в opencode - причем не надо ничего менять, - просто копируем как то так:
И используем скиллы бесплатно.
Для Opencode рекомендую GLM 4.7 - там за 6 баксов в месяц китайская модель с производительностью Соннета.
Но если по какой-то причине вам opencode не нравится и вы хотите именно ClaudeCode с бесплатными моделями использовать, - есть роутер.
#Skills #ClaudeCode #OpenCode
———
@tsingular
Нашел тут пару полезных коллекций:
1. ClaudeCode Templates
удобный каталог с поиском, собранный из разных источников, в том числе из официальных от Антропика и разных других курируемых списков.
2. Claude Code Subagents Collection
тут самописные агенты, они чуть попроще, но удобно разбиты по 10 доменам и в основном фокус на разработке.
Очень понравилось почитать официальные примеры от Антропика
там есть ссылка на пример Skills Notion -
т.е. можно прям настроить CC сохранять знания в базе Notion дополняя страницы и сущности (наверняка такое же можно провернуть и с Obsidian, кому не нравится отдавать свои заметки в облако)
Так вот, берём, например, файл notion-knowledge-capture.zip - качаем, ставим в скиллы и в нём читаем как именно эти скиллы создаются не любителями, а профессиональными командами. Есть чему поучиться. :)
Ну и самое вкусное, что все эти скиллы и субагенты поддерживаются, например, в opencode - причем не надо ничего менять, - просто копируем как то так:
Project Claude-compatible: .claude/skills/<name>/SKILL.md
Global Claude-compatible: ~/.claude/skills/<name>/SKILL.md
И используем скиллы бесплатно.
Для Opencode рекомендую GLM 4.7 - там за 6 баксов в месяц китайская модель с производительностью Соннета.
Но если по какой-то причине вам opencode не нравится и вы хотите именно ClaudeCode с бесплатными моделями использовать, - есть роутер.
#Skills #ClaudeCode #OpenCode
———
@tsingular
✍7⚡3🔥3