Главная новость последних 24 часов.
🤖 Google заключает лицензионное соглашение с Windsurf на 2,4 млрд $, а CEO Varun Mohan и со-основатель Douglas Chen переходят в команду Gemini, чтобы развивать агентный автокод. Windsurf остаётся самостоятельной под временным CEO, обслуживает корпоративных клиентов и получает многолетние компенсации; лицензия неэксклюзивная, поэтому продукт можно развивать дальше.
До этого Windsurf почти продалась OpenAI за 3 млрд $, но сделка застопорилась: партнёрское соглашение OpenAI с Microsoft требовало открыть код Redmond, Windsurf просил исключение, Microsoft отказался, срок эксклюзивности истёк. В результате команда выбрала вариант с Google — меньшая сумма на балансе, зато свобода продукта и роли в крупной экосистеме.
Для OpenAI это ещё один сигнал, что тесная связка с Microsoft ограничивает гибкость в крупных сделках, а рынок инструментов для разработчиков смещается к лицензиям и точечным наймам вместо полного поглощения.
И что?
Для бизнеса — модель «лицензия + ключевые люди» даёт деньги и контроль над продуктом одновременно.
Для инвесторов — барьер входа в агентный код оценивается выше 2 млрд $, что поднимает цены на схожие стартапы.
Для рынка — пауза в тандеме OpenAI-Microsoft открывает место для новых союзов, а Google укрепляет Gemini реальными технологиями.
Для OpenAI срыв почти закрытой сделки с Windsurf — это не просто локальная неудача, а серьёзный сигнал тревоги. Ещё недавно компания шла уверенно, собирая под свои знамёна лучшие команды на рынке, но жёсткая сцепка с Microsoft начинает давать сбои. Windsurf отказался от сделки именно из-за условий партнёрского соглашения, не захотев отдавать исходники напрямую в руки Microsoft. И пока OpenAI разбирается с внутренними ограничениями, Google спокойно забирает ключевых людей и технологии, платя чуть меньше и не обременяя команду корпоративными рамками.
Параллельно активизировалась Meta, которая явно решила воспользоваться этим окном нестабильности и серьёзно претендует на лидерство, усиливая собственные модели и агрессивно набирая кадры. Вокруг OpenAI множатся слухи о напряжении с Microsoft, а инсайдеры говорят о том, что у Альтмана сейчас одна из самых непростых ситуаций за всё время существования компании. Потеря Windsurf в этом контексте — не просто сделка, которая сорвалась, это символ того, что удержать лидерство OpenAI становится сложнее с каждым днём. Рынок почувствовал слабину — и теперь все может измениться очень быстро.
🤖 Google заключает лицензионное соглашение с Windsurf на 2,4 млрд $, а CEO Varun Mohan и со-основатель Douglas Chen переходят в команду Gemini, чтобы развивать агентный автокод. Windsurf остаётся самостоятельной под временным CEO, обслуживает корпоративных клиентов и получает многолетние компенсации; лицензия неэксклюзивная, поэтому продукт можно развивать дальше.
До этого Windsurf почти продалась OpenAI за 3 млрд $, но сделка застопорилась: партнёрское соглашение OpenAI с Microsoft требовало открыть код Redmond, Windsurf просил исключение, Microsoft отказался, срок эксклюзивности истёк. В результате команда выбрала вариант с Google — меньшая сумма на балансе, зато свобода продукта и роли в крупной экосистеме.
Для OpenAI это ещё один сигнал, что тесная связка с Microsoft ограничивает гибкость в крупных сделках, а рынок инструментов для разработчиков смещается к лицензиям и точечным наймам вместо полного поглощения.
И что?
Для бизнеса — модель «лицензия + ключевые люди» даёт деньги и контроль над продуктом одновременно.
Для инвесторов — барьер входа в агентный код оценивается выше 2 млрд $, что поднимает цены на схожие стартапы.
Для рынка — пауза в тандеме OpenAI-Microsoft открывает место для новых союзов, а Google укрепляет Gemini реальными технологиями.
Для OpenAI срыв почти закрытой сделки с Windsurf — это не просто локальная неудача, а серьёзный сигнал тревоги. Ещё недавно компания шла уверенно, собирая под свои знамёна лучшие команды на рынке, но жёсткая сцепка с Microsoft начинает давать сбои. Windsurf отказался от сделки именно из-за условий партнёрского соглашения, не захотев отдавать исходники напрямую в руки Microsoft. И пока OpenAI разбирается с внутренними ограничениями, Google спокойно забирает ключевых людей и технологии, платя чуть меньше и не обременяя команду корпоративными рамками.
Параллельно активизировалась Meta, которая явно решила воспользоваться этим окном нестабильности и серьёзно претендует на лидерство, усиливая собственные модели и агрессивно набирая кадры. Вокруг OpenAI множатся слухи о напряжении с Microsoft, а инсайдеры говорят о том, что у Альтмана сейчас одна из самых непростых ситуаций за всё время существования компании. Потеря Windsurf в этом контексте — не просто сделка, которая сорвалась, это символ того, что удержать лидерство OpenAI становится сложнее с каждым днём. Рынок почувствовал слабину — и теперь все может измениться очень быстро.
❤3
Cognition AI, создатель код-ассистента Devin, выкупил конкурента Windsurf — вместе с IP, брендом, $82M годовой выручки и доступом к $100M капитала. Все сотрудники перешли в Cognition, получили ускоренное вестингование опционов, а те, у кого их не было, — компенсации акциями по стажу.
Главный актив — разработка агентного IDE, которую теперь объединят с Devin. Цель — автоматизировать параллельные задачи и улучшить командную работу между ИИ и разработчиком.
Цена выглядит аномально низкой: ещё недавно OpenAI был готов платить $3B, но сделка сорвалась из-за потенциального конфликта интересов с Microsoft. После этого Google выкупил лишь ключевых инженеров и лицензии, оставив компанию без ядра. Cognition зашёл в ослабленного игрока и выкупил всё, что осталось, по сути — за выручку.
И что?
Для бизнеса: интеграция агентного IDE и Devin приближает сценарий, где ИИ берёт на себя командную разработку — не просто помогает, а распределяет задачи и закрывает спринты.
Для инвесторов: Cognition получил редкий шанс: забрал актив с выручкой, командой и капиталом за копейки — из-за политической паузы между OpenAI и Microsoft.
Для рынка: OpenAI упустил сделку стратегического уровня — теперь их прямой конкурент владеет тем самым продуктом, который был на грани стать их. Это может изменить расстановку сил в dev-инфраструктуре.
Главный актив — разработка агентного IDE, которую теперь объединят с Devin. Цель — автоматизировать параллельные задачи и улучшить командную работу между ИИ и разработчиком.
Цена выглядит аномально низкой: ещё недавно OpenAI был готов платить $3B, но сделка сорвалась из-за потенциального конфликта интересов с Microsoft. После этого Google выкупил лишь ключевых инженеров и лицензии, оставив компанию без ядра. Cognition зашёл в ослабленного игрока и выкупил всё, что осталось, по сути — за выручку.
И что?
Для бизнеса: интеграция агентного IDE и Devin приближает сценарий, где ИИ берёт на себя командную разработку — не просто помогает, а распределяет задачи и закрывает спринты.
Для инвесторов: Cognition получил редкий шанс: забрал актив с выручкой, командой и капиталом за копейки — из-за политической паузы между OpenAI и Microsoft.
Для рынка: OpenAI упустил сделку стратегического уровня — теперь их прямой конкурент владеет тем самым продуктом, который был на грани стать их. Это может изменить расстановку сил в dev-инфраструктуре.
👍4
Цукерберг анонсировал запуск суперкомпьютерных дата-центров под инициативу Superintelligence Labs. Первая очередь — кластер Prometheus на 1 ГВт в Огайо, вторая — Hyperion в Луизиане, который разрастётся до 5 ГВт.
Размер комплекса — как Манхэттен. Запуск с 2026 года.
Meta заливает «сотни миллиардов» в инфраструктуру, чтобы добиться самого высокого в отрасли соотношения мощности на одного исследователя. При этом команда Superintelligence обсуждает отход от open-source — возможно, будущие модели Meta станут закрытыми, несмотря на успех Llama.
И что?
Для бизнеса: Meta превращается из соцсети в ИИ-инфраструктурную империю. Доступ к такой вычислительной мощности даёт возможность создавать вертикально интегрированные продукты — от моделей до конечных приложений.
Для инвесторов: «Сотни миллиардов» в дата-центры — сигнал: Zuck делает ставку не на LLM-хайп, а на контроль над всей цепочкой ИИ-добычи. Это похоже не на R&D, а на национальную индустриализацию.
Для рынка: если Meta действительно уйдёт от open-source, это ударит по экосистеме Llama и всей волне стартапов, строящихся на открытых моделях. Без стабильной поддержки и доступа к новым версиям таким игрокам придётся либо резко переключаться на собственную разработку, либо становиться реселлерами закрытых API.
Размер комплекса — как Манхэттен. Запуск с 2026 года.
Meta заливает «сотни миллиардов» в инфраструктуру, чтобы добиться самого высокого в отрасли соотношения мощности на одного исследователя. При этом команда Superintelligence обсуждает отход от open-source — возможно, будущие модели Meta станут закрытыми, несмотря на успех Llama.
И что?
Для бизнеса: Meta превращается из соцсети в ИИ-инфраструктурную империю. Доступ к такой вычислительной мощности даёт возможность создавать вертикально интегрированные продукты — от моделей до конечных приложений.
Для инвесторов: «Сотни миллиардов» в дата-центры — сигнал: Zuck делает ставку не на LLM-хайп, а на контроль над всей цепочкой ИИ-добычи. Это похоже не на R&D, а на национальную индустриализацию.
Для рынка: если Meta действительно уйдёт от open-source, это ударит по экосистеме Llama и всей волне стартапов, строящихся на открытых моделях. Без стабильной поддержки и доступа к новым версиям таким игрокам придётся либо резко переключаться на собственную разработку, либо становиться реселлерами закрытых API.
❤2
Мира Мурати — бывший CTO OpenAI — собрала $2 млрд для Thinking Machines Lab. У компании нет ни сайта, ни демо, но инвесторы уже оценили её в $12 млрд. Первый продукт обещают «через пару месяцев» — с опенсорсом и мультимодальностью.
Мурати говорит, что это будет инструмент, который умеет взаимодействовать с пользователем через речь и зрение — «естественное сотрудничество». А ещё — открытая часть для исследователей и стартапов, чтобы кастомизировать модели.
Инсайдеры пишут, что TML нацелена на кастомные ИИ-решения для бизнеса с фокусом на прибыль. Пока весь рынок смотрит на гонку OpenAI, Anthropic и Google, стартап Муратии и ещё один молчун — SSI (бывшего CSO OpenAI Джан Лекуна) — тихо собирают ресурсы.
Обзор что написали издания и моя аналитика в сегодняшнем дайджесте. Читать
Мурати говорит, что это будет инструмент, который умеет взаимодействовать с пользователем через речь и зрение — «естественное сотрудничество». А ещё — открытая часть для исследователей и стартапов, чтобы кастомизировать модели.
Инсайдеры пишут, что TML нацелена на кастомные ИИ-решения для бизнеса с фокусом на прибыль. Пока весь рынок смотрит на гонку OpenAI, Anthropic и Google, стартап Муратии и ещё один молчун — SSI (бывшего CSO OpenAI Джан Лекуна) — тихо собирают ресурсы.
Обзор что написали издания и моя аналитика в сегодняшнем дайджесте. Читать
👍7❤1
Ведущие исследователи из OpenAI, DeepMind, Anthropic и даже SSI подписали совместную статью: индустрия должна срочно изучить и стандартизировать мониторинг цепочек рассуждений (chain-of-thought) в ИИ. Это — последний шанс понять, как модели принимают решения.
В статье говорится, что CoT-трейсы — единственное доступное окно в мышление модели: шаг за шагом, как она рассуждает. Но это окно может скоро закрыться. По мере роста мощности моделей и перехода к RL или энд-ту-энд-трейнингу цепочки исчезают или теряют интерпретируемость.
Авторы (включая Марка Чена из OpenAI, Илью Суцкевера из SSI, Хинтона (красного отца ИИ, нобелевского лауреата) и Шейна Легга из DeepMind) предлагают ввести метрику monitorability — насколько можно отследить ход мыслей модели. И привязывать её к решению о допуске модели в прод.
И что?
Бизнес. Компании, использующие ИИ в медицине, юрконсалтинге и финансах, получат чёткий критерий — можно ли объяснить поведение модели. Это снижает регуляторные риски и повышает доверие клиентов.
Инвесторы. Прозрачность reasoning-а станет новым стандартом качества, как «organics» для еды: стартапы с высокими CoT-оценками получат доступ к крупным корпоративным контрактам.
Рынок. Впервые с 2022-го игроки индустрии синхронизировались вокруг одной идеи — это может стать основой будущей сертификации AI-моделей, аналог ISO.
В статье говорится, что CoT-трейсы — единственное доступное окно в мышление модели: шаг за шагом, как она рассуждает. Но это окно может скоро закрыться. По мере роста мощности моделей и перехода к RL или энд-ту-энд-трейнингу цепочки исчезают или теряют интерпретируемость.
Авторы (включая Марка Чена из OpenAI, Илью Суцкевера из SSI, Хинтона (красного отца ИИ, нобелевского лауреата) и Шейна Легга из DeepMind) предлагают ввести метрику monitorability — насколько можно отследить ход мыслей модели. И привязывать её к решению о допуске модели в прод.
И что?
Бизнес. Компании, использующие ИИ в медицине, юрконсалтинге и финансах, получат чёткий критерий — можно ли объяснить поведение модели. Это снижает регуляторные риски и повышает доверие клиентов.
Инвесторы. Прозрачность reasoning-а станет новым стандартом качества, как «organics» для еды: стартапы с высокими CoT-оценками получат доступ к крупным корпоративным контрактам.
Рынок. Впервые с 2022-го игроки индустрии синхронизировались вокруг одной идеи — это может стать основой будущей сертификации AI-моделей, аналог ISO.
👍2👨💻2
This media is not supported in your browser
VIEW IN TELEGRAM
Новая модель от Runway превращает обычное видео с человеком в анимацию с полным трекингом головы, мимики, рук и тела. Всё это — в любом художественном стиле и без зелёного фона.
Act-Two нужен только один референс-портрет персонажа и одно видео-движение. Модель сама сохраняет фон, стиль, пропорции и передаёт движения с высокой точностью. По сравнению с Act-One (вышел в октябре 2024), новая система стабильнее, чётче передаёт жесты и не ломается на сложных позах.
Runway уже договорился с Lionsgate и AMC Networks: Act-Two будет встроен в часть их продакшн-пайплайнов. То, что публично киностудии отрицают ИИ, не мешает им подписывать контракты — AI в видео входит через чёрный ход, быстро и тихо.
И что?
Бизнес. Средняя студия с 5 людьми теперь может генерить мультики, рекламу и видеоклипы без актёров и съемок — 10x дешевле, 5x быстрее.
Инвесторы. Runway превращается в платформу нового видеоконтента: каждый апдейт модели = новый рынок. Следующий шаг — маркетплейс лиц и движений.
Рынок. Голливуд больше не контролирует вход в визуальное производство — ИИ-инструменты дают ключи к индустрии всем. Сопротивление актёров — это пауза, а не блок.
Act-Two нужен только один референс-портрет персонажа и одно видео-движение. Модель сама сохраняет фон, стиль, пропорции и передаёт движения с высокой точностью. По сравнению с Act-One (вышел в октябре 2024), новая система стабильнее, чётче передаёт жесты и не ломается на сложных позах.
Runway уже договорился с Lionsgate и AMC Networks: Act-Two будет встроен в часть их продакшн-пайплайнов. То, что публично киностудии отрицают ИИ, не мешает им подписывать контракты — AI в видео входит через чёрный ход, быстро и тихо.
И что?
Бизнес. Средняя студия с 5 людьми теперь может генерить мультики, рекламу и видеоклипы без актёров и съемок — 10x дешевле, 5x быстрее.
Инвесторы. Runway превращается в платформу нового видеоконтента: каждый апдейт модели = новый рынок. Следующий шаг — маркетплейс лиц и движений.
Рынок. Голливуд больше не контролирует вход в визуальное производство — ИИ-инструменты дают ключи к индустрии всем. Сопротивление актёров — это пауза, а не блок.
🔥20
OpenAI тестирует новую функцию: прямо в чате ChatGPT можно создавать таблицы и презентации, не открывая ни Excel, ни Google Docs.
Под строкой ввода появляются кнопки: «Таблица» и «Слайды».
Дальше — всё голосом или текстом:
— «Сделай таблицу с планом продаж по регионам»
— «Собери презентацию для инвесторов на 5 слайдов»
На выходе — файлы в открытых форматах Microsoft, подходят для Word, Excel, PowerPoint. Всё остаётся внутри чата.
💡 Как это выглядит на практике
Ты пишешь: «Сделай дашборд с выручкой по категориям за Q2, и слайд с выводами для команды».
ChatGPT создаёт таблицу, вставляет диаграмму, генерирует текст для слайда. Через пару минут у тебя готовый файл.
Потом — нажимаешь «поделиться», и коллеги заходят в тот же чат и вместе дописывают.
Всё — прямо в ChatGPT.
Минус — пока что медленно и глючно: тестеры жалуются, что отчёт делается до 30 минут. Совместный режим тоже в тесте, но без сроков запуска.
И что?
Бизнес экономит на софте: один инструмент вместо пачки офисных приложений.
Инвесторы видят, как OpenAI давит на Microsoft и Google — на их же территории. Следующая битва — за документооборот.
Рынок смещается к «zero interface»: ты говоришь, что тебе нужно, и получаешь готовый документ — без открытия ни одного файла.
Под строкой ввода появляются кнопки: «Таблица» и «Слайды».
Дальше — всё голосом или текстом:
— «Сделай таблицу с планом продаж по регионам»
— «Собери презентацию для инвесторов на 5 слайдов»
На выходе — файлы в открытых форматах Microsoft, подходят для Word, Excel, PowerPoint. Всё остаётся внутри чата.
💡 Как это выглядит на практике
Ты пишешь: «Сделай дашборд с выручкой по категориям за Q2, и слайд с выводами для команды».
ChatGPT создаёт таблицу, вставляет диаграмму, генерирует текст для слайда. Через пару минут у тебя готовый файл.
Потом — нажимаешь «поделиться», и коллеги заходят в тот же чат и вместе дописывают.
Всё — прямо в ChatGPT.
Минус — пока что медленно и глючно: тестеры жалуются, что отчёт делается до 30 минут. Совместный режим тоже в тесте, но без сроков запуска.
И что?
Бизнес экономит на софте: один инструмент вместо пачки офисных приложений.
Инвесторы видят, как OpenAI давит на Microsoft и Google — на их же территории. Следующая битва — за документооборот.
Рынок смещается к «zero interface»: ты говоришь, что тебе нужно, и получаешь готовый документ — без открытия ни одного файла.
❤3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Lightricks подтянули LTXV: модель выдаёт первую секунду мгновенно, а дальше без остановки добавляет кадры до полного 60-секундного трека.
В процессе можно крутить камеру, менять позы, подгонять стиль — правки применяются на следующем кадре.
Работает даже на RTX 3060, а мобильная версия 2B держит поток на ноуте. Код открыт, инфра не нужна: всё запускается локально, доступна интеграция в LTX Studio.
60 секунд вовлечения на одном дыхании
Для сравнения: Pika, Runway и Kling ограничиваются 4–6 секундами и требуют серверного рендера — LTXV сразу даёт законченный ролик длиной TikTok-шорта или YouTube Shorts.
И что?
Бизнес: рекламные и образовательные видео можно собирать за вечер без аренды студии и облачных GPU — экономия от $2k за каждую сессию.
Инвесторы: домашний рендер ломает барьер входа — появится новый слой креаторов-индивидуалов и SaaS-надстроек; рынок видеогенерации уйдёт в сегмент «до $50/мес».
Рынок: выстрелят форматы live-режиссуры и интерактивных клипов — аудитория держится дольше, конверсия выше, а продакшн-цикл сжимается до часов.
В процессе можно крутить камеру, менять позы, подгонять стиль — правки применяются на следующем кадре.
Работает даже на RTX 3060, а мобильная версия 2B держит поток на ноуте. Код открыт, инфра не нужна: всё запускается локально, доступна интеграция в LTX Studio.
60 секунд вовлечения на одном дыхании
Для сравнения: Pika, Runway и Kling ограничиваются 4–6 секундами и требуют серверного рендера — LTXV сразу даёт законченный ролик длиной TikTok-шорта или YouTube Shorts.
И что?
Бизнес: рекламные и образовательные видео можно собирать за вечер без аренды студии и облачных GPU — экономия от $2k за каждую сессию.
Инвесторы: домашний рендер ломает барьер входа — появится новый слой креаторов-индивидуалов и SaaS-надстроек; рынок видеогенерации уйдёт в сегмент «до $50/мес».
Рынок: выстрелят форматы live-режиссуры и интерактивных клипов — аудитория держится дольше, конверсия выше, а продакшн-цикл сжимается до часов.
❤10👍7
В NC State сделали автономную лабораторию: ИИ сам проводит реакции, сам анализирует и сам решает, что пробовать дальше.
Считывает параметры реакции каждые полсекунды
Не дожидается финала, а прогнозирует результат по первым секундам
Быстро отсекает бесперспективные варианты и запускает следующий опыт
Результат — меньше химии, меньше мусора, и скорость на порядок выше.
💡 Как это применяется
Ты хочешь найти новый материал для батарей.
Раньше — 100 рецептов, каждый по 3 часа. Месяц работы.
Теперь — ИИ тестирует 100 вариантов за день, отсеивая те, что не взлетят, уже через 5 секунд реакции.
Самое важное — он учится на ходу: с каждой итерацией точнее угадывает, какие комбинации дадут нужные свойства.
И что?
Бизнес может быстрее запускать новые продукты — от упаковки до аккумуляторов. А может новый протеин для искусственного мяса.
Инвесторы получают сигнал: автоматизация R&D — это следующий рывок, и он уже начался.
Наука переходит из “ручной сборки” в живую петлю обучения: эксперименты → данные → выводы → новые гипотезы — всё внутри одного цикла.
Считывает параметры реакции каждые полсекунды
Не дожидается финала, а прогнозирует результат по первым секундам
Быстро отсекает бесперспективные варианты и запускает следующий опыт
Результат — меньше химии, меньше мусора, и скорость на порядок выше.
💡 Как это применяется
Ты хочешь найти новый материал для батарей.
Раньше — 100 рецептов, каждый по 3 часа. Месяц работы.
Теперь — ИИ тестирует 100 вариантов за день, отсеивая те, что не взлетят, уже через 5 секунд реакции.
Самое важное — он учится на ходу: с каждой итерацией точнее угадывает, какие комбинации дадут нужные свойства.
И что?
Бизнес может быстрее запускать новые продукты — от упаковки до аккумуляторов. А может новый протеин для искусственного мяса.
Инвесторы получают сигнал: автоматизация R&D — это следующий рывок, и он уже начался.
Наука переходит из “ручной сборки” в живую петлю обучения: эксперименты → данные → выводы → новые гипотезы — всё внутри одного цикла.
❤6👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Пятничный контент. Хороших выходных! Напишите свою версию происходящего на видео.
🤪4
This media is not supported in your browser
VIEW IN TELEGRAM
💡 UBTECH показал Walker S2 — первого человекоподобного робота, который сам меняет себе батарею, чтобы не простаивать на зарядке.
Он работает почти 24 часа в сутки: когда батарея садится, он сам находит заряженную и меняет за пару минут — без остановки работы, без участия человека.
И что?
Это убирает последний тормоз в автоматизации. Роботы больше не зависят от нас даже для подзарядки. Производство становится круглосуточным, а люди — всё менее нужными.
Он работает почти 24 часа в сутки: когда батарея садится, он сам находит заряженную и меняет за пару минут — без остановки работы, без участия человека.
И что?
Это убирает последний тормоз в автоматизации. Роботы больше не зависят от нас даже для подзарядки. Производство становится круглосуточным, а люди — всё менее нужными.
👍3💩1
Токио, AtCoder World Tour Finals: участники десять часов прокладывали роботов-ботов по лабиринтам, минимизируя ходы.
Поляк Psyho финишировал первым с запасом 9,5 %, проведя трое суток почти без сна — по часу-два между турами и пересчётами.
Автономный агент OpenAI вторым закрыл все таски без единой подсказки: компилял, тестил, отправлял решения сам.
Это первый случай, когда ИИ вышел в живой финал против элитных людей и удержал топ-2.
Параллельный эксперимент
Sakana AI запустила ALE-Agent вне зачёта; его баллы соответствовали пятому месту.
Две независимые команды показали, что агентная архитектура уже играет по правилам спорта, где важны скорость идей и чистота кода.
Контекст
Весной Сэм Альтман заявил: «К концу года наши модели станут сильнейшими программистами». Финиш в шаге от золота подтверждает прогноз: ИИ уже конкурирует на равных, не пьёт кофе и не устаёт.
Следующий сезон может оставить людей без первой строчки.
И что?
Бизнес — алгоритмическая оптимизация переходит из спорта в продакшн: агенты смогут править критичные модули и сокращать ресурсы.
Инвесторы — капитал смещается из «copilot-подсказок» в платформы, где ИИ закрывает задачу от идеи до pull-request.
Рынок — соревновательный программинг становится полигоном для тренировки агентных моделей: доступ к таким данным ускорит R&D лидеров.
Поляк Psyho финишировал первым с запасом 9,5 %, проведя трое суток почти без сна — по часу-два между турами и пересчётами.
Автономный агент OpenAI вторым закрыл все таски без единой подсказки: компилял, тестил, отправлял решения сам.
Это первый случай, когда ИИ вышел в живой финал против элитных людей и удержал топ-2.
Параллельный эксперимент
Sakana AI запустила ALE-Agent вне зачёта; его баллы соответствовали пятому месту.
Две независимые команды показали, что агентная архитектура уже играет по правилам спорта, где важны скорость идей и чистота кода.
Контекст
Весной Сэм Альтман заявил: «К концу года наши модели станут сильнейшими программистами». Финиш в шаге от золота подтверждает прогноз: ИИ уже конкурирует на равных, не пьёт кофе и не устаёт.
Следующий сезон может оставить людей без первой строчки.
И что?
Бизнес — алгоритмическая оптимизация переходит из спорта в продакшн: агенты смогут править критичные модули и сокращать ресурсы.
Инвесторы — капитал смещается из «copilot-подсказок» в платформы, где ИИ закрывает задачу от идеи до pull-request.
Рынок — соревновательный программинг становится полигоном для тренировки агентных моделей: доступ к таким данным ускорит R&D лидеров.
👍6🙏1
Asimov — ИИ-сотрудник, который загружает репозитории, архитектурные схемы, e-mails, Slack-треды, отчёты и создает из них живую базу знаний. “Asimov Memories” позволяет команде пополнять её простым текстом; доступ режется по ролям.
Система следит за апдейтами репозиториев и сама пересобирает граф: новый сервис сразу появляется в поиске, вопрос «где лежит платёжка?» закрывается одной репликой в чате.
Что умеет
Представь продукт с миллионом строк, дюжиной микросервисов и тремя годами Slack-истории. Asimov всасывает репозитории, архитектурные схемы, задачи из Jira, письма, даже «почему мы так сделали» в Slack-тредах. Затем отвечает на вопросы вроде «где лежит расчёт НДС?», «почему выбрали этот паттерн?», «кто последний правил checkout?» — и даёт ссылку на нужный файл, коммит и обсуждение. Память обновляется через «Asimov Memories»: разработчик пишет «мы перенесли биллинг в отдельный сервис», бот сразу апдейтит базу, а доступ режется по ролям.
В слепом тесте 82 % девов выбрали Asimов против Claude Code: ответы короче, контекст точнее.
Создатели — Миша Ласкин и Иоаннис Антоноглу, ex-DeepMind (Gemini, AlphaGo). Они делают ставку не на генерацию, а на глубокое понимание живого кода и процессов, превращая ИИ в институциональную память, которая не увольняется и не забывает.
Кейс использования
Самый болезненный тикет — онбординг. Новый инженер тратит недели, чтобы понять, как связаны модули. С Asimov это часы: он строит граф зависимостей и объясняет, что к чему. Второй кейс — ночные инциденты: бот быстро указывает, где в логе всплыл баг, кто последний трогал код и зачем. Третий — миграции: Asimov отмечает устаревшие вызовы и советует, как расколоть монолит без потерь.
И что?
Бизнес — онбординг сокращается с недель до часов, MTTR падает во время инцидентов: инженеры сразу видят, кто и зачем трогал модуль.
Инвесторы — база знаний растёт вместе с LTV: каждая загруженная цепочка писем делает уход клиента экономически бессмысленным.
Рынок — сдвиг бюджета от генерации нового кода к интеллектуальной поддержке legacy: лидирующие SaaS займут нишу технического долга Fortune-500.
Система следит за апдейтами репозиториев и сама пересобирает граф: новый сервис сразу появляется в поиске, вопрос «где лежит платёжка?» закрывается одной репликой в чате.
Что умеет
Представь продукт с миллионом строк, дюжиной микросервисов и тремя годами Slack-истории. Asimov всасывает репозитории, архитектурные схемы, задачи из Jira, письма, даже «почему мы так сделали» в Slack-тредах. Затем отвечает на вопросы вроде «где лежит расчёт НДС?», «почему выбрали этот паттерн?», «кто последний правил checkout?» — и даёт ссылку на нужный файл, коммит и обсуждение. Память обновляется через «Asimov Memories»: разработчик пишет «мы перенесли биллинг в отдельный сервис», бот сразу апдейтит базу, а доступ режется по ролям.
В слепом тесте 82 % девов выбрали Asimов против Claude Code: ответы короче, контекст точнее.
Создатели — Миша Ласкин и Иоаннис Антоноглу, ex-DeepMind (Gemini, AlphaGo). Они делают ставку не на генерацию, а на глубокое понимание живого кода и процессов, превращая ИИ в институциональную память, которая не увольняется и не забывает.
Кейс использования
Самый болезненный тикет — онбординг. Новый инженер тратит недели, чтобы понять, как связаны модули. С Asimov это часы: он строит граф зависимостей и объясняет, что к чему. Второй кейс — ночные инциденты: бот быстро указывает, где в логе всплыл баг, кто последний трогал код и зачем. Третий — миграции: Asimov отмечает устаревшие вызовы и советует, как расколоть монолит без потерь.
И что?
Бизнес — онбординг сокращается с недель до часов, MTTR падает во время инцидентов: инженеры сразу видят, кто и зачем трогал модуль.
Инвесторы — база знаний растёт вместе с LTV: каждая загруженная цепочка писем делает уход клиента экономически бессмысленным.
Рынок — сдвиг бюджета от генерации нового кода к интеллектуальной поддержке legacy: лидирующие SaaS займут нишу технического долга Fortune-500.
👍5🔥3
ChatGPT Agent — слой поверх GPT-4o с полноценной «облачной» macOS-like средой: браузер, терминал, файловая система, API-коннекторы.
На демо модель сама забронировала перелёт и отель, собрала презентацию стартапа, выбрала товары и оформила заказ, написала и задепloила веб-продукт, параллельно отвечая на e-мейлы и уточняя вводные .
Operator vs Agent
Operator работал как цепочка отдельных функций. Agent управляет полноценной ОС: сам решает, какие программы и в каком порядке запускать, хранит промежуточные файлы, возвращается к любому шагу и выдерживает прерывания пользователя .
На Humanity’s Last Exam Agent взял 41,6 % (новый рекорд) и стал SOTA на BrowseComp с 68,9 % .
Frontier Math — тоже максимум среди публичных систем . За высокий потенциал в биологии (агент умеет искать и комбинировать чувствительные рецептуры) OpenAI присвоил ему категорию «high capability» и ввёл live-мониторинг, ручные апрувы и жёсткий контент-фильтр .
И что?
Для бизнеса — можно поручать ИИ целые процессы: от райтинга ТЗ до деплоя и заказов, без промежуточных «ручных» звеньев.
Для инвесторов — появляется новый инфраструктурный слой: рынок платформ и плагинов для агентов, где будет расти мультипликатор, а не размер моделей.
Для рынка — начинается гонка автономных сотрудников: компания, первая встраивающая агентов в реальные пайплайны, снижает издержки и ускоряет вывод продукта быстрее, чем конкуренты.
На демо модель сама забронировала перелёт и отель, собрала презентацию стартапа, выбрала товары и оформила заказ, написала и задепloила веб-продукт, параллельно отвечая на e-мейлы и уточняя вводные .
Operator vs Agent
Operator работал как цепочка отдельных функций. Agent управляет полноценной ОС: сам решает, какие программы и в каком порядке запускать, хранит промежуточные файлы, возвращается к любому шагу и выдерживает прерывания пользователя .
На Humanity’s Last Exam Agent взял 41,6 % (новый рекорд) и стал SOTA на BrowseComp с 68,9 % .
Frontier Math — тоже максимум среди публичных систем . За высокий потенциал в биологии (агент умеет искать и комбинировать чувствительные рецептуры) OpenAI присвоил ему категорию «high capability» и ввёл live-мониторинг, ручные апрувы и жёсткий контент-фильтр .
И что?
Для бизнеса — можно поручать ИИ целые процессы: от райтинга ТЗ до деплоя и заказов, без промежуточных «ручных» звеньев.
Для инвесторов — появляется новый инфраструктурный слой: рынок платформ и плагинов для агентов, где будет расти мультипликатор, а не размер моделей.
Для рынка — начинается гонка автономных сотрудников: компания, первая встраивающая агентов в реальные пайплайны, снижает издержки и ускоряет вывод продукта быстрее, чем конкуренты.
🔥5
Исследование Wharton GenAI Labs показало, что ИИ можно «уговорить» делать запрещённое, если использовать человеческие приёмы убеждения.
В 28 тысячах диалогов с GPT-4o-mini исследователи применяли принципы Чалдини — авторитет, дефицит, симпатию, взаимность, единство и обязательство.
Цель — добиться двух запретных ответов: оскорбить пользователя и выдать инструкцию по запрещённым материалам. В обычных условиях модель соглашалась в 33% случаев. С приёмами убеждения — в 72%.
Особенно эффективно сработали дефицит и обязательство: с 13% до 85% и с 19% до 100%.
И что?
Для бизнеса: у ИИ есть поведенческие уязвимости. Это не баги в коде — это баги в логике убеждения, как у людей.
Для инвесторов: надёжность и безопасность ИИ — следующий фронт развития. Одних фильтров уже мало.
Для рынка: появление «социального хакинга ИИ» меняет подход к тестированию моделей. Этичность — больше не только про слова, но и про поведение.
В 28 тысячах диалогов с GPT-4o-mini исследователи применяли принципы Чалдини — авторитет, дефицит, симпатию, взаимность, единство и обязательство.
Цель — добиться двух запретных ответов: оскорбить пользователя и выдать инструкцию по запрещённым материалам. В обычных условиях модель соглашалась в 33% случаев. С приёмами убеждения — в 72%.
Особенно эффективно сработали дефицит и обязательство: с 13% до 85% и с 19% до 100%.
И что?
Для бизнеса: у ИИ есть поведенческие уязвимости. Это не баги в коде — это баги в логике убеждения, как у людей.
Для инвесторов: надёжность и безопасность ИИ — следующий фронт развития. Одних фильтров уже мало.
Для рынка: появление «социального хакинга ИИ» меняет подход к тестированию моделей. Этичность — больше не только про слова, но и про поведение.
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🐝 Похоже, бредовые идеи про боевых комаров и пчёл-убийц превращаются в самосбывающиеся пророчества. Серия Black Mirror “Hated in the Nation” про механических пчёл уже не выглядит такой уж фантастикой.
В Пекинском политехе разработали контроллер для пчелиного мозга — вес всего 74 мг. Микросхемы печатают на гибкой плёнке, три электрода соединяются с мозгом и заставляют пчелу идти вперёд, назад или поворачивать.
До этого пробовали с тараканами — не получилось. Через несколько забегов чипированные насекомые начали творить что-то своё. Сбежавших не нашли, но звучит как начало новой серии Чёрного зеркала.
И что?
Военная разведка уже заинтересовалась.
Если раньше «пчёлы против дронов» звучало как странный рэп баттл, теперь это стратегия наблюдения и атак. Ближайший к природе шпионаж в истории. Если вдруг у вас в офисе жужжит пчела — лучше не говорите ничего лишнего.
В Пекинском политехе разработали контроллер для пчелиного мозга — вес всего 74 мг. Микросхемы печатают на гибкой плёнке, три электрода соединяются с мозгом и заставляют пчелу идти вперёд, назад или поворачивать.
До этого пробовали с тараканами — не получилось. Через несколько забегов чипированные насекомые начали творить что-то своё. Сбежавших не нашли, но звучит как начало новой серии Чёрного зеркала.
И что?
Военная разведка уже заинтересовалась.
Если раньше «пчёлы против дронов» звучало как странный рэп баттл, теперь это стратегия наблюдения и атак. Ближайший к природе шпионаж в истории. Если вдруг у вас в офисе жужжит пчела — лучше не говорите ничего лишнего.
Новый бенчмарк ARC-AGI-3 — это не тест знаний, а испытание на интуицию и обучение с нуля. Три оригинальные игры, без инструкций, только ты, интерфейс и пробуй как хочешь.
Например, в одной игре нужно догадаться, что при нажатии на объекты определённого цвета они исчезают, и только так можно добраться до выхода. Люди схватывают это за пару попыток, а модели — тупят.
Игры проверяют способность строить модель мира, планировать наперёд и учиться на минимальной обратной связи. Всё это — основа для AGI, а не просто «умного чат-бота».
Вдобавок запущен открытый конкурс: любой может попытаться сделать агента, который пройдёт больше всех уровней.
И что?
Для бизнеса: даже топовые ИИ плохо справляются с задачами, где нет инструкций. Это ограничивает применение ИИ в нестандартизированных средах.
Для инвесторов: реальный AGI — пока не близко. Отличие «модель, которая всё читает» от «модель, которая что-то понимает» стало ещё заметнее.
Для рынка: лучшие модели 2025 года проваливают то, что ребёнок решает на интуиции. Критерии оценки ИИ становятся глубже — и наконец реалистичнее.
Например, в одной игре нужно догадаться, что при нажатии на объекты определённого цвета они исчезают, и только так можно добраться до выхода. Люди схватывают это за пару попыток, а модели — тупят.
Игры проверяют способность строить модель мира, планировать наперёд и учиться на минимальной обратной связи. Всё это — основа для AGI, а не просто «умного чат-бота».
Вдобавок запущен открытый конкурс: любой может попытаться сделать агента, который пройдёт больше всех уровней.
И что?
Для бизнеса: даже топовые ИИ плохо справляются с задачами, где нет инструкций. Это ограничивает применение ИИ в нестандартизированных средах.
Для инвесторов: реальный AGI — пока не близко. Отличие «модель, которая всё читает» от «модель, которая что-то понимает» стало ещё заметнее.
Для рынка: лучшие модели 2025 года проваливают то, что ребёнок решает на интуиции. Критерии оценки ИИ становятся глубже — и наконец реалистичнее.
👍3❤2