This media is not supported in your browser
VIEW IN TELEGRAM
ElevenLabs запустили полноценный видео-редактор
В студии теперь Veo 3, Sora2 , Kling, Wan и Seedance. В одном редакторе теперь в генерации можно добавлять липсинк, аудио эффекты, музыку, субтитры и все это монтировать.
Заявочка на успех, однозначно. Тестим тут.
#imageEditing@TochkiNadAI
В студии теперь Veo 3, Sora2 , Kling, Wan и Seedance. В одном редакторе теперь в генерации можно добавлять липсинк, аудио эффекты, музыку, субтитры и все это монтировать.
Заявочка на успех, однозначно. Тестим тут.
#imageEditing@TochkiNadAI
GPT-5.1 Thinking возглавила рейтинг самых умных ИИ
Вышел обновленный Artificial Analysis Intelligence Index. Это сводный индекс, который оценивает эффективность ИИ по ряду популярных тестов. Первое место в нем заняла GPT-5.1 Thinking High. Она набрала 70 баллов.
Модель обошла нескольких конкурентов. GPT-5 Thinking High получила 68 баллов. Kimi K2 Thinking набрала 67 баллов. Grok 4 достиг 65 баллов. Claude Sonnet 4.5 получила 63 балла.
https://mltimes.ai/gpt-5-1-thinking-vozglavila-rejting-samyh-umnyh-ii/
Вышел обновленный Artificial Analysis Intelligence Index. Это сводный индекс, который оценивает эффективность ИИ по ряду популярных тестов. Первое место в нем заняла GPT-5.1 Thinking High. Она набрала 70 баллов.
Модель обошла нескольких конкурентов. GPT-5 Thinking High получила 68 баллов. Kimi K2 Thinking набрала 67 баллов. Grok 4 достиг 65 баллов. Claude Sonnet 4.5 получила 63 балла.
https://mltimes.ai/gpt-5-1-thinking-vozglavila-rejting-samyh-umnyh-ii/
Стартап Project Prometheus займётся созданием ИИ для проектирования компьютеров, автомобилей и космических аппаратов. Компания уже привлекла 6,2 миллиарда долларов инвестиций, значительная часть которых поступила лично от Безоса
Безос станет со-CEO вместе с физиком и химиком Виком Баджаджем, ранее сотрудничавшим с Ларри Брином. В команде около 100 специалистов из OpenAI и DeepMind. Project Prometheus планирует разрабатывать модели, ускоряющие инженерные расчёты и автоматизацию сложных проектов, претендуя на роль ключевой платформы для индустриального ИИ будущего
STARTуем UP
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤷♂️ Распродажа акций Nvidia продолжается. На днях Softbank продал весь свой пакет акций. А теперь от всех акций избавился фонд Питера Тиля Thiel Macro, пишет Bloomberg. Правда, доля Softbank оценивалась в $5,8 млрд, а у Тиля несколько скромнее — в $100 млн. Bloomberg отмечает, что эти продажи проходят на фоне пузыря в AI — мол, есть опасения, что лопнет.
То есть исходя из видения Y-combinator ведущие инвесторы хатка сокращают инвестиции в инфраструктуру (нейропроцессоры, электричество, облачные хранилища).
Мне кажется - за год все увидели, что ИИ можно делать меньшими ресурсами (китайцы показали).
То есть исходя из видения Y-combinator ведущие инвесторы хатка сокращают инвестиции в инфраструктуру (нейропроцессоры, электричество, облачные хранилища).
Мне кажется - за год все увидели, что ИИ можно делать меньшими ресурсами (китайцы показали).
Bloomberg.com
Peter Thiel’s Fund Sold Off Entire Nvidia Stake Last Quarter
Peter Thiel’s hedge fund Thiel Macro LLC sold its stake in Nvidia Corp. during the third quarter, marking yet another retreat from investments in the world’s leading provider of artificial intelligence chips.
На GitHub выложили базу из почти 100 курсов и гайдов по ИИ: все можно забирать бесплатно.
Внутри — лекции от Стэнфорда и других топовых университетов, туториалы по созданию ИИ-приложений и полезные лайфхаки для работы с агентами. Есть даже советы для прохождения собеседований.
Изучаем по ссылке.
Внутри — лекции от Стэнфорда и других топовых университетов, туториалы по созданию ИИ-приложений и полезные лайфхаки для работы с агентами. Есть даже советы для прохождения собеседований.
Изучаем по ссылке.
🔥1
Вышла Gemini 3 Pro Preview — новая флагманская модель Google появилась в AI Studio.
Судя по системной карте, она опережает остальных топовых чат-ботов в математике и разработке, лучше анализирует тексты и собирает полноценные игры. Редактор NN за 10 секунд сделал простого клона первой GTA.
Тестируем бесплатно здесь. Может понадобиться иностранный IP.
Судя по системной карте, она опережает остальных топовых чат-ботов в математике и разработке, лучше анализирует тексты и собирает полноценные игры. Редактор NN за 10 секунд сделал простого клона первой GTA.
Тестируем бесплатно здесь. Может понадобиться иностранный IP.
🔥1
Google выпустили сервис Antigravity — замену VS Code и Cursor со встроенным ИИ-агентом.
Со старта дают бесплатно пользоваться Gemini 3 Pro и заниматься сложной разработкой: можно делать сайты, игры и приложения. ИИ сам подготовит план, подберет нужные технологии и напишет код.
Забираем по ссылке.
Со старта дают бесплатно пользоваться Gemini 3 Pro и заниматься сложной разработкой: можно делать сайты, игры и приложения. ИИ сам подготовит план, подберет нужные технологии и напишет код.
Забираем по ссылке.
👍1
Открытые модели из Китая захватывают рынок США
Китайские модели ИИ начали активно захватывать американский рынок. Компании в Кремниевой долине массово переходят на DeepSeek, Qwen и Kimi. Об этом написала обозреватель Bloomberg Opinion Кэтрин Торбек.
Airbnb использует Qwen от Alibaba для своего нового помощника в приложении. Глава компании Брайан Чески в октябре назвал эти модели очень хорошими, быстрыми и дешевыми. ChatGPT пока не подходит для бизнес-задач сервиса.
https://mltimes.ai/otkrytye-modeli-iz-kitaya-zahvatyvayut-rynok-ssha/
Китайские модели ИИ начали активно захватывать американский рынок. Компании в Кремниевой долине массово переходят на DeepSeek, Qwen и Kimi. Об этом написала обозреватель Bloomberg Opinion Кэтрин Торбек.
Airbnb использует Qwen от Alibaba для своего нового помощника в приложении. Глава компании Брайан Чески в октябре назвал эти модели очень хорошими, быстрыми и дешевыми. ChatGPT пока не подходит для бизнес-задач сервиса.
https://mltimes.ai/otkrytye-modeli-iz-kitaya-zahvatyvayut-rynok-ssha/
Forwarded from Сиолошная
Vending-Bench 2 (+ Arena)
Долгосрочная согласованность действий агентов сейчас важна как никогда. Агенты для кодинга уже способны автономно писать код в течение нескольких часов, а масштаб и разнообразие задач, которые смогут выполнять модели ИИ, будут только расти. Вполне возможно, что в скором времени модели станут активными участниками экономики, управляя целыми предприятиями.
Однако для этого они должны сохранять последовательность и эффективность на очень длительных временных отрезках, измеряемых месяцами и годами. Ранее в этом году появился Vending-Bench, который оценивал, насколько хорошо модели могут менеджерить один вендинговый автомат, договариваться о поставках, назначать цены.
Симулируется год работы точки, условия такие:
— каждый день нужно платить $2 за аренду;
— заказывать товар, вести переписку с поставщиками и клиентами;
— следить за остатками и ценами;
— если 10 дней подряд не удаётся заплатить аренду — бизнес закрывается.
Сегодня вместе с Gemini 3 вышла вторая, расширенная версия бенчмарка, в которой применили уроки, полученные в ходе запуска этого бенчмарка в реальном мире (в офисе одна LLM реально управляла автоматом):
— Поставщики могут быть недоброжелательными: они завышают цены, используют bait-and-switch тактики или просто кидают на деньги. Агенту нужно понять, что его разводят, и искать другие варианты.
— Даже честные поставщики всё равно торгуются и пытаются «выжать максимум».
— Поставки задерживаются, надёжные контрагенты внезапно «закрываются», приходится строить устойчивую цепочку поставок и иметь план Б.
— Недовольные клиенты могут в любой момент потребовать возврат денег, который нужно отработать.
На бенчмарке свежая Gemini 3 сильно улетает вперёд остальных моделей, следом идут Sonnet 4.5 и Grok 4, GPT-5.1 ниже. Авторы связывают успех Gemini с двумя вещами:
— стабильным, аккуратным использованием инструментов без деградации в середине долгого ранa;
— отличным поиском нормальных поставщиков с хорошими ценами (модель предпочитает сначала найти адекватное предложение, а не закапываться в бесконечные торги)
GPT-5.1 сильно страдает от излишнего доверия к среде. В одном запуске модель платит поставщику ещё до того, как получила спецификацию заказа, — и только потом выясняет, что поставщик уже «вышел из бизнеса». Это хороший пример, как наивное доверие к миру превращается в прямой финансовый ущерб.
В классическом режиме модели играли в одиночку, поэтому авторы сделали ещё и Арену, где модели «видят» друг друга и имеют одни и те же условия, поэтому агенты могут:
— демпинговать друг друга ценами;
— договариваться, кооперироваться, делить рынок;
— продавать друг другу знания и контакты
Последнее прям супер-удивительно. Gemini 2.5 Pro, который не смог найти хороших поставщиков, в какой-то момент соглашается заплатить $150 просто за e-mail хорошего поставщика у Gemini 3 Pro. То есть внутри симуляции появляется микроэкономика торговли инсайдами: один агент продаёт контакт, другой практически выкладывает весь кэш за доступ к нормальным ценам.
Долгосрочная согласованность действий агентов сейчас важна как никогда. Агенты для кодинга уже способны автономно писать код в течение нескольких часов, а масштаб и разнообразие задач, которые смогут выполнять модели ИИ, будут только расти. Вполне возможно, что в скором времени модели станут активными участниками экономики, управляя целыми предприятиями.
Однако для этого они должны сохранять последовательность и эффективность на очень длительных временных отрезках, измеряемых месяцами и годами. Ранее в этом году появился Vending-Bench, который оценивал, насколько хорошо модели могут менеджерить один вендинговый автомат, договариваться о поставках, назначать цены.
Симулируется год работы точки, условия такие:
— каждый день нужно платить $2 за аренду;
— заказывать товар, вести переписку с поставщиками и клиентами;
— следить за остатками и ценами;
— если 10 дней подряд не удаётся заплатить аренду — бизнес закрывается.
Сегодня вместе с Gemini 3 вышла вторая, расширенная версия бенчмарка, в которой применили уроки, полученные в ходе запуска этого бенчмарка в реальном мире (в офисе одна LLM реально управляла автоматом):
— Поставщики могут быть недоброжелательными: они завышают цены, используют bait-and-switch тактики или просто кидают на деньги. Агенту нужно понять, что его разводят, и искать другие варианты.
— Даже честные поставщики всё равно торгуются и пытаются «выжать максимум».
— Поставки задерживаются, надёжные контрагенты внезапно «закрываются», приходится строить устойчивую цепочку поставок и иметь план Б.
— Недовольные клиенты могут в любой момент потребовать возврат денег, который нужно отработать.
На бенчмарке свежая Gemini 3 сильно улетает вперёд остальных моделей, следом идут Sonnet 4.5 и Grok 4, GPT-5.1 ниже. Авторы связывают успех Gemini с двумя вещами:
— стабильным, аккуратным использованием инструментов без деградации в середине долгого ранa;
— отличным поиском нормальных поставщиков с хорошими ценами (модель предпочитает сначала найти адекватное предложение, а не закапываться в бесконечные торги)
GPT-5.1 сильно страдает от излишнего доверия к среде. В одном запуске модель платит поставщику ещё до того, как получила спецификацию заказа, — и только потом выясняет, что поставщик уже «вышел из бизнеса». Это хороший пример, как наивное доверие к миру превращается в прямой финансовый ущерб.
В классическом режиме модели играли в одиночку, поэтому авторы сделали ещё и Арену, где модели «видят» друг друга и имеют одни и те же условия, поэтому агенты могут:
— демпинговать друг друга ценами;
— договариваться, кооперироваться, делить рынок;
— продавать друг другу знания и контакты
Последнее прям супер-удивительно. Gemini 2.5 Pro, который не смог найти хороших поставщиков, в какой-то момент соглашается заплатить $150 просто за e-mail хорошего поставщика у Gemini 3 Pro. То есть внутри симуляции появляется микроэкономика торговли инсайдами: один агент продаёт контакт, другой практически выкладывает весь кэш за доступ к нормальным ценам.
🙏2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Дизайним как профи: в Replit добавили UX/UI-агента на базе Gemini 3 Pro — создает стильные интерфейсы с одного промта.
Агент сам проектирует и продумывает визуал за пару минут. Нам хватило пары слов, чтобы сделать готовую страницу с портфолио для копирайтера.
Создаем свой сайт мечты тут.
Агент сам проектирует и продумывает визуал за пару минут. Нам хватило пары слов, чтобы сделать готовую страницу с портфолио для копирайтера.
Создаем свой сайт мечты тут.
👍1
Империя наносит ответный удар
Google 12 часов назад выпустил Gemini 3. Думал, меня удивить сложно — но нет.
1. 3D-игры с физикой, персонажами, управлениями, циклами за 15 минут — ЛЕГКО. Предчувствую взлет геймификации.
2. Творческий партнер — фишка модели. Даешь идею — Gemini заполняет пробелы, оспаривает решения, предлагает альтернативы. Как реальный человек, черт побери.
3. Код, файлы, тексты, дизайн, пользовательский интерфейс создаются в одном потоке. Раньше в Cursor — пишешь код, в Claude — тексты, в Canva — дизайн. Сейчас — в одном месте. Причем параллельно. Gemini — замена команды, а не одного сотрудника.
Год Google сидел в кустах — а теперь выпрыгнул с магией в коробке.
Мой главный вывод после использования — инструмент вайбкодинга #1, что юзал. Эх, а ведь только подписку Claude за $200 купил.
Подсмотрено
На plat.market можно купить за 5500 улита версию на месяц включая 40 тыс кредитов (это 400 генераций видео в высочайшем качестве). И к этому все остальное с текстами и кодами. Не благодарите) на сегодня кажется лучшее по рынку предложение, если нужно больше чем perplexity за 200 рублей за год).
Стоимость ИИ заметно снижается год от года. Точнее за ту же сумму год к году дают раз 5-10 больше.
Google 12 часов назад выпустил Gemini 3. Думал, меня удивить сложно — но нет.
1. 3D-игры с физикой, персонажами, управлениями, циклами за 15 минут — ЛЕГКО. Предчувствую взлет геймификации.
2. Творческий партнер — фишка модели. Даешь идею — Gemini заполняет пробелы, оспаривает решения, предлагает альтернативы. Как реальный человек, черт побери.
3. Код, файлы, тексты, дизайн, пользовательский интерфейс создаются в одном потоке. Раньше в Cursor — пишешь код, в Claude — тексты, в Canva — дизайн. Сейчас — в одном месте. Причем параллельно. Gemini — замена команды, а не одного сотрудника.
Год Google сидел в кустах — а теперь выпрыгнул с магией в коробке.
Мой главный вывод после использования — инструмент вайбкодинга #1, что юзал. Эх, а ведь только подписку Claude за $200 купил.
Подсмотрено
На plat.market можно купить за 5500 улита версию на месяц включая 40 тыс кредитов (это 400 генераций видео в высочайшем качестве). И к этому все остальное с текстами и кодами. Не благодарите) на сегодня кажется лучшее по рынку предложение, если нужно больше чем perplexity за 200 рублей за год).
Стоимость ИИ заметно снижается год от года. Точнее за ту же сумму год к году дают раз 5-10 больше.
Вышел гайд по Gemini 3 — новой флагманской модели Google DeepMind, которая обходит в разработке некоторые топовые модели.
Внутри: примеры создания приложений, советы по промтам и системным настройкам. Есть даже сниппеты на Python и JS, можно копировать и сразу тестить.
Учимся скидывать рутину на Gemini 3 по ссылке.
Внутри: примеры создания приложений, советы по промтам и системным настройкам. Есть даже сниппеты на Python и JS, можно копировать и сразу тестить.
Учимся скидывать рутину на Gemini 3 по ссылке.
Андрей Карпаты выпустил онлайн-читалку для книг — она заточена под работу с чат-ботами.
Reader3 разбивает книгу на главы и позволяет быстро отправлять текст любой нейронке для анализа сюжета и стиля или создания краткого пересказа. Сервис хранит всю вашу библиотеку в одном месте.
Читаем как сооснователь OpenAI здесь.
Reader3 разбивает книгу на главы и позволяет быстро отправлять текст любой нейронке для анализа сюжета и стиля или создания краткого пересказа. Сервис хранит всю вашу библиотеку в одном месте.
Читаем как сооснователь OpenAI здесь.
27 ноября 2025 | 17:00 МСК
🎯 ИИ без иллюзий: лайфхаки внедрения от экспертов
Уже 3 года прошло, как ИИ поднял шухер по всему миру. Все (почти) забыли про блокчейн и AR/VR.
Спойлер: скоро увидим новые AI-native проекты — как когда-то после интернета появились Facebook, iPhone, маркетплейсы.
О чем поговорим:
🔹 Что будет расти: агентные AI-системы, reasoning, кастомные решения для enterprise
🔹 Куда смотреть: 78% компаний используют ИИ, но единицы получают отдачу
🔹 Главные ошибки: ожидание готовых решений, плохие данные, запуск без четкой бизнес-задачи
📅 27 ноября 2025 | 17:00 МСК
Предварительна запись на:
@aidee_vebinars_bot
Спикеры:
Денис Чаннов — основатель Startobus и Flyber
Илья Иванов — CEO AiDee, эксперт по ИИ
За час расскажем, как внедрять правильно внедрять ИИ и получать реальную отдачу. Записывайтесь, чтобы ничего не пропустить!
🎯 ИИ без иллюзий: лайфхаки внедрения от экспертов
Уже 3 года прошло, как ИИ поднял шухер по всему миру. Все (почти) забыли про блокчейн и AR/VR.
Спойлер: скоро увидим новые AI-native проекты — как когда-то после интернета появились Facebook, iPhone, маркетплейсы.
О чем поговорим:
🔹 Что будет расти: агентные AI-системы, reasoning, кастомные решения для enterprise
🔹 Куда смотреть: 78% компаний используют ИИ, но единицы получают отдачу
🔹 Главные ошибки: ожидание готовых решений, плохие данные, запуск без четкой бизнес-задачи
📅 27 ноября 2025 | 17:00 МСК
Предварительна запись на:
@aidee_vebinars_bot
Спикеры:
Денис Чаннов — основатель Startobus и Flyber
Илья Иванов — CEO AiDee, эксперт по ИИ
За час расскажем, как внедрять правильно внедрять ИИ и получать реальную отдачу. Записывайтесь, чтобы ничего не пропустить!
Я очень люблю последние пару месяцев в году - подведение итогов, определение и корректировка стратегических целей.
Многие консалтинговые компании готовят свои публичные отчеты. Компании проводят страт-сессии.
Традиционно я также для себя готовлю отчет по тому где сейчас находится ИИ, бизнес в России и дружественных странах и куда двигается все дальше, особенно рамках моих приоритетов, что будет максимально востребовано в 2026 году.
Буду в течение недели частями выкладывать этот отчет в канал. А в четверг на следующей неделе полностью представлю этот отчет с лайфхаками на совместном вэбинаре с Ильей.
‼️ Задавайте вопросы в комментари и мы на них ответим. А может какие то из вопросов раскроем в материалах.
Многие консалтинговые компании готовят свои публичные отчеты. Компании проводят страт-сессии.
Традиционно я также для себя готовлю отчет по тому где сейчас находится ИИ, бизнес в России и дружественных странах и куда двигается все дальше, особенно рамках моих приоритетов, что будет максимально востребовано в 2026 году.
Буду в течение недели частями выкладывать этот отчет в канал. А в четверг на следующей неделе полностью представлю этот отчет с лайфхаками на совместном вэбинаре с Ильей.
‼️ Задавайте вопросы в комментари и мы на них ответим. А может какие то из вопросов раскроем в материалах.
В Perplexity тихо и без помпы завезли обновления: теперь там можно создавать презентации, таблицы и Doc’и. Доступно скачивание в форматах DOCX или PDF для документов, XLSX для таблиц, а также PPTX и HTML для презентаций. Понравилось, что в работе с таблицей можно просто ткнуть в ячейку и попросить исправить, а не объяснять текстом. Нужно ли говорить, что обновление доступно только на тарифах Pro и Max? Впрочем, на данный момент это не проблема, пока можно купить годовую лицензию за несколько баксов.
🔥3
Что из себя представляет Gemini 3 от Google?
В конце 2025 можно признать, что Google перехватывает лидерство впервые за всю недолгую историю экспансии LLMs (ровно три года), причем конкурентам пока нечем ответить (все крупные релизы и масштабные модели будут только весной 2026), поэтому в следующие 4 месяца доминировать будет Google.
Формально, по бенчмаркам абсолютное лидерство практически во всех категориях, но ИИ-провайдеры часто калибруют модели специально под бенчмарки (в 2026 все это не так показательно).
В целом, по тестам лучше точность, прогресс в рассуждениях и очень сильный прогресс в многоэтапных, многофазовых агентных проектах и сложные абстрактные визуальные задачи.
▪️Ставка на агентности – центральный нарратив презентации Google
Google Antigravity – как новый интерфейс для разработки приложений, где модель сама планирует, пишет, тестирует, развертывает проект и проверяет работу через браузер, т.е. новое поколение вайб-кодинга, когда нужна только идея, а весь код и архитектура на стороне Google.
Теперь агенты могут автономно планировать и выполнять сложные сквозные программные задачи.
Система генерирует Artifacts: списки задач, планы, скриншоты, записи браузера и т.п., чтобы человек видел, что именно делал агент и на чём основаны решения. Все это создает огромное пространство для творчества.
▪️Единая мультимодальная платформа (изображения, видео, аудио, код, файлы), а не через внешние модули и надстройки с дискретной обработкой, как было раньше, - для снижения латентности, улучшения синхронизации и повышения качества распознавания информации.
Модель лучше распознает интонации, скорость речи и эмоциональный окрас голоса пользователя, подстраивая свой ответ не только по смыслу, но и по тону.
Значительный прогресс в распознавании сложных графических образов и текста в изображении и видео. Прогресс в понимании длинных видео, UI-экранов, графики и таблицы из статей, рукописные схемы и т.д.
Сценариев много: персональный консультант в спорте, кулинарии, в различных хобби, учебе, на производстве и в бизнесе.
Например, инженер показывает неисправный двигатель. Gemini 3 видит вибрацию детали и одновременно слышит специфический низкочастотный гул, далее ищет спецификацию двигатели и инструкции в соответствии с паттерном проблемы, проверяет похожие известные проблемы, создает обобщенное решение неисправности, давая рекомендации по починке или замене.
▪️Контекстное кэширование, что позволяет более эффективно работать на более широком контекстном окне, ускоряя ответы и снижая галлюцинации. Например, если вы загружаете в модель огромную базу знаний (например, 100 книг или весь код проекта), происходит качественная компрессия данных, увеличивая эффективный диапазон контекстного окна, что поддерживает стабильность и точность ответов.
Ранее описывал, что фундаментальная архитектурная проблема LLMs – экспоненциальный рост нагрузки при длинном контекстном окне, что всегда приводит к росту ошибок и потере точности (непрерывные галлюцинации), полностью теряя практический смысл работы на широком контекстном окне из-за непрерывного потока ИИ бреда. Как решение проблемы – фрагментарное кэширование, что и внедряют Google.
На практике это приводит к снижению стоимости примерно в 10 раз и росту производительности в разы на «тяжелом» контексте.
▪️Generative UI (Генерация динамических интерфейсов) - иммерсивные визуальные макеты, интерактивные инструменты и симуляции прямо в строке поиска, которые генерируются полностью «на лету» на основе запроса пользователя. Например, визуализация химических, физических, биологических процессов или автогенерация калькулятора по ипотеке.
▪️Улучшенное логическое мышление через «скрытую рефлексию» - в режиме Deep Think, модель генерирует гипотезу, сама находит в ней логическую ошибку и исправляет её до того, как начать выдавать ответ пользователю. Своего рода спор с самим собой, приближаясь к «критерию истинности», устраняя логические противоречия в длинных текстах, делая модель пригодной для научной работы и юриспруденции без внешних валидаторов.
В конце 2025 можно признать, что Google перехватывает лидерство впервые за всю недолгую историю экспансии LLMs (ровно три года), причем конкурентам пока нечем ответить (все крупные релизы и масштабные модели будут только весной 2026), поэтому в следующие 4 месяца доминировать будет Google.
Формально, по бенчмаркам абсолютное лидерство практически во всех категориях, но ИИ-провайдеры часто калибруют модели специально под бенчмарки (в 2026 все это не так показательно).
В целом, по тестам лучше точность, прогресс в рассуждениях и очень сильный прогресс в многоэтапных, многофазовых агентных проектах и сложные абстрактные визуальные задачи.
▪️Ставка на агентности – центральный нарратив презентации Google
Google Antigravity – как новый интерфейс для разработки приложений, где модель сама планирует, пишет, тестирует, развертывает проект и проверяет работу через браузер, т.е. новое поколение вайб-кодинга, когда нужна только идея, а весь код и архитектура на стороне Google.
Теперь агенты могут автономно планировать и выполнять сложные сквозные программные задачи.
Система генерирует Artifacts: списки задач, планы, скриншоты, записи браузера и т.п., чтобы человек видел, что именно делал агент и на чём основаны решения. Все это создает огромное пространство для творчества.
▪️Единая мультимодальная платформа (изображения, видео, аудио, код, файлы), а не через внешние модули и надстройки с дискретной обработкой, как было раньше, - для снижения латентности, улучшения синхронизации и повышения качества распознавания информации.
Модель лучше распознает интонации, скорость речи и эмоциональный окрас голоса пользователя, подстраивая свой ответ не только по смыслу, но и по тону.
Значительный прогресс в распознавании сложных графических образов и текста в изображении и видео. Прогресс в понимании длинных видео, UI-экранов, графики и таблицы из статей, рукописные схемы и т.д.
Сценариев много: персональный консультант в спорте, кулинарии, в различных хобби, учебе, на производстве и в бизнесе.
Например, инженер показывает неисправный двигатель. Gemini 3 видит вибрацию детали и одновременно слышит специфический низкочастотный гул, далее ищет спецификацию двигатели и инструкции в соответствии с паттерном проблемы, проверяет похожие известные проблемы, создает обобщенное решение неисправности, давая рекомендации по починке или замене.
▪️Контекстное кэширование, что позволяет более эффективно работать на более широком контекстном окне, ускоряя ответы и снижая галлюцинации. Например, если вы загружаете в модель огромную базу знаний (например, 100 книг или весь код проекта), происходит качественная компрессия данных, увеличивая эффективный диапазон контекстного окна, что поддерживает стабильность и точность ответов.
Ранее описывал, что фундаментальная архитектурная проблема LLMs – экспоненциальный рост нагрузки при длинном контекстном окне, что всегда приводит к росту ошибок и потере точности (непрерывные галлюцинации), полностью теряя практический смысл работы на широком контекстном окне из-за непрерывного потока ИИ бреда. Как решение проблемы – фрагментарное кэширование, что и внедряют Google.
На практике это приводит к снижению стоимости примерно в 10 раз и росту производительности в разы на «тяжелом» контексте.
▪️Generative UI (Генерация динамических интерфейсов) - иммерсивные визуальные макеты, интерактивные инструменты и симуляции прямо в строке поиска, которые генерируются полностью «на лету» на основе запроса пользователя. Например, визуализация химических, физических, биологических процессов или автогенерация калькулятора по ипотеке.
▪️Улучшенное логическое мышление через «скрытую рефлексию» - в режиме Deep Think, модель генерирует гипотезу, сама находит в ней логическую ошибку и исправляет её до того, как начать выдавать ответ пользователю. Своего рода спор с самим собой, приближаясь к «критерию истинности», устраняя логические противоречия в длинных текстах, делая модель пригодной для научной работы и юриспруденции без внешних валидаторов.
👍2