Grok лежит уже третий день подряд.
В начале недели xAI запустила новые функции, а раннее – бету 4.3. Видимо, поэтому нагрузка возросла. Пользователи видят ошибку "high demand", часть платных подписчиков SuperGrok тоже не могут зайти. Тем временем страница статуса xAI показывает, что проблем нет.
В начале недели xAI запустила новые функции, а раннее – бету 4.3. Видимо, поэтому нагрузка возросла. Пользователи видят ошибку "high demand", часть платных подписчиков SuperGrok тоже не могут зайти. Тем временем страница статуса xAI показывает, что проблем нет.
❤2
DeepSeek выпустила V4 в один день с GPT-5.5. Вышло две версии – Pro на 1.6 триллиона параметров и Flash на 284 миллиарда, обе с поддержкой контекста в миллион токенов. Веса открыты под лицензией Apache 2.0.
V4-Pro занял третье место среди открытых моделей в рейтинге кодинга Arena Code и обошел GPT-5.4 на Codeforces. При этом его стоимость 3.48 доллара за миллион токенов, что почти в 9 раз дешевле новой GPT-5.5. Модель обучена на чипах Huawei Ascend, что важно в контексте американских санкций на экспорт процессоров.
V4-Pro занял третье место среди открытых моделей в рейтинге кодинга Arena Code и обошел GPT-5.4 на Codeforces. При этом его стоимость 3.48 доллара за миллион токенов, что почти в 9 раз дешевле новой GPT-5.5. Модель обучена на чипах Huawei Ascend, что важно в контексте американских санкций на экспорт процессоров.
❤4
answer as
Вышла GPT-5.5.
GPT-5.5 стала первой полностью переобученной моделью со времен GPT-4.5. Вышло две версии, GPT-5.5 Thinking и Pro.
Семейство прибавило в основных агентских задачах и интеллектуальных тестах, а еще стало первым, кто пробил порог в 85% по абстрактным размышлениям ARC-AGI-2. Мнения пользователей сходятся в том, что она поумнела, лучше следует инструкциям, а ответы ощущаются более полными.
Но есть и проблемы. При оценке моделей, им выгоднее что-нибудь ответить наугад, чем честно сказать «не знаю». GPT-5.5 страдает от этого сильнее других. По тесту AA-Omniscience степень ее галлюцинаций составила 86% против 36% у Opus 4.7 и 50% у Gemini 3.1 Pro preview.
Дополнительно:
• стала эффективнее по расходу токенов, но подорожала в API в два раза. Самого доступа к API еще нет из-за доработки фильтров безопасности;
• GPT-5.5 помогла оптимизировать свою же инфраструктуру на 20%;
• био и кибер навыки модели отнесли к категории High, поэтому в ней включили более строгие фильтры на такие запросы (пример на фото)
Семейство прибавило в основных агентских задачах и интеллектуальных тестах, а еще стало первым, кто пробил порог в 85% по абстрактным размышлениям ARC-AGI-2. Мнения пользователей сходятся в том, что она поумнела, лучше следует инструкциям, а ответы ощущаются более полными.
Но есть и проблемы. При оценке моделей, им выгоднее что-нибудь ответить наугад, чем честно сказать «не знаю». GPT-5.5 страдает от этого сильнее других. По тесту AA-Omniscience степень ее галлюцинаций составила 86% против 36% у Opus 4.7 и 50% у Gemini 3.1 Pro preview.
Дополнительно:
• стала эффективнее по расходу токенов, но подорожала в API в два раза. Самого доступа к API еще нет из-за доработки фильтров безопасности;
• GPT-5.5 помогла оптимизировать свою же инфраструктуру на 20%;
• био и кибер навыки модели отнесли к категории High, поэтому в ней включили более строгие фильтры на такие запросы (пример на фото)
❤3👏2
Китайская модель нашла себя в ИИ-сериале. Ее цифровой двойник бьет женщин и обижает животных в микродраме "Цветок персика", которую крутили на Hongguo – платформе ByteDance (создатели Seedance и Seedream).
Модель Кристин Ли заметила, что создатели взяли конкретный набор ее фото двухлетней давности из соцсетей. Еще один пострадавший – стилист традиционных костюмов, которого сделали неприятным антагонистом. После обвинений руководство провело проверку: продюсеры не смогли предоставить разрешение на использование и шоу просто удалили.
Модель Кристин Ли заметила, что создатели взяли конкретный набор ее фото двухлетней давности из соцсетей. Еще один пострадавший – стилист традиционных костюмов, которого сделали неприятным антагонистом. После обвинений руководство провело проверку: продюсеры не смогли предоставить разрешение на использование и шоу просто удалили.
❤4
Google вложила $40 млрд в Anthropic. $10 млрд уже переведено, остальное – если компания выполнит показатели. Сверху Google даст еще 5 гигаватт облачных вычислительных мощностей на пять лет. Оценка Anthropic теперь $350 млрд, при годовой выручке в $30 млрд.
Amazon несколько дней назад тоже объявил инвестицию в размере $25 млрд в них же.
Amazon несколько дней назад тоже объявил инвестицию в размере $25 млрд в них же.
❤2
Anthropic запустила внутренний рынок, где ИИ-агенты торговались вместо людей.
69 сотрудников попросили подготовить список своих личных вещей, которые они хотели бы продать и список вещей, которые они хотели бы купить. Затем на их аккаунты выдали по $100 и подключили агенты Claude, которые неделю вели самостоятельные переговоры на основе списков владельцев. Итог: 186 сделок на $4000+. Один агент купил 19 мячиков для пинг-понга, потому что сотрудница разрешила купить что нибудь "в подарок себе (Claude)".
В рамках маркета Anthropic тихо прогнала 4 параллельных теста. В одном из них, части аккаунтов подключили топовую на тот момент Opus 4.5, другим – самую дешевую Haiku 4.5. Opus выторговывал в среднем на $2.68 больше за каждый товар. Интересно, что люди с более слабым агентом считали сделки честными и не заподозрили никакого подвоха.
69 сотрудников попросили подготовить список своих личных вещей, которые они хотели бы продать и список вещей, которые они хотели бы купить. Затем на их аккаунты выдали по $100 и подключили агенты Claude, которые неделю вели самостоятельные переговоры на основе списков владельцев. Итог: 186 сделок на $4000+. Один агент купил 19 мячиков для пинг-понга, потому что сотрудница разрешила купить что нибудь "в подарок себе (Claude)".
В рамках маркета Anthropic тихо прогнала 4 параллельных теста. В одном из них, части аккаунтов подключили топовую на тот момент Opus 4.5, другим – самую дешевую Haiku 4.5. Opus выторговывал в среднем на $2.68 больше за каждый товар. Интересно, что люди с более слабым агентом считали сделки честными и не заподозрили никакого подвоха.
❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Google запустила экспериментальный режим поиска "Ask YouTube". Вместо списка видео по ключевым словам пользователь получает текстовый ответ с подборкой релевантных клипов и возможностью уточнять в рамках одного диалога.
Функция работает через кнопку в строке поиска. Система собирает ответ из содержимого видео, Shorts и текстовых описаний. Google предупреждает, что качество и точность могут варьироваться, и просит ставить оценки. Пока доступно только премиум-подписчикам в США, зарегистрированным в специальной программе для теста функций.
Функция работает через кнопку в строке поиска. Система собирает ответ из содержимого видео, Shorts и текстовых описаний. Google предупреждает, что качество и точность могут варьироваться, и просит ставить оценки. Пока доступно только премиум-подписчикам в США, зарегистрированным в специальной программе для теста функций.
👍6
В Окленде начался суд Маска против Альтмана. Жюри из 9 человек отобрано, открытые аргументы стартовали сегодня. Маск требует 134 млрд долларов, отставки Альтмана и возврата OpenAI в статус некоммерческой организации.
Из 26 претензий до суда дожили только две – нарушение благотворительного доверия и неосновательное обогащение. Альтман и Брокман присутствуют в зале. Маск не пришел, но зато активно репостит мемы и посты в X со «Scam Altman».
UPD: Маск все-таки пришел
Из 26 претензий до суда дожили только две – нарушение благотворительного доверия и неосновательное обогащение. Альтман и Брокман присутствуют в зале. Маск не пришел, но зато активно репостит мемы и посты в X со «Scam Altman».
UPD: Маск все-таки пришел
❤4😱2
OpenAI провалила собственные цели по пользователям и выручке. Они не дотянули до миллиарда еженедельных юзеров к концу 2025 (набрали 900 млн к февралю 2026), а месячные планы по деньгам срывались несколько раз подряд в начале 2026-го.
CFO Сара Фрейар, по данным WSJ, предупредила коллег, что компания тратит слишком много на дата-центры и может не потянуть уже подписанные контракты на вычисления. До 280 млрд долларов выручки к 2030 году надо как-то добраться при текущих 25 млрд. Anthropic тем временем уже обогнала OpenAI, заработав 30 млрд и потратив на обучение моделей примерно в четыре раза меньше.
CFO Сара Фрейар, по данным WSJ, предупредила коллег, что компания тратит слишком много на дата-центры и может не потянуть уже подписанные контракты на вычисления. До 280 млрд долларов выручки к 2030 году надо как-то добраться при текущих 25 млрд. Anthropic тем временем уже обогнала OpenAI, заработав 30 млрд и потратив на обучение моделей примерно в четыре раза меньше.
❤5
Poolside AI выпустила два новых ИИ-агента для написания кода - Laguna M.1 и Laguna XS.2. Меньшая модель XS.2 содержит 33 миллиарда параметров и запускается на Mac с 36 ГБ памяти через Ollama.
Модели заточены под агентный кодинг, прогон тестов и исправление багов в длительных сессиях. XS.2 набирает 68,2% на SWE-bench Verified, что сопоставимо с Claude Haiku 4.5. Большая M.1 (225 млрд параметров) конкурирует с Sonnet 4.6 и DeepSeek V4 Flash. Доступна бесплатно через API.
Модели заточены под агентный кодинг, прогон тестов и исправление багов в длительных сессиях. XS.2 набирает 68,2% на SWE-bench Verified, что сопоставимо с Claude Haiku 4.5. Большая M.1 (225 млрд параметров) конкурирует с Sonnet 4.6 и DeepSeek V4 Flash. Доступна бесплатно через API.
🤩2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic выпустила 9 коннекторов Claude для творческих инструментов. Теперь он умеет работать прямо внутри Blender, продуктов Adobe (Photoshop, Firefly, Premiere), Ableton, SketchUp и Splice.
Коннекторы работают по протоколу MCP и позволяют Claude управлять сценами в 3D-редакторах, пакетно обрабатывать задачи в Adobe, искать сэмплы в Splice и переносить файлы между программами. Anthropic даже вступила в фонд развития Blender с взносом 240 000 евро в год.
Коннекторы работают по протоколу MCP и позволяют Claude управлять сценами в 3D-редакторах, пакетно обрабатывать задачи в Adobe, искать сэмплы в Splice и переносить файлы между программами. Anthropic даже вступила в фонд развития Blender с взносом 240 000 евро в год.
❤3
OpenAI запретила своему инструменту Codex упоминать гоблинов, гремлинов, енотов, троллей, огров и голубей, если только это не связано с запросом пользователя напрямую. Запрет прописан в системном промпте несколько раз подряд.
Проблема появилась в релизе GPT-5.1. Модель где-то решила, что слово "гоблин" отлично заменяет расплывчатые термины типа "штуковина" или "вещь". Сотрудник Google поделился логами, где ИИ использовал goblin несколько раз в день в рабочих ответах. Частота упоминаний гоблинов в ChatGPT выросла еще больше, когда в версии 5.4 добавили личность Nerdy. От нее пришлось избавиться, но даже после этого модель добавляла их так часто, что пришлось вписать ограничения в системный промпт.
Проблема появилась в релизе GPT-5.1. Модель где-то решила, что слово "гоблин" отлично заменяет расплывчатые термины типа "штуковина" или "вещь". Сотрудник Google поделился логами, где ИИ использовал goblin несколько раз в день в рабочих ответах. Частота упоминаний гоблинов в ChatGPT выросла еще больше, когда в версии 5.4 добавили личность Nerdy. От нее пришлось избавиться, но даже после этого модель добавляла их так часто, что пришлось вписать ограничения в системный промпт.
😁6
xAI запустила Imagine Agent в Grok, который пишет сценарий, генерирует сцены, склеивает их в короткий фильм и делает постер.
Imagine Agent работает в холсте вместо обычного чата и может выполнять довольно сложные задачи по созданию минутных роликов, UGC-контента, стрипов комиксов и раскадровок.
Доступно пока в бета-режиме для подписчиков Grok Heavy и Super Grok. Официального анонса еще не было.
Imagine Agent работает в холсте вместо обычного чата и может выполнять довольно сложные задачи по созданию минутных роликов, UGC-контента, стрипов комиксов и раскадровок.
Доступно пока в бета-режиме для подписчиков Grok Heavy и Super Grok. Официального анонса еще не было.
❤3