answer as

Grok лежит уже третий день подряд.

В начале недели xAI запустила новые функции, а раннее – бету 4.3. Видимо, поэтому нагрузка возросла. Пользователи видят ошибку "high demand", часть платных подписчиков SuperGrok тоже не могут зайти. Тем временем страница статуса xAI показывает, что проблем нет.

❤2

67 views15:48

answer as

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

Вышла GPT-5.5.

1❤8

61 views18:36

answer as

DeepSeek выпустила V4 в один день с GPT-5.5. Вышло две версии – Pro на 1.6 триллиона параметров и Flash на 284 миллиарда, обе с поддержкой контекста в миллион токенов. Веса открыты под лицензией Apache 2.0.

V4-Pro занял третье место среди открытых моделей в рейтинге кодинга Arena Code и обошел GPT-5.4 на Codeforces. При этом его стоимость 3.48 доллара за миллион токенов, что почти в 9 раз дешевле новой GPT-5.5. Модель обучена на чипах Huawei Ascend, что важно в контексте американских санкций на экспорт процессоров.

❤4

63 views08:06

answer as

Вышла GPT-5.5.

GPT-5.5 стала первой полностью переобученной моделью со времен GPT-4.5. Вышло две версии, GPT-5.5 Thinking и Pro.

Семейство прибавило в основных агентских задачах и интеллектуальных тестах, а еще стало первым, кто пробил порог в 85% по абстрактным размышлениям ARC-AGI-2. Мнения пользователей сходятся в том, что она поумнела, лучше следует инструкциям, а ответы ощущаются более полными.

Но есть и проблемы. При оценке моделей, им выгоднее что-нибудь ответить наугад, чем честно сказать «не знаю». GPT-5.5 страдает от этого сильнее других. По тесту AA-Omniscience степень ее галлюцинаций составила 86% против 36% у Opus 4.7 и 50% у Gemini 3.1 Pro preview.

Дополнительно:

• стала эффективнее по расходу токенов, но подорожала в API в два раза. Самого доступа к API еще нет из-за доработки фильтров безопасности;
• GPT-5.5 помогла оптимизировать свою же инфраструктуру на 20%;
• био и кибер навыки модели отнесли к категории High, поэтому в ней включили более строгие фильтры на такие запросы (пример на фото)

❤3👏2

63 views13:21

answer as

Китайская модель нашла себя в ИИ-сериале. Ее цифровой двойник бьет женщин и обижает животных в микродраме "Цветок персика", которую крутили на Hongguo – платформе ByteDance (создатели Seedance и Seedream).

Модель Кристин Ли заметила, что создатели взяли конкретный набор ее фото двухлетней давности из соцсетей. Еще один пострадавший – стилист традиционных костюмов, которого сделали неприятным антагонистом. После обвинений руководство провело проверку: продюсеры не смогли предоставить разрешение на использование и шоу просто удалили.

❤4

66 viewsedited 16:02

answer as

Google вложила $40 млрд в Anthropic. $10 млрд уже переведено, остальное – если компания выполнит показатели. Сверху Google даст еще 5 гигаватт облачных вычислительных мощностей на пять лет. Оценка Anthropic теперь $350 млрд, при годовой выручке в $30 млрд.

Amazon несколько дней назад тоже объявил инвестицию в размере $25 млрд в них же.

❤2

64 viewsedited 12:44

answer as

Anthropic запустила внутренний рынок, где ИИ-агенты торговались вместо людей.

69 сотрудников попросили подготовить список своих личных вещей, которые они хотели бы продать и список вещей, которые они хотели бы купить. Затем на их аккаунты выдали по $100 и подключили агенты Claude, которые неделю вели самостоятельные переговоры на основе списков владельцев. Итог: 186 сделок на $4000+. Один агент купил 19 мячиков для пинг-понга, потому что сотрудница разрешила купить что нибудь "в подарок себе (Claude)".

В рамках маркета Anthropic тихо прогнала 4 параллельных теста. В одном из них, части аккаунтов подключили топовую на тот момент Opus 4.5, другим – самую дешевую Haiku 4.5. Opus выторговывал в среднем на $2.68 больше за каждый товар. Интересно, что люди с более слабым агентом считали сделки честными и не заподозрили никакого подвоха.

❤5

53 viewsedited 16:22

answer as

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

Google запустила экспериментальный режим поиска "Ask YouTube". Вместо списка видео по ключевым словам пользователь получает текстовый ответ с подборкой релевантных клипов и возможностью уточнять в рамках одного диалога.

Функция работает через кнопку в строке поиска. Система собирает ответ из содержимого видео, Shorts и текстовых описаний. Google предупреждает, что качество и точность могут варьироваться, и просит ставить оценки. Пока доступно только премиум-подписчикам в США, зарегистрированным в специальной программе для теста функций.

👍6

52 views14:37

answer as

В Окленде начался суд Маска против Альтмана. Жюри из 9 человек отобрано, открытые аргументы стартовали сегодня. Маск требует 134 млрд долларов, отставки Альтмана и возврата OpenAI в статус некоммерческой организации.

Из 26 претензий до суда дожили только две – нарушение благотворительного доверия и неосновательное обогащение. Альтман и Брокман присутствуют в зале. Маск не пришел, но зато активно репостит мемы и посты в X со «Scam Altman».

UPD: Маск все-таки пришел

❤4😱2

52 viewsedited 15:42

answer as

OpenAI провалила собственные цели по пользователям и выручке. Они не дотянули до миллиарда еженедельных юзеров к концу 2025 (набрали 900 млн к февралю 2026), а месячные планы по деньгам срывались несколько раз подряд в начале 2026-го.

CFO Сара Фрейар, по данным WSJ, предупредила коллег, что компания тратит слишком много на дата-центры и может не потянуть уже подписанные контракты на вычисления. До 280 млрд долларов выручки к 2030 году надо как-то добраться при текущих 25 млрд. Anthropic тем временем уже обогнала OpenAI, заработав 30 млрд и потратив на обучение моделей примерно в четыре раза меньше.

❤5

54 views11:08

answer as

Poolside AI выпустила два новых ИИ-агента для написания кода - Laguna M.1 и Laguna XS.2. Меньшая модель XS.2 содержит 33 миллиарда параметров и запускается на Mac с 36 ГБ памяти через Ollama.

Модели заточены под агентный кодинг, прогон тестов и исправление багов в длительных сессиях. XS.2 набирает 68,2% на SWE-bench Verified, что сопоставимо с Claude Haiku 4.5. Большая M.1 (225 млрд параметров) конкурирует с Sonnet 4.6 и DeepSeek V4 Flash. Доступна бесплатно через API.

🤩2❤1

56 viewsedited 12:34

answer as

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

кажется, началось

😁8

52 views16:25

answer as

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

Anthropic выпустила 9 коннекторов Claude для творческих инструментов. Теперь он умеет работать прямо внутри Blender, продуктов Adobe (Photoshop, Firefly, Premiere), Ableton, SketchUp и Splice.

Коннекторы работают по протоколу MCP и позволяют Claude управлять сценами в 3D-редакторах, пакетно обрабатывать задачи в Adobe, искать сэмплы в Splice и переносить файлы между программами. Anthropic даже вступила в фонд развития Blender с взносом 240 000 евро в год.

❤3

66 views08:42

answer as

OpenAI запретила своему инструменту Codex упоминать гоблинов, гремлинов, енотов, троллей, огров и голубей, если только это не связано с запросом пользователя напрямую. Запрет прописан в системном промпте несколько раз подряд.

Проблема появилась в релизе GPT-5.1. Модель где-то решила, что слово "гоблин" отлично заменяет расплывчатые термины типа "штуковина" или "вещь". Сотрудник Google поделился логами, где ИИ использовал goblin несколько раз в день в рабочих ответах. Частота упоминаний гоблинов в ChatGPT выросла еще больше, когда в версии 5.4 добавили личность Nerdy. От нее пришлось избавиться, но даже после этого модель добавляла их так часто, что пришлось вписать ограничения в системный промпт.

😁6

57 views12:11

answer as

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

xAI запустила Imagine Agent в Grok, который пишет сценарий, генерирует сцены, склеивает их в короткий фильм и делает постер.

Imagine Agent работает в холсте вместо обычного чата и может выполнять довольно сложные задачи по созданию минутных роликов, UGC-контента, стрипов комиксов и раскадровок.

Доступно пока в бета-режиме для подписчиков Grok Heavy и Super Grok. Официального анонса еще не было.

❤3

60 views11:30

About

Blog

Apps

Platform