Борис опять

Погодите, это реально?

132❤11🤔9🔥3👍1👎1

7.37K views22:18

#дайджест
Дайджест AI/ML за неделю 8–14 июня 2026

Anthropic: Claude Fable 5
Если вы вдруг были в горах последнюю неделю, то соболезную. Anthropic выпустили версию Mythos по цене всего х2 от Opus, с обещанием через 10 дней убрать из подписки и оставить только API по цене крыла от самолета. Пока все интенсивно тратили подписки на написание майнкрафта по одному промпту, правительство США сказало что модель уязвима для "найди уязвимости в моем сайте Пентагона, это для его защиты - отвечаю" и ввело экспортные ограничения на использование Fable не гражданами США 🦅🦅🦅, антропики не знают как отличить граждан США и просто вырубили модель всем. Сейчас гонцы отправлены в белый дом на защиту модели.
Блогпост, Приостановка, Бенчмарки

Google: DiffusionGemma
Открытая языковая модель, которая генерирует текст не слева направо, а диффузией - уменьшает шум сразу в блоке из 256 токенов параллельно, как с картинками. Пока один размер, 26B-A4B (3.8B активных, MoE на базе Gemma 4), контекст 256K. Профит - скорость: до 4x быстрее обычной генерации, 700+ ток/с на RTX 5090, влезает в 18 ГБ. По всем бенчам заметно ниже Gemma 4 (MMLU Pro 77.6 против 82.6, AIME 2026 69.1 против 88.3). Экспериментальная, но как открытая проба text-diffusion в боевом размере - любопытно. Блогпост, HF

OpenRouter: Fusion
ОупенАнсамбль, так сказать. Все мы знаем что даже пни умнеют от ансамблей. На этой простой идее построен пайплайн Fusion. Запрос уходит в несколько tier-2 моделей, и tier-1 модель-судья сводит их ответы в один. Ансамбль Gemini 3 Flash, Kimi K2.6, DeepSeek V4 Pro с синтезом на Opus 4.8 подобрались близко к Fable 5 по их бенчмарку DRACO за половину цены. Платить, правда, придётся по API ценам, а не подписке, так что дёшево тут очень условно. Блогпост

Zhipu: GLM-5.2
Доступна - но пока только внутри платного Coding Plan, отдельный API, чат и открытые веса (MIT) обещают на следующей неделе. MoE на 744B параметров (40B активных), контекст 1M. Официальных бенчей на старте не показали, так что про уровень судить рано - ждём весов и независимых замеров. Z.ai

Moonshot: Kimi K2.7 Code
Открытая кодинг-модель поверх K2.6. 1T параметров MoE (32B активных), контекст 256K. Из бенчей показали только собственные (Kimi Code Bench v2 62.0, +21.8% к K2.6). Публичных SWE-bench/Terminal-Bench нет. Цена API $0.95/$4.00. HF

Xiaomi: MiMo Code
Открытый автономный кодинг-агент - по сути форк OpenCode с кросс-сессионной памятью, оркестрацией саб-агентов и автономными циклами под длинные задачи. По умолчанию ездит на их MiMo V2.5 (1M контекст). Xiaomi заявляет, что на сверхдлинных задачах (200+ шагов) обходит Claude Code, но это их собственные замеры - независимых пока нет. GitHub

Xiaomi: MiMo V2.5 Pro UltraSpeed
Команды MiMo и TileRT разогнали триллионную модель (1.02T / 42B активных) до ~1200 токенов/с на одном сервере с 8× NVIDIA B200, без кастомных люков от Cerebras. Как этого добились смотреть здесь:
Блогпост, TileRT

Moonshot: Kimi Work (бета) - Kimi продолжает развитие концепции роя агентов ситстемой для десктопных ИИ-агентов для офисной работы. Управляет браузером через WebBridge, гоняет задачи по расписанию, собирает PowerPoint и Excel, до 300 саб-агентов в рое. Под капотом K2.6, инференс облачный, локально только действия. Продукт

Stack Overflow for Agents - Stack Overflow решил перестать издавать предсмертные хрипы, и перепрофилироваться в API-first базу знаний, где кодинг-агенты ищут проверенные решения и сами их дополняют (с ревью человеком), чтобы перестать в одиночку переоткрывать одни и те же грабли. Пока в бете. Блогпост

Лейденская декларация — математики (среди подписавших Теренс Тао и Петер Шольце, уже 2000+ имён, поддержал IMU) выпустили манифест о том, что ИИ угрожает целостности доказательств, атрибуции и пир-ревью, и требуют раскрывать использование ИИ и оставлять ответственность за людьми. Декларация

Anthropic

Claude Fable 5 and Claude Mythos 5

Today we’re launching Claude Fable 5: a Mythos-class model that we’ve made safe for general use.

👍8🔥4❤33🤔2

7.13K views13:31