⚡️ Состоялся полноценный релиз GLM-5.2
Z.ai (Zhipu AI) опубликовали веса GLM-5.2 на HuggingFace под MIT-лицензией. Модель анонсировали ещё 13 июня, но без весов и с урезанным доступом.
Попробовать модель можно через их ADE ZCode, а также через Claude Code, OpenCode и т.д. Ребята из Китая сами написали инструкцию, как подключить GLM-5.2 в сторонних агентах.
В отличие от релиза Kimi, здесь бенчмарки всем известные и результаты впечатляют. По первым отзывам пользователей модель также крайне хорошо себя показывает.
@ai_for_devs
Z.ai (Zhipu AI) опубликовали веса GLM-5.2 на HuggingFace под MIT-лицензией. Модель анонсировали ещё 13 июня, но без весов и с урезанным доступом.
Технически: 744B параметров (MoE, 40B активных), контекст вырос с 200K до 1M токенов, максимальный вывод 131K токенов. Два уровня рассуждений: GLM-5.2 (max) и GLM-5.2 (high). Цены на API те же, что у GLM-5.1.
Попробовать модель можно через их ADE ZCode, а также через Claude Code, OpenCode и т.д. Ребята из Китая сами написали инструкцию, как подключить GLM-5.2 в сторонних агентах.
В отличие от релиза Kimi, здесь бенчмарки всем известные и результаты впечатляют. По первым отзывам пользователей модель также крайне хорошо себя показывает.
@ai_for_devs
1🔥57👍23❤9🤩8🤯2
⚡️ Cursor готовят замену GitHub для AI-агентов
Систему спроектировали так: основным автором и ревьюером кода становится AI-агент, человек подключается только на этапе финального одобрения. Анонс продукта сделал Томас Реймерс, основатель Graphite (сервис ревью кода, который Cursor купили в 2025 году).
GitHub строили под людей, которые читают диффы и пишут комментарии к строкам кода. Cursor делает ставку на то, что код всё чаще пишут и проверяют агенты.
Релиз запланирован на осень, лист ожидания уже открыт на cursor.com/origin. Цены и список функций пока неизвестны.
@ai_for_devs
Систему спроектировали так: основным автором и ревьюером кода становится AI-агент, человек подключается только на этапе финального одобрения. Анонс продукта сделал Томас Реймерс, основатель Graphite (сервис ревью кода, который Cursor купили в 2025 году).
Платформа рассчитана на сотни агентов, которые параллельно клонируют, создают ветки и коммитят в один репозиторий. На демо показали 22,6 коммита в секунду в одном репо и сотни тысяч клонов и пушей в час.
GitHub строили под людей, которые читают диффы и пишут комментарии к строкам кода. Cursor делает ставку на то, что код всё чаще пишут и проверяют агенты.
Релиз запланирован на осень, лист ожидания уже открыт на cursor.com/origin. Цены и список функций пока неизвестны.
@ai_for_devs
1👍55🔥33🤯23😱10❤7⚡5
⚡️ Subquadratic подали признаки жизни: вышла SubQ 1.1 Small с независимой проверкой бенчмарков
Та самая SSA-модель с контекстом до 12M токенов, про которую мы писали раньше. Бенчмарки теперь проверила сторонняя организация Appen.
Small в названии, по всей видимости, отражает размер модели в линейке. Сколько именно у неё параметров, компания не говорит. Дальше обещают модели покрупнее, также с контекстом до 12M токенов.
Общие способности не упали: GPQA Diamond — 85.4%, LiveCodeBench — 89.7%, почти на уровне лучших моделей.
Пока модель доступна избранным партнёрам, широкий публичный релиз обещают к концу года. Ждём!
@ai_for_devs
Та самая SSA-модель с контекстом до 12M токенов, про которую мы писали раньше. Бенчмарки теперь проверила сторонняя организация Appen.
Small в названии, по всей видимости, отражает размер модели в линейке. Сколько именно у неё параметров, компания не говорит. Дальше обещают модели покрупнее, также с контекстом до 12M токенов.
На тесте, где нужно связывать факты из разных частей текста, точность выросла с 95% до 99%.
Обычные модели сверяют каждое слово с каждым, поэтому вычислений с ростом текста становится непропорционально больше. SubQ выбирает только значимые связи и реально использует 0.13% всех пар слов, отсюда экономия на длинных задачах.
На контексте 1M токенов: вычислений в 64 раза меньше, чем у обычных моделей, ответ получают в 56 раз быстрее.
Общие способности не упали: GPQA Diamond — 85.4%, LiveCodeBench — 89.7%, почти на уровне лучших моделей.
Пока модель доступна избранным партнёрам, широкий публичный релиз обещают к концу года. Ждём!
@ai_for_devs
1🔥40👍21🤯15❤5⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Anthropic добавили Artifacts в Claude Code: живые HTML-страницы из контекста сессии
Теперь прогресс сессии можно опубликовать как интерактивную HTML-страницу. Claude Code собирает её из кодовой базы, коннекторов и переписки с моделью. Страница обновляется по тому же URL по ходу работы, версии сохраняются в истории.
По умолчанию артефакт виден только автору. Делиться можно с участниками организации на тарифах Team и Enterprise, остальным пока что недоступно.
Подробнее о том, почему HTML лучше Markdown с точки зрения инженера Anthropic, читайте на Habr.
@ai_for_devs
Теперь прогресс сессии можно опубликовать как интерактивную HTML-страницу. Claude Code собирает её из кодовой базы, коннекторов и переписки с моделью. Страница обновляется по тому же URL по ходу работы, версии сохраняются в истории.
И мы уверены, что у этой фичи есть предыстория. Ещё в мае Тарик Шихипар, инженер из команды Claude Code, рассказывал, что перешёл с Markdown на HTML.
Главная причина: у HTML куда больше возможностей визуализации, а красивые таблицы, SVG-диаграммы и интерактивные слайдеры люди воспринимают лучше обычного текста.
Видимо, каждый раз просить Claude сделать HTML ребятам поднадоело, и они решили избавить себя от лишних действий. Теперь подобный способ делиться результатами своей работы в Claude Code стал отдельной фичей продукта.
По умолчанию артефакт виден только автору. Делиться можно с участниками организации на тарифах Team и Enterprise, остальным пока что недоступно.
Подробнее о том, почему HTML лучше Markdown с точки зрения инженера Anthropic, читайте на Habr.
@ai_for_devs
1🔥57👍22❤9🤩9🤯1
Был в моей карьере небольшой период, когда я писал на Go. В то время периодически натыкался на видео Николая Тузова. Думаю, любой, кто в своё время сидел на Go, так или иначе видел его топовый глубокий инженерный контент: за больше чем 4 года такого накопилось довольно много.
А сейчас его(как и всю индустрию) затянуло в AI, и он в это плотно погрузился.
Теперь Николай активно экспериментирует, разбирается с LLM и делится практическими заметками в канале Tuzov AI Lab. Личные кейсы, что работает, что нет, объяснения базы и авторские мысли.
Кому интересны личные кейсы опытного разработчика, объяснение базы про LLM и авторские заметки – welcome!
P.S. Один из постов, который лично мне пришелся по душе – "Создатель OpenClaw — вайбкодер или инженер?".
@ai_for_devs
Недавно узнал, что Николай читает наш канал. Приятно, честно говоря!
А сейчас его
Теперь Николай активно экспериментирует, разбирается с LLM и делится практическими заметками в канале Tuzov AI Lab. Личные кейсы, что работает, что нет, объяснения базы и авторские мысли.
Кому интересны личные кейсы опытного разработчика, объяснение базы про LLM и авторские заметки – welcome!
P.S. Один из постов, который лично мне пришелся по душе – "Создатель OpenClaw — вайбкодер или инженер?".
@ai_for_devs
Telegram
Tuzov AI Lab
Заметки инженера про AI / LLM: актуальные новости, эксперименты, кейсы, мысли.
Автор: @ntuzov
Общаемся в AI Dev Club: https://t.me/+NMh-DL73ibFkMWEy
Автор: @ntuzov
Общаемся в AI Dev Club: https://t.me/+NMh-DL73ibFkMWEy
1👍55❤32🔥10👏1
⚡️ Sakana AI выпустили Fugu Ultra: японская LLM обходит часть западных флагманов
Sakana AI основали экс-инженеры Google Дэвид Ха и Лайон Джонс (один из восьми авторов оригинальной статьи про трансформеры). В апреле компания уже показывала Marlin: агента, который самостоятельно копает тему до 8 часов и выдаёт отчёт с презентацией.
Fugu их следующий продукт с реализацией идеи «несколько моделей вместо одной»: компактная LLM, обученная решать, кого вызвать, в какой роли и с какими подзадачами под конкретный запрос. Нечто похожее недавно показали OpenRouter с продуктом Fusion.
Fugu Ultra работает немного иначе: сама генерирует workflow на естественном языке, делит задачу на подзадачи, распределяет их по моделям и может рекурсивно вызвать себя как одного из воркеров.
На бенчмарках Fugu Ultra идёт почти вровень с топовыми западными моделями.
@ai_for_devs
Sakana AI основали экс-инженеры Google Дэвид Ха и Лайон Джонс (один из восьми авторов оригинальной статьи про трансформеры). В апреле компания уже показывала Marlin: агента, который самостоятельно копает тему до 8 часов и выдаёт отчёт с презентацией.
Fugu их следующий продукт с реализацией идеи «несколько моделей вместо одной»: компактная LLM, обученная решать, кого вызвать, в какой роли и с какими подзадачами под конкретный запрос. Нечто похожее недавно показали OpenRouter с продуктом Fusion.
Fugu Ultra работает немного иначе: сама генерирует workflow на естественном языке, делит задачу на подзадачи, распределяет их по моделям и может рекурсивно вызвать себя как одного из воркеров.
На бенчмарках Fugu Ultra идёт почти вровень с топовыми западными моделями.
@ai_for_devs
1🔥61❤23👍22⚡2😱1
⚡️ OpenAI и Broadcom представили чип для инференса LLM: Jalapeño
Чип спроектирован с нуля под инференс больших языковых моделей. Производит его TSMC. Разработка от дизайна до отправки финального проекта на фабрику заняла 9 месяцев — рекордный срок для сложных современных чипов, по словам компаний.
Первый коммерческий запуск обещают до конца 2026 года.
Google, Amazon, Microsoft, Meta и OpenAI уходят от Nvidia к своим чипам, а Маск наоборот: у xAI уже 555 тысяч GPU, цель — миллион. Может, зря?)
@ai_for_devs
Чип спроектирован с нуля под инференс больших языковых моделей. Производит его TSMC. Разработка от дизайна до отправки финального проекта на фабрику заняла 9 месяцев — рекордный срок для сложных современных чипов, по словам компаний.
В отличие от Cerebras, которые делают один гигантский кристалл с памятью прямо на чипе (на котором GPT-5.3-Codex-Spark выдаёт больше 1000 ток/с), Jalapeño — чип обычного размера.
Нужную мощность получают не размером кристалла, а количеством чипов: тысячи Jalapeño соединяют в кластер через сетевые чипы.
Первый коммерческий запуск обещают до конца 2026 года.
Google, Amazon, Microsoft, Meta и OpenAI уходят от Nvidia к своим чипам, а Маск наоборот: у xAI уже 555 тысяч GPU, цель — миллион. Может, зря?)
@ai_for_devs
1👍39🔥19⚡8❤5🤯5
⚡️ Opus, Sonnet, GPT, Gemini, GLM, DeepSeek — c оплатой рублями, без зарубежной карты и VPN
Veai — российский AI-агент для JetBrains IDE с доступом к топовым моделям. Поддерживает MCP, SKILLs, дебаг, сборку и запуск проекта, умеет фиксить тесты и поддерживает сабагентов.
Минуты не сгорают, переносятся на следующий месяц.
Начни использовать Veai: https://veai.ru/products
Veai — российский AI-агент для JetBrains IDE с доступом к топовым моделям. Поддерживает MCP, SKILLs, дебаг, сборку и запуск проекта, умеет фиксить тесты и поддерживает сабагентов.
Первые 30 дней бесплатно, затем оплата подписки в рублях. Есть 3 тарифа:
1. Сообщество — бесплатный. Подключаешь свой API-ключ и пробуешь все функции плагина без ограничений.
2. Персональный — 2 800 ₽/мес. 200 минут работы с топовыми моделями по единой цене.
3. Профессиональный — 10 000 ₽/мес. 1000 минут, приоритетный доступ, минута работы модели дешевле — 10 ₽ против 14 ₽ у «Персонального».
Минуты не сгорают, переносятся на следующий месяц.
Начни использовать Veai: https://veai.ru/products
1👍29👌15❤12🔥8🤯8🤡2
Индустрия меняет фокус каждые несколько месяцев. Сначала был prompt engineering: главным было то, что и как написать агенту. Потом MCP дал агентам доступ к внешним инструментам. Потом появились SKILLs: знание о проекте, записанное один раз и читаемое на каждом запуске. Теперь все чаще слышно про Loop'ы и Goal'ы.
Идея: один раз спроектировать систему, которая сама находит задачу, прогоняет её через агента, проверяет результат и решает, что делать дальше. Дальше она промптит себя сама, человек выходит из цикла.
TL;DR: Loop Engineering реален, но большинству разработчиков он пока не нужен.
Loop оправдывает себя, если выполняются все четыре условия:
1. Задача повторяется хотя бы раз в неделю
2. Проверка автоматизирована (тесты, линтер, сборка)
3. Лимит токенов
4. У агента есть инструменты уровня senior-инженера
Если не выполняется хоть одно из условий, затраты превысят выгоду.
Можете похвастаться подпиской за $200, а то и не одной? Периодически ловите себя на мысли, что вы это уже делали с агентом? Новая статья на Хабре: «Loop Engineering: 14 шагов от промптера до архитектора систем».
@ai_for_devs
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥27👍17❤11👏2🤩2🤯1
⚡️ Китайцы получают доступ к Claude в 10 раз дешевле
ChinaTalk опубликовали расследование о китайских API-прокси для доступа к Claude.
Это зарубежные серверы, которые принимают запросы пользователей и передают их в Anthropic от своего имени, обходя геоблокировку и требование иностранной банковской карты.
Через такие прокси токены Claude продают по 1 юаню за $1 — это на 70–90% дешевле официальной стоимости.
Блокировки не останавливают, а создают рынок для тех, кто умеет их обходить. Нам это в целом знакомо🥲
@ai_for_devs
ChinaTalk опубликовали расследование о китайских API-прокси для доступа к Claude.
Это зарубежные серверы, которые принимают запросы пользователей и передают их в Anthropic от своего имени, обходя геоблокировку и требование иностранной банковской карты.
Через такие прокси токены Claude продают по 1 юаню за $1 — это на 70–90% дешевле официальной стоимости.
Низкую цену объясняют тремя источниками:
1. Массовая регистрация аккаунтов: бесплатные $5-кредиты Anthropic, чужие неиспользованные квоты, скидки для студентов, деление одной подписки Max за $200 между несколькими пользователями.
2. Подмена моделей: аудит немецкого центра CISPA проверил 17 прокси и обнаружил, что запрос к «Gemini-2.5» через прокси показывал 37% на медицинском бенчмарке вместо 83,82% у официального API. То есть по сути продают не Claude, а свои дешевые локальные модели.
3. Третий источник, по словам самих китайских разработчиков, главный: логи запросов и ответов, которые можно продать для обучения других моделей. Данные дороже кода, это нам давно известно.
Блокировки не останавливают, а создают рынок для тех, кто умеет их обходить. Нам это в целом знакомо
@ai_for_devs
Please open Telegram to view this post
VIEW IN TELEGRAM
1⚡33🤯21👍18❤6💯3🔥2
⚡️ OpenAI показали GPT-5.6: семейство Sol, Terra и Luna
Под конец недели OpenAI выпустили GPT-5.6 — но только узкому кругу партнёров, согласованных с правительством США.
GPT-5.6 разбили на три тира:
1. Sol (флагман)
2. Terra (на уровне GPT-5.5, но вдвое дешевле)
3. и Luna (быстрая и самая дешёвая)
Цены за 1M токенов (вход/выход): Sol $5/$30, Terra $2.50/$15, Luna $1/$6.
В июле Sol запустят на Cerebras — до 750 токенов/с. Публичный доступ в ChatGPT, Codex и API обещают через пару недель.
@ai_for_devs
Под конец недели OpenAI выпустили GPT-5.6 — но только узкому кругу партнёров, согласованных с правительством США.
GPT-5.6 разбили на три тира:
1. Sol (флагман)
2. Terra (на уровне GPT-5.5, но вдвое дешевле)
3. и Luna (быстрая и самая дешёвая)
Цены за 1M токенов (вход/выход): Sol $5/$30, Terra $2.50/$15, Luna $1/$6.
Ключевое сравнение с Mythos (Fable 5) от Anthropic идёт по кибербезопасности. На ExploitBench Sol тянется к Mythos Preview, расходуя при этом примерно треть выходных токенов.
В июле Sol запустят на Cerebras — до 750 токенов/с. Публичный доступ в ChatGPT, Codex и API обещают через пару недель.
@ai_for_devs
3❤48🔥30👍19⚡2👌2🤩1
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁211👍22🔥13💯9❤4🤡2
Как не слить конфиденциальные данные в общедоступные нейросети?
Самый надежный способ — развернуть их локально на собственном сервере. Или не тратить на это время и воспользоваться готовым решением от Selectel. В каталоге готовых ИИ-моделей нейросети уже развернуты на оптимальном железе для инференса.
Что вы получаете в Selectel:
1. Большой выбор моделей для ваших задач: для генерации текста и кода, распознавания речи, создания контента и других
2. Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки
3. Прогнозируемую стоимость: платите за фактическое время потребления вычислительных ресурсов
Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/vj562
Самый надежный способ — развернуть их локально на собственном сервере. Или не тратить на это время и воспользоваться готовым решением от Selectel. В каталоге готовых ИИ-моделей нейросети уже развернуты на оптимальном железе для инференса.
Что вы получаете в Selectel:
1. Большой выбор моделей для ваших задач: для генерации текста и кода, распознавания речи, создания контента и других
2. Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки
3. Прогнозируемую стоимость: платите за фактическое время потребления вычислительных ресурсов
Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/vj562
1👌19👍15❤9🔥2
⚡️ Grok 4.5 вышел в приватную бету в SpaceX и Tesla
В основе Grok 4.5 лежит V9: новая модель, которую xAI обучали с нуля вместе с инженерами из Cursor на их данных.
Модель втрое больше предыдущей: 1.5 триллиона параметров против 0.5T у v8-small (Grok 4.3), которая сейчас обслуживает весь продакшен трафик.
Илон обещает по одной новой модели в месяц от SpaceX. То есть в паблик Grok 4.5 должен выйти уже в июле!
Параллельно xAI развивает Grok Build (собственный инструмент для кодинга), конкурент того же Cursor. Маск говорит, что он становится лучше с каждым днём. Делаем ставки, кого из них в итоге принесут в жертву?
@ai_for_devs
В основе Grok 4.5 лежит V9: новая модель, которую xAI обучали с нуля вместе с инженерами из Cursor на их данных.
Модель втрое больше предыдущей: 1.5 триллиона параметров против 0.5T у v8-small (Grok 4.3), которая сейчас обслуживает весь продакшен трафик.
Макс отметил, что данные Cursor добавили уже после основного этапа (это менее эффективно, чем с нуля). В следующей версии на 2T параметров они войдут с самого начала.
Илон обещает по одной новой модели в месяц от SpaceX. То есть в паблик Grok 4.5 должен выйти уже в июле!
Параллельно xAI развивает Grok Build (собственный инструмент для кодинга), конкурент того же Cursor. Маск говорит, что он становится лучше с каждым днём. Делаем ставки, кого из них в итоге принесут в жертву?
@ai_for_devs
1👍43⚡12🔥6❤5👏1🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Холли-молли...
🤯 А чё, так можно было что ли!?
🤡 Ну ты и дед...
🤯 А чё, так можно было что ли!?
🤡 Ну ты и дед...
3🤯152🤡28👍1