Claude AI Dev Broadcast
2.06K subscribers
97 photos
9 videos
91 links
Всё про разработку с использованием IT технологий
Download Telegram
Channel name was changed to «Claude AI Dev Broadcast»
Каждый день по несколько раз сталкиваюсь с проблемой "API Error" в Claude Code. Бывает что приходится ждать минут по 5 чтобы сессия вернулась к жизни, если вовсе не запускать заново (исключительные ситуации).

💬 У вас часто видится такая ошибка?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎13
Переход из Claude Code в... ? Мне все хвалят решение XXX и советуют перейти на него.

Я не вижу смысла переходить на OpenAI, потому что вижу смену одного поставщика закрытых моделей на другого. Потенциально интересно Cursor, потому что они игрок, независимый от производителя моделей. Хвалят их Composer.

💬 Есть реальные истории кто перешел с Агента X на Y для полного цикла разработки фичей и получил в чем-то улучшение (хоть в цене подписки)?
Please open Telegram to view this post
VIEW IN TELEGRAM
👎9👍6
🤔 Nvidia сделала RTX-ноутбуки на ARM — и я не понимаю, зачем именно ноутбук.

Суть анонса: чипы с CUDA-ядрами и NPU для локального запуска моделей, ноутбуки собирают сторонние вендоры. Идея — полностью локальные AI-агенты, никакой зависимости от облака. Это правильное направление.

Но сравнивать с Apple тут некорректно. Apple сделала unified memory architecture: CPU, GPU, NPU в одном кристалле с общей памятью — это фундаментально иная эффективность. Nvidia добавляет свой GPU/NPU к стороннему ARM CPU. Разные вещи по тепловыделению и latency.

И вот здесь вопрос: у меня MacBook M3 Max с его NPU греется при серьёзных задачах. А что будет с RTX-ноутбуком под inference? Плюс цена, плюс охлаждение, плюс ты прикован к этой машине.

Мне DGX Spark изначально нравился больше как концепция: небольшой сервер у себя дома, подключаешься с чего угодно, задачи выполняются там. Никакого перегрева в руках, нет компромисса между мощностью и портативностью.

Тренд правильный — компьютеры трансформируются в агентные платформы, которым не нужен доступ в сеть. Но форм-фактор под этот сценарий, на мой взгляд, не должен быть ноутбук.

Буду смотреть на первые устройства. Особенно интересно, сколько это будет стоить.

#nvidia #AI
👍12👎3
⭐️ Вышла Gemma 4 12B и она запускается локально на 16GB RAM. Понимает текст, картинки и аудио в одной модели

До этого мультимодальные модели работали так: картинку сначала обрабатывает отдельный блок, аудио тоже через свой. Каждый такой блок ест память и добавляет задержку. Gemma 4 12B делает это без посредников. Картинка и звук идут прямо в модель. Один пайплайн для всего.

На практике это значит меньше памяти под инфраструктуру и выше скорость отклика. Модель запускается на железе с 16GB VRAM (не потребляет, а столько оперативки в компе надо) или unified memory, то есть MacBook Pro с M3 тянет без проблем. Apache 2.0, весы на Hugging Face и Kaggle, запуск через Ollama или LM Studio.

Задачи, которые это открывает:
👉 локальный агент с пониманием скриншотов и голоса
👉 анализ изображений без отправки данных в облако
👉 голосовой ввод прямо в агентный пайплайн.

Для тех, кто строит агентов с приватными данными или просто не хочет зависеть от API-ключей и облачных лимитов — это рабочий вариант.

Мне интересно попробовать именно в связке с локальным агентом: один инстанс, текст плюс скриншот плюс аудио, без облака. Посмотрим, насколько это работает на практике, а не только на бенчмарках.

🔗 Оф анонс

#AI #Gemma
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26👎1
Кто-то вообще работает с Grok для разработки? Да хоть как-то, но на постоянной основе
👍6👎4
MiniMax выпустили модель M3. Это первая open-weight модель, которая сочетает три вещи сразу: контекст в миллион токенов, нативная мультимодальность (видео и картинки), и кодинг на уровне топовых закрытых моделей.

Главная техническая фишка — новая архитектура внимания MSA. Она позволяет работать с миллионом токенов без квадратичного роста вычислений: в 20 раз меньше compute на токен, prefill быстрее в 9 раз.

На SWE-Bench Pro модель набирает 59%. Больше GPT-5.5, больше Gemini 3.1 Pro. Но MiniMax аккуратно сравнивают себя с Opus 4.7, игнорируя 4.8 — а там разрыв уже 10 пунктов. Это не "почти на уровне Claude", это "хороший уровень, но не frontier". Даже Opus 4.6 делом круто, поэтому некритично.

Есть два интересных нюанса.
1️⃣ Первый: большинство бенчмарков они гоняли через Claude Code как scaffolding. То есть результаты конкурента получены с помощью инструмента Anthropic.
2️⃣Второй: у них теперь есть свой агент — MiniMax Code. Прямой конкурент Claude Code. Демки впечатляют — 24-часовая оптимизация CUDA-ядра, 12-часовое воспроизведение научной статьи без участия человека.

Цена в 10-15 раз дешевле Claude Opus и GPT-5.5.

#AI #MiniMax
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Забирайте записи с ДевФеста — devfest.ru

26 сессий о том, как реально применяют ИИ в разработке: лучшие практики, безопасность ИИ-агентов, опыт создателей стандартов и инженеров, стоящих за технологиями, которыми мы пользуемся каждый день.

👉 Доступ к записям:
Бесплатно — за подписку на каналы
Через Timepad — по цене Claude Max

#реклама
👎17👍3
Forwarded from Android Broadcast
🔴 Созвон Закрытого Сообщества. Жаркая дискуссия: какой агент лучше. Best practices, ошибки и как работать с ИИ.

Гость — Никита @Nek.12. Один из немногих в русскоязычном сообществе, у кого я реально нашел много интересного для работы с ИИ. Никита не использует Claude Code, Codex или Cursor. Он написал своего агента с нуля. Builder — это CLI-хarness с супервайзером, скиллами, Docker-сэндбоксингом, клиент-серверной архитектурой и возможностью гонять агента автономно сутками. Всё сам. На Kotlin-бекенде. В одиночку.

У нас принципиально разные подходы. Я работаю с Claude Code, активно использую MCP-серверы и верю в это. Никита написал статью "MCP is Deprecated" и считает, что сложные агентные оркестраторы — это микроменеджмент, который мешает модели работать.

Будем разбираться, кто прав. Или оба правы по-своему. Или оба не правы.

Формат — живой разговор, вы можете задавать вопросы в чате прямо во время эфира.

🪙 Стрим пройдет для платных подписчиков на Boosty

#AndroidBroadcast #LIVE
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29👎4
Kimi Code CLI - официально решение от создателей моделей Kimi для кодинга. По суди сделали свой Claude Code, но адаптированный под свои модели. И это очень важно, ведь вставлять сторонние модели Claude Code дает хуже результат, ведь часть фичей непосредственно затачиваются под фичи CLI.
👍8👎4
🤯 Гипотеза агента заблокировала поиск реального ответа и стоила миллионов токенов

Пишу приложение для записи экрана и внешней камеры на macOS. Нужна поддержка 4K через AVFoundation. Камера анонсирует формат 420v 3840×2160@30fps.

Opus 4.8 с extended thinking посчитал bandwidth "в уме", получил 3.7 Gbps (видно ограничение камеры), решил что не влезает в кабель и выдал "невозможно". Без единого практического теста. Просто гипотеза, оформленная как факт.

Дальше агент десятки раундов защищал этот вывод. Я запускал отдельный research-агент и он тоже ходил по кругу, потому что искал подтверждение невозможного, а не причину.

Новая сессия. Подключил документацию, заставил проверять практически. И только тогда нашлась реальная причина: AVFoundation всегда скидывает разрешение внешней камеры до Full HD. Это ограничение фреймворка, не железа. Вывод "невозможно" оказался верным, но агент пришёл к нему только через практику, не через расчёт в уме.

Если бы первый агент не застрял на непроверенной гипотезе и сразу пошёл тестировать и реальная причина нашлась бы за один прогон.

По итогу зашил правило в инструкции проекта: любое "невозможно" требует практического подтверждения. Эмпирика - это гипотеза для проверки, не аргумент для остановки.

Какая бы модель ни стояла под капотом — без этого правила агент будет уверенно защищать собственные предположения вместо поиска ответа. Со стороны пользователя требуется постоянная настройка и улучшение настроек в проекте и глобально.

#AIdev #ClaudeCode #Opus #macOS
👍32👎6
Вышла модель Claude Fable 5 - упрощенная Mythos. Пи*** лимитам - жрет в 2 раза больше Opus
👎15👍9
По подписке Fable 5 доступна только до 22 июня, а дальше только за токены
👎12👍4
Что такое Fable 5? Это версия Mythos, которая ограничена с целью безопасности от атак и взломов на основе уязвимостей, которая смогла найти Mythos.

Как уляжется шумиха и сбросится мой недельный лимит - обязательно попробую ее для задач, где Opus проваливался.

Карпаты назвал Fable прорывом, аналогичным Opus 4.5 был в свое время (всего то 6 месяцев прошло).

Кто уже попробовал и ощутил мощь Fable стороны ?
👍11👎7
Fable 5 отказывается работать 😁
👎6👍1
🧠 Anthropic отключила клиентов от Fable 5 по требованию властей США. Я уже выражал мысли, что такие ограничения будут вполне реальными.

Зато опять лимиты сбросили, а кто-то именно ради Fable и покупал подписку

#Claude #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
👎13👍1
Полный недельный лимит меньше чем на сутки? Пора выкрутить модели на максимум и запустить все отложенные задачи! ULTRACODE режим
👎10👍7
🧠 OpenAI готовит резкое снижение цен на токены, не дожидаясь, пока это сделает Anthropic. По данным WSJ, в компании ждут ценовой войны и хотят сыграть на опережение.

Сам Альтман уже признал публично, что стоимость использования ИИ стала «огромной проблемой». И давят на цены не энтузиасты, а корпоративные клиенты. Один из топов Uber рассказал, что компания сожгла весь бюджет 2026 года на агентный ИИ ещё в начале года. В Долине даже завёлся термин tokenmaxxing - палить максимум токенов, изображая продуктивность, в том числе там, где это вообще не окупается.

Мне кажется, это начало разворота. Долгое время все мерились, чья модель умнее. Сейчас вопрос смещается в другую плоскость - сколько денег нужно, чтобы довести задачу до результата. Это хорошо видно по Android Bench от Google. В лидерборде рядом с качеством стоят колонки tokens и cost в долларах за прогон, и высокий балл часто идёт за заметно большие деньги.

Тут есть ловушка, про которую забывают. Дешевле за токен не равно дешевле за результат. Слабая модель чаще промахивается, гоняет агента по кругу и в сумме сжигает больше. Поэтому я не верю в простой исход «все разбежались к тем, кто дешевле». Останется тот, кто даёт стабильно нужный уровень за вменяемую цену и без лишних итераций. А чистая мощность как главная метрика, по-моему, своё уже отжила.

🔗 Источник

#AI #ИИ #OpenAI #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22👎3