AI for Devs

⚡️ Sakana AI выпустили Fugu Ultra: японская LLM обходит часть западных флагманов

Sakana AI основали экс-инженеры Google Дэвид Ха и Лайон Джонс (один из восьми авторов оригинальной статьи про трансформеры). В апреле компания уже показывала Marlin: агента, который самостоятельно копает тему до 8 часов и выдаёт отчёт с презентацией.

Fugu их следующий продукт с реализацией идеи «несколько моделей вместо одной»: компактная LLM, обученная решать, кого вызвать, в какой роли и с какими подзадачами под конкретный запрос. Нечто похожее недавно показали OpenRouter с продуктом Fusion.

Fugu Ultra работает немного иначе: сама генерирует workflow на естественном языке, делит задачу на подзадачи, распределяет их по моделям и может рекурсивно вызвать себя как одного из воркеров.

На бенчмарках Fugu Ultra идёт почти вровень с топовыми западными моделями.

@ai_for_devs

1🔥61❤23👍22⚡2😱1

10.3K views15:42

AI for Devs

⚡️ OpenAI и Broadcom представили чип для инференса LLM: Jalapeño

Чип спроектирован с нуля под инференс больших языковых моделей. Производит его TSMC. Разработка от дизайна до отправки финального проекта на фабрику заняла 9 месяцев — рекордный срок для сложных современных чипов, по словам компаний.

В отличие от Cerebras, которые делают один гигантский кристалл с памятью прямо на чипе (на котором GPT-5.3-Codex-Spark выдаёт больше 1000 ток/с), Jalapeño — чип обычного размера.

Нужную мощность получают не размером кристалла, а количеством чипов: тысячи Jalapeño соединяют в кластер через сетевые чипы.

Первый коммерческий запуск обещают до конца 2026 года.

Google, Amazon, Microsoft, Meta и OpenAI уходят от Nvidia к своим чипам, а Маск наоборот: у xAI уже 555 тысяч GPU, цель — миллион. Может, зря?)

@ai_for_devs

1👍39🔥19⚡8❤5🤯5

9.3K views15:07

AI for Devs

⚡️ Opus, Sonnet, GPT, Gemini, GLM, DeepSeek — c оплатой рублями, без зарубежной карты и VPN

Veai — российский AI-агент для JetBrains IDE с доступом к топовым моделям. Поддерживает MCP, SKILLs, дебаг, сборку и запуск проекта, умеет фиксить тесты и поддерживает сабагентов.

Первые 30 дней бесплатно, затем оплата подписки в рублях. Есть 3 тарифа:

1. Сообщество — бесплатный. Подключаешь свой API-ключ и пробуешь все функции плагина без ограничений.

2. Персональный — 2 800 ₽/мес. 200 минут работы с топовыми моделями по единой цене.

3. Профессиональный — 10 000 ₽/мес. 1000 минут, приоритетный доступ, минута работы модели дешевле — 10 ₽ против 14 ₽ у «Персонального».

Минуты не сгорают, переносятся на следующий месяц.

Начни использовать Veai: https://veai.ru/products

1👍29👌15❤12🔥8🤯8🤡2

9.26K views09:01

AI for Devs

😐

Loop Engineering: The Next Big Thing

Индустрия меняет фокус каждые несколько месяцев. Сначала был prompt engineering: главным было то, что и как написать агенту. Потом MCP дал агентам доступ к внешним инструментам. Потом появились SKILLs: знание о проекте, записанное один раз и читаемое на каждом запуске. Теперь все чаще слышно про Loop'ы и Goal'ы.

Идея: один раз спроектировать систему, которая сама находит задачу, прогоняет её через агента, проверяет результат и решает, что делать дальше. Дальше она промптит себя сама, человек выходит из цикла.

TL;DR: Loop Engineering реален, но большинству разработчиков он пока не нужен.

Loop оправдывает себя, если выполняются все четыре условия:

1. Задача повторяется хотя бы раз в неделю
2. Проверка автоматизирована (тесты, линтер, сборка)
3. Лимит токенов (практически или полностью) неограничен
4. У агента есть инструменты уровня senior-инженера

Если не выполняется хоть одно из условий, затраты превысят выгоду.

Можете похвастаться подпиской за $200, а то и не одной? Периодически ловите себя на мысли, что вы это уже делали с агентом? Новая статья на Хабре: «Loop Engineering: 14 шагов от промптера до архитектора систем».

@ai_for_devs

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥27👍17❤11👏2🤩2🤯1

9.19K views12:57

AI for Devs

⚡️ Китайцы получают доступ к Claude в 10 раз дешевле

ChinaTalk опубликовали расследование о китайских API-прокси для доступа к Claude.

Это зарубежные серверы, которые принимают запросы пользователей и передают их в Anthropic от своего имени, обходя геоблокировку и требование иностранной банковской карты.

Через такие прокси токены Claude продают по 1 юаню за $1 — это на 70–90% дешевле официальной стоимости.

Низкую цену объясняют тремя источниками:

1. Массовая регистрация аккаунтов: бесплатные $5-кредиты Anthropic, чужие неиспользованные квоты, скидки для студентов, деление одной подписки Max за $200 между несколькими пользователями.

2. Подмена моделей: аудит немецкого центра CISPA проверил 17 прокси и обнаружил, что запрос к «Gemini-2.5» через прокси показывал 37% на медицинском бенчмарке вместо 83,82% у официального API. То есть по сути продают не Claude, а свои дешевые локальные модели.

3. Третий источник, по словам самих китайских разработчиков, главный: логи запросов и ответов, которые можно продать для обучения других моделей. Данные дороже кода, это нам давно известно.

Блокировки не останавливают, а создают рынок для тех, кто умеет их обходить. Нам это в целом знакомо 🥲

@ai_for_devs

Please open Telegram to view this post

VIEW IN TELEGRAM

1⚡33🤯21👍18❤6💯3🔥2

8.37K views12:56

AI for Devs

⚡️ OpenAI показали GPT-5.6: семейство Sol, Terra и Luna

Под конец недели OpenAI выпустили GPT-5.6 — но только узкому кругу партнёров, согласованных с правительством США.

GPT-5.6 разбили на три тира:
1. Sol (флагман)
2. Terra (на уровне GPT-5.5, но вдвое дешевле)
3. и Luna (быстрая и самая дешёвая)

Цены за 1M токенов (вход/выход): Sol $5/$30, Terra $2.50/$15, Luna $1/$6.

Ключевое сравнение с Mythos (Fable 5) от Anthropic идёт по кибербезопасности. На ExploitBench Sol тянется к Mythos Preview, расходуя при этом примерно треть выходных токенов.

В июле Sol запустят на Cerebras — до 750 токенов/с. Публичный доступ в ChatGPT, Codex и API обещают через пару недель.

@ai_for_devs

3❤49🔥30👍19⚡2👌2🤩1

8.54K views17:45

AI for Devs

Так у нас год за 5 получается 🤣

Please open Telegram to view this post

VIEW IN TELEGRAM

1😁212👍22🔥13💯9❤4🤡2

7.91K views13:39

AI for Devs

Как не слить конфиденциальные данные в общедоступные нейросети?

Самый надежный способ — развернуть их локально на собственном сервере. Или не тратить на это время и воспользоваться готовым решением от Selectel. В каталоге готовых ИИ-моделей нейросети уже развернуты на оптимальном железе для инференса.

Что вы получаете в Selectel:

1. Большой выбор моделей для ваших задач: для генерации текста и кода, распознавания речи, создания контента и других

2. Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки

3. Прогнозируемую стоимость: платите за фактическое время потребления вычислительных ресурсов

Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/vj562

1👌19👍15❤9🔥2

6.97K views09:02

AI for Devs

⚡️ Grok 4.5 вышел в приватную бету в SpaceX и Tesla

В основе Grok 4.5 лежит V9: новая модель, которую xAI обучали с нуля вместе с инженерами из Cursor на их данных.

Модель втрое больше предыдущей: 1.5 триллиона параметров против 0.5T у v8-small (Grok 4.3), которая сейчас обслуживает весь продакшен трафик.

Макс отметил, что данные Cursor добавили уже после основного этапа (это менее эффективно, чем с нуля). В следующей версии на 2T параметров они войдут с самого начала.

Илон обещает по одной новой модели в месяц от SpaceX. То есть в паблик Grok 4.5 должен выйти уже в июле!

Параллельно xAI развивает Grok Build (собственный инструмент для кодинга), конкурент того же Cursor. Маск говорит, что он становится лучше с каждым днём. Делаем ставки, кого из них в итоге принесут в жертву?

@ai_for_devs

1👍43⚡12🔥6❤5👏1🤩1

7.31K views12:26

AI for Devs

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Холли-молли...

🤯 А чё, так можно было что ли!?
🤡 Ну ты и дед...

3🤯152🤡28👍2

7.44K views08:16

AI for Devs

⚡️ Claude Sonnet 5: Anthropic обновили главную рабочую лошадку

Позиционируется как самый агентный Sonnet. По качеству близка к Opus 4.8, но дешевле.

Цены: $2 за млн входных и $10 за млн выходных токенов до 31 августа, с 1 сентября $3/$15.

Обновили токенайзер, входные тексты занимают на 0–35% больше токенов, чем в предыдущих версиях.

По рассуждению, использованию инструментов, написанию кода и задачам на знание строгое доминирование над Sonnet 4.6. На многих бенчмарках Opus 4.8 по-прежнему впереди.

Наконец-то что-то для просто народа!)

@ai_for_devs

1🤩37❤27👍18🔥3⚡2

7.36K views18:17

AI for Devs

⚡️ Anthropic "возвращают" доступ к Fable 5

Экспортные ограничения на Fable 5 и Mythos 5 сняли вчера, 30 июня, модель обещают сделать доступной всем уже сегодня. Но "всеобщий" доступ с оговорками.

1. На Pro/Max/Team Fable 5 входит в подписку только в пределах 50% недельного лимита и только до 7 июля. Дальше исключительно через usage credits, то есть отдельная оплата сверху подписки, по себестоимости как за API. Для тех, у кого тариф enterprise, usage credits нужны вообще сразу, никакого бесплатного окна нет.

2. Заодно выкатили "улучшенный" классификатор безопасности. Anthropic сами пишут, что он чаще блокирует безобидные запросы на обычном кодинге и дебаге. В те пару дней, что модель уже была доступна в июне, часть пользователей и так жаловалась на запросы, которые без видимой причины перекидывало на Opus 4.8. С новым классификатором таких случаев станет только больше.

3. Anthropic согласились, что релизы топовых моделей теперь идут через расширенный ранний доступ для правительства США: Минторг, CAISI и профильные ведомства получают модели и защитные механизмы до публичного релиза. Тут без комментариев))

В общем да, сегодня Fable 5 снова станет доступна "всем"

🙂

@ai_for_devs

Please open Telegram to view this post

VIEW IN TELEGRAM

1⚡31👍29❤12🤯7😢5🔥1💯1

7.41K views06:53

AI for Devs

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Fable 5 is back.

1🔥64👍18🤯14⚡6❤5🤩3

6.2K viewsedited 19:55

AI for Devs

⚡️ Z.ai выпустили крупное обновление ZCode

Альтернатива Claude Code и Codex от создателей GLM-5.2 уже доступна для всех OS.

Их собственный ZCode Agent заточен под GLM-5.2, но через BYOK можно подключить свои подписки OpenAI, Anthropic и других провайдеров.

Новым пользователям дают 5 дней бесплатного доступа с повышенным дневным лимитом: хороший повод протестировать китайский флагман.

Подписчикам GLM Coding Plan квота в ZCode в 1.5 раза выше обычной.

P.S. GLM в ZCode доступна из России без VPN.

@ai_for_devs

1🔥47👍20⚡14❤4🤩2

4.63K views13:45

About

Blog

Apps

Platform