Mat Intellect 😎
88 subscribers
84 photos
1 video
1 file
68 links
Канал Mat про ИИ
Подписывайся 👇
https://www.instagram.com/matintellect
https://www.youtube.com/@Matintel
Download Telegram
#AI: Anthropic выпустил урезанный Mythos - Claude Fable 5 🧠

⚡️ Несколько недель назад Anthropic предупредила что новая модель слишком мощная для публичного доступа. 9 июня выпустили - в модифицированной форме. Claude Fable 5: первая публично доступная модель Mythos-класса.

Что такое Claude Fable 5:
Это не Opus Plus - это другой класс. Fable 5 = Mythos 5 под капотом, но с дополнительным слоем классификаторов-фильтров поверх. Когда модель детектирует запрос по кибербезопасности, биологии, химии или дистилляции - запрос автоматически переходит на Opus 4.8 и ты видишь уведомление. Срабатывает менее 5% сессий. В тестировании на alignment: уровень нежелательного поведения Fable 5 аналогичен Opus 4.8 - тот же базовый вес, те же показатели. Название Fable - "история" по-английски - Anthropic объясняют тем что модель строит сложные нарративы и решает задачи требующие длинного многошагового reasoning. Не один промпт-ответ, а развернутый процесс на часы работы вперед

Бенчмарки - что показали тесты:
🟢 FrontierBench (Cognition coding eval) - лучший результат среди всех публично доступных моделей
🟢 Core analytics - первая пробившая 90%, плюс 10 пунктов к Opus 4.8
🟢 Frontier physics - 36 часов против 4 дней у GPT-5.5, и с третью reasoning-токенов

Ключевая деталь: чем длиннее и сложнее задача, тем больше отрыв Fable 5 от конкурентов. Это другой reasoning под капотом - модель удерживает нить рассуждений иначе. На коротких ответах разрыв менее заметен, на задачах в несколько итераций - другой уровень. Anthropic специально указывает это в анонсе: чем сложнее задача, тем масштабнее преимущество

Как попробовать:
💎 Pro/Max/Team/Enterprise - бесплатный доступ до 22 июня
💎 API - $10/M input токенов, $50/M output. Вдвое дешевле Mythos Preview
💎 Prompt caching - скидка 90% сохраняется как и для всех Claude-моделей

🛡 Полный Mythos 5 - только через Project Glasswing: государственная программа для киберзащитников и операторов критической инфраструктуры

Mythos 5 - та же базовая модель но без фильтров по кибербезопасности. По данным Anthropic: самая мощная по кибервозможностям модель в мире на сегодня. Доступна исключительно через Project Glasswing в партнерстве с правительством США. Bloomberg отметил: впервые американская ИИ-лаборатория координирует выпуск frontier-модели через государственную программу с самого старта - не постфактум через партнерство, а как первичный канал дистрибуции

⭐️ Dario Amodei, CEO Anthropic:

"Мы считаем что можем строить одну из самых трансформирующих и потенциально опасных технологий в истории - и все равно идем вперед. Это не когнитивный диссонанс, а расчетная ставка: если мощный ИИ придет в любом случае - лучше чтобы его строили лаборатории которые думают о безопасности"


🎯 Дело не в фильтрах - Anthropic разделила один вес модели на две точки доступа с принципиально разными уровнями доверия. Fable 5 для всех, Mythos 5 только через государство. Это архитектурный ответ на вопрос "как выпустить опасную модель": не ограничивать одну, а создать две версии с разными воротами входа. Пока все это держится на доверии к Anthropic и к государственному партнерству. Вопрос насколько долго эта схема работает - и что произойдет когда кто-то воспроизведет те же возможности без этих ворот

Instagram | YouTube | Threads
🔥2
#Лайвхак: Как я делаю проект с первого раза - 3 лайвхака + бесплатный файл 🎯

🔥 Промтинг, скилы, хуки - детский сад, это все знают. Я несколько месяцев строю проекты под ключ - агенты, пайплайны, автоматизации - и вот три вещи которые реально помогают делать разработку с первого раза!

Правило 1 - 70% разработки это планирование:
Держи в голове такое соотношение: 70% планирование, 30% сама разработка. Не наоборот. Сначала детальный промт идеи - что строишь, зачем, что из себя представляет. Потом детальный промт разработки - архитектура, стек, зависимости, порядок этапов. Потом все собирается в один общий файл с точками отката на каждом этапе и тестом после реализации каждого куска

Это то что GitHub в 2026 году называет spec-driven development. Почему это важно: "Языковые модели отлично завершают паттерны, но не умеют читать мысли". Расплывчатый промт создает тысячи невысказанных допущений - ИИ честно их заполняет своими догадками. Чаще всего неправильными. Детальная спека устраняет угадывание на входе - и это дешевле чем переписывать три раза после

Правило 2 - аудит через команду /audit:
Вшил в систему процесс который запускает нескольких аналитиков последовательно. Каждый следующий работает с результатом предыдущего - это принципиально:
Аналитик #1 - "Ты уверен в своем плане? Раскритикуй, найди все слабые места. Напиши в конце новый план с учетом критики"
Аналитик #2 - "Ты уверен на 200%?" - второй уровень. Первый аудит сам проходит аудит
Аналитик #3 - "Это лучшее что ты можешь предложить? Есть альтернативные решения?" - находит то что первые два не заметили
Аналитик Codex (или любая другая модель) - внешний взгляд. Находит то что основная не умеет видеть из-за собственных паттернов

Первые разы казалось что это паранойя. Но третий аналитик стабильно находит минимум одно слабое место которое предыдущие два пропустили. Без исключений. Anthropic документирует этот подход: независимые агенты проверяют одно и то же, итог агрегируется - и это работает именно потому что каждый агент не знает что сказал другой

Правило 3 - GSD (Get Shit Done):

😳 Внутри - 67 скилов, 20 агентов и море автоматизации

📌 После аудита и финального планирования - разбивка на максимальное количество небольших фаз
📌 Каждая фаза: конкретная задача, реализация, тест, точка отката если что-то пошло не так
📌 Разработка идет строго линейно от первой фазы до финального боевого проекта без прыжков

Каждый шаг атомарный. Либо сработал и идешь дальше. Либо откатился и четко понял где именно ошибся - не "что-то пошло не так", а конкретный этап, конкретная причина. Это инженерная дисциплина примененная к вайб-кодингу

GSD - это реальный бесплатный open-source проект на GitHub. Установка глобально одной командой:

npx get-shit-done-cc@latest --claude --global


⭐️ Simon Willison, автор Agentic Engineering Patterns:

"Agentic engineering - это профессиональные инженеры которые используют ИИ-агентов чтобы улучшить и ускорить работу, усиливая собственную экспертизу. Принципиально отличается от vibe coding - когда непрограммисты запускают LLM в случайном режиме и надеются на лучшее"


💭 Полгода назад переписывал каждый второй проект с нуля. Думал нужен лучший промт или новая модель. Оказалось нужно было перестать начинать кодить до того как четко понял что строю, где могу ошибиться, и как откатиться если ошибся. Банально? Да. Работает? Да

Instagram | YouTube | Threads
Please open Telegram to view this post
VIEW IN TELEGRAM
1
audit.md
22.1 KB
🆓 Ловите бесплатный файл для настройки /audit
Please open Telegram to view this post
VIEW IN TELEGRAM
2
This media is not supported in your browser
VIEW IN TELEGRAM
4🙏2
Ловушка контента

Если честно, я попал в собственную ловушку контента

С одной стороны, алгоритмы соцсетей работают тупым, упрямым образом: больше контента = больше аудитории 😓

С другой стороны, я реально построил полностью автоматическую контент-фабрику, которая позволяет постить новости в пару кликов 24/7

С третьей стороны, я смотрю на все это, и мне реально не хочется публиковать бесполезную хуйню, которая вам не интересна, а меня от нее просто тошнит

В итоге я решил послать нахуй алгоритмы и публиковать только то, что я реализовал сам, либо полезняки, либо то, что вы меня реально попросите. И только в исключительных случаях - живые важные новости. Идет?

Если вам не очень влом, киньте пару комментариев, что бы хотелось узнать. Для меня это мотивация, а для вас бесплатный полезняк 😉

Жду

Instagram | YouTube | Threads
👍3
#AI: Переехал с Claude SDK на CLI - и вот что нашел по пути 🔧

⚡️ Сегодня Anthropic вводит отдельную тарификацию для Claude SDK - $100/месяц на аккаунт. Я переехал заранее, и в процессе обнаружил кое-что что большинство разработчиков пропустят до тех пор пока не получат счет.

Детали перехода на Claude CLI:
Месяц назад Anthropic объявил: с 15 июня все вызовы через Claude SDK идут по отдельной тарификации. Звучало как просто переключить конфиг и забыть. По факту оказалось совсем не так. Многие проекты клиентов были построены целиком на Claude SDK - пришлось сначала мигрировать их, и только потом заниматься собственной системой. Процесс занял намного больше времени чем я ожидал - особенно там где SDK был зашит глубоко в слоях автоматизации.

Что нашел во время аудита системы:
Клиентские проекты на Claude SDK - первый и самый трудоемкий приоритет миграции
⚡️ claude -p в инструментах автоматизации - это тоже Claude SDK, и таких вызовов внутри системы гораздо больше чем кажется на первый взгляд
💡 $100/месяц на аккаунт с сегодняшнего дня - при реальной боевой нагрузке не хватит даже на несколько дней

Главная неожиданность была именно в claude -p. Инструменты автоматизации дергают его там где ты не ждешь и даже не думаешь что это SDK-вызов. Прогони grep по всем конфигам и скриптам прямо сейчас. Make-файлы, bash-скрипты, воркфлоу - claude -p встречается там чаще всего. Миграция одного процесса занимает 10-15 минут если знаешь где искать. Найди и перевези на чистый Claude CLI.

Почему это только начало:
Я ожидаю что гайки будут закручивать все сильнее. Даже текущие методы которые я сейчас использую - Anthropic в итоге тоже изменит или отменит. Это не паранойя, это паттерн: каждые несколько месяцев условия меняются и нужно переезжать снова.

Единственный выход - строить систему которая не зависит от конкретного API. Поэтому моя следующая остановка - мульти-LLM архитектура где каждый процесс дергает свою модель. Разные задачи - разные модели. Я уже почти построил такую систему, и это другой уровень независимости от любого провайдера.

⭐️ Simon Willison, разработчик и автор блога о практике применения LLM:

"Каждый AI API который ты используешь сегодня - это технический долг с неизвестной датой погашения. Строй системы которые умеют менять модели как перчатки - иначе ты работаешь на условиях провайдера, а не на своих"


💡 Дедлайн: 15 июня 2026 - уже сегодня

🗒 Я уже почти построил мульти-LLM систему где каждый агент дергает свою модель под свою задачу - скоро расскажу подробнее. Если не задуматься об архитектуре прямо сейчас, потом будешь переезжать в панике под новые прайсы и ограничения. Лучше делать это с холодной головой

Instagram | YouTube | Threads
👍4
Claude дал заднюю ⁉️

Ночью пришло письмо о том, что Claude Agent SDK не будет работать пока по отдельной тарификации. Пока. Только пока 😏

Я вижу несколько причин. Компания реально не готова столкнуться с потерями, которые она понесет после перехода на отдельную тарификацию по Claude SDK. Второе - они хотят доработать систему тарификации, поскольку людей предупредили заранее и большинство перешли на чистый Claude CLI, но по сути на расход токенов это особо не повлияло. Введение этого ограничения скорее отпугнет будущих пользователей, нежели текущих

Теоретически, Claude Agent SDK не будет работать по отдельной тарификации, поскольку людей предупредили заранее и большинство перешли на чистый Claude CLI. Это скорее время на паузу, на подумать - чтобы вернуться чуть позже с более продуманным механизмом, как компании тратить меньше денег на обслуживание людей по подписке

Компания не единожды доказала, что их фокус направлен больше на бизнес-сектор, который реально платит за токены по API - заработок там в 30-40 раз больше, нежели с пользователей по подписке. Хотя пользователей по подписке в общем объеме, естественно, больше, и словить хейт от аудитории - значит срубить сук, на котором они сидят 🪚, и получить большой удар по бизнесу и репутации

Месяца компании не хватило, чтобы решить свои экономические вопросы, и на неопределенный срок этим хитрым письмом они продлили себе время на решение. Но оно обязательно настанет. Не думайте, что мы сможем пользоваться Claude в том же объеме, пользуясь лишь подпиской, как сейчас. Я в последний месяц потратил порядка 45 тысяч долларов на реализацию своих проектов, если бы платил за токены по API. Выводы делайте сами 🤷

Instagram | YouTube | Threads
Управление голосом 🎙

Меня не покидает мысль о реализации взаимодействия с системой голосом. Здесь есть плюсы и минусы

Плюсы - конечно, хочется реализовать систему как в фильме "Железный человек", где я утром говорю "Привет, Джарвис", и моя система автоматически запускается, начинает работать и отвечает мне голосом быстро, четко и так далее 🤖

И минусы. Действительно ли можно качественно осуществлять оркестрацию системы голосом, когда ты не видишь текста, когда ты не видишь данных и слушаешь только голос, который тебе отвечает через динамики? Скорее нет, чем да 🤔

Поэтому в ближайшее время я реализую систему, которая будет взаимодействовать со мной голосом, где я буду с ней разговаривать как с живым человеком. Но основную разработку продуктов для своих клиентов я все равно оставлю текстом с большим контекстным окном и с большим количеством деталей. Иначе все это превратится в полную мусорку и будет совершенно непригодно к использованию

А у вас какие фантазии? Что вы хотите реализовать? 💭

Instagram | YouTube | Threads
2
#AI: Подключил GLM-5.2 вместо Fable 5 🧠

💪 Anthropic закрыли Fable 5 для пользователей. Я нашел замену - и честно говоря, только выиграл от этого

Что такое GLM-5.2:
Открытая модель от z.ai с контекстным окном 1 млн токенов. Вышла 16 июня под MIT лицензией с открытыми весами на HuggingFace - без региональных ограничений и без риска что ее "выключат" решением регулятора. По бенчмаркам задача планирования - Fable 9.1 vs GLM 9.0. Одинаковые архитектурные решения. Стоимость в 10 раз ниже

Мой стек сейчас - три модели, три задачи:
⚡️ Claude Opus 4.8 - основная модель, сложное мышление, разработка архитектуры
⚡️ Codex 5.5 - фикс багов, аудит разработанного кода от Claude
⚡️ GLM-5.2 - независимый аудит Claude и Codex

Именно эта комбинация вывела разработку на другой уровень. Три провайдера, разные сильные стороны

🎯 Полгода я думал что достаточно держать одину топовую LLM и не усложнять стек. Оказалось нет. Чем больше умных моделей и разных взглядов - тем качественнее конечный продукт

🔥 Подключить GLM по моей рефке - ссылка 👈

Instagram | YouTube | Threads
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
🔴 Голосовой ассистент 🎙

Если честно, это не первая попытка собрать себе голосового ассистента. Первая попытка была 4 месяца назад. Я потратил около недели и не смог собрать ничего толкового - не было опыта. Тогда я все собирал в OpenClaw прямо через Телеграм. В итоге провал 😅

Но прошло время, и у меня появился клиент, который попросил сделать ему агента наподобие Siri, только умнее. Чтобы можно было как в фильме общаться с ним голосом и чтобы он делал то, что его попросят. Прежде чем что-то собирать клиенту, я собрал для себя

И... Знакомьтесь - Jes!

Это НЕ чат-бот в стиле "напишите сообщение и ждите три дня". Это живой голос, с которым я разговариваю. По-русски. Как с живым человеком - которого можно перебить на полуслове. Я говорю - она отвечает мгновенно. Можно тараторить, можно мямлить, можно влезть в середине ее фразы - она поймет и подхватит

Но голос - это только обертка. Дальше начинается самый жир 👇

🎛 Она рулит всем
У меня пашет целая система - боты разрабатывают, пишут тексты, рисуют картинки, считают, мониторят. Раньше я лазил руками, теперь я просто говорю:
- "Jes, поставь задачу дизайнеру нарисовать картинку для презентации голосового ассистента"
- "Сейчас поставлю задачу"
И она пошла и сделала. Поставила задачу боту, узнала статус и отчиталась за результат - голосом, как в фильме, Карл!

🧠 И она ПОМНИТ
Память в несколько уровней:
▪️ Помнит важные факты и решения - между разговорами, не теряет
▪️ В начале каждого диалога уже знает, о чем мы говорили вчера - сама делает короткую выжимку, не заставляет пересказывать
▪️ Ищет по всем нашим прошлым разговорам по СМЫСЛУ, а не по точному слову ("где мы там про оплату решали?" - находит, хоть ты слово в слово не помнишь)
▪️ Роется в моей базе знаний, как в своем кармане
Говорю: "Jes, запомни, что..." - и в следующий раз она это уже знает

📲 И она ВЕЗДЕ
На телефоне - вынес иконку на домашний экран, открывается как настоящее приложение. На макбуке - живет в Dock отдельным окном: кликнул - говоришь. Достал телефон - Jes под рукой. Без установок, без магазинов приложений, без всей этой ебли с "обновите до версии X"

⚡️ И по мелочи:
🌐 Ищет в интернете, на гитхабе, в документации - голосом, и зачитывает суть, а не ссылки
Ставит напоминания и таймеры - в нужный момент сама говорит вслух + дублирует в Телеграм
📬 Читает почту и календарь, отправляет письма
🌦 Говорит погоду, новости и еще кучу всего

Под капотом - живой realtime-движок от OpenAI, своя многоуровневая память и командир-оркестратор, который дергает ботов

Нам десять лет обещали "умных ассистентов", а по факту втюхивали кнопочные автоответчики, которые "не расслышали запрос" 🤡 А тут - живой голос, который рулит целой системой, помнит все, не путается и всегда под рукой. Не демка, не концепт, не "скоро покажем". Работает. Прямо сейчас

Будущее - это не "когда-нибудь потом". Оно уже у меня в кармане. И ее зовут Jes 🔴

Instagram | YouTube | Threads
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM