AI Vibe Breakfast Almaty — третья встреча!
Нас все больше и больше, что радует.
Первые два завтрака прошли отлично: познакомились, нашли точки соприкосновения и круто зарядились. В эту субботу встречаемся уже в третий раз.
Продолжаем традицию субботних завтраков для тех, кто строит продукты в IT и AI. Никаких формальностей, слайдов или душных выступлений. Только кофе, общение и нетворкинг.
Приходи знакомиться, обсуждать проекты, находить партнеров или просто чиллить с утра в компании единомышленников.
📅 Суббота, 4 апреля · 10:00 📍 Coffee Original (Байтурсынова, 67) 🎟️ Бесплатно · Количество мест ограничено
Хочешь прийти? Вступай в группу WhatsApp — там вся инфа и детали: https://chat.whatsapp.com/Kr2qcF6P9Y9DlUMroofyPc
Нас все больше и больше, что радует.
Первые два завтрака прошли отлично: познакомились, нашли точки соприкосновения и круто зарядились. В эту субботу встречаемся уже в третий раз.
Продолжаем традицию субботних завтраков для тех, кто строит продукты в IT и AI. Никаких формальностей, слайдов или душных выступлений. Только кофе, общение и нетворкинг.
Приходи знакомиться, обсуждать проекты, находить партнеров или просто чиллить с утра в компании единомышленников.
📅 Суббота, 4 апреля · 10:00 📍 Coffee Original (Байтурсынова, 67) 🎟️ Бесплатно · Количество мест ограничено
Каждый заказывает и оплачивает свой счет самостоятельно.
Хочешь прийти? Вступай в группу WhatsApp — там вся инфа и детали: https://chat.whatsapp.com/Kr2qcF6P9Y9DlUMroofyPc
⚡1👍1🥰1
PMы щёлкают промпты. Разработчики рисуют диаграммы.
Microsoft Research выпустил репорт: продакт-менеджеры всё чаще пишут код. AI-агенты позволяют сформулировать задачу текстом и получить рабочий прототип. Не нужно учить синтаксис — нужно уметь объяснять что хочешь.
Разработчики при этом уходят в планирование. Архитектура, промпты для AI, code review сгенерированного кода. Меньше писанины — больше стратегии.
Выглядит как идеальная рокировка, но все так просто.
AI генерирует 80% моего кода. При этом я трачу 80% времени на то чтобы понять что именно он написал. Сгенерированный код — не инженерное решение. Это код, который работает, выглядит норм, но понять почему — отдельная задача.
PM получает быстрый результат. Разработчик получает чужой код на контроль.
Кто тут выигрывает — большой вопрос.
Вступить в AI Vibe Club
Microsoft Research выпустил репорт: продакт-менеджеры всё чаще пишут код. AI-агенты позволяют сформулировать задачу текстом и получить рабочий прототип. Не нужно учить синтаксис — нужно уметь объяснять что хочешь.
Разработчики при этом уходят в планирование. Архитектура, промпты для AI, code review сгенерированного кода. Меньше писанины — больше стратегии.
Выглядит как идеальная рокировка, но все так просто.
AI генерирует 80% моего кода. При этом я трачу 80% времени на то чтобы понять что именно он написал. Сгенерированный код — не инженерное решение. Это код, который работает, выглядит норм, но понять почему — отдельная задача.
PM получает быстрый результат. Разработчик получает чужой код на контроль.
Кто тут выигрывает — большой вопрос.
Вступить в AI Vibe Club
Уже завтра — очередная встреча AI Vibe Breakfast Almaty!
Собираемся в третий раз. Никаких слайдов, формальностей и скучных выступлений. Просто кофе, живое общение и нетворкинг с теми, кто строит продукты в IT и AI.
📅 Суббота, 11 апреля · 10:00
📍 Coffee Original (Байтурсынова, 67)
🎟️ Бесплатно · Места ограничены
Каждый платит за себя.
Хочешь прийти? Все детали в WhatsApp-группе: https://chat.whatsapp.com/Kr2qcF6P9Y9DlUMroofyPc
Собираемся в третий раз. Никаких слайдов, формальностей и скучных выступлений. Просто кофе, живое общение и нетворкинг с теми, кто строит продукты в IT и AI.
📅 Суббота, 11 апреля · 10:00
📍 Coffee Original (Байтурсынова, 67)
🎟️ Бесплатно · Места ограничены
Каждый платит за себя.
Хочешь прийти? Все детали в WhatsApp-группе: https://chat.whatsapp.com/Kr2qcF6P9Y9DlUMroofyPc
👍2
Еще одна субботняя встреча - Done ✅
Присоединяйтесь к нам на следующую встречу. Подтянуть нетворкинг никогда не лишнее 💪
Присоединяйтесь к нам на следующую встречу. Подтянуть нетворкинг никогда не лишнее 💪
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Китае набирает обороты практика, которая пугает. Компании заставляют сотрудников писать развёрнутую документацию по своей работе — а потом на этих данных обучают AI и заменяют человека. В сообществе это называют "дистилляция".
На этом фоне появился Anti-Distillation Skill. Инструмент берёт твои рабочие документы и переписывает их так, чтобы они выглядели профессионально и убедительно, но при этом были бесполезны для обучения AI. Компания получает красивую документацию. Реальные знания и нюансы остаются у тебя.
И вот это реально впечатляет. Люди находят способ защитить свою экспертизу. Фактически они саботируют собственную замену — и это работает.
Есть и обратная сторона. AI уже умеет имитировать манеру работы коллег один в один. Так что ставки растут с обеих сторон.
Если ты думаешь, что твоя ценность на рынке — это просто знания, которые можно задокументировать, то пора задуматься. Потому что однажды кто-то просто посадит AI смотреть как ты работаешь.
Вступить в AI Vibe Club
На этом фоне появился Anti-Distillation Skill. Инструмент берёт твои рабочие документы и переписывает их так, чтобы они выглядели профессионально и убедительно, но при этом были бесполезны для обучения AI. Компания получает красивую документацию. Реальные знания и нюансы остаются у тебя.
И вот это реально впечатляет. Люди находят способ защитить свою экспертизу. Фактически они саботируют собственную замену — и это работает.
Есть и обратная сторона. AI уже умеет имитировать манеру работы коллег один в один. Так что ставки растут с обеих сторон.
Если ты думаешь, что твоя ценность на рынке — это просто знания, которые можно задокументировать, то пора задуматься. Потому что однажды кто-то просто посадит AI смотреть как ты работаешь.
Вступить в AI Vibe Club
🔥6❤1🤩1
🎙 GLM 5.1 vs Qwen 3.6 vs Minimax 2.7 vs Xiaomi MiMo-V2-Pro — кто реально лучше?
Во вторник в закрытом клубе возьмём 4 модели и зададим каждой реальную задачу с проекта. Посмотрим кто быстрее, кто точнее, где лажает и почему. Только живой код, никаких бенчмарков из интернета.
Что разберём на эфире:
— Кто быстрее и точнее на кодинге
— Где каждая лажает
— Сколько стоит каждый вариант
Тема пришла от участника Дмитрия — подписчики присылают идеи для эфиров, и мы берём лучшие в работу.
Вступить в AI Vibe Club
Во вторник в закрытом клубе возьмём 4 модели и зададим каждой реальную задачу с проекта. Посмотрим кто быстрее, кто точнее, где лажает и почему. Только живой код, никаких бенчмарков из интернета.
Что разберём на эфире:
— Кто быстрее и точнее на кодинге
— Где каждая лажает
— Сколько стоит каждый вариант
Тема пришла от участника Дмитрия — подписчики присылают идеи для эфиров, и мы берём лучшие в работу.
Вступить в AI Vibe Club
🔥3👏1
Китай делает свой ход.
DeepSeek V4 выходит в конце апреля. Впервые модель будет работать не на Nvidia, а на Huawei Ascend чипах. Полный уход от CUDA.
Параметры серьёзные — триллион параметров, контекст на миллион токенов. Huawei Ascend под капотом. Полностью китайский стек от железа до софта.
Alibaba, ByteDance и Tencent уже закупают чипы под это. Цены на Huawei-чипы выросли на 20 процентов за последние недели — хотя хз, может и больше.
8 апреля компания добавила «Экспертный режим». Индустрия сразу поняла — обкатка V4. Та самая компания, которая обрушила рынки своими R1, готовится к следующему удару.
Думаю это самый недооценённый тренд сейчас. Все смотрят на Американские модели, а Китай спокойно строит свою экосистему. Быстро строит.
Если ты в индустрии — следи за китайским стеком. Мир меняется не только в одну сторону.
Вступить в AI Vibe Club
DeepSeek V4 выходит в конце апреля. Впервые модель будет работать не на Nvidia, а на Huawei Ascend чипах. Полный уход от CUDA.
Параметры серьёзные — триллион параметров, контекст на миллион токенов. Huawei Ascend под капотом. Полностью китайский стек от железа до софта.
Alibaba, ByteDance и Tencent уже закупают чипы под это. Цены на Huawei-чипы выросли на 20 процентов за последние недели — хотя хз, может и больше.
8 апреля компания добавила «Экспертный режим». Индустрия сразу поняла — обкатка V4. Та самая компания, которая обрушила рынки своими R1, готовится к следующему удару.
Думаю это самый недооценённый тренд сейчас. Все смотрят на Американские модели, а Китай спокойно строит свою экосистему. Быстро строит.
Если ты в индустрии — следи за китайским стеком. Мир меняется не только в одну сторону.
Вступить в AI Vibe Club
👍6❤3🔥2🤣2😁1
Милла Йовович написала AI-инструмент. Да, та самая из Обители зла.
По ночам пишет код, по дням снимается в боевиках и ходит по подиумам Miu Miu. MemPalace — её совместный проект с Беном Сигманом, CEO из крипто.
Идея красивая — постоянная память для любого LLM между сессиями. Claude, ChatGPT, Gemini — все они забывают всё при закрытии чата. MemPalace хранит разговоры дословно в векторной базе ChromaDB, без посредников. Архитектура работает по принципу дворца памяти — Wings, Halls, Rooms — иерархия от доменов до конкретных тем. При старте загружается всего ~170 токенов, остальное достаётся через семантический поиск. 42 тысячи звёзд на GitHub за неделю.
А потом сообщество взялось за бенчмарки. Заявленный 96.6% — это не показатель MemPalace, а просто ChromaDB по умолчанию. Заявленный 100% достигнут через ручной фикс конкретных тестов и пересчёт на той же выборке — классическое «натренировались на тестовых данных». «Полностью локально, без API» оказалось неправдой: оба 100% результата требовали платный Claude API.
Как финал — на запуске появился крипто-токен в Solana, накачался и слился за 24 часа. Бен и Милла в доле по 50%.
Получается что-то среднее между реальным open-source инструментом, celebrity-хайпом и крипто-схемой. Инструмент рабочий, идея нормальная — но маркетинг откровенно врал.
Вступить в AI Vibe Club
По ночам пишет код, по дням снимается в боевиках и ходит по подиумам Miu Miu. MemPalace — её совместный проект с Беном Сигманом, CEO из крипто.
Идея красивая — постоянная память для любого LLM между сессиями. Claude, ChatGPT, Gemini — все они забывают всё при закрытии чата. MemPalace хранит разговоры дословно в векторной базе ChromaDB, без посредников. Архитектура работает по принципу дворца памяти — Wings, Halls, Rooms — иерархия от доменов до конкретных тем. При старте загружается всего ~170 токенов, остальное достаётся через семантический поиск. 42 тысячи звёзд на GitHub за неделю.
А потом сообщество взялось за бенчмарки. Заявленный 96.6% — это не показатель MemPalace, а просто ChromaDB по умолчанию. Заявленный 100% достигнут через ручной фикс конкретных тестов и пересчёт на той же выборке — классическое «натренировались на тестовых данных». «Полностью локально, без API» оказалось неправдой: оба 100% результата требовали платный Claude API.
Как финал — на запуске появился крипто-токен в Solana, накачался и слился за 24 часа. Бен и Милла в доле по 50%.
Получается что-то среднее между реальным open-source инструментом, celebrity-хайпом и крипто-схемой. Инструмент рабочий, идея нормальная — но маркетинг откровенно врал.
Вступить в AI Vibe Club
OpenAI сделал контекст платным
С 2 апреля OpenAI перевел тарификацию Codex на точную токенную модель, и теперь оплата зависит строго от объема входящих и исходящих данных, а не от условного количества сообщений. Если раньше система часто прощала большие объемы загружаемой информации, то теперь каждый лишний байт в диалоге превращается в прямые расходы. Простые задачи стали дешевле, но работа с крупными проектами и длинными контекстами ощутимо ударила по бюджету пользователей.
Любопытно, что одновременно с изменением правил активные пользователи получили письма с бонусными кредитами. Это выглядит как щедрый подарок, но на деле является классическим способом смягчить переход на менее выгодные условия и удержать аудиторию в момент, когда предсказуемость расходов снижается, а платить приходится больше.
Привычка загружать в модель огромные массивы данных «на всякий случай» или держать в контексте гигантские файлы инструкций теперь становится экономически нецелесообразной. Промпт-инжиниринг превращается из модного термина в реальный навык экономии, где умение четко формулировать запрос напрямую влияет на стоимость результата.
Чтобы адаптироваться к новым условиям, стоит сделать три конкретные вещи:
• Почистите системные файлы и инструкции. Документы вроде AGENTS.md, раздутые сотнями строк правил, теперь сжигают бюджет, поэтому оставьте там только самую суть.
• Фильтруйте входящие данные. Не нужно загружать в чат весь проект целиком, если в этом нет прямой необходимости для конкретной задачи.
• Грамотнее выбирайте модель. Запускать тяжелую нейросеть ради простой правки кода неэффективно: для рутинных операций лучше подходят легкие версии, а мощные инструменты стоит беречь для сложной аналитики.
Технологии взрослеют, и время свободного потребления уходит. Теперь придется думать не только о том, какой результат вы хотите получить, но и каким способом это сделать эффективнее.
Вступить в AI Vibe Club
С 2 апреля OpenAI перевел тарификацию Codex на точную токенную модель, и теперь оплата зависит строго от объема входящих и исходящих данных, а не от условного количества сообщений. Если раньше система часто прощала большие объемы загружаемой информации, то теперь каждый лишний байт в диалоге превращается в прямые расходы. Простые задачи стали дешевле, но работа с крупными проектами и длинными контекстами ощутимо ударила по бюджету пользователей.
Любопытно, что одновременно с изменением правил активные пользователи получили письма с бонусными кредитами. Это выглядит как щедрый подарок, но на деле является классическим способом смягчить переход на менее выгодные условия и удержать аудиторию в момент, когда предсказуемость расходов снижается, а платить приходится больше.
Привычка загружать в модель огромные массивы данных «на всякий случай» или держать в контексте гигантские файлы инструкций теперь становится экономически нецелесообразной. Промпт-инжиниринг превращается из модного термина в реальный навык экономии, где умение четко формулировать запрос напрямую влияет на стоимость результата.
Чтобы адаптироваться к новым условиям, стоит сделать три конкретные вещи:
• Почистите системные файлы и инструкции. Документы вроде AGENTS.md, раздутые сотнями строк правил, теперь сжигают бюджет, поэтому оставьте там только самую суть.
• Фильтруйте входящие данные. Не нужно загружать в чат весь проект целиком, если в этом нет прямой необходимости для конкретной задачи.
• Грамотнее выбирайте модель. Запускать тяжелую нейросеть ради простой правки кода неэффективно: для рутинных операций лучше подходят легкие версии, а мощные инструменты стоит беречь для сложной аналитики.
Технологии взрослеют, и время свободного потребления уходит. Теперь придется думать не только о том, какой результат вы хотите получить, но и каким способом это сделать эффективнее.
Вступить в AI Vibe Club
👍6❤3
Напоминаю, сегодня в 17:00 по мск - эфир.
GLM 5.1, Qwen 3.6, Minimax 2.7, Xiaomi MiMo-V2-Pro. Четыре модели, одна реальная задача с проекта. Живой код, никаких бенчмарков из интернета.
Сравним кто быстрее, кто точнее, где каждая лажает. Наверное будет жарко.
Сегодня, 17:00 мск.👇
Вступить в AI Vibe Club
GLM 5.1, Qwen 3.6, Minimax 2.7, Xiaomi MiMo-V2-Pro. Четыре модели, одна реальная задача с проекта. Живой код, никаких бенчмарков из интернета.
Сравним кто быстрее, кто точнее, где каждая лажает. Наверное будет жарко.
Сегодня, 17:00 мск.👇
Вступить в AI Vibe Club
🔥4👍1
Anthropic готовится поднять цены на Claude в 10+ раз для компаний. Фикс-тарифы убирают, бизнес переводят на API с оплатой за токены.
Один разработчик сожрал 10 миллиардов токенов за 8 месяцев на Max за 100 баксов. В API-эквиваленте это 15 000 долларов. Раньше компания платила 100 в месяц за человека, теперь будет платить тысячи. Разница в 10-150 раз.
Причем Anthropic сознательно идет на это. Из официальной страницы Enterprise видно что seat fee покрывает только доступ, а использование считается отдельно по API-расценкам. Лицензия запрещает использовать личные подписки на работе, телеметрия банит. Хотя знакомый рассказывал что полкоманды тихонько юзает личные подписки. Теневое ИТ расцветает. Впрочем, это другая история.
Дарио делает Apple от мира LLM. Apple занимает процентов 10 рынка смартфонов, но забирает 90 процентов прибыли. Дарио готов отдать 90 процентов пользователей конкурентам. Для Fortune 500 платить несколько тысяч в месяц за Claude Enterprise - копейки по сравнению с полной стоимостью содержания разработчика.
Посередине оказались студии, стартапы, средний бизнес. Им нужен план Б. И когда все начнут платить за токены, пропадет смысл привязываться к одному провайдеру.
Вступить в AI Vibe Club
Один разработчик сожрал 10 миллиардов токенов за 8 месяцев на Max за 100 баксов. В API-эквиваленте это 15 000 долларов. Раньше компания платила 100 в месяц за человека, теперь будет платить тысячи. Разница в 10-150 раз.
Причем Anthropic сознательно идет на это. Из официальной страницы Enterprise видно что seat fee покрывает только доступ, а использование считается отдельно по API-расценкам. Лицензия запрещает использовать личные подписки на работе, телеметрия банит. Хотя знакомый рассказывал что полкоманды тихонько юзает личные подписки. Теневое ИТ расцветает. Впрочем, это другая история.
Дарио делает Apple от мира LLM. Apple занимает процентов 10 рынка смартфонов, но забирает 90 процентов прибыли. Дарио готов отдать 90 процентов пользователей конкурентам. Для Fortune 500 платить несколько тысяч в месяц за Claude Enterprise - копейки по сравнению с полной стоимостью содержания разработчика.
Посередине оказались студии, стартапы, средний бизнес. Им нужен план Б. И когда все начнут платить за токены, пропадет смысл привязываться к одному провайдеру.
Вступить в AI Vibe Club
❤2
Anthropic готовит Claude Opus 4.7 — The Information сообщил первым. Вместе с ним выйдет инструмент для создания сайтов и презентаций через промпты.
31 марта 2026 при обновлении npm-пакета Claude Code разработчики случайно не добавили .npmignore и не удалили исходники перед публикацией. В утечке 512 тысяч строк TypeScript — и там явные упоминания Opus 4.7, Sonnet 4.8 и модели с кодовым именем Mythos. Смешная ошибка для компании, которая занимается AI-безопасностью.
Отдельная история с Claude Mythos. Anthropic его показали, но не для публики. Только крупные партнеры — AWS, Apple, Google, Microsoft, Cisco, NVIDIA — получат доступ через Project Glasswing для поиска уязвимостей в критической инфраструктуре.
Предыдущий Opus 4.6 вышел 5 февраля 2026 с функцией agent teams. То есть цикл выпуска примерно 2-3 месяца. Для компании без публичных роадмапов это почти прозрачно.
Вступить в AI Vibe Club
31 марта 2026 при обновлении npm-пакета Claude Code разработчики случайно не добавили .npmignore и не удалили исходники перед публикацией. В утечке 512 тысяч строк TypeScript — и там явные упоминания Opus 4.7, Sonnet 4.8 и модели с кодовым именем Mythos. Смешная ошибка для компании, которая занимается AI-безопасностью.
Отдельная история с Claude Mythos. Anthropic его показали, но не для публики. Только крупные партнеры — AWS, Apple, Google, Microsoft, Cisco, NVIDIA — получат доступ через Project Glasswing для поиска уязвимостей в критической инфраструктуре.
Предыдущий Opus 4.6 вышел 5 февраля 2026 с функцией agent teams. То есть цикл выпуска примерно 2-3 месяца. Для компании без публичных роадмапов это почти прозрачно.
Вступить в AI Vibe Club
❤2
Один участник встречи рассказал как он прошел платный курс по целеполаганию. Восемь модулей, куча инсайтов. Потом взял и транскрибировал все уроки, сделал из этого skill. Теперь у него личный AI-коуч со всеми восемью навыками из курса. Обращается к нему и получает нужный результат.
В skill можно встроить что угодно. Если нужны знания, вызываешь Python-скрипт. Хочешь RAG, хочешь websearch, хочешь query-markdown который найдет релевантное среди тысячи файлов. Skill это просто последовательность действий, и изгаляться можно как угодно.
Зачем платить коучу каждый месяц, если одноразовая транскрибация дает тебе вечного персонального тренера. Причем не тупого, а с доступом к любым базам знаний. Наверное, так и будет развиваться корпоративное обучение.
И да, в эту субботу у нас очередная встреча AI Vibe Breakfast Almaty!
📅 Суббота, 18 апреля · 10:00
📍Где: Coffee Boom, ул. Гоголя, 58
Вход: бесплатно, места ограничены (каждый платит за свой заказ)
Хочешь прийти? Все детали в WhatsApp-группе: https://chat.whatsapp.com/Kr2qcF6P9Y9DlUMroofyPc
Вступить в AI Vibe Club
В skill можно встроить что угодно. Если нужны знания, вызываешь Python-скрипт. Хочешь RAG, хочешь websearch, хочешь query-markdown который найдет релевантное среди тысячи файлов. Skill это просто последовательность действий, и изгаляться можно как угодно.
Зачем платить коучу каждый месяц, если одноразовая транскрибация дает тебе вечного персонального тренера. Причем не тупого, а с доступом к любым базам знаний. Наверное, так и будет развиваться корпоративное обучение.
И да, в эту субботу у нас очередная встреча AI Vibe Breakfast Almaty!
📅 Суббота, 18 апреля · 10:00
📍Где: Coffee Boom, ул. Гоголя, 58
Вход: бесплатно, места ограничены (каждый платит за свой заказ)
Хочешь прийти? Все детали в WhatsApp-группе: https://chat.whatsapp.com/Kr2qcF6P9Y9DlUMroofyPc
Вступить в AI Vibe Club
👍3❤2
Anthropic выпустила Claude Opus 4.7
Opus обновился, и вышел довольно интересный апдейт.
Формально флагманом линейки теперь считается Claude Mythos, но его пока никому не дали — так что Opus 4.7 это лучшее, что можно пощупать прямо сейчас.
Главное в этом обновлении — код. На CursorBench прыгнули с 58% до 70%, а Terminal Bench стал решать задачи, которые раньше вообще не брал. У меня ощущение, что Anthropic реально хочет сделать модель, которой можно скинуть задачу и уйти пить кофе. Не "помоги написать функцию", а "разберись с этим таском сам".
Зрение тоже подтянули — картинки теперь принимает до 2576px, это примерно в три раза больше, чем было. Кто скармливает модели схемы и диаграммы — точно почувствует разницу.
Забавная история с промптами: модель стала выполнять инструкции буквально. Anthropic прямо предупреждают — возможно, вам придется переписать свои старые промпты. Сначала все жаловались что модели не понимают, а теперь будут жаловаться что понимают слишком дословно 😄
В Claude Code добавили уровень сложности xhigh и команду /ultrareview для глубокого ревью кода. Для тех, кто сидит в Claude Code каждый день — приятное обновление.
Про цену. Формально все те же $5/$25 за миллион токенов. Но есть нюанс: новый токенизатор на том же самом тексте жрет на 0–35% больше токенов. По факту для части задач стало дороже, просто это никто не афиширует 🤷
Доступно на claude.ai, через API, Amazon Bedrock, Google Vertex AI и Microsoft Foundry.
Вступить в AI Vibe Club
Opus обновился, и вышел довольно интересный апдейт.
Формально флагманом линейки теперь считается Claude Mythos, но его пока никому не дали — так что Opus 4.7 это лучшее, что можно пощупать прямо сейчас.
Главное в этом обновлении — код. На CursorBench прыгнули с 58% до 70%, а Terminal Bench стал решать задачи, которые раньше вообще не брал. У меня ощущение, что Anthropic реально хочет сделать модель, которой можно скинуть задачу и уйти пить кофе. Не "помоги написать функцию", а "разберись с этим таском сам".
Зрение тоже подтянули — картинки теперь принимает до 2576px, это примерно в три раза больше, чем было. Кто скармливает модели схемы и диаграммы — точно почувствует разницу.
Забавная история с промптами: модель стала выполнять инструкции буквально. Anthropic прямо предупреждают — возможно, вам придется переписать свои старые промпты. Сначала все жаловались что модели не понимают, а теперь будут жаловаться что понимают слишком дословно 😄
В Claude Code добавили уровень сложности xhigh и команду /ultrareview для глубокого ревью кода. Для тех, кто сидит в Claude Code каждый день — приятное обновление.
Про цену. Формально все те же $5/$25 за миллион токенов. Но есть нюанс: новый токенизатор на том же самом тексте жрет на 0–35% больше токенов. По факту для части задач стало дороже, просто это никто не афиширует 🤷
Доступно на claude.ai, через API, Amazon Bedrock, Google Vertex AI и Microsoft Foundry.
Вступить в AI Vibe Club
👍5
Тестирую китайские модели в бою: качество и цена
Решил наконец разобраться, на что способны китайские модели в реальных задачах. Взял четыре штуки: GLM 5.1, Qwen 3.6+, Xiaomi MiX, MiniMax — все через OpenRouter, подключил к Kilo Code и погнал.
Первая задача — простой лендинг. Все четыре справились, но черт в деталях. GLM сделал аккуратнее всех. Xiaomi — нормально, с обычным скроллом. MiniMax — в своих фирменных цветах, но дольше всех думал. Qwen добавил скругления, анимации на ховер — стильненько.
Вторая задача — дашборд. MiniMax удивил — сделал быстрее всех, хотя от маленькой модели не ожидал. Остальные тоже справились.
Третья — Тетрис. Вот тут стало интересно. Все четыре модели сделали подозрительно похожие реализации. Пауза, рестарт, очки — работает. Но Qwen единственный добавил Game Over. Xiaomi чуть подлагивал, у MiniMax — чёрный квадрат внизу.
По итогу: GLM стабильно лучше всех по качеству. Количество параметров всё ещё решает, как бы ни крутили файн-тюнинг.
А теперь про деньги. За пять задач (лендинг, дашборд, тетрис, питч-дек, брендбук) через OpenRouter ушло $2.68:
GLM — $0.96
Xiaomi — $0.92
Qwen — $0.05 (!)
MiniMax — $0.34
Qwen космически дешёвый. MiniMax тоже копейки. GLM — самый дорогой из четвёрки, но и результаты лучше. Для сравнения: за ту же сумму на Anthropic получишь двадцать промптов Opus. Может, и меньше.
GLM 5.1 это уже не дешёвая модель. Они подняли цены, и это понятно: инференс триллионных моделей стоит денег. Но пока что по соотношению цена/качество — вне конкуренции.
Вступить в AI Vibe Club
Решил наконец разобраться, на что способны китайские модели в реальных задачах. Взял четыре штуки: GLM 5.1, Qwen 3.6+, Xiaomi MiX, MiniMax — все через OpenRouter, подключил к Kilo Code и погнал.
Первая задача — простой лендинг. Все четыре справились, но черт в деталях. GLM сделал аккуратнее всех. Xiaomi — нормально, с обычным скроллом. MiniMax — в своих фирменных цветах, но дольше всех думал. Qwen добавил скругления, анимации на ховер — стильненько.
Вторая задача — дашборд. MiniMax удивил — сделал быстрее всех, хотя от маленькой модели не ожидал. Остальные тоже справились.
Третья — Тетрис. Вот тут стало интересно. Все четыре модели сделали подозрительно похожие реализации. Пауза, рестарт, очки — работает. Но Qwen единственный добавил Game Over. Xiaomi чуть подлагивал, у MiniMax — чёрный квадрат внизу.
По итогу: GLM стабильно лучше всех по качеству. Количество параметров всё ещё решает, как бы ни крутили файн-тюнинг.
А теперь про деньги. За пять задач (лендинг, дашборд, тетрис, питч-дек, брендбук) через OpenRouter ушло $2.68:
GLM — $0.96
Xiaomi — $0.92
Qwen — $0.05 (!)
MiniMax — $0.34
Qwen космически дешёвый. MiniMax тоже копейки. GLM — самый дорогой из четвёрки, но и результаты лучше. Для сравнения: за ту же сумму на Anthropic получишь двадцать промптов Opus. Может, и меньше.
GLM 5.1 это уже не дешёвая модель. Они подняли цены, и это понятно: инференс триллионных моделей стоит денег. Но пока что по соотношению цена/качество — вне конкуренции.
Вступить в AI Vibe Club
🔥12❤4👍1
Почему Anthropic режет лимиты: версия изнутри
На днях утекла внутренняя записка Denise Dresser, коммерческого директора OpenAI, отправленная сотрудникам 13 апреля. Там прямым текстом: Anthropic допустил стратегическую ошибку - не закупил достаточно вычислительных мощностей. И это теперь видно в продукте. Дословно: "Их стратегический просчёт с недостаточными мощностями теперь проявляется в продукте" - троттлинг, слабая доступность, ненадёжный пользовательский опыт.
И я это вижу на практике. У меня две подписки, и обе за полторы-две недели ушатываются. Причём я даже не генерю код - использую Opus только как ревьюера. Он ничего не пишет, просто находит косяки. Занудно, вдумчиво, и очень точно. Но лимита на $20 не хватает даже на это.
Anthropic сами признали проблему - пользователи выжирают лимиты "намного быстрее, чем ожидалось". Пиковые часы урезали. А причина простая: после движения QuitGPT (бойкот OpenAI из-за контракта с Пентагоном) к Claude ломанулось по миллиону новых пользователей в день. Платные подписчики удвоились с начала года. Инфраструктура к такому не была готова.
Сверху ещё наложились удары иранских дронов по дата-центрам AWS в Дубае и Бахрейне 1 марта. API выстоял, но claude.ai, мобильное приложение и Claude Code легли. А вчера ещё и Opus 4.7 выкатили - при том что нужно параллельно держать старые версии. Видеокарт больше не стало.
Пока OpenAI строил инфраструктуру впрок, Anthropic делал ставку на качество моделей. Модели получились отличные. А вот обслуживать их в нужном объёме - пока не получается.
Вступить в AI Vibe Club
На днях утекла внутренняя записка Denise Dresser, коммерческого директора OpenAI, отправленная сотрудникам 13 апреля. Там прямым текстом: Anthropic допустил стратегическую ошибку - не закупил достаточно вычислительных мощностей. И это теперь видно в продукте. Дословно: "Их стратегический просчёт с недостаточными мощностями теперь проявляется в продукте" - троттлинг, слабая доступность, ненадёжный пользовательский опыт.
И я это вижу на практике. У меня две подписки, и обе за полторы-две недели ушатываются. Причём я даже не генерю код - использую Opus только как ревьюера. Он ничего не пишет, просто находит косяки. Занудно, вдумчиво, и очень точно. Но лимита на $20 не хватает даже на это.
Anthropic сами признали проблему - пользователи выжирают лимиты "намного быстрее, чем ожидалось". Пиковые часы урезали. А причина простая: после движения QuitGPT (бойкот OpenAI из-за контракта с Пентагоном) к Claude ломанулось по миллиону новых пользователей в день. Платные подписчики удвоились с начала года. Инфраструктура к такому не была готова.
Сверху ещё наложились удары иранских дронов по дата-центрам AWS в Дубае и Бахрейне 1 марта. API выстоял, но claude.ai, мобильное приложение и Claude Code легли. А вчера ещё и Opus 4.7 выкатили - при том что нужно параллельно держать старые версии. Видеокарт больше не стало.
Пока OpenAI строил инфраструктуру впрок, Anthropic делал ставку на качество моделей. Модели получились отличные. А вот обслуживать их в нужном объёме - пока не получается.
Вступить в AI Vibe Club
👍6